中山 浩太郎氏
東京大学
工学系研究科 松尾研究室
リサーチディレクター
NABLAS 株式会社 代表取締役CEO
専門分野はAI・大規模データ解析・Webマイニング。大阪大学大学院情報科学研究科で博士号を取得、(株)関西総合情報研究所代表取締役、大阪大学大学院情報科学研究科特任研究員、東京大学「知の構造化センター」特任講師、東京大学工学系研究科特任講師を経て現在に至る。
深層学習(ディープラーニング)をはじめとするAIの先端技術の発達により、数年前から「第3次AIブーム」が世界的に起こっている。
ビジネスや日常生活にどのような変化をもたらすのか。
機械に代替されることのない、人間だけが持つ資質や能力とは何か。
AIの先端研究で知られる東京大学松尾研究室の中山浩太郎氏に語っていただいた。
まず、「AI」「人工知能」という言葉の定義をしないと、以降の議論が発散してしまうのですが、実はこれは難しい問題として知られています。それは、そもそも「知能」という言葉の定義が難しいためで、いろんな技術がAI技術として捉えられています。我々はそのような中でも「DeepLearning」と「データサイエンス分野における機械学習」という2つの分野が重要なAI技術だと位置づけ、重点的に研究開発を進めています。
機械学習は、膨大なデータの中から、データ内に存在するルールや共通点などを自動的に抽出し、データを処理するモデルを作る技術です。簡単な例でいうと、不動産なら、間取り、広さ、構造などの物件に関するデータを縦軸に、年齢、性別などの購買者に関するデータを横軸に取ると、人が好みそうな物件などの情報を過去のデータから関係づけて出すことができるようになります。人の特徴を入れると、好まれそうな物件を自動で出力するようなモデルを作ることができます。この時、年齢や性別、広さといったように、人間がその特徴を把握しやすく、ルールなどを定義しやすいデータに対しては、データサイエンス領域の機械学習技術が向いています。
一方、ディープラーニングは、画像や音声、言語など、そのものの特徴を人間が表現しにくいデータから、特徴を自動的に抽出するのが得意です。例えば、私たちは「本」を見るだけで、それが「本」だとすぐ認識できますが、「本」と「本以外のもの」の違いを色や形、重さなどの要素で明確に定義するのは難しい。同様に「あ」と「い」の音声の違いは周波数の波形などだけでは定義できません。これをディープラーニングでは、「本」と「本以外のもの」の画像を膨大に読み込ませることで、自動的に本の特徴を学習し、「本」かどうかを判断します(図1参照)。音声も同様です。
近年、飛躍的に技術が向上し、現在の「第3次AIブーム」が巻き起こる大きな契機にもなりました。最近の翻訳技術の飛躍的な向上も、ディープラーニング技術の進化に起因しています。
MRIなどの医療画像を分析して診断や治療に役立てるといった例がよく知られていますが、ディープラーニングの成果は画像解析にとどまりません。
ディープラーニングは「眼の技術」だと言われます。生命の進化において初めて眼を持った動物である三葉虫は、生存競争で圧倒的優位に立ち、その後の進化にも重大な影響を及ぼしました。ディープラーニングは、テクノロジーの進化において三葉虫の登場に匹敵するほどのインパクトをもたらします。例えばロボティクス分野。産業ロボットのアームでモノを掴むとき、かなりの高精度で動作をプログラミングしておくことで、寸分違わない動作をしますが、そのような機械は非常に高価なものとなります。
一方、眼の技術である深層学習と連動させることができれば、フラフラのロボットでも眼で見ながら動作を微調整可能なので、ロボット自体の制御技術は簡易なもので済みます。ロボットの導入コストが大幅に低減し、製造業はもちろん、物流や建設など幅広い分野でロボット化・自動化が進む可能性があります。
AIが貢献できる分野はたくさんあります。特に「生成モデル」と呼ばれる技術は、ディープラーニングのセカンドインパクトとして注目しています。ディープラーニング技術は、入力されたデータに対して識別をするような用途で主に性能を発揮してきましたが、生成モデルは、これに加えて新たなアウトプットを生み出すことを可能にする技術です。例えば、ある人物のスピーチ動画を使って、あたかも著名人がスピーチしているかのような動画をAIが自動的に作り出すDeepfakes(ディープフェイク)」や、AI が描いた絵画が巨額で売買されたことは記憶に新しいですが、これらの技術は生成モデルを基盤としています。
現在の技術でどのようなことができて、どのようなことができないのかという点については、議論が絶えませんが、このような技術の先には、(工学)デザインに関する一部の作業を、AI技術で行うことができるようになるかもしれません。例えば、与えられた制約の中で最も機能性の高い回路設計や建築図面などの組み合わせについてはAIに考えさせて、画期的なプロダクトデザインや建築デザインに生かすという可能性も大いにあります。あるいは、人間には処理できないほどの膨大な技術情報を世界中から集めることで、経営環境の変化を正確に把握し、それに対する最適なソリューションを導き出すための作業を支援するといったことも可能かもしれません。
スマートフォンの登場で、便利なアプリやネットサービスが続々と生まれたように、今後AIがコモディティ化することで、新たな製品・サービスが次々と生まれてくるでしょう。
AIの最新の技術動向に対し、常にアンテナを張っておくことが重要です。もはや「自分は営業職だからテクノロジーは関係ない」という時代ではありません。企業がテクノロジーへの投資を判断するためにも、AIを開発する人たちだけでなく、AIを使用する人たちも正しい知識を持っておくべきです。
既に英国のアラン・チューリング研究所やスタンフォード大学では、経営者や政治家にAI技術を正確に理解してもらうための講座などが始まっています。一般のビジネスパーソンも、テクノロジーに対する情報感度を高め、AIに触れてプログラミングを体験し、得た知識や体験をもとに、自社の業務の中でAIを活用できないかと仮説を立て、実際に挑戦してみるようなアグレッシブさが必要ではないでしょうか。
具体的な資質・能力で言うと、プログラミングの知識や能力は、より幅広い方々にぜひ持っていただきたいですね。プログラミング教育が小学校でスタートするのは良いことだと思っています。我々の研究室でも社会人向けに、データサイエンスの知識や機械学習、深層学習のプログラミングを扱う体験講座を実施し、啓蒙を図っています。プログラミング技術を身につけることで、身の回りのデータ分析やちょっとした作業の自動化などが可能となり、その結果、人間がすべきことと機械に任せられることが判断できるようになってきます。翻って、私たちは人間にしかできないことにフォーカスしていくべきです。
あとは英語力。翻訳技術が高まっているとはいえ、最新の情報を正しく、タイムリーに取得するための能力という意味で、英語力は必要だと思います。
人間が構造化や設計できないことは、AIにもできません。AIの開発や活用において、人間だけが持つとされるドメイン知識をAIに与えるという重要な役割は、人間側にあります。また、意思決定をすること、倫理的な正しさを判断すること、感動を与えることなども、人間にしかできない能力です。
ただし、人間が意思決定をする場合、限られた情報を判断材料にしていますし、主観や先入観などに左右されがちです。AIは人間が処理できないような膨大な量の情報を数値化し、「何パーセントの確率で、この事象が起こる」といった予測を導きだすことができます。AI技術を活用することにより、人間はより多くの客観的判断材料をもとに意思決定できるようになります。AIを上手に活用して、本当にフォーカスすべきことに注力していくという発想が大切です。
中山 浩太郎氏
東京大学
工学系研究科 松尾研究室
リサーチディレクター
NABLAS 株式会社 代表取締役CEO
専門分野はAI・大規模データ解析・Webマイニング。大阪大学大学院情報科学研究科で博士号を取得、(株)関西総合情報研究所代表取締役、大阪大学大学院情報科学研究科特任研究員、東京大学「知の構造化センター」特任講師、東京大学工学系研究科特任講師を経て現在に至る。