00:31:47
ノーベル賞受賞者であり、Google DeepMindのCEOであるデミス・ハサビス氏が、AIの現状と未来、そしてAIが科学の発見をどのように加速させるかについて語りました。
ハサビス氏は、AlphaFoldによるタンパク質構造予測の功績が認められノーベル賞を受賞しました。受賞の瞬間について、「スウェーデンからの電話は、科学者なら誰もが夢見るものだ。全てがシュールな体験だった」と振り返ります。ノーベル賞は科学的ブレークスルーだけでなく、現実世界へのインパクトも評価の対象となります。AlphaFoldはその両方を満たす画期的な成果でした。授賞式では、120年間続く伝統の中、アインシュタインやマリー・キュリーといった偉大な科学者たちの名前が連ねられたノーベルブックに自身の名前を署名する光栄に浴したと語りました。
Google DeepMindは、Alphabet社内のさまざまなAI開発チームを統合し、現在では約5,000名のエンジニアと研究者を擁する組織へと成長しました。ハサビス氏はその役割を「GoogleとAlphabet全体のエンジンルーム」と表現しています。
その中核となるのが、マルチモーダルAIモデル「ジェミニ(Gemini)」です。これはテキストだけでなく、画像、音声、動画などあらゆる種類の入出力を扱うことができます。このモデルは、AI概要(AI Overviews)やGeminiアプリなど、Googleのほぼ全てのプロダクトに組み込まれており、数十億ユーザーが日常的に利用しています。WorkspaceやGmailへの統合も進んでおり、研究から実用化までのスピードが大きく加速していることがわかります。
特に注目すべきは、「ジェニー(Genie)」や「VO」といった「ワールドモデル」です。Genieは、単なる動画生成を超え、ユーザーがインタラクティブに探索できる3D世界をテキストプロンプトから生成します。
ハサビス氏は、1990年代に自身がビデオゲームのグラフィックスエンジンを開発していた経験から、「手作業でポリゴンや物理エンジンをプログラムするのがどれほど大変だったか」と述べ、Genieがビデオデータのみから直感的な物理学や世界の力学を逆算で学習し、一貫性のあるインタラクティブな世界を生成する能力を「驚異的」と称賛します。
この技術は、単なるエンターテインメントを超える意義を持ちます。AGIを実現するためには、抽象的な言語や数学の世界だけでなく、私たちを取り巻く物理世界を理解する能力が不可欠です。Genieのようなワールドモデルは、将来のロボティクスや、現実世界を理解して支援するスマートグラスなどの開発において基盤となる技術です。
ハサビス氏は、ロボティクスにおけるAIの応用について、二つの戦略を提示します。一つは、さまざまなロボット間で動作する「Android的なOSレイヤー」を構築する戦略。もう一つは、最新のAIモデルと特定のロボット設計を垂直統合する戦略です。
汎用性の高い「ジェミニロボティクスモデル」では、ユーザーが「黄色い物体を赤いバケツに入れて」と自然言語で指示するだけで、ロボットがその言葉を運動指令に変換して実行できるようになります。マルチモーダルモデルの真価は、このような現実世界の理解をロボットの操作に持ち込める点にあります。
人間型ロボットの形態については、「物理世界は人間のために設計されているため、ドアや階段など既存の環境にシームレスに溶け込むには人間型の形態が重要」としつつも、産業用など特定のタスクには特化型ロボットも並行して発展するとの見解を示しました。ロボットの社会的実装は、アルゴリズムとハードウェアの両面でのさらなる成熟が必要であり、今後数年内に「驚きの瞬間」が訪れると予測しています。
ハサビス氏がAI研究に人生を捧げてきた原動力は、「科学の発見を加速するため」です。AlphaFoldをはじめ、核融合プラズマの制御、天気予報、材料設計、数学の難問解決など、DeepMindのAIは様々な科学分野で応用されています。
しかし、現在のAIにはまだ限界があります。それは「真の創造性」、つまり、新しい仮説や理論を独自に構築する能力です。ハサビス氏は、AGIのテストとして、「1901年時点の知識しか与えられていないAIが、アインシュタインのように1905年に特殊相対性理論を思いつけるか?」または「囲碁の新しい戦略だけでなく、囲碁自体のようにエレガントで美しい全く新しいゲームを生み出せるか?」という問いを提示します。現在のAIはこのような「直感的な飛躍」ができておらず、これがAGI達成に向けた核心的な課題の一つです。
また、現在の大規模言語モデルは、PhDレベルの能力を一部で発揮するものの、一般的にはPhDレベルの知性には達しておらず、簡単な計算ミスをすることもあり、一貫性と継続学習能力が欠けていると指摘します。ハサビス氏は、真のAGIの実現にはあと5年から10年、そしておそらく1つまたは2つの重要なブレークスルーが必要だと予想しています。
ハサビス氏は現在、DeepMindの事業と並行して、AlphaFoldの成果を発展させたスピンアウト企業「Isomorphic Labs」の運営にも注力しています。タンパク質の構造予測は創薬プロセスのほんの一段階に過ぎません。Isomorphic Labsは、副作用がなく正確にタンパク質に結合する化合物の設計など、隣接する課題を解決する「多数のAlphaFold」を構築することを目指しています。
目標は、創薬にかかる時間を「数年、時には10年から数週間、さらには数日へ」と短縮することです。同社はすでにEli LillyやNovartisといった大手製薬企業と提携しており、癌や免疫学などの分野でプログラムを進め、来年にも前臨床段階へ進む見込みです。
Isomorphic Labsが採用するアプローチは「ハイブリッドモデル」です。データから学習する確率的なニューラルネットワークと、既知の化学や物理の法則(原子間の結合角など)を組み込んだ決定論的な要素を融合させます。最終的には、全てをデータから直接学習するエンドツーエンドの学習が理想ですが、生物学などの領域ではデータが不足しているため、現段階ではこのハイブリッド型アプローチが現実的です。
AIの急成長に伴うエネルギー消費への懸念に対して、ハサビス氏は二つの側面から見解を述べます。
一つは、モデルの効率化が急速に進んでいる事実です。Googleでは数十億ユーザーにサービスを提供するため、低レイテンシーかつ低コストでの運用が不可欠です。そのため、「蒸留(Distillation)」などの技術を用いて、大規模モデルの性能を小型の効率的なモデルに継承させ、ここ2年でモデルの効率は10倍から100倍向上していると説明します。
しかし、AGIというフロンティアの追求には、より大規模な計算資源が必要となるため、需要は減らないというジレンマもあります。それでもハサビス氏は、AIがもたらすメリットの方がはるかに大きいと楽観視しています。AIは、電力グリッドの効率化、新材料の発見、新しいエネルギー源の開発など、エネルギー問題そのものの解決に貢献すると考えており、AIが消費するエネルギーを上回る価値を社会に還元するとの見解を示しました。
最後に、今後10年の未来像について問われると、ハサビス氏は「AIの世界では10週間でも一生分の進歩がある」と笑いながらも、真摯に展望を語りました。
今後10年以内にAGIが実現すれば、「科学の新たな黄金時代(新しいルネサンス)」が訪れると確信しています。エネルギー、医療、あらゆる科学分野で、AIが人類の知性を増幅し、かつてない速度と規模で発見と革新が進む世界。デミス・ハサビス氏の情熱は、子供の頃からの夢である「科学の発見を加速する」という一点に集約され、その夢は現在、Google DeepMindの日々の研究開発を通じて着実に現実のものとなっています。