自動運転システムの進化を支える、3 つの AI 駆動型研究領域
本ブログでは、マルチモーダル基盤モデル、生成 AI によるクローズドループ シミュレーション、自動運転ソフトウェアにおける強化学習を軸に、自動運転システムを進化させる 3 つの AI 駆動型研究領域について解説します。

自動車業界では、自動運転への AI 統合が進むことで大きな進展が生まれており、こうしたシステムの大規模運用への対応力、汎化性能、堅牢性が高まりつつあります。自動運転がより複雑化するなか、多様な条件下でこれらの技術をトレーニング、テスト、検証するための革新的な手法へのニーズは一段と高まっています。
生成 AI や機械学習技術の台頭を背景に、自動運転業界では近年パラダイムシフトが起きています。オンボードの自動運転ソフトウェアとオフボードの開発パイプラインの双方に変革が及び、大規模データと高度なコンピューティングに支えられたこれらのイノベーションは、効率の大幅な向上と機能の拡張を後押ししています。
本ブログでは、自動運転システムの進化に重要な役割を担うと期待される 3 つの AI 駆動型研究領域を解説します。
自動運転ソフトウェアは、従来の認識、予測、計画モジュールを統合しながら、よりデータ駆動型で微分可能なパラダイムへと移行しつつあります。一方で、微分可能な自動運転ソフトウェアの汎化性能を高め、膨大なインターネット規模のデータを活用するだけでなく、運転判断の背後にあるロジックまで解釈し、理解できるようにすることは、依然として大きな課題です。こうした要件をつなぐ手段として、大きな可能性を示しているのが言語モダリティです。マルチモーダル基盤モデル (MMFM) によって微分可能な自動運転ソフトウェアを強化することで、その実現に近づきます。MMFM は、ビジョン、言語、その他さまざまなモダリティを考慮し、大規模なインターネットデータと走行データを活用することで、コーナーケースへの対応や、人間の思考に沿った意思決定を可能にします。さらに MMFM は、微分可能な自動運転ソフトウェアによって統合的に制御される、汎化性能の高い自動運転の実現に向けた有力なアプローチでもあります。
微分可能な自動運転ソフトウェアを大規模にトレーニング、テストするには、視覚的にも挙動面でも現実に近いクローズドループ型のシミュレーション ツールチェーンが求められます。このツールチェーンには、道路利用者の反応的な挙動を生成する機能、多様で現実的なシナリオを作成または変更する機能、さらにマルチモーダルセンサーから合成データを生成する機能も必要です。こうした要件を大規模かつ自動化された形で満たすため、新たに登場した生成 AI と 3D 再構築技術が積極的に取り入れられ、シミュレーション生成はデータ駆動型かつ AI 活用型のパラダイムへと移行しつつあります。こうした反応型データジェネレーターと組み合わせることで、MMFM は実世界データのキュレーションとマイニングにおいても大きな可能性を示しており、自動化された効率的なデータエンジンとシミュレーション ツールチェーンの構築に向けても有効です。
微分可能な自動運転ソフトウェアの模倣事前学習では、実世界のデモンストレーションを含む大規模データを活用できます。一方で、分布外のケースに対応し、十分なデモンストレーションが存在しない要件を満たすために、自動運転ソフトウェアをいかに堅牢にし、洗練させ、カスタマイズしていくかは、依然として未解決の課題です。クローズド ループにおける強化学習は、既存データや収集可能なデータの範囲を超えて自動運転ソフトウェアを改善する可能性をもたらします。同時に、人間の選好と整合しながら運転要件を的確に表現する報酬設計への需要も高まっています。現在検討されているアプローチでは、事前に定義された報酬構造に依存せず、AI を活用した自動運転ソフトウェアが試行錯誤を通じて学習できるようになり、こうした課題への対応が可能になります。
Applied Intuition は、業界をリードするパートナー企業と協力し、我々の自動運転ソフトウェア、車両ソフトウェア、自動運転向け開発プラットフォームの強化に取り組んでいます。我々は、AI 技術を発展させ、より優れた製品とソリューションを提供することに注力しています。
自動運転システムに変革をもたらす最先端の AI 研究を推進するため、Applied Intuition は AI リサーチチームを編成しました。同チームには、Berkeley DeepDrive の共同ディレクターも務める Wei Zhan が、このほど Applied Intuition のチーフサイエンティストとして参画しました。AI リサーチチームは、さまざまなソースから得られる大規模データを活用し、大規模展開に対応する自動運転システムにおいて、言語をビジョンやその他のモダリティと統合するマルチモーダル基盤モデルと微分可能な自動運転ソフトウェアの研究を進めています。これにより、堅牢で量産可能な自動運転ソリューションの開発を目指します。
AI リサーチ チームは、Applied Intuition が構築した業界トップクラスのシミュレーション ツールチェーンに、最先端の 3D 再構築技術と生成 AI を組み合わせ、高い忠実度、使いやすさ、大規模運用への対応力、制御性を備えた次世代のクローズド ループ シミュレーションとデータエンジンに向けた AI 技術を開発しています。
現実世界の条件下で機能する完全自動運転システムを開発するには、継続的なイノベーションと技術統合が欠かせません。我々が取り組むクローズド ループ シミュレーションと、言語を統合した自動運転ソフトウェアは、この目標に向けて着実に進展しています。
「自動運転技術を前進させる鍵は、現実世界と AI の双方から得られる大規模なマルチモーダルデータを活用する力にあります」と Wei Zhan は述べています。「我々が現在進めている研究は、こうしたデータを生成、変換し、新たな時代における大規模運用に対応した安全な自動運転システムに向けて、活用可能なアセットと実行可能なインサイトへと変えていくことに重点を置いています」
AI リサーチチームの募集職種については、Applied Intuition の採用情報ページ をご覧ください。