現行AIワールドモデルに致命的欠陥
スタンフォード大など国際研究チームが発表したWRBenchベンチマークは、主要23モデルを検証し、現行のAIワールドモデルが「観測されていない間も世界が継続する」という物理的一貫性を維持できないことを実証した。自動運転・製造シミュレーション・ゲーム開発など多分野の開発戦略に直接影響を及ぼす。

AIワールドモデルの研究開発に取り組む企業・研究機関に対し、根本的な設計上の欠陥を指摘する論文が発表された。陸炳鵬氏ら11名の研究者チームは、9600本の生成動画を対象とした体系的ベンチマーク「WRBench」を構築し、現行の生成AIワールドモデルが物理的な状態継続性を欠くことを定量的に示した。
研究の核心にあるのは「非観測時の世界継続性」という概念である。現実世界では、カメラが別の方向を向いている間も物体は動き続け、事象は進行する。月が誰にも見られていなくても軌道を保つように、真の意味でのワールドモデルはカメラの視野外でも内部状態を更新し続けなければならない。しかし研究チームが四つの制御パラダイムにわたる23モデルを検証したところ、カメラが一時的に対象から離れて戻った際に、すべてのモデルが「視点が離れた時点の状態」からシーンを再開するという系統的な失敗パターンが確認された。解像度の向上、動き制御の精緻化、幾何学的事前知識の付加、パラメータ数の増加のいずれも、この欠陥を解消しないことも明らかになった。
WRBenchは評価を三段階に分解している。第一に、カメラが指示された動作を正確に実行するか。第二に、視野内においてシーンの連続性と識別可能性が保たれるか。第三に、カメラが戻った際に対象が「設定された事象の延長線上」に存在するか。この三層構造により、従来の忠実度・運動品質・カメラ制御性という表層的指標では捉えられなかった深層的な失敗を可視化することに成功した。
ビジネス上の影響は複数の産業に及ぶ。最も直接的な打撃を受けるのは自動運転開発部門である。ワールドモデルはシミュレーターとして活用され、仮想環境でのエッジケース訓練に不可欠とされてきた。しかし非観測領域における状態継続性の欠如は、死角から飛び出す歩行者や自転車の挙動を正確にシミュレートできないことを意味する。安全性評価KPIであるシナリオカバレッジ率や衝突回避成功率の信頼性が根本から問い直されることになる。
製造業においても影響は深刻である。工場の生産ラインやロボットアームの動作計画にワールドモデルを活用しようとするシステムインテグレーターにとって、視野外の部品や機器の状態が不正確に推定されれば、衝突リスクや工程ミスが発生する。OEE(設備総合効率)改善を目的とするAI導入プロジェクトの精度前提が崩れかねない。
ゲーム・メタバース開発企業においては、AIによる動的ゲーム世界生成の実用化が遅延するリスクがある。プレイヤーが立ち去ったエリアでNPCや環境が正しく「進行」しないならば、ゲームの没入感を支えるリアリティKPIを達成できない。エンタテインメント各社が投資するAI駆動型コンテンツ生成の事業化スケジュールを見直す必要が生じる可能性がある。
研究チームはこの問題を解決するには、フレームの見栄えではなく「物理状態核の安定性」と「視点介入下でのワールドラインの一貫性」を設計の第一級目標として位置づける必要があると主張している。これはワールドモデル開発に投資するIT企業・スタートアップ各社の技術ロードマップや評価指標の再構築を促すものであり、単なる学術的知見にとどまらない産業的な転換点となりえる。
WRBenchは公開予定とされており、今後の調達・採用・PoC評価において、このベンチマークを参照基準とするベンダー選定基準の策定が企業の購買・技術部門に求められることになる。