AI×製造

人間の視線模倣AIがロボット自律航行を革新

ノルウェー科学技術大学の研究チームが、人間の視線走査を99.4%の計算コスト削減で再現するAIモデル「GazeLNN」を開発した。自律ロボットの知覚効率を飛躍的に高め、物流・建設・警備など現場産業のコスト構造を変える可能性がある。

人間の視線模倣AIがロボット自律航行を革新
広告

ノルウェー科学技術大学(NTNU)の研究チームは、人間の視覚的注意メカニズムをロボット自律制御に組み込む新モデル「GazeLNN」を発表した。同モデルは視線の軌跡(スキャンパス)をリアルタイムで予測し、ロボットが人間と同様に場面の重要箇所を効率的に認識する能力を付与する。論文はarXivで公開されている。

GazeLNNの技術的核心は、液体ニューラルネットワーク(Liquid Neural Networks)を再帰エンジンとして採用し、軽量画像認識モデルのMobileNetV3と組み合わせた点にある。現在の視覚刺激と過去の視線履歴を条件として、次の視線固定点のヒートマップを逐次予測する自己回帰型アーキテクチャを採用している。計算量はわずか0.61GFLOPsで、MIT低解像度データセットにおいてScanMatchスコア0.47という最先端性能を達成した。既存の再帰型ベースラインモデルと比較して計算コストを99.40%削減し、推論速度を最大6倍高速化している。

研究チームはさらに、GazeLNNを強化学習で訓練したカメラ搭載ロボットの能動的制御方策に統合し、ドローン(空中ロボット)による実環境での自律航行を実証した。人間の視線誘導型知覚がロボット自律性の向上に直接寄与することを、現実世界の飛行実験で確認している。

ビジネスへの影響は複数の産業分野に及ぶ。物流・倉庫業では、棚卸しや異常検知を担う自律搬送ロボット(AMR)の処理効率向上が期待される。現行システムは全方位カメラ映像を均一に処理するため、エッジコンピューティング機器への負荷が高い。GazeLNNの導入により、注目すべき領域を優先処理する人間的な知覚戦略が可能となり、バッテリー消費量や処理遅延といったKPIの改善につながる。

建設・インフラ点検分野では、ドローンによる橋梁や送電線の自動点検業務への応用が有望である。点検部門のオペレーターが従来は手動でカメラを操作していた工程を自動化でき、一件当たりの点検時間短縮と人件費削減を同時に実現できる。計算コストの低さはオンデバイス推論を可能にするため、通信インフラが乏しい山岳地や海上設備での運用にも適している。

警備・防災部門においては、群衆監視や災害現場での捜索活動にGazeLNN搭載ドローンを活用する可能性がある。人間の視線パターンを模倣することで、熟練オペレーターと同等の優先順位付け判断を機械が自律的に行えるようになり、オペレーター一人当たりの管理可能機体数(稼働効率KPI)の引き上げが見込まれる。

製造業の品質管理部門にとっても示唆は大きい。検査員の視線データを学習させることで、個人の熟練度に依存しない標準化された外観検査AIの構築が現実味を帯びる。特に計算資源が限られた生産ライン上の組み込み機器への展開が、今後の実用化の鍵を握る。

課題も残る。GazeLNNが学習に用いた視線データは一般的な画像閲覧時のものであり、各産業固有の専門的視線パターンとの乖離が実用精度に影響する可能性がある。現場ごとのドメイン適応学習と、視線データ収集のための初期投資が導入障壁となる。また、自律ロボットの行動判断に視線モデルが介在する場合、誤認識時の責任所在を明確にする法的・倫理的枠組みの整備も求められる。

研究チームは今後、より高解像度データセットへの適用と多様なロボットプラットフォームへの統合を進める方針を示している。エッジAIチップの性能向上と相まって、視線誘導型自律知覚は今後2〜3年以内に産業現場への本格展開が加速するとみられる。

出典: Fast Human Attention Prediction for Fixation-guided Active Perception in Autonomous Navigation, Fatma Youssef Mohammed, Grzegorz Malczyk, Kostas Alexis, arXiv:2606.20491v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告