AI×製造

SAM3自己蒸留で屋外環境の意味分割精度が向上

視覚基盤モデル「SAM3」を活用した自己蒸留技術が、屋外環境の細粒度セマンティックセグメンテーション精度69.73%を達成。自律移動ロボットや建設・農業分野の機械知覚システム高度化に直結する成果である。

SAM3自己蒸留で屋外環境の意味分割精度が向上
広告

米国の研究者が、ICRA 2026 GOOSEセマンティックセグメンテーション・チャレンジにおいて第4位を獲得した手法を発表した。Segment Anything Model 3(SAM3)の画像エンコーダーを軽量デコーダーと組み合わせ、自己蒸留や推論時マルチスケール拡張などの技術を積み重ねることで、1,815枚のテスト画像に対して複合mIoU 69.73%を達成した。

GOOSEデータセットは、農地・森林・舗装路・不整地など多様な屋外環境を対象とした細粒度ラベルを持つベンチマークであり、自律走行ロボットや作業機械が実環境で遭遇する複雑なシーンを網羅している。本研究で提案された手法の中核は「自己蒸留スキーム」にある。SAM3にグラウンドトゥルースのバウンディングボックスをプロンプトとして与え、自モデルよりもSAM3が高精度なクラスに限定して教師信号として再利用する仕組みだ。これにより、ラベル追加コストを発生させることなくモデルの弱点クラスを選択的に補完できる。

第二の手法は画像レベルのマルチスケール推論である。入力解像度が固定された基盤モデルに対し、モデル側でなく入力画像を複数スケールにリサイズして推論結果を統合することで、固定入力モデルの制約を回避した。また実験的知見として、2025年GOOSEチャレンジの優勝手法で用いられた積極的な色彩歪曲(フォトメトリック・ディストーション)のデータ拡張を自パイプラインへ移植したところ、単一要因としては最大の精度向上をもたらすことが確認された。

これらの成果が持つ産業的意義は大きい。建設機械メーカーや農業機械メーカーにとって、屋外作業機械への自律制御搭載は重要な競争軸であり、環境認識精度はシステムの安全性認証や稼働率KPIに直結する。特に農業分野では、圃場内の畝・作物・障害物・人員を高精度に区別することが収穫ロボットや除草機の誤動作防止に不可欠であり、mIoUの数ポイント向上が事故率低減と保険コスト削減に結びつく。

自律移動ロボットを展開する物流企業や警備サービス企業においても、屋外環境認識精度の向上は稼働可能エリアの拡大と定期メンテナンス頻度の削減に貢献する。AIシステム開発部門が既存の大規模基盤モデルを社内の専用モデル強化に活用する「自己蒸留」アプローチは、GPUコストや追加アノテーションコストを抑えながら精度を引き上げる実用的な方向性を示している。

インフラ管理分野では、道路・橋梁・法面などの点検ドローンや地上ロボットへの応用が期待される。国土交通省が推進するインフラDXの文脈でも、現場環境を自動解析するシステムの知覚精度は、点検コスト削減や異常検知速度といったKPIに直結する。

今後の課題としては、69.73%という精度が産業用途の安全基準を満たすかどうかの検証が必要である。GOOSEのような多様な屋外環境ベンチマークで上位精度を達成した手法でも、特定の気象条件や照明環境での性能劣化は起こりうる。メーカー各社は本手法を自社データセットで再評価し、ドメイン適応の工数と効果を見極めることが導入判断の前提となる。基盤モデルを教師として活用する自己蒸留の枠組みは、専用モデル開発コストを圧縮する手段として、AI開発部門の標準的な手法になる可能性がある。

出典: SAM3 Self-Distillation for Fine-Grained GOOSE 2D Semantic Segmentation, Xuesong Wang, arXiv:2606.20130v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告