SAR・光学・言語統合データセット公開、衛星AI開発を加速
フランス航空宇宙研究院らが超高解像度SAR画像・光学画像・自然言語の三者対応データセット「SARLO-80」を公開した。衛星データAIの商用開発における最大の障壁であったデータ不足を解消し、防衛・保険・インフラ管理など複数産業のビジネス応用を直接後押しする。

フランス国立航空宇宙研究センター(ONERA)を中心とする研究チームは、合成開口レーダー(SAR)と光学画像、自然言語記述を組み合わせた大規模マルチモーダルデータセット「SARLO-80」を学術・商用向けに無償公開した。72カ国257地点をカバーする11万9,566組の対応データを収録しており、衛星リモートセンシング分野における基盤モデル開発の新たな出発点となり得る。
SARは雲や夜間に左右されず地表を観測できる電波センサーであり、光学カメラが無力化される悪天候下でも安定したデータ取得が可能である。しかし従来の公開データセットは解像度が低く、複素数値情報を保持しない強度画像のみに限られていた。SARLO-80はUmbraが提供するスポットライトモード取得データをセンサー独立複素データ(SICD)形式で活用し、80cmスラントレンジグリッドに統一した上で1024×1024ピクセルのパッチに分割している。各SARパッチに対し高解像度光学画像を画素レベルで位置合わせし、さらに短・中・長の3種類のキャプションを付与することで、クロスモーダル検索や条件付き画像生成など多様なAIタスクに対応できる構成となっている。
ビジネス上の影響は広範な産業に及ぶ。損害保険業界では、台風や洪水発生直後に光学衛星が雲で使用不能となる場面でSAR画像を活用した被災範囲自動推定モデルの精度向上が見込まれ、損害査定部門における査定期間短縮と支払い精度の改善という二つのKPI改善に直結する。国内大手損保各社はすでに衛星データ活用を戦略投資の柱に据えており、高品質な学習データの入手容易化はモデル内製化コストの大幅削減につながる。
インフラ管理分野でも活用余地は大きい。電力・鉄道・道路を管轄する事業会社の設備管理部門は、AIによる衛星画像からの異常検知を定期巡視業務の補完手段として検討しているケースが増加している。SARLO-80が提供する自然言語キャプション付きの訓練データは、現場担当者が画像AIの出力結果を理解・検証する際のインターフェース構築にも応用可能であり、デジタルツイン推進部門における採用障壁を下げる効果が期待される。
防衛・安全保障分野では、従来は各国政府機関や防衛関連企業が独自に構築・保有してきたSAR学習データを公開資源で補完できる点が注目される。商業衛星データを活用した状況認識システムの開発企業にとっては、参入コストの引き下げと開発サイクルの短縮が競争優位に直結する。海上監視や港湾管理を手がけるスタートアップ企業が特に恩恵を受けると見られる。
農業・林業向けリモートセンシングサービスを提供するアグリテック企業においても、SAR・光学融合モデルの精度向上は作物分類や収穫量予測の改善に寄与し、農業法人向けの契約精度指標(精度・再現率)向上に反映される。
データセットはHugging Face Hubで公開されており、学習・検証・テスト分割済みのデータと前処理コードが一括提供される。再現可能なベンチマーク環境が整備されている点は、AI研究開発部門が外部ベンダーの評価を実施する際の標準化にも役立つ。今後は複数偏波や異なる入射角への対応拡張、さらには動画像シリーズへの展開が期待されており、衛星データAI市場全体の底上げに資するインフラとして機能することになろう。