AI×金融

AI生成テキスト画像の検出、既存手法に限界

OpenAIの画像生成モデルが作る領収書・UI・学術ポスターなど「テキスト主体画像」を既存AIが高精度で検出できないことが判明。デジタル取引の真正性確保に課題を突きつけた。

AI生成テキスト画像の検出、既存手法に限界
広告

テキストや表組みを含む画像の偽造検出において、現行のAI検出技術が深刻な限界を抱えることが、新たな研究で明らかになった。王逸錦氏ら研究チームは、OpenAIの画像生成モデル「GPT-Image-2」を用いて生成した8,602枚の画像からなるベンチマークデータセットを構築し、商業ポスター・インフォグラフィック・学術ポスター・レシート・表・UIスクリーンショットの6カテゴリにわたって5種類の検出モデルを評価した。

結果は業界にとって看過できないものである。いずれの検出手法もカテゴリによって性能が大きく変動し、あるカテゴリで高精度を示す手法が別のカテゴリでは著しく精度を落とした。さらに、最も性能の高い従来型検出器でさえ、JPEG圧縮という一般的な後処理に対して極端な脆弱性を示した。SNSへの投稿や電子メール添付の過程で画像が圧縮されるだけで、AI生成の痕跡が消えてしまう可能性がある。

この知見が最も直接的に影響するのは金融・保険・小売の各セクターである。経費精算システムや保険金請求において、AI生成の偽造レシートや明細書が添付された場合、現行の自動審査フローでは検出が困難になるリスクがある。経理部門や損害調査部門のKPIである不正検出率や審査コストは、生成AIの高度化とともに悪化する恐れがある。実際、レシートカテゴリは構造が定型的であるにもかかわらず検出精度が低い傾向が確認されており、電子領収書を多用するBtoB取引でのリスクが高まる。

電子商取引・広告業界も無視できない。AI生成の商業ポスターやUIスクリーンショットが製品レビューやマーケットプレイスに大量混入すれば、消費者の購買意思決定を歪める。プラットフォーム企業のコンテンツモデレーション部門にとっては、偽装広告の排除率や虚偽レビュー検出件数といったKPIに直結する問題となる。

学術・出版分野においても影響は及ぶ。AI生成の学術ポスターや図表が査読前論文投稿サイトや学会に持ち込まれた場合、論文審査の信頼性を損なう。大学や学術出版社の研究不正対応部署では、テキストの盗用検出に加えて図版の真正性確認という新たな業務負担が生じる見通しである。

研究チームはマルチモーダル視覚言語モデルによる探索的評価も実施しており、構造化フォーマットに対して一定の可能性を示しつつも限界があることを確認した。これは、テキストのレイアウトや意味論を理解するモデル設計こそが次世代検出技術の鍵になるという方向性を示唆している。

今後の課題は明確である。JPEG圧縮耐性を備え、テキストの配置・書体・意味構造を総合的に解析できる検出アーキテクチャの開発が急務となる。コンテンツ認証の国際標準であるC2PAの普及とあわせて、企業は検出ツールの定期的な性能評価と更新サイクルの確立を迫られる段階に入った。データセットは公開されており、民間企業も自社システムの評価基盤として活用できる。

出典: A Multi-Domain Benchmark for Detecting AI-Generated Text-Rich Images from GPT-Image-2, Yijin Wang, Shuyi Wang, Wenhan Zhang, Yuqi Ouyang, arXiv:2606.19259v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告