長文RAGの精度を高める不確実性対応検索手法が登場
米研究者らが、企業の社内文書検索AIの回答精度を大幅に改善する新手法「UMG-RAG」を発表した。追加学習不要で既存システムに組み込め、法務・金融・医療など大量文書を扱う業種に直接的な恩恵をもたらす可能性がある。

検索拡張生成(RAG)は、大規模言語モデルに社内文書や専門資料を参照させる手法として、企業のナレッジ管理や顧客対応自動化に広く採用されている。しかし既存手法には根本的な課題があった。検索時に使う「チャンク」と呼ばれる文書の分割単位が大きすぎると無関係な情報が混入し、小さすぎると文脈が失われて検索精度が低下する。この二律背反が、特に長文文書を扱う業務での回答品質を制限してきた。
Hoin Jungらが発表した「UMG-RAG(Uncertainty-aware Multi-Granularity RAG)」は、クエリごとに最適な文書粒度を動的に選択する手法である。複数の粒度で分割した文書群に対し、密検索(意味的類似性)と疎検索(キーワード一致)という二種類の検索器を組み合わせて動作させる。各検索結果の信頼性を「分布エントロピー」という統計指標で定量評価し、不確実性が高い検索結果の影響を自動的に抑制しながら証拠を統合する仕組みだ。さらに発展形の「UMGP-RAG」は、細粒度チャンクで精密に関連箇所を特定したうえで、文脈の連続性を保つ親チャンクを返す「親チャンク昇格」機能を備える。追加の学習やモデル改修が不要な「プラグアンドプレイ」型の設計が特徴で、既存のRAG基盤に後付けで導入できる。
ビジネス上の影響は複数の業種・部門にわたる。法務部門では、契約書審査や判例検索において参照根拠の正確性が訴訟リスクの管理に直結する。従来手法では長文契約書の特定条項を誤った文脈で引用するケースが生じていたが、粒度適応型検索はこの誤引用率を低減させると期待される。KPIとしては、AI法務レビューの「ハルシネーション発生件数」や「人手修正率」の改善が主要指標となろう。
金融機関のリサーチ部門やコンプライアンス部門にとっても影響は大きい。有価証券報告書、規制通達、リスク管理マニュアルなど数千ページに及ぶ文書群を横断して回答を生成するシステムでは、検索の信頼性が回答の根拠品質を左右する。本手法の導入により、アナリストの情報確認工数削減や、規制対応レポートの作成時間短縮が見込まれる。
医療・製薬分野においても、臨床ガイドラインや治験報告書を参照する医療支援AIの精度向上に寄与し得る。添付文書や処方指針の検索精度は患者安全に直接関わるため、不確実性を明示的に制御する本手法の価値は高い。エラーレートや根拠文書の特定精度が主要評価指標となる。
カスタマーサポート部門では、製品マニュアルや社内FAQ文書が肥大化するにつれ、チャットボットの回答品質が低下する問題が顕在化している。UMG-RAGはこうした大規模ナレッジベースに対する問い合わせ応答の正答率向上に貢献し、エスカレーション率や顧客満足度スコアの改善につながる可能性がある。
実装面での優位性は、既存インフラへの低摩擦な統合にある。ベクトルデータベースや既製の検索エンジンをそのまま活用できるため、エンジニアリングコストを抑制しながら検索品質を向上させられる点は、AI導入の費用対効果を重視する企業にとって訴求力が高い。
今後の課題としては、実運用環境における多言語対応の検証や、リアルタイム更新が求められる文書環境でのレイテンシ評価が挙げられる。研究チームは質問応答ベンチマークで有効性を確認しているが、業種固有の専門文書への適応性については引き続き実証が求められる。企業のAI推進部門が本手法の採用を検討する際は、自社のチャンク設計と検索インフラとの整合性を先行評価することが現実的な第一歩となるだろう。