再帰型AIエージェントが長文推論を刷新
米研究チームが開発した「再帰型エージェントハーネス」が、AIの長文脈推論精度を従来比10ポイント近く向上させた。大量文書を扱う金融・法務・製造業の業務自動化に直結する成果として注目される。

米国の研究者チームは、AIエージェントが自律的にサブエージェントを生成・並列実行する新アーキテクチャ「再帰型エージェントハーネス(RAH)」を発表した。OpenAIのGPT-5を基盤モデルとして固定した条件下で、既存のコーディングエージェント基準値71.75%から81.36%へと精度を向上させた。AnthropicのClaude Sonnet 4.5を基盤に採用した場合は89.77%に達した。
RAHの核心は、親エージェントが実行可能なスクリプトを生成し、そのスクリプトが複数のサブエージェントを並列起動するという「コード優先の再帰構造」にある。各サブエージェントはファイルシステムへのアクセス、コード実行、計画立案といったツール群を独立して保有する。単純なモデル呼び出しの繰り返しにとどまった従来の再帰型言語モデル(RLM)と異なり、RAHは「エージェントそのもの」を再帰の単位とすることで、最大400万トークンに及ぶ長文脈処理において従来手法を大幅に上回る性能を示した。
業務への影響が最も大きいと見られるのは、金融機関のリサーチ部門および法務部門である。証券アナリストが行う決算資料・有価証券報告書の横断分析は、数百ページに及ぶ文書を複数同時に参照する作業を伴う。RAHを応用したシステムは、文書ごとのサブエージェントが並列で要点を抽出し、親エージェントが統合判断を行う構成が可能となる。分析リードタイムの短縮と、アナリスト一人当たりカバレッジ銘柄数の拡大という二つのKPI改善が期待できる。
法律事務所や企業の法務部においては、契約書レビューの自動化に直結する。M&Aデューデリジェンスでは数千件の契約文書を短期間で精査する必要があり、現状は人手と外部弁護士費用に多大なコストがかかっている。RAHが実現する大規模並列文書処理は、レビュー期間の圧縮とリスク検出率の向上を同時に追求できる手段となり得る。契約審査コストおよびデューデリジェンス期間という二つのKPIに直接作用する。
製造業においては、設計文書・品質基準書・サプライヤー仕様書など異種大量文書を照合する工程管理業務への応用が考えられる。調達部門が複数サプライヤーの技術仕様を比較検討する際、サブエージェントが各文書を担当し、親エージェントが差異を統合報告する構成は、調達リードタイム短縮と仕様不適合件数削減に寄与する。
導入にあたっての留意点も存在する。RAHはエージェントが動的にコードを生成・実行する仕組みであるため、実行環境のセキュリティ管理と、生成コードの監査体制が不可欠である。特に金融・医療分野では、サブエージェントが参照するデータの機密区分管理とアクセス制御の設計が導入可否を左右する。
今回の研究は、エージェントアーキテクチャそのものが性能向上の主因であることを、モデルを固定した対照実験により示した点に科学的意義がある。基盤モデルの性能競争とは独立して、エージェント設計の工夫によって実用精度を底上げできるという知見は、特定モデルベンダーへの依存度を下げながら業務システムを高度化したい企業にとって戦略的な選択肢を広げるものである。AIエージェント基盤の設計・調達を検討する情報システム部門および最高デジタル責任者(CDO)は、本アーキテクチャの動向を注視する必要がある。