AI論文246万件を知識図に変換、企業R&D革新へ
中国の研究チームが科学論文246万件を構造化知識グラフに変換するAIパイプライン「Agents-K1」を発表した。製薬・素材・化学などの研究開発部門における情報収集コストと意思決定速度に直接影響する技術として注目される。

科学論文の情報を自動的に構造化し、企業の研究開発活動に組み込める知識グラフを生成するAIシステム「Agents-K1」が発表された。複数機関の研究者らが共同開発したこのシステムは、論文の要旨だけでなく本文全体から実体、証拠、引用関係、手法の系譜を抽出し、エージェントが直接推論に利用できる形式に変換する。
従来のLLM(大規模言語モデル)を活用した研究支援ツールの多くは、論文の要旨を参照するにとどまり、実験結果の詳細や研究手法の変遷といった本質的な科学情報を見落としてきた。Agents-K1はこの課題に対し、5モジュール構成のマルチモーダル解析器と40億パラメータの情報抽出モデルを組み合わせることで、図表や数式を含む論文全体の構造を解析する。さらに、ウェブ検索・グラフ検索・文書横断検索を統合した「graphanything CLI」と呼ばれるエージェントインターフェースを通じて、複数論文にまたがる多段推論を可能にした。
同チームはこのパイプラインを用いて自然科学・工学・医学など6分野にわたる246万件の論文を処理し、「Scholar-KG」と呼ばれる大規模知識グラフを構築した。このうち100万件分のサブセットは公開予定であり、産業界による応用研究の基盤となることが期待される。
ビジネスへの影響は製薬・バイオテクノロジー業界において特に顕著である。創薬研究における文献調査は研究者一人あたり年間数百時間を要するとされ、候補化合物の絞り込みにかかるリードタイム短縮が業界共通の課題となっている。Agents-K1のような知識グラフ基盤を社内研究データベースと連携させることで、特定のタンパク質標的に関連する実験証拠を数分以内に網羅的に収集できる可能性がある。新薬開発パイプラインにおけるフェーズ移行率や研究費用対効果(ROI)の改善が見込まれる。
素材・化学メーカーの研究部門でも応用が進むとみられる。新素材開発においては先行研究の機構解明が不可欠であり、同システムが持つ手法系譜の追跡機能は、特許の空白領域を特定する知財戦略にも活用できる。技術情報部門が担う先行技術調査の工数削減と精度向上が期待され、特許申請件数や技術移転スピードといったKPIへの貢献が想定される。
コンサルティングファームやシンクタンクにとっても、産業動向の把握に要するリサーチコストの削減につながる。市場調査レポートの作成において、科学的エビデンスと産業データを横断的に参照できるシステムは、アナリストの生産性指標に直結する。
一方、企業導入に際しては幾つかの課題も残る。知識グラフの品質は元論文の構造に依存するため、査読前論文(プレプリント)を大量に含む分野では情報の信頼性管理が必要となる。また、社内機密文書を同パイプラインで処理する場合には、データセキュリティとアクセス権限の設計が前提条件となる。
研究チームは同パイプラインが科学論文に限らず一般的なコーポレートドキュメントへも拡張可能と述べており、法務・コンプライアンス部門における規制文書の構造化分析への応用も中長期的な展望として挙げられている。知識グラフ技術を核とした企業内情報基盤の再設計が、研究開発集約型産業における次の競争軸となる可能性を同研究は示唆している。