医療AI幻覚の発生段階を特定するベンチマーク登場
アリババDAMO Academyらは医療用マルチモーダルAIが誤答を生じる推論段階を特定するベンチマーク「ClinHallu」を公開した。医療AIの信頼性評価に新基準をもたらす可能性がある。

アリババDAMO Academyらは医療用マルチモーダルAIが誤答を生じる推論段階を特定するベンチマーク「ClinHallu」を公開した。医療AIの信頼性評価に新基準をもたらす可能性がある。

米研究者らがゲノム情報をベイズ推論の事前分布として活用し、ウェアラブルデバイスの計測値を個人の遺伝的基準値と比較できるAI基盤を提案した。数週間のデータ蓄積なしに初日から有意な健康偏差を検出できる点が、産業保健・保険・ヘルスケアIT各領域に商機をもたらす。

カナダの研究チームが深層学習を用いた新生児MRI再構成の精度向上に成功した。成人データのみで訓練したモデルを新生児に適用する際の課題を克服し、医療機器メーカーや病院経営に広範な影響を与えうる成果である。

IIT Patnaらの研究チームが、インド系7言語に対応した多モーダル医療推論フレームワーク「ArogyaSutra」を発表した。農村部における言語障壁を起因とするヘルスケアアクセス格差の解消に向け、製薬・医療テック企業の事業戦略に影響を与えうる成果である。

中国の研究チームが科学実験室向けの視覚・言語・行動統合モデル「LabVLA」を発表した。実験プロトコルの自動実行を可能にするこの技術は、製薬・化学・材料科学分野の研究開発コストと期間を大幅に圧縮する可能性を持つ。

米研究チームがAIエージェントのエピゲノム解析能力を測る評価基準「EpiBench」を公開した。最先端モデルでも正答率は45%に留まり、製薬・バイオ企業における自律型AI導入の限界が定量的に示された。

患者データを施設外に持ち出さず複数病院が協調してAIモデルを訓練する「連合学習」システムが、治験への患者登録率を34%向上させた。新薬開発の長期化・高コスト化に悩む製薬業界に実用的な突破口を提供する。
