ウェアラブル健康データをAIが問答、精度24%向上
ケンブリッジ大学らの研究チームが、ウェアラブルデバイスの生体データに特化したAI問答フレームワーク「WEQA」を発表した。既存手法より精度が24%高く、医療専門家12人の評価でも有用性が認められた。

ケンブリッジ大学やGoogle DeepMindの研究者らが共同で開発したWEQA(Wearable hEalth Question Answering)は、スマートウォッチや生体センサーが収集する連続的な健康データを大規模言語モデル(LLM)で解析し、自然言語による質問に回答するエージェント型フレームワークである。心拍数、睡眠パターン、活動量といった高次元かつ時系列性の高いデータを扱う点で、従来の医療QAシステムとは一線を画す。
従来のLLMは医師国家試験水準の問題に高精度で対応できる一方、ウェアラブルデバイスが生成する連続センサーデータの解釈には構造的な弱点があった。センサーの種類やユーザーの問い合わせ意図が多岐にわたるため、単一の推論ワークフローでは対応しきれなかった。WEQAはLLMをコントローラーとして機能させ、各クエリの性質に応じて専門分析ツールや事前学習済みモデルを動的に組み合わせる設計を採用している。さらに外部医学知識を参照しながら回答内容の妥当性を自動検証する「根拠付き監査」機能も備える。
4つの公開ウェアラブルデータセットを用いた評価実験では、既存のLLMおよびエージェント型ベースラインと比較して正解率が24%向上した。医療専門家12人と一般ユーザー8人を対象とした盲検試験でも、臨床的妥当性と実用性の両面で顕著な改善が確認されている。
ビジネスへの影響は複数の産業にまたがる。健康保険業界では、保険会社のアンダーライティング部門が加入者のウェアラブルデータを活用したリスク評価モデルを高度化できる。これまで定期健診データに依存していたリスクスコアの更新頻度を日次・週次に引き上げることで、保険料算定の精度向上や早期介入による医療費抑制効果が見込まれる。損害率(ロス・レシオ)の改善という形でKPIに直結する可能性がある。
企業の人事・福利厚生部門にとっても活用余地は大きい。従業員の健康増進プログラム(ウェルネスプログラム)の効果測定において、WEQAのような仕組みを導入すれば、担当者が専門的なデータ分析知識を持たなくても自然言語でウェアラブルデータの傾向を照会できる。プレゼンティーイズム(出社しているが生産性が低い状態)の把握や、メンタルヘルス施策の効果測定指標としての活用が想定される。
医療機器メーカーおよびデジタルヘルス企業にとっては、製品差別化の観点から重要な技術となりうる。ウェアラブルデバイスにWEQAの機能を統合することで、単なるデータ収集端末からインタラクティブな健康相談ツールへの転換が可能となる。月間アクティブユーザー数(MAU)やアプリ内エンゲージメント指標の向上が期待される。
一方、実用化にあたっては課題も残る。個人の生体データを扱うため、改正個人情報保護法や医療情報の第三者提供に関する規制への対応が不可欠である。また、AIが出力した健康上の見解が医療行為に該当するかという法的グレーゾーンについても、厚生労働省の見解を踏まえた慎重な設計が求められる。研究チームは今後、より多様なセンサーモダリティへの対応と、臨床現場での実証実験を進める方針を示している。