AI×経営戦略

AIの個人記憶、脳型設計で精度5.6倍

米研究者がユーザー固有の情報をAIモデルに外科的に書き込む新手法「User as Engram」を発表した。従来比5.6倍の推論精度と3万3千分の1のメモリ削減を両立し、企業向けAIパーソナライズの経済性を根本から変える可能性がある。

AIの個人記憶、脳型設計で精度5.6倍
広告

ボジエ・リー氏が発表した論文「User as Engram」は、大規模言語モデルにおける個人記憶の実装方法を刷新する手法を提案している。現在主流のパーソナライズ手法には大きく二種類ある。一つはユーザーの情報をモデル外部のテキストファイルや検索インデックスに保存するRAG型、もう一つはユーザーごとのLoRAアダプターとしてモデルの重みに組み込む手法である。いずれも商用AIサービスで広く採用されているが、精度・コスト・スケーラビリティの三点で根本的な限界を抱えていた。

新手法はヒトの脳の記憶構造を参考に設計されている。海馬が個別エピソードを局所的なエングラム(記憶痕跡)として保持し、大脳新皮質が共有の推論能力を担うという二層構造を模倣する。具体的には、ユーザー固有の事実情報をモデル内部のハッシュキー型メモリテーブルに「外科的編集」として書き込み、推論能力は全ユーザーが共有する単一アダプターで賄う設計だ。異なるユーザーの情報は互いに干渉しない独立したハッシュスロットに格納されるため、多数のユーザーデータを一つのテーブルに損失なく重ね合わせることができる。

性能面での優位性は顕著である。従来のLoRAアダプターと比較して間接推論の精度が平均5.6倍向上し、メモリ使用量は約3万3千分の1に圧縮される。また、ユーザー数が約100件を超えると、2.5倍大きなモデルを使用したRAGパイプラインをも推論速度で上回るという結果が示された。

この技術が最も直接的に影響を与える産業はフィンテック・保険・医療の三分野である。金融機関のリテール部門では、顧客の投資方針・リスク許容度・過去の相談履歴をAIアドバイザーに恒久記憶させることで、再説明コストの削減と顧客満足度スコア(CSAT)の改善が期待できる。保険会社のコールセンターでは、契約内容や過去の事故歴を即時参照した応答が可能となり、平均処理時間(AHT)の短縮に直結する。医療分野では、電子カルテとの連携により患者ごとのアレルギー情報や投薬履歴をAI診断支援システムが正確に参照でき、医療過誤リスクの低減につながる。

Eコマースおよびサブスクリプションサービス企業にとっても戦略的意義は大きい。マーケティング部門はユーザーの購買履歴・嗜好・検索パターンをモデルに内在化することで、レコメンデーションエンジンの精度向上とCPA(顧客獲得単価)改善を見込める。現行のRAG型パーソナライズでは検索レイテンシが顧客体験を損なうケースがあったが、本手法ではユーザー数の増加に対してレイテンシが線形増加しない構造的優位性がある。

インフラコストの観点も見逃せない。クラウドサービス企業のMLOps部門にとって、ユーザーごとに独立したLoRAアダプターを保持・切り替えるオペレーションは、ユーザー数の増加とともに管理コストが爆発的に膨張する課題があった。本手法では全ユーザーが単一のモデルインスタンスを共有しながら個別記憶を保持できるため、GPU使用効率(MFU)の改善とインフラ費用の大幅削減が実現しうる。

一方で実装上の留意点もある。現時点では研究段階の提案であり、本番環境での大規模検証は今後の課題である。ハッシュ衝突の確率的管理やプライバシー規制への対応、既存MLパイプラインとの統合コストなどを考慮した上で、段階的な導入検討が現実的な選択肢となる。エンタープライズAI戦略の立案部門は、RAGとLoRAの代替として本手法の動向を引き続き注視する必要がある。

出典: User as Engram: Internalizing Per-User Memory as Local Parametric Edits, Bojie Li, arXiv:2606.19172v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告