AI×法務

AI推論の「選択的忘却」技術が実用化へ

AIモデルから特定知識だけを外科的に消去する技術「MAST」が開発された。既存手法が引き起こす性能劣化を大幅に抑制し、コンプライアンス対応や知財管理に求められる精密な学習取消しを可能にする。

AI推論の「選択的忘却」技術が実用化へ
広告

中国の研究者らは、強化学習によって獲得したAIの推論能力を、他の能力を損なわずに選択的に消去する手法「MAST(Mechanism-Aligned Selective Targeting)」を発表した。大規模言語モデルの商用展開が加速する中、学習済みモデルから特定情報を安全に除去する「アンラーニング(学習取消し)」技術は、法規制対応の観点から業界の急務となっている。

従来のアンラーニング手法では、モデルの全パラメータを更新するため、消去対象以外の能力まで劣化する問題があった。研究チームの実験では、標準的な全パラメータ更新を施したモデルで、数学ベンチマーク「GSM8K」のスコアが大幅に崩壊する事例が確認された。これは企業がAIを業務システムに組み込んだ後に知識修正を試みた場合、サービス品質の予期せぬ低下を招くリスクを意味する。

MASTはこの問題をアーキテクチャの解析から解決する。強化学習前後のモデルを比較し、「注意投影テンソル」と呼ばれる特定パラメータ群を、忘却対象への影響度と既存知識への干渉度に基づいてランク付けする。更新対象を上位に絞ることで、主要モデルでの実験において忘却対象のスコアを150問中45問から37問へ統計的有意に低下させながら、保持対象のGSM8Kスコアを維持、MATHの保持問題も0.5ポイント減にとどめた。

この技術が直接的に影響するのは、まず法務・コンプライアンス部門である。欧州のAI法やGDPRに基づく「忘れられる権利」への対応において、企業はユーザーデータに由来する学習効果の消去を求められる場面が増えている。従来は対応困難だったモデルレベルの個人情報除去が、MASTを活用することで精度高く実施できる可能性がある。対応コストと再学習コストの削減という形でKPI改善に直結する。

金融業界においても活用余地は大きい。銀行・証券各社は独自データでファインチューニングしたモデルを審査や市場分析に活用するが、提携解消や規制変更に伴い特定取引先の情報や禁止手法を学習から除去しなければならない状況が生じる。モデル全体を再学習せずに対処できれば、開発費用と時間を大幅に圧縮できる。システム部門が管理するモデル保守コストは主要なKPIとなる。

製薬・医療機器業界では、臨床試験データや特定化合物の合成経路をモデルが習得している場合、特許戦略や規制当局への対応として特定知識の消去が必要になる局面がある。MASTのような精密なアンラーニングは、研究開発部門が保有するモデル資産の知財管理ツールとして機能しうる。

教育テクノロジー分野では、学習者の誤答パターンや不適切な解法をモデルに記憶させた後、特定の誤概念だけを取り除いて正確な教授法に更新するという応用が考えられる。学習成果指標の改善に寄与する可能性がある。

課題も残る。現時点の実験はQwen2.5-Math-1.5BおよびQwen3-1.7B-Baseという比較的小規模なモデルで行われており、GPT-4やClaudeクラスの大規模モデルへの適用可能性は未検証である。また、消去すべき対象の定義が曖昧な実業務では、ランク付け基準の設定が困難になる場合も想定される。

研究チームは複数の最適化手法や異なるモデルアーキテクチャでの再現性を確認しており、汎用性の高さを示唆している。アンラーニング技術は今後のAIガバナンス規制強化とともに企業の必須インフラとなる見通しであり、精度と安全性を両立する本手法は商用化に向けた重要な一歩となる。

出典: Mechanism-Guided Selective Unlearning for RLVR-Induced Reasoning, Chenyu Zhou, Qiliang Jiang, Shuning Wu, Xu Zhou, arXiv:2606.19222v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告