AI×法務読了 約4

LLM個人情報消去の精度評価、新基盤登場

大規模言語モデルが記憶した個人情報を真に削除できているかを検証する初のパラメータ水準テストベッド「LACUNA」が発表された。既存の消去手法が出力を隠蔽するにとどまることを示し、企業のAIガバナンスに根本的な問い直しを迫る。

LLM個人情報消去の精度評価、新基盤登場
広告

研究の概要

大規模言語モデル(LLM)は学習データに含まれる氏名・住所・電話番号などの個人識別情報(PII)を内部パラメータに記憶する。欧州の一般データ保護規則(GDPR)や国内の個人情報保護法が定める「忘れられる権利」への対応として、モデルから特定知識を事後的に除去する「アンラーニング」手法が注目を集めているが、その実効性の検証方法には大きな空白が存在した。

カナダ・マギル大学らの研究チームが発表したLACUNAは、この空白を埋める初のテストベッドである。合成個人のPIIを10億・70億パラメータ規模のOLMoモデルの事前に特定されたパラメータ群へ意図的に注入することで、「どのパラメータが知識を保持しているか」という正解データを持つ評価環境を構築した。これにより、アンラーニング手法が本当に該当パラメータを書き換えているのか、それとも出力層で回答を抑制しているにすぎないのかを直接判定できる。

実験の結果は業界にとって警戒すべき内容であった。最先端のアンラーニング手法は出力評価では高い消去性能を示す一方、パラメータ水準では照準が大きくずれており、復元攻撃(リサーフェシング攻撃)によって消去されたはずの情報が再出力される脆弱性が確認された。逆に、パラメータの特定が正確であれば、単純な勾配ベースの手法でも強固な消去と攻撃耐性が得られることが示された。

ビジネスへの示唆

この研究が直撃するのは、LLMを自社サービスや内部業務に組み込む企業のコンプライアンス・法務・ITガバナンス部門である。現状、多くの企業はアンラーニング手法の「出力評価スコア」をもって規制当局への説明責任を果たしていると判断しているが、LACUNAの知見はその前提を崩す。

影響を受ける主な領域は以下のとおりである。

  • 金融・保険業: 顧客の取引履歴や与信情報をファインチューニングに使用したモデルに対し、退会・解約時の情報消去要求が法的義務となりつつある。出力抑制だけでは規制審査を通過できないリスクが高まる。
  • 医療・ヘルスケア: 患者の診療記録を学習させた医療支援AIにおいて、同意撤回後の真正な削除証明が求められる。訴訟リスクと監督官庁への報告義務に直結する。
  • HR・採用テック: 候補者情報を扱うAIでは、削除要求対応の不備がGDPRや個人情報保護委員会の行政処分につながり得る。

KPI観点では、アンラーニング対応の達成率を「出力テスト合格率」から「パラメータ水準の消去精度」へ再定義する必要が生じる。監査コストの増大も見込まれるが、不完全な消去が情報漏洩事案として表面化した場合のレピュテーション損失と比較すれば、先行投資の合理性は高い。

今後の展望

LACUNAはオープンソースとして公開されており、企業のAIセキュリティチームや規制当局が独自に手法を評価する基盤として活用できる。今後はGPTやClaudeといった非公開アーキテクチャへの応用可能性や、より大規模なパラメータ空間での検証が課題となる。

アンラーニング技術の標準化に向けた議論は国際的に加速しており、NISTやEUのAI法執行機関が評価指標の策定を進める中、LACUNAのようなパラメータ水準の検証手法が業界標準の一角を担う可能性がある。「消去した」という証明責任を問われる時代に備え、LLM導入企業は出力評価一辺倒のガバナンス体制を早急に見直すべき局面に入った。

関連トピック

出典: LACUNA: A Testbed for Evaluating Localization Precision for LLM Unlearning, Matteo Boglioni, Thibault Rousset, Siva Reddy, Marius Mosbach, Verna Dankers, arXiv:2607.02513v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

同セクションの記事

広告