AI法律引用、ハイブリッド型で幻覚ゼロ達成
カナダの研究チームが賃貸借法を対象にAIの法令条文引用精度を比較実験し、微調整と検索を組み合わせたハイブリッド手法が幻覚をゼロに抑えつつ最高精度を記録した。法務・不動産業界への実装競争が加速しそうだ。

カナダの研究者チームは、大規模言語モデル(LLM)による法令条文の正確な引用という実務課題に正面から取り組んだ論文を発表した。対象はオンタリオ州の住宅賃貸借法(Residential Tenancies Act、2006年)で、自己代理の借主・貸主や相談窓口スタッフが「どの条文が自分の問題を規律しているか」を即座に知る必要がある場面を想定している。
実験はQwen2.5-7B-Instructモデルを用いた四方向比較で構成された。第一がベースモデルによるゼロショット推論、第二がLoRAを用いたファインチューニング単独(SFT-only)、第三が検索拡張生成単独(RAG-only)、第四がファインチューニングと検索を組み合わせたハイブリッド(SFT+RAG)である。評価指標は条文番号と項番号の完全一致率(Exact-Match)とした。
結果はハイブリッド手法の優位性を明確に示した。ベースモデルは賃貸借法の条文をほぼ引用できず、SFT単独は誤った条文番号を「自信を持って」出力する誤想起(hallucination)が頻発した。一方、RAGを組み込んだ手法は構造上、存在しない条文を生成する余地がなくなるため幻覚をゼロに抑制した。SFT+RAGは完全一致率0.481を記録し、四手法中最高となった。さらに注目すべき点として、小型の埋め込みモデル(bge-small)を使った低コストな検索基盤でも、大型エンベッダーとクロスエンコーダ再ランカーを組み合わせた高コスト構成に匹敵または凌駕する結果が得られた。訓練データを増やしても精度向上は見られず、「特殊化された検索モデルや大量データは必ずしも必要ない」という知見を示した。
この研究が示すビジネス上の含意は広範かつ即効性が高い。まず不動産管理会社・賃貸仲介会社のカスタマーサポート部門では、テナントからの問い合わせ対応コストを大幅に削減できる可能性がある。従来、法的根拠を示した回答には社内弁護士や外部顧問の確認が必要だったが、幻覚ゼロの条文引用AIが一次回答を担うことで、専門家への照会件数削減という形でKPIが改善しうる。問い合わせ解決時間(AHT)の短縮も直接的な効果として見込まれる。
法律テック企業(LegalTech)にとっては、小型モデルと軽量検索基盤で競争力ある製品を構築できる可能性を示す知見であり、参入コストの低下が市場競争を促進しよう。特に中小法律事務所向けのSaaSプロダクトや、自治体が運営する法律相談窓口のデジタル化案件において応用範囲は広い。
コンプライアンス部門を抱える金融機関や保険会社も無関係ではない。法令改正時の条文トレースや契約書のコンプライアンスチェック業務に同様のアーキテクチャを転用すれば、監査対応工数の削減や誤引用リスクの低減が期待される。KPI換算では、法令確認にかかる人的工数(時間)や外部顧問費用が定量評価の軸となる。
ただし研究チーム自身が指摘するように、現時点での完全一致率0.481は目標値0.70に届いておらず、評価セットも小規模で人手検証が完了していない予備的な結果である。実業務への本格展開には、より大規模かつ検証済みの評価データでの追試と、誤答した場合のリスク管理プロセスの整備が不可欠だ。法令条文の誤引用は当事者に直接的な不利益をもたらすため、AIの出力を最終判断とせず専門家によるレビューを挟む運用設計が当面は求められる。
法律AIの信頼性を「幻覚ゼロ」という指標で定量化しようとする本研究のアプローチ自体は、業界標準の議論を前進させる意義を持つ。日本の借地借家法など類似の国内法制度への応用可能性も含め、法務テクノロジー分野への波及が注目される。