AI×経営戦略

AIの「スキル」を潜在変数に圧縮、推論コスト削減へ

香港大学らの研究チームが、AIエージェントの行動指針をMarkdownファイルではなく数十トークンの連続ベクトルに圧縮する手法「SoftSkill」を発表した。推論コストの削減と精度向上を同時に実現し、企業のAI運用経済性を根本から変えうる。

AIの「スキル」を潜在変数に圧縮、推論コスト削減へ
広告

香港大学などの研究チームは、大規模言語モデル(LLM)に与える「スキル」情報の格納方法を抜本的に見直す手法「SoftSkill」を論文として公表した。従来、AIエージェントの業務手順や回答方針は自然言語のMarkdownファイルとしてプロンプトに付加されてきたが、同手法ではそれを長さ32トークン程度の潜在ベクトルに圧縮して保持する。ベースモデルのパラメータは一切変更せず、追加学習によって得られた「ソフトスキル」を推論時のプレフィックスとして挿入する設計である。

性能面では顕著な改善が確認されている。Qwen3.5-4Bモデルを用いた評価において、スキルなしのプロンプティングと比較してSearchQAで8.3ポイント、LiveMathで42.1ポイント、DocVQAで1.3ポイントそれぞれ精度が向上した。先行手法であるSkillOptとの比較でも、SearchQAで5.2ポイント、LiveMathで12.5ポイントの上乗せを達成しており、数百から数千に及ぶMarkdownトークンをわずかな仮想トークンで代替できることを示している。

この技術が企業のAI活用に与える影響は複数の側面から検討できる。第一にコスト構造の変化である。カスタマーサポートや社内ヘルプデスクのAI化を進める企業では、問い合わせごとに長大なシステムプロンプトをAPIに送信することが常態化しており、入力トークン数に比例して課金されるクラウドLLMサービスの費用が膨らむ課題があった。SoftSkillのアプローチが実用化されれば、業務手順書に相当するテキストをベクトルとして事前に「焼き込む」ことで、1リクエストあたりの入力トークンを大幅に削減できる。コールセンター部門やIT部門のAI運用コスト(トークン消費量)というKPIに直接寄与する。

第二に知的財産管理の観点がある。金融機関や製薬企業では、業務ノウハウを記述したプロンプトが外部APIサーバーに送信されることへのセキュリティ上の懸念が根強い。スキルを潜在ベクトルとして保持する構造は、業務知識が人間可読なテキストとして露出しにくくなる特性を持つ。法務・コンプライアンス部門がAI導入の承認要件として求めるデータ漏洩リスクの低減に貢献しうる点で、金融・医療・法律分野への展開が期待される。

第三に業務特化モデルの展開コストである。製造業の品質管理部門や小売業のマーチャンダイジング部門など、部門ごとに異なる判断基準をAIに持たせたい場合、ファインチューニングは計算資源と管理コストが大きい。SoftSkillはベースモデルを凍結したまま軽量なベクトルを部門別に用意するだけで行動様式を切り替えられるため、モデル管理の複雑性を抑えつつ多様な業務への適応が可能となる。部門別のAI応答品質(タスク達成率)を独立して最適化・評価できる運用体制の構築につながる。

一方で論文自体が認めているように、複数ステップにわたるエージェント的タスク、すなわち長期的な手順実行が求められる業務への適用はいまだ発展途上である。倉庫管理の自動発注フローや経理部門における複合的な承認プロセスへの適用には追加研究が必要とされる。また、潜在ベクトルの解釈可能性が低い点は、AIシステムの判断根拠を説明する義務が生じる規制業種において導入障壁となりえる。

現時点では学術的な提案段階にあるが、トークン経済性と業務適応性を両立するこの方向性は、企業のAI調達戦略とシステム設計思想に中期的な影響を与えると見られる。

出典: SoftSkill: Behavioral Compression for Contextual Adaptation, Xijia Tao, Yihua Teng, Xinyu Fu, Ziru Liu, Kecheng Chen, Yuzhi Zhao, Suiyun Zhang, Rui Liu, Lingpeng Kong, arXiv:2606.20333v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告