AI×経営戦略2026年7月2日読了約4分

人間の操作履歴からAIがブラウザ技能を自動習得

保存

中国の研究チームが、人間のブラウザ操作履歴をAIが自律的に「スキル」として抽出・再利用する手法を発表した。業務自動化の範囲を大幅に拡張できる可能性があり、ホワイトカラー業務の生産性指標に直接影響を与えると見られる。

研究の概要

Kaisen Yangら14名の研究チームは、ブラウザ上での人間の操作履歴を自然言語の「スキル」単位に変換し、AIエージェントがそれを読み取り・検索・再利用・組み合わせできる枠組みを提案した。論文のタイトルは「Scalable Behaviour Cloning on Browser via Skill Distillation」であり、arXivにて公開されている。

従来のブラウザ自動化AIは、あらかじめ人手で設計したタスクを学習させる必要があり、対応できる業務の幅が限られていた。本研究はこの課題に対し、インターネットユーザーが日常的に行う操作――ソフトウェア開発、文書編集、フォーム入力、企業内ワークフローなど――をそのまま学習源として活用する点で根本的に異なるアプローチをとる。

抽出されたスキルはスキルグラフと呼ばれる構造に整理され、スキルの数が際限なく増大するのではなく、類似スキルを統合しながら体系的に拡張される設計となっている。研究チームは「ブラウザエージェントのスケーラビリティは、手動設計タスクよりも、インターネットユーザーが既に表現している集合的スキルから生まれる」と主張する。

ビジネスへの示唆

この技術が実用化された場合、影響を受ける業種・部門・KPIは広範にわたる。

バックオフィス・間接部門：経理、人事、調達など反復的なWebフォーム入力やシステム間データ転記が自動化対象となり、処理件数あたりのコストおよびエラー率の改善が見込まれる。
金融・保険業：社内システムと外部ポータルをまたぐ審査・照会業務において、担当者一人あたりの**処理件数（スループット）**を引き上げる効果が期待できる。
ITサービス・ヘルプデスク：チケット登録や設定変更など定型操作の自動化が加速し、**一次解決率（FCR）**の向上につながる可能性がある。
EC・マーケティング部門：競合調査や価格モニタリングといったブラウザ上の情報収集タスクを人手なしで継続実行でき、市場反応速度が高まる。

特に注目すべきは、学習に必要なデータが「既存の業務操作履歴」であるという点だ。企業はゼロからトレーニングデータを用意する必要がなく、社内の操作ログをそのまま活用できる可能性がある。これはRPA（ロボティック・プロセス・オートメーション）の導入コストを大幅に下げる契機となり得る。RPAは現状、業務フローの設計・メンテナンスに多大な人的リソースを要するが、本手法はその課題に直接応える。