既存業務基盤にAI推論層を追加する新機構登場
IBMリサーチの研究者らが、既存のワークフローエンジンを置き換えることなくAIエージェントを組み込む「プロセスハーネス」機構を発表した。基幹業務システムの刷新コストを抑えながらAI活用を加速できる可能性があり、金融・保険・製造業の業務改革に直結する成果である。

研究の概要
イスラエル・IBMリサーチのFabiana Fournier氏とLior Limonad氏は、既存の決定論的ワークフローエンジンをそのまま稼働させながら、その外側にAIエージェント層を被せる**「プロセスハーネス」**と呼ぶ新機構を提案した。論文はarXivで公開されている。
従来のBPM(ビジネスプロセス管理)システムは、あらかじめ定義されたフロー通りに処理を進める反面、例外対応や状況に応じた判断が苦手であった。かといって大規模言語モデル(LLM)に処理全体を委ねると、コンプライアンス上の要件を満たすことが困難になる。プロセスハーネスはこの矛盾を解消するアーキテクチャである。
具体的には、TDF(Task-Decision-Flow)モデルと呼ぶデータスキーマと実行意味論を定義し、LLMによる推論を3種類のエージェントに分解する。「TaskAgent」は知識集約型タスクを担い、「DecisionAgent」はケースごとの分岐判断を行い、「FlowAgent」はフック機構を通じてプロセスの実行時適応を統括する。各エージェントは「プロセスFRAME」と呼ぶポリシーセット内で推論するため、LLMの動作が組織のルールや規制の枠内に収まることが保証される。
検証には住宅ローン審査ワークフローが用いられ、3種すべてのエージェントと規制上書き処理が正常に機能することが確認された。同機構の実装はCUGA FLOというプラットフォームで実現されている。
ビジネスへの示唆
この研究が企業にとって重要なのは、「基幹システムを捨てずにAIを使える」という点に尽きる。多くの大企業では、SAP・Pegasystems・IBMのBPMスイートなどに数年・数十億円規模の投資をしており、全面刷新は現実的でない。プロセスハーネスはこの制約を回避する。
影響を受ける主な業界・部門とKPIは以下の通りである。
- 金融・銀行の審査部門: ローン・クレジット審査の自動化率および審査リードタイムが主要KPIとなる。DecisionAgentが個別案件の与信判断を担い、規制要件はポリシーで担保されるため、Basel IIIやFSA対応と両立できる。
- 損害保険の査定部門: 保険金支払い判断における例外処理件数と査定コストが改善対象となる。複雑な約款解釈をTaskAgentが担当し、FlowAgentが規約逸脱を検知する。
- 製造業の調達・購買部門: 発注承認ワークフローにおける例外承認件数の削減と処理スループット向上が期待される。
- 医療機関の診療報酬請求部門: 請求エラー率と返戻率の低下。規制ポリシーをFRAMEに組み込むことで診療報酬改定への追従も効率化される。
システム統合の観点からも意義は大きい。既存エンジンが「構造的権限」を保持し続けるため、監査ログや変更管理の連続性が保たれる。コンプライアンス部門がAI導入に難色を示す最大の理由である「説明可能性の欠如」に対し、ポリシー準拠の推論記録が自動生成される点は、金融庁・厚労省等への説明責任を求められる日本企業にとって特に価値が高い。
今後の展望
課題も残る。TDFモデルの設計にはプロセスFRAMEの適切な定義が必要であり、ポリシー設計の専門知識とシステム実装コストが導入障壁となりうる。また、LLMの出力品質がエージェント判断の精度に直結するため、モデルの選定・バージョン管理が運用上の新たなリスクとなる。
一方、エンタープライズAIの文脈では「ガバナンスを損なわないAI自律化」への需要は急速に高まっており、プロセスハーネスのアプローチはその有力な解の一つとなりうる。日本では2025年以降に本格化する金融機関のAI審査対応や、製造業のスマートファクトリー化において、既存BPM資産を活かしながらAIを段階導入する手法として注目を集める可能性がある。
同セクションの記事
AIが自律的に有害画像を排除、自己改善型コードブック登場
英オックスフォード大らの研究チームが、自動回帰型画像生成AIの安全性を人手によるアノテーションなしに反復的に高める手法を発表した。企業が生成AIを活用する際のコンプライアンスコストを大幅に削減できる可能性がある。

新最適化手法でAI学習コスト大幅削減
行列直交化に基づく分散学習最適化手法「DMuon」が公開された。従来比で最大163倍の最適化ステップ高速化を実現し、大規模AIモデルの開発コストと期間を抑制できる可能性がある。

LLM障害分析の精度、実態は2割どまり
大規模言語モデルによる障害根本原因分析の正解率が平均20.7%にとどまることが新ベンチマーク研究で判明した。AI活用を進めるITオペレーション部門にとって、信頼性評価の再設計が急務となる。
