AI×経営戦略6/13(土)AIエージェント評価、標準化へ新枠組み米カーネギーメロン大学らの研究チームが、AIエージェントの評価を自動化・標準化する枠組み「AgentBeats」を発表した。企業がAIシステムの導入判断に用いるベンチマークの信頼性が飛躍的に高まる可能性がある。
AI×経営戦略6/13(土)AIエージェントの複合ツール実行精度が2倍超に向上複数ツールを連携させるLLMエージェントの新手法「HyperTool」が登場した。従来比で最大3倍超の精度改善を実現し、業務自動化システムの実用性を大幅に引き上げる可能性がある。