AI×経営戦略6/22(月)強化学習の分散低減、企業AI活用を加速マックス・プランク研究所などの研究チームが強化学習の時間差分学習における分散の上界を理論的に証明し、より少ないデータで安定した意思決定AIを構築できる道筋を示した。
AI×経営戦略6/18(木)TD学習の誤差上限、新理論で解明強化学習の基盤手法である時間差分学習の誤差挙動を確率微分方程式で精密に記述する理論が発表された。AIモデルの精度管理と計算コスト最適化に直結する成果として注目される。