トピック: Curriculum Learning

全セクション横断 4 件

カナダの研究チームが強化学習エージェントの訓練に必要な多様な仮想環境を自動生成する手法を発表した。従来は手作業だった環境構築を自動化し、AI開発の工数を大幅に削減できる可能性がある。

オランダの研究チームが安全強化学習の新ベンチマーク「CRAX」を発表した。JAXによるハードウェア高速化で従来比最大100倍の試験速度を達成し、自律走行・産業ロボットの開発サイクルを大幅に短縮できる可能性がある。

香港大学などの研究チームが開発した拡散型言語モデル「DreamReasoner-8B」が、数学・コード推論で自己回帰型の主要モデルと同等の性能を達成した。推論速度と品質の両立という長年の課題に解決の糸口を示した。

アリババ系Qwenチームが言語命令で未来映像を予測する世界モデル「Qwen-RobotWorld」を発表した。製造・物流・自動運転の開発期間短縮とデータ収集コスト削減に直結する技術として注目を集めている。