トピック: Reinforcement Learning from Human Feedback

全セクション横断 2 件

マサチューセッツ大学などの研究チームが、ユーザーのマウス操作と視線データだけでLLMの応答品質を大幅に向上させる手法を開発した。高コストな人手評価を代替しうる技術として、AI導入企業の運用コスト削減に直結する可能性がある。

米マサチューセッツ大学などの研究チームが、ユーザーのマウス操作と視線データからAIの回答品質を自動改善する手法を開発した。明示的な評価入力を不要とし、AI改善コストの大幅削減が見込まれる。