MetricRL:MetricRL:RLの次のステップ革新する。最適じゃないデータでエージェントの学びを機械学習MetricRLを使った強化学習エージェントの学習改善MetricRLは目標指向のタスクで過去の経験からの学びを強化する。2025-09-07T05:28:24+00:00 ― 1 分で読む