I-CURL:I-CURL:新しいアプローチAIの行動における報酬関数推論を革新中。機械学習逆凹型効用強化学習の進展AIの行動における複雑な報酬関数を理解するための新しいアプローチ。2025-08-05T02:36:06+00:00 ― 1 分で読む