Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Eugene Santos

機械学習マルコフじゃない報酬関数で強化学習を進める

複雑な環境で隠れたトリガーを使ってRLエージェントをトレーニングする新しい方法。

2025-09-15T17:09:42+00:00 ― 1 分で読む