Goran Radanovic

エージェントの行動によって引き起こされる環境の変化を考慮した新しい強化学習のアプローチがあるよ。

2025-09-07T14:09:48+00:00 ― 1 分で読む

新しいアプローチがAIエージェントに構造化されたディベートを通じて正当な決定を下すようにトレーニングするんだ。

2025-09-04T13:05:18+00:00 ― 1 分で読む

パフォーマティブRLがゲームのダイナミクスやポリシーの安定性にどう影響するか探ってるんだ。

2025-05-28T22:03:27+00:00 ― 1 分で読む