Michal Nauman

強化学習エージェントの行動価値推定を改善する新しいアプローチ。

2025-09-02T14:05:00+00:00 ― 1 分で読む

研究によると、一般的な正則化手法がオフポリシーRLエージェントのパフォーマンスをタスク全体で向上させることがわかった。

2025-09-02T06:58:24+00:00 ― 1 分で読む

BROを紹介するよ、もっと早くロボットが学べる方法なんだ。

2025-08-07T03:03:18+00:00 ― 1 分で読む

この研究は、VLMが視覚的な視点をどれくらい理解できるかを評価している。

2025-06-18T19:38:06+00:00 ― 1 分で読む