オフラインRLを使ったVLオフラインRLを使ったVLNエージェントフォーマンスを改善する。最適じゃないデータ手法でナビゲーションパコンピュータビジョンとパターン認識オフライン強化学習による視覚と言語のナビゲーションの進展この研究は、サブオプティマルデータを使ってVLNエージェントを改善するためのオフラインRL手法を強調してるよ。2025-08-24T23:22:00+00:00 ― 1 分で読む