Diese Studie hebt Offline-RL-Methoden hervor, um VLN-Agenten mit suboptimalen Daten zu verbessern.
― 9 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Diese Studie hebt Offline-RL-Methoden hervor, um VLN-Agenten mit suboptimalen Daten zu verbessern.
― 9 min Lesedauer