Utsav Singh

PIPER migliora l'apprendimento per rinforzo usando feedback basato sulle preferenze per affrontare le ricompense scarse.

2025-08-17T22:02:36+00:00 ― 7 leggere min

LGR2 migliora le prestazioni nei compiti robotici grazie a istruzioni linguistiche e apprendimento gerarchico.

2025-07-31T10:25:18+00:00 ― 7 leggere min

DIPPER ottimizza l'apprendimento dei robot tramite il feedback umano, migliorando le prestazioni nei compiti.

2025-07-28T05:00:06+00:00 ― 6 leggere min

Un nuovo metodo aiuta i robot a svolgere compiti in modo più efficace suddividendo gli obiettivi.

2025-06-01T13:48:24+00:00 ― 5 leggere min