Archit Sharma

Presentiamo SERL: un nuovo framework per compiti di apprendimento robotico efficienti.

2025-09-13T13:48:42+00:00 ― 6 leggere min

Questo articolo parla di un metodo per migliorare i LLM usando feedback verbale senza fare generalizzazioni eccessive.

2025-09-07T11:16:00+00:00 ― 11 leggere min

Uno studio sull'efficacia di RLAIF rispetto al fine-tuning supervisionato per i modelli di linguaggio.

2025-09-06T15:07:18+00:00 ― 9 leggere min

I robot stanno imparando ad adattarsi e a svolgere compiti in diversi settori.

2025-08-27T22:43:48+00:00 ― 7 leggere min

I robot imparano ad adattarsi e migliorare ricevendo feedback umano in tempo reale.

2025-08-27T22:28:00+00:00 ― 7 leggere min

Un nuovo framework aiuta i modelli di linguaggio a imparare dagli errori nella risoluzione dei problemi.

2025-08-23T19:58:48+00:00 ― 8 leggere min

Questo studio valuta i metodi per migliorare i modelli di linguaggio di grandi dimensioni utilizzando i dati delle preferenze degli utenti.

2025-08-17T07:09:54+00:00 ― 6 leggere min

Questo articolo esamina i fattori chiave nella qualità dei dataset di preferenze per un migliore addestramento dei modelli di ricompensa.

2025-06-12T06:17:36+00:00 ― 7 leggere min

Scopri come il Reinforcement Learning Agnostico alla Politica cambia il processo decisionale delle macchine.

2025-03-29T14:06:54+00:00 ― 7 leggere min