Aviral Kumar

Integrare modelli vision-language con l'apprendimento rinforzato migliora l'efficienza dell'apprendimento automatico.

2025-09-11T15:59:30+00:00 ― 6 leggere min

Un nuovo framework migliora il processo decisionale multi-turn per i modelli linguistici.

2025-09-02T23:18:00+00:00 ― 7 leggere min

Questo articolo parla di come usare la classificazione per le funzioni di valore nel deep reinforcement learning.

2025-08-23T12:51:08+00:00 ― 6 leggere min

Questo studio valuta i metodi per migliorare i modelli di linguaggio di grandi dimensioni utilizzando i dati delle preferenze degli utenti.

2025-08-17T07:09:54+00:00 ― 6 leggere min

Un approccio nuovo per rendere gli assistenti digitali più intelligenti grazie a un apprendimento continuo.

2025-07-29T01:56:12+00:00 ― 6 leggere min

Le ricerche mostrano un miglioramento delle prestazioni nei modelli linguistici usando computazione adattiva al momento del test.

2025-07-01T13:06:06+00:00 ― 9 leggere min

Un nuovo modo di addestrare i modelli di ricompensa migliora l'allineamento dell'IA con le preferenze umane.

2025-06-09T16:00:54+00:00 ― 7 leggere min

Scopri come il Reinforcement Learning Agnostico alla Politica cambia il processo decisionale delle macchine.

2025-03-29T14:06:54+00:00 ― 7 leggere min