Rishabh Joshi

La ricerca punta a rendere i modelli linguistici più sicuri e utili per gli utenti.

2025-08-21T06:36:48+00:00 ― 6 leggere min

Un nuovo modo di addestrare i modelli di ricompensa migliora l'allineamento dell'IA con le preferenze umane.

2025-06-09T16:00:54+00:00 ― 7 leggere min

Questo metodo aiuta le IA a imparare creando e risolvendo sfide.

2025-05-26T00:12:48+00:00 ― 7 leggere min