Shenao Zhang

Un nuovo metodo migliora i modelli linguistici cercando attivamente risposte diverse.

2025-08-05T06:41:00+00:00 ― 6 leggere min

Introducendo un metodo per ridurre l'overoptimization nei modelli addestrati con feedback umano.

2025-07-26T04:46:48+00:00 ― 6 leggere min

Un nuovo metodo migliora i modelli di codifica usando test auto-generati.

2025-05-19T03:37:20+00:00 ― 6 leggere min

Scopri come i robot possono migliorare seguendo i comandi umani e adattandosi agli errori.

2025-01-22T09:09:54+00:00 ― 7 leggere min