Max Bartolo

Esaminare l'affidabilità del feedback umano per valutare i risultati dei modelli di linguaggio.

2025-09-20T21:35:12+00:00 ― 7 leggere min

Un'iniziativa guidata dalla comunità per identificare i prompt dannosi nei modelli T2I.

2025-09-08T09:31:06+00:00 ― 6 leggere min

Un nuovo metodo migliora i modelli di ricompensa usando critiche sintetiche per un allineamento migliore.

2025-08-03T23:12:54+00:00 ― 13 leggere min