Junru Wu

Un nuovo metodo per migliorare le prestazioni dei LLM nei compiti di ranking dei documenti.

2025-10-25T11:13:06+00:00 ― 6 leggere min

LAMPO migliora la classificazione ordinale usando grandi modelli linguistici per un confronto migliore degli oggetti.

2025-07-01T13:37:42+00:00 ― 5 leggere min

Un nuovo modo di addestrare i modelli di ricompensa migliora l'allineamento dell'IA con le preferenze umane.

2025-06-09T16:00:54+00:00 ― 7 leggere min