Elizabeth Daly

Un nuovo metodo per perfezionare i sistemi di ricompensa nel reinforcement learning usando il feedback degli utenti.

2025-10-02T12:11:36+00:00 ― 9 leggere min

Presentiamo un nuovo approccio per classificare i modelli linguistici senza bisogno di risposte di riferimento.

2025-09-05T20:25:30+00:00 ― 10 leggere min