Hwaran Lee

APRICOT aumenta la fiducia nei modelli linguistici misurando con precisione la fiducia nelle risposte.

2025-08-31T00:04:06+00:00 ― 7 leggere min

AdvisorQA valuta la capacità dei modelli di linguaggio di fornire consigli personali in modo efficace.

2025-08-18T23:27:18+00:00 ― 6 leggere min

Un nuovo standard per valutare la conoscenza culturale nei modelli di linguaggio attraverso culture diverse.

2025-07-28T18:25:54+00:00 ― 7 leggere min

Un metodo fresco per testare la sicurezza del modello linguistico e le abilità multilingue.

2025-07-28T02:37:54+00:00 ― 8 leggere min

La ricerca si concentra sul miglioramento dell'affidabilità nei modelli di linguaggio grandi utilizzando la quantificazione dell'incertezza.

2025-06-28T11:22:06+00:00 ― 7 leggere min