Wenting Zhao

Nuovo framework migliora la generazione di risposte lunghe dalle tabelle.

2025-09-24T19:43:42+00:00 ― 8 leggere min

Questa ricerca si concentra sul migliorare la riformulazione delle domande per interazioni utente migliori.

2025-07-07T18:16:48+00:00 ― 9 leggere min

Un nuovo benchmark valuta i LLM per l'accuratezza fattuale.

2025-07-07T18:08:54+00:00 ― 6 leggere min

Esplora la necessità di un sistema di feedback aperto per migliorare le risposte dell'IA.

2025-06-27T17:51:24+00:00 ― 6 leggere min

I modelli linguistici sono forti nei compiti di memoria ma fanno fatica con le sfide di ragionamento.

2025-06-24T14:08:54+00:00 ― 5 leggere min

Uno strumento per analizzare i registri delle chat in modo rapido ed efficace per i ricercatori.

2025-06-16T17:36:06+00:00 ― 6 leggere min

La ricerca si concentra sul migliorare la capacità dei modelli linguistici di capire testi più lunghi.

2025-06-10T03:36:06+00:00 ― 9 leggere min

I modelli di linguaggio grandi migliorano le valutazioni della sintesi del codice con valutazioni creative.

2025-04-23T14:57:45+00:00 ― 6 leggere min

Esaminare i problemi nelle valutazioni dei chatbot guidati dalla comunità e modi per migliorarli.

2025-04-11T18:18:00+00:00 ― 6 leggere min