Kaijie Zhu

Un nuovo metodo bilancia la robustezza del modello e la generalizzazione contro input complicati.

2025-10-13T16:16:00+00:00 ― 5 leggere min

Introducing un nuovo modo per valutare i modelli di linguaggio grandi in modo efficace.

2025-09-05T09:14:00+00:00 ― 7 leggere min

NPHardEval4V valuta le capacità di ragionamento dei modelli di linguaggio multimodali di grande dimensione.

2025-09-01T13:19:48+00:00 ― 8 leggere min

Questo studio esamina come i LLM gestiscono il ragionamento in scenari astratti e contestuali.

2025-08-02T16:24:18+00:00 ― 5 leggere min

Esaminare i problemi e i possibili miglioramenti nella revisione paritaria accademica.

2025-07-27T05:49:42+00:00 ― 8 leggere min