Lizhou Fan

NPHardEval4V valuta le capacità di ragionamento dei modelli di linguaggio multimodali di grande dimensione.

2025-09-01T13:19:48+00:00 ― 8 leggere min

Un sistema che simula battaglie per rivelare le esperienze dei soldati.

2025-08-17T05:19:18+00:00 ― 6 leggere min

Questo studio esamina come i LLM gestiscono il ragionamento in scenari astratti e contestuali.

2025-08-02T16:24:18+00:00 ― 5 leggere min

Sfruttare le recensioni online per migliorare l'accessibilità urbana per tutti.

2025-06-13T08:37:36+00:00 ― 7 leggere min