Zilong Zheng

MindDial migliora le conversazioni con l'IA tenendo conto delle credenze e delle prospettive individuali.

2025-10-26T19:04:54+00:00 ― 6 leggere min

MathBench valuta le capacità matematiche degli LLM in vari livelli educativi.

2025-08-09T21:32:48+00:00 ― 5 leggere min

DiveR-CT migliora il red teaming automatico per valutazioni di sicurezza migliori.

2025-08-05T02:44:00+00:00 ― 7 leggere min

Un nuovo approccio migliora i modelli Transformer per una migliore elaborazione dei testi lunghi.

2025-07-24T22:15:54+00:00 ― 6 leggere min

Un nuovo benchmark valuta come i modelli video-linguistici gestiscono efficacemente le imprecisioni.

2025-07-24T17:47:18+00:00 ― 7 leggere min

Un nuovo metodo aiuta i robot a orientarsi e muoversi correttamente per i compiti.

2025-07-14T07:05:42+00:00 ― 7 leggere min

Questo metodo migliora il ragionamento visivo implementando una verifica a ogni passo del ragionamento.

2025-07-02T15:49:48+00:00 ― 7 leggere min

Un framework che usa token di memoria migliora la comprensione e l'interazione con i video.

2025-06-18T08:10:48+00:00 ― 7 leggere min