Ji Zhang

Un nuovo approccio che usa sistemi multi-agente per potenziare modelli linguistici più piccoli.

2025-09-17T04:26:54+00:00 ― 7 leggere min

Questo articolo parla di un nuovo framework per valutare le allucinazioni nei LVLM.

2025-09-04T12:02:06+00:00 ― 7 leggere min

Un nuovo benchmark valuta come gli agenti di ruolo interagiscono socialmente.

2025-08-27T12:43:24+00:00 ― 7 leggere min

Un nuovo framework migliora il modo in cui gli agenti linguistici imparano e svolgono compiti.

2025-08-27T05:28:54+00:00 ― 6 leggere min

MIBench testa le performance dei modelli multimodali su più immagini.

2025-07-09T14:23:18+00:00 ― 6 leggere min

mPLUG-Owl3 migliora la comprensione delle immagini e dei video per risposte migliori.

2025-06-30T17:13:12+00:00 ― 7 leggere min

Un nuovo metodo per combinare i modelli linguistici in modo più efficace.

2025-06-29T22:23:30+00:00 ― 6 leggere min

Nuove tecniche di modellazione migliorano la nostra comprensione del movimento batterico.

2025-06-24T23:02:57+00:00 ― 5 leggere min

MaVEn migliora la capacità dell'AI di elaborare più immagini per un ragionamento migliore.

2025-06-23T15:38:00+00:00 ― 6 leggere min

Un nuovo framework cerca di migliorare la generazione di immagini usando il feedback umano.

2025-06-13T07:34:24+00:00 ― 6 leggere min

Uno sguardo a come i social media influenzano le opinioni collettive.

2025-05-20T18:31:30+00:00 ― 8 leggere min

Scopri come il skip tuning migliora l'efficienza nei modelli vision-language.

2025-02-28T07:07:30+00:00 ― 7 leggere min