Jindong Gu

Un nuovo modello migliora l'accuratezza del recupero per i video con eventi multipli.

2025-10-05T17:44:42+00:00 ― 6 leggere min

Questo documento analizza il rischio di attacchi backdoor nel few-shot learning.

2025-09-19T15:10:18+00:00 ― 7 leggere min

I modelli di base come CLIP offrono sia opportunità che pericoli nascosti nell'IA.

2025-08-27T20:05:48+00:00 ― 6 leggere min

Un nuovo framework migliora la sicurezza nella creazione di immagini da testi.

2025-08-20T12:58:48+00:00 ― 6 leggere min

Questo articolo parla di un nuovo benchmark per unire immagini e testo per trovare eventi nei video.

2025-07-28T20:24:24+00:00 ― 8 leggere min

Un nuovo benchmark valuta l'efficacia dei modelli linguistici nelle applicazioni robotiche.

2025-07-22T16:56:24+00:00 ― 7 leggere min

Un nuovo metodo migliora la distillazione dei dataset, aumentando l'efficienza dell'addestramento del modello.

2025-07-10T06:11:18+00:00 ― 5 leggere min

Questo articolo parla dei problemi di sicurezza nei modelli da testo a immagine e propone delle soluzioni.

2025-06-04T12:22:48+00:00 ― 7 leggere min

Esplorare metodi per migliorare i modelli multimodali nel rispondere a domande visive.

2025-06-03T18:52:06+00:00 ― 6 leggere min

Presentiamo un modello che trova momenti specifici in video lunghi con facilità.

2025-05-12T10:45:20+00:00 ― 6 leggere min