Jifeng Dai

Un nuovo framework migliora le azioni dei robot tramite comandi umani.

2025-09-04T09:55:42+00:00 ― 6 leggere min

Il Progetto Tutto-Vedente V2 migliora la comprensione dell'AI riguardo le relazioni tra gli oggetti nelle immagini.

2025-09-02T23:57:30+00:00 ― 7 leggere min

Esplora come i modelli di linguaggio di grandi dimensioni migliorano la creatività attraverso la generazione multimediale.

2025-08-04T21:12:12+00:00 ― 7 leggere min

Nuovo approccio migliora l'apprendimento da dati immagine-testo mescolati.

2025-07-30T14:16:36+00:00 ― 7 leggere min

Un dataset completo che unisce immagini e testo per aiutare il machine learning.

2025-07-29T22:44:24+00:00 ― 7 leggere min

Un nuovo metodo aiuta i robot a trasportare oggetti insieme.

2025-07-26T00:51:42+00:00 ― 7 leggere min

Un nuovo metodo migliora l'efficienza nel rispondere a domande su video lunghi.

2025-07-22T01:47:54+00:00 ― 4 leggere min

Un nuovo metodo migliora le abilità di ragionamento nei modelli linguistici usando l'ottimizzazione delle preferenze.

2025-05-22T16:25:03+00:00 ― 5 leggere min

HoloDrive unisce dati 2D e 3D per auto a guida autonoma più intelligenti.

2025-04-23T20:37:30+00:00 ― 7 leggere min

Un nuovo framework permette di generare immagini da testo in diverse lingue in modo efficiente.

2025-04-23T03:38:15+00:00 ― 6 leggere min

Scopri come V2PE migliora i modelli Vision-Language per una migliore comprensione dei contesti lunghi.

2025-03-17T05:59:33+00:00 ― 6 leggere min