Un nuovo framework migliora le azioni dei robot tramite comandi umani.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo framework migliora le azioni dei robot tramite comandi umani.
― 6 leggere min
Il Progetto Tutto-Vedente V2 migliora la comprensione dell'AI riguardo le relazioni tra gli oggetti nelle immagini.
― 7 leggere min
Esplora come i modelli di linguaggio di grandi dimensioni migliorano la creatività attraverso la generazione multimediale.
― 7 leggere min
Nuovo approccio migliora l'apprendimento da dati immagine-testo mescolati.
― 7 leggere min
Un dataset completo che unisce immagini e testo per aiutare il machine learning.
― 7 leggere min
Un nuovo metodo aiuta i robot a trasportare oggetti insieme.
― 7 leggere min
Un nuovo metodo migliora l'efficienza nel rispondere a domande su video lunghi.
― 4 leggere min
Un nuovo metodo migliora le abilità di ragionamento nei modelli linguistici usando l'ottimizzazione delle preferenze.
― 5 leggere min
HoloDrive unisce dati 2D e 3D per auto a guida autonoma più intelligenti.
― 7 leggere min
Un nuovo framework permette di generare immagini da testo in diverse lingue in modo efficiente.
― 6 leggere min
Scopri come V2PE migliora i modelli Vision-Language per una migliore comprensione dei contesti lunghi.
― 6 leggere min