CLIP mostra forza nel gestire il bilanciamento dei dati nei compiti visivi e linguistici.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
CLIP mostra forza nel gestire il bilanciamento dei dati nei compiti visivi e linguistici.
― 7 leggere min
MMScan migliora la capacità dell'AI di comprendere ambienti 3D complessi con annotazioni dettagliate.
― 7 leggere min
Un nuovo metodo aiuta i robot a trasportare oggetti insieme.
― 7 leggere min
OVExp combina linguaggio e visione per un'abile navigazione degli oggetti in ambienti vari.
― 5 leggere min
LLaVA-3D combina intuizioni 2D e 3D per un ragionamento spaziale più profondo.
― 6 leggere min
Un nuovo modello aiuta i robot a unire la visione con l'azione per migliorare le loro abilità di manipolazione.
― 5 leggere min