Un sistema che collega i suoni con le immagini, migliorando la comprensione delle macchine.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un sistema che collega i suoni con le immagini, migliorando la comprensione delle macchine.
― 6 leggere min
Il benchmark TAPVid-3D migliora il tracciamento dei punti 3D per applicazioni di robotica e video.
― 8 leggere min
AutoAD-Zero utilizza suggerimenti visivi per descrizioni audio più rapide ed efficaci.
― 7 leggere min
Magiv2 punta a migliorare l'accesso ai manga per persone con disabilità visive tramite trascrizioni automatiche.
― 6 leggere min
Un nuovo metodo migliora il tracciamento degli oggetti nei video in prima persona usando la consapevolezza 3D.
― 6 leggere min
Una panoramica sui progressi nel riconoscimento vocale grazie alla VoxCeleb Challenge.
― 5 leggere min
Esplora la scienza affascinante dietro i suoni del versare le bevande.
― 5 leggere min
Scopri come le macchine imparano dai video per capire il movimento e la profondità.
― 7 leggere min