Un sistema que conecta sonidos con imágenes, mejorando la comprensión de las máquinas.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un sistema que conecta sonidos con imágenes, mejorando la comprensión de las máquinas.
― 7 minilectura
El benchmark TAPVid-3D mejora el seguimiento de puntos 3D para aplicaciones de robótica y video.
― 9 minilectura
AutoAD-Zero utiliza indicaciones visuales para descripciones de audio más rápidas y efectivas.
― 8 minilectura
Magiv2 busca mejorar el acceso al manga para personas con discapacidad visual a través de transcripciones automatizadas.
― 7 minilectura
Un nuevo método mejora el seguimiento de objetos en videos en primera persona usando conciencia 3D.
― 7 minilectura
Una visión general de los avances en el reconocimiento de voz a través del VoxCeleb Challenge.
― 5 minilectura
Explora la fascinante ciencia detrás de los sonidos al servir bebidas.
― 6 minilectura
Descubre cómo las máquinas aprenden de los videos para entender el movimiento y la profundidad.
― 8 minilectura