Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.
― 8 minilectura
MusicAOG simplifica la creación y comprensión de la música a través de una representación gráfica innovadora.
― 7 minilectura
Analizar el estrés y la depresión puede mejorar nuestra comprensión de la salud mental.
― 7 minilectura
Un nuevo modelo identifica momentos graciosos en videos usando datos visuales, de audio y de texto.
― 7 minilectura
AesopAgent permite a los usuarios crear videos a partir de historias usando herramientas de IA avanzadas.
― 6 minilectura
Examinando cómo las imágenes impactan el aprendizaje en los artículos de Wikipedia.
― 7 minilectura
Un método para reducir la redundancia en representaciones de datos de múltiples vistas.
― 7 minilectura
CoAVT integra datos de audio, visuales y de texto para una mejor comprensión.
― 9 minilectura
Crea videos de avatares hablantes fácilmente con el sistema innovador de Virbo.
― 8 minilectura
El conjunto de datos WiMANS permite rastrear las actividades de múltiples usuarios usando señales de WiFi.
― 8 minilectura
Un nuevo marco simplifica las tareas de edición de video usando herramientas de edición de imágenes.
― 10 minilectura
BDoG mejora el razonamiento de la IA integrando varios tipos de datos de manera efectiva.
― 8 minilectura
Heracles combina transformadores y modelos de espacio de estado para mejorar el procesamiento de datos.
― 7 minilectura
Un nuevo método integra información acústica en los modelos de lenguaje para mejorar el reconocimiento de voz.
― 10 minilectura
Usar música para explicar el cáncer puede mejorar la comprensión y el interés.
― 8 minilectura
Un nuevo marco mejora la completación de gráficos de conocimiento con diferentes tipos de datos.
― 9 minilectura
Una nueva forma de animar retratos con expresiones y ángulos cambiantes.
― 8 minilectura
Nuevo método mejora la compresión de datos 3D manteniendo la calidad.
― 10 minilectura
CIRP mejora la representación de productos para un mejor empaquetado en línea.
― 10 minilectura
Explorando cómo IoS podría transformar nuestras experiencias digitales al involucrar todos los sentidos.
― 13 minilectura
DIBS mejora la subtitulación de eventos en video refinando los límites usando datos no etiquetados.
― 9 minilectura
Combinar imágenes y texto mejora la precisión en la estimación de profundidad 3D.
― 8 minilectura
WebXR transforma la manera en que interactuamos con entornos digitales inmersivos.
― 10 minilectura
Nuevo método mejora la síntesis de voz para personas que no pueden hablar.
― 8 minilectura
AniFrame hace que programar arte sea accesible para los principiantes con un enfoque fácil de usar.
― 7 minilectura
Un nuevo conjunto de datos mejora la generación de imágenes a partir de títulos de noticias complejos.
― 9 minilectura
Un nuevo método mejora la verificación de hechos de las afirmaciones en redes sociales.
― 8 minilectura
Shotit permite a los usuarios encontrar videos rápido usando imágenes, facilitando el proceso de búsqueda.
― 7 minilectura
Un nuevo marco para mejorar las recomendaciones sin datos previos.
― 9 minilectura
Pegasus-1 permite a los usuarios interactuar con videos usando lenguaje natural.
― 7 minilectura
GaussianTalker ofrece sincronización labial natural y visuales de alta calidad para videos de personas hablando.
― 7 minilectura
Un nuevo enfoque permite que las máquinas identifiquen personajes de cómics sin previo entrenamiento.
― 7 minilectura
Mimosa simplifica la creación de audio espacial para videomakers amateurs.
― 9 minilectura
El Desafío AIS 2024 busca mejorar las evaluaciones de calidad de video usando aprendizaje profundo.
― 6 minilectura
GaussianTalker transforma la interacción digital con cabezas hablantes que parecen reales.
― 7 minilectura
Los subtítulos se están volviendo esenciales para mejorar la experiencia del espectador en los servicios de streaming.
― 9 minilectura
La investigación presenta técnicas innovadoras para mejorar la detección de videos deepfake.
― 7 minilectura
Un nuevo conjunto de datos mejora la forma en que los robots interpretan entornos del mundo real.
― 8 minilectura
UniAV combina la localización de acción, la detección de sonido y la localización de eventos audio-visuales para una mejor comprensión del video.
― 9 minilectura
Un nuevo método mejora el rendimiento de detección de objetos usando consultas adaptativas.
― 9 minilectura