Un sistema innovador automatiza la generación de sonido para películas y juegos.
― 9 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un sistema innovador automatiza la generación de sonido para películas y juegos.
― 9 minilectura
Aprende cómo la Atención de Armonización mejora la mezcla de imágenes al centrarse en la geometría y la textura.
― 7 minilectura
Mejorar la calidad de la imagen lleva a evaluaciones de tamaño de pupila más precisas.
― 7 minilectura
Los benchmarks actuales no evalúan bien la capacidad de los modelos para conectar datos de audio y visuales.
― 6 minilectura
La automatización en la creación de animaciones abre nuevos caminos para contar historias y crear visuales.
― 8 minilectura
Una mirada a las complejidades de identificar pistas de audio mezcladas.
― 7 minilectura
StyleSpeech mejora los sistemas de TTS al captar los matices del habla natural.
― 7 minilectura
Cap2Sum utiliza subtítulos densos en videos para mejorar la eficiencia y efectividad de la resumición de videos.
― 9 minilectura
MaVEn mejora la capacidad de la IA para procesar múltiples imágenes y razonar mejor.
― 7 minilectura
La IA está cambiando cómo se compone y se vive la música.
― 7 minilectura
Un nuevo método mejora el reconocimiento de emociones en conversaciones usando múltiples fuentes de datos.
― 6 minilectura
Presentamos RMARN: una forma innovadora de conectar texto y datos en 3D.
― 6 minilectura
Un nuevo método transforma el texto en escenas 3D detalladas sin problemas.
― 7 minilectura
Un nuevo enfoque para construir espacios virtuales accesibles usando WebXR y A-Frame.
― 7 minilectura
SynthDoc crea documentos sintéticos para el aprendizaje automático en la lectura de documentos.
― 7 minilectura
Este estudio presenta un modelo para analizar las reacciones emocionales al contenido de video.
― 8 minilectura
Este artículo habla sobre las ventajas de combinar sistemas de reconocimiento de voz y facial.
― 5 minilectura
Un nuevo método para crear imágenes RGBA de manera fácil y efectiva.
― 8 minilectura
Kangaroo mejora el análisis de video al integrar visuales, sonidos y texto de manera efectiva.
― 6 minilectura
Este documento presenta un modelo de un solo codificador para mejorar la segmentación de imágenes basado en descripciones de texto.
― 8 minilectura
Nuevos métodos mejoran la separación de voces en entornos ruidosos.
― 5 minilectura
Un nuevo marco mejora la precisión de los subtítulos de imágenes y reduce errores.
― 7 minilectura
Mejorando cómo las máquinas ayudan a los usuarios a través de mejor interacción y respuestas.
― 6 minilectura
Explorando humanos digitales e interfaces hápticas para interacciones inmersivas.
― 6 minilectura
Nuevos métodos mejoran la transmisión de video al predecir datos perdidos de manera efectiva.
― 6 minilectura
Un marco para ajustar la música en tiempo real en juegos y películas.
― 6 minilectura
MRDAC mejora la calidad de video facial y la compresión usando múltiples fotogramas de referencia.
― 7 minilectura
Los investigadores exploran ecos ultrasónicos para medir distancias de manera precisa en entornos interiores tranquilos.
― 7 minilectura
Explorando la detección, eliminación y generación de sombras en visión por computadora.
― 9 minilectura
Un nuevo método mejora la calidad de imagen en condiciones climáticas adversas usando modelos de lenguaje y de visión.
― 6 minilectura
Este marco mejora la eficiencia de las apps multimedia mientras protege la privacidad del usuario.
― 9 minilectura
LongLLaVA mejora la comprensión de múltiples imágenes para varias aplicaciones.
― 6 minilectura
SegTalker mejora los videos de caras que hablan con texturas realistas y edición sencilla.
― 6 minilectura
HiSC4D captura el movimiento humano usando sensores portátiles para un mejor análisis de interacción.
― 8 minilectura
Presentando un método para mejorar la respuesta a preguntas en videos con múltiples eventos.
― 7 minilectura
Una visión general de métodos, desafíos y sistemas de diarización de altavoces audiovisuales.
― 6 minilectura
Este trabajo mejora los modelos de visión-lenguaje a través de mejores estrategias de datos y técnicas innovadoras.
― 8 minilectura
Un nuevo método mejora la identificación de objetos en imágenes mediante una integración visual y textual personalizada.
― 6 minilectura
SimCLIP mejora el análisis de memes al combinar perfectamente texto e imágenes.
― 7 minilectura
El conjunto de datos MIP-GAF ayuda a analizar las dinámicas sociales en las imágenes.
― 7 minilectura