Informática - Multimedia

RSS

Computación y lenguaje Presentando MMPKUBase: Un Grafo de Conocimiento Chino

MMPKUBase ofrece más de 52,000 temas chinos con imágenes increíbles.

2025-07-02T17:32:30+00:00 ― 6 minilectura

Sonido Revolucionando la creación musical con TEAdapter

TEAdapter mejora la generación de música a partir de texto, dando a los usuarios más control y creatividad.

2025-07-02T17:17:05+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Presentamos SynopGround: Un Nuevo Enfoque para el Anclaje de Video

Un nuevo conjunto de datos y método mejoran la anclaje de video para narrativas complejas.

2025-07-02T17:08:48+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en la detección de deepfakes con MkfaNet

Un nuevo método mejora la detección de deepfakes faciales.

2025-07-02T17:00:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Lighthouse: Una herramienta para recuperar momentos de vídeo y detectar destacados

Lighthouse hace que sea fácil para los investigadores encontrar momentos en videos y detectar resúmenes.

2025-07-02T07:08:24+00:00 ― 6 minilectura

Sonido Avances en separación de fuentes de audio con RQ-VAE

Nuevo modelo de aprendizaje automático mejora las técnicas de separación de fuentes de audio.

2025-07-02T05:08:20+00:00 ― 6 minilectura

Sonido Nuevo método mejora la claridad del habla en gafas inteligentes

Un sistema para mejorar la claridad del habla en entornos ruidosos usando gafas inteligentes.

2025-07-02T02:42:35+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo conjunto de datos busca mejorar el análisis de videos de cocina

COM Kitchens ofrece videos de cocina sin editar para estudiar los procesos de preparación de alimentos.

2025-07-01T20:28:30+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones ReSyncer: Un Nuevo Enfoque para Sincronizar Labios

ReSyncer mejora la calidad de video y la flexibilidad para que los movimientos de los labios estén sincronizados con el audio.

2025-07-01T12:18:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Ajuste Neural: Un Nuevo Enfoque para el Aprendizaje Multitarea

Presentando la sintonización neuronal para mejorar efectivamente las capacidades multitarea de los modelos grandes.

2025-07-01T09:09:06+00:00 ― 7 minilectura

Multimedia Avances en la recuperación de productos de comercio electrónico

Un nuevo método mejora las búsquedas de productos en diferentes formatos de medios.

2025-07-01T08:45:24+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la detección de deepfakes con detalles finos

Un nuevo enfoque se centra en inconsistencias sutiles en la detección de deepfakes.

2025-07-01T04:02:15+00:00 ― 7 minilectura

Multimedia MetaDragonBoat: Una inmersión virtual en el patrimonio cultural

Vive el Festival del Barco Dragón con técnicas de remo virtuales innovadoras.

2025-07-01T01:54:36+00:00 ― 9 minilectura

Inteligencia artificial HiQuE: Un Nuevo Enfoque para Detectar la Depresión

Presentamos un marco que mejora la detección de la depresión a través de entrevistas estructuradas.

2025-06-30T20:14:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Concept Conductor: Un Nuevo Enfoque para la Generación de Imágenes

Un nuevo método para crear imágenes claras a partir de prompts de texto complejos.

2025-06-30T20:07:00+00:00 ― 6 minilectura

Multimedia Utilizando imágenes para predecir eventos

Combinar imágenes y texto mejora las predicciones de eventos futuros.

2025-06-30T08:47:36+00:00 ― 8 minilectura

Multimedia El arte de secuenciar canciones en los álbumes

Este artículo analiza cómo el orden de las canciones impacta la experiencia de escuchar álbumes de música.

2025-06-30T08:31:48+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en el Reconocimiento de Actividades Humanas Usando Mu-MAE

Mu-MAE presenta nuevos métodos para reconocer actividades humanas a través de múltiples fuentes de datos.

2025-06-30T05:53:48+00:00 ― 8 minilectura

Inteligencia artificial Abordando el discurso de odio en memes con HateSieve

Un nuevo sistema combate el discurso de odio en memes de manera efectiva.

2025-06-29T11:12:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando la Generación de Movimiento 3D a partir de Videos Cotidianos

La técnica ViMo transforma videos cotidianos en movimientos 3D realistas.

2025-06-29T07:54:30+00:00 ― 9 minilectura

Teoría de la información Navegando desafíos en VR interactiva inalámbrica para múltiples usuarios

Explora los avances y desafíos en la tecnología de VR inalámbrica para múltiples usuarios.

2025-06-29T01:07:44+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones ExpoMamba: Transformando la Mejora de Imágenes en Bajos Niveles de Luz

Un nuevo modelo para mejorar imágenes con poca luz de manera más rápida y efectiva.

2025-06-28T21:47:10+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Evaluando la calidad de profundidad en imágenes 3D para VR

Un nuevo método para medir la percepción de profundidad en imágenes 3D de realidad virtual.

2025-06-28T11:15:35+00:00 ― 8 minilectura

Multimedia Analizando Noticias Globales A Través de Contenido en Video

Un método para resumir videos de diferentes culturas y fuentes de noticias.

2025-06-28T03:36:00+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Simplificando la edición de escenas 3D con imágenes 2D

Un nuevo método simplifica la edición de escenas 3D usando solo una imagen 2D.

2025-06-27T23:54:48+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en ataques adversariales multitarea en sistemas de autenticación facial

Un nuevo método apunta a sistemas de autenticación facial múltiples de manera eficiente.

2025-06-27T11:00:36+00:00 ― 10 minilectura

Sonido Video-Foley: Transformando el diseño de sonido en multimedia

Un sistema innovador automatiza la generación de sonido para películas y juegos.

2025-06-26T23:37:55+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Armonizando la Atención: Un Nuevo Enfoque para Mezclar Imágenes

Aprende cómo la Atención de Armonización mejora la mezcla de imágenes al centrarse en la geometría y la textura.

2025-06-26T03:32:30+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la Medición del Tamaño de la Pupila a Partir de Imágenes de Webcam

Mejorar la calidad de la imagen lleva a evaluaciones de tamaño de pupila más precisas.

2025-06-26T00:30:48+00:00 ― 7 minilectura

Multimedia Repensando los estándares de localización de fuentes audio-visuales

Los benchmarks actuales no evalúan bien la capacidad de los modelos para conectar datos de audio y visuales.

2025-06-25T16:03:10+00:00 ― 6 minilectura

Computación y lenguaje La IA se adelanta en la producción de animación

La automatización en la creación de animaciones abre nuevos caminos para contar historias y crear visuales.

2025-06-25T13:58:48+00:00 ― 8 minilectura

Sonido Desafíos en la detección de señales de voz parcialmente falsas

Una mirada a las complejidades de identificar pistas de audio mezcladas.

2025-06-25T06:20:10+00:00 ― 7 minilectura

Sonido StyleSpeech: El Futuro de la Tecnología de Texto a Voz

StyleSpeech mejora los sistemas de TTS al captar los matices del habla natural.

2025-06-24T14:08:30+00:00 ― 7 minilectura

Multimedia Cap2Sum: Un Nuevo Enfoque para la Resumen de Videos

Cap2Sum utiliza subtítulos densos en videos para mejorar la eficiencia y efectividad de la resumición de videos.

2025-06-23T23:55:42+00:00 ― 9 minilectura

Computación y lenguaje Presentamos MaVEn: Un nuevo enfoque para entender múltiples imágenes

MaVEn mejora la capacidad de la IA para procesar múltiples imágenes y razonar mejor.

2025-06-23T15:38:00+00:00 ― 7 minilectura

Sonido Inteligencia Artificial y el Futuro de la Creación Musical

La IA está cambiando cómo se compone y se vive la música.

2025-06-23T08:10:55+00:00 ― 7 minilectura

Multimedia Equilibrando Emociones: Un Nuevo Enfoque en ERC

Un nuevo método mejora el reconocimiento de emociones en conversaciones usando múltiples fuentes de datos.

2025-06-23T01:01:06+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método para la recuperación de texto-3D usando RMARN

Presentamos RMARN: una forma innovadora de conectar texto y datos en 3D.

2025-06-22T22:23:06+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones SceneDreamer360: Avanzando en la Creación de Escenas 3D a partir de Texto

Un nuevo método transforma el texto en escenas 3D detalladas sin problemas.

2025-06-22T22:15:12+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Creando un Metaverso Abierto para Todos

Un nuevo enfoque para construir espacios virtuales accesibles usando WebXR y A-Frame.

2025-06-22T18:26:06+00:00 ― 7 minilectura