Informática - Multimedia

RSS

Visión por Computador y Reconocimiento de Patrones Avanzando en la compresión de imágenes con análisis de frecuencias

Un nuevo método mejora la compresión de imágenes al centrarse en bandas de frecuencia.

2025-09-16T14:45:18+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Vlogger: Una nueva herramienta para la creación de videos

Vlogger simplifica el video blogging, haciéndolo más rápido y fácil para los creadores.

2025-09-16T11:12:00+00:00 ― 7 minilectura

Multimedia Los costos ambientales del streaming de video

Examinando el uso de energía y el impacto del streaming de video en el medio ambiente.

2025-09-16T01:59:00+00:00 ― 8 minilectura

Sonido Nuevo modelo mejora la evaluación de la intensidad de alimentación de los peces

Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.

2025-09-14T21:03:15+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones El impacto de la IA en la tecnología de video

Descubre cómo la IA está cambiando la creación y transmisión de videos.

2025-09-13T11:18:36+00:00 ― 7 minilectura

Procesado de imagen y vídeo Presentamos el Conjunto de Datos de Videoconferencias para Comunicación del Mundo Real

Un conjunto de datos diseñado para probar la calidad de video en situaciones de videoconferencia.

2025-09-13T03:45:30+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo marco conecta video y texto de manera más efectiva

Los investigadores desarrollan un marco para mejorar la comprensión de videos y textos.

2025-09-12T20:49:36+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en técnicas de segmentación audio-visual

Un nuevo método mejora la segmentación audio-visual sin etiquetas detalladas.

2025-09-12T20:28:15+00:00 ― 6 minilectura

Sonido Nuevo sistema mejora la extracción de voz desde posiciones inestables de la cabeza

PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.

2025-09-12T19:39:40+00:00 ― 7 minilectura

Procesado de Audio y Voz MusiLingo: Uniendo Música y Lenguaje

Un nuevo sistema que conecta la música y el lenguaje para una mejor comprensión.

2025-09-11T14:30:40+00:00 ― 7 minilectura

Multimedia Diseño de Pósters Efectivo a Través de Métricas Sencillas

Aprende a diseñar carteles que comuniquen mensajes de manera clara y atractiva.

2025-09-09T08:49:24+00:00 ― 6 minilectura

Multimedia BDIQA: Avanzando en la Respuesta a Preguntas de Video con la Teoría de la Mente

Un nuevo conjunto de datos mejora la capacidad de la IA para interpretar el comportamiento humano en videos.

2025-09-09T07:30:24+00:00 ― 8 minilectura

Interacción Persona-Ordenador Spica: Una Nueva Herramienta para Usuarios Ciegos

Spica mejora el acceso a videos para usuarios ciegos y con baja visión a través de la interactividad.

2025-09-09T06:43:00+00:00 ― 5 minilectura

Robótica Probando robots para desafíos inesperados

Explorando métodos para mejorar el rendimiento de los robots en entornos impredecibles.

2025-09-09T02:53:54+00:00 ― 5 minilectura

Sonido Avances en la tecnología de conversión de voz usando imágenes faciales

Nuevo método transforma voces usando rasgos faciales para diversas aplicaciones.

2025-09-09T01:46:55+00:00 ― 10 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Recuperación de información Mejorando la búsqueda de videos con técnicas modernas

Un nuevo método simplifica la búsqueda de videos al combinar diferentes tipos de información.

2025-09-08T20:50:30+00:00 ― 7 minilectura

Multimedia Creando máquinas sensibles a las emociones para mejores interacciones

Desarrollando máquinas que responden según las emociones para mejorar la interacción entre humanos y computadoras.

2025-09-08T19:31:30+00:00 ― 7 minilectura

Sonido Generación de texto a audio más rápida usando destilación de consistencia

Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.

2025-09-08T18:29:40+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Técnicas Avanzadas de Localización de Fuentes de Sonido

Mejorando la forma en que identificamos fuentes de sonido usando datos audio-visuales.

2025-09-08T12:49:35+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Mapeando Sonidos: Un Nuevo Enfoque para el Análisis del Paisaje Sonoro

Un método para visualizar y predecir sonidos en diferentes entornos usando tecnología avanzada.

2025-09-08T11:12:25+00:00 ― 6 minilectura

Multimedia Green-LL: Mejorando la Experiencia de Transmisión de Video en Vivo

Un nuevo enfoque para mejorar la calidad de la transmisión de video en vivo por móvil y la eficiencia energética.

2025-09-08T06:13:36+00:00 ― 11 minilectura

Recuperación de información Recomendaciones de comida personalizadas con ChatDiet

ChatDiet combina datos personales y conocimientos de la población para dar mejores consejos sobre comida.

2025-09-07T00:28:12+00:00 ― 9 minilectura

Multimedia Debates en la Televisión: Un Vistazo más Cercano a la Parcialidad y la Civilidad

Un análisis de sesgo e incivilidad en los debates de la televisión india.

2025-09-06T18:16:54+00:00 ― 7 minilectura

Procesado de imagen y vídeo Avances en técnicas de compresión de video

Nuevo marco mejora la eficiencia y calidad de la compresión de video.

2025-09-06T14:40:20+00:00 ― 7 minilectura

Interacción Persona-Ordenador El Papel de los Medios Visuales en la Propaganda

Este artículo examina cómo las imágenes impactaron la opinión pública durante el conflicto entre Rusia y Ucrania.

2025-09-05T06:04:24+00:00 ― 5 minilectura

Procesado de imagen y vídeo Mejorando la transmisión inalámbrica de imágenes en entornos ruidosos

Un nuevo método mejora la calidad de la imagen durante la transmisión inalámbrica en canales ruidosos.

2025-09-05T03:18:04+00:00 ― 6 minilectura

Informática y sociedad MemeCraft: Una Nueva Herramienta para la Advocacy Social

MemeCraft crea memes chidos para promover causas sociales de manera segura.

2025-09-04T14:48:00+00:00 ― 12 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el aprendizaje audiovisual con co-augmentación de velocidad

Un nuevo método mejora el aprendizaje automático de datos audio-visuales.

2025-09-04T05:59:30+00:00 ― 7 minilectura

Computación y lenguaje Tarea RVS: Una nueva forma de dar direcciones

La investigación revela formas más amplias de dar direcciones usando conocimiento espacial.

2025-09-03T23:39:30+00:00 ― 9 minilectura

Procesado de señales Un Nuevo Enfoque para Identificar los Síntomas de la Esquizofrenia

Combinando audio, video y texto para mejorar las evaluaciones de salud mental.

2025-09-03T22:42:15+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de generación de caras que hablan

Nuevo marco mejora la sincronización de labios y la calidad visual en videos de caras hablando.

2025-09-03T04:02:24+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en la detección de defectos con muestras sintéticas

Un nuevo método genera muestras defectuosas falsas para mejorar la detección de anomalías en la fabricación.

2025-09-02T21:51:06+00:00 ― 7 minilectura

Sonido Combinando voz y cara para una mejor identificación

Un nuevo método mejora la verificación de hablantes al combinar datos de audio y visuales.

2025-09-02T07:50:15+00:00 ― 6 minilectura

Multimedia Avances en la localización de altavoces de audio y video

Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.

2025-09-02T06:13:05+00:00 ― 8 minilectura

Sonido Un Nuevo Modelo para la Generación de Música con IA

MusicAOG simplifica la creación y comprensión de la música a través de una representación gráfica innovadora.

2025-08-31T08:52:25+00:00 ― 7 minilectura

Interacción Persona-Ordenador La importancia de las emociones no típicas

Analizar el estrés y la depresión puede mejorar nuestra comprensión de la salud mental.

2025-08-31T02:02:36+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Detectando Humor en Videos con FunnyNet-W

Un nuevo modelo identifica momentos graciosos en videos usando datos visuales, de audio y de texto.

2025-08-30T23:09:25+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones AesopAgent: Transformando Cuentos en Videos

AesopAgent permite a los usuarios crear videos a partir de historias usando herramientas de IA avanzadas.

2025-08-30T18:32:18+00:00 ― 6 minilectura

Interacción Persona-Ordenador El papel de las imágenes en el aprendizaje de Wikipedia

Examinando cómo las imágenes impactan el aprendizaje en los artículos de Wikipedia.

2025-08-30T02:28:30+00:00 ― 7 minilectura