Informática - Multimedia

RSS

Informática y sociedad Optimizando el marketing en línea con insights de IA

Integrando IA para mejorar estrategias de marketing y la efectividad de las campañas.

2025-07-12T01:38:18+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la comprensión visual en modelos de lenguaje

X-Former mejora cómo los modelos combinan la comprensión de imágenes y texto.

2025-07-11T06:40:42+00:00 ― 10 minilectura

Visión por Computador y Reconocimiento de Patrones Abordando la desinformación fuera de contexto en la era digital

Combatiendo la información engañosa con nuevos métodos y tecnologías.

2025-07-10T22:46:42+00:00 ― 6 minilectura

Computación y lenguaje Técnicas Avanzadas para la Detección de Desinformación

Un nuevo sistema que combina análisis de texto e imagen para combatir la desinformación.

2025-07-10T07:30:18+00:00 ― 6 minilectura

Multimedia Mejorando la eficiencia en modelos multimodales con RoE

El nuevo método RoE mejora la eficiencia de los modelos de lenguaje grandes multimodales con enrutamiento dinámico.

2025-07-10T02:38:00+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Generación de Marcos de Video 360 Grados

Presentamos 360VFI para mejorar la calidad y la experiencia del video en 360 grados.

2025-07-10T01:42:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Integrando entradas de audio y visuales en modelos de aprendizaje automático

Un nuevo modelo combina audio y video para una mejor comprensión.

2025-07-09T23:36:18+00:00 ― 6 minilectura

Sonido Avances en Técnicas de Separación de Voz Audio-Visual

Un nuevo método mejora la separación de voces en entornos ruidosos con múltiples hablantes.

2025-07-09T16:53:50+00:00 ― 6 minilectura

Multimedia Evaluando Técnicas de Muestreo de Fotogramas de Video para una Mejor Recuperación

Este estudio revisa métodos de muestreo de fotogramas para mejorar la recuperación de contenido de video.

2025-07-09T09:07:18+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Automatizando la Creación de Resúmenes de Fútbol con Tecnología Avanzada

Un nuevo marco simplifica la creación de clips destacados específicos de jugadores a partir de videos de fútbol.

2025-07-09T06:29:18+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones HaloQuest: Un Nuevo Enfoque para la Alucinación en VLMs

HaloQuest aborda problemas de alucinación en modelos de lenguaje-visual con un nuevo conjunto de datos.

2025-07-08T23:14:48+00:00 ― 12 minilectura

Multimedia Avanzando en la Recuperación 3D Cross-Modal para Categorías No Vistas

Un nuevo marco mejora la recuperación de objetos 3D a partir de diferentes tipos de datos.

2025-07-08T16:31:54+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Detectar noticias falsas en videos cortos

Examinando el proceso creativo detrás de la producción de videos de noticias falsas.

2025-07-08T09:33:12+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la puntuación visual con QPT V2

QPT V2 mejora la puntuación visual usando modelado de imágenes enmascaradas y datos de alta calidad.

2025-07-08T07:26:48+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones MMTrail: Un conjunto de datos de video completo para modelos de lenguaje

MMTrail combina descripciones visuales y de audio para mejorar los modelos de video-lenguaje.

2025-07-08T06:53:20+00:00 ― 5 minilectura

Multimedia Protegiendo la privacidad en la comunicación multimodal

Nuevo método refuerza la privacidad para imágenes y textos compartidos.

2025-07-08T03:14:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo marco mejora la respuesta a preguntas audio-visuales

Un nuevo método mejora el rendimiento de AVQA cuando faltan entradas de audio o visuales.

2025-07-07T23:40:42+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Generando audio sincronizado para videos silenciosos

Un método para crear audio que coincida con videos en primera persona.

2025-07-07T23:36:05+00:00 ― 9 minilectura

Multimedia Nueva colección de modelos 3D para investigación

Una colección diversa de modelos 3D para mejorar las oportunidades de investigación.

2025-07-07T13:24:30+00:00 ― 7 minilectura

Sonido Evaluando Modelos de Lenguaje Grandes en la Creación Musical

Este estudio analiza qué tan bien entienden y generan música los LLMs.

2025-07-07T10:38:45+00:00 ― 6 minilectura

Sonido ChordSync: Sincronizando Acordes Musicales con Audio

Un nuevo modelo que sincroniza las anotaciones de acordes con el audio de la música de manera fluida.

2025-07-06T22:30:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método mejora la compresión de nubes de puntos

Un modelo unificado mejora la compresión de nubes de puntos para mayor calidad y eficiencia.

2025-07-06T19:15:40+00:00 ― 8 minilectura

Criptografía y seguridad Un Nuevo Enfoque para la Verificación de Imágenes

Método innovador añade mensajes ocultos para asegurar la autenticidad de las imágenes.

2025-07-06T15:01:30+00:00 ― 7 minilectura

Sonido Nuevo método para detectar deepfakes usando audio y video

Un marco que identifica de manera efectiva contenido deepfake a través de un análisis combinado de audio y visual.

2025-07-06T08:44:05+00:00 ― 6 minilectura

Sonido Evaluando la comprensión musical con el benchmark MuChoMusic

Un nuevo estándar para evaluar modelos que analizan música y lenguaje.

2025-07-06T05:29:45+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Modelo Innovador para Diagnosticar la Depresión

Un nuevo enfoque combina audio, video y datos de texto para un diagnóstico efectivo de la depresión.

2025-07-06T04:53:12+00:00 ― 9 minilectura

Multimedia Avanzando en el Aprendizaje Generalizado Zero-Shot Audiovisual

Un nuevo marco mejora la clasificación en tareas audiovisuales no vistas.

2025-07-06T04:41:10+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la segmentación de siluetas humanas

Un nuevo modelo mejora la segmentación de siluetas usando señales de RF para una mejor captura de movimiento.

2025-07-06T03:34:12+00:00 ― 6 minilectura

Multimedia Abordando el discurso de odio en videos con el conjunto de datos MultiHateClip

Nuevo conjunto de datos ofrece información sobre el discurso de odio en diferentes idiomas y formatos.

2025-07-06T02:31:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la compresión de imágenes para modelos multimodales

Nuevo marco mejora el procesamiento de imágenes en modelos de lenguaje grandes multimodales.

2025-07-06T00:56:12+00:00 ― 5 minilectura

Multimedia AxiomVision: Transformando la Analítica de Video para Entornos Dinámicos

AxiomVision ofrece un nuevo enfoque para el análisis de video, mejorando el rendimiento en condiciones cambiantes.

2025-07-05T14:40:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de detección de violencia

Nuevos sistemas combinan audio y video para mejorar la detección de violencia en espacios públicos.

2025-07-05T14:06:40+00:00 ― 6 minilectura

Multimedia Gafas de VR asequibles para videollamadas realistas

Un nuevo sistema mejora las videollamadas en cascos de VR económicos usando comandos de voz.

2025-07-05T12:33:36+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Navegando el proceso de envío de manuscritos académicos

Una guía clara sobre los tipos de manuscritos y los desafíos de envío.

2025-07-04T20:14:00+00:00 ― 5 minilectura

Multimedia Avances en Segmentación Semántica Audiovisual

Un nuevo método mejora el reconocimiento de objetos en videos a través de pistas sonoras y visuales.

2025-07-04T10:13:36+00:00 ― 6 minilectura

Aprendizaje automático Navegando los Desafíos del Aprendizaje de Cola Larga

Una mirada a las estrategias para abordar datos de cola larga en el aprendizaje automático.

2025-07-03T17:06:36+00:00 ― 8 minilectura

Multimedia Avances en la detección de outliers multivista

Un nuevo método mejora la detección de anomalías en conjuntos de datos de múltiples vistas con vistas faltantes.

2025-07-03T12:38:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Abordando la alucinación en modelos de lenguaje multimodal

Un estudio sobre los retos y soluciones para las alucinaciones en MLLMs.

2025-07-03T06:42:30+00:00 ― 5 minilectura

Multimedia Abordando la correspondencia ruidosa en la recuperación multimodal

Un marco para enfrentar el ruido de datos en técnicas de recuperación cruzada.

2025-07-03T06:34:36+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Combatir el fraude de identidad con el conjunto de datos IDNet

Un nuevo conjunto de datos apoya mejores herramientas para detectar el fraude de documentos de identidad.

2025-07-02T17:40:24+00:00 ― 9 minilectura