Informática - Multimedia

RSS

Visión por Computador y Reconocimiento de Patrones Avances en Sistemas de Múltiples Cámaras para Vehículos Autónomos

Occ-BEV mejora la percepción del vehículo a través de modelado 3D con múltiples cámaras e integración de datos.

2025-11-07T14:57:18+00:00 ― 7 minilectura

Últimos artículos

Criptografía y seguridad Analizando el Método J-UNIWARD y Su Error

2025-11-06T17:05:54+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Abordando el sesgo en la respuesta a preguntas visuales

2025-11-06T14:27:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la calidad de compresión de nubes de puntos 3D

2025-11-06T06:33:54+00:00 ― 7 minilectura

Aprendizaje automático Avanzando en el aprendizaje multimodal con C-MCR

2025-11-05T03:49:55+00:00 ― 7 minilectura

Sonido Simplificando la síntesis de sonido con NAS-FM

2025-11-04T17:18:20+00:00 ― 7 minilectura

Últimos artículos

Visión por Computador y Reconocimiento de Patrones Do-GOOD Benchmark: Mejorando Modelos de Comprensión de Documentos

Nuevo punto de referencia revela brechas de rendimiento en modelos de procesamiento de documentos.

2025-11-04T02:17:36+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en Segmentación Semántica Panorámica

Nuevo modelo mejora el análisis de imágenes panorámicas para aplicaciones del mundo real.

2025-11-04T00:19:06+00:00 ― 5 minilectura

Interacción Persona-Ordenador LoopBoxes: Una Nueva Forma de Hacer Música

LoopBoxes ayuda a los niños a crear música de manera fácil y colaborativa.

2025-11-03T08:55:00+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Desafíos en la recuperación de texto-video y soluciones

Una mirada a los sesgos en la búsqueda de texto-video y formas de mejorar la precisión.

2025-11-03T00:45:00+00:00 ― 7 minilectura

Sonido Avances en técnicas de clasificación de audio

Un nuevo método mejora la clasificación de audio al aprender nuevos sonidos de manera eficiente.

2025-10-31T22:37:00+00:00 ― 5 minilectura

Multimedia 360TripleView: Mejorando la experiencia de video en 360 grados

Un nuevo sistema mejora la selección de dirección de visualización en videos de 360 grados.

2025-10-31T20:44:30+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones GeneCIS: Avanzando en la Similitud de Imágenes Condicionales en Visión por Computadora

Un estándar para evaluar la similitud de imágenes según condiciones definidas por el usuario.

2025-10-31T19:09:42+00:00 ― 7 minilectura

Sonido Avanzando en la Pregunta y Respuesta de Audio con el Modelo MWAFM

Un nuevo modelo mejora la forma en que las máquinas entienden y responden a preguntas de audio.

2025-10-31T18:34:05+00:00 ― 7 minilectura

Multimedia Equilibrando el Aprendizaje Activo en Datos Multimodales

Una nueva estrategia asegura una representación equitativa de los tipos de datos en el aprendizaje automático.

2025-10-31T02:02:42+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en técnicas de detección de copias de video

Un nuevo conjunto de datos desafía los métodos para detectar contenido de video alterado.

2025-10-30T18:16:36+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en Teledetección con RS5M y DVLM

Un nuevo conjunto de datos y modelo mejoran el análisis de imágenes de teledetección.

2025-10-29T03:49:48+00:00 ― 7 minilectura

Multimedia Optimizando el almacenamiento de videos para cirugías de cataratas

Investigaciones muestran maneras efectivas de comprimir videos de cirugía de cataratas para una mejor gestión del almacenamiento.

2025-10-28T02:25:06+00:00 ― 6 minilectura

Sonido Analizando música con BERT: un nuevo enfoque

La investigación explora el potencial de BERT en el análisis musical a nivel de bares.

2025-10-27T07:41:05+00:00 ― 6 minilectura

Sonido Avanzando la Armonización de Melodías con Contexto Emocional

Un nuevo modelo mejora la armonización de melodías al considerar factores emocionales.

2025-10-26T21:58:05+00:00 ― 7 minilectura

Multimedia Avances en la tecnología de compresión de video

Un nuevo método mejora la compresión de video manteniendo la calidad y eficiencia.

2025-10-26T05:46:25+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la Segmentación de Instancias de Alimentos con Etiquetado Inteligente

Un nuevo marco reduce los costos de etiquetado manual en la segmentación de imágenes de alimentos.

2025-10-25T23:35:42+00:00 ― 7 minilectura

Recuperación de información Un Nuevo Marco para Recomendaciones Multimodales

Este marco simplifica el procesamiento de datos para mejores sistemas de recomendación.

2025-10-25T18:59:12+00:00 ― 7 minilectura

Multimedia Mejorando la eficiencia de codificación de video con nuevas técnicas

Un nuevo método acelera la codificación de video mientras mantiene la calidad.

2025-10-25T14:30:36+00:00 ― 5 minilectura

Sonido Creando melodías a partir de ritmos simples

Este proyecto ayuda a cualquiera a componer música usando ritmos básicos y métodos informáticos avanzados.

2025-10-25T11:57:35+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en Modelos de Lenguaje y Visuales

Nuevo modelo relaciona la comprensión del lenguaje con el procesamiento de imágenes de manera eficiente.

2025-10-25T06:20:48+00:00 ― 6 minilectura

Multimedia Un Nuevo Sistema para hacer Coincidencia de Música y Videos

Esta investigación presenta un sistema para emparejar música con contenido de video de manera efectiva.

2025-10-24T07:37:10+00:00 ― 8 minilectura

Multimedia El Metaverso: Un Nuevo Paisaje Digital

Descubre el Metaverso en evolución y su impacto en la comunicación y la economía.

2025-10-24T03:21:18+00:00 ― 7 minilectura

Informática y sociedad El Papel de las Transcripciones en Videos Educativos

Las transcripciones mejoran la comprensión de los videos educativos, solucionando problemas de calidad de audio.

2025-10-24T02:33:54+00:00 ― 7 minilectura

Procesado de señales Avances en la transmisión de nubes de puntos 3D con SEPT

SEPT mejora la transmisión inalámbrica de nubes de puntos 3D usando aprendizaje profundo.

2025-10-23T03:16:45+00:00 ― 6 minilectura

Recuperación de información Un nuevo conjunto de datos multilingüe para noticias en video

Este conjunto de datos tiene como objetivo mejorar la búsqueda de noticias en video en cinco idiomas.

2025-10-23T01:32:54+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la Selección de Marcos para Respuestas a Preguntas en Videos

Nuevos métodos mejoran cómo los modelos eligen cuadros para responder preguntas de videos.

2025-10-22T05:40:00+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando las videollamadas con codificación predictiva

Un nuevo método mejora la calidad de las videollamadas mientras ahorra ancho de banda.

2025-10-22T03:02:00+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Transformando fotos en dibujos de línea de personajes

Un método para crear dibujos artísticos a lápiz a partir de fotos con control del usuario.

2025-10-19T23:25:12+00:00 ― 8 minilectura

Multimedia Avanzando Tareas de Video-Texto en Idioma Indonesio

Nuevo conjunto de datos mejora las tareas de video-texto para hablantes de indonesio.

2025-10-19T21:32:45+00:00 ― 8 minilectura

Sonido Avances en la Medición de la Similitud Musical

La investigación busca combinar datos de audio y simbólicos para analizar la similitud musical.

2025-10-19T11:49:45+00:00 ― 9 minilectura

Multimedia Avances en técnicas de ataque de marcas de agua usando modelos de difusión

Nuevos métodos mejoran la eliminación de marcas de agua mientras mantienen la calidad de la imagen.

2025-10-18T23:41:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la detección de discurso de odio con mDT

Un nuevo método mejora la detección de discursos de odio combinando texto, imágenes y el contexto de la discusión.

2025-10-18T18:50:54+00:00 ― 8 minilectura

Redes y arquitectura de Internet Las predicciones impulsadas por IA mejoran la eficiencia de los servicios XR

Las predicciones de IA mejoran el servicio para los usuarios de realidad extendida en redes avanzadas.

2025-10-18T09:22:06+00:00 ― 5 minilectura

Multimedia Mejorando la extracción del hablante objetivo con pistas visuales

Un nuevo modelo mejora la extracción de voz usando información de audio y visual.

2025-10-17T12:51:55+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo conjunto de datos busca detectar caras alteradas

El conjunto de datos RetouchingFFHQ mejora los métodos de detección de retoque facial.

2025-10-17T11:46:30+00:00 ― 7 minilectura

Multimedia Revolucionando el monitoreo del sueño infantil con LittleBeats

Un estudio usa un dispositivo de múltiples datos para seguir los patrones de sueño de los bebés de manera más precisa.

2025-10-16T17:25:55+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la anotación de imágenes con el método vTelos

Un nuevo enfoque para mejorar la precisión del etiquetado de imágenes en el aprendizaje automático.

2025-10-15T08:57:06+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Reconocimiento de Acción en Video Eficiente con Menos Fotogramas

Un nuevo método mejora el reconocimiento de acciones usando menos fotogramas sin perder el contexto importante.

2025-10-14T23:36:12+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la generación de imágenes a partir de descripciones de texto

Un nuevo método mejora cómo las imágenes coinciden con las entradas de texto.

2025-10-14T14:00:56+00:00 ― 7 minilectura

Bases de datos El impacto de la blockchain en la gestión de derechos de autor

Explorando cómo la tecnología blockchain puede transformar la gestión de derechos de autor para los creadores.

2025-10-14T07:24:30+00:00 ― 7 minilectura