Últimos artículos para Procesamiento de Audio

Procesado de Audio y Voz Avanzando la localización de fuentes de sonido con DOA-PNN

Un nuevo método mejora la localización del sonido en entornos variados al centrarse en el aprendizaje continuo.

2025-07-22T02:03:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la Detección de Eventos Sonoros con UCIL

Un nuevo método mejora la detección de eventos de sonido al integrar nuevas clases de audio de manera efectiva.

2025-07-22T01:15:20+00:00 ― 8 minilectura

Aprendizaje automático Mejorando la Eficiencia en Modelos de Difusión para Muestreo de Datos

Nuevos métodos mejoran la velocidad y precisión del muestreo en modelos de difusión.

2025-07-21T11:17:44+00:00 ― 8 minilectura

Computación y lenguaje Evaluando Sistemas de Diarización de Habla en Línea

Este artículo examina la latencia de varios sistemas de diarización de locutores en el procesamiento de audio.

2025-07-21T04:12:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la separación de fuentes de audio cinematográfico

Explora las actualizaciones en la versión 3 del conjunto de datos Divide and Remaster.

2025-07-19T12:31:35+00:00 ― 7 minilectura

Análisis funcional Investigando la Decadencia de Energía en Redes Convolucionales

Un estudio sobre el comportamiento energético en redes de aprendizaje profundo que mejora el análisis de señales.

2025-07-19T10:56:37+00:00 ― 7 minilectura

Procesado de Audio y Voz Evaluando la eficiencia de Mamba en tecnología del habla

Mamba promete mucho contra transformers en tareas de habla, especialmente con entradas largas.

2025-07-17T13:33:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voz Multicanal

El método CUSIDE-array mejora la precisión del reconocimiento de voz en tiempo real en sistemas multicanal.

2025-07-17T02:13:35+00:00 ― 7 minilectura

Sonido Adaptando Whisper para mejorar la verificación de hablantes

Un nuevo marco mejora el rendimiento de la verificación de hablantes con datos limitados.

2025-07-17T00:36:25+00:00 ― 8 minilectura

Procesado de Audio y Voz Qwen2-Audio: Una Nueva Voz para la Tecnología

Un modelo impulsado por voz que transforma la interacción de audio con la tecnología.

2025-07-16T00:18:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz por robots móviles

Un robot móvil aprende a reconocer voces en entornos ruidosos para aplicaciones prácticas.

2025-07-15T16:13:05+00:00 ― 5 minilectura

Sonido Generación de sonido innovadora para modelos humanos en 3D

Un nuevo método mejora la creación de sonido para modelos humanos 3D realistas.

2025-07-15T00:01:25+00:00 ― 8 minilectura

Multimedia Avanzando en la localización de fuentes de sonido mediante la integración audio-visual

Un estudio sobre cómo mejorar la localización de fuentes de sonido aprovechando mejor la información auditiva y visual.

2025-07-14T06:12:35+00:00 ― 9 minilectura

Inteligencia artificial Charla de emociones: Soporte de audio para sentimientos

Un proyecto que ofrece apoyo emocional a través de respuestas de audio para quienes lo necesiten.

2025-07-14T05:46:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la clasificación kNN con gradientes auto-supervisados

Un nuevo método mejora la clasificación kNN usando gradientes para una mejor representación de características.

2025-07-13T10:33:18+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Segmentación Audio-Visual Referencial: Un Nuevo Enfoque

Combinar la info de audio y visual ayuda a reconocer mejor objetos en videos.

2025-07-13T10:17:30+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Integrando texto y sonido para la segmentación de objetos

Un nuevo método combina pistas de audio y texto para una mejor identificación de objetos.

2025-07-13T10:01:42+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Técnicas de Mejora del Habla

Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.

2025-07-12T15:20:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Transformando la transmisión con tecnología IP y etiquetado de audio

Descubre cómo la transmisión IP y el etiquetado de audio están transformando la entrega de contenido.

2025-07-12T05:37:35+00:00 ― 7 minilectura

Sonido Evaluando el razonamiento en modelos de audio-lenguaje

Este estudio evalúa las habilidades de razonamiento de modelos de audio-lenguaje con una nueva tarea.

2025-07-10T09:54:05+00:00 ― 9 minilectura

Sonido Avanzando en la clasificación de audio con nuevas técnicas de aprendizaje

Un método que mejora el reconocimiento de sonidos en máquinas.

2025-07-09T17:42:25+00:00 ― 7 minilectura

Sonido Avances en Tecnologías de Detección de Voz

La investigación combina la mejora del habla y el aprendizaje por transferencia para mejores sistemas anti-spoofing.

2025-07-08T23:53:35+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando la detección de palabras clave en entornos ruidosos

Un nuevo sistema mejora el reconocimiento de comandos de voz a pesar del ruido de fondo.

2025-07-08T18:13:30+00:00 ― 6 minilectura

Multimedia Avanzando en el Aprendizaje Generalizado Zero-Shot Audiovisual

Un nuevo marco mejora la clasificación en tareas audiovisuales no vistas.

2025-07-06T04:41:10+00:00 ― 7 minilectura

Sonido Optimizando la Diarización de Voces para Resultados Más Rápidos

Métodos para acelerar la diarización de hablantes sin sacrificar la precisión.

2025-07-05T00:20:45+00:00 ― 8 minilectura

Sonido GRAFX: Una Nueva Herramienta para Procesar Audio

GRAFX ofrece una solución de código abierto para el procesamiento de audio eficiente con PyTorch.

2025-07-04T17:52:05+00:00 ― 5 minilectura

Multimedia Avances en Segmentación Semántica Audiovisual

Un nuevo método mejora el reconocimiento de objetos en videos a través de pistas sonoras y visuales.

2025-07-04T10:13:36+00:00 ― 6 minilectura

Sonido Mejorando las RNNs para modelar efectos de audio

Nuevos métodos para mejorar el control de las RNNs mejoran las simulaciones de efectos de audio.

2025-07-03T15:08:50+00:00 ― 10 minilectura

Sonido Avanzando en los métodos de detección de audio Deepfake

La investigación se centra en detectar audio deepfake mediante técnicas mejoradas y expansión de datos.

2025-07-01T06:28:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en procesamiento de audio y lenguaje

Nuevo modelo mejora las conexiones entre los sonidos y sus significados textuales.

2025-06-30T08:36:15+00:00 ― 8 minilectura

Computación Neuronal y Evolutiva Detección Eficiente de Palabras Clave Usando Dispositivos Neuromórficos

Un nuevo método para la detección de palabras clave eficiente en energía usando tecnología neuromórfica.

2025-06-30T01:41:00+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la claridad en el audio: técnicas de separación de diálogos

La separación de diálogos ayuda a los espectadores a escuchar las conversaciones claramente a pesar del ruido de fondo.

2025-06-29T11:33:05+00:00 ― 8 minilectura

Sonido Avances en Aprendizaje de Pocas Muestras para Procesamiento de Audio

Este artículo habla sobre el aprendizaje con pocos ejemplos y su impacto en tareas de audio.

2025-06-28T12:04:10+00:00 ― 8 minilectura

Aprendizaje automático Avances en el Aprendizaje de Composición de Audio

Un nuevo método mejora la separación y generación de audio sin necesidad de datos etiquetados.

2025-06-28T05:35:30+00:00 ― 7 minilectura

Sonido Desafío ASVspoof: Avances en la Autenticación de Voz

Abordando los desafíos del audio falso y la verificación de hablantes.

2025-06-28T00:44:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en tecnología de texto a voz con SSL-TTS

SSL-TTS simplifica la síntesis de voz usando pocos datos de entrenamiento para obtener resultados de alta calidad.

2025-06-27T15:49:35+00:00 ― 7 minilectura

Multimedia Repensando los estándares de localización de fuentes audio-visuales

Los benchmarks actuales no evalúan bien la capacidad de los modelos para conectar datos de audio y visuales.

2025-06-25T16:03:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Métodos de Detección de Inicio Musical

Nuevos algoritmos mejoran la precisión para identificar el inicio de las notas musicales.

2025-06-25T14:26:00+00:00 ― 8 minilectura

Sonido Avanzando en técnicas de detección de falsificación de audio

Nuevos métodos mejoran la detección de audio falso en condiciones del mundo real.

2025-06-24T06:51:15+00:00 ― 5 minilectura

Procesado de Audio y Voz Nuevas métricas para medir el sonido en espacios

La investigación propone mejores formas de evaluar la reverberación tardía en las habitaciones.

2025-06-24T02:48:20+00:00 ― 7 minilectura