Últimos artículos para Procesamiento de Audio

Aprendizaje automático Desafíos en el uso de Convnets para el diseño de filtros de audio

Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.

2025-09-14T14:34:35+00:00 ― 6 minilectura

Sonido Avances en modelos de audio y lenguaje

El modelo CLAP conecta el procesamiento de audio y texto para varias aplicaciones.

2025-09-14T13:46:00+00:00 ― 5 minilectura

Sonido Nuevo sistema mejora la extracción de voz desde posiciones inestables de la cabeza

PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.

2025-09-12T19:39:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con la tecnología AV2Wav

AV2Wav mejora la calidad del habla usando pistas de audio y visuales.

2025-09-12T17:13:55+00:00 ― 6 minilectura

Sonido Un Nuevo Marco para la Anonimización de Voces

Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.

2025-09-12T05:05:10+00:00 ― 8 minilectura

Sonido Los desafíos emocionales en el discurso ponen a prueba los modelos de separación de sonidos

La investigación revela que el habla emocional afecta el rendimiento del modelo en tareas de separación de voz.

2025-09-11T18:33:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando en las técnicas de detección de discursos falsos

Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.

2025-09-11T02:21:55+00:00 ― 6 minilectura

Sonido Mejorando el entrenamiento de Vocoder con aprendizaje contrastivo

Nuevos métodos mejoran el rendimiento del vocoder con datos de audio limitados.

2025-09-10T12:36:00+00:00 ― 6 minilectura

Sonido Un nuevo método para detectar la suplantación de voz

Un enfoque sólido para identificar anomalías en el audio y combatir el spoofing vocal.

2025-09-09T07:27:00+00:00 ― 6 minilectura

Sonido DiCon: Un Nuevo Enfoque para la Síntesis de Voz

Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.

2025-09-09T03:24:05+00:00 ― 7 minilectura

Procesado de Audio y Voz HiFTNet: Avanzando la tecnología de texto a voz

HiFTNet ofrece una síntesis de voz más rápida y de alta calidad usando técnicas innovadoras y eficientes.

2025-09-09T02:35:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Sonido Generación de texto a audio más rápida usando destilación de consistencia

Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.

2025-09-08T18:29:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Presentamos el modelo SPGM para separación de voz

Un nuevo modelo mejora la eficiencia y el rendimiento en la separación de voces.

2025-09-07T10:54:55+00:00 ― 6 minilectura

Sonido Método innovador transforma la subtitulación de audio con datos de texto

Un nuevo enfoque genera subtítulos de audio usando solo texto, mejorando la eficiencia de datos.

2025-09-07T00:23:20+00:00 ― 8 minilectura

Sonido Conectando Música: Recuperación de Audio y Partituras

Explorando los desafíos y las innovaciones para emparejar grabaciones de audio con partituras.

2025-09-06T21:57:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando Conjuntos de Datos de Audio con Agrupamiento K-Means

Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.

2025-09-06T15:28:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Técnicas de Aumento de Audio

Un estudio muestra que la augmentación de audio puede mejorar el reconocimiento de voz en lenguas con pocos recursos.

2025-09-06T09:48:50+00:00 ― 7 minilectura

Aprendizaje automático Mejorando el Aprendizaje con Etiquetas Débiles a Través de la Selección de Ejemplos Negativos

Nuevas estrategias mejoran el aprendizaje con etiquetas débiles al seleccionar ejemplos negativos relevantes.

2025-09-06T04:57:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Selección de Modelo Eficiente para Reconocimiento de Voz

Un método para elegir el mejor modelo de ASR basado en características de audio.

2025-09-05T23:17:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con técnicas de dereverberación

Aprende cómo la dereverberación mejora el reconocimiento de voz en ambientes ruidosos.

2025-09-05T12:45:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Nuevo método para estimar el volumen de una habitación usando modelos de atención

Este estudio presenta un modelo basado en atención para estimar volúmenes de habitaciones a partir de grabaciones de audio.

2025-09-05T11:08:30+00:00 ― 6 minilectura

Sonido Presentamos ASCA: Un Nuevo Enfoque para la Clasificación de Audio

El modelo ASCA mejora la precisión de clasificación de audio para conjuntos de datos pequeños.

2025-09-05T10:19:55+00:00 ― 7 minilectura

Sonido Transformando los movimientos de la lengua en sonidos del habla

Este estudio convierte datos de MRI de la lengua en audio de voz real.

2025-09-04T22:11:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances y desafíos en los modelos de reconocimiento de voz

Este estudio analiza cómo la compresión de modelos afecta el reconocimiento de voz en entornos ruidosos.

2025-09-04T19:45:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Detección de Eventos Sonoros con OAL

Explora cómo el Aprendizaje Activo en Línea mejora la eficiencia del reconocimiento de sonido.

2025-09-04T18:56:50+00:00 ― 7 minilectura

Sonido Avances en modelos de reconocimiento de audio y voz

Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.

2025-09-04T18:08:15+00:00 ― 6 minilectura

Sonido Avances en la Clasificación de Audio Usando DCLS

DCLS mejora el rendimiento de clasificación de audio al aprender las posiciones del núcleo durante el entrenamiento.

2025-09-04T07:36:40+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el aprendizaje audiovisual con co-augmentación de velocidad

Un nuevo método mejora el aprendizaje automático de datos audio-visuales.

2025-09-04T05:59:30+00:00 ― 7 minilectura

Procesado de Audio y Voz MC-SimCLR: Avanzando en el aprendizaje de sonido y la conciencia de ubicación

Un nuevo método mejora el reconocimiento de sonido y la localización de fuentes sin etiquetas.

2025-09-03T00:50:30+00:00 ― 6 minilectura

Sonido Nuevas ideas sobre la generalización en redes neuronales

Explorando cómo la agudeza de los mínimos influye en el rendimiento del modelo con datos de audio no vistos.

2025-09-02T15:56:05+00:00 ― 6 minilectura

Sonido Transformers en Aprendizaje de Representación Musical

Un estudio sobre el uso de transformadores para un etiquetado y representación musical efectiva.

2025-09-02T07:01:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Un enfoque universal para mejorar el habla

Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.

2025-09-02T02:10:10+00:00 ― 6 minilectura

Sonido El auge de los subtítulos automáticos en audio

Explorando los avances en la subtitulación automática de audio y su impacto en la accesibilidad.

2025-09-02T01:21:35+00:00 ― 6 minilectura

Sonido Avances en técnicas de anclaje de texto a audio

Nuevos métodos mejoran la conexión entre descripciones de texto y eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la Diarización de Habla con el Método E-SHARC

E-SHARC mejora la identificación de hablantes en varios entornos de audio.

2025-08-28T06:22:45+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando la segmentación audiovisual con técnicas no supervisadas

Un nuevo enfoque simplifica la segmentación audiovisual sin necesidad de datos etiquetados costosos.

2025-08-27T01:00:18+00:00 ― 8 minilectura

Procesado de Audio y Voz Nuevo método para eliminar el eco en el habla

Un método mejora la claridad del habla en entornos ruidosos sin datos de entrenamiento claros.

2025-08-26T17:56:30+00:00 ― 7 minilectura

Análisis funcional Wavelets y Suavidad: Una Perspectiva Práctica

Explora el papel de las wavelets en el análisis de la suavidad de funciones y sus aplicaciones.

2025-08-24T23:53:28+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la diarización de hablantes con enfoques de múltiples micrófonos

Nuevos métodos mejoran la detección de actividad de voz y superposición en la diarización del hablante.

2025-08-24T13:18:35+00:00 ― 8 minilectura