Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Sonido AffectEcho: Conectando emociones en el habla de IA

El modelo AffectEcho mejora la expresión emocional en el habla generada por IA.

2025-09-25T07:15:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la conversión de grafema a fonema con un nuevo método de muestreo

Este estudio mejora los modelos G2P al centrarse en las áreas propensas a errores durante el entrenamiento.

2025-09-25T05:38:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en técnicas de seguimiento de formantes

Descubre métodos que mejoran la precisión en el seguimiento de formantes para el análisis del habla.

2025-09-24T22:21:05+00:00 ― 8 minilectura

Procesado de Audio y Voz Usando el Análisis de Voz para Evaluar la Severidad del Parkinson

Los investigadores desarrollan métodos basados en el habla para evaluar el Parkinson de forma más precisa.

2025-09-24T21:32:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la detección de sonido con técnicas de meta-aprendizaje

Meta-SELD mejora la localización de eventos sonoros en diferentes entornos.

2025-09-24T19:55:20+00:00 ― 6 minilectura

Aprendizaje automático Momentos Audiovisuales en el Tiempo: Un Nuevo Conjunto de Datos para el Reconocimiento de Acciones

AVMIT ofrece a los investigadores información sobre cómo se relacionan el sonido y la visión en el reconocimiento de acciones.

2025-09-24T07:46:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la Predicción de Calidad de Audio con GML

Un nuevo modelo de IA mejora la predicción de las puntuaciones de calidad de audio.

2025-09-24T03:43:40+00:00 ― 7 minilectura

Sonido Generación de Música con IA: Un Estudio sobre Técnicas de Muestreo

Esta investigación examina cómo los métodos de muestreo afectan la calidad de la música generada por IA.

2025-09-24T02:55:05+00:00 ― 7 minilectura

Sonido Avances en la Tecnología de Anti-Spoofing de Audio

Un nuevo método mejora la detección de audio falso en sistemas de reconocimiento de voz.

2025-09-23T23:40:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el seguimiento del ritmo para música clásica

Nuevos métodos mejoran la precisión del seguimiento del ritmo en música clásica compleja.

2025-09-23T14:46:20+00:00 ― 8 minilectura

Procesado de Audio y Voz Entendiendo el papel de la diarización del lenguaje

Una mirada a cómo la diarización de lenguaje ayuda en conversaciones multilingües.

2025-09-22T23:23:15+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el marco de generación de textura de audio

Un nuevo marco simplifica la generación de texturas de audio al reducir las necesidades de etiquetado.

2025-09-22T22:34:40+00:00 ― 7 minilectura

Sonido Avances en el Reconocimiento de Voz para Entornos Ruidosos

Un nuevo sistema mejora el reconocimiento de voz en lugares ruidosos usando técnicas avanzadas.

2025-09-22T21:46:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Evaluando el rendimiento de la línea base B1 del desafío VoicePrivacy

Evaluando la efectividad de la anonimización de la voz sin perder el sonido natural.

2025-09-22T14:28:50+00:00 ― 7 minilectura

Sonido Avances en la Clasificación de Audio con LCANets++

Nuevos modelos mejoran la precisión de la clasificación de audio y la resistencia al ruido y ataques.

2025-09-22T12:51:40+00:00 ― 5 minilectura

Sonido IA en la Música: Herramientas y Técnicas de Creación

Una visión general de las herramientas de IA para la creación musical y sus características únicas.

2025-09-22T08:48:45+00:00 ― 13 minilectura

Sonido Generando sonidos realistas a partir de videos silenciosos

La investigación explora el deep learning para crear audio que coincida con contenido de video en silencio.

2025-09-22T04:45:50+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Combinando sonido y visuales para mejorar la calidad del audio

Un nuevo método mejora las grabaciones de sonido usando señales visuales.

2025-09-22T03:57:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Evaluando la calidad del habla con modelos XLS-R

Una mirada a cómo los modelos XLS-R mejoran la evaluación de la calidad de audio en reuniones en línea.

2025-09-22T01:31:30+00:00 ― 7 minilectura

Sonido Mejorando el etiquetado de audio con el marco CED

Un nuevo método mejora el rendimiento y la eficiencia en el etiquetado de audio.

2025-09-22T00:42:55+00:00 ― 6 minilectura

Sonido Nuevo estudio sobre la detección de voz generada por IA

La investigación destaca métodos de detección en tiempo real para audio falso creado por IA.

2025-09-21T19:02:50+00:00 ― 6 minilectura

Sonido Whombat: Una Nueva Herramienta para la Investigación Bioacústica

Whombat simplifica la anotación de grabaciones de sonido para la investigación de la vida salvaje.

2025-09-21T18:14:15+00:00 ― 6 minilectura

Sonido Avances en Técnicas de Mejora de Voz

Nuevas estrategias mejoran la claridad del habla en ambientes ruidosos para un mejor reconocimiento.

2025-09-21T17:25:40+00:00 ― 7 minilectura

Multimedia Vinculando emociones en imágenes con la búsqueda de música

Un nuevo sistema conecta imágenes emocionales con música para mejorar el descubrimiento.

2025-09-21T16:37:05+00:00 ― 7 minilectura

Sonido Mejorando la Calidad de la Música para Grabaciones Diarias

Un nuevo sistema mejora las grabaciones de audio para una mejor experiencia de escucha.

2025-09-21T15:48:30+00:00 ― 7 minilectura

Sonido Mejorando la bioacústica con técnicas de aprendizaje activo

Un nuevo enfoque reduce el etiquetado de datos mientras mejora la precisión en la clasificación de audio.

2025-09-21T14:11:20+00:00 ― 6 minilectura

Sonido Avances en la tecnología de texto a voz para un habla natural

Un nuevo sistema mejora la calidad del habla y la expresividad para la síntesis de párrafos.

2025-09-21T11:45:35+00:00 ― 6 minilectura

Sonido Evaluando la calidad de la música generada por IA

Descubre métodos para evaluar la calidad de la música creada por IA mediante evaluaciones subjetivas y objetivas.

2025-09-21T10:08:25+00:00 ― 6 minilectura

Sonido Nuevas ideas sobre el movimiento de la lengua al hablar

La investigación se centra en los movimientos de la lengua para ayudar en la terapia del habla y el aprendizaje de idiomas.

2025-09-21T04:28:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Impacto de género en los sistemas biométricos de voz

Este estudio analiza cómo el género afecta la utilidad, privacidad y equidad de la biometría de voz.

2025-09-20T19:33:55+00:00 ― 8 minilectura

Sonido Mejorando la Síntesis de Voz con Técnicas de Poda

Nuevos métodos de poda mejoran el rendimiento del modelo de texto a voz de múltiples hablantes sin entrenamiento previo.

2025-09-20T15:31:00+00:00 ― 9 minilectura

Computación y lenguaje Entendiendo las Emociones en Conversaciones de Emergencia

La investigación sobre el reconocimiento de emociones en interacciones de llamadas de emergencia revela insights importantes.

2025-09-20T14:42:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Nuevos métodos para seleccionar datos de voz minimizan el etiquetado mientras mejoran la precisión del reconocimiento.

2025-09-20T13:53:50+00:00 ― 6 minilectura

Sonido Avanzando el Reconocimiento de Emociones en el Habla con el Transformador Tiempo-Frecuencia

Un nuevo método mejora el reconocimiento de emociones en el habla al analizar el tiempo y la frecuencia.

2025-09-20T12:16:40+00:00 ― 6 minilectura

Física cuántica La tecnología cuántica se encuentra con la creación musical

Explora cómo las herramientas cuánticas transforman la producción musical para los artistas.

2025-09-20T08:57:42+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la Evaluación de la Calidad del Habla con Puntuaciones de Preferencia

Un nuevo método mejora la clasificación de calidad del habla utilizando puntuaciones de preferencia de los oyentes.

2025-09-20T07:25:10+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Voz para Personas con Tartamudez

Un método para mejorar los sistemas de ASR para usuarios que tartamudean.

2025-09-20T06:36:35+00:00 ― 6 minilectura

Sonido Problemas de acceso en el conjunto de datos de un millón de canciones

Los desafíos para acceder a datos de audio dificultan las oportunidades de investigación.

2025-09-20T00:07:55+00:00 ― 6 minilectura

Sonido Avances en la Tecnología de Aislamiento de Voz

Nuevos métodos mejoran la claridad en entornos ruidosos a través de un procesamiento de sonido avanzado.

2025-09-19T22:30:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de síntesis de voz francesa

Un sistema recién desarrollado genera un habla francesa realista para una competencia.

2025-09-19T21:42:10+00:00 ― 6 minilectura