Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Avances en el reconocimiento de voz no supervisado

Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.

2025-10-25T13:34:45+00:00 ― 8 minilectura

Sonido Creando melodías a partir de ritmos simples

Este proyecto ayuda a cualquiera a componer música usando ritmos básicos y métodos informáticos avanzados.

2025-10-25T11:57:35+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Los modelos auto-supervisados revelan ideas sobre las distinciones fonéticas y fonémicas en el habla.

2025-10-25T10:20:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando la responsabilidad policial con tecnología de reconocimiento de voz

La investigación explora el uso de reconocimiento de voz en el análisis de grabaciones de cámaras corporales de la policía.

2025-10-25T07:54:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la tecnología de detección de estrés vocal

Nuevos métodos mejoran la precisión en la detección de estrés vocal a corto plazo.

2025-10-25T06:17:30+00:00 ― 8 minilectura

Sonido Nuevas formas en que las computadoras crean música

Una mirada a cómo las computadoras están cambiando la composición musical.

2025-10-25T04:31:16+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento y la Síntesis Emocional en Modelos de Voz

Nuevas técnicas mejoran la comprensión emocional en tareas de procesamiento de habla.

2025-10-25T01:26:00+00:00 ― 7 minilectura

Sonido LinDiff: Un Salto Adelante en la Síntesis de Voz

El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.

2025-10-25T00:37:25+00:00 ― 5 minilectura

Sonido Nuevo método transforma la tecnología de compresión de audio

Un nuevo enfoque para la compresión de audio reduce el tamaño del archivo sin perder calidad.

2025-10-24T18:57:20+00:00 ― 6 minilectura

Sonido Mejorando la claridad del habla en entornos ruidosos

Técnicas para mejorar el reconocimiento de voz en medio de ruido de fondo.

2025-10-24T16:50:20+00:00 ― 7 minilectura

Computación y lenguaje Mejorando los Asistentes de Voz con Comprensión del Lenguaje Multimodal

La comprensión multimodal del lenguaje mejora el rendimiento de los asistentes de voz en condiciones reales.

2025-10-24T15:43:00+00:00 ― 6 minilectura

Procesado de Audio y Voz HiddenSinger: Una Nueva Era en la Sintetización de Voz Cantante

HiddenSinger mejora la calidad de la voz cantando usando técnicas avanzadas de IA.

2025-10-24T14:54:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de conversión de voz electrolaríngea

Nuevos métodos mejoran la claridad del habla para usuarios de electrolaringes.

2025-10-24T13:17:15+00:00 ― 7 minilectura

Sonido Avances innovadores en tecnología de habla electrolaringea

Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.

2025-10-24T12:28:40+00:00 ― 6 minilectura

Procesado de Audio y Voz El impacto de la edad en los sistemas de reconocimiento de voz

Un estudio destaca cómo el envejecimiento afecta el rendimiento de la verificación automática del hablante.

2025-10-24T10:02:55+00:00 ― 6 minilectura

Procesado de Audio y Voz PausaVoz: Avanzando la Tecnología de Texto a Voz

PauseSpeech mejora los sistemas TTS con una voz que suena más natural gracias a pausas mejoradas.

2025-10-24T09:14:20+00:00 ― 6 minilectura

Multimedia Un Nuevo Sistema para hacer Coincidencia de Música y Videos

Esta investigación presenta un sistema para emparejar música con contenido de video de manera efectiva.

2025-10-24T07:37:10+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz en Entornos Ruidosos

Nuevos métodos mejoran el rendimiento del reconocimiento automático de voz en medio del ruido de fondo.

2025-10-24T02:45:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz con modelos de lenguaje grandes

Esta investigación resalta cómo los LLMs mejoran la comprensión del habla en videos largos.

2025-10-23T22:42:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Gestión eficiente de grandes modelos de voz

Un nuevo método optimiza los modelos de voz para un mejor rendimiento con menos recursos.

2025-10-23T21:54:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo método para evaluación objetiva de audio espacial

Un enfoque nuevo mejora cómo evaluamos la calidad del audio espacial.

2025-10-23T19:28:25+00:00 ― 6 minilectura

Sonido Identificando el habla leída vs. la espontánea en entrevistas

Un estudio sobre cómo distinguir entre el habla leída y la espontánea.

2025-10-23T18:39:50+00:00 ― 6 minilectura

Procesado de Audio y Voz StyleTTS 2: Avanzando la Tecnología de Texto a Voz

Un nuevo modelo mejora el realismo del discurso sintético.

2025-10-23T15:25:30+00:00 ― 9 minilectura

Procesado de Audio y Voz Malafide: Un nuevo desafío para los sistemas de reconocimiento de voz

Malafide introduce técnicas de suplantación sofisticadas, complicando las contramedidas en el reconocimiento de voz.

2025-10-23T14:36:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el seguimiento de fuentes de sonido con PI-RNN

Un nuevo modelo mejora la precisión y eficiencia en el seguimiento de fuentes de sonido.

2025-10-23T10:34:00+00:00 ― 6 minilectura

Computación y lenguaje Presentamos el conjunto de datos ITALIC para el italiano hablado

Un nuevo conjunto de datos mejora la comprensión del lenguaje hablado para el italiano.

2025-10-23T08:56:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Aprendizaje Auto-Supervisado para el Procesamiento de Voz

MCR-Data2vec 2.0 mejora el reconocimiento de voz al hacer que el modelo sea más consistente.

2025-10-23T08:08:15+00:00 ― 5 minilectura

Aprendizaje automático EM-Network: Un Nuevo Enfoque en el Aprendizaje de Secuencias

EM-Network mejora el aprendizaje de secuencias en tareas de procesamiento de habla y lenguaje.

2025-10-23T07:19:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en modelos de ASR bilingües y con cambio de código

Nuevos métodos mejoran el reconocimiento de voz multilingüe usando fuentes de datos existentes.

2025-10-23T04:05:20+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz para Idiomas de Bajos Recursos

La investigación se centra en mejorar la tecnología de voz para idiomas que no tienen suficientes datos.

2025-10-22T23:13:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Técnicas de Mejora de Voz

Una mirada a los avances recientes en la mejora de la claridad de audio usando modelos avanzados.

2025-10-22T21:36:40+00:00 ― 6 minilectura

Sonido Evaluando la dificultad de piezas de piano con un nuevo conjunto de datos

Un nuevo conjunto de datos tiene como objetivo clasificar partituras de piano por nivel de dificultad.

2025-10-22T20:48:05+00:00 ― 9 minilectura

Sonido Avances en la Mejora de la Calidad del Habla

El marco Gesper mejora la claridad del habla en entornos ruidosos.

2025-10-22T19:59:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando la mejora del habla con técnicas de normalización

Este estudio presenta un nuevo método para mejorar la calidad del habla usando modelos preentrenados.

2025-10-22T19:10:55+00:00 ― 7 minilectura

Inteligencia artificial Mejorando la detección de discurso de odio en multimedia

Combinar audio, video y texto mejora la detección de discursos de odio.

2025-10-22T15:08:00+00:00 ― 6 minilectura

Sonido Un enfoque simplificado para HMM híbrido en ASR

Este artículo habla sobre un nuevo método para construir sistemas ASR eficientes.

2025-10-22T14:19:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Personalizando el Reconocimiento de Voz en Dispositivos Móviles

Un nuevo enfoque mejora el reconocimiento de voz directamente en los smartphones mientras garantiza la privacidad del usuario.

2025-10-22T10:16:30+00:00 ― 8 minilectura

Procesado de Audio y Voz Nuevo sistema mejora la identificación de altavoces en audio

Un nuevo método mejora la precisión para identificar a los hablantes durante las conversaciones.

2025-10-22T09:27:55+00:00 ― 6 minilectura

Sonido Avances en la detección de eventos bioacústicos con pocos disparos

Equipos mejoran la identificación de sonidos de animales con pocos ejemplos en el desafío DCASE.

2025-10-22T07:50:45+00:00 ― 7 minilectura

Sonido Aprovechando el etiquetado de audio en computadoras pequeñas

Aprende sobre sistemas de etiquetado de audio y su uso en Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 6 minilectura