Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

Sonido Analizando la música con árboles de dependencias

Un método fresco para entender las relaciones musicales a través de árboles de dependencia.

2025-10-15T13:05:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Modelos de Larga Contexto

Este artículo habla de nuevos modelos que mejoran la precisión del reconocimiento de voz al considerar contextos más largos.

2025-10-15T12:16:55+00:00 ― 7 minilectura

Computación y lenguaje Presentamos LyricWhiz: Transformando la transcripción de letras

LyricWhiz combina modelos avanzados para mejorar la precisión de la transcripción de letras en diferentes idiomas.

2025-10-15T09:51:10+00:00 ― 7 minilectura

Sonido Clasificando los cantos de aves africanas a través del análisis de audio

Un estudio sobre cómo usar grabaciones de sonido para identificar diferentes especies de aves en África.

2025-10-15T09:02:35+00:00 ― 7 minilectura

Computación Neuronal y Evolutiva Avanzando Redes Neuronales de Espigas a Través del Aprendizaje por Retraso

Nuevo método mejora el aprendizaje en Redes Neuronales Espigadas al incorporar ajustes de retraso.

2025-10-15T07:25:25+00:00 ― 7 minilectura

Recuperación de información Cómo las recomendaciones de música usan el análisis de datos

Descubre cómo los sistemas de recomendación sugieren canciones según las preferencias de los usuarios.

2025-10-15T02:33:55+00:00 ― 6 minilectura

Aprendizaje automático Abordando el desbalance de datos en la clasificación de audio

Este artículo habla sobre los desafíos y técnicas para manejar el desequilibrio de conjuntos de datos en la clasificación de audio.

2025-10-15T00:08:10+00:00 ― 7 minilectura

Computación y lenguaje Avanzando el reconocimiento de voz para idiomas de bajos recursos

Un nuevo enfoque mejora el reconocimiento de voz para el rumano usando inhibición lateral.

2025-10-14T23:19:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en la Privacidad de Género en Audio: Nuevas Perspectivas

La investigación destaca métodos para proteger la privacidad de género en audio hablado.

2025-10-14T21:42:25+00:00 ― 7 minilectura

Sonido Entendiendo las emociones en el reconocimiento de voz

Una mirada a cómo captar mejor las emociones detrás de las palabras habladas.

2025-10-14T16:02:20+00:00 ― 5 minilectura

Sonido Avanzando en la clasificación de música con embeddings de audio

Usar embeddings de audio preentrenados lleva a mejores modelos de clasificación musical.

2025-10-14T13:36:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Nuevo modelo mejora la comprensión del procesamiento del habla en el cerebro

Investigaciones destacan el papel de los límites de las palabras en el habla y la actividad EEG.

2025-10-14T11:59:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de síntesis de lip a voz

Nuevo marco mejora la claridad del habla en videos silenciosos mediante un procesamiento mejorado.

2025-10-13T19:47:45+00:00 ― 7 minilectura

Sonido La ciencia detrás del mridangam: un instrumento único

Descubre la mezcla de arte y ciencia en el estudio del mridangam.

2025-10-13T17:19:15+00:00 ― 9 minilectura

Computación y lenguaje Avanzando el Reconocimiento de Voz para Idiomas de Bajos Recursos

Un nuevo método mejora el reconocimiento de palabras personalizadas en sistemas ASR para idiomas con datos limitados.

2025-10-13T13:19:05+00:00 ― 6 minilectura

Sonido Avances en la detección de audio falso usando modelos Conformer

Los investigadores desarrollan un modelo Conformer para mejorar la detección de audio falso.

2025-10-13T03:36:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Protegiendo la privacidad de género en los sistemas de reconocimiento de voz

Un método para ocultar la información de género mientras se asegura la verificación de identidad en el reconocimiento de voz.

2025-10-12T22:44:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en la detección del Alzheimer a través del análisis del habla

Nuevos métodos mejoran la detección temprana del Alzheimer usando análisis de voz y audio.

2025-10-12T19:30:15+00:00 ― 9 minilectura

Procesado de Audio y Voz Nueva base de datos revela información sobre los sonidos de instrumentos musicales

Explora datos de sonido de 41 instrumentos musicales con grabaciones detalladas.

2025-10-12T15:27:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en los Embeddings Acústicos de Palabras para el Lenguaje Hablado

Investigación sobre cómo mejorar los embeddings acústicos de palabras con comprensión semántica y datos multilingües.

2025-10-12T14:38:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz para la disartria

Nuevas tecnologías mejoran la comunicación para personas con trastornos del habla.

2025-10-12T13:01:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en la tecnología de procesamiento de voz en tiempo real

Un nuevo sistema combina transcripción y traducción para mejorar la comunicación.

2025-10-12T11:24:25+00:00 ― 5 minilectura

Sonido Avances en el reconocimiento de voz con Whisper-AT

Whisper-AT combina el reconocimiento de voz y el etiquetado de audio para un mejor rendimiento.

2025-10-12T08:10:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Integrando el habla con modelos de lenguaje: El método Speech-LLaMA

Un nuevo enfoque que combina el habla con modelos de lenguaje para mejorar la traducción.

2025-10-11T18:24:10+00:00 ― 5 minilectura

Sonido Avances en la Transcripción Automática de Pianos

Nuevo método mejora la precisión al convertir audio de piano en partituras.

2025-10-11T14:21:15+00:00 ― 5 minilectura

Procesado de Audio y Voz El paisaje en evolución de la IA de audio generativo

Este artículo habla de las necesidades y desafíos en la tecnología de audio generativo.

2025-10-11T13:32:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la detección de tuberculosis a través del análisis de la tos

Nuevos métodos usan los sonidos de la tos y datos de salud para detectar mejor la tuberculosis.

2025-10-11T09:29:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Cambios de voz en pacientes con cáncer oral durante el tratamiento

Este estudio examina cómo evolucionan las características de la voz en pacientes con cáncer oral después del tratamiento.

2025-10-11T08:41:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando la Transferencia de Timbre con DiffTransfer

Un nuevo método para cambiar el timbre musical usando técnicas avanzadas de aprendizaje automático.

2025-10-11T07:52:35+00:00 ― 5 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con RNN-Transductores

Nuevos métodos mejoran la precisión del reconocimiento de voz, solucionando errores comunes de transcripción.

2025-10-11T04:38:15+00:00 ― 5 minilectura

Sonido Avances en la síntesis de voz articulatoria

Un estudio sobre cómo mejorar la reproducción del sonido vocal con técnicas de síntesis avanzadas.

2025-10-11T02:12:30+00:00 ― 7 minilectura

Sonido Presentamos VampNet: Una Nueva Forma de Crear Música

VampNet transforma el procesamiento de música a través de técnicas innovadoras de modelado de tokens.

2025-10-11T01:23:55+00:00 ― 5 minilectura

Sonido EchoVest: Una Nueva Esperanza para la Pérdida Auditiva

Tecnología portátil asequible para personas con pérdida auditiva.

2025-10-10T23:46:45+00:00 ― 6 minilectura

Sonido Avanzando la alineación de letras en servicios de música

Un nuevo modelo mejora la precisión de tiempo para las letras en aplicaciones de música.

2025-10-10T18:55:15+00:00 ― 7 minilectura

Interacción Persona-Ordenador Presentamos SnakeSynth: Una Nueva Forma de Crear Sonido

Un sintetizador en línea que permite a los usuarios crear música usando gestos simples.

2025-10-10T16:29:30+00:00 ― 5 minilectura

Sonido IA y Creatividad en la Música Metal Progresivo

Un estudio sobre el papel de la IA en la generación de música metal progresivo.

2025-10-10T13:15:10+00:00 ― 7 minilectura

Sonido ShredGP: Una Nueva Forma de Generar Música de Guitarra

Un modelo que crea tablaturas de guitarra reflejando los estilos de guitarristas famosos.

2025-10-10T12:26:35+00:00 ― 7 minilectura

Sonido Avances en Aprendizaje Auto-Supervisado para Análisis Musical

Explorando el potencial del aprendizaje auto-supervisado en la recuperación de información musical.

2025-10-10T10:00:50+00:00 ― 7 minilectura

Sonido Análisis de audio en la detección de COVID-19

Usando señales de audio para identificar riesgos de salud respiratoria.

2025-10-10T09:12:15+00:00 ― 9 minilectura

Computación y lenguaje ResumenMezcla: Un Nuevo Enfoque para el Reconocimiento de Voz

Un nuevo método mejora la velocidad y precisión del reconocimiento de voz mientras reduce el uso de recursos.

2025-10-10T07:35:05+00:00 ― 7 minilectura