Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Detección de hablantes en tiempo real para reuniones modernas

Un nuevo sistema mejora las experiencias de las reuniones al identificar a los hablantes en tiempo real.

2025-09-11T03:10:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando en las técnicas de detección de discursos falsos

Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.

2025-09-11T02:21:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Anonimizando Datos de Voz: Un Nuevo Enfoque

Un método para la conversión de voz que mejora la privacidad y la calidad del habla.

2025-09-11T01:33:20+00:00 ― 8 minilectura

Sonido Avances en los sistemas de detección de deepfakes de audio

Nuevos métodos mejoran la capacidad de distinguir audio falso de real.

2025-09-10T22:19:00+00:00 ― 7 minilectura

Sonido Nuevo método para detectar voz sintética

Un método mejora la detección de voces sintéticas y identifica a sus creadores.

2025-09-10T20:41:50+00:00 ― 6 minilectura

Sonido Avances en Modelos Pequeños de Mejora de Voz

Nuevos métodos mejoran modelos pequeños para una mejor mejora de voz usando menos recursos.

2025-09-10T19:53:15+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz con técnicas de personalización

Un nuevo método mejora los modelos de ASR para usuarios individuales usando cuantización y adaptación.

2025-09-10T13:24:35+00:00 ― 7 minilectura

Sonido Mejorando el entrenamiento de Vocoder con aprendizaje contrastivo

Nuevos métodos mejoran el rendimiento del vocoder con datos de audio limitados.

2025-09-10T12:36:00+00:00 ― 6 minilectura

Sonido Entendiendo la Disartria: Perspectivas sobre el Trastorno del Habla

Una mirada a la disartria, su detección y el papel de la tecnología.

2025-09-10T06:55:55+00:00 ― 7 minilectura

Sonido Mejorando el Reconocimiento de Voz con Prompts Suaves

Los soft prompts mejoran la tecnología de reconocimiento de voz para un mejor rendimiento en ambientes ruidosos.

2025-09-10T04:30:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la inversión de voz a través del aprendizaje auto-supervisado

La investigación combina aprendizaje auto-supervisado y nuevas técnicas de medición para mejorar la inversión del habla.

2025-09-10T01:15:50+00:00 ― 7 minilectura

Sonido Mejorando la claridad en el habla electrolaríngea

Los investigadores desarrollan un nuevo marco para mejorar la claridad del habla para los usuarios de electrolaringe.

2025-09-09T22:50:05+00:00 ― 6 minilectura

Criptografía y seguridad Mejorando la detección de deepfakes mediante métodos de entrenamiento diversos

Este estudio explora estrategias de entrenamiento para mejorar la detección de audio falso.

2025-09-09T22:01:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voz a través de Modelos de Salida Temprana

Nuevos modelos se adaptan para mejorar la eficiencia y la rapidez del reconocimiento de voz.

2025-09-09T21:12:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Presentamos RECAP: Una Nueva Frontera en el Subtitulaje de Audio

RECAP usa técnicas avanzadas para generar subtítulos de audio precisos sin necesidad de reentrenar.

2025-09-09T20:24:20+00:00 ― 6 minilectura

Sonido Fundamentos de la Teoría Musical y Armonía

Una guía práctica para entender la teoría musical a través de la armonía y las escalas.

2025-09-09T16:21:25+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando los sistemas ASR con datos sintéticos

Un nuevo método utiliza datos sintéticos para mejorar los sistemas de ASR en áreas desconocidas.

2025-09-09T15:32:50+00:00 ― 7 minilectura

Sonido Estimando la Densidad de Multitudes con Sonido Mientras se Protege la Privacidad

Un nuevo método basado en audio estima el tamaño de las multitudes sin invadir la privacidad personal.

2025-09-09T13:55:40+00:00 ― 5 minilectura

Computación y lenguaje Avanzando en el Reconocimiento de Voz: Sistemas que Siguen Instrucciones

Un nuevo enfoque para el reconocimiento de voz mejora la interacción del usuario con instrucciones flexibles.

2025-09-09T08:15:35+00:00 ― 5 minilectura

Sonido Un nuevo método para detectar la suplantación de voz

Un enfoque sólido para identificar anomalías en el audio y combatir el spoofing vocal.

2025-09-09T07:27:00+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Reconocimiento de Emociones en Conversaciones

Un nuevo modelo mejora la comprensión de las emociones durante las conversaciones.

2025-09-09T06:38:25+00:00 ― 7 minilectura

Computación y lenguaje ¿Los símbolos de habla generada por computadora siguen la ley de Zipf?

Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.

2025-09-09T04:12:40+00:00 ― 6 minilectura

Sonido DiCon: Un Nuevo Enfoque para la Síntesis de Voz

Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.

2025-09-09T03:24:05+00:00 ― 7 minilectura

Procesado de Audio y Voz HiFTNet: Avanzando la tecnología de texto a voz

HiFTNet ofrece una síntesis de voz más rápida y de alta calidad usando técnicas innovadoras y eficientes.

2025-09-09T02:35:30+00:00 ― 6 minilectura

Sonido Avances en la tecnología de conversión de voz usando imágenes faciales

Nuevo método transforma voces usando rasgos faciales para diversas aplicaciones.

2025-09-09T01:46:55+00:00 ― 10 minilectura

Procesado de Audio y Voz Presentamos AV-SUPERB: Un Nuevo Referente para Modelos Audiovisuales

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

Sonido Mejorando la Diarización de Habla con Información Semántica

Un nuevo enfoque mejora la diarización de hablantes al integrar datos semánticos en el proceso.

2025-09-08T20:06:50+00:00 ― 6 minilectura

Sonido Generación de texto a audio más rápida usando destilación de consistencia

Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.

2025-09-08T18:29:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Emociones en el Habla: Un Enfoque Multilingüe

La investigación muestra una mejor precisión en el reconocimiento de emociones a partir del habla en diferentes idiomas.

2025-09-08T16:03:55+00:00 ― 5 minilectura

Sonido Mejorando el Reconocimiento de Voz con Entrenamiento en Tiempo de Prueba

Explora cómo TTT mejora el reconocimiento de voz al adaptarse a cambios en la distribución.

2025-09-08T14:26:45+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Técnicas Avanzadas de Localización de Fuentes de Sonido

Mejorando la forma en que identificamos fuentes de sonido usando datos audio-visuales.

2025-09-08T12:49:35+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Mapeando Sonidos: Un Nuevo Enfoque para el Análisis del Paisaje Sonoro

Un método para visualizar y predecir sonidos en diferentes entornos usando tecnología avanzada.

2025-09-08T11:12:25+00:00 ― 6 minilectura

Computación y lenguaje Avances en la Identificación de Lenguaje Hablado

Nuevos métodos combinan audio y metadatos para mejorar el reconocimiento de idiomas.

2025-09-08T07:09:30+00:00 ― 7 minilectura

Sonido Nuevo sistema de reconocimiento de voz enfrenta amenazas de suplantación

Un sistema diseñado para detectar ataques de presentación de voz mejora la seguridad en el reconocimiento de voz.

2025-09-08T06:20:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando Whisper para lenguas de pocos recursos

Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.

2025-09-08T03:55:10+00:00 ― 5 minilectura

Sonido Avances en la edición de voz basada en texto

FluentEditor mejora la edición de audio al centrarse en el flujo natural y la consistencia.

2025-09-07T20:37:55+00:00 ― 5 minilectura

Computación y lenguaje Nuevos Métodos en la Traducción Simultánea de Habla

Mejorando la traducción en tiempo real con técnicas avanzadas de segmentación.

2025-09-07T18:12:10+00:00 ― 6 minilectura

Computación y lenguaje Avances en la Traducción Simultánea de Habla

Mejorando las traducciones en tiempo real a través de métodos innovadores y políticas inteligentes.

2025-09-07T17:23:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el Reconocimiento Automático de Voz para el Árabe Tunisino

Esfuerzos para mejorar los sistemas de ASR para el árabe tunecino y el cambio de código.

2025-09-07T16:35:00+00:00 ― 6 minilectura

Sonido Personalizando la Generación de Música: Nuevos Enfoques

Métodos innovadores buscan adaptar la generación de música a las preferencias del usuario.

2025-09-07T15:46:25+00:00 ― 8 minilectura