Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Examinando la calidad de la voz y su impacto

Este estudio explora métodos de clasificación de calidad de voz y su importancia en la comunicación.

2025-09-29T12:28:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de control activo de ruido

Aprende cómo los nuevos algoritmos mejoran las técnicas de cancelación de ruido para diferentes aplicaciones.

2025-09-29T05:59:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Nueva herramienta mide la calidad del audio con análisis de video

AudioVMAF combina métricas de video para mejorar la evaluación de la calidad del audio.

2025-09-29T01:56:50+00:00 ― 7 minilectura

Sonido Avances en la detección de audio falso con RAWM

Un nuevo método mejora la detección de audio falso usando modificación adaptativa de pesos.

2025-09-29T01:08:15+00:00 ― 7 minilectura

Criptografía y seguridad La creciente necesidad de esteganálisis en la seguridad de la información

La esteganálisis ayuda a detectar mensajes ocultos en multimedia, asegurando una comunicación segura.

2025-09-28T23:31:05+00:00 ― 5 minilectura

Procesado de Audio y Voz Separando la identidad del hablante de los datos de voz

Un estudio sobre cómo separar la identidad del hablante de las señales de voz para mejorar el procesamiento.

2025-09-28T19:28:10+00:00 ― 6 minilectura

Multimedia TranSTYLer: Un Salto en la Comunicación Virtual

Transformando gestos para agentes virtuales con significado preservado.

2025-09-28T18:39:35+00:00 ― 7 minilectura

Sonido Avances en la Localización de Fuentes de Sonido Usando Redes Neuronales

Explorando cómo las redes neuronales mejoran la precisión en la localización de fuentes de sonido.

2025-09-28T12:10:55+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz en punjabi con métodos de autoentrenamiento

Los investigadores mejoran el reconocimiento automático del habla para Punjabi usando técnicas innovadoras de autoentrenamiento.

2025-09-28T08:56:35+00:00 ― 7 minilectura

Sonido Avances en el reconocimiento de voz del hablante objetivo

Nuevo modelo mejora el reconocimiento de voz en entornos ruidosos al centrarse en un solo hablante.

2025-09-28T08:08:00+00:00 ― 5 minilectura

Sonido Equilibrando la privacidad y la monitorización de audio inteligente

Nuevos métodos buscan proteger la privacidad del habla en sistemas de monitoreo de audio.

2025-09-28T06:30:50+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en la síntesis de habla expresiva con un nuevo conjunto de datos

Un nuevo conjunto de datos mejora la síntesis de voz al captar la expresión emocional sin depender del texto.

2025-09-27T18:22:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la Clasificación de Tonos Musicales con SDTW

Nuevas estrategias para mejorar la estabilidad del entrenamiento en la clasificación de tonos musicales.

2025-09-27T13:30:35+00:00 ― 7 minilectura

Sonido Avances en la Tecnología de Conversión de Voz

Phoneme Hallucinator transforma la conversión de voz con datos limitados para obtener salidas más claras.

2025-09-27T10:16:15+00:00 ― 5 minilectura

Sonido Avanzando en la Generación de Gestos para Humanos Digitales

Un nuevo método crea gestos realistas a partir de audio de voz cruda.

2025-09-27T08:39:05+00:00 ― 6 minilectura

Aprendizaje automático Nuevo método para analizar la actividad cerebral durante el habla

Los investigadores desarrollan un Alineador Neuronal Latente para interpretar mejor las señales del cerebro durante las tareas de hablar.

2025-09-27T05:24:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en el Reconocimiento de Voz Bilingüe con Unidades de Grafemas

Mejorando sistemas ASR híbridos para habla bilingüe usando unidades de grafemas.

2025-09-27T03:47:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Aprendizaje Conjunto de Habla y Texto

Un nuevo modelo mejora la alineación de voz y texto para un mejor reconocimiento automático.

2025-09-27T02:10:25+00:00 ― 7 minilectura

Sonido Avances en el reconocimiento visual del habla con Lip2Vec

Lip2Vec mejora el reconocimiento visual del habla usando menos datos etiquetados.

2025-09-27T01:21:50+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz

Nuevos métodos mejoran la precisión y la velocidad en los sistemas de reconocimiento de voz.

2025-09-26T11:35:55+00:00 ― 6 minilectura

Aprendizaje automático O-1: Una Nueva Frontera en el Entrenamiento de Reconocimiento de Voz

O-1 mejora el reconocimiento de voz al optimizar métodos de autoentrenamiento.

2025-09-26T09:10:10+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento Automático de Voz con Inyección de Texto

Un nuevo método mejora el rendimiento del ASR a través de la integración de datos de texto.

2025-09-26T07:33:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con inyección de texto

La inyección de texto ayuda a reconocer información personal mientras se mantiene la privacidad.

2025-09-26T06:44:25+00:00 ― 6 minilectura

Sonido Avances en la detección de eventos sonoros usando aprendizaje generativo

Descubre cómo nuevas técnicas están transformando la detección de eventos sonoros para varias aplicaciones.

2025-09-26T05:55:50+00:00 ― 7 minilectura

Procesado de Audio y Voz La importancia del procesamiento de audio no lineal

Explorando métodos no lineales en audio para la producción musical y el análisis del habla.

2025-09-26T03:30:05+00:00 ― 7 minilectura

Sonido Avances en la Extracción de Tono con PitchNet

Un nuevo método para detectar el tono con precisión en música y sonido.

2025-09-26T02:41:30+00:00 ― 7 minilectura

Sonido Avances en el Reconocimiento de Voz con Tecnología mmWave

Radio2Text usa señales mmWave para el reconocimiento de voz en tiempo real en entornos ruidosos.

2025-09-25T22:38:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Evaluando un sistema automático de enmascaramiento de sonido en parques urbanos

Un estudio examina la efectividad de los enmascaradores de sonido automáticos en espacios públicos.

2025-09-25T18:35:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voces con Redes Neurales de Grafos

Las redes neuronales gráficas mejoran la precisión del reconocimiento de voz al analizar las relaciones entre muestras de voz.

2025-09-25T09:41:15+00:00 ― 6 minilectura

Computación y lenguaje Avances en el reconocimiento de emociones en el habla en diferentes idiomas

Un estudio que evalúa el reconocimiento de emociones en modelos de habla en seis idiomas.

2025-09-25T08:04:05+00:00 ― 6 minilectura

Sonido AffectEcho: Conectando emociones en el habla de IA

El modelo AffectEcho mejora la expresión emocional en el habla generada por IA.

2025-09-25T07:15:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la conversión de grafema a fonema con un nuevo método de muestreo

Este estudio mejora los modelos G2P al centrarse en las áreas propensas a errores durante el entrenamiento.

2025-09-25T05:38:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en técnicas de seguimiento de formantes

Descubre métodos que mejoran la precisión en el seguimiento de formantes para el análisis del habla.

2025-09-24T22:21:05+00:00 ― 8 minilectura

Procesado de Audio y Voz Usando el Análisis de Voz para Evaluar la Severidad del Parkinson

Los investigadores desarrollan métodos basados en el habla para evaluar el Parkinson de forma más precisa.

2025-09-24T21:32:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la detección de sonido con técnicas de meta-aprendizaje

Meta-SELD mejora la localización de eventos sonoros en diferentes entornos.

2025-09-24T19:55:20+00:00 ― 6 minilectura

Aprendizaje automático Momentos Audiovisuales en el Tiempo: Un Nuevo Conjunto de Datos para el Reconocimiento de Acciones

AVMIT ofrece a los investigadores información sobre cómo se relacionan el sonido y la visión en el reconocimiento de acciones.

2025-09-24T07:46:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la Predicción de Calidad de Audio con GML

Un nuevo modelo de IA mejora la predicción de las puntuaciones de calidad de audio.

2025-09-24T03:43:40+00:00 ― 7 minilectura

Sonido Generación de Música con IA: Un Estudio sobre Técnicas de Muestreo

Esta investigación examina cómo los métodos de muestreo afectan la calidad de la música generada por IA.

2025-09-24T02:55:05+00:00 ― 7 minilectura

Sonido Avances en la Tecnología de Anti-Spoofing de Audio

Un nuevo método mejora la detección de audio falso en sistemas de reconocimiento de voz.

2025-09-23T23:40:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el seguimiento del ritmo para música clásica

Nuevos métodos mejoran la precisión del seguimiento del ritmo en música clásica compleja.

2025-09-23T14:46:20+00:00 ― 8 minilectura