Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Mejorando la tecnología ASR con minimización de entropía generalizada a nivel secuencial

Un nuevo método mejora los sistemas de reconocimiento de voz automático para una mejor precisión y adaptabilidad.

2025-10-29T02:36:00+00:00 ― 7 minilectura

Sonido Avanzando la simulación de sonido con BEDRF

Un nuevo modelo mejora la difracción del sonido en entornos virtuales.

2025-10-29T01:47:25+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Sesgo Contextual

El sesgo contextual mejora los sistemas de reconocimiento de voz, aumentando la precisión en tareas especializadas.

2025-10-29T00:58:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de conversión de emociones en el habla

Un nuevo enfoque para cambiar emociones en el habla en medio de ruido del mundo real.

2025-10-28T23:21:40+00:00 ― 7 minilectura

Sonido Nuevo método para mejorar la detección de la pronunciación del idioma

Este estudio presenta un nuevo sistema para detectar errores de pronunciación en los estudiantes de idiomas.

2025-10-28T21:44:30+00:00 ― 7 minilectura

Sonido Un Nuevo Enfoque para el Reordenamiento de la Música

El sistema Q A usa aprendizaje auto-supervisado para una reordenación innovadora de música.

2025-10-28T20:07:20+00:00 ― 6 minilectura

Sonido Mejorando la síntesis de habla expresiva con TVC-GMM

Un nuevo método mejora la calidad del texto a voz y la expresión emocional.

2025-10-28T18:30:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con técnicas audio-visuales

Los investigadores combinan datos de audio y visuales para mejorar la comprensión del habla en lugares ruidosos.

2025-10-28T17:41:35+00:00 ― 5 minilectura

Procesado de Audio y Voz Control Activo de Ruido: Reducción de Sonido No Deseado

Descubre cómo la tecnología de control de ruido activo está cambiando nuestra experiencia sonora.

2025-10-28T16:53:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento de voz con modelos más pequeños

Están surgiendo técnicas para reducir el tamaño del modelo sin perder rendimiento.

2025-10-28T15:15:50+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en Efectos de Fase Digital

Nuevo modelo imita efectos de fase analógica con técnicas de aprendizaje mejoradas.

2025-10-28T12:50:05+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el reconocimiento de voz multilingüe con DistilXLSR

Un nuevo modelo reduce el tamaño mientras mejora el reconocimiento de voz multilingüe.

2025-10-28T11:12:55+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz para acentos diversos

Un nuevo método mejora la precisión del reconocimiento de voz para acentos africanos.

2025-10-28T09:35:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando las evaluaciones de tecnología de voz a través de informes detallados

Examinando el impacto de evaluaciones detalladas en sistemas de síntesis de voz.

2025-10-28T07:58:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de cancelación de eco

Mejorando la claridad de la voz a través de técnicas efectivas de cancelación de eco y aprendizaje automático.

2025-10-28T05:32:50+00:00 ― 8 minilectura

Procesado de Audio y Voz Seguimiento en Tiempo Real de Voces Cantantes con SingNet

SingNet mejora el seguimiento del ritmo en voces cantadas usando datos del pasado.

2025-10-28T04:44:15+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Reconocimiento de Voz para Múltiples Hablantes

Un nuevo sistema mejora el reconocimiento de voz en entornos con múltiples hablantes.

2025-10-28T00:41:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en tecnología de lectura de labios a voz

LipVoicer genera un habla clara a partir de videos silenciosos usando métodos avanzados de lectura labial.

2025-10-27T21:27:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento del habla disártrica con enfoques innovadores

Nuevos métodos buscan mejorar la comunicación para personas con disartria.

2025-10-27T21:01:09+00:00 ― 7 minilectura

Procesado de Audio y Voz Combinando el procesamiento de voz con el aprendizaje visual

Este estudio examina los beneficios de combinar el procesamiento del habla con datos visuales.

2025-10-27T20:38:25+00:00 ― 7 minilectura

Computación y lenguaje Avances en predicciones con múltiples puntuaciones en procesos gaussianos

Nuevo método mejora predicciones al considerar múltiples puntuaciones de expertos.

2025-10-27T19:49:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Reevaluando la anonimización del hablante y el impacto del vocoder

Una nueva perspectiva sobre la anonimización de voces y el papel crucial de los vocoders.

2025-10-27T18:12:40+00:00 ― 6 minilectura

Computación y lenguaje Evaluando el rendimiento de Whisper en los dialectos árabes

Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.

2025-10-27T13:21:10+00:00 ― 5 minilectura

Computación y lenguaje Video-LLaMA: Un Nuevo Enfoque para Entender Videos

Un programa que combina datos visuales y de audio para mejorar la comprensión de videos.

2025-10-27T11:44:00+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el reconocimiento de actos de habla en bengalí

Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.

2025-10-27T10:55:25+00:00 ― 6 minilectura

Procesado de Audio y Voz El Papel de la Risa en la Interacción con Máquinas

Estudiar la risa puede mejorar cómo las máquinas interactúan con la gente.

2025-10-27T08:29:40+00:00 ― 6 minilectura

Sonido Analizando música con BERT: un nuevo enfoque

La investigación explora el potencial de BERT en el análisis musical a nivel de bares.

2025-10-27T07:41:05+00:00 ― 6 minilectura

Informática y sociedad Aprendizaje de matemáticas entretenido para niños pequeños

Un nuevo sistema mejora el aprendizaje de matemáticas en casa a través de interacciones divertidas.

2025-10-27T07:08:49+00:00 ― 7 minilectura

Computación y lenguaje Adaptación Eficiente del Reconocimiento de Voz Usando Datos de Texto

Un nuevo método mejora los modelos de reconocimiento de voz usando solo datos de texto para la adaptación.

2025-10-27T06:52:30+00:00 ― 7 minilectura

Sonido Avanzando la Armonización de Melodías con Contexto Emocional

Un nuevo modelo mejora la armonización de melodías al considerar factores emocionales.

2025-10-26T21:58:05+00:00 ― 7 minilectura

Aprendizaje automático Creación de Danza Innovadora Usando Palabras Sonoras

Nuevos métodos usan onomatopeyas para inspirar movimientos de baile únicos.

2025-10-26T20:20:55+00:00 ― 6 minilectura

Sonido Avances en Sistemas de Contramedidas de Voz

Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.

2025-10-26T17:55:10+00:00 ― 7 minilectura

Bibliotecas digitales Desafíos de reproducibilidad en las conferencias de Interspeech

Una mirada a los problemas de reproducibilidad en la investigación de procesamiento de voz.

2025-10-26T16:18:00+00:00 ― 8 minilectura

Computación y lenguaje Avances en la identificación de idiomas con el marco LASR

Un nuevo enfoque mejora la identificación del lenguaje hablado usando aprendizaje auto-supervisado y etiquetas.

2025-10-26T08:12:10+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz disártrica en árabe

Un nuevo método mejora el reconocimiento de voz para hablantes árabes con disartria.

2025-10-26T07:23:35+00:00 ― 7 minilectura

Computación y lenguaje Herramienta innovadora de reconocimiento de voz para idiomas de bajos recursos

Allophant mejora el reconocimiento de fonemas para idiomas con datos limitados.

2025-10-26T06:35:00+00:00 ― 6 minilectura

Sonido SANGEET: Un Conjunto de Datos Estructurado para Música Hindustaní

Te presentamos SANGEET, un conjunto de datos detallado sobre la música clásica hindustani.

2025-10-26T04:57:50+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando el tiempo de las palabras en sistemas de reconocimiento de voz

Mejorando cómo los sistemas de reconocimiento de voz estiman el tiempo de las palabras para más precisión.

2025-10-26T01:43:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Modelos Avanzados

Nuevos métodos mejoran el procesamiento del habla en modelos de lenguaje.

2025-10-26T00:54:55+00:00 ― 6 minilectura

Sonido Abordando el desafío de la detección de audio falso

Un nuevo método busca mejorar la detección de audio falso sin perder el conocimiento previo.

2025-10-25T16:00:30+00:00 ― 7 minilectura