Últimos artículos para Procesamiento de voz

Procesado de Audio y Voz Avances en el Descubrimiento de Términos Hablados con DUSTED

DUSTED mejora la eficiencia en identificar palabras habladas analizando patrones fonéticos.

2025-06-25T02:17:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Texto a Voz con DualSpeech

El modelo DualSpeech mejora la claridad de TTS y la similitud con el hablante.

2025-06-24T10:54:10+00:00 ― 7 minilectura

Computación y lenguaje Nuevo estándar para el reconocimiento de voz en hindi

La investigación mejora el reconocimiento de voz para el hindi con acentos diversos.

2025-06-24T05:11:42+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en tecnología de audio: Presentando X-Codec

X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.

2025-06-21T15:41:45+00:00 ― 7 minilectura

Sonido Avances en sistemas de reconocimiento de emociones en el habla

Este estudio mejora el SER a través de un mejor procesamiento previo y modelos de atención eficientes.

2025-06-18T12:23:30+00:00 ― 6 minilectura

Computación y lenguaje Avanzando Modelos de Voz con Aprendizaje Visual

La investigación se centra en mejorar el aprendizaje de idiomas a través de modelos de habla visualmente fundamentados.

2025-06-18T03:42:12+00:00 ― 10 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconstrucción de voz para dispositivos de audición

Nuevos métodos mejoran la claridad del sonido en ambientes ruidosos para dispositivos de audio.

2025-06-17T23:26:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando la calidad de voz en ambientes ruidosos

Un nuevo método mejora la claridad del habla en entornos ruidosos.

2025-06-17T00:45:50+00:00 ― 5 minilectura

Procesado de Audio y Voz Nuevo enfoque en el reconocimiento de emociones en el habla

Un nuevo método combina el significado y el sonido para mejorar la detección de emociones en el habla.

2025-06-16T16:40:00+00:00 ― 8 minilectura

Sonido Avances en la diarización de hablantes de audio y video

Una visión general de métodos, desafíos y sistemas de diarización de altavoces audiovisuales.

2025-06-15T21:14:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Evaluando el modelo Mamba en tareas de procesamiento de voz

Esta investigación analiza el rendimiento de Mamba en tareas de habla, enfatizando la reconstrucción y el reconocimiento de sonidos.

2025-06-14T23:22:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la generación de habla basada en texto

SSR-Speech ofrece nuevas soluciones para la generación y edición de voz.

2025-06-14T16:05:00+00:00 ― 5 minilectura

Procesado de Audio y Voz Hitos Acústicos: Un Nuevo Conjunto de Datos para el Procesamiento del Habla

Los investigadores desarrollan un conjunto de datos para mejorar las técnicas de reconocimiento y análisis de voz.

2025-06-13T19:50:25+00:00 ― 7 minilectura

Sonido Entendiendo el reconocimiento de emociones en el habla

Un estudio que revela cómo los modelos de deep learning reconocen emociones en el habla.

2025-06-11T16:01:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando la verificación de hablantes con la técnica IML-KD

Un nuevo método mejora el reconocimiento de voz de máquinas para la verificación de hablantes.

2025-06-11T09:32:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la interacción humano-robot a través del reconocimiento de emociones

El estudio resalta los avances en el reconocimiento de emociones en robots usando Transformadores de Visión.

2025-06-10T02:46:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voz para Escenarios de Múltiples Hablantes

Un nuevo marco simplifica el reconocimiento de voz en entornos ruidosos.

2025-06-07T20:31:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en el procesamiento de voz con consistencia en la reconstrucción de fases

Una nueva función de pérdida mejora la calidad del audio al alinear fase y magnitud.

2025-06-03T12:03:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en códecs neuronales con ESPnet-Codec

ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.

2025-06-03T03:09:30+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando el aprendizaje multi-tarea en modelos de voz

Un nuevo método mejora el procesamiento de voz y audio en varias tareas.

2025-06-02T10:57:50+00:00 ― 6 minilectura

Sonido Integrando datos audio-visuales para el procesamiento de voz

Este estudio analiza cómo el audio, el video y el texto funcionan juntos en el reconocimiento de voz.

2025-05-30T15:13:22+00:00 ― 8 minilectura

Sonido Avances en la tecnología de reconocimiento de emociones en altavoces

Explorando nuevos métodos para reconocer emociones en el habla usando modelos avanzados.

2025-05-24T20:14:18+00:00 ― 9 minilectura

Computación y lenguaje Análisis Topológico de Datos en Procesamiento de Lenguaje Natural

Descubre cómo TDA mejora la comprensión en el análisis del lenguaje.

2025-05-22T13:35:24+00:00 ― 7 minilectura

Procesado de Audio y Voz Identificando la fuente del discurso falso

Un nuevo método busca detectar el origen de las voces sintéticas.

2025-05-03T14:39:08+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la separación de voz con Codecformer-EL

Nuevos métodos mejoran la separación de voces usando códecs de audio neuronales para una comunicación más clara.

2025-04-26T00:20:40+00:00 ― 10 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz

Nuevos métodos mejoran el reconocimiento de voz sin perder el conocimiento anterior.

2025-04-21T11:17:42+00:00 ― 6 minilectura

Sonido Avances en el Reconocimiento Automático de Voz

Nuevos métodos mejoran cómo las máquinas reconocen el lenguaje hablado.

2025-04-20T10:37:12+00:00 ― 9 minilectura

Sonido El Futuro del Clonado de Voz: Una Nueva Era

La tecnología de clonación de voz está avanzando, creando un habla realista que imita la conversación humana.

2025-04-11T04:32:42+00:00 ― 7 minilectura

Procesado de Audio y Voz Preservando el énfasis de las sílabas en ambientes ruidosos

La investigación explora cómo los modelos de mejora del habla mantienen el estrés silábico en medio del ruido.

2025-03-07T10:31:48+00:00 ― 8 minilectura

Sonido Mejorando la extracción del hablante objetivo con nuevos datos

Los investigadores mejoran el procesamiento de voz usando Libri2Vox y técnicas de datos sintéticos.

2025-02-23T07:21:54+00:00 ― 7 minilectura

Sonido Dando vida al doblaje: Mejorando la sincronía labial

Un nuevo método mejora la sincronización de labios en videos doblados para una experiencia de visualización más natural.

2025-02-03T03:44:06+00:00 ― 8 minilectura