Xie Chen

Nuevos métodos para seleccionar datos de voz minimizan el etiquetado mientras mejoran la precisión del reconocimiento.

2025-09-20T13:53:50+00:00 ― 6 minilectura

ELLA-V mejora la calidad y el control del texto a voz, superando modelos anteriores.

2025-08-30T01:17:40+00:00 ― 6 minilectura

Un nuevo modelo mejora la comprensión del audio espacial por parte de las máquinas.

2025-08-26T15:30:45+00:00 ― 6 minilectura

AniTalker crea animaciones realistas usando retratos y audio, capturando dinámicas faciales matizadas.

2025-08-13T18:14:24+00:00 ― 8 minilectura

GigaSpeech 2 ofrece un montón de datos para lenguas de pocos recursos para mejorar el reconocimiento de voz.

2025-07-29T02:29:15+00:00 ― 6 minilectura

El BPE acústico mejora la inteligibilidad y la calidad del habla en sistemas TTS.

2025-07-22T08:32:35+00:00 ― 7 minilectura

Explorando la importancia de los defectos topológicos en la física y la ciencia de materiales.

2025-07-15T04:02:54+00:00 ― 6 minilectura

Un nuevo método mejora el rendimiento del modelo de habla en varias tareas.

2025-06-21T02:44:25+00:00 ― 7 minilectura

VQTalker crea avatares hablantes realistas en varios idiomas, mejorando las interacciones digitales.

2025-03-09T22:14:42+00:00 ― 8 minilectura