La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.
― 6 minilectura
Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.
― 6 minilectura
Coco-Nut ofrece muestras de voz japonesa diversas para aplicaciones avanzadas de texto a voz.
― 12 minilectura
Un estudio sobre cómo mejorar los sistemas de TTS con muestras de voz diversas.
― 5 minilectura
RALL-E mejora la síntesis de texto a voz para que suene más clara y natural.
― 6 minilectura
Introduciendo la conversión de voz espacial para mejorar el realismo y la inmersión del audio.
― 7 minilectura
Este estudio examina cómo varían las preferencias de voz entre diferentes oyentes.
― 5 minilectura
Los investigadores exploran enfoques sin texto para entender mejor el lenguaje hablado.
― 8 minilectura
J-CHAT ofrece un gran conjunto de datos de código abierto para mejorar los sistemas de diálogo hablado.
― 6 minilectura
Los investigadores desarrollan SaSLaW para mejorar la adaptación del habla de las máquinas en diferentes entornos.
― 6 minilectura
BigCodec mejora la calidad de sonido en la transmisión de audio a baja tasa de bits.
― 6 minilectura
Un nuevo método mejora el canto en conjunto sintetizado al modelar las interacciones entre los cantantes.
― 6 minilectura