Shinnosuke Takamichi

La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.

2025-09-12T08:19:30+00:00 ― 6 minilectura

Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.

2025-09-09T04:12:40+00:00 ― 6 minilectura

Coco-Nut ofrece muestras de voz japonesa diversas para aplicaciones avanzadas de texto a voz.

2025-09-05T11:57:05+00:00 ― 12 minilectura

Un estudio sobre cómo mejorar los sistemas de TTS con muestras de voz diversas.

2025-08-16T12:35:45+00:00 ― 5 minilectura

RALL-E mejora la síntesis de texto a voz para que suene más clara y natural.

2025-08-13T01:11:40+00:00 ― 6 minilectura

Introduciendo la conversión de voz espacial para mejorar el realismo y la inmersión del audio.

2025-07-27T01:54:15+00:00 ― 7 minilectura

Este estudio examina cómo varían las preferencias de voz entre diferentes oyentes.

2025-07-21T00:57:50+00:00 ― 5 minilectura

Los investigadores exploran enfoques sin texto para entender mejor el lenguaje hablado.

2025-07-13T18:11:30+00:00 ― 8 minilectura

J-CHAT ofrece un gran conjunto de datos de código abierto para mejorar los sistemas de diálogo hablado.

2025-07-12T12:06:15+00:00 ― 6 minilectura

Los investigadores desarrollan SaSLaW para mejorar la adaptación del habla de las máquinas en diferentes entornos.

2025-07-01T16:11:00+00:00 ― 6 minilectura

BigCodec mejora la calidad de sonido en la transmisión de audio a baja tasa de bits.

2025-06-15T19:36:50+00:00 ― 6 minilectura

Un nuevo método mejora el canto en conjunto sintetizado al modelar las interacciones entre los cantantes.

2025-06-09T11:23:10+00:00 ― 6 minilectura