Shinnosuke Takamichi

La sélection de sous-ensembles améliore les modèles de synthèse vocale en se concentrant sur des données variées.

2025-09-12T08:19:30+00:00 ― 7 min lire

Cette étude examine si les symboles de la parole appris imitent les modèles de fréquence des mots.

2025-09-09T04:12:40+00:00 ― 7 min lire

Coco-Nut propose des échantillons de voix japonaise variés pour des applis avancées de synthèse vocale.

2025-09-05T11:57:05+00:00 ― 13 min lire

Une étude sur l'amélioration des systèmes TTS avec des échantillons de voix divers.

2025-08-16T12:35:45+00:00 ― 6 min lire

RALL-E améliore la synthèse texte-parole pour un discours plus clair et naturel.

2025-08-13T01:11:40+00:00 ― 6 min lire

Introduction de la conversion de voix spatiale pour améliorer le réalisme audio et l'immersion.

2025-07-27T01:54:15+00:00 ― 7 min lire

Cette étude examine comment les préférences vocales varient chez différents auditeurs.

2025-07-21T00:57:50+00:00 ― 6 min lire

Des chercheurs explorent des approches sans texte pour mieux comprendre le langage parlé.

2025-07-13T18:11:30+00:00 ― 8 min lire

J-CHAT propose un grand jeu de données open-source pour améliorer les systèmes de dialogue parlé.

2025-07-12T12:06:15+00:00 ― 7 min lire

Des chercheurs ont développé SaSLaW pour améliorer l'adaptation de la parole des machines dans divers environnements.

2025-07-01T16:11:00+00:00 ― 6 min lire

BigCodec améliore la qualité sonore dans les transmissions audio à faible débit.

2025-06-15T19:36:50+00:00 ― 6 min lire

Une nouvelle méthode améliore le chant d'ensemble synthétisé en modélisant les interactions entre les chanteurs.

2025-06-09T11:23:10+00:00 ― 6 min lire