Yi-Cheng Lin

Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.

2025-08-22T23:15:10+00:00 ― 9 min lire

Examiner comment les codecs gardent les émotions dans les données vocales.

2025-07-12T06:26:10+00:00 ― 7 min lire

Un nouveau jeu de données met en lumière les biais dans les modèles de parole en fonction du genre et de l'âge.

2025-06-30T19:07:50+00:00 ― 10 min lire

Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.

2025-06-16T15:02:50+00:00 ― 6 min lire

Le modèle MCMamba améliore la qualité de la parole dans des environnements bruyants en utilisant des infos spatiales et spectraales.

2025-06-09T21:54:45+00:00 ― 5 min lire

Cette étude améliore les systèmes de reconnaissance des émotions pour les langues moins courantes en utilisant des données à forte ressource.

2025-06-08T07:51:20+00:00 ― 9 min lire

Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.

2025-06-05T06:58:50+00:00 ― 6 min lire

Créer un modèle d'IA pour des conversations naturelles en mandarin taïwanais.

2025-05-20T03:51:26+00:00 ― 6 min lire