Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.
― 9 min lire
La science de pointe expliquée simplement
Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.
― 9 min lire
Examiner comment les codecs gardent les émotions dans les données vocales.
― 7 min lire
Un nouveau jeu de données met en lumière les biais dans les modèles de parole en fonction du genre et de l'âge.
― 10 min lire
Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.
― 6 min lire
Le modèle MCMamba améliore la qualité de la parole dans des environnements bruyants en utilisant des infos spatiales et spectraales.
― 5 min lire
Cette étude améliore les systèmes de reconnaissance des émotions pour les langues moins courantes en utilisant des données à forte ressource.
― 9 min lire
Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.
― 6 min lire
Créer un modèle d'IA pour des conversations naturelles en mandarin taïwanais.
― 6 min lire