AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.
― 7 min lire
La science de pointe expliquée simplement
AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.
― 7 min lire
Le projet EMO-SUPERB améliore la reconnaissance des émotions dans la parole grâce à des techniques améliorées et à la collaboration de la communauté.
― 9 min lire
Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.
― 9 min lire
Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.
― 10 min lire
Examiner comment les codecs gardent les émotions dans les données vocales.
― 7 min lire
Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.
― 6 min lire
Le modèle MCMamba améliore la qualité de la parole dans des environnements bruyants en utilisant des infos spatiales et spectraales.
― 5 min lire
Cette étude évalue des méthodes à faible latence pour améliorer la qualité du son dans des conditions bruyantes.
― 8 min lire
Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.
― 6 min lire
ESPnet-Codec améliore l'entraînement et l'évaluation des codecs neuronaux pour l'audio et la parole.
― 9 min lire
Une nouvelle méthode améliore l'efficacité des charges de travail d'attention pour les systèmes IA.
― 8 min lire
VERSA évalue efficacement la qualité de la parole, de l'audio et de la musique.
― 11 min lire