BASS améliore le résumé des longs audios en traitant par blocs.
― 6 min lire
La science de pointe expliquée simplement
BASS améliore le résumé des longs audios en traitant par blocs.
― 6 min lire
Une nouvelle méthode forme des systèmes de légendes audio en utilisant uniquement des descriptions textuelles.
― 8 min lire
Un nouveau cadre améliore l'apprentissage à partir d'étiquettes de données incomplètes.
― 7 min lire
De nouvelles stratégies améliorent l'apprentissage avec des étiquettes faibles en sélectionnant des exemples négatifs pertinents.
― 8 min lire
PAM propose une nouvelle façon de mesurer la qualité audio sans avoir besoin d'enregistrements de référence.
― 8 min lire
De nouvelles méthodes améliorent la compréhension des émotions humaines dans la parole par les machines.
― 5 min lire
Cette étude évalue les compétences en raisonnement des modèles audio-langage avec une nouvelle tâche.
― 9 min lire
Cette étude examine comment différentes méthodes de résumé affectent la qualité et le contenu.
― 7 min lire
Un nouveau cadre améliore la précision de la confirmation de l'identité vocale.
― 7 min lire