Une nouvelle méthode combine l'apprentissage traditionnel et profond pour une imagerie sonore efficace.
― 7 min lire
La science de pointe expliquée simplement
Une nouvelle méthode combine l'apprentissage traditionnel et profond pour une imagerie sonore efficace.
― 7 min lire
De nouvelles méthodes améliorent le réalisme dans les technologies audio en utilisant des techniques informées par la physique.
― 8 min lire
Un nouveau modèle améliore l'apprentissage des mots en utilisant de l'audio et des images.
― 7 min lire
Enquête sur comment la technologie vocale peut empêcher la participation en double des patients dans les essais.
― 8 min lire
Un nouveau jeu de données aide à identifier les signes de dépression et d'anxiété grâce à l'analyse de la parole.
― 8 min lire
Une nouvelle méthode reconstruit le son à partir des signaux cérébraux, révélant des infos sur le traitement auditif.
― 6 min lire
Un guide pour utiliser des modèles d'IA pour la musique sur la plateforme Bela.
― 7 min lire
Une nouvelle méthode évalue les systèmes de reconnaissance automatique de la parole sans avoir besoin de textes de référence.
― 6 min lire
NoRefER propose une nouvelle méthode pour évaluer les résultats de reconnaissance vocale sans avoir besoin de transcriptions.
― 8 min lire
Cet article parle d'une méthode pour améliorer les sous-titres vidéo en intégrant l'audio.
― 7 min lire
Un nouveau modèle améliore la conversion vocale en simplifiant les techniques de séparation de la parole.
― 8 min lire
La recherche vise à combiner des données audio et symboliques pour l'analyse de similarité musicale.
― 9 min lire
De nouvelles méthodes améliorent la segmentation de la parole dans les conversations multilingues.
― 8 min lire
NoisyILRMA améliore l'extraction du son des bruits de fond pour une expérience audio plus claire.
― 5 min lire
Cet article parle du rôle de l'apprentissage auto-supervisé dans la technologie musicale.
― 7 min lire
Un nouveau cadre améliore la reconnaissance vocale pour les langues à faibles ressources et la scalabilité multilingue.
― 7 min lire
Les systèmes de reconnaissance vocale personnalisés améliorent grave la communication pour les personnes DHH.
― 8 min lire
De nouvelles méthodes utilisent des résumés de conversation pour améliorer la reconnaissance des locuteurs.
― 7 min lire
Améliorer les systèmes de feedback pour les apprenants en anglais en s'attaquant au problème du démarrage à froid.
― 8 min lire
Recherche des méthodes pour localiser les sources de bruit des éoliennes pour réduire le bruit.
― 5 min lire
Présentation d'un nouveau modèle pour identifier les techniques de chant dans les pistes audio.
― 7 min lire
Un nouveau modèle améliore l'extraction de la parole en utilisant des infos audio et visuelles.
― 7 min lire
Wespeaker simplifie la reconnaissance de locuteurs avec des outils faciles à utiliser et des modèles préentraînés.
― 7 min lire
Une nouvelle méthode transforme les signaux mono en expériences stéréo captivantes.
― 7 min lire
Une étude sur l'amélioration de la détection des émotions dans la parole pour des groupes divers.
― 7 min lire
Cet article parle d'améliorer la reconnaissance vocale en utilisant des méthodes d'ensemble basées sur la confiance.
― 6 min lire
Une étude utilise un dispositif multi-données pour suivre les habitudes de sommeil des bébés plus précisément.
― 6 min lire
3D-Speaker propose une grosse collection d'enregistrements audio pour une analyse de la parole avancée.
― 6 min lire
GenerTTS améliore la technologie de synthèse vocale pour des applications multilingues.
― 6 min lire
Un nouveau système améliore la détection des audios manipulés grâce à des techniques innovantes.
― 7 min lire
Améliorer la reconnaissance vocale pour des voix qui se chevauchent rend l'utilisation plus facile dans plein de situations.
― 6 min lire
De nouvelles méthodes améliorent la séparation des voix dans des environnements audio mélangés.
― 6 min lire
Découvrez comment de nouvelles techniques améliorent la clarté de la parole dans des environnements bruyants.
― 6 min lire
Une nouvelle méthode pour rendre la synthèse vocale plus personnelle en utilisant moins de données vocales.
― 6 min lire
De nouvelles méthodes améliorent la localisation du son grâce à des réseaux de micros distribués.
― 6 min lire
Cette étude examine des méthodes pour protéger la vie privée tout en analysant des conversations parlées.
― 8 min lire
Des attaques récentes par backdoor révèlent des risques dans les technologies d'identification vocale.
― 9 min lire
Un nouveau modèle améliore l'extraction de la parole des bruits de fond grâce à l'apprentissage profond.
― 6 min lire
GOLF propose une nouvelle façon de créer un chant qui sonne humain en utilisant moins de ressources.
― 8 min lire
Recherche sur la prédiction de l'âge et du genre à partir de données vocales en utilisant des modèles innovants.
― 6 min lire