Les agents virtuels apprennent à imiter les gestes humains pour une meilleure interaction.
― 8 min lire
La science de pointe expliquée simplement
Les agents virtuels apprennent à imiter les gestes humains pour une meilleure interaction.
― 8 min lire
Une nouvelle méthode pour créer des synthétiseurs qui profite aux musiciens.
― 7 min lire
Un nouveau cadre améliore la détection du locuteur actif en utilisant des indices audio et visuels.
― 7 min lire
Un aperçu des défis et des défenses dans les systèmes de vérification automatique des locuteurs.
― 6 min lire
Les réseaux optiques permettent un transfert de données rapide, façonnant l'avenir de la technologie de communication.
― 6 min lire
Une nouvelle méthode améliore les modèles audio généraux pour une reconnaissance vocale efficace.
― 9 min lire
Nouveau modèle améliore la compréhension émotionnelle dans les dialogues.
― 8 min lire
Un modèle combine langue parlée et texte pour améliorer la précision de la traduction.
― 7 min lire
La recherche utilise des modèles de parole humaine pour analyser efficacement les vocalises des Marmosets.
― 7 min lire
De nouvelles méthodes améliorent la détection précoce des maladies respiratoires en utilisant des données sonores.
― 7 min lire
Cette étude examine comment le rire transmet des émotions à travers l'analyse sonore.
― 5 min lire
Un nouveau modèle apporte des fonctionnalités vocales aux appareils sans internet.
― 6 min lire
Le nouveau modèle ZET-Speech améliore la synthèse vocale émotionnelle pour des intervenants variés.
― 6 min lire
Une étude montre que de nouvelles techniques de mixage améliorent la précision de la transcription musicale.
― 5 min lire
Une nouvelle méthode améliore les réponses des machines grâce à une meilleure compréhension émotionnelle.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale automatique pour les réunions.
― 7 min lire
CALLS a pour but d'améliorer la capacité des assistants vocaux à gérer les interactions avec les clients.
― 6 min lire
De nouvelles méthodes améliorent la restauration audio et la qualité de production.
― 6 min lire
PLCMOS propose une nouvelle façon d'évaluer la qualité de la parole sans auditeurs humains.
― 7 min lire
LoopBoxes aide les enfants à créer de la musique facilement et en collaboratif.
― 7 min lire
Une nouvelle méthode pour créer des sons d'impact réalistes grâce aux réseaux de neurones.
― 6 min lire
Une nouvelle technique améliore les systèmes ASR pour mieux reconnaître les accents non natifs.
― 8 min lire
De nouvelles méthodes exploitent l'identité du locuteur pour améliorer la performance de la reconnaissance vocale.
― 6 min lire
Une nouvelle méthode combine la reconnaissance vocale et l'identification des locuteurs pour les discours qui se chevauchent.
― 7 min lire
Une nouvelle méthode améliore la qualité et l'efficacité de la traduction en temps réel.
― 5 min lire
Une nouvelle méthode pour estimer les réponses des salles dans des environnements sonores complexes.
― 9 min lire
Une nouvelle méthode de conversion vocale améliore la clarté et l'adaptation.
― 7 min lire
MeLoDy génère rapidement de la musique de haute qualité à partir de textes.
― 7 min lire
De nouvelles méthodes émergent pour protéger la reconnaissance vocale contre les attaques adverses.
― 7 min lire
Une nouvelle technique vérifie l'exposition aux données d'entraînement dans les modèles de diffusion.
― 6 min lire
Un nouveau modèle améliore l'isolation vocale dans les environnements bruyants.
― 6 min lire
Cet article parle de comment recréer le son des bandes magnétiques en utilisant la technologie numérique.
― 8 min lire
Une nouvelle méthode améliore la vérification des locuteurs en combinant la distillation de connaissances et le fine-tuning.
― 8 min lire
DeCoR aide les machines à apprendre de nouveaux sons sans oublier les anciens.
― 7 min lire
Les transformateurs audio en streaming améliorent la vitesse et l'efficacité des systèmes de tagging audio.
― 8 min lire
De nouvelles techniques améliorent la précision et la rapidité de la conversion de la parole en texte.
― 7 min lire
Cette recherche propose des évaluations améliorées pour une communication plus claire chez les personnes atteintes de dysarthrie.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance vocale pour les noms qui se ressemblent.
― 7 min lire
Une nouvelle méthode améliore le naturel et la variété des sorties de synthèse vocale.
― 7 min lire
L'adaptateur Treff améliore la classification audio avec des données étiquetées limitées.
― 6 min lire