Une nouvelle méthode améliore la compréhension des ordres parlés par les ordinateurs avec moins d'exemples.
― 6 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la compréhension des ordres parlés par les ordinateurs avec moins d'exemples.
― 6 min lire
Améliorer l'identification des locuteurs en combinant le son et les mots prononcés dans l'audio.
― 7 min lire
Les agents virtuels apprennent à imiter les gestes humains pour une meilleure interaction.
― 8 min lire
Une nouvelle méthode pour créer des synthétiseurs qui profite aux musiciens.
― 7 min lire
Un nouveau cadre améliore la détection du locuteur actif en utilisant des indices audio et visuels.
― 7 min lire
Un aperçu des défis et des défenses dans les systèmes de vérification automatique des locuteurs.
― 6 min lire
Les réseaux optiques permettent un transfert de données rapide, façonnant l'avenir de la technologie de communication.
― 6 min lire
Une nouvelle méthode améliore les modèles audio généraux pour une reconnaissance vocale efficace.
― 9 min lire
Nouveau modèle améliore la compréhension émotionnelle dans les dialogues.
― 8 min lire
Un modèle combine langue parlée et texte pour améliorer la précision de la traduction.
― 7 min lire
La recherche utilise des modèles de parole humaine pour analyser efficacement les vocalises des Marmosets.
― 7 min lire
De nouvelles méthodes améliorent la détection précoce des maladies respiratoires en utilisant des données sonores.
― 7 min lire
Cette étude examine comment le rire transmet des émotions à travers l'analyse sonore.
― 5 min lire
Un nouveau modèle apporte des fonctionnalités vocales aux appareils sans internet.
― 6 min lire
Cette recherche traite de l'oubli en IA à travers l'apprentissage continu dans la compréhension du langage parlé.
― 10 min lire
Le nouveau modèle ZET-Speech améliore la synthèse vocale émotionnelle pour des intervenants variés.
― 6 min lire
Une étude montre que de nouvelles techniques de mixage améliorent la précision de la transcription musicale.
― 5 min lire
Une nouvelle méthode améliore les réponses des machines grâce à une meilleure compréhension émotionnelle.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale automatique pour les réunions.
― 7 min lire
CALLS a pour but d'améliorer la capacité des assistants vocaux à gérer les interactions avec les clients.
― 6 min lire
De nouvelles méthodes améliorent la restauration audio et la qualité de production.
― 6 min lire
La recherche améliore les techniques de quantification pour rendre les modèles de reconnaissance vocale plus efficaces.
― 10 min lire
PLCMOS propose une nouvelle façon d'évaluer la qualité de la parole sans auditeurs humains.
― 7 min lire
LoopBoxes aide les enfants à créer de la musique facilement et en collaboratif.
― 7 min lire
Une nouvelle méthode pour créer des sons d'impact réalistes grâce aux réseaux de neurones.
― 6 min lire
Une nouvelle technique améliore les systèmes ASR pour mieux reconnaître les accents non natifs.
― 8 min lire
De nouvelles méthodes exploitent l'identité du locuteur pour améliorer la performance de la reconnaissance vocale.
― 6 min lire
Une nouvelle méthode combine la reconnaissance vocale et l'identification des locuteurs pour les discours qui se chevauchent.
― 7 min lire
Une nouvelle méthode améliore la qualité et l'efficacité de la traduction en temps réel.
― 5 min lire
Une nouvelle approche améliore l'apprentissage machine avec moins d'exemples et des données multimodales.
― 7 min lire
Une nouvelle méthode pour estimer les réponses des salles dans des environnements sonores complexes.
― 9 min lire
Une nouvelle méthode de conversion vocale améliore la clarté et l'adaptation.
― 7 min lire
Créer des systèmes TTS pour des langues turciques moins connues en utilisant des données kazakhes.
― 6 min lire
MeLoDy génère rapidement de la musique de haute qualité à partir de textes.
― 7 min lire
De nouvelles méthodes émergent pour protéger la reconnaissance vocale contre les attaques adverses.
― 7 min lire
AudioDec propose de l'audio en temps réel de haute qualité avec peu de consommation de données.
― 6 min lire
Une nouvelle technique vérifie l'exposition aux données d'entraînement dans les modèles de diffusion.
― 6 min lire
Un nouveau modèle améliore l'isolation vocale dans les environnements bruyants.
― 6 min lire
Cet article parle de comment recréer le son des bandes magnétiques en utilisant la technologie numérique.
― 8 min lire
Un nouveau cadre améliore la qualité de génération de voix dans la synthèse vocale.
― 6 min lire