Une nouvelle méthode améliore la séparation des voix en utilisant plusieurs micros sans données étiquetées.
― 5 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la séparation des voix en utilisant plusieurs micros sans données étiquetées.
― 5 min lire
Une étude améliore les modèles de vérification des speakers pour mieux protéger l'identité.
― 8 min lire
De nouveaux modèles améliorent la façon dont les machines réagissent aux questions basées sur l’audio.
― 6 min lire
De nouvelles méthodes améliorent la synthèse vocale pour l'allemand suisse à partir de textes en allemand standard.
― 6 min lire
Découvrez comment SVVAD améliore la détection de l'activité vocale pour une meilleure vérification des locuteurs.
― 6 min lire
Une nouvelle méthode améliore les retours sur la prononciation pour les apprenants de langues.
― 7 min lire
Un nouveau cadre évalue comment les modèles de parole s'adaptent à des tâches spécifiques.
― 8 min lire
Les modèles HuBERT améliorent les tâches de parole en utilisant plusieurs résolutions pour de meilleures performances.
― 7 min lire
De nouvelles techniques améliorent la précision pour reconnaître les intervenants et détecter les imposteurs.
― 6 min lire
Une nouvelle approche améliore la réponse de phase dans les effets audio virtuels en utilisant l'apprentissage profond.
― 6 min lire
SlothSpeech dévoile des failles dans les systèmes de reconnaissance vocale, les ralentissant considérablement.
― 6 min lire
UnDiff améliore la qualité audio grâce à des techniques innovantes de restauration de la parole.
― 7 min lire
De nouvelles méthodes en apprentissage automatique améliorent les capacités de détection du bégaiement.
― 6 min lire
EmoMix permet de créer des discours exprimant des émotions mélangées avec une intensité précise.
― 6 min lire
Découvrez la méthode innovante du Multi-Window Masked Autoencoder pour améliorer le traitement audio.
― 6 min lire
Une nouvelle méthode fusionne des données audio et visuelles pour réparer la parole manquante.
― 7 min lire
Explorer des méthodes pour détecter les discours de haine dans les diffusions audio de langues sous-représentées.
― 6 min lire
Une nouvelle méthode restaure les hautes fréquences perdues dans les enregistrements historiques.
― 8 min lire
Un nouveau modèle améliore la diffraction du son dans les environnements virtuels.
― 8 min lire
Le biais contextuel améliore les systèmes de reconnaissance vocale, augmentant la précision dans les tâches spécialisées.
― 7 min lire
Cette étude présente un nouveau système pour détecter les erreurs de prononciation chez les apprenants de langues.
― 7 min lire
Le système Q A utilise l'apprentissage auto-supervisé pour réorganiser la musique de manière innovante.
― 7 min lire
Une nouvelle méthode améliore la qualité du texte en parole et l'expression émotionnelle.
― 6 min lire
Des techniques pour réduire la taille des modèles tout en gardant la performance émergent.
― 5 min lire
Nouveau modèle imite les effets de phasage analogique avec des techniques d'apprentissage améliorées.
― 6 min lire
Un nouveau modèle réduit la taille tout en améliorant la reconnaissance vocale multilingue.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale pour les accents africains.
― 6 min lire
Un nouveau système améliore la reconnaissance vocale dans des situations avec plusieurs intervenants.
― 7 min lire
LipVoicer génère une voix claire à partir de vidéos silencieuses en utilisant des méthodes de lecture labiale avancées.
― 7 min lire
De nouvelles méthodes visent à améliorer la communication des personnes atteintes de dysarthrie.
― 8 min lire
Une nouvelle méthode améliore les prévisions en tenant compte des scores de plusieurs experts.
― 7 min lire
Un aperçu de comment Whisper gère les différents dialectes et accents arabes.
― 6 min lire
Un programme qui combine des données visuelles et audio pour améliorer la compréhension des vidéos.
― 6 min lire
Une nouvelle méthode améliore la reconnaissance des actes de parole en bengali grâce à l'analyse audio et textuelle.
― 6 min lire
La recherche explore le potentiel de BERT dans l'analyse musicale au niveau des bars.
― 6 min lire
Un nouveau système améliore l'apprentissage des maths à la maison grâce à des interactions amusantes.
― 7 min lire
Une nouvelle méthode améliore les modèles de reconnaissance vocale en utilisant seulement des données textuelles pour l'adaptation.
― 7 min lire
Un nouveau modèle améliore l'harmonisation des mélodies en tenant compte des facteurs émotionnels.
― 8 min lire
De nouvelles méthodes utilisent l'onomatopée pour inspirer des mouvements de danse uniques.
― 6 min lire
Des chercheurs améliorent la détection de la parole générée par machine en ajustant les informations de phase.
― 7 min lire