De nouvelles méthodes utilisant la parole montrent des promesses pour identifier les schémas de respiration et les problèmes de santé.
― 6 min lire
La science de pointe expliquée simplement
De nouvelles méthodes utilisant la parole montrent des promesses pour identifier les schémas de respiration et les problèmes de santé.
― 6 min lire
MIDI-Draw permet à tout le monde de créer de la musique en dessinant des mélodies de manière intuitive.
― 6 min lire
De nouvelles techniques inspirées du traitement d'images améliorent l'évaluation de la qualité audio.
― 8 min lire
De nouvelles méthodes améliorent la compréhension de la parole par les machines en utilisant des indices audio et visuels.
― 7 min lire
Nouveau modèle améliore la reconnaissance des mots-clés dans des environnements acoustiques difficiles.
― 8 min lire
Une nouvelle méthode améliore les modèles de parole en transférant des connaissances des modèles de texte.
― 7 min lire
Une collection de sons respiratoires aide à identifier les cas de COVID-19.
― 5 min lire
Un nouveau modèle améliore la vérification des locuteurs grâce à des techniques efficaces.
― 7 min lire
Un aperçu détaillé des techniques de reconnaissance vocale développées pour la compétition de 2022.
― 6 min lire
Une nouvelle méthode forme l'IA à mieux reconnaître la parole et les émotions dans des environnements bruyants.
― 7 min lire
De nouvelles méthodes visent à mieux comprendre la dynamique familiale et la santé mentale des enfants.
― 8 min lire
De nouvelles méthodes d'apprentissage profond améliorent les prédictions des mouvements du diaphragme des locuteurs.
― 6 min lire
Explorer comment ciwGAN peut apprendre et représenter des caractéristiques phonologiques comme la nasalité.
― 6 min lire
Un nouveau modèle améliore l'efficacité et la précision de la reconnaissance vocale.
― 6 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des infos contextuelles.
― 7 min lire
Les chercheurs utilisent des GANs pour générer de la parole bruitée à partir d'audio propre, améliorant les modèles de parole.
― 7 min lire
Le corpus JNV capture des sons émotionnels variés en japonais, enrichissant les collections existantes.
― 7 min lire
De nouvelles méthodes améliorent la génération de rires pour des interactions réalistes entre humains et ordinateurs.
― 6 min lire
Un coup d'œil sur comment repérer les faux audios dans notre monde technologique d'aujourd'hui.
― 6 min lire
Une nouvelle méthode améliore la détection des émotions dans la parole grâce à des techniques avancées de transformateurs.
― 6 min lire
Utiliser des modèles de texte pour améliorer la génération de discours pour une meilleure compréhension.
― 11 min lire
C-MCR simplifie l'apprentissage multi-modal en reliant efficacement les connaissances existantes.
― 8 min lire
FluentSpeech propose une solution automatique pour rendre l'édition de la parole plus fluide.
― 8 min lire
MDA améliore la reconnaissance vocale en optimisant les modèles pour des domaines de données spécifiques.
― 7 min lire
Des recherches montrent que les signaux cérébraux peuvent aider à prédire les mouvements de la langue pendant la parole.
― 8 min lire
Le système U-DiT TTS améliore la génération de la parole naturelle grâce à une architecture innovante.
― 6 min lire
Une nouvelle méthode vise à améliorer les systèmes de reconnaissance vocale pour les locuteurs dysarthriques.
― 7 min lire
Améliorer l'identification des locuteurs en combinant le son et les mots prononcés dans l'audio.
― 7 min lire
Les agents virtuels apprennent à imiter les gestes humains pour une meilleure interaction.
― 8 min lire
Une nouvelle méthode pour créer des synthétiseurs qui profite aux musiciens.
― 7 min lire
Un nouveau cadre améliore la détection du locuteur actif en utilisant des indices audio et visuels.
― 7 min lire
Un aperçu des défis et des défenses dans les systèmes de vérification automatique des locuteurs.
― 6 min lire
Les réseaux optiques permettent un transfert de données rapide, façonnant l'avenir de la technologie de communication.
― 6 min lire
Une nouvelle méthode améliore les modèles audio généraux pour une reconnaissance vocale efficace.
― 9 min lire
Nouveau modèle améliore la compréhension émotionnelle dans les dialogues.
― 8 min lire
Un modèle combine langue parlée et texte pour améliorer la précision de la traduction.
― 7 min lire
La recherche utilise des modèles de parole humaine pour analyser efficacement les vocalises des Marmosets.
― 7 min lire
De nouvelles méthodes améliorent la détection précoce des maladies respiratoires en utilisant des données sonores.
― 7 min lire
Cette étude examine comment le rire transmet des émotions à travers l'analyse sonore.
― 5 min lire
Un nouveau modèle apporte des fonctionnalités vocales aux appareils sans internet.
― 6 min lire