De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.
― 5 min lire
La science de pointe expliquée simplement
De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.
― 5 min lire
Une nouvelle méthode améliore l'intégration de la parole avec les modèles de langage.
― 8 min lire
VoxtLM combine la reconnaissance vocale, la synthèse, la génération de texte et la continuité dans un seul modèle.
― 5 min lire
Libriheavy propose 50 000 heures d'anglais parlé pour améliorer la technologie de reconnaissance vocale.
― 6 min lire
Les prompts doux améliorent la technologie de reconnaissance vocale pour de meilleures performances dans des environnements bruyants.
― 6 min lire
Une nouvelle approche de la reconnaissance vocale améliore l'interaction utilisateur avec des instructions flexibles.
― 6 min lire
Explore comment TTT améliore la reconnaissance vocale en s'adaptant aux changements de distribution.
― 8 min lire
Apprends comment la dé-réverbération améliore la reconnaissance vocale dans des environnements bruyants.
― 6 min lire
Un nouveau modèle améliore la compréhension de la parole et des sons en même temps.
― 7 min lire
Améliorer les modèles de parole pour mieux reconnaître et s'adapter à différents accents.
― 6 min lire
Un projet pour améliorer la reconnaissance vocale dans plusieurs langues indiennes.
― 6 min lire
Kallaama crée un jeu de données de discours dans les langues locales pour aider les agriculteurs sénégalais.
― 6 min lire
Les langues autochtones font face à des défis en matière de technologie tout en offrant des perspectives culturelles riches.
― 7 min lire
Une étude sur l'utilisation de l'ARI dans une structure de jour pour personnes âgées.
― 7 min lire
La recherche identifie et classe les dialectes kurdes sorani en utilisant des enregistrements audio extensifs.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance de texte dans plusieurs applications.
― 8 min lire
Un nouveau système améliore les interactions des robots en filtrant les discours qui se chevauchent.
― 7 min lire
De nouvelles méthodes améliorent la reconnaissance vocale dans des environnements bruyants en utilisant des techniques adaptatives.
― 9 min lire
Une nouvelle méthode améliore la traduction de discours en langues mélangées en anglais.
― 6 min lire
GigaSpeech 2 propose un énorme jeu de données pour les langues peu répandues afin d'améliorer la reconnaissance vocale.
― 6 min lire
Un jeu de données unique capture la vie quotidienne des enfants pour améliorer l'apprentissage machine et la compréhension de l'apprentissage humain.
― 10 min lire
Découvrez comment l'IA générative change notre façon de créer du contenu.
― 8 min lire
De nouvelles méthodes améliorent la précision et l'efficacité des systèmes de reconnaissance vocale.
― 8 min lire
Un nouveau modèle améliore la communication pour les personnes handicapées en utilisant la reconnaissance vocale et le code Morse.
― 6 min lire
Un modèle vocal qui transforme l'interaction audio avec la technologie.
― 7 min lire
Un nouveau jeu de données vise à améliorer la capture de la voix avec des capteurs de conduction corporelle.
― 7 min lire
La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.
― 8 min lire
Des chercheurs améliorent le décodage de la parole en utilisant l'EEG pour aider les personnes ayant des troubles de la parole.
― 9 min lire
Cette étude évalue les systèmes de reconnaissance vocale en utilisant différentes langues pour l'histoire orale.
― 7 min lire
OpenOmni crée des outils flexibles pour créer et tester des agents conversationnels.
― 10 min lire
La recherche se concentre sur une meilleure synthèse des conversations parlées dans différentes langues.
― 8 min lire
NEST propose une approche plus rapide et efficace pour les tâches de parole auto-supervisées.
― 7 min lire
La recherche se concentre sur la prédiction des erreurs dans la reconnaissance vocale pour une meilleure précision.
― 7 min lire
La recherche améliore la reconnaissance vocale pour le hindi avec des accents divers.
― 6 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale dans plusieurs langues.
― 7 min lire
Des chercheurs ont créé LibriheavyMix pour améliorer la reconnaissance vocale dans des environnements bruyants.
― 6 min lire
Cette recherche analyse la performance de Mamba dans les tâches de parole, en mettant l'accent sur la reconstruction et la reconnaissance des sons.
― 7 min lire
Des chercheurs ont développé un jeu de données pour améliorer les techniques de reconnaissance et d'analyse de la parole.
― 8 min lire
Efforts pour améliorer la technologie de la parole pour la langue Faetar, qui est sous-resources.
― 6 min lire
Une étude sur l'utilisation des modèles de langue pour corriger les erreurs dans les systèmes de reconnaissance vocale.
― 7 min lire