De nouvelles méthodes améliorent la reconnaissance vocale pour les langues sous-représentées en utilisant des données de langues similaires.
― 7 min lire
La science de pointe expliquée simplement
De nouvelles méthodes améliorent la reconnaissance vocale pour les langues sous-représentées en utilisant des données de langues similaires.
― 7 min lire
Cette étude aborde les défis de la capture de termes médicaux précis à partir d'audio bruyant.
― 10 min lire
Une nouvelle méthode intègre des infos acoustiques dans les modèles de langage pour améliorer la reconnaissance vocale.
― 11 min lire
Les LLM améliorent la précision des transcriptions médicales, ce qui est super pour le soin des patients.
― 8 min lire
Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.
― 9 min lire
Un aperçu de la reconnaissance automatique de la parole (ASR) et de ses avancées dans les applications modernes.
― 5 min lire
L'IA améliore les implants cochléaires pour mieux entendre et communiquer dans des environnements difficiles.
― 8 min lire
Une nouvelle méthode améliore l'évaluation de la parole en utilisant des enregistrements entiers.
― 10 min lire
Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.
― 10 min lire
Une nouvelle méthode crée directement des sous-titres, améliorant l'accessibilité pour des publics variés.
― 10 min lire
Cette étude évalue la performance des systèmes de reconnaissance vocale avec des personnes qui bégaient.
― 11 min lire
Un clip audio universel peut couper des modèles ASR avancés comme Whisper.
― 8 min lire
Une reconnaissance vocale améliorée pour les salles de classe grâce à des techniques de formation avancées améliore l'apprentissage.
― 9 min lire
Le nouveau modèle VPIDM améliore la clarté de la parole dans des environnements bruyants.
― 8 min lire
Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.
― 9 min lire
mHuBERT-147 traite la parole dans plusieurs langues de manière efficace.
― 5 min lire
Améliorer la précision dans la transcription des présentations scientifiques grâce à l'intégration de la parole et de la vision.
― 11 min lire
Une étude sur la traduction de l'anglais nigérian pour une meilleure accessibilité dans les films de Nollywood.
― 7 min lire
Nouveau modèle améliore la traduction de la parole en texte en utilisant des grands modèles de langage.
― 8 min lire
Améliorer la technologie d'anonymisation des locuteurs pour neuf langues afin de garantir la vie privée.
― 7 min lire
Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.
― 6 min lire
Cette étude évalue la technologie de la parole dans des langues à faibles ressources comme l'arabe tunisien.
― 6 min lire
Mamba montre du potentiel contre les transformers dans les tâches de parole, surtout pour les longues entrées.
― 6 min lire
Apprends comment le contexte améliore la précision de la reconnaissance vocale automatique et la reconnaissance des mots.
― 6 min lire
La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.
― 8 min lire
Une étude sur l'amélioration de la précision de la transcription grâce à une meilleure conception des invites.
― 7 min lire
Un nouveau modèle vise à améliorer la qualité de la traduction vocale grâce à des systèmes intégrés.
― 7 min lire
De nouvelles méthodes visent à améliorer la reconnaissance de la parole chuchotée dans les systèmes automatiques.
― 8 min lire
Les modèles d'IA améliorent la précision des conversions de la parole en texte.
― 6 min lire
La recherche améliore les systèmes ASR en utilisant des modèles de langage pour une meilleure précision.
― 9 min lire
Un nouveau système améliore la reconnaissance vocale en utilisant des mots-clés contextuels pour plus de précision.
― 7 min lire
De nouvelles méthodes améliorent les modèles ASR pour plusieurs langues, tout en préservant les connaissances passées.
― 6 min lire
Examiner la reconnaissance automatique de la parole dans les systèmes judiciaires canadiens et son impact.
― 8 min lire
Des recherches montrent comment les LLM améliorent la reconnaissance vocale automatique en japonais.
― 7 min lire
SALSA améliore la précision de la reconnaissance vocale pour les langues à faibles ressources en intégrant des modèles ASR et des modèles linguistiques.
― 7 min lire
Examiner la performance de la reconnaissance automatique de la parole pour les utilisateurs sourds et malentendants.
― 14 min lire
Une nouvelle méthode utilise des données vocales pour améliorer les évaluations de l'autisme.
― 7 min lire
Examiner les dernières avancées des modèles génératifs dans différents domaines.
― 7 min lire
Un nouveau modèle combine la reconnaissance vocale et la reconnaissance d'entités pour de meilleurs résultats.
― 7 min lire
Une nouvelle méthode améliore les systèmes ASR pour une meilleure communication en classe.
― 6 min lire