Derniers articles pour Taux d'erreur de mots

Calcul et langage Avancées dans la correction des erreurs de reconnaissance vocale

De nouvelles méthodes améliorent la précision dans la reconnaissance vocale brouillée en utilisant de grands modèles de langue.

2025-08-29T01:48:45+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des données acoustiques

Une nouvelle méthode intègre des infos acoustiques dans les modèles de langage pour améliorer la reconnaissance vocale.

2025-08-25T02:15:55+00:00 ― 11 min lire

Calcul et langage Améliorer la transcription médicale avec l'IA

Les LLM améliorent la précision des transcriptions médicales, ce qui est super pour le soin des patients.

2025-08-24T16:32:55+00:00 ― 8 min lire

Interaction homme-machine Avancées dans les interfaces de parole silencieuse

Un aperçu de MONA, un système qui améliore la communication par la parole silencieuse.

2025-08-20T16:11:30+00:00 ― 6 min lire

Robotique Améliorer la reconnaissance vocale des robots dans des environnements bruyants

La recherche se concentre sur l'aide aux robots pour mieux comprendre la parole en plein bruit de fond.

2025-08-19T22:22:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Évaluer la reconnaissance vocale dans des environnements bruyants

Un nouveau critère évalue la performance des systèmes de reconnaissance vocale face à différentes distorsions.

2025-08-19T14:16:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les langues à faible ressources

Une méthode pour améliorer la précision de la reconnaissance vocale en kannada et en télougou.

2025-08-17T15:19:00+00:00 ― 10 min lire

Calcul et langage Améliorer la reconnaissance vocale en classe avec un pré-entraînement continu

Une reconnaissance vocale améliorée pour les salles de classe grâce à des techniques de formation avancées améliore l'apprentissage.

2025-08-05T19:06:15+00:00 ― 9 min lire

Apprentissage automatique Avancées dans la reconnaissance automatique de la parole avec des modèles de langage de débruitage

Les modèles de langage de débruitage améliorent la correction des erreurs dans les systèmes de reconnaissance vocale en utilisant des données synthétiques.

2025-08-03T22:34:10+00:00 ― 10 min lire

Calcul et langage Faire avancer la reconnaissance vocale avec des livres de code spécifiques aux accents

Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.

2025-07-22T04:29:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole en streaming

Le modèle XLSR-Transducer déchire en transcription en temps réel avec peu de données.

2025-07-21T18:46:40+00:00 ― 7 min lire

Son Vulnérabilité dans les systèmes de reconnaissance vocale exposée

Des recherches montrent des risques dans les modèles de parole multi-tâches comme Whisper.

2025-07-21T09:52:15+00:00 ― 6 min lire

Calcul et langage TokenVerse : Simplifier l'analyse de conversation

TokenVerse simplifie l'analyse des conversations orales en intégrant plusieurs tâches dans un seul modèle.

2025-07-21T08:15:05+00:00 ― 8 min lire

Calcul et langage LearnerVoice : Améliorer la Reconnaissance Vocale pour les Apprenants en Langue

Nouveau jeu de données vise à améliorer la reconnaissance vocale pour les anglophones non natifs.

2025-07-21T02:35:00+00:00 ― 7 min lire

Intelligence artificielle Adapter la technologie OCR pour la reconnaissance de texte en espagnol

Un projet pour améliorer la reconnaissance de texte pour les documents en espagnol en utilisant TrOCR.

2025-07-16T15:58:30+00:00 ― 7 min lire

Son L'évolution des systèmes de reconnaissance vocale automatique

Un aperçu des avancées dans les technologies et méthodes de reconnaissance vocale.

2025-07-15T11:21:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Amélioration de la mise en forme des chiffres dans les transcriptions ASR

Cet article parle des moyens d'améliorer le formatage des expressions numériques dans les transcriptions automatiques.

2025-07-14T15:55:35+00:00 ― 7 min lire

Intelligence artificielle Présentation de DANIEL : Une nouvelle approche pour la reconnaissance de documents manuscrits

DANIEL utilise plusieurs techniques pour extraire efficacement des documents manuscrits.

2025-07-14T08:08:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Les caméras événementielles transforment la reconnaissance de la langue des signes

De nouvelles caméras événementielles améliorent la reconnaissance et la traduction de la langue des signes, rendant les outils de communication plus efficaces.

2025-07-11T18:39:36+00:00 ― 7 min lire

Son L'essor du montage vocal dans les médias numériques

Explore l'importance croissante du montage audio pour les créateurs de contenu.

2025-07-11T00:28:35+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'OCR et HWR en arabe avec Qalam

Qalam offre une meilleure reconnaissance pour le texte et l'écriture arabe.

2025-07-11T00:21:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer les technologies de reconnaissance de la parole chuchotée

De nouvelles méthodes visent à améliorer la reconnaissance de la parole chuchotée dans les systèmes automatiques.

2025-07-08T08:30:30+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'apprentissage de la représentation du bruit contextuel

Une méthode pour améliorer la qualité de la reconnaissance vocale dans des environnements bruyants.

2025-07-01T23:28:15+00:00 ― 8 min lire

Son Avancées dans la technologie de conversion de voix sans exemples

Un nouveau modèle améliore la conversion vocale, surtout pour la parole chuchotée et les applis en temps réel.

2025-06-26T17:57:50+00:00 ― 7 min lire

Calcul et langage Le rôle de la reconnaissance vocale dans la transcription judiciaire

Examiner la reconnaissance automatique de la parole dans les systèmes judiciaires canadiens et son impact.

2025-06-24T14:48:24+00:00 ― 8 min lire

Son StyleSpeech : L'avenir de la technologie texte-à-parole

StyleSpeech fait avancer les systèmes TTS en capturant les nuances de la parole naturelle.

2025-06-24T14:08:30+00:00 ― 7 min lire

Calcul et langage Nouveau standard pour la reconnaissance vocale en hindi

La recherche améliore la reconnaissance vocale pour le hindi avec des accents divers.

2025-06-24T05:11:42+00:00 ― 6 min lire

Calcul et langage Évaluer la précision de la reconnaissance vocale automatique

Un aperçu de la mesure de la précision dans les systèmes de reconnaissance vocale avec de nouvelles méthodes.

2025-06-22T20:50:45+00:00 ― 7 min lire

Calcul et langage Évaluation de la précision de l'ASR pour l'accessibilité

Examiner la performance de la reconnaissance automatique de la parole pour les utilisateurs sourds et malentendants.

2025-06-22T01:24:45+00:00 ― 14 min lire

Calcul et langage Améliorer la reconnaissance automatique de la parole avec des modèles de langue

Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des modèles de langue pour de meilleures transcriptions.

2025-06-21T20:33:15+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec un entraînement augmenté par le bruit

Cette étude examine comment le bruit peut renforcer la résilience de la reconnaissance vocale face aux défis.

2025-06-19T14:18:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la synthèse vocale utilisant DDSP

Découvrez comment DDSP améliore l'efficacité et la qualité de la synthèse vocale.

2025-06-18T17:15:00+00:00 ― 8 min lire

Calcul et langage Défis et avancées dans la traduction orale

Un aperçu des complexités et des améliorations dans la technologie de traduction de la parole à la parole.

2025-06-18T06:12:18+00:00 ― 8 min lire

Calcul et langage Comment les styles de transcription influencent la compréhension de l'anglais afro-américain

Explorer l'impact des styles de transcription sur la précision de l'anglais afro-américain.

2025-06-17T09:16:12+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les noms rares

Cette méthode améliore la précision de reconnaissance des noms rares dans les sorties vocales.

2025-06-16T03:42:40+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale en classe avec un préentraînement continu

Une nouvelle méthode améliore les systèmes ASR pour une meilleure communication en classe.

2025-06-12T18:44:20+00:00 ― 6 min lire

Son Avancées dans la restauration de la parole : MaskSR2

MaskSR2 améliore la clarté et la qualité de la voix grâce à des techniques innovantes.

2025-06-11T07:06:40+00:00 ― 6 min lire

Son Avancées dans la technologie de synthèse vocale

Une nouvelle méthode améliore la qualité et l'efficacité de la génération de discours.

2025-06-07T10:48:10+00:00 ― 6 min lire

Cryptographie et sécurité Une nouvelle méthode expose les vulnérabilités des capteurs de smartphone

Des recherches montrent des risques avec les capteurs de mouvement des smartphones, soulevant des préoccupations sur la vie privée.

2025-06-07T00:09:24+00:00 ― 7 min lire

Calcul et langage Faire avancer la communication médicale avec la technologie ASR

Le projet MultiMed améliore la reconnaissance vocale automatique pour une meilleure communication dans le domaine de la santé.

2025-06-05T06:10:15+00:00 ― 7 min lire