Derniers articles pour Reconnaissance Automatique de la Parole

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les langues à faibles ressources

De nouvelles méthodes améliorent la reconnaissance vocale pour les langues sous-représentées en utilisant des données de langues similaires.

2025-08-26T10:39:15+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance des entités à partir de transcriptions médicales bruyantes

Cette étude aborde les défis de la capture de termes médicaux précis à partir d'audio bruyant.

2025-08-26T04:59:30+00:00 ― 10 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des données acoustiques

Une nouvelle méthode intègre des infos acoustiques dans les modèles de langage pour améliorer la reconnaissance vocale.

2025-08-25T02:15:55+00:00 ― 11 min lire

Calcul et langage Améliorer la transcription médicale avec l'IA

Les LLM améliorent la précision des transcriptions médicales, ce qui est super pour le soin des patients.

2025-08-24T16:32:55+00:00 ― 8 min lire

Traitement de l'audio et de la parole Codec-SUPERB : Un benchmark pour les codecs audio

Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.

2025-08-22T23:15:10+00:00 ― 9 min lire

Son Comprendre la technologie de reconnaissance automatique de la parole

Un aperçu de la reconnaissance automatique de la parole (ASR) et de ses avancées dans les applications modernes.

2025-08-20T15:22:55+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées des implants cochléaires avec les technologies d'IA

L'IA améliore les implants cochléaires pour mieux entendre et communiquer dans des environnements difficiles.

2025-08-17T13:41:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'évaluation automatique de la qualité de la parole

Une nouvelle méthode améliore l'évaluation de la parole en utilisant des enregistrements entiers.

2025-08-14T06:20:40+00:00 ― 10 min lire

Traitement de l'audio et de la parole Évaluer des modèles de traitement de la parole avec SUPERB

Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.

2025-08-11T09:31:05+00:00 ― 10 min lire

Calcul et langage Avancées dans les systèmes de sous-titrage automatique

Une nouvelle méthode crée directement des sous-titres, améliorant l'accessibilité pour des publics variés.

2025-08-10T07:49:00+00:00 ― 10 min lire

Calcul et langage Évaluation des systèmes de reconnaissance vocale pour la parole bégayée

Cette étude évalue la performance des systèmes de reconnaissance vocale avec des personnes qui bégaient.

2025-08-07T04:18:10+00:00 ― 11 min lire

Calcul et langage Nouvelle méthode d'attaque qui rend les systèmes ASR muets

Un clip audio universel peut couper des modèles ASR avancés comme Whisper.

2025-08-07T03:29:35+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale en classe avec un pré-entraînement continu

Une reconnaissance vocale améliorée pour les salles de classe grâce à des techniques de formation avancées améliore l'apprentissage.

2025-08-05T19:06:15+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec VPIDM

Le nouveau modèle VPIDM améliore la clarté de la parole dans des environnements bruyants.

2025-08-03T16:54:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Présentation du modèle 4D dans la reconnaissance vocale

Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.

2025-08-01T01:44:35+00:00 ― 9 min lire

Calcul et langage Présentation de mHuBERT-147 : un modèle de parole compact

mHuBERT-147 traite la parole dans plusieurs langues de manière efficace.

2025-07-30T22:12:45+00:00 ― 5 min lire

Calcul et langage Avancées dans la reconnaissance vocale scientifique multimodale

Améliorer la précision dans la transcription des présentations scientifiques grâce à l'intégration de la parole et de la vision.

2025-07-28T04:36:24+00:00 ― 11 min lire

Calcul et langage Le défi linguistique de Nollywood : Rapprocher les dialectes

Une étude sur la traduction de l'anglais nigérian pour une meilleure accessibilité dans les films de Nollywood.

2025-07-24T04:16:05+00:00 ― 7 min lire

Calcul et langage Avancées dans la traduction parole-texte avec les LLMs

Nouveau modèle améliore la traduction de la parole en texte en utilisant des grands modèles de langage.

2025-07-23T08:01:30+00:00 ― 8 min lire

Calcul et langage Avancées dans l'anonymisation des locuteurs multilingues

Améliorer la technologie d'anonymisation des locuteurs pour neuf langues afin de garantir la vie privée.

2025-07-23T03:58:35+00:00 ― 7 min lire

Calcul et langage Faire avancer la reconnaissance vocale avec des livres de code spécifiques aux accents

Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.

2025-07-22T04:29:40+00:00 ― 6 min lire

Calcul et langage Avancer la technologie de la parole pour l'arabe tunisien

Cette étude évalue la technologie de la parole dans des langues à faibles ressources comme l'arabe tunisien.

2025-07-21T12:18:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluation de l'efficacité de Mamba dans la technologie de la parole

Mamba montre du potentiel contre les transformers dans les tâches de parole, surtout pour les longues entrées.

2025-07-17T13:33:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec des indices contextuels

Apprends comment le contexte améliore la précision de la reconnaissance vocale automatique et la reconnaissance des mots.

2025-07-16T14:53:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour la langue polonaise

La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.

2025-07-14T16:44:10+00:00 ― 8 min lire

Calcul et langage Optimisation de la correction des erreurs ASR avec des modèles de langue

Une étude sur l'amélioration de la précision de la transcription grâce à une meilleure conception des invites.

2025-07-11T15:03:05+00:00 ― 7 min lire

Calcul et langage Avancées dans la technologie de traduction vocale

Un nouveau modèle vise à améliorer la qualité de la traduction vocale grâce à des systèmes intégrés.

2025-07-11T02:54:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les technologies de reconnaissance de la parole chuchotée

De nouvelles méthodes visent à améliorer la reconnaissance de la parole chuchotée dans les systèmes automatiques.

2025-07-08T08:30:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec la collaboration de l'IA

Les modèles d'IA améliorent la précision des conversions de la parole en texte.

2025-07-07T09:50:10+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale pour des termes spécialisés

La recherche améliore les systèmes ASR en utilisant des modèles de langage pour une meilleure précision.

2025-07-06T20:41:12+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec des mots-clés contextuels

Un nouveau système améliore la reconnaissance vocale en utilisant des mots-clés contextuels pour plus de précision.

2025-06-29T22:53:15+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale multilingue sans données originales

De nouvelles méthodes améliorent les modèles ASR pour plusieurs langues, tout en préservant les connaissances passées.

2025-06-27T15:01:00+00:00 ― 6 min lire

Calcul et langage Le rôle de la reconnaissance vocale dans la transcription judiciaire

Examiner la reconnaissance automatique de la parole dans les systèmes judiciaires canadiens et son impact.

2025-06-24T14:48:24+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale japonaise avec des techniques GER

Des recherches montrent comment les LLM améliorent la reconnaissance vocale automatique en japonais.

2025-06-23T04:08:00+00:00 ― 7 min lire

Calcul et langage Présentation de SALSA : Une nouvelle méthode pour améliorer la reconnaissance vocale

SALSA améliore la précision de la reconnaissance vocale pour les langues à faibles ressources en intégrant des modèles ASR et des modèles linguistiques.

2025-06-22T06:16:15+00:00 ― 7 min lire

Calcul et langage Évaluation de la précision de l'ASR pour l'accessibilité

Examiner la performance de la reconnaissance automatique de la parole pour les utilisateurs sourds et malentendants.

2025-06-22T01:24:45+00:00 ― 14 min lire

Calcul et langage Utiliser les données vocales pour diagnostiquer l'autisme

Une nouvelle méthode utilise des données vocales pour améliorer les évaluations de l'autisme.

2025-06-19T19:12:12+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les modèles génératifs et leurs applis

Examiner les dernières avancées des modèles génératifs dans différents domaines.

2025-06-14T04:06:48+00:00 ― 7 min lire

Calcul et langage WhisperNER : Fusion de la reconnaissance vocale et de la détection d'entités

Un nouveau modèle combine la reconnaissance vocale et la reconnaissance d'entités pour de meilleurs résultats.

2025-06-13T03:29:30+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale en classe avec un préentraînement continu

Une nouvelle méthode améliore les systèmes ASR pour une meilleure communication en classe.

2025-06-12T18:44:20+00:00 ― 6 min lire