Derniers articles pour Reconnaissance vocale

Calcul et langage Faire progresser la compréhension du langage parlé avec le CCL

Une nouvelle méthode améliore la façon dont les systèmes gèrent les erreurs dans la compréhension du langage parlé.

2025-08-08T14:20:30+00:00 ― 8 min lire

Calcul et langage Déchiffrement de fusion générative : faire avancer la reconnaissance de texte

Une nouvelle méthode améliore la précision de la reconnaissance de texte dans plusieurs applications.

2025-08-07T22:00:54+00:00 ― 8 min lire

Calcul et langage Nouvelle méthode d'attaque qui rend les systèmes ASR muets

Un clip audio universel peut couper des modèles ASR avancés comme Whisper.

2025-08-07T03:29:35+00:00 ― 8 min lire

Calcul et langage Avancées dans l'apprentissage fédéré pour la reconnaissance vocale

Exploiter des modèles à sortie anticipée pour un apprentissage fédéré efficace dans les systèmes ASR.

2025-08-06T09:48:24+00:00 ― 12 min lire

Calcul et langage Intégrer des modèles audio et linguistiques : SpeechVerse

SpeechVerse fait le lien entre la compréhension audio et le traitement du langage pour améliorer l'interaction humain-ordinateur.

2025-08-06T06:26:25+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale en classe avec un pré-entraînement continu

Une reconnaissance vocale améliorée pour les salles de classe grâce à des techniques de formation avancées améliore l'apprentissage.

2025-08-05T19:06:15+00:00 ― 9 min lire

Apprentissage automatique Avancées dans la reconnaissance automatique de la parole avec des modèles de langage de débruitage

Les modèles de langage de débruitage améliorent la correction des erreurs dans les systèmes de reconnaissance vocale en utilisant des données synthétiques.

2025-08-03T22:34:10+00:00 ― 10 min lire

Son Avancées dans les techniques de remplissage de voix

Découvrez comment le speech inpainting restaure la qualité audio dans différents domaines.

2025-08-02T18:13:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Présentation du modèle 4D dans la reconnaissance vocale

Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.

2025-08-01T01:44:35+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale en arabe grâce à la distillation de connaissances

Une étude sur l'amélioration de la reconnaissance vocale automatique pour les dialectes arabes en utilisant des techniques de modèle efficaces.

2025-07-31T23:18:50+00:00 ― 6 min lire

Calcul et langage Avancées dans l'apprentissage auto-supervisé pour la parole

Explorer le rôle de l'apprentissage auto-supervisé dans le traitement de la parole et ses défis.

2025-07-30T15:51:24+00:00 ― 11 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de diarisation de la parole ciblée

Un coup d'œil sur les nouvelles méthodes pour comprendre les discours qui se chevauchent pendant les conversations.

2025-07-30T14:06:55+00:00 ― 9 min lire

Son Améliorer les attaques par porte dérobée dans la reconnaissance vocale

Une nouvelle méthode cible les changements de rythme pour des attaques de discours discrètes.

2025-07-29T08:09:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole AV-CrossNet : Améliorer la reconnaissance vocale dans le bruit

Un nouveau système aide à séparer la parole du bruit pour une communication plus claire.

2025-07-29T03:17:50+00:00 ― 8 min lire

Son Diarisation de locuteur en temps réel : un aperçu

Découvre la diarisation de locuteur en ligne et son importance dans diverses applications.

2025-07-28T06:14:40+00:00 ― 8 min lire

Son Évaluation des jetons audio discrets pour les tâches de parole

Un nouvel outil de référence évalue les tokens audio discrets pour diverses tâches de traitement de la parole.

2025-07-28T04:37:30+00:00 ― 11 min lire

Calcul et langage Améliorer la correction des erreurs de parole dans les systèmes de reconnaissance vocale

Une nouvelle méthode combine des caractéristiques acoustiques et des scores de confiance pour une meilleure correction des erreurs.

2025-07-25T20:45:15+00:00 ― 6 min lire

Calcul et langage Comment les modèles de reconnaissance vocale gèrent les changements de son

Une étude sur comment les machines s'adaptent aux changements phonologiques dans la parole.

2025-07-25T20:31:00+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la détection des intervenants avec des données audio et visuelles

Un système combine audio et vidéo pour améliorer la précision de la détection des intervenants.

2025-07-25T10:13:40+00:00 ― 6 min lire

Calcul et langage Progrès dans les systèmes de dialogue parlé

Une nouvelle méthode améliore le dialogue machine grâce à des données pseudo-stéréo.

2025-07-25T08:36:30+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale chinoise grâce à la régularisation du pinyin

Cette étude présente un ensemble de données et une méthode pour améliorer la précision de la reconnaissance vocale chinoise en utilisant le Pinyin.

2025-07-25T07:47:55+00:00 ― 9 min lire

Son Analyse des techniques de détection d'audio deepfake

Cette étude se concentre sur l'amélioration de la détection des faux audios en utilisant des méthodes avancées.

2025-07-25T02:56:25+00:00 ― 6 min lire

Son L'importance de mesurer l'incertitude dans la reconnaissance des émotions dans la parole

Comprendre l'incertitude améliore la précision de la reconnaissance des émotions dans des situations réelles.

2025-07-24T17:13:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Nouvelle approche pour la diarisation des locuteurs

Un système de reconnaissance de locuteurs dans des audio multilingues sans avoir besoin de beaucoup de données.

2025-07-24T01:01:45+00:00 ― 7 min lire

Calcul et langage Avancées dans l'anonymisation des locuteurs multilingues

Améliorer la technologie d'anonymisation des locuteurs pour neuf langues afin de garantir la vie privée.

2025-07-23T03:58:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale audio-visuelle

Les recherches montrent que la vidéo aide à améliorer la reconnaissance vocale dans des environnements bruyants.

2025-07-22T20:41:20+00:00 ― 6 min lire

Son Avancées dans la reconnaissance vocale multi-parleurs

Une nouvelle méthode améliore la précision dans la reconnaissance de la parole de plusieurs intervenants.

2025-07-22T10:58:20+00:00 ― 6 min lire

Neurosciences Comprendre comment nos cerveaux traitent le son

Explore comment le cortex auditif intègre le son au fil du temps.

2025-07-22T08:05:26+00:00 ― 8 min lire

Son Avancées dans la technologie d'amélioration du son

Une nouvelle méthode améliore la clarté de la parole dans des environnements bruyants en utilisant des réseaux de neurones doubles.

2025-07-22T06:55:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole en streaming

Le modèle XLSR-Transducer déchire en transcription en temps réel avec peu de données.

2025-07-21T18:46:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Seed-ASR : Faire avancer la technologie de reconnaissance vocale

Un nouveau modèle améliore la précision des capacités de reconnaissance vocale en texte dans plusieurs langues.

2025-07-21T14:43:45+00:00 ― 6 min lire

Son Vulnérabilité dans les systèmes de reconnaissance vocale exposée

Des recherches montrent des risques dans les modèles de parole multi-tâches comme Whisper.

2025-07-21T09:52:15+00:00 ― 6 min lire

Calcul et langage TokenVerse : Simplifier l'analyse de conversation

TokenVerse simplifie l'analyse des conversations orales en intégrant plusieurs tâches dans un seul modèle.

2025-07-21T08:15:05+00:00 ― 8 min lire

Son Faire avancer le repérage de mots-clés en quelques exemples avec l'entraînement mixte

Cette étude examine le Mix-Training pour la détection de mots-clés dans des conditions de parole bruyante.

2025-07-19T16:39:18+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les langues à faible ressource

Améliorer les systèmes de reconnaissance vocale pour les langues avec peu de données en ligne.

2025-07-19T04:25:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Spectrogrammes et réseaux de neurones dans la reconnaissance vocale

Cette étude examine comment les réseaux de neurones interprètent la parole en utilisant des spectrogrammes.

2025-07-18T22:45:40+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec des indices contextuels

Apprends comment le contexte améliore la précision de la reconnaissance vocale automatique et la reconnaissance des mots.

2025-07-16T14:53:25+00:00 ― 6 min lire

Calcul et langage Analyse de l'harmonie vocalique en assamais avec fiwGAN

Cette étude utilise fiwGAN pour explorer les modèles d'harmonie vocalique dans la langue assamese.

2025-07-16T07:17:06+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec mélange de langues grâce à la distillation de connaissances

Un nouveau cadre améliore la performance de l'ASR en utilisant des données et des ressources limitées.

2025-07-15T22:41:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Amélioration de la mise en forme des chiffres dans les transcriptions ASR

Cet article parle des moyens d'améliorer le formatage des expressions numériques dans les transcriptions automatiques.

2025-07-14T15:55:35+00:00 ― 7 min lire