Derniers articles pour Reconnaissance vocale

Traitement de l'audio et de la parole Avancées dans le suivi des formants pour le traitement de la parole

De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.

2025-09-19T02:16:10+00:00 ― 5 min lire

Calcul et langage Connecter la parole avec les modèles de langage : la méthode BLSP

Une nouvelle méthode améliore l'intégration de la parole avec les modèles de langage.

2025-09-18T15:44:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole VoxtLM : Une approche unifiée pour la parole et le texte

VoxtLM combine la reconnaissance vocale, la synthèse, la génération de texte et la continuité dans un seul modèle.

2025-09-13T11:02:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Libriheavy : Un nouveau dataset pour la reconnaissance vocale

Libriheavy propose 50 000 heures d'anglais parlé pour améliorer la technologie de reconnaissance vocale.

2025-09-12T18:51:05+00:00 ― 6 min lire

Son Améliorer la reconnaissance vocale avec des prompts doux

Les prompts doux améliorent la technologie de reconnaissance vocale pour de meilleures performances dans des environnements bruyants.

2025-09-10T04:30:10+00:00 ― 6 min lire

Calcul et langage Avancer la Reconnaissance Vocale : Systèmes Suivant des Instructions

Une nouvelle approche de la reconnaissance vocale améliore l'interaction utilisateur avec des instructions flexibles.

2025-09-09T08:15:35+00:00 ― 6 min lire

Son Améliorer la reconnaissance vocale avec l'entraînement au moment du test

Explore comment TTT améliore la reconnaissance vocale en s'adaptant aux changements de distribution.

2025-09-08T14:26:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la clarté de la parole avec des techniques de dériverbération

Apprends comment la dé-réverbération améliore la reconnaissance vocale dans des environnements bruyants.

2025-09-05T12:45:40+00:00 ― 6 min lire

Son Avancées dans les modèles de reconnaissance audio et de la parole

Un nouveau modèle améliore la compréhension de la parole et des sons en même temps.

2025-09-04T18:08:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour des accents variés

Améliorer les modèles de parole pour mieux reconnaître et s'adapter à différents accents.

2025-09-04T08:25:15+00:00 ― 6 min lire

Calcul et langage Construire une reconnaissance vocale pour les langues indiennes

Un projet pour améliorer la reconnaissance vocale dans plusieurs langues indiennes.

2025-09-01T15:10:24+00:00 ― 6 min lire

Calcul et langage Projet Kallaama : Lier la langue et la technologie dans l'agriculture

Kallaama crée un jeu de données de discours dans les langues locales pour aider les agriculteurs sénégalais.

2025-08-23T02:43:54+00:00 ― 6 min lire

Calcul et langage Défis et opportunités pour les langues autochtones dans le PNL

Les langues autochtones font face à des défis en matière de technologie tout en offrant des perspectives culturelles riches.

2025-08-21T07:40:36+00:00 ― 7 min lire

Robotique Évaluer un robot social dans le domaine de la santé

Une étude sur l'utilisation de l'ARI dans une structure de jour pour personnes âgées.

2025-08-20T09:17:36+00:00 ― 7 min lire

Calcul et langage Classer les sous-dialectes du kurde sorani à travers des données audio

La recherche identifie et classe les dialectes kurdes sorani en utilisant des enregistrements audio extensifs.

2025-08-14T07:57:50+00:00 ― 7 min lire

Calcul et langage Déchiffrement de fusion générative : faire avancer la reconnaissance de texte

Une nouvelle méthode améliore la précision de la reconnaissance de texte dans plusieurs applications.

2025-08-07T22:00:54+00:00 ― 8 min lire

Interaction homme-machine Avancer la communication entre robots : Solution de discours qui se chevauche

Un nouveau système améliore les interactions des robots en filtrant les discours qui se chevauchent.

2025-08-04T13:57:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole avec le TTA dynamique

De nouvelles méthodes améliorent la reconnaissance vocale dans des environnements bruyants en utilisant des techniques adaptatives.

2025-07-29T13:49:25+00:00 ― 9 min lire

Calcul et langage Avancées dans la traduction de la parole en code-switching

Une nouvelle méthode améliore la traduction de discours en langues mélangées en anglais.

2025-07-29T09:46:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole GigaSpeech 2 : Un nouveau dataset pour la reconnaissance vocale

GigaSpeech 2 propose un énorme jeu de données pour les langues peu répandues afin d'améliorer la reconnaissance vocale.

2025-07-29T02:29:15+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Le BabyView Dataset : Un nouveau regard sur l'apprentissage des enfants

Un jeu de données unique capture la vie quotidienne des enfants pour améliorer l'apprentissage machine et la compréhension de l'apprentissage humain.

2025-07-29T01:16:42+00:00 ― 10 min lire

Calcul et langage Systèmes d'IA générative : Façonner l'avenir de la création de contenu

Découvrez comment l'IA générative change notre façon de créer du contenu.

2025-07-24T05:01:00+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de reconnaissance vocale automatique

De nouvelles méthodes améliorent la précision et l'efficacité des systèmes de reconnaissance vocale.

2025-07-22T03:41:05+00:00 ― 8 min lire

Son Avancer la communication : La reconnaissance vocale rencontre le code Morse

Un nouveau modèle améliore la communication pour les personnes handicapées en utilisant la reconnaissance vocale et le code Morse.

2025-07-18T02:52:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Qwen2-Audio : Une nouvelle voix pour la technologie

Un modèle vocal qui transforme l'interaction audio avec la technologie.

2025-07-16T00:18:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Vibravox : Faire avancer la technologie de reconnaissance vocale

Un nouveau jeu de données vise à améliorer la capture de la voix avec des capteurs de conduction corporelle.

2025-07-15T14:35:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour la langue polonaise

La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.

2025-07-14T16:44:10+00:00 ― 8 min lire

Neurones et cognition Progrès de la technologie EEG pour la récupération de la parole

Des chercheurs améliorent le décodage de la parole en utilisant l'EEG pour aider les personnes ayant des troubles de la parole.

2025-07-12T16:20:33+00:00 ― 9 min lire

Calcul et langage Évaluation de la reconnaissance vocale dans des histoires orales multilingues

Cette étude évalue les systèmes de reconnaissance vocale en utilisant différentes langues pour l'histoire orale.

2025-07-07T12:29:12+00:00 ― 7 min lire

Interaction homme-machine OpenOmni : Faire avancer les agents de conversation multimodaux

OpenOmni crée des outils flexibles pour créer et tester des agents conversationnels.

2025-07-01T09:40:42+00:00 ― 10 min lire

Calcul et langage Améliorer les techniques de résumé de discours cross-lingual

La recherche se concentre sur une meilleure synthèse des conversations parlées dans différentes langues.

2025-06-29T05:24:24+00:00 ― 8 min lire

Son Présentation de NEST : Un nouveau modèle pour le traitement de la parole

NEST propose une approche plus rapide et efficace pour les tâches de parole auto-supervisées.

2025-06-25T20:06:05+00:00 ― 7 min lire

Intelligence artificielle Améliorer la reconnaissance vocale grâce à la prédiction d'erreurs

La recherche se concentre sur la prédiction des erreurs dans la reconnaissance vocale pour une meilleure précision.

2025-06-25T10:09:42+00:00 ― 7 min lire

Calcul et langage Nouveau standard pour la reconnaissance vocale en hindi

La recherche améliore la reconnaissance vocale pour le hindi avec des accents divers.

2025-06-24T05:11:42+00:00 ― 6 min lire

Son Avancées dans la vérification des locuteurs avec Whisper

Une nouvelle méthode améliore la précision de la reconnaissance vocale dans plusieurs langues.

2025-06-22T18:25:00+00:00 ― 7 min lire

Son Nouveau jeu de données améliore la technologie de reconnaissance vocale

Des chercheurs ont créé LibriheavyMix pour améliorer la reconnaissance vocale dans des environnements bruyants.

2025-06-20T22:41:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluation du modèle Mamba dans les tâches de traitement de la parole

Cette recherche analyse la performance de Mamba dans les tâches de parole, en mettant l'accent sur la reconstruction et la reconnaissance des sons.

2025-06-14T23:22:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Repères Acoustiques : Un Nouveau Jeu de Données pour le Traitement de la Parole

Des chercheurs ont développé un jeu de données pour améliorer les techniques de reconnaissance et d'analyse de la parole.

2025-06-13T19:50:25+00:00 ― 8 min lire

Calcul et langage Avancer la reconnaissance vocale pour la langue faetar

Efforts pour améliorer la technologie de la parole pour la langue Faetar, qui est sous-resources.

2025-06-13T09:18:50+00:00 ― 6 min lire

Calcul et langage Améliorer la précision de la reconnaissance vocale avec des modèles linguistiques

Une étude sur l'utilisation des modèles de langue pour corriger les erreurs dans les systèmes de reconnaissance vocale.

2025-06-12T22:47:15+00:00 ― 7 min lire