Derniers articles pour Reconnaissance vocale

Traitement de l'audio et de la parole Améliorer les techniques de détection de discours truqués

De nouvelles méthodes améliorent notre capacité à détecter efficacement les discours falsifiés.

2025-09-11T02:21:55+00:00 ― 7 min lire

Son Améliorer la reconnaissance vocale avec des techniques de personnalisation

Une nouvelle méthode améliore les modèles ASR pour les utilisateurs individuels en utilisant la quantification et l'adaptation.

2025-09-10T13:24:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale grâce aux modèles à sortie anticipée

De nouveaux modèles s'adaptent pour améliorer l'efficacité et la réactivité de la reconnaissance vocale.

2025-09-09T21:12:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer Whisper pour les langues à faibles ressources

Améliorer la reconnaissance vocale de Whisper pour le vietnamien et d'autres langues à faibles ressources.

2025-09-08T03:55:10+00:00 ― 5 min lire

Neurosciences Comprendre le traitement de la parole dans des environnements difficiles

Cette étude examine comment l'audition influence la compréhension de la parole dans des environnements bruyants.

2025-09-07T04:34:28+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer les jeux de données audio avec le clustering K-Means

Utiliser le clustering k-means pour optimiser les données audio pour un meilleur entraînement des modèles.

2025-09-06T15:28:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Sélection de modèle efficace pour la reconnaissance vocale

Une méthode pour choisir le meilleur modèle ASR en fonction des caractéristiques audio.

2025-09-05T23:17:15+00:00 ― 6 min lire

Calcul et langage Mon projet de tuteur en science : Une nouvelle façon d'apprendre

MyST vise à améliorer l'apprentissage des sciences chez les enfants grâce à du tutorat virtuel.

2025-09-05T09:31:20+00:00 ― 6 min lire

Son Avancées dans la technologie de transcription des réunions

Un aperçu de M2MeT 2.0 et son impact sur la transcription des réunions.

2025-09-05T03:51:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées et défis des modèles de reconnaissance vocale

Cette étude explore comment la compression de modèle impacte la reconnaissance vocale dans des environnements bruyants.

2025-09-04T19:45:25+00:00 ― 7 min lire

Son Avancées dans les modèles de reconnaissance audio et de la parole

Un nouveau modèle améliore la compréhension de la parole et des sons en même temps.

2025-09-04T18:08:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'extraction de la parole

Présentation de nouveaux modèles pour mieux extraire la parole dans des environnements bruyants.

2025-09-04T02:45:10+00:00 ― 7 min lire

Calcul et langage Aborder les défis de la reconnaissance automatique de la parole en long format

La recherche se concentre sur l'amélioration des systèmes ASR pour l'audio non segmenté.

2025-09-03T13:47:50+00:00 ― 6 min lire

Calcul et langage S'attaquer aux préjugés de genre dans la technologie de reconnaissance vocale

Examiner les écarts de performance dans la reconnaissance vocale entre les différents genres.

2025-09-03T12:51:42+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des grands modèles de langage

Les LLMs améliorent la précision et la correction des erreurs dans les systèmes de reconnaissance vocale.

2025-09-03T06:30:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les transcriptions de réunion avec le système PP-MeT

PP-MeT vise à améliorer la précision dans la retranscription de réunions avec plusieurs intervenants.

2025-09-02T04:35:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Calcul et langage Avancées dans la reconnaissance vocale du code-switching

Ce projet vise à améliorer la reconnaissance de la parole mélangée gujarati-anglais.

2025-08-30T05:46:00+00:00 ― 7 min lire

Calcul et langage Faire avancer la classification de la parole avec des données multimodales

Un nouveau modèle intègre l'audio et le texte pour une meilleure classification de la parole.

2025-08-29T18:49:00+00:00 ― 8 min lire

Son Défi NOTSOFAR-1 : Faire avancer la technologie de transcription des réunions

Une nouvelle initiative pour améliorer la technologie de transcription pour les réunions dans les grandes salles.

2025-08-29T16:23:15+00:00 ― 9 min lire

Calcul et langage Avancées dans la correction des erreurs de reconnaissance vocale

De nouvelles méthodes améliorent la précision dans la reconnaissance vocale brouillée en utilisant de grands modèles de langue.

2025-08-29T01:48:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole S'attaquer aux défis de la technologie de la parole pour les langues sous-resources

Cet article parle des solutions pour les applications de parole dans les langues avec peu de données transcrites.

2025-08-28T18:31:30+00:00 ― 8 min lire

Calcul et langage Documenter des langues en danger avec l'IGT

Une nouvelle méthode aide à préserver les langues en danger grâce à une documentation détaillée.

2025-08-27T17:35:42+00:00 ― 10 min lire

Traitement de l'audio et de la parole Nouvelle méthode pour effacer le discours écho

Une méthode améliore la clarté de la parole dans des environnements bruyants sans données d'entraînement claires.

2025-08-26T17:56:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les langues à faibles ressources

De nouvelles méthodes améliorent la reconnaissance vocale pour les langues sous-représentées en utilisant des données de langues similaires.

2025-08-26T10:39:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Reborn : Une nouvelle ère dans l'ASR non supervisé

Reborn propose des solutions innovantes pour la reconnaissance vocale automatique sans données étiquetées.

2025-08-25T19:16:10+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de dialogue vocal

Un aperçu des nouveaux modèles pour des réponses parlées naturelles.

2025-08-25T03:04:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la diarisation des locuteurs avec des approches multi-microphones

De nouvelles méthodes améliorent la détection d'activité vocale et de chevauchement dans la diarisation des locuteurs.

2025-08-24T13:18:35+00:00 ― 8 min lire

Traitement du signal Chirp MFCC : Une nouvelle approche dans le traitement audio

Chirp MFCC améliore la représentation des signaux audio pour une meilleure classification et reconnaissance.

2025-08-23T08:58:10+00:00 ― 6 min lire

Calcul et langage Projet Kallaama : Lier la langue et la technologie dans l'agriculture

Kallaama crée un jeu de données de discours dans les langues locales pour aider les agriculteurs sénégalais.

2025-08-23T02:43:54+00:00 ― 6 min lire

Calcul et langage Faire avancer les modèles linguistiques grâce aux styles de parole

Un nouveau cadre améliore les modèles de langue en reconnaissant et en répondant à différents styles de discours.

2025-08-23T00:03:45+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer la vérification vocale pour les enfants

Améliorer les systèmes ASV pour reconnaître les voix des enfants avec précision.

2025-08-22T09:29:15+00:00 ― 12 min lire

Traitement de l'audio et de la parole Avancées dans l'estimation des propriétés acoustiques des salles

La recherche met en avant de nouveaux modèles pour une meilleure qualité audio dans différents environnements.

2025-08-22T03:00:35+00:00 ― 9 min lire

Son Avancées dans les techniques de diarisation automatique des locuteurs

La recherche met en avant l'importance du timing par rapport aux caractéristiques spécifiques des intervenants dans les modèles de diarisation.

2025-08-21T00:17:20+00:00 ― 7 min lire

Interaction homme-machine Avancées dans les interfaces de parole silencieuse

Un aperçu de MONA, un système qui améliore la communication par la parole silencieuse.

2025-08-20T16:11:30+00:00 ― 6 min lire

Robotique Améliorer la reconnaissance vocale des robots dans des environnements bruyants

La recherche se concentre sur l'aide aux robots pour mieux comprendre la parole en plein bruit de fond.

2025-08-19T22:22:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Évaluer la reconnaissance vocale dans des environnements bruyants

Un nouveau critère évalue la performance des systèmes de reconnaissance vocale face à différentes distorsions.

2025-08-19T14:16:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées des implants cochléaires avec les technologies d'IA

L'IA améliore les implants cochléaires pour mieux entendre et communiquer dans des environnements difficiles.

2025-08-17T13:41:50+00:00 ― 8 min lire

Son Nouvelle approche pour la séparation audio en utilisant le langage

Cette méthode améliore la séparation audio en combinant des descriptions de langue avec une analyse sonore.

2025-08-13T14:57:35+00:00 ― 7 min lire

Son Analyse vocale innovante pour la détection précoce de Parkinson

Des recherches montrent que l'analyse de la parole pourrait aider à identifier la maladie de Parkinson tôt.

2025-08-09T16:24:42+00:00 ― 6 min lire