Derniers articles pour Reconnaissance vocale

Calcul et langage Nouvelles méthodes pour évaluer la diarisation des locuteurs

Présentation de nouvelles métriques pour évaluer la précision de la diarisation des locuteurs dans l'IA conversationnelle.

2025-09-26T18:04:30+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de reconnaissance vocale

De nouvelles méthodes améliorent la précision et la rapidité des systèmes de reconnaissance vocale.

2025-09-26T11:35:55+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance automatique de la parole avec injection de texte

Une nouvelle méthode améliore la performance de la reconnaissance vocale grâce à l'intégration de données textuelles.

2025-09-26T07:33:00+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'injection de texte

L'injection de texte aide à reconnaître les infos perso tout en gardant la vie privée.

2025-09-26T06:44:25+00:00 ― 7 min lire

Son Avancées dans la reconnaissance vocale avec la technologie mmWave

Radio2Text utilise des signaux mmWave pour la reconnaissance vocale en temps réel dans des environnements bruyants.

2025-09-25T22:38:35+00:00 ― 8 min lire

Calcul et langage Améliorer la conversion graphème-phonème avec une nouvelle méthode d'échantillonnage

Cette étude améliore les modèles G2P en se concentrant sur les zones sujettes aux erreurs pendant l'entraînement.

2025-09-25T05:38:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de suivi de formants

Découvrez des méthodes qui améliorent la précision du suivi des formants pour l'analyse de la parole.

2025-09-24T22:21:05+00:00 ― 9 min lire

Calcul et langage Avancées dans la modélisation du langage parlé

De nouvelles méthodes améliorent le traitement et la génération de la parole dans les modèles linguistiques.

2025-09-19T16:02:05+00:00 ― 6 min lire

Son Avancées dans la technologie de suppression du bruit

Des nouvelles techniques améliorent la clarté audio dans des environnements bruyants.

2025-09-19T15:13:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer le repérage de mots-clés en few-shot avec des données de discours de lecture

De nouvelles méthodes améliorent la détection de mots-clés en utilisant les données de parole disponibles.

2025-09-19T13:36:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancer l'estimation de confiance dans la reconnaissance automatique de la parole

Une nouvelle méthode améliore l'estimation de confiance dans les systèmes ASR pour une meilleure précision.

2025-09-15T03:14:28+00:00 ― 6 min lire

Apprentissage automatique Défis d'utilisation des Convnets pour la conception de filtres audio

Cette étude explore les problèmes liés à l'utilisation des convnets pour la création de filtres audio.

2025-09-14T14:34:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la diarisation des locuteurs avec des modèles de langue

Cet article explore les avancées en diarisation des locuteurs en utilisant des modèles de langue pour plus de précision.

2025-09-14T03:14:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole PromptASR : Une techno de reconnaissance vocale de folie

Nouveau système améliore la reconnaissance vocale grâce à des invites conscientes du contexte.

2025-09-13T10:14:10+00:00 ― 5 min lire

Son Avancées dans les modèles Universal Audio

EnCodecMAE combine l'apprentissage auto-supervisé et les codecs audio pour améliorer les performances dans les tâches audio.

2025-09-13T09:25:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Une nouvelle approche pour repérer des mots-clés

Présentation d'une méthode flexible pour reconnaître les mots-clés dans la parole à travers les langues.

2025-09-13T06:11:15+00:00 ― 7 min lire

Son Nouveau système améliore l'extraction vocale depuis des positions de tête instables

PIAVE aide les machines à extraire les voix clairement, même quand les intervenants tournent la tête.

2025-09-12T19:39:40+00:00 ― 7 min lire

Son Un nouveau cadre pour l'anonymisation des intervenants

Présentation d'un cadre flexible pour améliorer la recherche sur la confidentialité vocale.

2025-09-12T05:05:10+00:00 ― 9 min lire

Calcul et langage Améliorer les explications pour les modèles de parole

Une nouvelle méthode simplifie la compréhension des modèles de classification de la parole.

2025-09-12T02:39:25+00:00 ― 8 min lire

Son M-AUDIODEC : Une nouvelle façon de compresser l'audio

M-AUDIODEC compresse l'audio multi-canaux tout en gardant la position des enceintes et la qualité.

2025-09-11T16:56:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la qualité sonore dans les écouteurs

Des recherches montrent de nouveaux modèles pour améliorer la clarté de la voix dans les écouteurs intelligents.

2025-09-11T12:04:55+00:00 ― 6 min lire

Intelligence artificielle Améliorer la compréhension des instructions humaines par les robots

Une nouvelle méthode améliore la capacité des robots à suivre les instructions verbales avec précision.

2025-09-11T08:21:18+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les techniques de détection de discours truqués

De nouvelles méthodes améliorent notre capacité à détecter efficacement les discours falsifiés.

2025-09-11T02:21:55+00:00 ― 7 min lire

Son Améliorer la reconnaissance vocale avec des techniques de personnalisation

Une nouvelle méthode améliore les modèles ASR pour les utilisateurs individuels en utilisant la quantification et l'adaptation.

2025-09-10T13:24:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale grâce aux modèles à sortie anticipée

De nouveaux modèles s'adaptent pour améliorer l'efficacité et la réactivité de la reconnaissance vocale.

2025-09-09T21:12:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer Whisper pour les langues à faibles ressources

Améliorer la reconnaissance vocale de Whisper pour le vietnamien et d'autres langues à faibles ressources.

2025-09-08T03:55:10+00:00 ― 5 min lire

Neurosciences Comprendre le traitement de la parole dans des environnements difficiles

Cette étude examine comment l'audition influence la compréhension de la parole dans des environnements bruyants.

2025-09-07T04:34:28+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer les jeux de données audio avec le clustering K-Means

Utiliser le clustering k-means pour optimiser les données audio pour un meilleur entraînement des modèles.

2025-09-06T15:28:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Sélection de modèle efficace pour la reconnaissance vocale

Une méthode pour choisir le meilleur modèle ASR en fonction des caractéristiques audio.

2025-09-05T23:17:15+00:00 ― 6 min lire

Calcul et langage Mon projet de tuteur en science : Une nouvelle façon d'apprendre

MyST vise à améliorer l'apprentissage des sciences chez les enfants grâce à du tutorat virtuel.

2025-09-05T09:31:20+00:00 ― 6 min lire

Son Avancées dans la technologie de transcription des réunions

Un aperçu de M2MeT 2.0 et son impact sur la transcription des réunions.

2025-09-05T03:51:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées et défis des modèles de reconnaissance vocale

Cette étude explore comment la compression de modèle impacte la reconnaissance vocale dans des environnements bruyants.

2025-09-04T19:45:25+00:00 ― 7 min lire

Son Avancées dans les modèles de reconnaissance audio et de la parole

Un nouveau modèle améliore la compréhension de la parole et des sons en même temps.

2025-09-04T18:08:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'extraction de la parole

Présentation de nouveaux modèles pour mieux extraire la parole dans des environnements bruyants.

2025-09-04T02:45:10+00:00 ― 7 min lire

Calcul et langage Aborder les défis de la reconnaissance automatique de la parole en long format

La recherche se concentre sur l'amélioration des systèmes ASR pour l'audio non segmenté.

2025-09-03T13:47:50+00:00 ― 6 min lire

Calcul et langage S'attaquer aux préjugés de genre dans la technologie de reconnaissance vocale

Examiner les écarts de performance dans la reconnaissance vocale entre les différents genres.

2025-09-03T12:51:42+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des grands modèles de langage

Les LLMs améliorent la précision et la correction des erreurs dans les systèmes de reconnaissance vocale.

2025-09-03T06:30:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les transcriptions de réunion avec le système PP-MeT

PP-MeT vise à améliorer la précision dans la retranscription de réunions avec plusieurs intervenants.

2025-09-02T04:35:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Calcul et langage Avancées dans la reconnaissance vocale du code-switching

Ce projet vise à améliorer la reconnaissance de la parole mélangée gujarati-anglais.

2025-08-30T05:46:00+00:00 ― 7 min lire