Derniers articles pour Reconnaissance vocale

Calcul et langage Avancer la reconnaissance des actes de parole en bengali

Une nouvelle méthode améliore la reconnaissance des actes de parole en bengali grâce à l'analyse audio et textuelle.

2025-10-27T10:55:25+00:00 ― 6 min lire

Calcul et langage Avancées dans l'identification des langues avec le cadre LASR

Une nouvelle approche améliore l'identification de la langue parlée en utilisant l'apprentissage auto-supervisé et des étiquettes.

2025-10-26T08:12:10+00:00 ― 8 min lire

Son Amélioration de la reconnaissance de la parole chez les personnes dysarthriques arabes

Une nouvelle méthode améliore la reconnaissance vocale pour les locuteurs arabes atteints de dysarthrie.

2025-10-26T07:23:35+00:00 ― 7 min lire

Calcul et langage Outil de Reconnaissance Vocale Innovant pour Langues à Faibles Ressources

Allophant améliore la reconnaissance des phonèmes pour les langues avec peu de données.

2025-10-26T06:35:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer le timing des mots dans les systèmes de reconnaissance vocale

Améliorer comment les systèmes de reconnaissance vocale estiment le timing des mots pour plus de précision.

2025-10-26T01:43:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec des modèles avancés

De nouvelles méthodes améliorent le traitement de la parole dans les modèles linguistiques.

2025-10-26T00:54:55+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Déplacement télescopique alternatif : Une nouvelle méthode pour l'alignement des données multimodales

Découvre une nouvelle méthode pour combiner différents types de données de manière efficace.

2025-10-25T22:40:24+00:00 ― 7 min lire

Calcul et langage Avancées dans l'apprentissage auto-supervisé pour la reconnaissance vocale

Les modèles auto-supervisés révèlent des trucs sur les distinctions phonétiques et phonémiques dans la parole.

2025-10-25T10:20:25+00:00 ― 7 min lire

Neurosciences Examen des réponses du cerveau à la parole : points clés

Des recherches montrent comment notre cerveau suit les caractéristiques de la parole pendant la compréhension.

2025-10-25T09:40:42+00:00 ― 7 min lire

Calcul et langage Avancées dans la reconnaissance de noms d'entités parlées

Cette étude se concentre sur l'amélioration de la NER orale grâce à l'apprentissage par transfert et aux modèles E2E.

2025-10-24T10:59:30+00:00 ― 8 min lire

Calcul et langage Améliorer le remplissage de slots dans les systèmes de dialogue

Une nouvelle méthode améliore les systèmes de dialogue orientés tâche en utilisant l'intégration audio et de connaissances.

2025-10-23T22:13:12+00:00 ― 8 min lire

Calcul et langage Avancées dans la reconnaissance automatique de la parole pour les langues norvégiennes

Des recherches récentes améliorent les modèles ASR pour le norvégien, boostant leurs performances en Bokmål et Nynorsk.

2025-10-23T21:10:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les modèles ASR bilingues et à code-switching

De nouvelles méthodes améliorent la reconnaissance vocale multilingue en utilisant des sources de données existantes.

2025-10-23T04:05:20+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues à faibles ressources

La recherche se concentre sur l'amélioration de la technologie vocale pour les langues qui manquent de données suffisantes.

2025-10-22T23:13:50+00:00 ― 8 min lire

Son Une approche simplifiée du HMM hybride pour la reconnaissance vocale

Cet article parle d'une nouvelle méthode pour construire des systèmes ASR efficaces.

2025-10-22T14:19:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Nouveau jeu de données et modèle pour le texte à la parole multilingue

CML-TTS permet d'améliorer les systèmes de conversion texte-parole dans sept langues.

2025-10-21T18:04:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale multi-parleur avec SURT 2.0

SURT 2.0 améliore la reconnaissance vocale pour plusieurs intervenants en temps réel.

2025-10-21T05:07:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans l'apprentissage de la reconnaissance vocale automatique

Une nouvelle méthode améliore la technologie de reconnaissance vocale sans perdre les connaissances déjà acquises.

2025-10-20T13:44:25+00:00 ― 7 min lire

Calcul et langage Nouvelles métriques pour évaluer la qualité de la reconnaissance vocale

Une nouvelle méthode évalue les systèmes de reconnaissance automatique de la parole sans avoir besoin de textes de référence.

2025-10-19T19:07:00+00:00 ― 6 min lire

Calcul et langage Évaluer la qualité de la reconnaissance vocale sans textes de référence

NoRefER propose une nouvelle méthode pour évaluer les résultats de reconnaissance vocale sans avoir besoin de transcriptions.

2025-10-19T16:41:15+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de diarisation de la langue parlée

De nouvelles méthodes améliorent la segmentation de la parole dans les conversations multilingues.

2025-10-19T02:06:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole pour un usage multilingue

Un nouveau cadre améliore la reconnaissance vocale pour les langues à faibles ressources et la scalabilité multilingue.

2025-10-18T19:38:05+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la lecture labiale avec un entraînement aux visèmes

Une nouvelle méthode améliore la précision de la lecture sur les lèvres en utilisant des visèmes dans la reconnaissance vocale.

2025-10-18T03:42:24+00:00 ― 6 min lire

Son Faire avancer la reconnaissance vocale pour les utilisateurs sourds

Les systèmes de reconnaissance vocale personnalisés améliorent grave la communication pour les personnes DHH.

2025-10-18T03:26:25+00:00 ― 8 min lire

Son Avancées dans les techniques de diarisation des locuteurs

De nouvelles méthodes utilisent des résumés de conversation pour améliorer la reconnaissance des locuteurs.

2025-10-18T00:12:05+00:00 ― 7 min lire

Calcul et langage Améliorer l'évaluation automatique de la parole pour les apprenants de langues

Améliorer les systèmes de feedback pour les apprenants en anglais en s'attaquant au problème du démarrage à froid.

2025-10-17T16:54:50+00:00 ― 8 min lire

Multimédia Améliorer l'extraction du locuteur cible avec des indices visuels

Un nouveau modèle améliore l'extraction de la parole en utilisant des infos audio et visuelles.

2025-10-17T12:51:55+00:00 ― 7 min lire

Son Avancées dans la technologie d'extraction de la voix cible

Découvrez comment de nouvelles techniques améliorent la clarté de la parole dans des environnements bruyants.

2025-10-16T10:08:40+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des modèles à long contexte

Cet article parle de nouveaux modèles qui améliorent la précision de la reconnaissance vocale en tenant compte d'un contexte plus long.

2025-10-15T12:16:55+00:00 ― 7 min lire

Informatique neuronale et évolutive Faire avancer les réseaux de neurones à impulsions grâce à l'apprentissage des délais

Une nouvelle méthode améliore l'apprentissage dans les réseaux de neurones à spikes en intégrant des ajustements de délai.

2025-10-15T07:25:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Faire avancer la confidentialité de genre dans l'audio : Nouvelles perspectives

La recherche met en avant des méthodes pour protéger la vie privée de genre dans l'audio parlé.

2025-10-14T21:42:25+00:00 ― 8 min lire

Son Avancées dans la technologie de synthèse de la parole à partir des lèvres

Un nouveau cadre améliore la clarté des discours dans les vidéos silencieuses grâce à un traitement amélioré.

2025-10-13T19:47:45+00:00 ― 7 min lire

Son Avancées dans la détection de faux audio avec des modèles Conformer

Des chercheurs ont développé un modèle Conformer pour améliorer la détection des fausses audios.

2025-10-13T03:36:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancer les embeddings acoustiques de mots pour le langage parlé

Recherche sur l'amélioration des embeddings acoustiques des mots avec compréhension sémantique et données multilingues.

2025-10-12T14:38:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Intégrer la parole avec des modèles de langage : la méthode Speech-LLaMA

Une nouvelle approche qui combine la parole avec des modèles de langage pour une traduction améliorée.

2025-10-11T18:24:10+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des RNN-Transducteurs

De nouvelles méthodes améliorent la précision de la reconnaissance vocale, en s'attaquant aux erreurs courantes de transcription.

2025-10-11T04:38:15+00:00 ― 6 min lire

Calcul et langage Avancées dans la classification de l'intention de parole et le remplissage de slots

Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.

2025-10-09T12:09:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale sans texte

Une nouvelle méthode améliore la reconnaissance vocale en utilisant seulement des données audio brutes.

2025-10-09T02:26:05+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les personnes âgées

Une étude améliore la reconnaissance vocale pour les personnes âgées, en utilisant des techniques innovantes.

2025-10-09T01:37:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Nouveau jeu de données pour améliorer la reconnaissance vocale en hébreu

ivrit.ai fournit des ressources essentielles pour améliorer la technologie ASR en hébreu.

2025-10-08T05:22:55+00:00 ― 8 min lire