Derniers articles pour Reconnaissance vocale

Calcul et langage Nouvelles méthodes dans le traitement du langage parlé

Des chercheurs explorent des approches sans texte pour mieux comprendre le langage parlé.

2025-07-13T18:11:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la parole

Un nouveau modèle améliore la clarté de la voix en s'attaquant au bruit et aux échos.

2025-07-12T15:20:35+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'analyse d'images médicales basées sur la voix

Un nouveau jeu de données permet aux soins de santé d'utiliser des systèmes de questions par la parole pour les images médicales.

2025-07-12T04:00:30+00:00 ― 9 min lire

Calcul et langage Optimisation de la correction des erreurs ASR avec des modèles de langue

Une étude sur l'amélioration de la précision de la transcription grâce à une meilleure conception des invites.

2025-07-11T15:03:05+00:00 ― 7 min lire

Son Améliorer la reconnaissance des émotions dans la parole dans des environnements bruyants

Une nouvelle approche améliore les systèmes de reconnaissance vocale en utilisant des descriptions de l'environnement sonore.

2025-07-11T06:08:40+00:00 ― 8 min lire

Son Approche innovante pour la formation d'assistants vocaux

Combiner la synthèse vocale et des données réelles améliore efficacement les systèmes de reconnaissance vocale.

2025-07-10T00:59:40+00:00 ― 5 min lire

Son Avancées dans les interfaces de langage silencieux

Une nouvelle méthode améliore la conversion de la parole silencieuse en audio compréhensible.

2025-07-09T22:33:55+00:00 ― 7 min lire

Son Avancées dans les techniques de séparation de la parole audio-visuelle

Une nouvelle méthode améliore la séparation des voix dans des environnements bruyants avec plusieurs intervenants.

2025-07-09T16:53:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une nouvelle méthode pour mesurer la signification du son

Cette étude présente une méthode pour évaluer le sens des signaux sonores.

2025-07-09T16:05:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les technologies de reconnaissance de la parole chuchotée

De nouvelles méthodes visent à améliorer la reconnaissance de la parole chuchotée dans les systèmes automatiques.

2025-07-08T08:30:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec la collaboration de l'IA

Les modèles d'IA améliorent la précision des conversions de la parole en texte.

2025-07-07T09:50:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Équilibrer la vie privée et l'utilité dans l'analyse de conversation

Examiner des techniques pour protéger la vie privée tout en analysant des conversations enregistrées.

2025-07-07T04:10:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole SynesLM : Faire avancer la technologie de la parole audio-visuelle

Un nouveau modèle intègre des données audio et visuelles pour la reconnaissance vocale et la traduction.

2025-07-06T20:04:15+00:00 ― 8 min lire

Son S'attaquer aux défis de la reconnaissance des accents dans la technologie de la parole

De nouvelles méthodes améliorent la précision de la reconnaissance vocale pour les accents divers.

2025-07-05T05:12:15+00:00 ― 6 min lire

Calcul et langage Nouveau cadre transforme la parole en graphes de connaissances

Wav2graph crée des graphes de connaissances à partir de la langue parlée pour améliorer la compréhension de l'IA.

2025-07-04T04:06:10+00:00 ― 9 min lire

Son Présentation de MulliVC : Système de conversion vocale de nouvelle génération

MulliVC transforme les voix à travers les langues avec une précision et une clarté impressionnantes.

2025-07-03T11:54:30+00:00 ― 6 min lire

Robotique Les robots apprennent à lire les émotions humaines

Un nouveau système de navigation robotique comprend les commandes vocales à travers les émotions.

2025-07-02T20:42:06+00:00 ― 7 min lire

Calcul et langage Le nouveau modèle TOGGL améliore la transcription vocale

Le modèle TOGGL améliore la précision de la transcription dans les situations de discours qui se chevauchent.

2025-07-02T03:31:10+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'apprentissage de la représentation du bruit contextuel

Une méthode pour améliorer la qualité de la reconnaissance vocale dans des environnements bruyants.

2025-07-01T23:28:15+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la technologie vocale avec SaSLaW

Des chercheurs ont développé SaSLaW pour améliorer l'adaptation de la parole des machines dans divers environnements.

2025-07-01T16:11:00+00:00 ― 6 min lire

Calcul et langage Évaluer le biais dans les modèles de langage parlé

Un nouveau jeu de données met en lumière les biais dans les modèles de parole en fonction du genre et de l'âge.

2025-06-30T19:07:50+00:00 ― 10 min lire

Calcul et langage Avancées dans les modèles de parole grâce aux techniques de taille

Des recherches montrent comment rendre les modèles de discours plus petits et plus efficaces.

2025-06-29T16:24:35+00:00 ― 7 min lire

Son Améliorer la détection de mots-clés grâce à l'entraînement adversarial

L'entraînement adversarial améliore la précision de détection des mots-clés dans la parole synthétique et réelle.

2025-06-28T13:41:20+00:00 ― 7 min lire

Calcul et langage Évaluation des modèles de reconnaissance des émotions dans la parole avec un nouveau benchmark

Un nouveau standard améliore l'évaluation des systèmes de reconnaissance des émotions dans la parole, toutes langues et émotions confondues.

2025-06-28T04:15:30+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale multilingue sans données originales

De nouvelles méthodes améliorent les modèles ASR pour plusieurs langues, tout en préservant les connaissances passées.

2025-06-27T15:01:00+00:00 ― 6 min lire

Calcul et langage Amélioration de la reconnaissance vocale bilingue avec XCB

Une nouvelle approche améliore la reconnaissance des phrases en code-switching dans le discours bilingue.

2025-06-27T11:46:40+00:00 ― 7 min lire

Apprentissage automatique Avancées dans le traitement de séquences avec MRConv

Une nouvelle méthode pour mieux gérer les longues séquences de données.

2025-06-26T07:21:36+00:00 ― 6 min lire

Calcul et langage Le rôle de la prosodie et de la pragmatique dans la technologie de la parole

Examiner comment les patterns vocaux influencent le sens et la performance technologique.

2025-06-25T21:43:15+00:00 ― 6 min lire

Son Défis pour détecter des signaux de parole partiellement faux

Un aperçu des complexités pour identifier des pistes audio mixées.

2025-06-25T06:20:10+00:00 ― 8 min lire

Calcul et langage O-HuBERT : Un pas en avant dans la reconnaissance vocale

O-HuBERT améliore la reconnaissance vocale en séparant le contenu et l'information expressive.

2025-06-24T20:04:24+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale en hindi avec du pseudo-labelling

Une nouvelle méthode améliore la reconnaissance vocale pour l'hindi en utilisant des techniques de pseudo-étiquetage.

2025-06-24T06:02:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Préserver les dialectes tamouls grâce à la technologie

Un système pour classer les dialectes tamouls littéraires et colloquiaux en utilisant des caractéristiques sonores.

2025-06-23T13:51:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la Reconnaissance Vocale : Chuchoté vs. Normal

De nouvelles méthodes améliorent la compréhension de la parole chuchotée et normale par les ordinateurs.

2025-06-23T08:59:30+00:00 ― 6 min lire

Apprentissage automatique Comprendre le découpage en micro-lots dans le machine learning

Un aperçu du micro-batch clipping et ses avantages pour l'entraînement des modèles.

2025-06-23T05:45:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale japonaise avec des techniques GER

Des recherches montrent comment les LLM améliorent la reconnaissance vocale automatique en japonais.

2025-06-23T04:08:00+00:00 ― 7 min lire

Calcul et langage Comment les modèles de parole apprennent les suprasegmentaux

Cet article examine comment les modèles reconnaissent le ton, l'accentuation et les accents de hauteur.

2025-06-22T21:19:54+00:00 ― 6 min lire

Calcul et langage Présentation de SALSA : Une nouvelle méthode pour améliorer la reconnaissance vocale

SALSA améliore la précision de la reconnaissance vocale pour les langues à faibles ressources en intégrant des modèles ASR et des modèles linguistiques.

2025-06-22T06:16:15+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance automatique de la parole avec des modèles de langue

Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des modèles de langue pour de meilleures transcriptions.

2025-06-21T20:33:15+00:00 ― 5 min lire

Calcul et langage Améliorer la précision du marquage des intervenants dans les conversations

Un nouveau système corrige les erreurs d'identification des intervenants pour des transcriptions de conversation plus claires.

2025-06-21T18:56:05+00:00 ― 9 min lire

Son Avancées dans les techniques d'amélioration de la parole

Améliorer la clarté de la parole grâce à des filtres hybrides et des réseaux neuronaux.

2025-06-21T17:18:55+00:00 ― 6 min lire