Derniers articles pour Reconnaissance vocale

Son Faire progresser la reconnaissance vocale avec un transducteur temporel sparse

Nouveau modèle améliore la vitesse de reconnaissance vocale et l'utilisation de la mémoire.

2025-10-07T23:42:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de reconnaissance vocale sensible au domaine

De nouvelles méthodes améliorent la reconnaissance vocale dans des domaines spécifiques sans avoir besoin de beaucoup de données.

2025-10-07T15:37:00+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les embeddings acoustiques de mots

Un nouveau modèle améliore la façon dont les ordinateurs traitent la langue parlée.

2025-10-07T04:16:50+00:00 ― 5 min lire

Calcul et langage Avancées dans la technologie de reconnaissance vocale

Le transducteur de risque de Bayes améliore l'efficacité et la précision de la reconnaissance vocale.

2025-10-06T21:31:36+00:00 ― 6 min lire

Calcul et langage Avancées dans le question-réponse parlé avec LibriSQA

Nouvelle base de données et cadre améliorent les capacités de réponse aux questions orales.

2025-10-06T17:42:30+00:00 ― 5 min lire

Son Nouveau cadre améliore la reconnaissance vocale avec des métadonnées

Intégrer des métadonnées améliore les performances dans des tâches de parole comme l'identification de langue.

2025-10-06T12:05:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de transducteurs pour la reconnaissance vocale

Cet article parle des capacités en temps réel du modèle Transducer et des améliorations récentes.

2025-10-06T11:16:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'identification de sujets à partir de données audio

La recherche explore des méthodes pour identifier des sujets directement à partir d'enregistrements audio.

2025-10-05T23:56:25+00:00 ― 6 min lire

Son Faire avancer la technologie de la parole avec SCRAPS

Un nouveau modèle relie la phonétique et l'acoustique pour améliorer la technologie de la parole.

2025-10-05T13:24:50+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans la détection de locuteur actif grâce à l'audio

Des recherches montrent les avantages de plusieurs micros pour détecter et localiser les intervenants.

2025-10-03T11:12:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec PCNN

Présentation d'un nouveau modèle pour parler plus clairement dans les environnements bruyants.

2025-10-03T07:58:20+00:00 ― 6 min lire

Son Avancées dans la diarisation des intervenants grâce à l'intégration audio-visuelle

De nouveaux systèmes améliorent l'identification des locuteurs en utilisant à la fois des données audio et visuelles.

2025-10-02T15:46:40+00:00 ― 6 min lire

Calcul et langage Progrès dans la technologie de formation à la prononciation

Les chercheurs améliorent l'entraînement à la prononciation avec de nouvelles technologies pour les apprenants de langues.

2025-10-02T07:40:50+00:00 ― 7 min lire

Recherche d'informations Progrès dans la technologie de recherche vocale

La technologie de recherche vocale évolue, corrigeant les erreurs de reconnaissance vocale pour une meilleure expérience utilisateur.

2025-09-30T17:00:24+00:00 ― 8 min lire

Son Avancées dans la détection de faux audio avec RAWM

Une nouvelle méthode améliore la détection des faux audios grâce à la modification adaptative des poids.

2025-09-29T01:08:15+00:00 ― 7 min lire

Son Avancées dans la reconnaissance vocale du locuteur cible

Un nouveau modèle améliore la reconnaissance vocale dans des environnements bruyants en se concentrant sur un seul locuteur.

2025-09-28T08:08:00+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancer la reconnaissance vocale bilingue avec des unités de graphèmes

Améliorer les systèmes ASR hybrides pour la parole bilingue en utilisant des unités de graphèmes.

2025-09-27T03:47:35+00:00 ― 7 min lire

Calcul et langage Avancées dans l'apprentissage joint parole-texte

Un nouveau modèle améliore l'alignement de la parole et du texte pour une meilleure reconnaissance automatique.

2025-09-27T02:10:25+00:00 ― 7 min lire

Calcul et langage Nouvelles méthodes pour évaluer la diarisation des locuteurs

Présentation de nouvelles métriques pour évaluer la précision de la diarisation des locuteurs dans l'IA conversationnelle.

2025-09-26T18:04:30+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de reconnaissance vocale

De nouvelles méthodes améliorent la précision et la rapidité des systèmes de reconnaissance vocale.

2025-09-26T11:35:55+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance automatique de la parole avec injection de texte

Une nouvelle méthode améliore la performance de la reconnaissance vocale grâce à l'intégration de données textuelles.

2025-09-26T07:33:00+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'injection de texte

L'injection de texte aide à reconnaître les infos perso tout en gardant la vie privée.

2025-09-26T06:44:25+00:00 ― 7 min lire

Son Avancées dans la reconnaissance vocale avec la technologie mmWave

Radio2Text utilise des signaux mmWave pour la reconnaissance vocale en temps réel dans des environnements bruyants.

2025-09-25T22:38:35+00:00 ― 8 min lire

Calcul et langage Améliorer la conversion graphème-phonème avec une nouvelle méthode d'échantillonnage

Cette étude améliore les modèles G2P en se concentrant sur les zones sujettes aux erreurs pendant l'entraînement.

2025-09-25T05:38:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de suivi de formants

Découvrez des méthodes qui améliorent la précision du suivi des formants pour l'analyse de la parole.

2025-09-24T22:21:05+00:00 ― 9 min lire

Calcul et langage Avancées dans la modélisation du langage parlé

De nouvelles méthodes améliorent le traitement et la génération de la parole dans les modèles linguistiques.

2025-09-19T16:02:05+00:00 ― 6 min lire

Son Avancées dans la technologie de suppression du bruit

Des nouvelles techniques améliorent la clarté audio dans des environnements bruyants.

2025-09-19T15:13:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer le repérage de mots-clés en few-shot avec des données de discours de lecture

De nouvelles méthodes améliorent la détection de mots-clés en utilisant les données de parole disponibles.

2025-09-19T13:36:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancer l'estimation de confiance dans la reconnaissance automatique de la parole

Une nouvelle méthode améliore l'estimation de confiance dans les systèmes ASR pour une meilleure précision.

2025-09-15T03:14:28+00:00 ― 6 min lire

Apprentissage automatique Défis d'utilisation des Convnets pour la conception de filtres audio

Cette étude explore les problèmes liés à l'utilisation des convnets pour la création de filtres audio.

2025-09-14T14:34:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la diarisation des locuteurs avec des modèles de langue

Cet article explore les avancées en diarisation des locuteurs en utilisant des modèles de langue pour plus de précision.

2025-09-14T03:14:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole PromptASR : Une techno de reconnaissance vocale de folie

Nouveau système améliore la reconnaissance vocale grâce à des invites conscientes du contexte.

2025-09-13T10:14:10+00:00 ― 5 min lire

Son Avancées dans les modèles Universal Audio

EnCodecMAE combine l'apprentissage auto-supervisé et les codecs audio pour améliorer les performances dans les tâches audio.

2025-09-13T09:25:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Une nouvelle approche pour repérer des mots-clés

Présentation d'une méthode flexible pour reconnaître les mots-clés dans la parole à travers les langues.

2025-09-13T06:11:15+00:00 ― 7 min lire

Son Nouveau système améliore l'extraction vocale depuis des positions de tête instables

PIAVE aide les machines à extraire les voix clairement, même quand les intervenants tournent la tête.

2025-09-12T19:39:40+00:00 ― 7 min lire

Son Un nouveau cadre pour l'anonymisation des intervenants

Présentation d'un cadre flexible pour améliorer la recherche sur la confidentialité vocale.

2025-09-12T05:05:10+00:00 ― 9 min lire

Calcul et langage Améliorer les explications pour les modèles de parole

Une nouvelle méthode simplifie la compréhension des modèles de classification de la parole.

2025-09-12T02:39:25+00:00 ― 8 min lire

Son M-AUDIODEC : Une nouvelle façon de compresser l'audio

M-AUDIODEC compresse l'audio multi-canaux tout en gardant la position des enceintes et la qualité.

2025-09-11T16:56:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la qualité sonore dans les écouteurs

Des recherches montrent de nouveaux modèles pour améliorer la clarté de la voix dans les écouteurs intelligents.

2025-09-11T12:04:55+00:00 ― 6 min lire

Intelligence artificielle Améliorer la compréhension des instructions humaines par les robots

Une nouvelle méthode améliore la capacité des robots à suivre les instructions verbales avec précision.

2025-09-11T08:21:18+00:00 ― 7 min lire