Derniers articles pour Technologie de la parole

Son Avancées dans les systèmes de contre-mesures vocales

Des chercheurs améliorent la détection de la parole générée par machine en ajustant les informations de phase.

2025-10-26T17:55:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale non supervisée

Un nouveau cadre améliore l'étude des systèmes de reconnaissance vocale non supervisée.

2025-10-25T13:34:45+00:00 ― 9 min lire

Son LinDiff : Un grand pas en avant dans la synthèse vocale

Le nouveau modèle LinDiff améliore la vitesse et la qualité de la synthèse vocale.

2025-10-25T00:37:25+00:00 ― 6 min lire

Son Avancées innovantes dans la technologie de la parole électrolaryngée

Des chercheurs mélangent des caractéristiques visuelles et sonores pour améliorer la parole des utilisateurs d'électrolarynx.

2025-10-24T12:28:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec de grands modèles de langage

Cette recherche montre comment les LLM améliorent la compréhension de la parole dans les longues vidéos.

2025-10-23T22:42:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Gestion efficace des grands modèles de parole

Une nouvelle méthode optimise les modèles de parole pour de meilleures performances avec moins de ressources.

2025-10-23T21:54:10+00:00 ― 7 min lire

Apprentissage automatique EM-Réseau : Une nouvelle approche dans l'apprentissage des séquences

EM-Network améliore l'apprentissage des séquences dans les tâches de traitement de la parole et du langage.

2025-10-23T07:19:40+00:00 ― 7 min lire

Son Évaluer la qualité de la parole avec des modèles d'apprentissage automatique

Cette étude évalue différents modèles pour prédire la qualité de la parole synthétisée.

2025-10-21T16:27:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale grâce à des ensembles basés sur la confiance

Cet article parle d'améliorer la reconnaissance vocale en utilisant des méthodes d'ensemble basées sur la confiance.

2025-10-16T18:14:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancer dans le texte-à-parole : Explication du modèle GenerTTS

GenerTTS améliore la technologie de synthèse vocale pour des applications multilingues.

2025-10-16T15:48:45+00:00 ― 6 min lire

Son Avancée de la technologie d'isolation vocale

Un nouveau modèle améliore l'extraction de la parole des bruits de fond grâce à l'apprentissage profond.

2025-10-16T02:02:50+00:00 ― 6 min lire

Son Avancées dans la synthèse de la parole articulatoire

Une étude sur l'amélioration de la reproduction sonore vocale grâce à des techniques de synthèse avancées.

2025-10-11T02:12:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'anonymisation des locuteurs

De nouvelles méthodes visent à cacher l'identité des intervenants tout en gardant la clarté de la parole.

2025-10-08T01:20:00+00:00 ― 7 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Intelligence artificielle Mesurer les émotions dans la parole : Une nouvelle approche

Des chercheurs analysent comment les émotions se partagent à travers la parole en utilisant des données variées.

2025-10-03T09:07:42+00:00 ― 7 min lire

Calcul et langage Avancées dans la technologie de synthèse vocale

De nouvelles méthodes améliorent la qualité de la parole synthétisée grâce à l'apprentissage auto-supervisé.

2025-09-30T17:37:25+00:00 ― 6 min lire

Son Faire avancer la reconnaissance vocale avec l'apprentissage fédéré

L'apprentissage fédéré améliore la reconnaissance vocale tout en gardant les données des utilisateurs privées.

2025-09-30T08:43:00+00:00 ― 7 min lire

Calcul et langage EmoDistill : Faire avancer la reconnaissance des émotions dans la parole

Une nouvelle méthode améliore la détection des émotions à partir de la parole en utilisant uniquement l'audio.

2025-09-28T23:55:36+00:00 ― 6 min lire

Apprentissage automatique O-1 : Une nouvelle frontière dans l’entraînement à la reconnaissance vocale

O-1 améliore la reconnaissance vocale en optimisant les méthodes d'auto-formation.

2025-09-26T09:10:10+00:00 ― 6 min lire

Son Nouvelle étude sur la détection de la parole générée par l'IA

La recherche met en avant des méthodes de détection en temps réel pour les faux audios créés par l'IA.

2025-09-21T19:02:50+00:00 ― 7 min lire

Son Améliorer la synthèse vocale avec des techniques de taille

De nouvelles méthodes de réduction améliorent les performances du modèle de synthèse vocale multi-locuteurs en zéro-shot.

2025-09-20T15:31:00+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans l'apprentissage auto-supervisé pour la reconnaissance vocale

De nouvelles méthodes pour sélectionner des données de discours minimisent l'étiquetage tout en améliorant la précision de reconnaissance.

2025-09-20T13:53:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer l'évaluation de la qualité de la parole avec des scores de préférence

Une nouvelle méthode améliore le classement de la qualité de la parole en utilisant les scores de préférence des auditeurs.

2025-09-20T07:25:10+00:00 ― 7 min lire

Son Améliorer la reconnaissance vocale pour les personnes qui bégaient

Une méthode pour améliorer les systèmes ASR pour les utilisateurs qui bégayent.

2025-09-20T06:36:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans le suivi des formants pour le traitement de la parole

De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.

2025-09-19T02:16:10+00:00 ― 5 min lire

Calcul et langage Connecter la parole avec les modèles de langage : la méthode BLSP

Une nouvelle méthode améliore l'intégration de la parole avec les modèles de langage.

2025-09-18T15:44:35+00:00 ― 8 min lire

Calcul et langage Le rôle des modèles de langage préentraînés dans la synthèse vocale

Examiner comment les modèles de langage préentraînés améliorent la qualité de la synthèse vocale.

2025-09-17T20:18:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole MuLanTTS : Une nouvelle frontière dans la synthèse vocale

Le MuLanTTS de Microsoft propose des capacités de synthèse vocale en français naturelles et expressives.

2025-09-15T22:57:55+00:00 ― 6 min lire

Calcul et langage Avancées dans l'apprentissage auto-supervisé pour les technologies de la parole en français

Un projet vise à améliorer le traitement de la parole en français grâce à l'apprentissage auto-supervisé.

2025-09-14T12:57:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans l'annotation automatique de la prosodie

De nouvelles méthodes améliorent la façon dont les machines reconnaissent le rythme de la parole et les émotions.

2025-09-14T12:08:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès dans la reconnaissance vocale pour les enfants

Cette étude améliore la capacité des systèmes ASR à reconnaître la parole des enfants.

2025-09-14T02:25:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole VoxtLM : Une approche unifiée pour la parole et le texte

VoxtLM combine la reconnaissance vocale, la synthèse, la génération de texte et la continuité dans un seul modèle.

2025-09-13T11:02:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Libriheavy : Un nouveau dataset pour la reconnaissance vocale

Libriheavy propose 50 000 heures d'anglais parlé pour améliorer la technologie de reconnaissance vocale.

2025-09-12T18:51:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la clarté de la parole avec la technologie AV2Wav

AV2Wav améliore la qualité de la parole en utilisant des indices audio et visuels.

2025-09-12T17:13:55+00:00 ― 7 min lire

Son Optimiser la synthèse vocale avec la sélection de core-set

La sélection de sous-ensembles améliore les modèles de synthèse vocale en se concentrant sur des données variées.

2025-09-12T08:19:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Emo-StarGAN : Avancer la technologie de conversion vocale

Une nouvelle méthode préserve le ton émotionnel dans la conversion de voix pour une meilleure interaction humain-ordinateur.

2025-09-11T23:25:05+00:00 ― 7 min lire

Son Des discours émotionnels mettent à l'épreuve les modèles de séparation de discours

Des recherches montrent que le discours émotionnel influence les performances des modèles dans les tâches de séparation de la parole.

2025-09-11T18:33:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer l'inversion de la parole grâce à l'apprentissage auto-supervisé

La recherche combine l'apprentissage auto-supervisé et de nouvelles techniques de mesure pour améliorer l'inversion de la parole.

2025-09-10T01:15:50+00:00 ― 7 min lire

Son Améliorer la clarté de la parole électrolaryngée

Des chercheurs ont développé un nouveau cadre pour améliorer la clarté de la parole pour les utilisateurs d'électrolarynges.

2025-09-09T22:50:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer les systèmes ASR avec des données synthétiques

Une nouvelle méthode utilise des données synthétiques pour améliorer les systèmes ASR dans des domaines inconnus.

2025-09-09T15:32:50+00:00 ― 8 min lire