Génie électrique et science des systèmes - Traitement de l'audio et de la parole

RSS

Calcul et langage Avancées dans les systèmes de réponse audio aux questions

De nouveaux modèles améliorent la façon dont les machines réagissent aux questions basées sur l’audio.

2025-10-30T13:25:05+00:00 ― 6 min lire

Calcul et langage Améliorer l'identification des langues dans la parole en alternance

La recherche vise à améliorer la détection de la langue dans les conversations anglais-mandarin.

2025-10-30T12:36:30+00:00 ― 9 min lire

Calcul et langage Avancées dans la synthèse vocale en suisse-allemand

De nouvelles méthodes améliorent la synthèse vocale pour l'allemand suisse à partir de textes en allemand standard.

2025-10-30T10:59:20+00:00 ― 6 min lire

Calcul et langage Avancées dans les systèmes de reconnaissance vocale multilingue

Explorer des méthodes pour améliorer la reconnaissance vocale multilingue dans les langues indiennes.

2025-10-30T10:10:45+00:00 ― 7 min lire

Son Avancer la Détection d'Activité Voix avec SVVAD

Découvrez comment SVVAD améliore la détection de l'activité vocale pour une meilleure vérification des locuteurs.

2025-10-30T09:22:10+00:00 ― 6 min lire

Son Avancées dans l'évaluation automatique de la prononciation

Une nouvelle méthode améliore les retours sur la prononciation pour les apprenants de langues.

2025-10-30T08:33:35+00:00 ― 7 min lire

Calcul et langage Mesurer l'adaptabilité des modèles de reconnaissance vocale

Un nouveau cadre évalue comment les modèles de parole s'adaptent à des tâches spécifiques.

2025-10-30T06:56:25+00:00 ― 8 min lire

Calcul et langage Progrès dans la traduction de la parole multilingue

La recherche améliore la traduction vocale multilingue en utilisant des connaissances sémantiques.

2025-10-30T06:07:50+00:00 ― 5 min lire

Son Faire avancer le traitement de la parole avec HuBERT

Les modèles HuBERT améliorent les tâches de parole en utilisant plusieurs résolutions pour de meilleures performances.

2025-10-29T22:02:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'identification des locuteurs

De nouvelles techniques améliorent la précision pour reconnaître les intervenants et détecter les imposteurs.

2025-10-29T20:24:50+00:00 ― 6 min lire

Son Amélioration des effets audio analogiques virtuels avec l'apprentissage profond

Une nouvelle approche améliore la réponse de phase dans les effets audio virtuels en utilisant l'apprentissage profond.

2025-10-29T18:47:40+00:00 ― 6 min lire

Son Ralentissement dans la Reconnaissance Vocale : Un Regard de Plus Près sur SlothSpeech

SlothSpeech dévoile des failles dans les systèmes de reconnaissance vocale, les ralentissant considérablement.

2025-10-29T17:10:30+00:00 ― 6 min lire

Son UnDiff : Une nouvelle approche pour la clarté audio

UnDiff améliore la qualité audio grâce à des techniques innovantes de restauration de la parole.

2025-10-29T16:21:55+00:00 ― 7 min lire

Calcul et langage Nouvelles perspectives sur la modélisation du langage parlé génératif

Les chercheurs étudient comment le GSLM traite la parole dans des environnements bruyants.

2025-10-29T15:33:20+00:00 ― 8 min lire

Son Avancées dans la technologie de détection du bégaiement

De nouvelles méthodes en apprentissage automatique améliorent les capacités de détection du bégaiement.

2025-10-29T14:44:45+00:00 ― 6 min lire

Son EmoMix : Faire avancer la synthèse vocale émotionnelle

EmoMix permet de créer des discours exprimant des émotions mélangées avec une intensité précise.

2025-10-29T13:56:10+00:00 ― 6 min lire

Son MW-MAE : Une nouvelle approche de l'apprentissage audio

Découvrez la méthode innovante du Multi-Window Masked Autoencoder pour améliorer le traitement audio.

2025-10-29T11:30:25+00:00 ― 6 min lire

Son Améliorer la restauration audio avec des indices visuels

Une nouvelle méthode fusionne des données audio et visuelles pour réparer la parole manquante.

2025-10-29T10:41:50+00:00 ― 7 min lire

Calcul et langage Lutter contre les discours de haine dans les langues à faibles ressources

Explorer des méthodes pour détecter les discours de haine dans les diffusions audio de langues sous-représentées.

2025-10-29T09:04:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Raviver le Son : La Méthode BABE pour la Restauration Audio

Une nouvelle méthode restaure les hautes fréquences perdues dans les enregistrements historiques.

2025-10-29T06:38:55+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la technologie ASR avec la minimisation de l'entropie généralisée au niveau séquentiel

Une nouvelle méthode améliore les systèmes de reconnaissance automatique de la parole pour plus de précision et d'adaptabilité.

2025-10-29T02:36:00+00:00 ― 7 min lire

Son Faire avancer la simulation sonore avec BEDRF

Un nouveau modèle améliore la diffraction du son dans les environnements virtuels.

2025-10-29T01:47:25+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale avec un biais contextuel

Le biais contextuel améliore les systèmes de reconnaissance vocale, augmentant la précision dans les tâches spécialisées.

2025-10-29T00:58:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de conversion des émotions de la parole

Une nouvelle approche pour changer les émotions dans la parole au milieu du bruit ambiant.

2025-10-28T23:21:40+00:00 ― 8 min lire

Son Nouvelle méthode pour améliorer la détection de la prononciation des langues

Cette étude présente un nouveau système pour détecter les erreurs de prononciation chez les apprenants de langues.

2025-10-28T21:44:30+00:00 ― 7 min lire

Son Une nouvelle approche pour réarranger la musique

Le système Q A utilise l'apprentissage auto-supervisé pour réorganiser la musique de manière innovante.

2025-10-28T20:07:20+00:00 ― 7 min lire

Son Amélioration de la synthèse vocale expressive avec TVC-GMM

Une nouvelle méthode améliore la qualité du texte en parole et l'expression émotionnelle.

2025-10-28T18:30:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la clarté de la parole avec des techniques audio-visuelles

Des chercheurs combinent des données audio et visuelles pour améliorer la compréhension de la parole dans des endroits bruyants.

2025-10-28T17:41:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Contrôle Actif du Bruit : Réduire les Sons Indésirables

Découvre comment la technologie de contrôle actif du bruit est en train de changer notre expérience sonore.

2025-10-28T16:53:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale avec des modèles plus petits

Des techniques pour réduire la taille des modèles tout en gardant la performance émergent.

2025-10-28T15:15:50+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans les effets de phasage numérique

Nouveau modèle imite les effets de phasage analogique avec des techniques d'apprentissage améliorées.

2025-10-28T12:50:05+00:00 ― 6 min lire

Calcul et langage Faire avancer la reconnaissance vocale multilingue avec DistilXLSR

Un nouveau modèle réduit la taille tout en améliorant la reconnaissance vocale multilingue.

2025-10-28T11:12:55+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale pour des accents variés

Une nouvelle méthode améliore la précision de la reconnaissance vocale pour les accents africains.

2025-10-28T09:35:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer les évaluations de la technologie de la parole grâce à des rapports détaillés

Examiner l'impact des évaluations détaillées sur les systèmes de synthèse vocale.

2025-10-28T07:58:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'annulation d'écho

Améliorer la clarté de la voix grâce à des techniques d'annulation d'écho efficaces et au machine learning.

2025-10-28T05:32:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Suivi en temps réel des voix chantées avec SingNet

SingNet améliore le suivi des beats dans les voix chantées en utilisant des données passées.

2025-10-28T04:44:15+00:00 ― 7 min lire

Calcul et langage Avancées dans la reconnaissance vocale pour plusieurs intervenants

Un nouveau système améliore la reconnaissance vocale dans des situations avec plusieurs intervenants.

2025-10-28T00:41:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de la conversion des lèvres en parole

LipVoicer génère une voix claire à partir de vidéos silencieuses en utilisant des méthodes de lecture labiale avancées.

2025-10-27T21:27:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance de la parole dysarthrique avec des approches innovantes

De nouvelles méthodes visent à améliorer la communication des personnes atteintes de dysarthrie.

2025-10-27T21:01:09+00:00 ― 8 min lire

Traitement de l'audio et de la parole Combiner le traitement de la parole avec l'apprentissage visuel

Cette étude examine les avantages de fusionner le traitement de la parole avec des données visuelles.

2025-10-27T20:38:25+00:00 ― 8 min lire