Génie électrique et science des systèmes - Traitement de l'audio et de la parole

RSS

Son AffectEcho : Relier les émotions dans la parole AI

Le modèle AffectEcho améliore l'expression émotionnelle dans la parole générée par l'IA.

2025-09-25T07:15:30+00:00 ― 7 min lire

Calcul et langage Améliorer la conversion graphème-phonème avec une nouvelle méthode d'échantillonnage

Cette étude améliore les modèles G2P en se concentrant sur les zones sujettes aux erreurs pendant l'entraînement.

2025-09-25T05:38:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de suivi de formants

Découvrez des méthodes qui améliorent la précision du suivi des formants pour l'analyse de la parole.

2025-09-24T22:21:05+00:00 ― 9 min lire

Traitement de l'audio et de la parole Utiliser l'analyse vocale pour évaluer la gravité de la maladie de Parkinson

Des chercheurs développent des méthodes basées sur la parole pour une évaluation plus précise de la maladie de Parkinson.

2025-09-24T21:32:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la détection sonore avec des techniques d'apprentissage meta

Meta-SELD améliore la localisation des événements sonores dans des environnements variés.

2025-09-24T19:55:20+00:00 ― 7 min lire

Apprentissage automatique Moments Audiovisuels dans le Temps : Un Nouveau Jeu de Données pour la Reconnaissance d'Actions

AVMIT offre aux chercheurs des idées sur la façon dont le son et la vision sont liés dans la reconnaissance d'actions.

2025-09-24T07:46:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la prédiction de la qualité audio avec GML

Un nouveau modèle d'IA améliore la prédiction des scores de qualité audio.

2025-09-24T03:43:40+00:00 ― 7 min lire

Son Génération de musique par IA : Une étude sur les techniques d'échantillonnage

Cette recherche examine comment les méthodes d'échantillonnage affectent la qualité de la musique générée par l'IA.

2025-09-24T02:55:05+00:00 ― 7 min lire

Son Avancées dans la technologie anti-fraude audio

Une nouvelle méthode améliore la détection des faux audios dans les systèmes de reconnaissance vocale.

2025-09-23T23:40:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans le suivi du rythme pour la musique classique

De nouvelles méthodes améliorent la précision du suivi du rythme dans la musique classique complexe.

2025-09-23T14:46:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Comprendre le rôle de la diarisation linguistique

Un aperçu de comment la diarisation linguistique aide dans les conversations multilingues.

2025-09-22T23:23:15+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans le cadre de génération de texture audio

Un nouveau cadre simplifie la génération de textures audio en réduisant les besoins en étiquetage.

2025-09-22T22:34:40+00:00 ― 8 min lire

Son Avancées dans la reconnaissance vocale pour les environnements bruyants

Un nouveau système améliore la reconnaissance vocale dans des environnements bruyants en utilisant des techniques avancées.

2025-09-22T21:46:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluation de la performance de la base de référence B1 du défi VoicePrivacy

Évaluer l'efficacité de l'anonymisation vocale sans perdre le son naturel.

2025-09-22T14:28:50+00:00 ― 8 min lire

Son Avancées dans la classification audio avec LCANets++

De nouveaux modèles améliorent la précision de la classification audio et la résistance au bruit et aux attaques.

2025-09-22T12:51:40+00:00 ― 6 min lire

Son IA dans la musique : Outils et techniques de création

Un aperçu des outils IA pour la création musicale et leurs fonctionnalités uniques.

2025-09-22T08:48:45+00:00 ― 15 min lire

Son Générer des sons réalistes à partir de vidéos silencieuses

La recherche explore l'apprentissage profond pour créer de l'audio qui colle avec des vidéos silencieuses.

2025-09-22T04:45:50+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Combiner le son et les visuels pour améliorer la qualité audio

Une nouvelle méthode améliore les enregistrements sonores en utilisant des indices visuels.

2025-09-22T03:57:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Évaluation de la qualité du discours avec les modèles XLS-R

Un aperçu de comment les modèles XLS-R améliorent l'évaluation de la qualité audio lors des réunions en ligne.

2025-09-22T01:31:30+00:00 ― 7 min lire

Son Améliorer le marquage audio avec le cadre CED

Une nouvelle méthode améliore la performance et l'efficacité du tagging audio.

2025-09-22T00:42:55+00:00 ― 7 min lire

Son Nouvelle étude sur la détection de la parole générée par l'IA

La recherche met en avant des méthodes de détection en temps réel pour les faux audios créés par l'IA.

2025-09-21T19:02:50+00:00 ― 7 min lire

Son Whombat : Un nouvel outil pour la recherche bioacoustique

Whombat simplifie l'annotation des enregistrements sonores pour la recherche sur la faune.

2025-09-21T18:14:15+00:00 ― 6 min lire

Son Avancées dans les techniques d'amélioration de la parole

De nouvelles stratégies améliorent la clarté de la parole dans des environnements bruyants pour une meilleure reconnaissance.

2025-09-21T17:25:40+00:00 ― 7 min lire

Multimédia Lier les émotions dans les images à la recherche musicale

Un nouveau système relie des images émotionnelles à la musique pour une meilleure découverte.

2025-09-21T16:37:05+00:00 ― 7 min lire

Son Améliorer la qualité sonore des enregistrements quotidiens

Un nouveau système améliore les enregistrements audio pour une meilleure expérience d'écoute.

2025-09-21T15:48:30+00:00 ― 7 min lire

Son Améliorer la bioacoustique avec des techniques d'apprentissage actif

Une nouvelle méthode réduit le besoin d'étiquetage des données tout en améliorant la précision de la classification audio.

2025-09-21T14:11:20+00:00 ― 6 min lire

Son Avancées dans la technologie de synthèse vocale pour un langage naturel

Un nouveau système améliore la qualité de la parole et l'expressivité pour la synthèse de paragraphes.

2025-09-21T11:45:35+00:00 ― 6 min lire

Son Évaluer la qualité de la musique générée par l'IA

Découvre des méthodes pour évaluer la qualité de la musique créée par l'IA grâce à des évaluations subjectives et objectives.

2025-09-21T10:08:25+00:00 ― 7 min lire

Son Nouvelles perspectives sur le mouvement de la langue pendant la parole

La recherche se concentre sur les mouvements de la langue pour aider à la thérapie de la parole et à l'apprentissage des langues.

2025-09-21T04:28:20+00:00 ― 5 min lire

Traitement de l'audio et de la parole Impact du genre sur les systèmes biométriques vocaux

Cette étude examine comment le genre influence l'utilité, la vie privée et l'équité des biométries vocales.

2025-09-20T19:33:55+00:00 ― 9 min lire

Son Améliorer la synthèse vocale avec des techniques de taille

De nouvelles méthodes de réduction améliorent les performances du modèle de synthèse vocale multi-locuteurs en zéro-shot.

2025-09-20T15:31:00+00:00 ― 9 min lire

Calcul et langage Comprendre les émotions dans les conversations d'urgence

Des recherches sur la reconnaissance des émotions dans les interactions d'appels d'urgence révèlent des informations importantes.

2025-09-20T14:42:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'apprentissage auto-supervisé pour la reconnaissance vocale

De nouvelles méthodes pour sélectionner des données de discours minimisent l'étiquetage tout en améliorant la précision de reconnaissance.

2025-09-20T13:53:50+00:00 ― 7 min lire

Son Faire avancer la reconnaissance des émotions dans la parole avec le transformateur temps-fréquence

Une nouvelle méthode améliore la reconnaissance des émotions dans la parole en analysant le temps et la fréquence.

2025-09-20T12:16:40+00:00 ― 7 min lire

Physique quantique La technologie quantique rencontre la création musicale

Explore comment les outils quantiques transforment la production musicale pour les artistes.

2025-09-20T08:57:42+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer l'évaluation de la qualité de la parole avec des scores de préférence

Une nouvelle méthode améliore le classement de la qualité de la parole en utilisant les scores de préférence des auditeurs.

2025-09-20T07:25:10+00:00 ― 7 min lire

Son Améliorer la reconnaissance vocale pour les personnes qui bégaient

Une méthode pour améliorer les systèmes ASR pour les utilisateurs qui bégayent.

2025-09-20T06:36:35+00:00 ― 7 min lire

Son Problèmes d'accès dans le Million Song Dataset

Les défis pour accéder aux données audio freinent les opportunités de recherche.

2025-09-20T00:07:55+00:00 ― 6 min lire

Son Avancées dans la technologie d'isolement vocal

De nouvelles méthodes améliorent la clarté dans des environnements bruyants grâce à un traitement sonore avancé.

2025-09-19T22:30:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de synthèse vocale française

Un nouveau système développé génère des discours français réalistes pour une compétition.

2025-09-19T21:42:10+00:00 ― 7 min lire