Génie électrique et science des systèmes - Traitement de l'audio et de la parole

Multimédia Lier les émotions dans les images à la recherche musicale

Un nouveau système relie des images émotionnelles à la musique pour une meilleure découverte.

2025-09-21T16:37:05+00:00 ― 7 min lire

Son Améliorer la qualité sonore des enregistrements quotidiens

Un nouveau système améliore les enregistrements audio pour une meilleure expérience d'écoute.

2025-09-21T15:48:30+00:00 ― 7 min lire

Son Améliorer la bioacoustique avec des techniques d'apprentissage actif

Une nouvelle méthode réduit le besoin d'étiquetage des données tout en améliorant la précision de la classification audio.

2025-09-21T14:11:20+00:00 ― 6 min lire

Son Avancées dans la technologie de synthèse vocale pour un langage naturel

Un nouveau système améliore la qualité de la parole et l'expressivité pour la synthèse de paragraphes.

2025-09-21T11:45:35+00:00 ― 6 min lire

Son Évaluer la qualité de la musique générée par l'IA

Découvre des méthodes pour évaluer la qualité de la musique créée par l'IA grâce à des évaluations subjectives et objectives.

2025-09-21T10:08:25+00:00 ― 7 min lire

Son Nouvelles perspectives sur le mouvement de la langue pendant la parole

La recherche se concentre sur les mouvements de la langue pour aider à la thérapie de la parole et à l'apprentissage des langues.

2025-09-21T04:28:20+00:00 ― 5 min lire

Traitement de l'audio et de la parole Impact du genre sur les systèmes biométriques vocaux

Cette étude examine comment le genre influence l'utilité, la vie privée et l'équité des biométries vocales.

2025-09-20T19:33:55+00:00 ― 9 min lire

Son Améliorer la synthèse vocale avec des techniques de taille

De nouvelles méthodes de réduction améliorent les performances du modèle de synthèse vocale multi-locuteurs en zéro-shot.

2025-09-20T15:31:00+00:00 ― 9 min lire

Calcul et langage Comprendre les émotions dans les conversations d'urgence

Des recherches sur la reconnaissance des émotions dans les interactions d'appels d'urgence révèlent des informations importantes.

2025-09-20T14:42:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'apprentissage auto-supervisé pour la reconnaissance vocale

De nouvelles méthodes pour sélectionner des données de discours minimisent l'étiquetage tout en améliorant la précision de reconnaissance.

2025-09-20T13:53:50+00:00 ― 7 min lire

Son Faire avancer la reconnaissance des émotions dans la parole avec le transformateur temps-fréquence

Une nouvelle méthode améliore la reconnaissance des émotions dans la parole en analysant le temps et la fréquence.

2025-09-20T12:16:40+00:00 ― 7 min lire

Physique quantique La technologie quantique rencontre la création musicale

Explore comment les outils quantiques transforment la production musicale pour les artistes.

2025-09-20T08:57:42+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer l'évaluation de la qualité de la parole avec des scores de préférence

Une nouvelle méthode améliore le classement de la qualité de la parole en utilisant les scores de préférence des auditeurs.

2025-09-20T07:25:10+00:00 ― 7 min lire

Son Améliorer la reconnaissance vocale pour les personnes qui bégaient

Une méthode pour améliorer les systèmes ASR pour les utilisateurs qui bégayent.

2025-09-20T06:36:35+00:00 ― 7 min lire

Son Problèmes d'accès dans le Million Song Dataset

Les défis pour accéder aux données audio freinent les opportunités de recherche.

2025-09-20T00:07:55+00:00 ― 6 min lire

Son Avancées dans la technologie d'isolement vocal

De nouvelles méthodes améliorent la clarté dans des environnements bruyants grâce à un traitement sonore avancé.

2025-09-19T22:30:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de synthèse vocale française

Un nouveau système développé génère des discours français réalistes pour une compétition.

2025-09-19T21:42:10+00:00 ― 7 min lire

Son Progrès dans la technologie de repérage des mots-clés

De nouvelles méthodes améliorent l'efficacité et la précision des systèmes de reconnaissance vocale.

2025-09-19T17:39:15+00:00 ― 7 min lire

Calcul et langage Avancées dans la modélisation du langage parlé

De nouvelles méthodes améliorent le traitement et la génération de la parole dans les modèles linguistiques.

2025-09-19T16:02:05+00:00 ― 6 min lire

Son Avancées dans la technologie de suppression du bruit

Des nouvelles techniques améliorent la clarté audio dans des environnements bruyants.

2025-09-19T15:13:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer le repérage de mots-clés en few-shot avec des données de discours de lecture

De nouvelles méthodes améliorent la détection de mots-clés en utilisant les données de parole disponibles.

2025-09-19T13:36:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'extraction sonore

Un aperçu des méthodes d'extraction sonore personnalisables par région pour un son plus clair.

2025-09-19T07:56:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans le suivi des formants pour le traitement de la parole

De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.

2025-09-19T02:16:10+00:00 ― 5 min lire

Traitement de l'audio et de la parole Nouvelles idées dans la technologie du langage parlé

Un nouvel aperçu des avancées dans les méthodes et applications de la science du langage parlé.

2025-09-19T01:27:35+00:00 ― 8 min lire

Recherche d'informations Défis d'apprentissage à partir des clips musicaux

Cette étude examine les difficultés d'utilisation de l'apprentissage contrastif pour comprendre les clips musicaux.

2025-09-18T17:21:45+00:00 ― 7 min lire

Calcul et langage Connecter la parole avec les modèles de langage : la méthode BLSP

Une nouvelle méthode améliore l'intégration de la parole avec les modèles de langage.

2025-09-18T15:44:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancer la prédiction du mouvement de la parole dans la dysarthrie

Utiliser l'apprentissage auto-supervisé pour améliorer les prédictions des mouvements de la parole dans la dysarthrie.

2025-09-18T12:30:15+00:00 ― 7 min lire

Son Évaluer la connexion danse-musique avec le MDSC

Un nouveau critère pour évaluer l'alignement des styles de danse avec la musique.

2025-09-18T11:41:40+00:00 ― 9 min lire

Calcul et langage Le rôle des modèles de langage préentraînés dans la synthèse vocale

Examiner comment les modèles de langage préentraînés améliorent la qualité de la synthèse vocale.

2025-09-17T20:18:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole BWSNet : Faire avancer l'évaluation de la perception audio

Un nouveau modèle évalue la perception audio grâce aux retours humains en utilisant le Best-Worst Scaling.

2025-09-17T13:49:55+00:00 ― 7 min lire

Son Avancées dans les techniques de séparation des sources musicales

De nouvelles méthodes améliorent la clarté des composants audio dans les morceaux de musique.

2025-09-17T08:09:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la séparation audio cinématographique avec BandIt

BandIt améliore la séparation des sources audio en utilisant des techniques innovantes de deep learning.

2025-09-17T06:32:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Personnaliser les systèmes de reconnaissance des émotions dans la parole

Adapter la technologie de reconnaissance des émotions améliore la précision pour des intervenants divers.

2025-09-17T04:55:30+00:00 ― 8 min lire

Son Morphing de voix : Une menace pour la sécurité

Une étude révèle des menaces sérieuses dans la reconnaissance vocale en utilisant des échantillons morph.

2025-09-17T04:06:55+00:00 ― 7 min lire

Son Batik-joue-Mozart : Un dataset complet de piano

Un ensemble de données détaillé combinant les sonates de Mozart avec des performances au piano et des annotations d'experts.

2025-09-17T03:18:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la qualité audio pour les réunions à distance

Un nouveau design d'écouteurs améliore la clarté du son grâce à la technologie de conduction osseuse.

2025-09-17T02:29:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans l'estimation de la hauteur avec l'apprentissage auto-supervisé

Un nouveau modèle léger améliore l'estimation de la hauteur avec des techniques d'apprentissage auto-supervisé.

2025-09-17T00:04:00+00:00 ― 9 min lire

Son Avancées dans les techniques d'analyse de la structure musicale

Une nouvelle approche pour améliorer l'identification et l'analyse des segments musicaux.

2025-09-16T23:15:25+00:00 ― 7 min lire

Son Détecter les fausses chansons : Une nouvelle approche de dataset

De nouvelles méthodes ont été développées pour identifier les fausses chansons au milieu des préoccupations grandissantes.

2025-09-16T22:26:50+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec Cleancoder

Cleancoder améliore les systèmes ASR en réduisant le bruit de fond pour une meilleure compréhension de la parole.

2025-09-16T21:38:15+00:00 ― 6 min lire