Génie électrique et science des systèmes - Traitement de l'audio et de la parole

Son Avancées en traitement audio avec DAMAS-FISTA

Une nouvelle méthode combine l'apprentissage traditionnel et profond pour une imagerie sonore efficace.

2025-10-20T11:18:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconstruction du champ sonore

De nouvelles méthodes améliorent le réalisme dans les technologies audio en utilisant des techniques informées par la physique.

2025-10-20T10:30:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Faire avancer l'apprentissage des langues pour les langues peu répandues

Un nouveau modèle améliore l'apprentissage des mots en utilisant de l'audio et des images.

2025-10-20T09:41:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Le rôle de la reconnaissance vocale dans l'intégrité des essais cliniques

Enquête sur comment la technologie vocale peut empêcher la participation en double des patients dans les essais.

2025-10-20T07:15:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Analyser la parole pour détecter des problèmes de santé mentale

Un nouveau jeu de données aide à identifier les signes de dépression et d'anxiété grâce à l'analyse de la parole.

2025-10-20T06:27:10+00:00 ― 8 min lire

Son Reconstruire le son à partir de l'activité cérébrale

Une nouvelle méthode reconstruit le son à partir des signaux cérébraux, révélant des infos sur le traitement auditif.

2025-10-20T01:35:40+00:00 ― 6 min lire

Son Apporter l'IA à la création musicale sur Bela

Un guide pour utiliser des modèles d'IA pour la musique sur la plateforme Bela.

2025-10-19T22:21:20+00:00 ― 7 min lire

Calcul et langage Nouvelles métriques pour évaluer la qualité de la reconnaissance vocale

Une nouvelle méthode évalue les systèmes de reconnaissance automatique de la parole sans avoir besoin de textes de référence.

2025-10-19T19:07:00+00:00 ― 6 min lire

Calcul et langage Évaluer la qualité de la reconnaissance vocale sans textes de référence

NoRefER propose une nouvelle méthode pour évaluer les résultats de reconnaissance vocale sans avoir besoin de transcriptions.

2025-10-19T16:41:15+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le sous-titrage vidéo avec l'intégration audio

Cet article parle d'une méthode pour améliorer les sous-titres vidéo en intégrant l'audio.

2025-10-19T15:52:40+00:00 ― 7 min lire

Son Avancées dans la technologie de conversion vocale

Un nouveau modèle améliore la conversion vocale en simplifiant les techniques de séparation de la parole.

2025-10-19T12:38:20+00:00 ― 8 min lire

Son Progrès dans la mesure de la similarité musicale

La recherche vise à combiner des données audio et symboliques pour l'analyse de similarité musicale.

2025-10-19T11:49:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de diarisation de la langue parlée

De nouvelles méthodes améliorent la segmentation de la parole dans les conversations multilingues.

2025-10-19T02:06:45+00:00 ― 8 min lire

Son Nouvelle méthode améliore l'isolation sonore dans des environnements bruyants

NoisyILRMA améliore l'extraction du son des bruits de fond pour une expérience audio plus claire.

2025-10-19T00:29:35+00:00 ― 5 min lire

Son Avancées dans la compréhension de la voix chantée en utilisant des modèles SSL

Cet article parle du rôle de l'apprentissage auto-supervisé dans la technologie musicale.

2025-10-18T22:03:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole pour un usage multilingue

Un nouveau cadre améliore la reconnaissance vocale pour les langues à faibles ressources et la scalabilité multilingue.

2025-10-18T19:38:05+00:00 ― 7 min lire

Son Faire avancer la reconnaissance vocale pour les utilisateurs sourds

Les systèmes de reconnaissance vocale personnalisés améliorent grave la communication pour les personnes DHH.

2025-10-18T03:26:25+00:00 ― 8 min lire

Son Avancées dans les techniques de diarisation des locuteurs

De nouvelles méthodes utilisent des résumés de conversation pour améliorer la reconnaissance des locuteurs.

2025-10-18T00:12:05+00:00 ― 7 min lire

Calcul et langage Améliorer l'évaluation automatique de la parole pour les apprenants de langues

Améliorer les systèmes de feedback pour les apprenants en anglais en s'attaquant au problème du démarrage à froid.

2025-10-17T16:54:50+00:00 ― 8 min lire

Son Améliorer la localisation du bruit pour les éoliennes

Recherche des méthodes pour localiser les sources de bruit des éoliennes pour réduire le bruit.

2025-10-17T16:06:15+00:00 ― 5 min lire

Son Avancées dans la détection des techniques de chant avec PrimaDNN

Présentation d'un nouveau modèle pour identifier les techniques de chant dans les pistes audio.

2025-10-17T14:29:05+00:00 ― 7 min lire

Multimédia Améliorer l'extraction du locuteur cible avec des indices visuels

Un nouveau modèle améliore l'extraction de la parole en utilisant des infos audio et visuelles.

2025-10-17T12:51:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Présentation de Wespeaker : un kit d'outils pour la reconnaissance vocale

Wespeaker simplifie la reconnaissance de locuteurs avec des outils faciles à utiliser et des modèles préentraînés.

2025-10-17T10:26:10+00:00 ― 7 min lire

Son Convertir de l'audio mono en stéréo immersif

Une nouvelle méthode transforme les signaux mono en expériences stéréo captivantes.

2025-10-17T01:31:45+00:00 ― 7 min lire

Calcul et langage Faire avancer la reconnaissance des émotions à travers les âges et les langues

Une étude sur l'amélioration de la détection des émotions dans la parole pour des groupes divers.

2025-10-16T23:06:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale grâce à des ensembles basés sur la confiance

Cet article parle d'améliorer la reconnaissance vocale en utilisant des méthodes d'ensemble basées sur la confiance.

2025-10-16T18:14:30+00:00 ― 6 min lire

Multimédia Révolutionner le suivi du sommeil des bébés avec LittleBeats

Une étude utilise un dispositif multi-données pour suivre les habitudes de sommeil des bébés plus précisément.

2025-10-16T17:25:55+00:00 ― 6 min lire

Calcul et langage Présentation de 3D-Speaker : Une nouvelle ressource pour la recherche en parole

3D-Speaker propose une grosse collection d'enregistrements audio pour une analyse de la parole avancée.

2025-10-16T16:37:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancer dans le texte-à-parole : Explication du modèle GenerTTS

GenerTTS améliore la technologie de synthèse vocale pour des applications multilingues.

2025-10-16T15:48:45+00:00 ― 6 min lire

Son S'attaquer au défi des deepfakes audio

Un nouveau système améliore la détection des audios manipulés grâce à des techniques innovantes.

2025-10-16T15:00:10+00:00 ― 7 min lire

Son Avancées dans la reconnaissance vocale multi-locuteurs

Améliorer la reconnaissance vocale pour des voix qui se chevauchent rend l'utilisation plus facile dans plein de situations.

2025-10-16T11:45:50+00:00 ― 6 min lire

Son Améliorer les techniques d'extraction de locuteurs

De nouvelles méthodes améliorent la séparation des voix dans des environnements audio mélangés.

2025-10-16T10:57:15+00:00 ― 6 min lire

Son Avancées dans la technologie d'extraction de la voix cible

Découvrez comment de nouvelles techniques améliorent la clarté de la parole dans des environnements bruyants.

2025-10-16T10:08:40+00:00 ― 6 min lire

Son UnitSpeech : Personnaliser la synthèse vocale avec peu de données

Une nouvelle méthode pour rendre la synthèse vocale plus personnelle en utilisant moins de données vocales.

2025-10-16T06:54:20+00:00 ― 6 min lire

Son Avancées dans le traitement audio avec des réseaux de neurones graphiques

De nouvelles méthodes améliorent la localisation du son grâce à des réseaux de micros distribués.

2025-10-16T06:05:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Équilibrer la vie privée et l'utilité dans l'analyse de la parole

Cette étude examine des méthodes pour protéger la vie privée tout en analysant des conversations parlées.

2025-10-16T05:17:10+00:00 ― 8 min lire

Son Nouvelles vulnérabilités dans les systèmes de reconnaissance vocale

Des attaques récentes par backdoor révèlent des risques dans les technologies d'identification vocale.

2025-10-16T02:51:25+00:00 ― 9 min lire

Son Avancée de la technologie d'isolation vocale

Un nouveau modèle améliore l'extraction de la parole des bruits de fond grâce à l'apprentissage profond.

2025-10-16T02:02:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Présentation de GOLF : une nouvelle ère dans la synthèse de voix chantées

GOLF propose une nouvelle façon de créer un chant qui sonne humain en utilisant moins de ressources.

2025-10-15T16:19:50+00:00 ― 8 min lire

Son Avancées dans la prédiction de l'âge et du genre par la voix

Recherche sur la prédiction de l'âge et du genre à partir de données vocales en utilisant des modèles innovants.

2025-10-15T13:54:05+00:00 ― 6 min lire