Génie électrique et science des systèmes - Traitement de l'audio et de la parole

RSS

Traitement de l'audio et de la parole Biais dans le transfert d'apprentissage pour la reconnaissance musicale

Cette étude explore le biais dans les modèles audio utilisés pour la reconnaissance d'instruments.

2025-10-06T09:39:25+00:00 ― 8 min lire

Son Avancées dans la classification des genres musicaux avec l'apprentissage profond

Cette étude explore une approche d'apprentissage profond pour classifier avec précision les genres musicaux.

2025-10-06T08:50:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'identification de sujets à partir de données audio

La recherche explore des méthodes pour identifier des sujets directement à partir d'enregistrements audio.

2025-10-05T23:56:25+00:00 ― 6 min lire

Son Localisation automatique des sources sonores en eaux peu profondes

Une nouvelle méthode améliore le suivi de la localisation des sources sonores dans les environnements aquatiques peu profonds.

2025-10-05T13:27:48+00:00 ― 9 min lire

Son Faire avancer la technologie de la parole avec SCRAPS

Un nouveau modèle relie la phonétique et l'acoustique pour améliorer la technologie de la parole.

2025-10-05T13:24:50+00:00 ― 9 min lire

Son Avancées dans la reconnaissance des émotions avec l'apprentissage auto-supervisé

Cette étude met en avant le rôle de l'apprentissage auto-supervisé pour détecter les émotions à partir de données audio.

2025-10-05T08:33:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Rendre la musique facile pour tout le monde

Une nouvelle interface simplifie la création musicale pour les débutants grâce à la technologie de texte à audio.

2025-10-04T18:47:25+00:00 ― 6 min lire

Son Évaluation des prothèses auditives et de l'amélioration de la parole par IA

Des recherches montrent les améliorations que l'IA peut apporter aux appareils auditifs dans des environnements bruyants.

2025-10-04T17:58:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la séparation des sources musicales avec des données bruyantes

Une nouvelle méthode affine les données mal étiquetées, améliorant la séparation des sources musicales.

2025-10-04T10:41:35+00:00 ― 9 min lire

Son Nouvelles méthodes pour décoder l'attention auditive

Des avancées dans la compréhension de comment les gens se concentrent sur les sons à partir de l'activité cérébrale.

2025-10-04T07:43:21+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de synthèse de champ sonore

Une nouvelle méthode améliore la clarté et la localisation du son en utilisant une approche hybride.

2025-10-04T07:27:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'annulation d'écho acoustique avec CMNet

CMNet améliore la clarté vocale en réduisant l'écho dans les appareils de communication.

2025-10-04T06:38:40+00:00 ― 6 min lire

Son Améliorer la reconnaissance de cibles sous-marines avec des réseaux neuronaux

Une nouvelle méthode améliore la classification des sons sous-marins des navires en utilisant des réseaux de neurones.

2025-10-04T05:01:30+00:00 ― 6 min lire

Son Avancées dans la technologie des aides auditives

La recherche vise à améliorer la clarté des aides auditives pour une meilleure communication.

2025-10-04T02:35:45+00:00 ― 7 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Son Comprendre les vocalisations des vaches pendant le stress

Des recherches mettent en avant la communication des vaches pour améliorer les pratiques de l'élevage laitier.

2025-10-03T15:15:35+00:00 ― 6 min lire

Son Présentation de MuReNN : Un nouveau modèle pour le traitement audio

MuReNN combine des modèles paramétriques et non paramétriques pour une meilleure analyse audio.

2025-10-03T14:14:43+00:00 ― 6 min lire

Apprentissage automatique BioLingual : Une nouvelle ère en bioacoustique

Révolutionner la recherche sur la communication animale avec une intégration innovante de l'audio et du langage.

2025-10-03T11:32:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la détection de locuteur actif grâce à l'audio

Des recherches montrent les avantages de plusieurs micros pour détecter et localiser les intervenants.

2025-10-03T11:12:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec PCNN

Présentation d'un nouveau modèle pour parler plus clairement dans les environnements bruyants.

2025-10-03T07:58:20+00:00 ― 6 min lire

Multimédia Avancées dans le Matching Visuel Acoustique

Une nouvelle méthode améliore l'appariement audio en utilisant des images, rendant les environnements audio plus réalistes.

2025-10-03T03:55:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Nouveau jeu de données lie les émotions à la musique MIDI

Un ensemble de données relie les émotions aux chansons MIDI en utilisant l'analyse des paroles.

2025-10-03T02:18:15+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la voix

Améliorer la qualité de la parole grâce à des méthodes innovantes et des jeux de données multilingues.

2025-10-02T23:52:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Résoudre la perte de qualité audio pendant la transmission

De nouvelles techniques visent à améliorer la qualité audio en s'attaquant à la perte de paquets.

2025-10-02T22:15:20+00:00 ― 6 min lire

Son Détection efficace des deepfakes audio

De nouveaux systèmes sont conçus pour détecter les enregistrements audio truqués avec une précision améliorée.

2025-10-02T18:12:25+00:00 ― 7 min lire

Son Avancées dans la diarisation des intervenants grâce à l'intégration audio-visuelle

De nouveaux systèmes améliorent l'identification des locuteurs en utilisant à la fois des données audio et visuelles.

2025-10-02T15:46:40+00:00 ― 6 min lire

Son MoisesDB : Une avancée dans la séparation des sources musicales

MoisesDB propose un ensemble de données détaillé pour une séparation avancée des sons de musique.

2025-10-02T09:18:00+00:00 ― 7 min lire

Son Faire avancer le sous-titrage musical avec des grands modèles de langage

Utiliser des LLMs pour créer un énorme dataset pour le descripteur de musique.

2025-10-02T08:29:25+00:00 ― 9 min lire

Calcul et langage Progrès dans la technologie de formation à la prononciation

Les chercheurs améliorent l'entraînement à la prononciation avec de nouvelles technologies pour les apprenants de langues.

2025-10-02T07:40:50+00:00 ― 7 min lire

Son Avancées dans la technologie de transfert de style vocal

HierVST transforme les voix sans effort, améliorant la qualité audio sans avoir besoin de données massives.

2025-10-02T05:15:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Un nouveau modèle révolutionne l'analyse de la structure musicale

Une approche unifiée améliore l'analyse musicale en intégrant plusieurs éléments structurels.

2025-10-01T23:35:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la classification de la parole pour les enfants autistes

La recherche se concentre sur la classification du discours enfant-adulte en utilisant des données non étiquetées.

2025-10-01T22:46:25+00:00 ― 7 min lire

Multimédia Avancées dans l'estimation de l'engagement pour les conversations

La recherche développe un modèle pour mesurer avec précision l'engagement dans les conversations.

2025-10-01T21:57:50+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes DAVIS : Une nouvelle approche pour la séparation des sons

DAVIS propose une nouvelle façon de gérer la séparation des sons audio et visuels.

2025-10-01T19:32:05+00:00 ― 7 min lire

Son Améliorer les techniques de segmentation audio-visuelle

Une nouvelle méthode améliore l'identification précise des objets qui produisent des sons dans les vidéos.

2025-10-01T13:52:00+00:00 ― 8 min lire

Son Avancées dans la synthèse vocale avec DiffProsody

DiffProsody améliore la vitesse et la qualité de la synthèse vocale grâce à une génération de prosodie innovante.

2025-10-01T13:03:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconstruction de champ sonore avec des GANs

Les modèles de deep learning améliorent la reconstruction du champ sonore dans des environnements complexes.

2025-10-01T04:57:35+00:00 ― 9 min lire

Son S'attaquer à la guerre du volume avec des réseaux de délimitation

Une nouvelle technologie vise à restaurer la qualité musicale perdue à cause de la compression de volume.

2025-10-01T02:31:50+00:00 ― 6 min lire

Son Système automatisé pour identifier l'aphasie

Une nouvelle méthode promet une identification plus rapide des troubles de la parole comme l'aphasie.

2025-09-30T21:40:20+00:00 ― 6 min lire

Cryptographie et sécurité Techniques de son inaudible pour manipuler la parole

Une nouvelle méthode utilise des sons ultrasoniques pour embrouiller les systèmes de reconnaissance vocale sans être détectée.

2025-09-30T19:14:35+00:00 ― 7 min lire