Derniers articles pour Traitement audio

Son Amélioration de l'alignement des paroles dans les services de musique

Un nouveau modèle améliore la précision du timing pour les paroles dans les applis musicales.

2025-10-10T18:55:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale sans texte

Une nouvelle méthode améliore la reconnaissance vocale en utilisant seulement des données audio brutes.

2025-10-09T02:26:05+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'anonymisation des locuteurs

De nouvelles méthodes visent à cacher l'identité des intervenants tout en gardant la clarté de la parole.

2025-10-08T01:20:00+00:00 ― 7 min lire

Son FlexiAST : Une approche flexible du traitement audio

FlexiAST permet aux modèles de s'adapter efficacement à différentes tailles de patch audio.

2025-10-07T09:56:55+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de la segmentation audio-visuelle avec un nouveau cadre

Une nouvelle méthode s'attaque aux problèmes de segmentation audio-visuelle dans des environnements bruyants.

2025-10-06T13:13:54+00:00 ― 7 min lire

Traitement de l'audio et de la parole Biais dans le transfert d'apprentissage pour la reconnaissance musicale

Cette étude explore le biais dans les modèles audio utilisés pour la reconnaissance d'instruments.

2025-10-06T09:39:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'identification de sujets à partir de données audio

La recherche explore des méthodes pour identifier des sujets directement à partir d'enregistrements audio.

2025-10-05T23:56:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'annulation d'écho acoustique avec CMNet

CMNet améliore la clarté vocale en réduisant l'écho dans les appareils de communication.

2025-10-04T06:38:40+00:00 ― 6 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Son Présentation de MuReNN : Un nouveau modèle pour le traitement audio

MuReNN combine des modèles paramétriques et non paramétriques pour une meilleure analyse audio.

2025-10-03T14:14:43+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec PCNN

Présentation d'un nouveau modèle pour parler plus clairement dans les environnements bruyants.

2025-10-03T07:58:20+00:00 ― 6 min lire

Multimédia Avancées dans le Matching Visuel Acoustique

Une nouvelle méthode améliore l'appariement audio en utilisant des images, rendant les environnements audio plus réalistes.

2025-10-03T03:55:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Résoudre la perte de qualité audio pendant la transmission

De nouvelles techniques visent à améliorer la qualité audio en s'attaquant à la perte de paquets.

2025-10-02T22:15:20+00:00 ― 6 min lire

Son Détection efficace des deepfakes audio

De nouveaux systèmes sont conçus pour détecter les enregistrements audio truqués avec une précision améliorée.

2025-10-02T18:12:25+00:00 ― 7 min lire

Son MoisesDB : Une avancée dans la séparation des sources musicales

MoisesDB propose un ensemble de données détaillé pour une séparation avancée des sons de musique.

2025-10-02T09:18:00+00:00 ― 7 min lire

Son Avancées dans la technologie de transfert de style vocal

HierVST transforme les voix sans effort, améliorant la qualité audio sans avoir besoin de données massives.

2025-10-02T05:15:05+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes DAVIS : Une nouvelle approche pour la séparation des sons

DAVIS propose une nouvelle façon de gérer la séparation des sons audio et visuels.

2025-10-01T19:32:05+00:00 ― 7 min lire

Cryptographie et sécurité Techniques de son inaudible pour manipuler la parole

Une nouvelle méthode utilise des sons ultrasoniques pour embrouiller les systèmes de reconnaissance vocale sans être détectée.

2025-09-30T19:14:35+00:00 ― 7 min lire

Son Amélioration des techniques d'extraction de mélodie chantée avec le deep learning

De nouvelles méthodes améliorent la précision pour extraire des mélodies chantées à partir d'audio mixte.

2025-09-30T01:25:45+00:00 ― 9 min lire

Calcul et langage Avancées dans la technologie de sous-titrage audio

De nouvelles méthodes visent à améliorer le sous-titrage audio pour plus de précision et d'efficacité.

2025-09-30T00:25:00+00:00 ― 6 min lire

Son Avancées dans les techniques d'amélioration de la parole

Nouveau modèle améliore la clarté de la voix dans des environnements bruyants en utilisant des méthodes innovantes.

2025-09-29T22:11:25+00:00 ― 7 min lire

Son Analyser les chansons folkloriques coréennes grâce à la technologie

Une étude sur les chansons folkloriques coréennes en utilisant des méthodes d'analyse modernes.

2025-09-29T21:22:50+00:00 ― 10 min lire

Son Avancées dans la reconnaissance vocale du locuteur cible

Un nouveau modèle améliore la reconnaissance vocale dans des environnements bruyants en se concentrant sur un seul locuteur.

2025-09-28T08:08:00+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la classification de la hauteur musicale avec SDTW

Nouvelles stratégies pour améliorer la stabilité de l'entraînement pour la classification des hauteurs musicales.

2025-09-27T13:30:35+00:00 ― 8 min lire

Son Avancées dans l'extraction de la hauteur avec PitchNet

Une nouvelle méthode pour détecter précisément les tonalités en musique et en son.

2025-09-26T02:41:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation vidéo audio-visuelle avec le cadre CATR

Une nouvelle approche améliore la segmentation des objets dans les vidéos en utilisant des techniques d'intégration audio-visuelle.

2025-09-25T02:18:42+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la détection sonore avec des techniques d'apprentissage meta

Meta-SELD améliore la localisation des événements sonores dans des environnements variés.

2025-09-24T19:55:20+00:00 ― 7 min lire

Son Avancées dans la reconnaissance vocale pour les environnements bruyants

Un nouveau système améliore la reconnaissance vocale dans des environnements bruyants en utilisant des techniques avancées.

2025-09-22T21:46:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluation de la performance de la base de référence B1 du défi VoicePrivacy

Évaluer l'efficacité de l'anonymisation vocale sans perdre le son naturel.

2025-09-22T14:28:50+00:00 ― 8 min lire

Son Avancées dans la classification audio avec LCANets++

De nouveaux modèles améliorent la précision de la classification audio et la résistance au bruit et aux attaques.

2025-09-22T12:51:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluation de la qualité du discours avec les modèles XLS-R

Un aperçu de comment les modèles XLS-R améliorent l'évaluation de la qualité audio lors des réunions en ligne.

2025-09-22T01:31:30+00:00 ― 7 min lire

Son Avancées dans les techniques d'amélioration de la parole

De nouvelles stratégies améliorent la clarté de la parole dans des environnements bruyants pour une meilleure reconnaissance.

2025-09-21T17:25:40+00:00 ― 7 min lire

Son Améliorer la synthèse vocale avec des techniques de taille

De nouvelles méthodes de réduction améliorent les performances du modèle de synthèse vocale multi-locuteurs en zéro-shot.

2025-09-20T15:31:00+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancer le repérage de mots-clés en few-shot avec des données de discours de lecture

De nouvelles méthodes améliorent la détection de mots-clés en utilisant les données de parole disponibles.

2025-09-19T13:36:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans le suivi des formants pour le traitement de la parole

De nouvelles méthodes en une seule étape améliorent la précision du suivi des formants pour les sons de la parole.

2025-09-19T02:16:10+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la qualité audio pour les réunions à distance

Un nouveau design d'écouteurs améliore la clarté du son grâce à la technologie de conduction osseuse.

2025-09-17T02:29:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans l'estimation de la hauteur avec l'apprentissage auto-supervisé

Un nouveau modèle léger améliore l'estimation de la hauteur avec des techniques d'apprentissage auto-supervisé.

2025-09-17T00:04:00+00:00 ― 9 min lire

Son Détecter les fausses chansons : Une nouvelle approche de dataset

De nouvelles méthodes ont été développées pour identifier les fausses chansons au milieu des préoccupations grandissantes.

2025-09-16T22:26:50+00:00 ― 7 min lire

Son Classer les genres musicaux avec la technologie

Apprends comment la techno aide à classer les genres musicaux efficacement.

2025-09-14T21:51:50+00:00 ― 7 min lire

Apprentissage automatique Défis d'utilisation des Convnets pour la conception de filtres audio

Cette étude explore les problèmes liés à l'utilisation des convnets pour la création de filtres audio.

2025-09-14T14:34:35+00:00 ― 6 min lire