Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Son# Apprentissage automatique# Traitement de l'audio et de la parole

Améliorer l'écoute de la musique pour les utilisateurs d'appareils auditifs

Des approches innovantes visent à améliorer la qualité de la musique pour les personnes malentendantes.

Gerardo Roa Dabike, Michael A. Akeroyd, Scott Bannister, Jon P. Barker, Trevor J. Cox, Bruno Fazenda, Jennifer Firth, Simone Graetzer, Alinka Greasley, Rebecca R. Vos, William M. Whitmer

― 7 min lire


Musique pour lesMusique pour lesutilisateurs d'appareilsauditifsd'audition.pour les gens avec une perteUne tech innovante améliore la musique
Table des matières

Écouter de la musique, c'est super important dans plein de cultures. Ça rassemble les gens et peut vraiment améliorer la santé et le bien-être. Mais les personnes ayant des problèmes d'audition galèrent souvent à en profiter. L'Organisation Mondiale de la Santé prévoit qu'en 2050, environ 2,5 milliards de personnes auront des problèmes d'audition, avec 700 millions qui auront besoin de traitement. La perte d'audition peut rendre difficile l'écoute des sons faibles, la distinction des tonalités et l'identification des paroles et des instruments dans la musique. Donc, c'est essentiel de trouver de meilleures manières de traiter la musique pour ceux qui ont des difficultés auditives afin qu'ils puissent toujours en profiter.

Le Rôle des Appareils auditifs

Les appareils auditifs sont la solution la plus courante pour ceux qui ont une perte auditive légère à modérée. Beaucoup d'appareils auditifs ont des programmes spéciaux pour la musique, mais ces programmes ne fonctionnent pas toujours bien. Des recherches montrent qu'une bonne partie des utilisateurs a des problèmes en écoutant de la musique avec leurs appareils. Les appareils auditifs amplifient les sons différemment selon les fréquences, ce qui peut entraîner des expériences d'écoute déformées ou inconfortables quand il s'agit de musique. Comme la musique a des caractéristiques différentes de la parole, les réglages des appareils auditifs, qui sont généralement optimisés pour la parole, peuvent nuire à l'expérience d'écoute musicale.

Améliorer la Musique pour les Utilisateurs d'Appareils Auditifs

Les chercheurs ont exploré différentes manières d'améliorer la qualité de la musique pour ceux qui portent des appareils auditifs. Certaines études suggèrent d'utiliser la compression de fréquence pour déplacer les sons à haute fréquence vers des fréquences plus basses pour les rendre plus audibles. D'autres recherches ont montré que la compression audio à action lente pouvait améliorer la performance musicale. Cependant, ces méthodes donnent souvent des résultats mitigés.

Ces dernières années, l'Apprentissage automatique est apparu comme une approche prometteuse pour le traitement audio et a montré qu'il pouvait améliorer la reconnaissance de la parole dans les appareils auditifs. Cependant, son efficacité pour améliorer la qualité de la musique pour les personnes malentendantes reste encore à explorer.

Les Défis de l'Utilisation de l'Apprentissage Automatique

Les compétitions d'apprentissage automatique peuvent aider à faire avancer la technologie de traitement audio. Ces défis offrent généralement une tâche commune avec des lignes directrices claires, une solution logicielle de référence et des ensembles de données pour que les participants travaillent. Ces compétitions permettent aux chercheurs de différents domaines de collaborer et d'apporter de nouvelles idées. En fournissant un accès ouvert aux bases de données et aux logiciels, ces défis peuvent également abaisser les barrières pour les nouveaux chercheurs.

Le Projet Cadenza

Le projet Cadenza vise à utiliser l'apprentissage automatique pour améliorer la qualité audio de la musique pour les personnes malentendantes. Il a lancé deux défis principaux :

  1. CAD1 (2023) : Ce défi était centré sur l'écoute de musique avec des écouteurs. L'objectif était de permettre aux concurrents de créer des systèmes qui pouvaient améliorer l'expérience d'écoute musicale pour ceux avec des problèmes d'audition en séparant et en remixant différents composants sonores.

  2. ICASSP24 (2024) : Ce défi s'est élargi à l'écoute sur haut-parleur tout en utilisant des appareils auditifs. L'objectif était similaire à CAD1, mais le défi était rendu plus complexe en introduisant des dynamiques et des gains sonores différents appliqués à la musique.

Les deux défis ont fourni aux participants des outils de base et des ensembles de données pour encourager un environnement compétitif et équitable. Les tâches étaient conçues pour cibler la séparation des signaux audio en voix, percussions, basse et autres instruments. Le but était de permettre aux participants de réajuster ces éléments pour une expérience musicale personnalisée selon les besoins d'écoute.

Comment Fonctionnent les Défis

Dans ces défis, les participants doivent créer un système capable de prendre une piste musicale stéréo et de la décomposer en divers composants. Ils doivent ensuite gérer les niveaux de ces composants pour les rendre plus agréables pour les auditeurs malentendants. Les systèmes sont évalués sur un indice spécifique connu sous le nom de Hearing-Aid Audio Quality Index (HAAQI), qui évalue à quel point l'audio traité correspond à l'expérience d'écoute idéale.

Les défis posent aussi des exigences uniques pour les systèmes de traitement audio. Pour CAD1, l'accent était mis sur l'écoute avec des écouteurs, tandis que ICASSP24 a introduit la complexité de l'utilisation de haut-parleurs qui nécessitaient de prendre en compte le mélange sonore et les ajustements de gain. Cette approche visait à créer un environnement d'écoute plus réaliste, reflétant comment les gens profitent réellement de la musique.

L'Importance de la Personnalisation

Un aspect crucial pour améliorer l'écoute de la musique réside dans la personnalisation. Chaque participant aux défis a reçu un profil auditif basé sur des audiogrammes de tonalité pure, qui mesurent les seuils auditifs à différentes fréquences. Ces données permettent aux systèmes de traitement d'ajuster le son en fonction des besoins d'audition uniques de chaque utilisateur, améliorant ainsi leur expérience musicale.

Évaluation et Résultats

Dans les deux défis, les participants ont soumis leurs systèmes de traitement audio pour évaluation. Pour CAD1, les résultats ont montré qu'aucun participant n'a pu surpasser de façon significative le meilleur système de référence à cause d'une marge d'amélioration limitée. Cependant, ICASSP24 a vu plus de succès, avec plusieurs équipes surpassant la référence grâce à des techniques innovantes.

La plupart des systèmes les plus performants reposaient sur des versions affinées d'algorithmes de séparation audio existants. Les participants ont utilisé diverses stratégies, y compris des méthodes d'ensemble qui combinaient les résultats de plusieurs algorithmes pour obtenir de meilleurs résultats.

Les défis ont aussi souligné la nécessité d'une amélioration continue des métriques pour l'évaluation de la qualité audio. Bien que HAAQI soit la seule métrique spécifiquement conçue pour les personnes malentendantes, ses exigences computationnelles et sa nature non différentiable la rendent moins pratique pour les applications d'apprentissage automatique en temps réel.

À l'Avenir des Défis Futurs

Le projet Cadenza vise un développement continu dans le domaine du traitement audio pour les utilisateurs d'appareils auditifs. Les plans pour les futurs défis incluent l'expansion des types de musique concernés, comme la musique classique, qui correspond aux préférences de nombreux utilisateurs malentendants.

De plus, pour encourager la collaboration de recherche, le prochain défi inclura des prix en espèces pour inciter la participation et l'innovation dans ce domaine vital. Les chercheurs sont encouragés à continuer de repousser les limites du traitement audio pour créer de meilleures expériences d'écoute pour tous, indépendamment de leur capacité auditive.

Conclusion

Améliorer les expériences d'écoute musicale pour les personnes malentendantes est crucial, et l'apprentissage automatique représente une voie prometteuse pour progresser. En menant des défis ciblés, en favorisant la collaboration et en priorisant la personnalisation, les chercheurs peuvent travailler vers des solutions innovantes qui amélioreront la qualité de vie de ceux touchés par la perte d'audition. Le projet Cadenza représente une étape significative dans cette direction, visant à combler le fossé entre la technologie audio et les besoins d'une population diversifiée.

Source originale

Titre: The first Cadenza challenges: using machine learning competitions to improve music for listeners with a hearing loss

Résumé: It is well established that listening to music is an issue for those with hearing loss, and hearing aids are not a universal solution. How can machine learning be used to address this? This paper details the first application of the open challenge methodology to use machine learning to improve audio quality of music for those with hearing loss. The first challenge was a stand-alone competition (CAD1) and had 9 entrants. The second was an 2024 ICASSP grand challenge (ICASSP24) and attracted 17 entrants. The challenge tasks concerned demixing and remixing pop/rock music to allow a personalised rebalancing of the instruments in the mix, along with amplification to correct for raised hearing thresholds. The software baselines provided for entrants to build upon used two state-of-the-art demix algorithms: Hybrid Demucs and Open-Unmix. Evaluation of systems was done using the objective metric HAAQI, the Hearing-Aid Audio Quality Index. No entrants improved on the best baseline in CAD1 because there was insufficient room for improvement. Consequently, for ICASSP24 the scenario was made more difficult by using loudspeaker reproduction and specified gains to be applied before remixing. This also made the scenario more useful for listening through hearing aids. 9 entrants scored better than the the best ICASSP24 baseline. Most entrants used a refined version of Hybrid Demucs and NAL-R amplification. The highest scoring system combined the outputs of several demixing algorithms in an ensemble approach. These challenges are now open benchmarks for future research with the software and data being freely available.

Auteurs: Gerardo Roa Dabike, Michael A. Akeroyd, Scott Bannister, Jon P. Barker, Trevor J. Cox, Bruno Fazenda, Jennifer Firth, Simone Graetzer, Alinka Greasley, Rebecca R. Vos, William M. Whitmer

Dernière mise à jour: 2024-09-08 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2409.05095

Source PDF: https://arxiv.org/pdf/2409.05095

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires