Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'audio et de la parole# Son

Nouvelle méthode pour l'évaluation objective de l'audio spatial

Une nouvelle approche améliore notre façon d'évaluer la qualité audio spatiale.

― 6 min lire


Évaluation objective deÉvaluation objective del'audio spatialtests d'écoute.l'évaluation de la qualité audio sansUne nouvelle méthode améliore
Table des matières

L'audio spatial est une technologie qui aide à créer une sensation d'espace et de direction dans le son. C'est super important dans des domaines comme la musique, le cinéma et la réalité virtuelle, car ça améliore notre expérience audio. Cependant, évaluer la qualité de l'audio spatial a traditionnellement dépendu de tests d'écoute, qui peuvent être longs et nécessitent des auditeurs formés. Cet article parle d'une nouvelle méthode pour évaluer objectivement la qualité de l'audio spatial, en s'éloignant des tests d'écoute subjectifs.

Les bases de la localisation du son chez l'humain

Les humains ont une capacité incroyable à localiser les sons dans l'espace. Cette compétence est liée à la forme de notre tête et de nos oreilles, qui influencent la façon dont nous entendons les sons provenant de différentes directions. Un concept appelé fonction de transfert liée à la tête (HRTF) décrit comment ces formes modifient le son avant qu'il n'arrive à nos oreilles.

Une idée simplifiée de la façon dont nous localisons les sons, connue sous le nom de théorie duplexe, tourne autour de deux éléments clés : le temps que met un son à atteindre chaque oreille (différences de temps interaural ou ITD) et la différence de volume entre les deux oreilles (différences de niveau interaural ou ILD). Ces deux aspects nous aident à comprendre d'où viennent les sons.

Le défi d'évaluer l'audio spatial

Malgré notre compréhension de la localisation sonore, mesurer la qualité de l'audio spatial est compliqué. Beaucoup de méthodes existantes reposent sur des tests d'écoute subjectifs, qui prennent du temps et nécessitent des auditeurs experts. Bien que certaines métriques aient été proposées pour évaluer la qualité audio, elles dépendent souvent de la configuration audio spécifique ou ont d'autres limitations.

Limitations des méthodes actuelles

Les problèmes des méthodes actuelles incluent :

  • Beaucoup de techniques d'évaluation sont basées sur des données qui ont été utilisées pour les former, les rendant moins utiles pour de nouvelles configs audio.
  • Les métriques existantes ne tiennent pas toujours compte des défis uniques de l'audio spatial, surtout lorsque l'audio a été modifié par compression ou techniques de séparation.
  • Les mesures objectives qui se concentrent spécifiquement sur les aspects spatiaux de l'audio sont encore rares.

Une nouvelle méthode pour évaluer l'audio spatial

Pour faire face à ces défis, une nouvelle méthode a été développée qui se concentre sur la séparation des distorsions spatiales des autres distorsions audio. Cette méthode examine spécifiquement les effets des différences de temps et de niveau entre les canaux tout en utilisant des techniques d'optimisation pour isoler les erreurs spatiales dans un signal audio.

Comment ça marche

La nouvelle approche implique les étapes suivantes :

  1. Décomposition des signaux audio : L'audio est décomposé en composants spatiaux et non spatiaux. Cela permet de mesurer plus précisément la qualité spatiale.
  2. Métriques de ratio d'énergie : Des métriques simples sont créées pour quantifier la différence de qualité entre le signal propre et l'audio altéré. Deux métriques clés émergent de cette méthode :
    • Ratio Signal à Distorsion Spatiale (SSR) : Cela indique combien de la qualité audio est affectée par des problèmes spatiaux.
    • Ratio Signal à Distorsion Résiduelle (SRR) : Cela mesure les erreurs non spatiales comme le bruit ou les changements de timbre.

Analyse image par image

La méthode peut être appliquée image par image, ce qui est particulièrement utile pour les signaux audio qui changent avec le temps, comme la musique ou la parole. Cela signifie que l'évaluation peut suivre les variations de qualité audio.

Test de la méthode

La nouvelle méthode a été mise à l'épreuve contre diverses formes de dégradations audio, pour voir comment elle performe dans des scénarios réels.

Types de dégradations audio

Différents types de problèmes audio ont été examinés, y compris :

  • Erreurs de panoramique : Cela concerne le placement du son dans une configuration stéréo. Les erreurs ici ont été mesurées pour comprendre la qualité spatiale.
  • Erreurs de délai : Cela fait référence aux différences de timing entre les canaux audio. La méthode a analysé ces problèmes pour voir comment ils impactent la localisation sonore.
  • Erreurs de filtrage : Beaucoup de techniques de traitement audio peuvent altérer la qualité audio. La nouvelle méthode peut distinguer les distorsions spatialement pertinentes des autres erreurs de filtrage.
  • Bruit additionnel : Le bruit indésirable peut affecter la qualité audio. La méthode a été testée pour voir comment elle gère ce genre de distorsion.

Résultats des tests

Les résultats ont montré que les nouvelles métriques fournissent des insights utiles sur la qualité spatiale. Les valeurs SSR et SRR ont changé comme prévu avec différents types de distorsions, confirmant que la méthode peut évaluer efficacement la qualité audio.

Évaluation par rapport aux techniques existantes

Pour valider davantage la nouvelle méthode, elle a été comparée à des algorithmes de compression audio existants et à des techniques de séparation de sources musicales. Ces processus sont connus pour introduire des artefacts spatiaux et non spatiaux dans les signaux musicaux.

Compression audio

L'audio a été compressé en utilisant des méthodes courantes, comme AAC et Opus, pour voir comment cela affecte la qualité audio. Les résultats ont indiqué que des réglages de bitrate plus élevés entraînaient de meilleures valeurs SSR et SRR, signifiant moins de perte de qualité.

Séparation de sources musicales

La méthode a également été testée avec des outils de séparation musicale populaires, comme OpenUnmix et Spleeter. Les résultats ont montré que les nouvelles métriques d'évaluation s'alignent avec d'autres mesures établies de la qualité audio.

Conclusion

Cette nouvelle approche pour évaluer la qualité de l'audio spatial offre une façon plus objective d'évaluer l'audio sans dépendre des tests d'écoute. En séparant les distorsions spatiales des distorsions non spatiales, elle offre des insights plus clairs sur la qualité audio.

La méthode proposée a montré sa robustesse contre diverses formes de dégradations audio et promet de meilleures applications dans la musique, le cinéma et la réalité virtuelle. Alors que le besoin d'expériences audio de haute qualité continue d'augmenter, cet outil sera utile pour les ingénieurs et développeurs travaillant avec la technologie audio.

Source originale

Titre: Quantifying Spatial Audio Quality Impairment

Résumé: Spatial audio quality is a highly multifaceted concept, with many interactions between environmental, geometrical, anatomical, psychological, and contextual considerations. Methods for characterization or evaluation of the geometrical components of spatial audio quality, however, remain scarce, despite being perhaps the least subjective aspect of spatial audio quality to quantify. By considering interchannel time and level differences relative to a reference signal, it is possible to construct a signal model to isolate some of the spatial distortion. By using a combination of least-square optimization and heuristics, we propose a signal decomposition method to isolate the spatial error from a processed signal, in terms of interchannel gain leakages and changes in relative delays. This allows the computation of simple energy-ratio metrics, providing objective measures of spatial and non-spatial signal qualities, with minimal assumptions and no dataset dependency. Experiments demonstrate the robustness of the method against common spatial signal degradation introduced by, e.g., audio compression and music source separation. Implementation is available at https://github.com/karnwatcharasupat/spauq.

Auteurs: Karn N. Watcharasupat, Alexander Lerch

Dernière mise à jour: 2023-12-14 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2306.08053

Source PDF: https://arxiv.org/pdf/2306.08053

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires