Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Elektrotechnik und Systemtechnik# Ton# Audio- und Sprachverarbeitung

Die Lautstärke-Schlacht mit De-limiter Netzwerken angehen

Neue Technologie soll die Musikqualität wiederherstellen, die durch Lautstärkereduzierung verloren gegangen ist.

― 5 min Lesedauer


Den Loudness-KriegDen Loudness-Kriegbeendenwiederherzustellen.Qualität von Musik durch KompressionTechnik verspricht, die verlorene
Inhaltsverzeichnis

In der Musikindustrie gibt's einen Trend, der als Lautheitskrieg bekannt ist. Im Laufe der Jahre haben viele Produzenten und Ingenieure versucht, Musik so laut wie möglich zu machen. Die Idee ist simpel: Lautere Musik klingt für viele Leute besser. Aber diese Praxis führt oft dazu, dass der Dynamikbereich der Musik reduziert wird, was bedeutet, dass die Unterschiede zwischen den leisen und lauten Parts weniger auffällig werden.

Um diese Lautstärke zu erreichen, benutzen Mastering-Ingenieure oft Limiter. Das sind Werkzeuge, die den Sound komprimieren, die leisen Parts runterdrehen und die lauten hochpushen. Während diese Methode tatsächlich einen Song lauter klingen lassen kann, kann sie auch zu Ohrenschmerzen oder sogar Hörverlust bei den Zuhörern führen. Viele Leute in der Musikszene haben Bedenken geäussert, dass das Aufpumpen der Lautstärke die Qualität der Musik schädigt. Studien haben gezeigt, dass überkomprimierte Musik schlechter klingt als Musik ohne Kompression oder nur mit etwas Kompression.

Trotz dieser Warnungen zieht der Trend weiter. Viele Künstler glauben immer noch, dass lautere Musik besser ist. Auf Streaming-Plattformen könnte dir auffallen, dass viele Songs ähnlich in der Lautstärke klingen. Das nennt man Lautheitsnormalisierung und ist eine Methode, um das Hörerlebnis für alle zu nivellieren.

Die Herausforderung des De-Limitierens von Musik

Wenn Musik mit einem Limiter komprimiert wird, können die Veränderungen nicht komplett rückgängig gemacht werden. Das stellt eine grosse Herausforderung dar, wenn man versucht, die Musik zu ihrem ursprünglichen Klang zurückzubringen. Mit dem Aufkommen von Künstlicher Intelligenz und tiefen neuronalen Netzen glauben Forscher, dass diese Technologien bei der Bemühung, Musik zu "de-limitieren", helfen könnten.

Die Idee ist, ein System zu schaffen, das einen stark komprimierten Song nehmen und schätzen kann, wie die unkomprimierte Version klingen würde. So können wir versuchen, die ursprüngliche Klangqualität zurückzugewinnen, die die Musik hatte, bevor sie verändert wurde.

Einführung der Musik-De-Limiter-Netzwerke

Hier kommen die Musik-De-Limiter-Netzwerke ins Spiel. Diese Netzwerke können stark komprimierte Musik analysieren und daran arbeiten, wiederherzustellen, wie der ursprüngliche Klang gewesen wäre. Das wird durch eine Methode namens sample-wise gain inversion erreicht, die schätzt, wie sehr der Originalsound angepasst werden muss, um wieder in seine unkomprimierte Form zurückzukehren.

Um diese Netzwerke zu trainieren, wurde ein grosser Datensatz erstellt, der viele Beispiele komprimierter Musik zusammen mit ihren Originalversionen enthält. Dieser Datensatz ermöglicht es den Netzwerken, aus realen Beispielen zu lernen und ihre Fähigkeit, die Klangqualität komprimierter Musik wiederherzustellen, zu verbessern.

Vorteile des De-Limiter-Ansatzes

Es gibt mehrere Vorteile bei der Verwendung dieser De-Limiter-Netzwerke. Erstens, indem sie sich auf sample-wise Anpassungen konzentrieren, anstatt ganze neue Sounds zu erzeugen, können die Netzwerke hörbare Artefakte vermeiden, das sind unerwünschte Geräusche, die auftauchen können, wenn Musik verändert wird.

Ein weiterer Vorteil ist, dass das System ohne Phasenfehler arbeiten kann. Phasenfehler treten auf, wenn verschiedene Teile eines Sounds zu unterschiedlichen Zeiten bei den Ohren des Zuhörers ankommen, was einen matschigen oder unklaren Klang erzeugen kann. Indem sie diese Fehler vermeiden, können die De-Limiter-Netzwerke einen klareren, präziseren Sound produzieren.

Die Netzwerke sind auch darauf ausgelegt, leichtgewichtig zu sein. Das bedeutet, sie können schnell und effizient arbeiten, was wichtig für Echtzeitanwendungen wie Musikstreaming oder die Verwendung von Musik in Produktionen ist.

Die Rolle des Datensatzes

Der Datensatz, der zum Trainieren der De-Limiter-Netzwerke verwendet wird, besteht aus zahlreichen Musiksegmenten, die mit Limitern bearbeitet wurden. Diese Trainingsdaten wurden sorgfältig zusammengestellt, um eine breite Palette von Musikstilen und -merkmalen zu gewährleisten. Durch das Training auf diesem Datensatz lernen die Netzwerke, die Muster und Veränderungen zu erkennen, die auftreten, wenn Musik komprimiert wird, und wie man diese Effekte umkehrt.

Leistungsbewertung

Bei Tests zeigten die De-Limiter-Netzwerke beeindruckende Ergebnisse. Sie konnten Musik auf eine hochqualitative Version zurückbringen, die näher am Original war. Bestimmte Metriken wurden verwendet, um die Leistung zu messen, wie das skalierungsinvariante Verhältnis von Quelle zu Verzerrung (SI-SDR), das hilft zu quantifizieren, wie sehr der wiederhergestellte Klang dem Original ähnelt.

Die Netzwerke wurden auch darauf bewertet, wie gut sie in verschiedenen Musikabschnitten abschneiden, wie Gesang, Drums und Bass. Es wurde festgestellt, dass die Netzwerke besonders gut darin sind, den Klang von Drums wiederherzustellen, die oft am meisten unter Kompression leiden.

Anwendungen in der realen Welt

Die potenziellen Anwendungen dieser De-Limiter-Netzwerke sind riesig. Für die Zuhörer könnte diese Technologie zu einem besseren Audioerlebnis führen, da sie Musik geniessen können, die näher an dem klingt, wie sie ursprünglich gedacht war. Für Musikproduzenten könnte der Zugang zu einem De-Limiter ihnen ermöglichen, mit Samples zu arbeiten, die die ursprüngliche Qualität beibehalten.

Das könnte auch für Musikstreaming-Dienste von Vorteil sein, da sie diese Netzwerke implementieren könnten, um ein konsistenteres und angenehmeres Hörerlebnis über verschiedene Songs hinweg zu bieten.

Fazit

Der Lautheitskrieg ist seit vielen Jahren ein bedeutendes Problem in der Musikindustrie. Mit fortschrittlichen Technologien wie De-Limiter-Netzwerken gibt es Hoffnung auf eine Lösung, die die Qualität der Musik wiederherstellen kann, die durch übermässige Kompression verloren gegangen ist.

Durch den Einsatz eines sorgfältig zusammengestellten Datensatzes und innovativer Verarbeitungstechniken bieten diese Netzwerke eine Möglichkeit, den Reichtum und den Dynamikbereich der Musik zurückzubringen, was das Hören zu einem angenehmeren Erlebnis macht. Wenn sich diese Technologie weiterentwickelt, könnte sie den Weg für neue Standards in der Musikproduktion, dem Mastering und dem Genuss ebnen.

Zusammenfassend stellen De-Limiter-Netzwerke eine vielversprechende Entwicklung dar, um die Herausforderungen des Lautheitskriegs anzugehen. Indem sie darauf abzielen, die ursprüngliche Klangqualität wiederherzustellen, könnten diese Netzwerke sowohl die Musikproduktion als auch die Hörerlebnisse in der Zukunft erheblich verbessern.

Originalquelle

Titel: Music De-limiter Networks via Sample-wise Gain Inversion

Zusammenfassung: The loudness war, an ongoing phenomenon in the music industry characterized by the increasing final loudness of music while reducing its dynamic range, has been a controversial topic for decades. Music mastering engineers have used limiters to heavily compress and make music louder, which can induce ear fatigue and hearing loss in listeners. In this paper, we introduce music de-limiter networks that estimate uncompressed music from heavily compressed signals. Inspired by the principle of a limiter, which performs sample-wise gain reduction of a given signal, we propose the framework of sample-wise gain inversion (SGI). We also present the musdb-XL-train dataset, consisting of 300k segments created by applying a commercial limiter plug-in for training real-world friendly de-limiter networks. Our proposed de-limiter network achieves excellent performance with a scale-invariant source-to-distortion ratio (SI-SDR) of 24.0 dB in reconstructing musdb-HQ from musdb-XL data, a limiter-applied version of musdb-HQ. The training data, codes, and model weights are available in our repository (https://github.com/jeonchangbin49/De-limiter).

Autoren: Chang-Bin Jeon, Kyogu Lee

Letzte Aktualisierung: 2024-06-23 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2308.01187

Quell-PDF: https://arxiv.org/pdf/2308.01187

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel