Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Biologie# Verhalten und Kognition von Tieren

Fortschritte in der Sprachveränderungstechnologie

Forscher können jetzt Stimmen manipulieren, um das Verständnis von Wahrnehmung zu verbessern.

― 6 min Lesedauer


StimmverzerrungStimmverzerrungentfesseltEmpfinden von Sound um.Veränderte Stimmen formen unser
Inhaltsverzeichnis

Stimmenveränderung ist der Prozess, bei dem die Eigenschaften einer Stimme verändert werden, um Variationen oder neue Klänge zu erzeugen. Das ist ähnlich wie bei der Gesichtsmorphing-Software, die Forscher nutzen, um besser zu verstehen, wie wir Gesichter und Emotionen erkennen. Während es relativ einfach ist, einfache Klänge zu manipulieren, stellt das gleiche bei komplexen Klängen wie Stimmen mehr Herausforderungen dar.

Stimmenveränderungswerkzeuge ermöglichen es Wissenschaftlern, Stimmen auf eine Weise zu erstellen und zu modifizieren, die wesentliche Merkmale intakt hält. Zum Beispiel können Forscher eine Reihe von Stimmen erstellen, die allmählich von einer Identität zur anderen übergehen. Das hilft, die Unterschiede in Stimmen, wie Alter oder Geschlecht, zu erforschen, ohne die Verwirrung durch physische Unterschiede zwischen den Klängen.

Legacy STRAIGHT

Es gibt ein Open-Source-Tool namens Legacy STRAIGHT, das Forschern hilft, Sprachsignale zu manipulieren. Dieses Tool ist dafür ausgelegt, Sprache in hochwertiger Art und Weise zu verändern. Es war für viele Forscher hilfreich und führte zu spannenden Entdeckungen in der Sprachwahrnehmung und dem emotionalen Gehalt von Stimmen.

Legacy STRAIGHT funktioniert, indem es ein Sprachsignal in wichtige Teile zerlegt: die allgemeine Klangform, die Grundfrequenz der Stimme und die Zufälligkeit des Sounds. Das bedeutet, dass Klänge geglättet oder manipuliert werden können, um neue Versionen des Originalklangs zu schaffen.

STRAIGHT ist nicht nur gut für Sprache, sondern kann auch verwendet werden, um andere Arten von vokalen Klängen zu verändern, wie Tiergeräusche oder emotionale Ausdrücke in Stimmen. Das ermöglicht eine breitere Palette von Studien darüber, wie wir sowohl menschliche als auch nichtmenschliche Klänge verstehen.

Einführung von STRAIGHTMORPH

Der Zweck des neuen Tools, STRAIGHTMORPH, ist es, die Stimmenveränderung für Forscher einfach zu machen. Es baut auf den Fähigkeiten von Legacy STRAIGHT auf und enthält zusätzliche Funktionen, die sich auf das Extrahieren und Kombinieren von Stimmmerkmalen konzentrieren.

STRAIGHTMORPH ist dafür gedacht, in einem Softwareprogramm namens Matlab verwendet zu werden. Nutzer finden alle notwendigen Dateien zum Download. Ein Tutorial-Ordner enthält Beispielklänge, um den Nutzern den Einstieg zu erleichtern.

Schritt 1 – Extrahieren von Stimminformationen

Der erste Schritt bei der Verwendung von STRAIGHTMORPH besteht darin, Stimminformationen zu extrahieren, die als 'mObjects' bezeichnet werden. Diese mObjects enthalten wichtige Details über eine Stimme, wie ihre Wellenform, Frequenzschätzungen und Hintergrundgeräuschpegel.

Der Extraktionsprozess umfasst zwei Hauptschritte, die Aufmerksamkeit erfordern. Der erste ist die Schätzung der Grundfrequenz der Stimme, die für eine gute Klangqualität bei der Veränderung entscheidend ist. Manchmal liefern die automatischen Methoden keine perfekten Ergebnisse, also können Nutzer die Frequenzgrenzen manuell anpassen, wenn nötig.

Der zweite Schritt besteht darin, Referenzpunkte zu definieren, die Anker genannt werden. Diese Anker sind wichtig, um Klänge während der Veränderung genau auszurichten. Nutzer müssen diese Anker sorgfältig setzen, um sicherzustellen, dass der Morphing-Prozess qualitativ hochwertige Ergebnisse liefert.

Sobald das mObject erstellt ist, sollte es durch Abspielen überprüft werden, um sicherzustellen, dass es wie das Original klingt. Wenn es merkliche Unterschiede gibt, ist es am besten, den Extraktionsprozess zu wiederholen.

Schritt 2 – Kombinieren von mObjects

Der nächste Schritt besteht darin, mehrere mObjects zu kombinieren. Dieser Prozess wird von einer Funktion namens VoiceMultiMorph verwaltet. Wenn Nutzer unterschiedliche Stimmen zusammenführen wollen, laden sie ihre mObjects in die Software und definieren, wie viel von jeder Stimme im Endprodukt enthalten sein soll.

Der Schlüssel zu diesem Teil ist das Setzen von 'mRates', die bestimmen, wie viel von jeder Stimme zum neuen Klang beiträgt. Das gibt den Nutzern die Möglichkeit, verschiedene Mischungen von Stimmen zu erstellen. Das Tool kümmert sich um die Kombination der Stimmen auf eine unkomplizierte Weise, was es einfach macht, es für verschiedene Arten von Stimmenveränderungen zu verwenden.

Morphing-Beispiele

Morphing zwischen zwei Stimmen

Ein häufiges Beispiel ist das Morphing zwischen einer männlichen und einer weiblichen Stimme, die dasselbe Wort sagen. Wenn diese beiden Klänge kombiniert werden, können Nutzer gleiche Gewichte für beide Stimmen setzen, um einen Durchschnittsklang zu erzeugen, oder sie können die Gewichte anpassen, um bestimmte Mischungen zu erstellen.

Dieser Prozess kann auch auf Emotionen angewendet werden, da Forscher möglicherweise Stimmen mischen wollen, die unterschiedliche emotionale Zustände zeigen, um zu studieren, wie wir diese Änderungen wahrnehmen.

Erzeugen einer Reihe von Stimmen

Eine weitere interessante Anwendung ist das Generieren einer Reihe von Klängen zwischen zwei Stimmen, oft als Kontinuum bezeichnet. Durch schrittweise Variation der Gewichte können Nutzer mehrere verschiedene Versionen eines Sounds erstellen, die sanft von einer zur anderen übergehen. Das ist nützlich, um zu untersuchen, wie Veränderungen in den Stimmmerkmalen die Wahrnehmung beeinflussen.

Morphing mehrerer Stimmen

VoiceMultiMorph ermöglicht es Forschern auch, mehr als zwei Stimmen zu morphieren. Bei mehreren Stimmen gelten die gleichen Prinzipien. Der Schlüssel ist, alle gewünschten Stimmen zu laden und geeignete Gewichte für jede festzulegen. Das kann eine neue Stimme erzeugen, die einen Durchschnitt oder eine Mischung aller enthaltenen Klänge repräsentiert.

Verwendung von Stimmenveränderung für zufällige Stimuli

Neben dem Morphing zwischen bekannten Stimmen ist es möglich, zufällige Sprachproben zu erstellen, indem die angewendeten Gewichte auf die mObjects variiert werden. Das kann nützlich sein, um eine breite Palette von Klängen für Tests oder Experimente zu erzeugen.

Über menschliche Stimmen hinaus

Interessanterweise ist STRAIGHTMORPH nicht auf menschliche Stimmen beschränkt. Es kann auch verwendet werden, um menschliche Stimmen mit Musikklängen oder Tiergeräuschen zu kombinieren. Das eröffnet neue Wege für die Forschung zur Vocalisation über verschiedene Arten hinweg.

Forscher können beispielsweise eine Mischung zwischen einer menschlichen Stimme und einer musikalischen Note erzeugen, was zu Untersuchungen führt, wie verschiedene Klänge zusammen wahrgenommen werden können. STRAIGHTMORPH kann auch bei Tiergeräuschen funktionieren, solange sie klare Tonhöhendaten bieten.

Durch Anpassung einiger Einstellungen kann STRAIGHTMORPH bedeutungsvolle Veränderungen sogar in Vokalisierungen erzeugen, die nicht menschlich sind. Zum Beispiel könnte es neue Klänge erzeugen, die eine Mischung verschiedener Primatenrufe darstellen, und Forschern helfen, zu untersuchen, wie Tiere kommunizieren.

Fazit

Stimmenveränderung ist ein leistungsstarkes Werkzeug für Forschung und Experimente. Mit der Hilfe von Software wie STRAIGHTMORPH können Wissenschaftler Stimmen auf verschiedene Weise manipulieren und ein besseres Verständnis von Wahrnehmung und Kommunikation schaffen.

Da die Technologie weiterhin voranschreitet, werden diese Werkzeuge wahrscheinlich noch weiter verfeinert, was neue Einblicke in die Art und Weise bietet, wie wir unterschiedliche Klänge interpretieren und auf sie reagieren. Die potenziellen Anwendungen der Stimmenveränderung sind enorm und reichen in Bereiche wie Psychologie, Linguistik und sogar Unterhaltung. Ob man die Nuancen der Sprache oder die emotionalen Untertöne der Stimme untersucht, Morphing-Werkzeuge werden eine wesentliche Rolle in der zukünftigen Forschung spielen.

Originalquelle

Titel: STRAIGHTMORPH: A Voice Morphing Tool for Research in Voice Communication Sciences

Zusammenfassung: The purpose of this paper is to make easily available to the scientific community an efficient voice morphing tool called STRAIGHTMORPH and provide a short tutorial on its use with examples. STRAIGHTMORPH consists of a set of Matlab functions allowing to generate high-quality, parametrically-controlled morphs of an arbitrary number of voice samples. A first step consists in extracting an mObject for each voice sample, with accurate tracking of the fundamental frequency contour and manual definition of Time and Frequency anchors corresponding across samples to be morphed. The second step consists in parametrically combining the mObjects to generate novel synthetic stimuli, such as gender, identity or emotion continua, or random combinations. Although STRAIGHTMORPH has been designed for human voices it can work well with other types of sounds such as non-human primate vocalizations.

Autoren: Pascal Belin, H. Kawahara

Letzte Aktualisierung: 2024-06-06 00:00:00

Sprache: English

Quell-URL: https://www.biorxiv.org/content/10.1101/2024.06.04.597359

Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.06.04.597359.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel