Analyser les chansons folkloriques coréennes grâce à la technologie
Une étude sur les chansons folkloriques coréennes en utilisant des méthodes d'analyse modernes.
― 10 min lire
Table des matières
Ce travail parle de l'étude d'une grande collection de chansons folkloriques coréennes. Les chansons, enregistrées dans les années 1980 et 1990, représentent environ 700 heures d'audio. Les chanteurs étaient principalement des amateurs, et ils chantaient souvent sans instruments, ce qui rendait l'analyse difficile. Pour relever ces défis, on a utilisé une méthode appelée Apprentissage auto-supervisé, qui aide les ordis à apprendre des données sans avoir besoin de beaucoup d'étiquettes manuelles.
Comprendre les Chansons Folkloriques Coréennes
Les chansons folkloriques sont considérées comme un type de langage musical et représentent l'essence de la musique traditionnelle. Elles reflètent la culture et la langue d'une communauté et ont été fondamentales pour diverses formes d'art et de musique au fil du temps. La recherche sur les chansons folkloriques peut inspirer des idées nouvelles dans les études de musique contemporaine et encourager la collaboration entre la musique et d'autres domaines.
En Corée, il y a eu beaucoup de discussions sur les caractéristiques uniques des chansons folkloriques régionales. Un concept clé dans ces discussions est celui de "Tori". C'est un système de classification utilisé pour décrire les styles musicaux de la musique folklorique basé sur plusieurs caractéristiques, y compris les échelles, l'ornementation, et les motifs mélodiques courants.
Bien que l'idée de tori soit largement reconnue, les méthodes de classification existantes n'ont pas toujours capturé avec précision les caractéristiques de la musique. Beaucoup de chercheurs ont tenté de catégoriser le tori en examinant les échelles, les notes principales, l'ornementation, les notes finales et les motifs mélodiques communs. Cependant, des débats et des désaccords continuent sur la meilleure façon de classer le tori.
Pour mener des études significatives sur les chansons folkloriques, il est crucial d'analyser les relations au sein des enregistrements audio. En général, les chercheurs examinent de petites portions d'audio à cause de la nature chronophage de l'examen de nombreux fichiers individuellement. Une méthode traditionnelle utilisée dans l'analyse musicale est la transcription, qui consiste à écouter un morceau de musique et à l'écrire en utilisant une notation musicale. Cependant, cette méthode a des limites, car elle peut parfois ne pas refléter avec précision les hauteurs et les rythmes des chansons folkloriques.
Méthodes Modernes d'Analyse
Pour résoudre ces problèmes, les chercheurs ont commencé à appliquer des techniques de récupération d'information musicale (MIR) pour analyser la musique folklorique. Par exemple, la musique raga indienne traditionnelle a été étudiée en utilisant des distributions de hauteurs, tandis que le chant géorgien a été analysé tonalement basé sur des systèmes d'accord spécifiques. Des idées ont également été tirées de l'analyse de la musique vocale flamenco et arabe-andalouse en utilisant le traitement du signal audio.
Dans ce travail, nous proposons une méthode technologique pour analyser un grand nombre de chansons folkloriques coréennes en utilisant l'apprentissage profond. Notre objectif principal est d'examiner comment les catégories traditionnelles de chansons folkloriques coréennes, définies par le tori, se reflètent dans les enregistrements de terrain réels. En comparant nos résultats d'analyse avec des méthodes établies de classification musicale, nous visons à identifier des caractéristiques et des motifs clés parmi les chansons folkloriques coréennes.
Le Jeu de Données des Chansons Folkloriques Coréennes
L'"Anthologie des Chansons Folkloriques Traditionnelles Coréennes" est une collection audio qui consiste entièrement en chansons folkloriques coréennes traditionnelles. Cette collection a été rassemblée par la Munhwa Broadcasting Corporation (MBC) dans le cadre d'une initiative culturelle entre 1989 et 1995. L'audio comprend 15 861 chansons, totalisant environ 700 heures d'enregistrements. Ces chansons ont été enregistrées dans divers endroits à travers la Corée du Sud, couvrant de nombreuses villes et villages.
Le jeu de données est rempli d'informations utiles telles que les titres de chansons, les paroles, les régions, les dates d'enregistrement et des informations sur les chanteurs. Cette richesse de données fait de la collection une ressource vitale pour la recherche sur la musique folklorique coréenne.
Nous avons obtenu cet audio sur le site officiel de la MBC, où tout est mis à disposition du public. Nous avons également reçu le consentement de la MBC pour utiliser ces données pour notre étude.
Qu'est-ce que le Tori ?
Le concept de tori a été introduit au début des années 1980 par un expert en musique coréenne pour expliquer les traits musicaux des chansons folkloriques de différentes régions. Avant le développement de ce concept, des termes comme "jo" et "cheong" étaient souvent utilisés pour décrire les chansons folkloriques en fonction de leur centre tonal et de leurs intervalles. Cependant, ces termes n'ont pas réussi à capturer adéquatement les qualités uniques de la musique folklorique coréenne.
En conséquence, le système de classification tori a été créé pour couvrir plus de facteurs, comme les notes principales, l'ornementation, les notes finales et les motifs mélodiques communs. La méthode la plus courante divise les chansons en quatre catégories clés.
- Gyung-tori : Ce style implique cinq notes et se trouve principalement dans la région de la capitale. Il présente généralement un vibrato doux et une mélodie élaborée.
- Menari-tori : Trouvé dans toute la région est et à travers la péninsule coréenne, ce style saute entre les notes tout en montant et glisse vers le bas en utilisant des notes de passage.
- Yukjabaegi-tori : Principalement trouvé dans le sud de la Corée, ce style est connu pour son fort vibrato, particulièrement sur la note G, et en passant par une note E tout en descendant de E à D.
- Sushimga-tori : Commun dans le nord-ouest de la Corée, ce style présente un vibrato distinctif vers le haut.
Annotation Tori
Comme le jeu de données ne venait pas avec des étiquettes tori, un des chercheurs, qui a plus de dix ans d'expérience dans la musique traditionnelle coréenne, a classé manuellement une sélection de 218 enregistrements de haute qualité. L'accent était mis sur l'identification des traits musicaux clairs définis dans la méthode de classification tori, incluant la hauteur, l'ornementation et la mélodie.
En travaillant avec le jeu de données, il a été noté qu'il n'y avait pas beaucoup d'exemples de sushimga-tori. La majorité des chansons venaient des régions centrales et méridionales. Les chansons menari-tori ont été trouvées à travers le pays, tandis que les types restants de tori-gyung-tori, yukjabaegi-tori, et menari-tori-étaient plus répandus. Les morceaux audio qui ressemblaient à des discours ou des chants et qui ne correspondaient à aucune catégorie tori établie ont été étiquetés comme 'autres.'
La Méthode Utilisée
Dans cette étude, nous avons représenté les caractéristiques musicales des chansons folkloriques à l'aide d'un vecteur unique de haute dimension, connu sous le nom d'embedding. Si cet embedding reflète avec précision les qualités des tori, il peut être utilisé pour classifier les tori, rechercher des chansons similaires et regrouper des chansons selon les types de tori.
Plutôt que de travailler directement avec les enregistrements audio, nous nous sommes concentrés sur la forme de la fréquence fondamentale (F0), qui nous permet de mieux capturer la mélodie que d'autres caractéristiques comme le dialecte du chanteur.
Pour extraire le contour de F0 de chaque fichier audio, nous avons utilisé un modèle bien connu appelé CREPE, qui capture la valeur de F0 toutes les 10 millisecondes avec un score de confiance.
Analyser la Distribution des Hauteurs
Pour étudier le système musical, les chercheurs examinent souvent la distribution des hauteurs des mélodies à travers une méthode appelée histogrammes de hauteur. Cette approche a été utilisée pour analyser la musique traditionnelle de diverses cultures, comme la musique carnatique indienne et le makam turc.
Lorsqu'on travaille avec des histogrammes de hauteur, connaître le tonique d'une chanson est essentiel pour ajuster correctement la distribution des hauteurs. À travers nos expériences initiales, nous avons découvert que le tonique est généralement la hauteur la plus fréquemment rencontrée dans une chanson.
Nous avons déterminé le tonique en comptant les occurrences de hauteurs en utilisant une méthode qui prend en compte de légères variations de hauteur. Cette méthode nous a permis d'identifier le tonique même lorsque le centre de hauteur n'était pas en accord standard.
Utiliser un Modèle CNN
Bien que les histogrammes de hauteur puissent fournir une vue claire des caractéristiques musicales de chaque chanson, ils ne prennent pas en compte les relations entre les notes. Comme beaucoup des enregistrements comportent des chanteurs non professionnels sans accompagnement instrumental, il y avait beaucoup de bruit dû aux variations dans le chant et la fréquence tonique.
Pour résoudre ces problèmes, nous avons utilisé un réseau neuronal convolutionnel (CNN) pour apprendre la représentation du contour de hauteur. Cette technique nous aide à mieux saisir les caractéristiques musicales liées aux tori.
Les premières pensées étaient de former le CNN de manière traditionnelle en utilisant l'apprentissage supervisé, mais nous avons remarqué que de nombreuses chansons avaient différents types de tori même dans la même région, ce qui compliquait la formation. Ainsi, nous avons choisi d'employer une approche d'apprentissage auto-supervisé, permettant au modèle d'apprendre des données sans nécessiter de nombreux exemples étiquetés.
Évaluation et Discussion
Dans nos expériences, nous avons cherché à mesurer les connexions entre les classifications tori et divers schémas d'embedding. L'objectif était d'évaluer à quel point ces Embeddings expliquaient les caractéristiques des tori.
Nous avons utilisé deux métriques principales : le classement basé sur la similarité cosinus et la précision de classification avec un classificateur de forêt aléatoire. Les chansons qui partageaient des embeddings similaires étaient censées appartenir à la même classification tori.
Les résultats ont montré que les histogrammes de hauteur obtenaient une précision décente, mais la meilleure performance venait des embeddings appris grâce à l'apprentissage auto-supervisé. Cela suggère que le tori englobe plus que de simples échelles de hauteur-il inclut également l'ornementation et les phrases idiomatiques.
Aperçus des Données
Nous avons également mené une analyse des histogrammes de hauteur pour identifier des traits musicaux notables. L'analyse a révélé des motifs intéressants liés à l'utilisation de différentes notes et à la présence de vibrato.
Visualiser les embeddings appris en utilisant une technique appelée UMAP a fourni des aperçus sur les distributions des différentes classifications tori. Menari-tori, par exemple, montrait une gamme plus large par rapport à d'autres catégories.
Conclusion
Dans cette étude, nous avons introduit une approche moderne pour analyser une quantité significative de chansons folkloriques coréennes à travers la technologie. En utilisant l'apprentissage profond et l'apprentissage auto-supervisé, nous avons pu découvrir des aperçus significatifs sur les classifications musicales traditionnelles.
Grâce à nos découvertes, nous visons à améliorer la compréhension du tori et à offrir des ressources précieuses tant pour les chercheurs que pour les passionnés de musique folklorique coréenne. Notre travail peut servir de base pour de futures études, aidant à clarifier comment les chansons folkloriques ont évolué au fil du temps et à travers différentes régions.
Titre: Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song
Résumé: In this paper, we introduce a computational analysis of the field recording dataset of approximately 700 hours of Korean folk songs, which were recorded around 1980-90s. Because most of the songs were sung by non-expert musicians without accompaniment, the dataset provides several challenges. To address this challenge, we utilized self-supervised learning with convolutional neural network based on pitch contour, then analyzed how the musical concept of tori, a classification system defined by a specific scale, ornamental notes, and an idiomatic melodic contour, is captured by the model. The experimental result shows that our approach can better capture the characteristics of tori compared to traditional pitch histograms. Using our approaches, we have examined how musical discussions proposed in existing academia manifest in the actual field recordings of Korean folk songs.
Auteurs: Danbinaerin Han, Rafael Caro Repetto, Dasaem Jeong
Dernière mise à jour: 2023-08-04 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2308.02249
Source PDF: https://arxiv.org/pdf/2308.02249
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.