Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Son# Apprentissage automatique# Multimédia# Traitement de l'audio et de la parole

Avancée de l'harmonisation des mélodies avec un contexte émotionnel

Un nouveau modèle améliore l'harmonisation des mélodies en tenant compte des facteurs émotionnels.

― 8 min lire


Harmonie ÉmotionnelleHarmonie Émotionnelledans la GénérationMusicalemusicale grâce à l'harmonisation.Un nouveau modèle renforce l'émotion
Table des matières

L'harmonisation des mélodies, c'est une façon d'ajouter des accords à une mélodie. Le but, c'est de rendre la musique plus intéressante et d'exprimer des émotions. Ce processus est super important pour aider les ordis à créer une musique qui sonne humain, ce qui peut inspirer les compositeurs et être utile dans le divertissement et l'éducation.

Avant, beaucoup de modèles utilisaient un type de réseau de neurones appelé Long Short-Term Memory (LSTM) pour créer des accords basés sur des mélodies. Mais souvent, ces modèles donnaient des résultats similaires pour la même mélodie et ne prenaient pas en compte comment les émotions influencent la musique. Récemment, un autre modèle, le variational autoencoder (VAE), a été utilisé pour créer des harmonies plus variées. Mais ces études oublient souvent le contexte émotionnel de la musique.

Utiliser le deep learning pour générer de la musique en fonction des émotions est devenu à la mode. La plupart des recherches se sont concentrées sur la création de musique à partir de zéro en se basant sur les émotions. Peu d'études ont examiné comment les émotions influencent la génération de parties de musique, comme l'ajout d'harmonies aux mélodies.

Comprendre comment les émotions affectent l'harmonisation des mélodies est essentiel. Il y a deux idées principales : d'abord, si les harmonies expriment des émotions différentes, il pourrait être possible de changer l'émotion globale d'une pièce en générant des accords qui correspondent à une émotion précise. Ensuite, parfois c'est dur de saisir l'émotion transmise par les harmonies, et comprendre le contexte émotionnel peut aider à créer de meilleures harmonies.

Pour répondre à ça, un nouveau modèle appelé Hierarchical Variational Autoencoder (LHVAE) a été développé. Ce modèle LHVAE regarde les conditions émotionnelles et les combine avec différents niveaux d'informations musicales pour créer de meilleures harmonies avec plus de variété. Le modèle inclut aussi un vecteur de contexte mélodique pour mieux relier les mélodies et les harmonies.

Harmonisation des Mélodies

L'harmonisation des mélodies est une méthode pour générer des progressions d'accords à partir d'une mélodie donnée. Le but est de créer des harmonies qui améliorent la mélodie et ajoutent de la profondeur émotionnelle. En plus d'améliorer la créativité musicale, l'harmonisation des mélodies peut soutenir l'enseignement de la musique et améliorer le divertissement.

Beaucoup de modèles de réseaux de neurones ont été créés pour l'harmonisation des mélodies, mais ils produisent souvent des résultats limités pour la même entrée. En utilisant des réseaux LSTM, les chercheurs voulaient rendre les harmonies plus engageantes, mais beaucoup de modèles n'ont pas pris en compte comment l'émotion impacte la création musicale.

Le contexte émotionnel de la musique nécessite une attention précise en matière d'harmonisation des mélodies. Les arrangements harmoniques peuvent montrer des émotions distinctes, et utiliser des émotions spécifiques dans les harmonies peut changer le ressenti de l'ensemble d'une pièce musicale. Quand l'émotion de l'harmonie est difficile à discerner, les conditions émotionnelles peuvent aider à produire de meilleures harmonies.

Les recherches passées se sont concentrées sur ces points, suggérant que les conditions émotionnelles influencent positivement les résultats de l'harmonisation des mélodies. Pourtant, il n'y a pas eu suffisamment d'expérimentations pour confirmer que les mélodies sont les principales sources d'expression émotionnelle dans la musique, plutôt que les harmonies.

Modèle Proposé

Pour combler les lacunes dans les travaux antérieurs, LHVAE a été créé pour évaluer comment les conditions émotionnelles affectent la génération d'harmonies et améliorer la variété des progressions d'accords. Le modèle utilise une structure hiérarchique, permettant de différencier les niveaux d'influence émotionnelle sur les harmonies.

Le modèle LHVAE reconnaît que les mélodies et les harmonies doivent fonctionner ensemble pour créer une expérience musicale cohérente. Il capte les sentiments dans la musique en incluant des facteurs émotionnels à différents niveaux, s'assurant que les émotions sont représentées efficacement.

Représentation Musicale

Dans LHVAE, la musique est représentée en utilisant un format basé sur les événements. Chaque note dans la mélodie est décrite par deux composants : la hauteur et la durée. Un accord est représenté en combinant des informations sur le type d'accord et la tonalité fondamentale. Cette représentation structurée permet au modèle de comprendre la musique et de générer des accords avec précision.

Le modèle contient aussi différents types de Variables Latentes qui aident à capturer les dynamiques émotionnelles à divers niveaux. Ces variables aident le modèle à apprendre de la musique et à créer des harmonies adaptées.

Méthodologie

Le modèle LHVAE fonctionne en analysant une séquence de mélodie et en prédisant la séquence d'accords correspondante. Il utilise des variables latentes pour modéliser les conditions émotionnelles à la fois au niveau d'une pièce et au niveau d'une mesure. Chaque niveau influence la génération des accords, permettant des résultats plus nuancés.

Le modèle s'appuie sur l'inférence variationnelle pour calculer à quel point les accords générés sont probables par rapport aux pièces originales. En estimant la probabilité des accords générés, le modèle améliore continuellement ses résultats d'harmonisation.

De plus, le modèle intègre un vecteur de contexte mélodique, lui permettant de considérer les caractéristiques spécifiques des mélodies lors de la génération des accords. Cela aide à créer un meilleur match entre les mélodies et les harmonies ajoutées.

Expériences

Pour évaluer LHVAE, un ensemble de données avec un contenu émotionnel étiqueté a été utilisé. Les chercheurs ont comparé les performances de LHVAE avec d'autres modèles LSTM pour évaluer comment bien il générerait des harmonies. L'accent a été mis sur la détermination de l'impact du changement des accords sur l'émotion globale de la musique.

Les expériences ont montré que LHVAE produisait de meilleurs résultats que d'autres méthodes. Les chercheurs ont évalué la musique générée à l'aide de divers critères, y compris la façon dont les accords s'alignaient avec les mélodies et la diversité des harmonies générées.

Ils ont aussi réalisé des évaluations subjectives, recueillant des retours de personnes écoutant la musique pour voir si elles pouvaient identifier les émotions exprimées dans les harmonies générées. Ces retours ont fourni des insights importants sur l'efficacité émotionnelle des accords générés.

Résultats

Les résultats de l'évaluation ont mis en évidence que le modèle pouvait générer des harmonies diverses tout en maintenant la connexion globale avec la mélodie. Il a prouvé que LHVAE était efficace pour capturer le contexte émotionnel d'une manière que les modèles précédents n'ont pas pu.

Cependant, les résultats ont aussi révélé un point important : changer simplement les accords n'affectait pas significativement l'émotion globale perçue par les auditeurs. Cela indique que les musiciens et compositeurs pourraient devoir considérer plus que la structure des accords pour exprimer des thèmes émotionnels dans la musique.

Conclusion

LHVAE a été une avancée dans le raffinement du processus d'harmonisation des mélodies. En combinant des conditions émotionnelles avec une structure hiérarchique, le modèle pouvait produire des harmonies à la fois engageantes et variées. Il a montré que le contexte émotionnel joue un rôle dans la qualité des harmonies générées. Pourtant, il a conclu que changer simplement des accords pourrait ne pas changer l'émotion perçue d'une pièce.

Dans les efforts futurs, les chercheurs prévoient d'utiliser des modèles basés sur des transformeurs pour explorer des facteurs émotionnels plus profonds dans la musique. Ils visent à examiner d'autres éléments de la musique, comme le tempo et la densité des notes, pour améliorer la création musicale axée sur les émotions. L'objectif reste de créer de la musique qui résonne plus profondément avec les émotions humaines, offrant aux musiciens et aux auditeurs des expériences musicales plus riches.

Source originale

Titre: Emotion-Conditioned Melody Harmonization with Hierarchical Variational Autoencoder

Résumé: Existing melody harmonization models have made great progress in improving the quality of generated harmonies, but most of them ignored the emotions beneath the music. Meanwhile, the variability of harmonies generated by previous methods is insufficient. To solve these problems, we propose a novel LSTM-based Hierarchical Variational Auto-Encoder (LHVAE) to investigate the influence of emotional conditions on melody harmonization, while improving the quality of generated harmonies and capturing the abundant variability of chord progressions. Specifically, LHVAE incorporates latent variables and emotional conditions at different levels (piece- and bar-level) to model the global and local music properties. Additionally, we introduce an attention-based melody context vector at each step to better learn the correspondence between melodies and harmonies. Objective experimental results show that our proposed model outperforms other LSTM-based models. Through subjective evaluation, we conclude that only altering the types of chords hardly changes the overall emotion of the music. The qualitative analysis demonstrates the ability of our model to generate variable harmonies.

Auteurs: Shulei Ji, Xinyu Yang

Dernière mise à jour: 2023-07-19 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2306.03718

Source PDF: https://arxiv.org/pdf/2306.03718

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires