Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage

Émotions dans les paroles de chansons en telugu : un nouveau jeu de données

Un ensemble de données analysant les émotions dans les paroles de chansons en télougou basé sur la valence et l'excitation.

― 6 min lire


Analyse des émotions desAnalyse des émotions deschansons Teluguémotionnels des paroles en telugu.Un jeu de données révèle des insights
Table des matières

Reconnaître les Émotions dans la musique est super important pour comprendre comment les gens se sentent quand ils écoutent différentes chansons. On se concentre souvent sur les caractéristiques sonores, les tags de popularité et les détails des morceaux, mais on oublie souvent les paroles. En Inde, il n'y a pas eu beaucoup de recherches sur les émotions exprimées dans les paroles des chansons en langues régionales comme le télougou. Cet article parle de la création d'un jeu de données qui examine les émotions présentes dans les paroles de chansons télougou en se basant sur deux aspects : la Valence (à quel point une chanson est agréable ou désagréable) et l'Excitation (à quel point elle est énergique ou apaisante).

Création du jeu de données

Pour construire ce jeu de données, on a rassemblé des paroles de chansons télougou disponibles sur Spotify. Notre but était d'annoter ces paroles avec des notes moyennes pour la valence et l'excitation. On a remarqué que beaucoup de chansons télougou ont tendance à avoir des émotions positives. Pour équilibrer les émotions à travers différents types de chansons, on a sélectionné des morceaux de playlists variées comme "Happy Vibes Telugu" et "Sad Melodies Telugu."

On a rassemblé les paroles à la main, et si elles n'étaient pas dispos sur Spotify, on a utilisé d'autres sites pour les trouver. On a enlevé les doublons et on a fini avec 481 paroles uniques.

Processus d'annotation

On a utilisé une méthode simple pour annoter ces paroles. Trois locuteurs natifs télougous ont noté les paroles de chaque chanson en fonction de ce qu'ils ressentaient à propos de la valence et de l'excitation, sur une échelle de -2 à 2. Notre analyse a montré un bon accord entre les annotateurs, ce qui signifie que les gens ressentaient généralement de manière similaire les émotions dans les paroles.

Analyse des émotions

Les émotions dans les paroles peuvent être classées en quatre catégories en fonction des combinaisons de valence et d'excitation. Par exemple, une chanson peut être à la fois élevée en valence et élevée en excitation, comme un morceau joyeux à danser, ou basse dans les deux, comme une berceuse triste. On visait à créer des modèles qui classifient les paroles dans ces catégories basées sur les notes qu’on a collectées.

Pour y parvenir, on a utilisé deux méthodes principales : une basée sur des techniques de machine learning traditionnelles appelées Support Vector Machine (SVM) et une autre qui utilise des techniques avancées appelées fine-tuning avec un modèle connu sous le nom de XLM-RoBERTa. La deuxième méthode a montré de meilleurs résultats que la première, ce qui signifie qu'elle était plus efficace pour identifier les émotions à partir des paroles.

Comparaison avec Spotify

On a aussi comparé nos résultats avec les notes de Spotify pour chaque chanson, qui examinent les émotions en fonction de l'ensemble de la piste musicale. Spotify utilise des termes différents pour décrire des émotions comme la valence et l'énergie. Nos résultats ont montré qu'il y a un certain chevauchement entre nos annotations et les notes de Spotify, mais elles ne sont pas toujours d'accord.

Par exemple, on a observé une faible connexion entre nos notes de valence et celles de Spotify, indiquant que le poids émotionnel des paroles ne correspond pas toujours à la façon dont Spotify catégorise la chanson. Cependant, il y avait une corrélation positive modérée entre nos notes d'excitation et celles de Spotify, ce qui suggère que les deux méthodes capturent assez bien les éléments énergétiques.

Importance des paroles dans la reconnaissance des émotions musicales

Les paroles jouent un rôle clé dans nos émotions quand on écoute une chanson. Elles peuvent influencer profondément notre expérience émotionnelle. Malgré ça, de nombreuses études sur l'impact émotionnel de la musique se concentrent sur le son et non sur les mots. Notre recherche vise à combler ce manque en mettant en lumière la nécessité de prendre en compte les paroles en étudiant les émotions musicales.

Les Jeux de données précédents en langues indiennes se sont généralement concentrés soit sur la valence, soit sur l'excitation, mais pas les deux. Notre travail est unique car il fournit ces deux aspects pour les chansons télougou, ce qui aidera à mieux comprendre les sentiments véhiculés dans cette musique.

Le rôle de la culture

Les différences qu'on a trouvées entre nos annotations et les valeurs de Spotify suggèrent que les interprétations culturelles des émotions dans la musique peuvent varier. Chaque culture peut avoir des associations différentes avec les sons et les paroles, entraînant des réponses émotionnelles diversifiées. Comprendre cela peut aider à faire des recommandations musicales plus précises qui résonnent avec les auditeurs en fonction de leurs origines culturelles.

Directions futures

Ce jeu de données ouvre des opportunités pour des recherches futures. Il peut être utilisé pour créer des modèles qui prédisent les émotions à partir des paroles de chansons télougou et pourrait être élargi pour inclure des chansons d'autres langues sud-asiatiques. La capacité à reconnaître et catégoriser les émotions dans la musique peut améliorer notre interaction avec celle-ci et notre plaisir.

De plus, avec de plus en plus de gens en Inde utilisant des services de streaming musical comme Spotify, avoir des insights sur la façon dont les langues régionales expriment les émotions peut mener à de meilleures expériences pour les auditeurs. Équilibrer le jeu de données pour inclure une plus grande variété d'émotions sera important pour les études futures.

Conclusion

En résumé, on a créé un jeu de données de paroles de chansons télougou qui inclut des annotations pour la valence et l'excitation. Notre recherche souligne l'importance des paroles pour comprendre les émotions musicales et les nuances culturelles impliquées dans la perception émotionnelle. Les différences qu'on a trouvées en comparant nos annotations avec les valeurs de Spotify soulignent la nécessité de développer des modèles musicaux qui prennent en compte des contextes culturels spécifiques. En continuant d'explorer les émotions dans la musique, ce jeu de données servira de ressource précieuse pour les chercheurs et les développeurs.

Source originale

Titre: Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics

Résumé: Emotion recognition from a given music track has heavily relied on acoustic features, social tags, and metadata but is seldom focused on lyrics. There are no datasets of Indian language songs that contain both valence and arousal manual ratings of lyrics. We present a new manually annotated dataset of Telugu songs' lyrics collected from Spotify with valence and arousal annotated on a discrete scale. A fairly high inter-annotator agreement was observed for both valence and arousal. Subsequently, we create two music emotion recognition models by using two classification techniques to identify valence, arousal and respective emotion quadrant from lyrics. Support vector machine (SVM) with term frequency-inverse document frequency (TF-IDF) features and fine-tuning the pre-trained XLMRoBERTa (XLM-R) model were used for valence, arousal and quadrant classification tasks. Fine-tuned XLMRoBERTa performs better than the SVM by improving macro-averaged F1-scores of 54.69%, 67.61%, 34.13% to 77.90%, 80.71% and 58.33% for valence, arousal and quadrant classifications, respectively, on 10-fold cross-validation. In addition, we compare our lyrics annotations with Spotify's annotations of valence and energy (same as arousal), which are based on entire music tracks. The implications of our findings are discussed. Finally, we make the dataset publicly available with lyrics, annotations and Spotify IDs.

Auteurs: R Guru Ravi Shanker, B Manikanta Gupta, BV Koushik, Vinoo Alluri

Dernière mise à jour: 2023-03-16 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.09364

Source PDF: https://arxiv.org/pdf/2303.09364

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires