Emociones en letras de canciones en Telugu: Un nuevo conjunto de datos
Un conjunto de datos que analiza las emociones en las letras de canciones en telugu, basado en valencia y excitación.
― 5 minilectura
Tabla de contenidos
Reconocer emociones en la música es clave para entender cómo se siente la gente al escuchar diferentes canciones. La mayoría del foco ha estado en características de sonido, etiquetas de popularidad y detalles de las canciones, pero a menudo pasamos por alto la letra. En India, no ha habido mucha investigación sobre las emociones expresadas en las letras de canciones de lenguas regionales como el telugu. Este artículo habla sobre la creación de un conjunto de datos que analiza las emociones en las letras de canciones en telugu basándose en dos aspectos: valencia (qué tan agradable o desagradable se siente una canción) y Excitación (qué tan energética o tranquila se siente).
Creando el Conjunto de Datos
Para construir este conjunto de datos, recopilamos letras de canciones en telugu disponibles en Spotify. Nuestro objetivo era anotar estas letras con calificaciones promedio para valencia y excitación. Encontramos que muchas canciones en telugu tienden a tener sentimientos positivos. Para equilibrar las emociones en diferentes tipos de canciones, seleccionamos pistas de listas de reproducción diversas como "Happy Vibes Telugu" y "Sad Melodies Telugu."
Reunimos las letras manualmente, y si no estaban disponibles en Spotify, usamos otros sitios web para encontrarlas. Eliminamos duplicados y terminamos con 481 letras de canciones únicas.
Proceso de Anotación
Usamos un método sencillo para anotar estas letras. Tres hablantes nativos de telugu calificaron las letras de cada canción según lo que sentían respecto a la valencia y la excitación, usando una escala de -2 a 2. Nuestro análisis mostró un buen acuerdo entre los anotadores, lo que significa que la gente generalmente siente de manera similar acerca de las emociones en las letras.
Analizando Emociones
Las emociones en las letras pueden categorizarse en cuatro áreas basadas en combinaciones de valencia y excitación. Por ejemplo, una canción puede tener alta valencia y alta excitación, como una canción de baile alegre, o baja en ambas, como una nana triste. Nuestro objetivo era crear modelos que clasifiquen las letras en estas categorías basándose en las calificaciones que recopilamos.
Para lograrlo, utilizamos dos métodos principales: uno basado en técnicas tradicionales de aprendizaje automático llamado Support Vector Machine (SVM) y otro que utiliza técnicas avanzadas llamado fine-tuning con un modelo conocido como XLM-RoBERTa. El segundo método mostró mejores resultados que el primero, lo que significa que fue más efectivo para identificar emociones en las letras.
Comparando con Spotify
También comparamos nuestros hallazgos con las calificaciones de Spotify para cada canción, que analizan las emociones basándose en toda la pista musical. Spotify usa diferentes términos para describir emociones como valencia y energía. Nuestros resultados mostraron que, aunque hay cierta superposición entre nuestras anotaciones y las calificaciones de Spotify, no siempre están de acuerdo.
Por ejemplo, observamos una conexión débil entre nuestras calificaciones de valencia y las de Spotify, indicando que el peso emocional de las letras no siempre se alinea con cómo Spotify categoriza la canción. Sin embargo, hubo una correlación positiva moderada entre nuestras calificaciones de excitación y las de Spotify, sugiriendo que ambos métodos capturan los elementos energéticos bastante bien.
Importancia de las Letras en el Reconocimiento de Emociones de la Música
Las letras juegan un papel clave en cómo nos sentimos al escuchar una canción. Pueden influir profundamente en nuestra experiencia emocional. A pesar de esto, muchos estudios sobre el impacto emocional de la música se centran en el sonido y no en las palabras. Nuestra investigación busca llenar este vacío al resaltar la necesidad de mirar las letras al estudiar las emociones de la música.
Los Conjuntos de datos previos en lenguas indias generalmente solo se han enfocado en valencia o excitación, pero no en ambos. Nuestro trabajo es único porque proporciona ambos aspectos para canciones en telugu, lo que ayudará a entender mejor los sentimientos transmitidos en esta música.
El Papel de la Cultura
Las diferencias que encontramos entre nuestras anotaciones y los valores de Spotify sugieren que las interpretaciones culturales de las emociones en la música pueden variar. Cada cultura puede tener diferentes asociaciones con sonidos y letras, lo que lleva a respuestas emocionales diversas. Entender esto puede ayudar a hacer recomendaciones musicales más precisas que resuenen con los oyentes según sus contextos culturales.
Direcciones Futuras
Este conjunto de datos abre oportunidades para futuras investigaciones. Puede usarse para crear modelos que predicen emociones a partir de letras de canciones en telugu y podría ampliarse para incluir canciones de otras lenguas del sur de Asia. La capacidad de reconocer y clasificar emociones en la música puede mejorar la forma en que interactuamos y disfrutamos de la música.
Además, a medida que más personas en India usan servicios de streaming de música como Spotify, tener información sobre cómo las lenguas regionales expresan emociones puede llevar a mejores experiencias para los oyentes. Equilibrar el conjunto de datos para incluir una mayor variedad de emociones será importante para futuros estudios.
Conclusión
En resumen, creamos un conjunto de datos de letras de canciones en telugu que incluye anotaciones para valencia y excitación. Nuestra investigación resalta la importancia de las letras en la comprensión de las emociones musicales y las matices culturales implicadas en la percepción emocional. Las diferencias que encontramos al comparar nuestras anotaciones con los valores de Spotify subrayan la necesidad de desarrollar modelos musicales que consideren contextos culturales específicos. A medida que seguimos explorando emociones en la música, este conjunto de datos servirá como un recurso valioso para investigadores y desarrolladores por igual.
Título: Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics
Resumen: Emotion recognition from a given music track has heavily relied on acoustic features, social tags, and metadata but is seldom focused on lyrics. There are no datasets of Indian language songs that contain both valence and arousal manual ratings of lyrics. We present a new manually annotated dataset of Telugu songs' lyrics collected from Spotify with valence and arousal annotated on a discrete scale. A fairly high inter-annotator agreement was observed for both valence and arousal. Subsequently, we create two music emotion recognition models by using two classification techniques to identify valence, arousal and respective emotion quadrant from lyrics. Support vector machine (SVM) with term frequency-inverse document frequency (TF-IDF) features and fine-tuning the pre-trained XLMRoBERTa (XLM-R) model were used for valence, arousal and quadrant classification tasks. Fine-tuned XLMRoBERTa performs better than the SVM by improving macro-averaged F1-scores of 54.69%, 67.61%, 34.13% to 77.90%, 80.71% and 58.33% for valence, arousal and quadrant classifications, respectively, on 10-fold cross-validation. In addition, we compare our lyrics annotations with Spotify's annotations of valence and energy (same as arousal), which are based on entire music tracks. The implications of our findings are discussed. Finally, we make the dataset publicly available with lyrics, annotations and Spotify IDs.
Autores: R Guru Ravi Shanker, B Manikanta Gupta, BV Koushik, Vinoo Alluri
Última actualización: 2023-03-16 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2303.09364
Fuente PDF: https://arxiv.org/pdf/2303.09364
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://www.overleaf.com/project/6315852a4406453009ecf67c
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://open.spotify.com/
- https://developer.spotify.com/documentation/web-api/
- https://www.lyricstape.com/
- https://lyricstelugu.in/
- https://tinyurl.com/mu2zkjtc
- https://huggingface.co/docs/transformers/model