SANGEET: Um Conjunto de Dados Estruturado para Música Hindustani
Apresentando SANGEET, um dataset super detalhado sobre Música Clássica Hindustani.
― 5 min ler
Índice
No mundo da música, ter acesso a conjuntos de dados ricos e variados é essencial tanto para pesquisadores quanto para praticantes. Um novo conjunto de dados chamado SANGEET foca no Hindustani Sangeet, que é a música clássica do Norte da Índia. Esse conjunto é construído usando XML, um formato que permite fácil armazenamento e recuperação de informações. O SANGEET inclui informações detalhadas sobre composições musicais criadas pelo conhecido musicólogo Pt. Vishnu Narayan Bhatkhande. O objetivo do SANGEET é facilitar a pesquisa e a compreensão da Música Clássica Hindustani de um jeito estruturado.
Importância do Conjunto de Dados
Conjuntos de dados musicais desempenham um papel chave em várias áreas de pesquisa, especialmente em recuperação de informação musical (MIR) e estudos musicológicos. Muitos conjuntos de dados existentes focam em gravações de áudio, que são úteis, mas muitas vezes perdem representações visuais e dados estruturados. É aí que o SANGEET entra. Ele fornece detalhes abrangentes, como Metadados, informações estruturais, padrões rítmicos e melodias, tudo em um formato padronizado que é fácil de acessar e usar.
Design e Estrutura
O conjunto de dados SANGEET é desenvolvido a partir do segundo volume da série Kramik Pustak Malika de Bhatkhande. Essa série de livros captura a essência da música Hindustani e inclui várias composições que abrangem diferentes temas e estilos. Cada peça de música no conjunto é salva como um documento XML separado, permitindo fácil organização e recuperação.
O conjunto inclui várias partes chave:
- Metadados: Informações gerais sobre cada composição, como título e gênero.
- Taal: A estrutura rítmica, que inclui detalhes sobre batidas e padrões de estresse.
- Raag: A estrutura melódica, mostrando os padrões ascendentes e descendentes das notas.
- Partitura: O layout da notação musical, formatado para fácil leitura e interpretação.
Esses componentes trabalham juntos para formar uma rica fonte de informações essenciais para várias aplicações.
Aplicações do SANGEET
Visualizando Partituras Musicais
Um dos principais usos de um conjunto de dados musical é visualizar as partituras. Com o SANGEET, os pesquisadores podem renderizar essas partituras em um sistema de notação que permite ver e entender a música visualmente. No entanto, criar representações visuais pode ser desafiador devido à falta de fontes padronizadas para símbolos musicais específicos. Para resolver isso, o SANGEET usa o sistema de notação Ome Swarlipi, uma versão compacta dos símbolos de Bhatkhande, facilitando a visualização da música em formatos web.
Consultando Informações Musicais
Outro aspecto único do SANGEET é sua capacidade de permitir consultas detalhadas. Os pesquisadores podem fazer perguntas específicas sobre a música e obter respostas precisas. Isso é possível por meio de ferramentas como XPath e XQuery, que ajudam os usuários a navegar pelos documentos XML de forma eficiente. Os usuários podem buscar uma variedade de detalhes, como quais composições apresentam certos elementos musicais ou com que frequência uma nota específica aparece em uma peça.
Aprendizado de Máquina para Previsão de Raag
O SANGEET também abre portas para análises musicológicas avançadas, incluindo aplicações de aprendizado de máquina. Por exemplo, os pesquisadores podem usar o SANGEET para prever a qual raag, ou escala musical, uma determinada composição pertence, analisando a frequência das notas na música. Esse elemento do conjunto envolve converter os dados XML em um formato adequado para aprendizado de máquina, permitindo que vários algoritmos processem e aprendam com os dados musicais.
Perspectivas Futuras
O SANGEET tem como objetivo expandir e melhorar ao longo do tempo. O objetivo imediato é incluir composições dos outros cinco volumes da Kramik Pustak Malika de Bhatkhande. Isso vai enriquecer ainda mais o conjunto de dados e fornecer insights mais amplos sobre o Hindustani Sangeet. O trabalho futuro também vai focar em integrar mais recursos, como marcações de taal e letras, que ajudarão os usuários a obter um contexto melhor e uma compreensão mais profunda das composições.
Conclusão
O SANGEET se destaca pela sua abordagem de armazenar e compartilhar informações sobre Hindustani Sangeet. Ao estruturar esse conjunto de dados de uma forma organizada, ele abre caminho para que pesquisadores e amantes da música acessem e analisem dados musicais de maneira mais fluida. Seja visualizando partituras, consultando características musicais específicas ou aplicando técnicas de aprendizado de máquina para entender melhor os RAAGs, o conjunto de dados SANGEET tem o potencial de contribuir significativamente para o campo da pesquisa musical. À medida que cresce e se desenvolve, continuará a ser um recurso valioso para qualquer um interessado na rica herança da Música Clássica Hindustani.
Título: SANGEET: A XML based Open Dataset for Research in Hindustani Sangeet
Resumo: It is very important to access a rich music dataset that is useful in a wide variety of applications. Currently, available datasets are mostly focused on storing vocal or instrumental recording data and ignoring the requirement of its visual representation and retrieval. This paper attempts to build an XML-based public dataset, called SANGEET, that stores comprehensive information of Hindustani Sangeet (North Indian Classical Music) compositions written by famous musicologist Pt. Vishnu Narayan Bhatkhande. SANGEET preserves all the required information of any given composition including metadata, structural, notational, rhythmic, and melodic information in a standardized way for easy and efficient storage and extraction of musical information. The dataset is intended to provide the ground truth information for music information research tasks, thereby supporting several data-driven analysis from a machine learning perspective. We present the usefulness of the dataset by demonstrating its application on music information retrieval using XQuery, visualization through Omenad rendering system. Finally, we propose approaches to transform the dataset for performing statistical and machine learning tasks for a better understanding of Hindustani Sangeet. The dataset can be found at https://github.com/cmisra/Sangeet.
Autores: Chandan Misra, Swarup Chattopadhyay
Última atualização: 2023-06-07 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2306.04148
Fonte PDF: https://arxiv.org/pdf/2306.04148
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.