Progressi nella Misurazione della Somiglianza Musicale
La ricerca punta a combinare dati audio e simbolici per analizzare la somiglianza musicale.
― 7 leggere min
La somiglianza musicale si riferisce a quanto siano simili due pezzi di musica. Questa idea gioca un ruolo importante nel modo in cui troviamo canzoni, raccomandiamo musica e studiamo la sua storia. Quando gli esperti di musica guardano le somiglianze, riescono a vedere schemi e connessioni tra diversi compositori e stili.
Metodi Attuali per Misurare la Somiglianza Musicale
Al momento, ci sono due modi principali per studiare la somiglianza musicale. Il primo si basa sul contenuto musicale stesso, che può includere come la musica è scritta (contenuto simbolico) o come suona nelle registrazioni (contenuto audio). Il secondo metodo guarda ai dati non musicali, come informazioni sulla popolarità della canzone o chi la ascolta.
Usare il contenuto simbolico può richiedere tempo e non è sempre facile da ottenere. D'altra parte, l'uso dei Segnali Audio spesso non spiega perché alcune canzoni suonano simili. Questa ricerca mira a combinare entrambi gli approcci per una comprensione più completa della somiglianza musicale.
L'Importanza della Somiglianza Musicale
Sapere quanto siano simili le tracce musicali aiuta in molte applicazioni. Per esempio, può portare a migliori raccomandazioni di canzoni, aiutare a creare playlist e assistere nella classificazione musicale, come identificare il genere di una canzone. Questo può anche aiutare gli utenti a trovare nuove canzoni che potrebbero piacergli in base alle loro abitudini di ascolto.
Inoltre, la somiglianza musicale supporta la ricerca accademica rivelando schemi in diversi stili e generi musicali. Questo può dare un’idea delle influenze musicali nel tempo.
Sfide nella Ricerca Attuale
Nonostante la sua importanza, studiare la somiglianza musicale presenta delle sfide. Usare sistemi basati sui contenuti significa fare affidamento su informazioni dettagliate estratte dalla musica stessa. Questo può sollevare problemi perché teoria musicale, cognizione e tecnologia si intrecciano in modi complessi.
Ci sono due tipi di rappresentazioni musicali da considerare: le rappresentazioni del segnale e quelle simboliche. Le rappresentazioni del segnale sono registrazioni audio grezze, mentre le rappresentazioni simboliche catturano note musicali e strutture discrete.
Le rappresentazioni simboliche sono più strutturate e più facili da analizzare per ottenere informazioni. Tuttavia, le rappresentazioni del segnale sono più comunemente studiate a causa del loro valore commerciale e della migliore disponibilità.
Caratteristiche Utilizzate nell'Analisi della Somiglianza Musicale
Si possono considerare molte caratteristiche per analizzare la somiglianza musicale. Queste includono:
- Metadata Descrittivi: Informazioni di base sulla canzone, come l'artista o l'album.
- Caratteristiche di Basso Livello: Aspetti tecnici dal segnale audio, come ritmo e tempo. Anche se efficienti per l'analisi, possono essere difficili da interpretare.
- Caratteristiche di Alto Livello: Caratteristiche più complesse che riflettono le intuizioni di ascoltatori esperti e professionisti.
La maggior parte dei sistemi esistenti tende a fare affidamento su caratteristiche di basso livello. Annotare caratteristiche di alto livello richiede competenze ed è costoso, portando a sistemi che potrebbero mancare di trasparenza e chiarezza.
Soluzioni Proposte per la Somiglianza Musicale
Questa ricerca mira a creare un sistema che spiega e interpreta la somiglianza musicale utilizzando sia dati simbolici che audio. L'obiettivo è permettere agli utenti di comprendere meglio e controllare i sistemi di classificazione e somiglianza musicale disponibili.
Per iniziare, il primo passo è studiare il contenuto simbolico per definire come misurare la somiglianza in modo chiaro. Successivamente, la ricerca allineerà il contenuto simbolico con i segnali audio utilizzando una combinazione di diversi tipi di dati. Infine, verrà sviluppato un sistema di deep learning per analizzare l'audio considerando anche le informazioni simboliche.
Introduzione dei Dati Multimodali
La ricerca si concentra sull'uso di un metodo chiamato tecnologie del Semantic Web per gestire vari tipi di dati musicali. Una delle principali sfide è capire come organizzare i Grafi di conoscenza (KG) per consentire un'analisi efficace e una mappatura su modelli matematici.
Studi sulla Somiglianza Musicale Simbolica
Recentemente, ci sono stati molti studi focalizzati sulla somiglianza musicale simbolica. Questi studi spesso guardano alle somiglianze armoniche e melodiche. La somiglianza melodica ha ricevuto la maggior parte dell'attenzione, con molti algoritmi sviluppati per definire diversi tipi di somiglianza basati sulla teoria musicale.
Tuttavia, gli studi sulla somiglianza armonica non hanno ricevuto la stessa attenzione, e molti algoritmi si concentrano principalmente su confronti semplici. Questa ricerca affronta questa lacuna esaminando più a fondo le somiglianze armoniche insieme a quelle melodiche.
Somiglianza Musicale nel Dominio Audio
La ricerca sulla somiglianza musicale audio copre varie applicazioni, dall'identificazione delle canzoni cover al miglioramento dei sistemi di raccomandazione. Questi studi si basano solitamente su caratteristiche audio di basso livello, come frequenze e tonalità.
Un grande svantaggio di questi metodi è che spesso si basano su algoritmi di deep learning che non spiegano perché alcune canzoni possano suonare simili. Questa mancanza di approfondimento può ostacolare una comprensione più profonda della musica.
Combinare Contenuto Audio e Simbolico
Recenti ricerche hanno iniziato a esplorare la somiglianza musicale multimodale, che combina vari tipi di dati come informazioni audio e testuali. Anche se questo approccio sta guadagnando terreno, poche tecniche uniscono annotazioni audio e simboliche specificamente per compiti di analisi e classificazione.
Al alcuni sistemi mirano a identificare tracce audio utilizzando query simboliche, ma si basano pesantemente sulla conversione dell'audio in dati simbolici o viceversa. Altri sistemi usano informazioni simboliche per analizzare l'audio, anche se la ricerca in questo specifico settore è ancora limitata.
Metodologia di Ricerca
La ricerca mira a creare algoritmi che misurano efficacemente la somiglianza musicale considerando sia il contenuto audio che quello simbolico. L'approccio sarà basato su informazioni fattuali riguardanti la musica, garantendo che il modello per misurare la somiglianza sia chiaro e interpretabile.
Creazione del Dataset
Per iniziare, verrà creato un dataset multimodale, comprendente diversi tipi di dati per ogni canzone. Questo includerà:
- Una traccia audio
- Annotazioni melodiche
- Annotazioni armoniche
- Metadata della traccia
Questo dataset sarà organizzato come un grafo di conoscenza per stabilire relazioni significative tra i vari componenti.
Calcolo della Somiglianza
Successivamente, verranno definiti metodi per misurare la somiglianza basati sui dati simbolici, concentrandosi sugli aspetti melodici e armonici. Questo comporterà la creazione di definizioni chiare di somiglianza musicale sia dal punto di vista accademico che da quello degli ascoltatori.
Verranno esplorati vari tipi di corrispondenze nelle annotazioni simboliche, come corrispondenze esatte o corrispondenze più flessibili e sfumate. Guardando alla somiglianza musicale da un punto di vista puramente musicale, le funzioni risultanti possono essere chiare e trasparenti.
Fasi Finali della Ricerca
Nell'ultima fase, le intuizioni ottenute dai dati simbolici verranno utilizzate per analizzare i segnali audio. Questo comporterà l'addestramento di modelli di deep learning su entrambi i tipi di dati e garantirà che questa analisi rimanga chiara e interpretabile.
Una parte chiave del processo di selezione del modello è garantire che consenta di esplorare le relazioni tra i diversi elementi, come le caratteristiche audio e le annotazioni simboliche. Questo processo si concentrerà anche sulla convalida dell'efficacia e della chiarezza dei metodi di analisi.
Progressi Attuali
Come parte di questa ricerca, il lavoro è già iniziato su più fronti, inclusa la creazione di un dataset robusto per le annotazioni armoniche e un'indagine su come la somiglianza armonica possa essere misurata in modo efficace.
Creazione del Dataset
Un contributo importante è lo sviluppo di un dataset unico conosciuto come ChoCo. Questo dataset raccoglie dati armonici da varie fonti e li presenta in un formato standardizzato. Questo framework consente un'integrazione facile di più tipi di dati e supporta analisi musicali più efficaci.
Studi sulla Somiglianza Armonica
I primi sforzi nella misurazione della somiglianza armonica hanno portato alla creazione di uno strumento chiamato LHARP. Questo strumento innovativo enfatizza schemi condivisi in sequenze simboliche, rendendolo particolarmente utile per l'analisi musicale.
Direzioni Future
La ricerca mira a continuare ad espandere il dataset aggiungendo nuovi tipi di dati e affinando i metodi per valutare la somiglianza musicale. Questo migliorerà la capacità di analizzare diversi elementi musicali, creando una comprensione più completa della somiglianza nella musica.
Inoltre, la ricerca si concentrerà all'allineamento dei nuovi dati con i segnali audio per sviluppare un modello che possa analizzare la somiglianza basata su audio con l'aiuto di dati simbolici. Un obiettivo cruciale è ampliare i modelli ontologici, aprendo la strada a ulteriori esplorazioni nell'analisi multimodale in vari campi.
Questo progetto rappresenta un passo emozionante in avanti nella nostra capacità di comprendere e interpretare la somiglianza musicale, mescolando tecnologia innovativa con una forma d'arte classica.
Titolo: Knowledge-based Multimodal Music Similarity
Estratto: Music similarity is an essential aspect of music retrieval, recommendation systems, and music analysis. Moreover, similarity is of vital interest for music experts, as it allows studying analogies and influences among composers and historical periods. Current approaches to musical similarity rely mainly on symbolic content, which can be expensive to produce and is not always readily available. Conversely, approaches using audio signals typically fail to provide any insight about the reasons behind the observed similarity. This research addresses the limitations of current approaches by focusing on the study of musical similarity using both symbolic and audio content. The aim of this research is to develop a fully explainable and interpretable system that can provide end-users with more control and understanding of music similarity and classification systems.
Autori: Andrea Poltronieri
Ultimo aggiornamento: 2023-06-21 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2306.12249
Fonte PDF: https://arxiv.org/pdf/2306.12249
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://polifonia.disi.unibo.it/choco/sparql
- https://musicbrainz.org/
- https://www.discogs.com/
- https://polifonia-project.github.io/musilar-preview/
- https://github.com/polifonia-project/jams-ontology
- https://github.com/polifonia-project/roman-chord-ontology
- https://github.com/andreamust/music_note_pattern
- https://github.com/polifonia-project/ontology-network