Simple Science

Scienza all'avanguardia spiegata semplicemente

# Biologia quantitativa# Metodi quantitativi

Capire le vocalizzazioni degli uccelli tramite l'analisi del suono

Un nuovo metodo aiuta a stimare i repertori vocali degli uccelli usando l'analisi del suono.

― 6 leggere min


Metodologia per l'analisiMetodologia per l'analisidei suoni degli uccellivocalizzazioni degli uccelli svelate.Nuove tecniche per analizzare le
Indice

Gli uccelli fanno diversi suoni che creano una raccolta di vocalizzazioni conosciuta come il loro repertorio vocale. Sapere quanto è grande questo repertorio può aiutarci a capire le dimensioni del loro cervello, l'area che reclamano come propria e come interagiscono tra di loro. Tuttavia, scoprire quanti suoni unici può emettere un uccello può essere complicato perché richiede di analizzare molte registrazioni sonore, che possono essere difficili da raccogliere e interpretare.

Per iniziare, i ricercatori registrano i canti degli uccelli, li spezzano in parti più piccole chiamate Sillabe e li organizzano in gruppi. Ci sono due modi principali per farlo. Un modo è semplicemente contare ogni suono unico fino a quando non ne appaiono di nuovi. L'altro approccio utilizza algoritmi specifici per rendere il processo più affidabile e coerente. Questo articolo presenta un metodo che misura automaticamente le differenze tra le sillabe dei canti degli uccelli, rendendo più facile raggrupparle senza sapere in anticipo di cosa si tratta.

Introduzione alle Vocalizzazioni degli Uccelli

I suoni degli uccelli possono essere raggruppati in cinque tipi principali: elementi, sillabe, frasi, richiami e canti. Gli elementi sono le unità di suono più piccole, mentre le sillabe possono consistere in uno o più elementi. Le sillabe di solito durano pochi centinaia di millisecondi. Le frasi sono combinazioni brevi di sillabe, e i richiami sono brevi sequenze di frasi. I canti sono le vocalizzazioni lunghe e complesse che spesso associamo al canto degli uccelli.

Prendi, ad esempio, il canto del verdone. Il canto di questo uccello dura più di un minuto ed è composto da vari suoni, tra cui tremoli, unità tonali ripetute e suoni nasali specifici. I ricercatori hanno identificato quattro tipi principali di frasi nel suo canto, inclusi un trill e un suono nasale "tswee", un suono che compare circa il 10% delle volte. Alcuni credono che questo "tswee" sia innato, suggerendo che faccia parte del patrimonio genetico dell'uccello.

La grandezza del repertorio di un uccello può essere stimata anche contando le frasi. Per il verdone, molte frasi vengono ripetute a intervalli costanti per circa mezzo secondo. Questo porta i ricercatori a considerare l'uso di tecniche di apprendimento automatico per creare un sistema che possa stimare il repertorio vocale del verdone.

Raccolta dei Suoni degli Uccelli

Per trovare la grandezza del repertorio vocale di un uccello, i ricercatori iniziano registrando i suoni degli uccelli, di solito nei loro habitat naturali. Queste registrazioni catturano non solo i suoni dell'uccello obiettivo ma anche i rumori di altri animali, persone e fattori ambientali come vento e acqua. Filtrare questi suoni estranei è essenziale per isolare i canti per l'analisi.

La tecnologia Wavelet, che analizza i segnali a varie scale, è utile per filtrare il rumore. In questo studio, verrà utilizzato un tipo specifico di wavelet chiamato Daubechies per creare filtri passa-alto per eliminare il rumore di fondo.

La segmentazione è il passo successivo, che implica suddividere l'audio in parti significative. A differenza di altri metodi come le trasformate di Fourier, l'analisi wavelet non richiede una finestra fissa per evitare di perdere informazioni. Invece, può analizzare il suono senza preoccuparsi di discontinuità. Il processo utilizza la rilevazione dell'energia per trovare segmenti della registrazione che contengono canti di uccelli.

Estrazione delle Caratteristiche dai Suoni

Dopo aver segmentato l'audio, il passo successivo è l'estrazione delle caratteristiche. Questo significa convertire i dati audio in un formato semplificato chiamato vettore di caratteristiche, che aiuta a classificare i suoni. Lo studio si concentra sull'analisi di brevi intervalli di tempo dell'audio per estrarre varie caratteristiche, tra cui energia, durata delle sillabe e proprietà legate alla frequenza.

Alcune caratteristiche estratte dai canti includono:

  • Energia (quanto è forte il suono)
  • Tasso di attraversamento zero (quanto spesso il suono cambia da positivo a negativo)
  • Durata della sillaba (quanto dura ciascuna sillaba)
  • Caratteristiche spettrali come larghezza di banda e centroide.

Inoltre, verranno utilizzati anche i Coefficienti Cepstrali in Mel-Frequenza (MFCC), poiché sono efficaci per analizzare toni musicali.

Scelta delle Migliori Caratteristiche

Selezionare le caratteristiche più rilevanti è cruciale per migliorare l'accuratezza dell'analisi. Due metodi sono considerati per questo, la Soglia di Varianza e il punteggio Laplaciano, che aiutano a decidere quali caratteristiche sono più utili per distinguere i diversi tipi di suoni di uccelli.

La soglia di varianza si concentra sull'eliminazione delle caratteristiche che non variano molto tra i campioni, mentre il punteggio Laplaciano valuta la pertinenza delle caratteristiche in base a quanto bene preservano le strutture locali nei dati.

Raggruppamento dei Suoni

Una volta identificate le caratteristiche rilevanti, possono essere inserite in un algoritmo di Clustering, che raggruppa le sillabe in base alle somiglianze nelle loro caratteristiche. Questo studio utilizza l'algoritmo DBSCAN, che è bravo a identificare campioni centrali e può separare il rumore dai suoni reali.

I dati di input vengono visualizzati utilizzando una tecnica chiamata t-Distributed Stochastic Neighbor Embedding (t-SNE), che aiuta a capire come i punti dati si relazionano tra loro in uno spazio bidimensionale.

L'algoritmo DBSCAN può determinare quanti cluster esistono nei dati e gestire classi sbilanciate. Identifica grandi cluster di suoni simili e contrassegna suoni individuali come rumore quando necessario.

Creazione del Set di Dati

Per sviluppare e convalidare il sistema, viene costruito un set di dati utilizzando registrazioni di una specifica fonte online focalizzata sulla condivisione di suoni di uccelli. Vengono selezionate solo registrazioni di alta qualità per garantire una buona analisi, risultando in una collezione di file audio con il verdone europeo.

I dati includono dettagli come il luogo di registrazione, il punteggio di qualità e il tipo di suono, che aiutano a organizzare e analizzare le registrazioni.

Valutazione delle Prestazioni dei Cluster

Dopo che i suoni sono stati raggruppati, le prestazioni dei cluster saranno valutate utilizzando metriche come il punteggio Silhouette, che fornisce informazioni su quanto bene i suoni siano raggruppati. Un alto punteggio Silhouette suggerisce che i suoni sono ben abbinati all'interno dei loro cluster e male abbinati rispetto ad altri.

Ottimizzare i parametri dell'algoritmo di clustering è importante per garantire risultati accurati. Regolando il numero minimo di campioni richiesti per definire i cluster, i ricercatori possono trovare il numero ottimale di cluster che rappresentano il repertorio vocale.

Risultati e Conclusioni

Dopo aver completato il processo di clustering, i ricercatori hanno scoperto che il repertorio vocale del verdone europeo può essere stimato osservando il numero di classi di sillabe identificate dall'algoritmo di clustering. Queste classi corrispondono ai tipi di frasi precedentemente osservati nel canto dell'uccello.

Lo studio ha anche rivelato che ci sono molti segmenti identificati come rumore, evidenziando una sfida nell'estimare accuratamente la grandezza del repertorio. A causa della presenza di rumore nei dati, i risultati possono talvolta sottostimare o sovrastimare le capacità vocali dell'uccello.

I risultati possono aprire nuove strade per esplorare come le differenze geografiche influenzino i canti degli uccelli, poiché ricerche precedenti suggeriscono variazioni nelle vocalizzazioni tra regioni. La ricerca futura può concentrarsi sul perfezionamento delle tecniche utilizzate per filtrare il rumore e l'estrazione delle caratteristiche per migliorare l'accuratezza.

In generale, il sistema sviluppato in questo studio offre uno strumento prezioso per stimare la grandezza del repertorio vocale di un uccello, fornendo una comprensione più profonda della comunicazione e del comportamento degli uccelli.

Fonte originale

Titolo: Estimating the Repertoire Size in Birds using Unsupervised Clustering techniques

Estratto: Birds produce multiple types of vocalizations that, together, constitute a vocal repertoire. For some species, the repertoire size is of importance because it informs us about their brain capacity, territory size or social behaviour. Estimating the repertoire size is challenging because it requires large amounts of data which can be difficult to obtain and analyse. From birds vocalizations recordings, songs are extracted and segmented as sequences of syllables before being clustered. Segmenting songs in such a way can be done either by simple enumeration, where one counts unique vocalization types until there are no new types detected, or by specific algorithms permitting reproducible studies. In this paper, we present a specific automatic method to compute a syllable distance measure that allows an unsupervised classification of bird song syllables. The results obtained from the segmenting of the bird songs are evaluated using the Silhouette metric score.

Autori: Joachim Poutaraud

Ultimo aggiornamento: 2023-03-19 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2303.10678

Fonte PDF: https://arxiv.org/pdf/2303.10678

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili

Visione artificiale e riconoscimento di modelliMigliorare i Vision Transformers con un Addestramento Contrastivo Consapevole delle Etichette

Un nuovo framework potenzia i Vision Transformers utilizzando le etichette dei compiti per migliorare le performance.

― 5 leggere min