Simple Science

La science de pointe expliquée simplement

# Biologie quantitative# Méthodes quantitatives

Comprendre les vocalisations des oiseaux grâce à l'analyse sonore

Une nouvelle méthode aide à estimer les répertoires vocales des oiseaux en utilisant l'analyse sonore.

― 8 min lire


Méthodologie d'analyseMéthodologie d'analysedes sons d'oiseauxdévoilées.les vocalisations des oiseauxDe nouvelles techniques pour analyser
Table des matières

Les oiseaux produisent des sons différents qui forment un ensemble de vocalisations connu sous le nom de répertoire vocal. Savoir combien de sons ils peuvent faire peut nous aider à comprendre la taille de leur cerveau, le territoire qu'ils revendiquent et comment ils interagissent entre eux. Mais savoir combien de sons uniques un oiseau peut produire, c'est pas simple, parce que ça nécessite d'analyser plein d'enregistrements sonores, ce qui peut être difficile à rassembler et à comprendre.

Pour commencer, les chercheurs enregistrent les chants des oiseaux, les décomposent en parties plus petites appelées Syllabes, et les organisent en groupes. Il y a deux façons principales de faire ça. La première consiste simplement à compter chaque son unique jusqu'à ce qu'il n'y ait plus de nouveaux sons. L'autre méthode utilise des algorithmes spécifiques pour rendre le processus plus fiable et cohérent. Ce document présente une méthode qui mesure automatiquement les différences entre les syllabes des chants d'oiseaux, facilitant leur Regroupement sans connaître à l'avance ce qu'elles sont.

Introduction aux Vocalisations des Oiseaux

Les sons des oiseaux peuvent être regroupés en cinq types principaux : éléments, syllabes, phrases, appels et chants. Les éléments sont les plus petites unités de son, tandis que les syllabes peuvent être composées d'un ou plusieurs éléments. Les syllabes durent généralement quelques centaines de millisecondes. Les phrases sont de courtes combinaisons de syllabes, et les appels sont de courtes séquences de phrases. Les chants sont les vocalisations longues et complexes que l'on associe souvent au chant des oiseaux.

Prenons le chant du Verdon européen en exemple. Le chant de cet oiseau dure plus d'une minute et se compose de divers sons, y compris des trémolos, des unités tonales répétées et des sons nasaux spécifiques. Les chercheurs ont identifié quatre types principaux de phrases dans son chant, y compris un trille et un "tswee" nasal, un son qui apparaît environ 10 % du temps. Certains pensent que ce "tswee" est inné, suggérant qu'il fait partie de l'héritage génétique de l'oiseau.

On peut aussi estimer la taille du répertoire vocal d'un oiseau en comptant les phrases. Pour le verdon, beaucoup de phrases sont répétées à intervalles réguliers d'environ une demi-seconde. Cela amène les chercheurs à envisager d'utiliser des techniques d'apprentissage automatique pour créer un système capable d'estimer le répertoire vocal du verdon.

Rassembler des Sons d'Oiseaux

Pour déterminer la taille du répertoire vocal d'un oiseau, les chercheurs commencent par enregistrer les sons des oiseaux, généralement dans leur habitat naturel. Ces enregistrements capturent non seulement les sons de l'oiseau cible, mais aussi des bruits d'autres animaux, de personnes et des facteurs environnementaux comme le vent et l'eau. Il est essentiel de filtrer ces sons externes pour isoler les chants pour l'analyse.

La technologie des ondelettes, qui analyse les signaux à différentes échelles, est utile pour filtrer le bruit. Dans cette étude, un type spécifique d'ondelette appelé Daubechies sera utilisé pour créer des filtres passe-haut afin d'éliminer le bruit de fond.

La segmentation est la prochaine étape, qui consiste à décomposer l'audio en parties significatives. Contrairement à d'autres méthodes comme les transformations de Fourier, l'analyse par ondelettes ne nécessite pas de fenêtre fixe pour éviter de perdre des informations. Au lieu de cela, elle peut analyser le son sans se soucier des discontinuités. Le processus utilise la détection d'énergie pour trouver des segments de l'enregistrement contenant des chants d'oiseaux.

Extraction des Caractéristiques des Sons

Après avoir segmenté l'audio, l'étape suivante est l'extraction des caractéristiques. Cela signifie convertir les données audio en un format simplifié appelé vecteur de caractéristiques, ce qui aide à classifier les sons. L'étude se concentre sur l'analyse de courtes durées de l'audio pour extraire diverses caractéristiques, y compris l'énergie, la durée des syllabes, et des propriétés liées à la fréquence.

Certaines caractéristiques extraites des chants incluent :

  • Énergie (à quel point le son est fort)
  • Taux de Passage par Zéro (à quelle fréquence le son change de positif à négatif)
  • Durée de la Syllabe (combien de temps chaque syllabe dure)
  • Caractéristiques spectrales telles que la bande passante et le centroïde.

De plus, les Coefficients Cepstraux en Fréquence Mel (MFCC) seront également utilisés car ils sont efficaces pour analyser les tons musicaux.

Choix des Meilleures Caractéristiques

Choisir les caractéristiques les plus pertinentes est crucial pour améliorer l'exactitude de l'analyse. Deux méthodes sont considérées pour cela, le Seuil de Variance et le Score Laplacien, qui aident à décider quelles caractéristiques sont les plus utiles pour distinguer les différents types de sons d'oiseaux.

Le Seuil de Variance se concentre sur l'élimination des caractéristiques qui ne varient pas beaucoup entre les échantillons, tandis que le Score Laplacien évalue la pertinence des caractéristiques en fonction de leur capacité à préserver les structures locales dans les données.

Regroupement des Sons

Une fois les caractéristiques pertinentes identifiées, elles peuvent être introduites dans un algorithme de regroupement, qui regroupe les syllabes en fonction des similitudes de leurs caractéristiques. Cette étude utilise l'algorithme DBSCAN, qui est bon pour identifier les échantillons principaux et peut séparer le bruit des sons réels.

Les données d'entrée sont visualisées à l'aide d'une technique appelée Embedding Stochastique des Proches Voisins Distribués en t (t-SNE), qui aide à comprendre comment les points de données se rapportent les uns aux autres dans un espace à deux dimensions.

L'algorithme DBSCAN peut déterminer combien de clusters existent dans les données et gérer des classes déséquilibrées. Il identifie de grands clusters de sons similaires et marque les sons individuels comme du bruit si nécessaire.

Construction de l'Ensemble de Données

Pour développer et valider le système, un ensemble de données est construit à partir d'enregistrements d'une source en ligne spécifique axée sur le partage de sons d'oiseaux. Seuls des enregistrements de haute qualité sont sélectionnés pour garantir une bonne analyse, ce qui donne une collection de fichiers audio mettant en vedette le Verdon européen.

Les données comprennent des détails tels que le lieu d'enregistrement, la note de qualité, et le type de son, ce qui aide à organiser et analyser les enregistrements.

Évaluation des Performances du Cluster

Après que les sons ont été regroupés, la performance des clusters sera évaluée à l'aide de métriques telles que le score de Silhouette, qui donne un aperçu de la qualité du regroupement des sons. Un score de Silhouette élevé suggère que les sons sont bien assortis à l'intérieur de leurs clusters et mal assortis aux autres.

Affiner les paramètres de l'algorithme de regroupement est important pour garantir des résultats précis. En ajustant le nombre minimum d'échantillons requis pour définir les clusters, les chercheurs peuvent trouver le nombre optimal de clusters représentant le répertoire vocal.

Résultats et Conclusions

Après avoir passé le processus de regroupement, les chercheurs ont trouvé que le répertoire vocal du Verdon européen peut être estimé en observant le nombre de classes de syllabes identifiées par l'algorithme de regroupement. Ces classes correspondent aux types de phrases précédemment observées dans le chant de l'oiseau.

L'étude a également révélé qu'il y avait de nombreux segments identifiés comme du bruit, soulignant un défi pour estimer précisément la taille du répertoire. En raison de la présence de bruit dans les données, les résultats peuvent parfois sous-estimer ou surestimer les capacités vocales de l'oiseau.

Ces découvertes peuvent ouvrir de nouvelles voies pour explorer comment les différences géographiques affectent les chants des oiseaux, car des recherches précédentes suggèrent des variations dans les vocalisations selon les régions. Les futures recherches peuvent se concentrer sur le perfectionnement des techniques utilisées pour filtrer le bruit et extraire des caractéristiques pour améliorer la précision.

Dans l'ensemble, le système développé dans cette étude offre un outil précieux pour estimer la taille du répertoire vocal d'un oiseau, fournissant une compréhension plus profonde de la communication et du comportement des oiseaux.

Source originale

Titre: Estimating the Repertoire Size in Birds using Unsupervised Clustering techniques

Résumé: Birds produce multiple types of vocalizations that, together, constitute a vocal repertoire. For some species, the repertoire size is of importance because it informs us about their brain capacity, territory size or social behaviour. Estimating the repertoire size is challenging because it requires large amounts of data which can be difficult to obtain and analyse. From birds vocalizations recordings, songs are extracted and segmented as sequences of syllables before being clustered. Segmenting songs in such a way can be done either by simple enumeration, where one counts unique vocalization types until there are no new types detected, or by specific algorithms permitting reproducible studies. In this paper, we present a specific automatic method to compute a syllable distance measure that allows an unsupervised classification of bird song syllables. The results obtained from the segmenting of the bird songs are evaluated using the Silhouette metric score.

Auteurs: Joachim Poutaraud

Dernière mise à jour: 2023-03-19 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.10678

Source PDF: https://arxiv.org/pdf/2303.10678

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires