Simple Science

最先端の科学をわかりやすく解説

# 生物学# 動物の行動と認知

動物のコミュニケーションを音で理解する

科学者たちは動物が声を使ってやりとりする方法を研究してる。

― 1 分で読む


クジラの声の解読クジラの声の解読してるよ。新しい方法がクジラの声の複雑さを明らかに
目次

動物たちは音を使ってお互いにコミュニケーションをとってるんだ。これらの音は、異なる種類の動物の間だけじゃなくて、同じ種の中でも大きく異なることがあるんだよ。これらの音を理解することで、動物たちが環境やお互いとどう関わっているかをもっと学べるんだ。この文章では、科学者たちがこれらの声をどうやって研究しているのか、使っている方法、そしてそこから何を学べるのかを掘り下げていくよ。

動物の音の種類

動物の音は、いろんな基準に基づいていくつかのタイプに分けられるよ。たとえば、特定のグループに特有の音もあれば、個体や特定の状況に影響される音もあるんだ。一部の音は一貫性があって繰り返されるから分類しやすいけど、他の音は混ざり合っていて定義するのが難しいこともある。この変動性があるから、研究者たちは動物が出す音を整理して分類するのに苦労することが多いんだ。

音を分類する難しさ

科学者たちの間では、これらの声をどうやって分類するのがベストなのかについてまだまだ議論があるんだ。一部の人は、音の目立つ特徴を捉える簡単な方法を使っているけど、クリアな動物の鳴き声にはうまく機能することが多い。でも、多くの動物の音はもっと複雑で、固定されたカテゴリーにきれいに収まるわけじゃないんだ。特に多くの哺乳類にとってはそうなんだ。この音の徐々な変化が、正確に分類するのを難しくしているんだよ。

動物の音データを集める

動物の鳴き声を研究するために、科学者たちはしばしば音の録音を集めるんだ。これらの録音は異なる方法を使って分析されるよ。ひとつのアプローチは、音が時間とともにどのように変化するかを示すスペクトログラムと呼ばれるグラフを通じて視覚的に見ることかもしれない。訓練を受けた研究者たちが見ることと聞くことに基づいてこれらの音を分類するんだけど、これって時間がかかるプロセスで、人によって変わることもあるよ。

音を分析するためのテクノロジーの利用

研究者たちは、分類プロセスの手助けをするためにテクノロジーに頼っているよ。様々なソフトウェアプログラムが音を分析して、数学モデルに基づいて分類するのを助けてくれる。特定の特徴を捉えて、音の特性を詳細に分解することができるツールもあるんだ。このアプローチは大量のデータを生み出す可能性があるけど、重要な音の違いを特定するのが難しくなることもあるんだ。

メル周波数ケプストラム係数 (MFCC)

動物の音の研究で役立つツールのひとつが、メル周波数ケプストラム係数(MFCC)って呼ばれるものだ。この方法は、異なる周波数におけるエネルギーの分布に基づいて音を分析することを可能にするんだ。MFCCは、和音の音とノイズの特性を識別するのに特に役立つよ。動物が音の高さをどう認識するかも考慮されるから、動物の声の認識に関連しているんだ。

明確な分類方法の必要性

動物の音を研究する上での重要な問題は、人間の判断だけに頼らずにどうやって分類するかってことだ。従来の方法は訓練を受けた研究者が音を聞いて視覚的に検査することに依存していることが多いから、バイアスや不一致が生じる可能性があるんだ。音の特徴に基づいて音をカテゴリー分けするアルゴリズムを使う自動分類法は、速度や再現性を向上させることができるけど、システムを訓練するためには初期の人手による分類が必要なんだよ。

ファジィクラスタリングアルゴリズム

ファジィクラスタリングは、分類に対する新しいアプローチを提供する方法だ。音を厳密なカテゴリーに入れる代わりに、ファジィクラスタリングはもっと柔軟性を持たせるんだ。音は複数のカテゴリーに共通する特徴を持つことがあるから、各音がどのカテゴリーにどれだけ似ているかを示すスコアを付けるんだ。この方法は、音が重なったり混ざり合ったりしているときに特に役立つんだよ。

長 fin パイロットクジラの研究

このアプローチを示すために、研究者たちは長 fin パイロットクジラの鳴き声に関する研究を行ったんだ。このクジラたちは社交的なグループと豊かな音のバリエーションで知られているよ。研究の目的は、MFCCの特徴と組み合わせたファジィクラスタリング法を使って彼らの鳴き声を分析することだったんだ。この方法で、研究者たちはクジラの鳴き声のレパートリーを、彼らの音の微妙な違いを認識した形で記述することを期待していたんだ。

データ収集プロセス

研究者たちはノルウェー北部から長 fin パイロットクジラの音の録音を集めたんだ。これらの録音は興味のある鳴き声を強調するように処理されたよ。訓練を受けたスタッフが、視覚と音の特徴に基づいて既存の分類システムを使ってこれらの音を特定し、分類したんだ。

クジラの音の分析

データが集まったら、MFCCを計算してクジラの音を意味のある特徴に分解したんだ。このプロセスでは、各鳴き声のトーンの側面を分析するためのフィルターのシリーズを作成したよ。呼びかけをより小さいフレームにセグメント化することで、異なる時間セグメントにおける音エネルギーの分布を測定できたんだ。

音のクラスタリング

MFCCデータを抽出した後、研究者たちはファジィクラスタリングアルゴリズムを使ってクジラの音を分類したんだ。この方法で、彼らは鳴き声の構造を視覚化し、どのように類似性に基づいて相互関係があるかを理解できたよ。各音に対して、さまざまなクラスタセンターとの関係を表すスコアが与えられ、その音がそれらのカテゴリー内の音にどれだけ一致しているかを示しているんだ。

声のグラデーションを理解する

この分析を通じて、研究者たちは長 fin パイロットクジラの鳴き声が明確に区別されるものではなく、むしろ音の連続性を示していることを発見したんだ。この発見は、クジラが以前考えられていた以上に微妙な方法でコミュニケーションをとっている可能性があることを示唆しているんだよ。クラスタリングアプローチは、一部の呼びかけがより典型的で硬い一方、他の呼びかけは異なる音のカテゴリーと大きく重なっていることを強調しているんだ。

ファジィクラスタと既存の分類の比較

研究者たちは、ファジィクラスタリングの分析結果を既存の手動分類と比較したんだ。一部の領域では類似点があったけど、ファジィクラスタリング法は鳴き声の変動性に関する追加の洞察を提供し、クジラがどうコミュニケーションをとっているかに対するより繊細な理解を示したんだ。

今後の研究への影響

この研究は、高度な分類方法と従来の分析を組み合わせることで、動物のコミュニケーションに対するより豊かな洞察を得られることを示しているよ。ファジィクラスタリングアプローチは、固定された硬いカテゴライズでは見落とされがちなパターンを明らかにすることができるんだ。こうした発見は、他の動物種におけるコミュニケーションの理解に広い影響を持ち、行動生態学に大きく貢献できるんだ。

結論

動物の鳴き声の分類は、使用する方法を慎重に考慮しなければならない複雑な作業なんだ。ファジィクラスタリングやMFCC処理のような新しい技術は、研究者たちが動物の音をより深く分析し、その微妙さを認識する手助けをしてくれるよ。動物のコミュニケーションを探求し続ける中で、こうした革新的なアプローチを受け入れることで、私たちの周りの豊かな生命のタペストリーを理解する新しい機会が広がるんだ。今後の研究は、これらの技術とその異なる種への適用をさらに洗練させて、動物の行動や相互作用に関する知識を深めていくべきだよ。

オリジナルソース

タイトル: Unsupervised classification of graded animal vocalisations using fuzzy clustering

概要: We present here an unsupervised procedure for the classification of graded animal vocalisations based on Mel frequency cepstral coefficients and fuzzy clustering. Cepstral coefficients compress information about the distribution of energy across the frequency spectrum into a reduced number of variables and are well-defined for signals of various acoustic characteristics (tonal, pulsed, or broadband). In addition, the Mel scale mimics the logarithmic perception of pitch by mammalian ears and is therefore well-suited to defined meaningful perceptual categories for mammals. Fuzzy clustering is a soft classification approach. It does not assign samples to a single category, but rather describes their position relative to overlapping categories. This method is capable of identifying stereotyped vocalisations - vocalisations located in a single category - and graded vocalisations - vocalisation which lie between categories - in a quantitative way. We evaluated the performance of this procedure on a set of long-finned pilot whale (Globicephala melas) calls. We compared our results with a call catalogue previously defined through audio-visual inspection of the calls by human experts. Our unsupervised classification achieved slightly lower precision than the catalogue approach: we described between two and ten fuzzy clusters compared to 11 call types in the catalogue. The fuzzy clustering did not replicate the manual classification. One-to-one correspondence between fuzzy clusters and catalogue call types were rare, however the same sets of call types were consistently grouped together within fuzzy clusters. There were also discrepancies between both classification approaches, with some catalogue call types being consistently spread over several fuzzy clusters. Compared to manual classification, the fuzzy clustering approach proved to be much less time-consuming (days vs. months) and provided additional quantitative information about the graded nature of the vocalisations. We discuss the scope of our unsupervised classifier and the need to investigate the functions of call gradation in future research. Author summaryThere is no consensus on how to describe the vocal repertoire of a species, an essential initial step to analyse how animals rely on different types of vocalisations according to social, ecological, and behavioural contexts. This task is even more challenging for species with graded vocal repertoires: their vocalisations do not fall into distinct categories but form a continuum which makes it difficult to draw strict boundaries between sound types. We present here a method to overcome this challenge using an unsupervised classification algorithm based on Mel frequency cepstral coefficients and fuzzy clustering. It is specifically designed to deal with the graded nature of animal vocalisations, as it can describe overlapping categories in a quantitative way. We tested our classification procedure on a particularly challenging set of long-finned pilot whale (Globicephala melas) calls. Indeed, this species can produce sounds of various acoustic natures (tonal, broadband, and pulsed) and their large vocal repertoire is a mix of stereotyped and highly graded sound types. We compared our results with an existing call catalogue established by human operators. We obtained promising results and recommend similar classification procedures in future studies to take a quantitative approach when studying the gradation of animals vocal repertoires.

著者: Benjamin Benti, P. J. Miller, H. Vester, F. Noriega, C. Cure

最終更新: 2024-09-15 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.13.612808

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.13.612808.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事