爬虫類のための包括的な画像データベースを作ること
爬虫類標本の画像を体系化して、研究しやすくするプロジェクト。
― 1 分で読む
目次
画像は生物医学において重要な役割を果たしていて、研究者や分類学者がさまざまな種を研究するのに役立ってる。残念ながら、よく構成された画像のコレクションを提供するデータベースはあまりないんだ。存在するデータベースも、データを見つけやすく、アクセス可能で、相互運用性があり、再利用できるようにするFAIRガイドラインを満たしていないことが多い。
生物多様性と分類に役立つデータベースには、MorphobankとMorphosourceがある。Morphobankは系統的なコンテクストで特性や画像に焦点を当てていて、MorphosourceはCTスキャンのような3D画像を専門にしてる。これらのプラットフォームは生物画像の整理されたコレクションを助けてくれる。
動物の写真を見つける課題
インターネット上には無数の動物の写真があるけど、多くはランダムに集められている。特に爬虫類のコレクションを体系化しようとする取り組みもある。iNaturalistは自然の観察を記録する人気のプラットフォームで、何百万枚もの画像を誇っているが、特に分類に特化しているわけではない。最近、iNaturalistは博物館の標本の写真も追加し始めたけど、まだ専用の分類資源ではない。
分類学者は、種の比較や同定を簡単にするための標準化された画像を提供する専門のデータベースが必要なんだ。多くの自然史博物館のウェブサイトには画像があるけど、これらはしばしばコレクションの一部しかカバーしていない。さまざまなウェブサイトに散らばった画像は、研究者がそれらを見つけて利用するのを難しくしている。
爬虫類画像の新しいプロジェクト
このプロジェクトは、保存された標本から撮影された爬虫類画像の体系的なコレクションを作ることを目指している。世界中の20のコレクションと協力して、1,000種以上の爬虫類を撮影し、14,000枚以上の画像を得た。それぞれの画像には、地域や追加の詳細といった重要な情報がタグ付けされている。これにより、特定の特徴で画像を整理し、VertNetやReptile Databaseのような他のデータベースと参照するのが簡単になる。コレクションはMorphobankを通じてアクセスでき、ユーザーは各画像をその特定の標本にたどり着ける。
例として、Lacertinae亜科の8種の写真を紹介する。この亜科には多くのトカゲの属が含まれていて、提示される画像には標本のさまざまなビューが含まれ、背面と腹面、さらに詳細な顔のショットが示されている。サイズ測定のために定規も画像に含まれている。
使用された方法と材料
合計62.6GBの画像を収集し、1,045種の爬虫類の15,675枚の写真を含んでいる。その中の14,239枚は実際の標本を描写していて、残りの1,436枚は追加情報が記載されたラベルを示している。目標は、全体の体の背面と腹面、頭部や胴体のクローズアップを示す同じ視点で画像の一貫性を保つことだった。
画像の重複を整理するために、85%以上似ている写真を削除するツールを使った。メタデータはカスタムソフトウェアを使用して画像に追加され、各ビューと見える体の部分にタグ付けされた。これらのタグはユーザーが「頭」や「腹面」などの特定の特徴を簡単に検索するのを助ける。画像とそのメタデータは、プロジェクト番号の下でMorphobankとFigshareで利用可能。
現在、私たちのコレクションには1,045種の爬虫類の14,239枚以上の標準化された写真が含まれている。これらの画像は比較研究や種の同定の参考として使える。現在、私たちのデータベースには1,342標本のうち81が原記載タイプだが、追加のタイプ標本も入手可能になり次第追加される予定だ。
プロジェクトの分類学的目標
私たちの初期の目標は、すべてのトカゲ属の画像を取得することで、理想的には各属から少なくとも1種を撮影することだった。この目標はまだ達成していないが、490属のトカゲを撮影し、全体の81%を占めている。すべての属の代表を追跡するのは難しく、新しいトカゲ属が次々と記載され続けている。2000年以降、122の新しいトカゲ属が識別されていて、多くは私たちの現在のプロジェクトには含まれていない。
53の科からの写真を成功裏に収集し、そのうちの29科にはすべての属が代表されている。AnguidaeやPhyllodactylidaeのような大きな科は、十以上の属を持っている。ほぼ半数の爬虫類科では、80%以上の属の画像を集めている。
標準化とアクセスの向上
アクセシビリティを向上させるために、約20%の画像を重複として削除し、残りの写真には詳細なメタデータをタグ付けした。これにより、ユーザーはMorphobankやFigshareで特定の特徴を簡単に検索できるようになる。
目指すのは、標本の写真の標準化された参照データベースを作ること。私たちはコレクションがFAIRガイドラインを満たすように努力していて、見つけやすく、アクセス可能で、相互運用性があり、再利用できることを確保している。画像はクリエイティブ・コモンズの下でライセンスされ、Reptile Databaseのような他のデータベースとリンクされていて、元の記述や文献へのアクセスが容易になっている。
捕らえた形態的特徴
私たちの写真は、サイズ、形、パターンなどの特徴を持つ多くの個々の鱗を捉えている。私たちは、このプロジェクトを通じて少なくとも100万のユニークな特徴を記録したと推定している。このデータベースは、他の種を記述する情報源と組み合わせることで特に価値が高くなる。
歴史的な記述には、鱗の特徴に関する詳細な情報が含まれていて、私たちの画像データベースと一緒にアクセスできるようになる。例えば、一部のトカゲ属には、専門家でない人でも簡単に認識できる独特の特徴がある。
課題への対処と今後の方向性
このプロジェクトは、包括的な参照画像データベースを構築するための第一歩に過ぎない。すべての爬虫類種の画像を収集できたとしても、各種の完全な多様性を反映することはできない。地理的および個体差を正確に表現するには、より多くの画像が必要になる。
さらに、多くの標本には正確な地理情報や性別や年齢といった生物学的データといった重要なメタデータが欠けている。これらのギャップは研究を妨げる可能性がある。もう一つの懸念は、分類学的な不確実さの問題で、一部の標本は誤同定される可能性があり、分類学者が新しい情報を発見するたびに名前が頻繁に変わる。
データのリンクとリソースの強化
このプロジェクトの重要な側面は、収集されたデータを画像とコレクションデータベースにリンクさせることだ。これにより、iNaturalistのようなプラットフォームからの観察データやIUCNからの保全データにリンクする可能性が広がる。ゲノムデータがより重要になるにつれて、フェノタイプとDNA配列をリンクさせることも重要になってくるだろう。
参照画像の利用法
参照ライブラリはさまざまな目的で使用できる。まず、種の比較や同定のための分類学的研究に役立つ。これは詳細な種情報にアクセスできないアマチュアの自然愛好家にも助けになるかもしれない。次に、画像は研究者が特性をより簡単に調査できるようにし、特に標準化された用語と組み合わせることで効果的だ。
例えば、研究者は特定の特徴、たとえば頭の背面を示すすべての画像を見つけることができる。これにより、種の地理的変異に関する研究も可能になる。さらに、自動画像分析をこのデータセットに適用することもできる。特に爬虫類は、他の動物と比べて明確な鱗を持っているので定量化しやすい。
今後の改善点と目標
私たちの主な目標は、すべての爬虫類種、最終的には動物界と植物界のすべての種をカバーするために画像コレクションを拡張することだ。これが野心的に思えるかもしれないが、種のバリエーションを含めることで無限の可能性が広がる。3Dスキャンを追加することも選択肢だが、得られる利益がかかる時間やリソースに見合わないかもしれない。
データベースと他のリソースとの接続を維持することは課題のままだ。しかし、標準化された識別子の採用が、このプロセスを将来的にスムーズにする助けになるだろう。
結論
このプロジェクトは、爬虫類のための構造化され、アクセス可能で、標準化された写真コレクションを作成するための重要な努力を表している。私たちは科学コミュニティがこのリソースを利用して、分類学の分野でのさらなる研究と探求を促進することを奨励します。
タイトル: A reference database of reptile images
概要: While there are millions of reptile images available online, they are not well organized and not easily findable, accessible, interoperable, or reproducible (FAIR). More importantly, they are not standardized and thus hardly comparable. Here we present a reference database of more than 14,000 standardized images of 1,045 reptile species (969 lizard and 76 snake species), that are based on preserved specimens in 20 different collections, including 533 type species of genera and type specimens of 72 species. All images were taken with standardized views, including dorsal and ventral body shots as well as dorsal, ventral, and lateral views of the heads and other body parts. Although only 11 out of the 20 collections are cross-referenced in Vertnet, some others are indexed in GBIF, and this fraction will certainly grow in the near future. The utility of this and similar image collections will further grow with additional material and further cross-referencing, e.g., to DNA sequence databases or citizen science projects. The images are searchable and freely available on Morphobank.org (Project 5121) and on Figshare.com.
著者: Peter H Uetz, M. Patel, Z. Gbadamosi, S. Shoope, J. Nguyen
最終更新: 2024-03-10 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.03.08.584020
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.03.08.584020.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。