Simple Science

La science de pointe expliquée simplement

# Biologie# Paléontologie

Avancées dans l'analyse des fossiles grâce à de nouvelles technologies

Un nouvel outil améliore l'efficacité des études de fossiles grâce à des techniques d'imagerie avancées.

― 8 min lire


Percée technologique dansPercée technologique dansl'analyse des fossilesde fossiles.l'efficacité et la précision des étudesUn nouveau logiciel transforme
Table des matières

La fossilisation, c'est un processus rare. Pour que les restes biologiques deviennent des Fossiles, il faut que des conditions très spécifiques soient réunies pendant longtemps. Ce n'est pas suffisant que les restes soient enterrés ; ils doivent aussi être correctement préservés. Une fois les fossiles formés, il faut les découvrir et les extraire prudemment pour les étudier.

Les méthodes traditionnelles de préparation des fossiles consistent souvent à travailler physiquement sur eux, mais ça peut être risqué. La préparation peut endommager la surface de l'os et peut enlever des tissus mous qui sont difficiles à voir jusqu'à ce qu'ils soient exposés. De plus, cette méthode ne garantit pas que toutes les caractéristiques importantes du fossile seront révélées. Pour ces raisons, les conservateurs de musées sont généralement prudents vis-à-vis des méthodes destructrices ou d'une manipulation extensive des fossiles fragiles.

Nouvelle technologie dans la recherche sur les fossiles

Les récentes avancées technologiques ont changé notre façon d'étudier les fossiles. Un développement excitant est la Tomographie par ordinateur (CT), et un type spécifique appelé Tomographie par rayons synchrotron à contraste de phase de propagation (PPC-SRµCT). Ces méthodes permettent aux chercheurs d'examiner les fossiles avec un détail incroyable, jusqu'à des niveaux sub-microniques. Cela signifie que des structures cachées par des matériaux environnants peuvent être vues, permettant l'étude de caractéristiques internes et de tissus mous préservés sans endommager les fossiles.

Cependant, travailler avec les images 3D produites par ces méthodes avancées de rayons X peut être compliqué. Elles nécessitent beaucoup d'espace de stockage numérique et de puissance de calcul. Les processus nécessaires pour décomposer et gérer ces grands fichiers de données peuvent être coûteux et nécessitent souvent beaucoup de travail manuel, laissant certains projets incomplets. Certaines entreprises développent des outils d'Apprentissage automatique pour aider avec ça, mais ces outils sont généralement conçus pour l'industrie et peuvent ne pas bien fonctionner avec les données fossiles.

Pour remédier à cela, une équipe a créé un outil en ligne facile à utiliser pour aider à l'analyse des fossiles. Ce programme s'appelle ml4paleo. Il utilise des données librement disponibles provenant de scanners synchrotrons et est offert en tant que service gratuit au public. Ce logiciel combine des méthodes traditionnelles d'apprentissage automatique, des techniques de segmentation d'image spécialisées et des outils pour traiter de grands ensembles de données. Il permet aux utilisateurs de décomposer et d'analyser rapidement et efficacement les images de fossiles.

Comment fonctionne le logiciel

Le logiciel ml4paleo fonctionne en plusieurs étapes. D'abord, il commence avec des images brutes de rayons X de fossiles. Le logiciel prend ces images et utilise un mélange d'interventions humaines et d'assistance machine pour les annoter et les segmenter, créant des données d'entraînement pour une analyse plus poussée. Une fois le modèle de segmentation entraîné, il peut traiter l'ensemble des données à la fois, permettant aux chercheurs d'analyser de grands volumes de données sans avoir à tout charger en mémoire en même temps.

Un avantage significatif de ce programme est sa capacité de visualisation basée sur le navigateur. Les utilisateurs peuvent visualiser leurs scans et annotations directement dans leur navigateur web, rendant l'ensemble du processus plus accessible.

Défis de l'apprentissage automatique dans l'analyse des fossiles

Même avec ces avancées, la segmentation automatisée pose des défis. La paléontologie a des problèmes uniques, comme le contraste variable dans les images et une forte absorption causée par des matériaux métalliques. Ces défis ne sont pas très différents de ceux rencontrés dans des domaines comme la neuroscience et les sciences de la terre, raison pour laquelle l'outil ml4paleo vise à être un modèle pour de nombreux domaines de recherche.

L'équipe derrière ml4paleo a utilisé cinq ensembles de données publics pour les tests. Chaque ensemble de données comprenait différents types de fossiles et des conditions de scan, présentant des défis uniques pour la segmentation. Par exemple, un ensemble de données contenait des fossiles d'Afrique du Sud avec un contraste clair entre les fossiles et les matériaux environnants. En revanche, un autre ensemble montrait un crâne qui était plus difficile à analyser à cause d'un contraste plus faible.

Un ensemble de données fascinant impliquait un poisson-pagaie du Dakota du Nord, scanné à deux résolutions. La résolution plus élevée permettait une analyse plus détaillée, tandis que la résolution plus basse rendait plus difficile la distinction des caractéristiques clés. Un autre ensemble incluait un embryon dans un œuf, présentant des défis à cause de structures fines et d'un faible contraste.

La structure technique de ml4paleo

L'application web ml4paleo se compose de plusieurs composants. Au cœur se trouve un serveur d'application construit en utilisant un cadre qui lui permet de stocker des métadonnées sur les ensembles de données, facilitant ainsi l'accès et l'analyse. Ce serveur peut être configuré pour fonctionner avec des exigences logicielles minimales, le rendant accessible à divers groupes de recherche.

Les chercheurs reçoivent souvent de grandes piles d'images des installations de synchrotrons, ce qui peut être encombrant à gérer. Le logiciel aide à convertir ces grandes piles en morceaux plus petits et plus gérables. Ce processus de découpage permet au logiciel d'analyser des sections plus petites de données, rendant possible un travail efficace même sur des ordinateurs moins puissants.

L'outil a été conçu pour bien fonctionner avec du matériel grand public en utilisant des algorithmes qui ne nécessitent pas de ressources informatiques avancées. Il peut segmenter les images en 2D et en 3D, offrant une flexibilité en fonction des besoins de l'utilisateur et de la technologie disponible.

Entraînement du modèle de segmentation

Pour améliorer le modèle d'apprentissage automatique, les utilisateurs peuvent créer des données d'entraînement annotées par des humains à travers une simple application web. Cet outil permet aux utilisateurs de marquer manuellement des segments d'images, créant un ensemble de données dont la machine peut apprendre. Le programme utilise ensuite ces images annotées pour entraîner le modèle afin d'améliorer sa précision de segmentation.

Une fois le modèle entraîné, il peut traiter de grands volumes d'images de fossiles dans un système de file d'attente, produisant des masques de segmentation tout en gardant une trace du modèle utilisé pour chaque segmentation. Ce système permet aux chercheurs de revenir sur des travaux antérieurs et de les améliorer si nécessaire.

Visualisation et apprentissage en ligne

Une des fonctionnalités intéressantes de ml4paleo est sa capacité à visualiser les scans et annotations en trois dimensions. Il utilise une plateforme web pour fournir une vue haute performance de grands ensembles de données scientifiques. Cette visualisation facilite l'interaction des chercheurs avec leurs données et le partage de leurs découvertes avec d'autres.

Le programme encourage également un apprentissage continu. Après avoir créé un modèle de segmentation initial, les utilisateurs peuvent permettre à la machine de proposer des Segmentations préliminaires pour des tâches futures. Cette aide peut considérablement réduire la quantité de travail manuel nécessaire, rendant le processus d'annotation plus efficace. Les utilisateurs peuvent affiner les suggestions de la machine, améliorant ainsi encore la précision du modèle.

Résultats et limitations

Les performances de l'outil ml4paleo varient selon les ensembles de données. Pour certains, comme l'ensemble de données Burrow, la segmentation était assez précise et comparable aux efforts manuels. Cependant, pour des ensembles de données plus complexes, tels que les scans de poisson-pagaie avec une résolution plus faible ou les détails complexes de l'embryon, les performances n'étaient pas aussi fortes.

Des défis spécifiques, comme un faible contraste ou des textures compliquées, posaient des obstacles significatifs pour le modèle de segmentation. Dans certains cas, les annotateurs humains prenaient des semaines pour produire des segmentations satisfaisantes, soulignant la charge de travail impliquée dans ce type de recherche. Bien que le logiciel ait fourni une alternative plus rapide, les résultats indiquaient qu'il reste encore de la place pour des améliorations.

Les futures versions de l'outil pourraient intégrer des techniques plus avancées, comme la segmentation de plusieurs classes ou des modèles d'apprentissage plus profonds, pour mieux gérer les divers défis présentés par les données fossiles.

Conclusion

Le développement de l'outil ml4paleo représente une avancée significative dans l'analyse des données fossiles, rendant cette technologie plus accessible aux chercheurs. Bien qu'il y ait des limitations, surtout avec des fossiles complexes, l'outil a montré un succès notable dans l'amélioration de l'efficacité du travail de segmentation des fossiles. À mesure qu'il continue d'évoluer, il promet d'enrichir l'étude de la paléontologie et d'inspirer d'autres avancées dans divers domaines scientifiques.

Source originale

Titre: Automated segmentation of synchrotron-scanned fossils

Résumé: Computed tomography has revolutionised the study of the internal three-dimensional structure of fossils. Historically, fossils typically spent years in preparation to be freed from the enclosing rock. Now, X-ray and synchrotron tomography reveal structure that is otherwise invisible and data acquisition can be fast. However, manual segmentation of these 3D volumes can still take months to years. This is especially challenging for resource-poor teams, as scanning may be free, but the computing power and (AI-assisted) segmentation software required to handle the resulting large data sets are complex to use and expensive. Here we present a free, browser-based segmentation tool that reduces computational overhead by splitting volumes into small chunks, allowing processing on low-memory, inexpensive hardware. Our tool also speeds up collaborative ground-truth generation and 3D visualization, all in-browser. We developed and evaluated our pipeline on various open-data scans of differing contrast, resolution, textural complexity, and size. Our tool successfully isolated the Thrinaxodon and Broomistega pair from an Early Triassic burrow. It isolated cranial bones from the Cretaceous acipenseriform Parapsephurus willybemisi on both 45.53 {micro}m and 13.67 {micro}m resolution scanning data. We also isolated bones of the Middle Triassic sauropterygian Nothosaurus and a challenging scan of a squamate embryo inside an egg dating back to the Early Cretaceous. Our tool reliably reproduces expert-supervised segmentation at a fraction of the time and cost, offering greater accessibility than existing tools. Beyond the online tool, all our code is open source, enabling contributions from the palaeontology community to further this emerging machine learning ecosystem.

Auteurs: Melanie A.D. During, J. K. Matelsky, F. K. Gustafsson, D. F. A. E. Voeten, D. Chen, B. A. Wester, K. P. Kording, P. E. Ahlberg, T. B. Schön

Dernière mise à jour: 2024-10-25 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.10.23.619778

Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.23.619778.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires