Progresso nell'analisi dei fossili con nuove tecnologie
Un nuovo strumento migliora l'efficienza nello studio dei fossili grazie a tecniche di imaging avanzate.
Melanie A.D. During, J. K. Matelsky, F. K. Gustafsson, D. F. A. E. Voeten, D. Chen, B. A. Wester, K. P. Kording, P. E. Ahlberg, T. B. Schön
― 7 leggere min
Indice
La fossilizzazione è un processo raro. Perché i resti biologici diventino Fossili, devono verificarsi condizioni molto specifiche per un lungo periodo. Non basta che i resti siano sepolti; devono anche essere preservati correttamente. Una volta formati i fossili, devono essere scoperti e estratti con attenzione per lo studio.
I metodi tradizionali di preparazione dei fossili spesso comportano il lavoro fisico sui fossili, ma questo può essere rischioso. La preparazione può danneggiare la superficie dell'osso e potrebbe rimuovere i tessuti molli che sono difficili da vedere fino a quando non vengono esposti. Inoltre, questo metodo non garantisce che tutte le caratteristiche importanti del fossile vengano rivelate. Per queste ragioni, i curatori dei musei sono solitamente cauti nel permettere metodi distruttivi o un trattamento esteso dei fossili fragili.
Nuove Tecnologie nella Ricerca sui Fossili
Recenti progressi tecnologici hanno cambiato il modo in cui studiamo i fossili. Uno sviluppo entusiasmante è la Tomografia Computerizzata (CT), e un tipo specifico chiamato Micro-Tomografia a Radiazione di Sincronizzazione a Fase di Propagazione (PPC-SRµCT). Questi metodi permettono ai ricercatori di esaminare i fossili in dettagli incredibili, fino ai livelli sub-micronici. Questo significa che le strutture nascoste dai materiali circostanti possono essere viste, permettendo lo studio delle caratteristiche interne e dei tessuti molli conservati senza danneggiare i fossili.
Tuttavia, lavorare con le immagini 3D prodotte da questi avanzati metodi a raggi X può essere complicato. Richiedono molto spazio di archiviazione digitale e potenza di calcolo. I processi necessari per scomporre e gestire questi grandi file di dati possono essere costosi e spesso richiedono un grande sforzo manuale, lasciando alcuni progetti incompleti. Alcune aziende stanno sviluppando strumenti di Apprendimento Automatico per aiutare in questo, ma quegli strumenti sono tipicamente progettati per l'industria e potrebbero non funzionare bene con i dati fossili.
Per affrontare questo, un team ha creato uno strumento online facile da usare per aiutare nell'analisi dei fossili. Questo programma si chiama ml4paleo. Usa dati disponibili gratuitamente da scanner a sincrotrone ed è offerto come servizio gratuito al pubblico. Questo software combina metodi tradizionali di apprendimento automatico, tecniche specializzate di Segmentazione delle immagini e strumenti per l'elaborazione di grandi set di dati. Permette agli utenti di scomporre e analizzare le immagini fossili in modo rapido ed efficiente.
Come Funziona il Software
Il software ml4paleo opera in una serie di passaggi. Prima di tutto, parte da immagini grezze a raggi X dei fossili. Il software prende queste immagini e usa una combinazione di input umano e assistenza meccanica per annotarle e segmentarle, creando dati di addestramento per ulteriori analisi. Una volta che il modello di segmentazione è addestrato, può elaborare l'intero dataset in una volta, permettendo ai ricercatori di analizzare grandi volumi di dati senza dover caricare tutto in memoria contemporaneamente.
Un vantaggio significativo di questo programma è la capacità di visualizzazione basata sul browser. Gli utenti possono visualizzare le loro scansioni e annotazioni direttamente nel loro browser web, rendendo l'intero processo più accessibile.
Sfide con l'Apprendimento Automatico nell'Analisi dei Fossili
Anche con questi progressi, la segmentazione automatizzata presenta delle sfide. La paleontologia ha problemi unici, come il contrasto variabile nelle immagini e l'elevata assorbimento causata da materiali metallici. Queste sfide non sono molto diverse da quelle affrontate in campi come le neuroscienze e le scienze della terra, motivo per cui lo strumento ml4paleo mira a servire come modello per molte aree di ricerca.
Il team dietro ml4paleo ha utilizzato cinque set di dati pubblici per i test. Ogni set di dati includeva diversi tipi di fossili e condizioni di scansione, presentando sfide uniche per la segmentazione. Ad esempio, un set di dati presentava fossili dal Sud Africa con un chiaro contrasto tra i fossili e i materiali circostanti. Al contrario, un altro set mostrava un cranio che era più difficile da analizzare a causa di un contrasto più basso.
Un set di dati affascinante riguardava un pesce remibile del Nord Dakota, scannerizzato a due risoluzioni. La risoluzione più alta permetteva un'analisi più dettagliata, mentre la risoluzione più bassa rendeva più difficile distinguere le caratteristiche chiave. Un altro set di dati includeva un embrione dentro un uovo, presentando sfide a causa delle strutture fini e del basso contrasto.
La Struttura Tecnica di ml4paleo
L'applicazione web ml4paleo è composta da diversi componenti. Al suo interno c'è un server applicativo costruito utilizzando un framework che gli consente di memorizzare metadati sui set di dati, rendendo facile l'accesso e l'analisi. Questo server può essere configurato per funzionare con requisiti software minimi, rendendolo accessibile a vari gruppi di ricerca.
I ricercatori spesso ricevono grandi pile di immagini da strutture a sincrotrone, che possono essere ingombranti da gestire. Il software aiuta a convertire queste grandi pile in pezzi più piccoli e gestibili. Questo processo di suddivisione consente al software di analizzare sezioni più piccole di dati, rendendo possibile lavorare in modo efficiente anche su computer meno potenti.
Lo strumento è stato progettato per funzionare bene con hardware di livello consumer utilizzando algoritmi che non richiedono risorse di calcolo avanzate. Può segmentare immagini sia in 2D che in 3D, fornendo flessibilità in base alle esigenze dell'utente e alla tecnologia disponibile.
Addestramento del Modello di Segmentazione
Per migliorare il modello di apprendimento automatico, gli utenti possono creare dati di addestramento annotati da esseri umani attraverso una semplice applicazione web. Questo strumento consente agli utenti di contrassegnare manualmente i segmenti delle immagini, creando un set di dati da cui la macchina può apprendere. Il programma utilizza poi queste immagini annotate per addestrare il modello e migliorare la sua precisione di segmentazione.
Una volta che il modello è addestrato, può elaborare grandi volumi di immagini fossili in un sistema a coda, producendo maschere di segmentazione in modo da tenere traccia di quale modello è stato usato per ciascuna segmentazione. Questo sistema consente ai ricercatori di rivedere lavori precedenti e migliorare ulteriormente quando necessario.
Visualizzazione e Apprendimento Online
Una delle caratteristiche entusiasmanti di ml4paleo è la sua capacità di visualizzare scansioni e annotazioni in tre dimensioni. Utilizza una piattaforma basata sul web per fornire una visualizzazione ad alte prestazioni di grandi set di dati scientifici. Questa visualizzazione rende più facile per i ricercatori interagire con i loro dati e condividere scoperte con gli altri.
Il programma incoraggia anche l'apprendimento continuo. Dopo aver creato un modello di segmentazione iniziale, gli utenti possono permettere alla macchina di suggerire segmentazioni preliminari per compiti futuri. Questa guida può ridurre significativamente la quantità di lavoro manuale richiesto, rendendo il processo di annotazione più efficiente. Gli utenti possono affinare i suggerimenti della macchina, migliorando ulteriormente la precisione del modello.
Risultati e Limitazioni
Le prestazioni dello strumento ml4paleo variano tra diversi set di dati. Per alcuni, come il set Burrow, la segmentazione è stata abbastanza accurata e comparabile agli sforzi manuali. Tuttavia, per set di dati più complessi, come le scansioni del pesce remibile con risoluzione più bassa o i dettagli intricati dell'embrione, le prestazioni non sono state così forti.
Sfide specifiche, come il basso contrasto o texture complicate, hanno rappresentato notevoli ostacoli per il modello di segmentazione. In alcuni casi, gli annotatori umani hanno impiegato settimane per produrre segmentazioni soddisfacenti, sottolineando il carico di lavoro coinvolto in questo tipo di ricerca. Sebbene il software offra un'alternativa più veloce, i risultati indicano che c'è ancora margine di miglioramento.
Le versioni future dello strumento potrebbero incorporare tecniche più avanzate, come la segmentazione a classi multiple o modelli di apprendimento più profondi, per gestire meglio le diverse sfide presentate dai dati fossili.
Conclusione
Lo sviluppo dello strumento ml4paleo rappresenta un passo significativo avanti nell'analisi dei dati fossili, rendendo questa tecnologia più accessibile ai ricercatori. Anche se ci sono limitazioni, specialmente con fossili complessi, lo strumento ha dimostrato un notevole successo nel migliorare l'efficienza del lavoro di segmentazione fossile. Man mano che continua a evolversi, promette di potenziare lo studio della paleontologia e ispirare ulteriori progressi in vari campi scientifici.
Titolo: Automated segmentation of synchrotron-scanned fossils
Estratto: Computed tomography has revolutionised the study of the internal three-dimensional structure of fossils. Historically, fossils typically spent years in preparation to be freed from the enclosing rock. Now, X-ray and synchrotron tomography reveal structure that is otherwise invisible and data acquisition can be fast. However, manual segmentation of these 3D volumes can still take months to years. This is especially challenging for resource-poor teams, as scanning may be free, but the computing power and (AI-assisted) segmentation software required to handle the resulting large data sets are complex to use and expensive. Here we present a free, browser-based segmentation tool that reduces computational overhead by splitting volumes into small chunks, allowing processing on low-memory, inexpensive hardware. Our tool also speeds up collaborative ground-truth generation and 3D visualization, all in-browser. We developed and evaluated our pipeline on various open-data scans of differing contrast, resolution, textural complexity, and size. Our tool successfully isolated the Thrinaxodon and Broomistega pair from an Early Triassic burrow. It isolated cranial bones from the Cretaceous acipenseriform Parapsephurus willybemisi on both 45.53 {micro}m and 13.67 {micro}m resolution scanning data. We also isolated bones of the Middle Triassic sauropterygian Nothosaurus and a challenging scan of a squamate embryo inside an egg dating back to the Early Cretaceous. Our tool reliably reproduces expert-supervised segmentation at a fraction of the time and cost, offering greater accessibility than existing tools. Beyond the online tool, all our code is open source, enabling contributions from the palaeontology community to further this emerging machine learning ecosystem.
Autori: Melanie A.D. During, J. K. Matelsky, F. K. Gustafsson, D. F. A. E. Voeten, D. Chen, B. A. Wester, K. P. Kording, P. E. Ahlberg, T. B. Schön
Ultimo aggiornamento: 2024-10-25 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.10.23.619778
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.23.619778.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.