L'Ascesa del DNA Ambientale negli Studi sulla Biodiversità
Il DNA ambientale offre un nuovo modo per valutare la biodiversità senza catturare le specie.
― 6 leggere min
Indice
- Costruire un Database Affidabile per l'eDNA
- Valutare i Classificatori Tassonomici
- Le Sfide dei Database di Riferimento Incompleti
- Il Ruolo della Specificità nei Classificatori
- Insight dai Dati Simulati
- Raccomandazioni Pratiche per gli Studi sull'eDNA
- Conclusione: Il Futuro della Ricerca eDNA
- Fonte originale
- Link di riferimento
Il DNA ambientale (EDNA) è un metodo nuovo usato per controllare la Biodiversità, cioè la varietà di vita in una certa area. Funziona raccogliendo piccoli frammenti di DNA lasciati dagli organismi nell'ambiente, come nell'acqua o nel suolo. Questo metodo innovativo può identificare più Specie rispetto ai metodi tradizionali, che spesso comportano la cattura di animali o il conteggio visivo.
Perché l'eDNA è Importante
I metodi tradizionali per misurare la biodiversità possono richiedere molto tempo e risorse. Spesso necessitano di catturare animali, il che può essere difficile e disturbare gli ecosistemi. L'eDNA consente ai ricercatori di raccogliere informazioni senza dover catturare gli animali. Questo lo rende uno strumento prezioso per studiare gli animali marini, dove i metodi convenzionali possono essere troppo lenti o difficili da ampliare.
La Crescita degli Studi eDNA
Negli ultimi anni, l'uso dell'eDNA è cresciuto rapidamente. I ricercatori stanno rendendosi conto del suo potenziale come strumento potente per misurare la biodiversità. Tuttavia, mentre il campo si sviluppa, c'è bisogno di creare standard per gli studi sull'eDNA. Questi standard aiuterebbero a garantire che i dati raccolti siano accurati e affidabili. Un'area che manca di standardizzazione è la bioinformatica dell'eDNA, che coinvolge l'uso di metodi computazionali per analizzare i dati dell'eDNA.
La Necessità di Parametri di Riferimento nell'eDNA
Senza linee guida e parametri chiari, i ricercatori potrebbero usare metodi diversi per analizzare i dati dell'eDNA, portando a incoerenze. Alcuni studi potrebbero non riportare dettagli importanti sui metodi usati, rendendo difficile confrontare i risultati tra diversi studi. Un'analisi approfondita dei metodi di analisi dell'eDNA è fondamentale per costruire fiducia sia nella comunità scientifica che tra i decisori politici che potrebbero usare questi dati per prendere decisioni.
Costruire un Database Affidabile per l'eDNA
Per rendere gli studi sull'eDNA più efficaci, i ricercatori hanno creato database personalizzati di sequenze di DNA. Questi database sono molto curati, il che significa che includono solo sequenze accurate e verificate. Un database di riferimento ben organizzato aumenta la probabilità di identificare correttamente le specie dai campioni di eDNA.
Database Personalizzati per le Specie Marine Australiane
Uno di questi database si concentra sulle specie marine trovate in Australia. Questi database personalizzati includono sequenze di geni specifici noti per la loro utilità negli studi sull'eDNA. Raccogliendo tutte le sequenze geniche disponibili da queste specie, i ricercatori possono migliorare l'affidabilità delle identificazioni basate sull'eDNA.
Simulare il Sequenziamento dell'eDNA
I ricercatori usano anche la simulazione per creare set di dati che mimano campioni reali di eDNA. Questi set di dati simulati, noti come set di dati di controllo positivo, aiutano a valutare quanto bene diversi metodi possano classificare le specie dall'eDNA. Testando questi Classificatori su gruppi di organismi noti, gli scienziati possono determinare la loro accuratezza.
Valutare i Classificatori Tassonomici
Con vari metodi disponibili per analizzare i dati dell'eDNA, è importante confrontare quanto bene questi metodi identificano le specie. Diversi classificatori hanno punti di forza e debolezze uniche, e capire questi aspetti può aiutare a migliorare gli studi sull'eDNA.
Comprendere le Prestazioni dei Classificatori
In generale, i classificatori possono identificare specie con livelli di successo variabili. In alcuni test, i classificatori hanno identificato correttamente la specie giusta per meno della metà dei campioni. Tuttavia, alcuni metodi hanno performato significativamente meglio, etichettando correttamente una percentuale molto maggiore dei campioni.
L'Importanza dei Controlli Negativi
Per valutare l'accuratezza dei classificatori, gli scienziati usano controlli negativi. Questi controlli consistono in sequenze che non dovrebbero dare alcuna identificazione a livello di specie. Testando i classificatori contro questi controlli, i ricercatori possono misurare i falsi positivi, cioè i casi in cui un classificatore etichetta erroneamente una specie non target.
Le Sfide dei Database di Riferimento Incompleti
Una delle principali sfide negli studi sull'eDNA è che i database di riferimento sono spesso incompleti. Molte specie potrebbero non avere le loro sequenze genetiche registrate in questi database, il che complica la loro identificazione dai campioni di eDNA.
Effetti delle Esclusioni di Clade
Per capire l'impatto della completezza dei database, i ricercatori hanno condotto test rimuovendo intenzionalmente alcune famiglie di specie dai database di riferimento. Questo simula scenari reali in cui non tutte le specie sono rappresentate. I ricercatori possono quindi valutare come i classificatori si comportano in queste condizioni e quanto frequentemente producano falsi positivi.
Il Ruolo della Specificità nei Classificatori
Diversi studi sull'eDNA hanno obiettivi diversi, il che influisce su come vengono usati i classificatori. Ad esempio, uno studio mirato a rilevare specie invasive potrebbe dare priorità ad evitare falsi positivi, mentre uno studio sulla biodiversità potrebbe essere più interessato a identificare quante più specie possibili.
Misurare l'Efficacia dei Classificatori
Diversi parametri vengono utilizzati per misurare l'efficacia dei classificatori, tra cui veri positivi, falsi positivi, precisione e richiamo. Questi parametri aiutano gli scienziati a determinare quanto bene performa un classificatore in vari scenari.
Insight dai Dati Simulati
I dati simulati possono fornire informazioni preziose che i dati reali potrebbero non dare. Utilizzando set di dati simulati, i ricercatori possono valutare con precisione le prestazioni dei classificatori perché conoscono le specie presenti nel campione. Questo può evidenziare problemi potenziali con i classificatori che i dati reali non possono rivelare.
La Necessità di Maggiori Studi Simulati
Nonostante l'utilità dei dati simulati, non ci sono abbastanza ricercatori che utilizzano questo approccio. Più studi che utilizzano simulazioni aiuterebbero a stabilire parametri per gli studi sull'eDNA e fornirebbero informazioni più chiare sia sui punti di forza che sulle debolezze di vari classificatori.
Raccomandazioni Pratiche per gli Studi sull'eDNA
Affinché i metodi dell'eDNA siano affidabili e ampiamente utilizzati, è necessario focalizzarsi sul garantire che i profili delle specie generati siano affidabili.
Pratiche Raccomandate
Utilizzare Database di Riferimento Curati: I database personalizzati dovrebbero essere prioritari per migliorare l'accuratezza.
Implementare Controlli Negativi: Tutti i classificatori dovrebbero essere testati contro set di dati di controllo negativo per misurare i falsi positivi.
Valutare le Prestazioni dei Classificatori: I ricercatori dovrebbero confrontare diversi classificatori utilizzando set di dati di controllo sia positivi che negativi.
Aumentare l'uso dei Dati Simulati: Maggiore ricerca dovrebbe coinvolgere set di dati simulati per offrire informazioni più chiare sulle prestazioni dei classificatori.
Direzioni Future
L'evoluzione continua degli studi sull'eDNA indica la necessità di miglioramenti continui nell'accuratezza dei dati e nei metodi di classificazione. La ricerca futura dovrebbe mirare a sviluppare database di riferimento più compiuti, migliorare gli algoritmi di classificazione e esplorare l'uso di sequenze genetiche più lunghe.
Conclusione: Il Futuro della Ricerca eDNA
Man mano che la tecnologia dell'eDNA continua a crescere, ha il potenziale di trasformare il nostro approccio allo studio della biodiversità. Con gli standard e le pratiche giuste in atto, l'eDNA potrebbe diventare uno strumento centrale per il monitoraggio ambientale e gli sforzi di conservazione. Investendo in database migliori, affinando i metodi analitici e utilizzando dati simulati, i ricercatori possono aumentare l'affidabilità e l'efficacia delle metodologie dell'eDNA, portando a informazioni più solide sui nostri ecosistemi e sugli organismi che li abitano.
Il percorso verso studi affidabili sull'eDNA è in corso, e concentrandosi su queste pratiche raccomandate, la comunità scientifica può migliorare la fiducia nell'eDNA come strumento potente per la valutazione della biodiversità.
Titolo: A comprehensive evaluation of taxonomic classifiers in marine vertebrate eDNA studies
Estratto: Environmental DNA (eDNA) metabarcoding is a widely used tool for surveying marine vertebrate biodiversity. To this end, many computational tools have been released and a plethora of bioinformatic approaches are used for eDNA-based community composition analysis. Simulation studies and careful evaluation of taxonomic classifiers are essential to establish reliable benchmarks to improve accuracy and reproducibility of eDNA-based findings. Here we present a comprehensive evaluation of nine taxonomic classifiers exploring three widely used mitochondrial markers (12S rDNA, 16S rDNA, and COI) in Australian marine vertebrates. Curated reference databases and exclusion database tests were used to simulate diverse species compositions, including three positive control and two negative control datasets. Using these simulated datasets, we were able to identify between 19% to 85% of marine vertebrate species using mitochondrial markers. We show that MMSeqs2 and Metabuli generally outperform BLAST with 10% and 11% higher F1 scores for 12S and 16S rDNA markers, respectively, and that Naive Bayes Classifiers such as Mothur outperform sequence-based classifiers except MMSeqs2 for COI markers by 11%. Database exclusion tests reveal that MMSeqs2 and BLAST are less susceptible to false positives compared to Kraken2 with default parameters. Based on these findings, we recommend that MMSeqs2 is used for taxonomic classification of marine vertebrates given its ability to improve species-level assignments while reducing the number of false positives. Our work contributes to the establishment of best practices in eDNA-based biodiversity analysis to ultimately increase the reliability of this monitoring tool in the context of marine vertebrate conservation.
Autori: Philipp E. Bayer, A. Bennett, G. Nester, S. Corrigan, E. J. Raes, A. S. McInnes, M. Cooper, M. E. Ayad, P. McVey, A. Kardailsky, J. Pearce, M. W. Fraser, P. Goncalves, S. Burnell, S. Rauschert
Ultimo aggiornamento: 2024-02-17 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.02.15.580601
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.15.580601.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.