Snellire il riconoscimento dei nomi delle piante con APCalign
Un nuovo strumento semplifica il confronto dei nomi delle piante australiane con gli standard accettati.
― 8 leggere min
Indice
- Strumenti per Abbinare i Nomi delle Specie
- Standard Australiani delle Piante
- Introduzione di APCalign
- Gestione dei Nomi Tassonomici
- Standardizzazione dei Nomi
- Aggiornamento dei Nomi
- Comprendere la Distribuzione
- Prestazioni e Confronto con Altri Strumenti
- Servire Diversi Utenti
- Conclusione
- Fonte originale
- Link di riferimento
I nomi tassonomici sono super importanti per la ricerca online. Aiutano a connettere idee diverse sugli esseri viventi, come quali Specie esistono, dove si trovano, come sono collegate tra loro e quali caratteristiche hanno. Però, a volte queste connessioni si rompono o vengono trascurate. Questo succede spesso perché diversi set di dati usano modi incoerenti per definire e nominare le specie. Di conseguenza, gli scienziati possono non essere sempre d'accordo sui nomi o le classificazioni di alcune specie.
Il nome scientifico dato a una specie in un certo momento riflette quanto sappiamo sul suo background evolutivo. Man mano che i ricercatori imparano di più sulle caratteristiche di una specie, come i suoi tratti fisici o il suo patrimonio genetico, il nome potrebbe cambiare. Possono anche esserci errori, con nomi spesso scritti o digitati male. Nelle revisioni di molte specie, questi errori possono essere difficili da trovare.
Per tenere traccia del legame tra un nome scientifico, il concetto di specie correlato e i dati su di esso, è importante che diversi utenti abbinino e aggiornino automaticamente i nomi scientifici eventualmente errati o obsoleti ai nomi attualmente accettati.
Strumenti per Abbinare i Nomi delle Specie
Sono stati creati molti strumenti software per affrontare le questioni legate ai nomi delle specie non corrispondenti. Questi strumenti si basano su diversi set di dati tassonomici. Nonostante questo, nessuno di essi si concentra specificamente sulle Liste Nazionali Australiane delle Specie per le piante vascolari. Di solito, questi strumenti prendono un elenco di nomi di specie e restituiscono un elenco di nomi accettati che sono le migliori corrispondenze. Trovare la migliore corrispondenza per un nome di specie può essere complesso e richiedere tempo, ma gli strumenti moderni sono diventati abbastanza efficienti nel farlo.
Diversi strumenti vengono forniti con varie funzionalità e formati. Alcuni sono facili da accedere attraverso i browser web, come il Servizio di Risoluzione dei Nomi Tassonomici, mentre altri sono pacchetti software più specializzati, come un pacchetto R chiamato “taxize.” Anche se questi strumenti globali trattano i nomi delle specie australiane, le informazioni tassonomiche che usano potrebbero non corrispondere alle liste nazionali poiché diverse organizzazioni le gestiscono, ognuna con i propri set di linee guida.
Standard Australiani delle Piante
In Australia, lo standard accettato per nominare le piante vascolari è il Censimento delle Piante Australiane (APC). Questo è mantenuto da un'ampia lista di nomi di piante presenti nell'Indice dei Nomi delle Piante Australiane (APNI). L'APC è creato con input da diverse grandi collezioni di piante in Australia ed è regolarmente aggiornato. Questo processo di revisione implica l'analisi di nuove specie vegetali e cambiamenti nella Classificazione delle piante.
L'APC e l'APNI potrebbero non allinearsi sempre con le checklist internazionali, poiché ciascuna checklist potrebbe utilizzare nomi o classificazioni diversi. La lista australiana è particolarmente importante perché include molti nomi unici che non sono presenti nelle liste globali.
I nomi unici nella tassonomia delle piante australiane vengono spesso dati a specie che non sono state descritte formalmente. Questi nomi seguono uno schema specifico: includono il genere, un indicatore di rango, una descrizione, il nome del collezionista e un numero di riferimento relativo a un campione di erbario. Poiché l'APC è l'elenco nazionale ufficiale, è il principale focus per documentare informazioni sulle piante vascolari dell'Australia.
Introduzione di APCalign
Per aiutare gli utenti ad abbinare i nomi delle piante ai concetti di specie accettati nell'APC e nell'APNI, è stato sviluppato un nuovo strumento software chiamato “APCalign.” Questo strumento può operare sia come un pacchetto R per utenti avanzati sia attraverso un'interfaccia web per chi preferisce facilità d'uso. Il suo processo in due fasi abbina i nomi all'APC/APNI.
Nella prima fase, “APCalign” allinea ciascun nome di input al miglior nome corrispondente all'interno dell'APC/APNI. Questo può abbinare nomi a livelli diversi, come specie o famiglia. Nella seconda fase, aggiorna i nomi abbinati per riflettere i nomi attualmente accettati all'interno dell'APC. Lo strumento utilizza una varietà di algoritmi sofisticati, inclusi abbinamenti diretti e fuzzy, per massimizzare le connessioni accurate.
“APCalign” è progettato per gestire le complessità dei nomi tassonomici e può fornire dettagli aggiuntivi come distribuzione e stato nativo per i nomi abbinati. Include diverse funzioni per scaricare risorse, pulire e allineare i nomi e compilare informazioni sulla distribuzione dei taxon.
Gestione dei Nomi Tassonomici
I dati tassonomici che “APCalign” utilizza provengono dalla Lista Nazionale delle Specie dell'Australia, specificamente per le piante vascolari. L'APC contiene un elenco di classificazioni di specie approvate, che include sia nomi accettati sia nomi con stati alternativi, come sinonimi.
Attraverso lo strumento, gli utenti possono caricare queste risorse tassonomiche, permettendo al software di elaborare i nomi in modo accurato. Per allineare correttamente i nomi originali con la migliore corrispondenza nell'APC o nell'APNI, vengono considerati diversi fattori, come il formato dei nomi e se deve essere eseguito un abbinamento fuzzy.
Il software offre funzioni per standardizzare i nomi, allineare i nomi di input con quelli riconosciuti e aggiornare i nomi alle classificazioni accettate. Gli utenti possono facilmente ottenere nomi allineati e aggiornati in un semplice passaggio, senza dover passare attraverso più fasi.
Standardizzazione dei Nomi
Prima di abbinare i nomi alle classificazioni accettate, “APCalign” li standardizza. Questo significa creare diverse versioni del nome originale per trovare la migliore corrispondenza. Ad esempio, rimuoverà parole non necessarie e standardizzerà abbreviazioni o indicazioni per garantire un nome pulito e accurato.
Dopo la standardizzazione, ciascun nome passa attraverso un processo di abbinamento dove può essere connesso al miglior nome corrispondente nell'APC/APNI. Questo processo include l'uso di diversi algoritmi per controllare prima le corrispondenze esatte e poi passare a corrispondenze fuzzy meno esatte, se necessario.
Il software continua a controllare fino a trovare la migliore possibile corrispondenza per ciascun nome. Se non riesce a trovarne una, registrerà comunque che il nome poteva essere collegato solo a una categoria tassonomica più ampia, come un genere.
Aggiornamento dei Nomi
Una volta che un nome è stato abbinato, “APCalign” può aggiornarlo al nome attualmente accettato. Questo è fondamentale perché i nomi scientifici possono cambiare. Il programma ha funzioni che assicurano che i nomi non solo vengano aggiornati correttamente, ma che vengano forniti anche eventuali nomi alternativi o sinonimi.
Per ogni nome allineato, gli utenti ottengono un output che include il nome accettato, eventuali suggerimenti per altri nomi e identificatori che collegano ai dati originali. Questo aggiornamento sistematico aiuta a mantenere una chiara e attuale comprensione delle classificazioni vegetali in Australia.
Comprendere la Distribuzione
L'APC fornisce informazioni essenziali riguardo alla distribuzione delle specie tra gli stati e se sono native o introdotte. Questo è cruciale per comprendere la biodiversità. Il software include funzioni che permettono agli utenti di analizzare dove si trovano le specie e quanto siano diverse in diverse regioni.
Ad esempio, gli utenti possono vedere quali piante provengono da aree specifiche e quanto siano riuscite ad adattarsi a nuovi ambienti. Queste informazioni possono essere particolarmente utili alla luce dei cambiamenti climatici e del movimento delle specie vegetali.
Prestazioni e Confronto con Altri Strumenti
“APCalign” è stato progettato per standardizzare e allineare efficacemente vari elenchi di nomi di piante. I test hanno mostrato alti tassi di corrispondenze riuscite con i nomi nell'APC, dimostrando l'efficacia degli algoritmi usati. La maggior parte dei nomi provenienti da diversi studi ecologici sono stati accuratamente collegati a nomi accettati all'interno dell'APC.
Lo strumento è stato confrontato con altri programmi globali esistenti, come “TNRS” e “taxize.” Anche se questi strumenti offrono anche capacità importanti come abbinamenti e algoritmi fuzzy, “APCalign” si concentra specificamente sul contesto australiano, rendendolo unico.
Sebbene tutti gli strumenti confrontati consentano aggiornamenti dei nomi, “APCalign” si distingue perché può gestire le particolari sfumature dei nomi e delle classificazioni delle piante australiane. La capacità di mostrare chiaramente se un nome si allinea a livello di genere o di specie è un vantaggio aggiuntivo che aiuta gli utenti a comprendere meglio i risultati.
Servire Diversi Utenti
“APCalign” è stato costruito pensando sia ai ricercatori esperti sia agli utenti non tecnici. Per chi non è molto pratico di programmazione, è disponibile un'applicazione web di “APCalign,” che fornisce un'interfaccia semplice. Gli utenti possono facilmente inserire i loro nomi di piante attraverso un'interfaccia semplice o caricare un file. Lo strumento elaborerà quindi i nomi, restituendo nomi allineati e aggiornati che possono essere scaricati per un uso successivo.
Questo focus sull'accessibilità aiuta a garantire che i nomi tassonomici delle piante vengano utilizzati in modo coerente tra diversi utenti nella comunità botanica.
Conclusione
I ricercatori australiani sono fortunati ad avere accesso a risorse affidabili come l'APC, che vengono regolarmente aggiornate per riflettere le conoscenze attuali. “APCalign” è uno strumento innovativo che aiuta a rendere più facile per gli utenti abbinare e aggiornare i nomi delle piante secondo gli standard accettati. Serve come una risorsa vitale per progetti di ricerca, valutazioni della biodiversità e vivai, favorendo una comunicazione chiara a livello nazionale.
Sebbene esistano strumenti globali per l'abbinamento tassonomico, nessuno è specificamente progettato per l'APC, che considera le sfide uniche presenti nella denominazione delle piante australiane. Con “APCalign,” gli utenti possono assicurarsi che la loro ricerca sia allineata con gli standard nazionali, utilizzando uno strumento progettato per lavorare in modo efficace con la ricca diversità botanica dell'Australia. Man mano che la conoscenza tassonomica evolve, strumenti come “APCalign” continueranno a svolgere un ruolo essenziale nel mantenere i ricercatori informati e connessi a nomi e classificazioni vegetali affidabili.
Titolo: APCalign: an R package workflow and app for aligning and updating flora names to the Australian Plant Census
Estratto: Here we present "APCalign", an R package and accompanying browser-sourced application to align and update scientific names for Australian vascular plants to the most likely currently accepted name using the Australian Plant Census (APC) or a name in the Australian Plant Names Index (APNI). Scientific names are the label assigned to unique taxon concepts by the scientific community, but this common terminology is most useful if a taxon concept is consistently referred to by the same name. These links can be broken due to either spelling mistakes or taxonomic changes. Automated tools are required to resolve taxon lists, aligning and updating long lists of possibly erroneous scientific names to the most likely currently accepted names. It is essential that tools specific to the APC/APNI be developed, as these lists specify an endorsed national-level nomenclature used in government legislation and include the uniquely Australian concept of phrase names, absent in global taxonomic datasets. To align input names to names within the APC or APNI, "APCalign" works progressively through a sequence of checks that combine different permutations of the input name, exact versus fuzzy matches, matches that consider the entire name input versus a subset of words, and character strings that indicate a name can only be resolved to a genus or family. The aligned names are then, when possible, updated to a currently accepted taxon concept within the APC. This package should facilitate all research outputs that require diverse scientific name lists to be merged or outdated lists to be updated.
Autori: Elizabeth H Wenk, W. Cornwell, A. Fuchs, F. Kar, A. Monro, H. Sauquet, R. E. Stephens, D. S. Falster
Ultimo aggiornamento: 2024-02-05 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.02.02.578715
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.02.578715.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://biodiversity.org.au/nsl/
- https://traitecoevo.github.io/APCalign/articles/function_notes.html
- https://traitecoevo.github.io/APCalign/articles/APCalign.html
- https://traitecoevo.github.io/APCalign/articles/updating-taxon-names.html
- https://posit-connect-unsw.intersect.org.au/APCalign-app/
- https://www.plantminer.com/
- https://www.environment.nsw.gov.au/topics/animals-and-plants/biodiversity/nsw-bionet