Optimisation de la correspondance des noms de plantes avec APCalign
Un nouvel outil simplifie l'appariement des noms de plantes australiennes aux normes acceptées.
― 10 min lire
Table des matières
- Outils pour faire correspondre les noms d'espèces
- Normes australiennes sur les plantes
- Présentation d'APCalign
- Gestion des noms taxonomiques
- Standardisation des noms
- Mise à jour des noms
- Compréhension de la distribution
- Performance et comparaison avec d'autres outils
- Servir différents utilisateurs
- Conclusion
- Source originale
- Liens de référence
Les noms taxonomiques jouent un rôle super important dans la recherche en ligne. Ils aident à relier différentes idées sur les êtres vivants, comme les Espèces qui existent, où elles se trouvent, comment elles sont liées entre elles, et quelles caractéristiques elles ont. Mais parfois, ces connexions peuvent se casser ou passer inaperçues. Ça arrive souvent parce que différents ensembles de données utilisent des manières incohérentes pour définir et nommer les espèces. Du coup, les scientifiques ne sont pas toujours d'accord sur les noms ou les Classifications de certaines espèces.
Le nom scientifique d'une espèce à un moment donné reflète ce qu'on sait de son histoire évolutive. Au fur et à mesure que les chercheurs découvrent plus de choses sur les caractéristiques d'une espèce, comme ses traits physiques ou sa composition génétique, le nom peut changer. Des erreurs peuvent aussi survenir, avec des noms souvent mal orthographiés ou tapés de travers. Dans les revues de plusieurs espèces, ces erreurs peuvent être difficiles à repérer.
Pour garder une trace du lien entre un nom scientifique, son concept d'espèce associé et les données le concernant, il est important pour divers utilisateurs de faire correspondre automatiquement et de mettre à jour les noms scientifiques potentiellement incorrects ou anciens aux noms actuellement acceptés.
Outils pour faire correspondre les noms d'espèces
Pas mal de logiciels ont été créés pour aider à régler les problèmes de noms d'espèces mal assortis. Ces outils s'appuient sur différents ensembles de données taxonomiques. Pourtant, aucun d’eux ne se concentre spécifiquement sur les listes nationales australiennes des espèces de plantes vasculaires. En général, ces outils prennent une liste de noms d'espèces et renvoient une liste de noms acceptés qui sont les meilleures correspondances. Trouver la meilleure correspondance pour un nom d'espèce peut être complexe et prendre du temps, mais les outils modernes sont devenus assez efficaces pour ça.
Différents outils offrent diverses fonctionnalités et formats. Certains sont faciles d'accès via des navigateurs web, comme le Service de Résolution de Noms Taxonomiques, tandis que d'autres sont des logiciels plus spécialisés, comme un paquet R nommé “taxize.” Bien que ces outils mondiaux s'attaquent aux noms d'espèces australiennes, les informations taxonomiques qu'ils utilisent peuvent ne pas correspondre aux listes nationales puisque différentes organisations les gèrent, chacune avec ses propres directives.
Normes australiennes sur les plantes
En Australie, la norme acceptée pour nommer les plantes vasculaires est le Recensement des Plantes Australien (APC). Cela repose sur une énorme liste de noms de plantes trouvés dans l'Index des Noms de Plantes Australiens (APNI). L'APC est créé avec la contribution de plusieurs grandes collections de plantes en Australie et est régulièrement mis à jour. Ce processus de révision implique d'analyser de nouvelles espèces de plantes et des changements dans la classification des plantes.
L'APC et l'APNI ne s'alignent pas toujours avec les listes de contrôle internationales, car chaque liste peut utiliser des noms ou des classifications différentes. La liste de l'Australie est particulièrement importante parce qu'elle contient plein de noms uniques qui ne figurent pas dans les listes mondiales.
Les noms uniques dans la taxonomie des plantes australiennes sont souvent donnés à des espèces qui n'ont pas été formellement décrites. Ces noms suivent un modèle spécifique : ils incluent le genre, un indicateur de rang, une description, le nom du collecteur et un numéro de référence lié à un échantillon d'herbier. Comme l'APC est la liste nationale officielle, c'est le principal axe pour documenter des infos sur les plantes vasculaires d'Australie.
Présentation d'APCalign
Pour aider les utilisateurs à associer les noms de plantes avec les concepts d'espèces acceptés dans l'APC et l'APNI, un nouvel outil logiciel appelé “APCalign” a été développé. Cet outil peut fonctionner à la fois comme un paquet R pour les utilisateurs avancés et via une interface web pour ceux qui préfèrent la facilité d'utilisation. Son processus en deux étapes fait correspondre les noms avec l'APC/APNI.
Dans la première étape, “APCalign” aligne chaque nom d'entrée au meilleur nom correspondant dans l'APC/APNI. Cela peut faire correspondre des noms à différents niveaux, comme l'espèce ou la famille. Dans la seconde étape, il met à jour les noms correspondus pour refléter les noms actuellement acceptés dans l'APC. L'outil utilise une variété d'algorithmes sophistiqués, y compris des correspondances directes et floues, pour maximiser les connexions précises.
“APCalign” est conçu pour gérer la complexité des noms taxonomiques et peut fournir des détails supplémentaires comme la distribution et le statut natif pour les noms correspondus. Il comprend plusieurs fonctions pour télécharger des ressources, nettoyer et aligner les noms, et compiler des infos sur la distribution des taxa.
Gestion des noms taxonomiques
Les données taxonomiques que “APCalign” utilise viennent de la Liste Nationale des Espèces d'Australie, spécifiquement pour les plantes vasculaires. L'APC contient une liste de classifications d'espèces approuvées, qui inclut à la fois des noms acceptés et des noms avec des statuts alternatifs, comme des synonymes.
Grâce à l'outil, les utilisateurs peuvent charger ces ressources taxonomiques, ce qui permet au logiciel de traiter les noms avec précision. Pour bien aligner les noms originaux avec la meilleure correspondance dans l'APC ou l'APNI, plusieurs facteurs sont pris en compte, comme le format des noms et s'il faut effectuer une correspondance floue.
Le logiciel propose des fonctions pour standardiser les noms, aligner les noms d'entrée avec des noms reconnus, et mettre à jour les noms aux classifications acceptées. Les utilisateurs peuvent facilement obtenir des noms alignés et mis à jour en une seule étape simple au lieu de passer par plusieurs étapes.
Standardisation des noms
Avant de faire correspondre les noms aux classifications acceptées, “APCalign” les standardise. Ça signifie créer différentes versions du nom original pour trouver la meilleure correspondance. Par exemple, il va retirer les mots inutiles et standardiser les abréviations ou indications pour assurer un nom propre et précis.
Après normalisation, chaque nom passe par un processus de correspondance où il peut être connecté au meilleur nom correspondant dans l'APC/APNI. Ce processus inclut l'utilisation de plusieurs algorithmes pour vérifier d'abord les correspondances exactes, puis passer aux correspondances floues moins précises si nécessaire.
Le logiciel continue de vérifier jusqu'à ce qu'il trouve la meilleure correspondance possible pour chaque nom. Si aucune correspondance ne peut être trouvée, il va quand même enregistrer que le nom ne pouvait être lié qu'à une catégorie taxonomique plus large, comme un genre.
Mise à jour des noms
Une fois qu'un nom a été associé, “APCalign” peut le mettre à jour avec le nom actuellement accepté. C'est essentiel car les noms scientifiques peuvent changer. Le programme a des fonctions qui garantissent que les noms non seulement sont mis à jour correctement, mais que tous les noms alternatifs ou synonymes sont également fournis.
Pour chaque nom aligné, les utilisateurs reçoivent une sortie qui inclut le nom accepté, toute suggestion de noms alternatifs, et des identifiants qui renvoient aux sources de données originales. Cette mise à jour systématique aide à maintenir une compréhension claire et actuelle des classifications des plantes en Australie.
Compréhension de la distribution
L'APC fournit des infos essentielles concernant la distribution des espèces à travers les états et si elles sont natives ou introduites. C'est crucial pour comprendre la biodiversité. Le logiciel inclut des fonctions qui permettent aux utilisateurs d'analyser où se trouvent les espèces et combien elles sont diverses dans différentes régions.
Par exemple, les utilisateurs peuvent voir quelles plantes proviennent de zones spécifiques et comment elles se sont adaptées à de nouveaux environnements. Ces infos peuvent être particulièrement utiles face aux conditions climatiques changeantes et au déplacement des espèces végétales.
Performance et comparaison avec d'autres outils
“APCalign” a été conçu pour standardiser et aligner efficacement diverses listes de noms de plantes. Des tests ont montré de hauts taux de correspondances réussies avec les noms de l'APC, montrant l'efficacité des algorithmes utilisés. La plupart des noms provenant de différentes études écologiques ont été liés avec précision aux noms acceptés dans l'APC.
L'outil a été comparé à d'autres programmes mondiaux existants, comme “TNRS” et “taxize.” Bien que ces outils offrent aussi des capacités importantes comme la correspondance et des algorithmes flous, “APCalign” se concentre spécifiquement sur le contexte australien, ce qui le rend unique.
Bien que tous les outils comparés permettent la mise à jour des noms, “APCalign” se démarque car il peut gérer les nuances particulières des noms de plantes australiennes et leurs classifications. La capacité à montrer clairement si un nom correspond à un niveau de genre ou d'espèce est un avantage supplémentaire qui aide les utilisateurs à mieux comprendre leurs résultats.
Servir différents utilisateurs
“APCalign” a été construit en pensant à la fois aux chercheurs experts et aux utilisateurs non techniques. Pour ceux qui ne sont pas aussi familiers avec la programmation, une application web d'“APCalign” est disponible, offrant une interface simple. Les utilisateurs peuvent facilement entrer leurs noms de plantes via une interface simple ou uploader un fichier. L'outil traitera alors les noms, retournant des noms alignés et mis à jour qui peuvent être téléchargés pour une utilisation ultérieure.
Cette attention à l'accessibilité aide à assurer que les noms taxonomiques de plantes sont utilisés de manière cohérente parmi différents utilisateurs dans la communauté botanique.
Conclusion
Les chercheurs australiens ont de la chance d'avoir accès à des ressources fiables comme l'APC, qui sont régulièrement mises à jour pour refléter les connaissances actuelles. “APCalign” est un outil innovant qui facilite aux utilisateurs le fait de correspondre et de mettre à jour les noms de plantes selon les normes acceptées. Il sert de ressource vitale pour les projets de recherche, les évaluations de biodiversité et les pépinières, favorisant une communication claire à un niveau national.
Bien que des outils mondiaux pour le matching taxonomique existent, aucun d'eux n'est spécifiquement taillé pour l'APC, qui prend en compte les défis uniques présents dans le nommage des plantes australiennes. Avec “APCalign”, les utilisateurs peuvent s'assurer que leur recherche s'aligne avec les normes nationales, utilisant un outil conçu pour travailler efficacement avec la riche diversité botanique de l'Australie. Au fur et à mesure que les connaissances taxonomiques évoluent, des outils comme “APCalign” continueront de jouer un rôle essentiel pour tenir les chercheurs informés et connectés à des noms et classifications de plantes fiables.
Titre: APCalign: an R package workflow and app for aligning and updating flora names to the Australian Plant Census
Résumé: Here we present "APCalign", an R package and accompanying browser-sourced application to align and update scientific names for Australian vascular plants to the most likely currently accepted name using the Australian Plant Census (APC) or a name in the Australian Plant Names Index (APNI). Scientific names are the label assigned to unique taxon concepts by the scientific community, but this common terminology is most useful if a taxon concept is consistently referred to by the same name. These links can be broken due to either spelling mistakes or taxonomic changes. Automated tools are required to resolve taxon lists, aligning and updating long lists of possibly erroneous scientific names to the most likely currently accepted names. It is essential that tools specific to the APC/APNI be developed, as these lists specify an endorsed national-level nomenclature used in government legislation and include the uniquely Australian concept of phrase names, absent in global taxonomic datasets. To align input names to names within the APC or APNI, "APCalign" works progressively through a sequence of checks that combine different permutations of the input name, exact versus fuzzy matches, matches that consider the entire name input versus a subset of words, and character strings that indicate a name can only be resolved to a genus or family. The aligned names are then, when possible, updated to a currently accepted taxon concept within the APC. This package should facilitate all research outputs that require diverse scientific name lists to be merged or outdated lists to be updated.
Auteurs: Elizabeth H Wenk, W. Cornwell, A. Fuchs, F. Kar, A. Monro, H. Sauquet, R. E. Stephens, D. S. Falster
Dernière mise à jour: 2024-02-05 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.02.02.578715
Source PDF: https://www.biorxiv.org/content/10.1101/2024.02.02.578715.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://biodiversity.org.au/nsl/
- https://traitecoevo.github.io/APCalign/articles/function_notes.html
- https://traitecoevo.github.io/APCalign/articles/APCalign.html
- https://traitecoevo.github.io/APCalign/articles/updating-taxon-names.html
- https://posit-connect-unsw.intersect.org.au/APCalign-app/
- https://www.plantminer.com/
- https://www.environment.nsw.gov.au/topics/animals-and-plants/biodiversity/nsw-bionet