Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

AI e Monitoraggio dei Fiori Selvatici: Un Nuovo Approccio

Usare l'IA per migliorare il monitoraggio dei fiori selvatici e la salute degli ecosistemi.

― 8 leggere min


AI per il MonitoraggioAI per il Monitoraggiodei Fiori Selvaticiartificiale.selvatici con l'intelligenzaMigliorare il tracciamento dei fiori
Indice

I fiori selvatici, conosciuti anche come piante fiorite, sono piante che producono fiori che poi si trasformano in frutti contenenti semi dopo l'impollinazione. Queste piante giocano un ruolo fondamentale nel nostro ambiente. Esistono da circa 130 milioni di anni, il che le rende relativamente nuove rispetto ad altre forme di vita come i mammiferi. Attualmente, ci sono oltre 300.000 specie di piante fiorite, più di tutti gli altri tipi di piante messi insieme. Sono le piante più comuni che si trovano sulla terra.

I fiori selvatici arrivano in una miriade di colori, forme e consistenze. Questa varietà li aiuta ad attrarre impollinatori come api e farfalle. Oltre alla loro bellezza, i fiori selvatici forniscono servizi essenziali. Ad esempio, i loro sistemi radicali aiutano a mantenere il suolo sano, fornire acqua pulita e prevenire l’erosione. Le piante aiutano anche a controllare le temperature nelle città, fornendo materiali per costruire, cibo e molti farmaci. Inoltre, attraverso la fotosintesi, le piante assorbono anidride carbonica, il che può aiutare a ridurre i cambiamenti climatici.

Avere una gamma diversificata di piante è cruciale per mantenere gli ecosistemi sani. Tuttavia, molti di questi ecosistemi sono in difficoltà a causa della perdita di biodiversità. Per aiutare a mantenere questi ecosistemi, è importante avere sistemi in atto per monitorare la salute delle diverse specie nel tempo.

Monitoraggio dei Fiori Selvatici

Attualmente, il monitoraggio dei fiori selvatici spesso comporta la conta manuale dei fiori da parte delle persone sul campo. Questo metodo può essere lento e soggetto a errori. Anche se ci sono app per smartphone che possono aiutare a identificare diverse specie di piante, molte di queste app non sono attrezzate per gestire immagini che mostrano più piante contemporaneamente. Funzionano meglio con foto ravvicinate di singoli fiori.

Di conseguenza, c'è bisogno di metodi migliori per monitorare i fiori selvatici su larga scala. Usare l'intelligenza artificiale (AI) per analizzare le immagini potrebbe essere una soluzione. La tecnologia AI ha fatto progressi in vari settori, come le auto a guida autonoma e l'imaging medico, ma non è ancora stata applicata in modo esteso al monitoraggio dei fiori selvatici.

L'obiettivo è creare un sistema AI in grado di contare automaticamente i fiori selvatici in immagini che mostrano varie specie contemporaneamente. Questo compito coinvolge due fasi principali: prima, creare una raccolta di immagini contrassegnate con dati accurati sui fiori in ciascuna foto; secondo, addestrare un modello AI a riconoscere e contare le diverse specie.

Il Dataset dei Fiori Selvatici di Eindhoven

Il Dataset dei Fiori Selvatici di Eindhoven (EWD) è una raccolta di oltre 2000 immagini di alta qualità di fiori selvatici scattate dall'alto in cinque diversi tipi di paesaggio nei Paesi Bassi, come bordi stradali e parchi. Le immagini includono una vasta gamma di erbe e sono state catturate durante due stagioni di fioritura.

Nella creazione del dataset, un esperto di piante ha preso appunti sulle specie presenti in ogni immagine. L'obiettivo era assicurarsi che il dataset includesse molte specie di fiori selvatici diversi e abbastanza immagini di ciascuna. Questo permetterebbe al modello AI di imparare e riconoscere la varietà di fiori nei loro habitat naturali senza favorirne alcuno in particolare.

Il dataset non contiene solo immagini, ma anche annotazioni che indicano quali fiori sono presenti in ciascuna immagine e i loro specifici tipi. La qualità delle annotazioni è essenziale poiché garantisce che qualsiasi AI addestrata su questi dati possa apprendere in modo accurato.

Sfide nel Monitoraggio dei Fiori Selvatici

Ci sono sfide distintive nel monitorare i fiori selvatici. Gli sfondi delle immagini possono essere affollati, rendendo difficile vedere i fiori. Inoltre, i fiori passano attraverso varie fasi di crescita, dai boccioli ai fiori completamente sbocciati fino a quelli appassiti, il che cambia il loro aspetto nel tempo. Pertanto, identificare i fiori correttamente diventa più complicato.

Poiché ci sono molti tipi diversi di fiori selvatici, un modello AI deve essere in grado di riconoscere differenze sottili tra specie simili. Questo richiede un approccio sofisticato per apprendere sui fiori selvatici.

Per affrontare queste sfide, possono essere impiegati alcuni metodi di base, come utilizzare caratteristiche come colore e forma per aiutare a identificare i fiori. Tecniche più avanzate coinvolgono l'uso del deep learning, dove i modelli apprendono da grandi set di dati etichettati.

Rilevamento degli oggetti per il Monitoraggio dei Fiori Selvatici

Invece di limitarsi a identificare fiori singoli, il rilevamento degli oggetti implica riconoscere e localizzare più fiori in un'unica immagine. Questo approccio risponde a due domande: quali fiori sono presenti? E dove si trovano nell'immagine? Questo metodo è essenziale per contare accuratamente i fiori in una scena.

Per il rilevamento degli oggetti, le immagini devono essere etichettate con riquadri attorno ai fiori. Queste etichette aiutano l'AI a imparare quali parti di un'immagine corrispondono a quali fiori.

Confrontando le previsioni dell'AI con le etichette reali, possiamo misurare quanto bene sta funzionando il modello. Ad esempio, il punteggio di precisione media (mAP) ci aiuta a capire quanto bene il modello rileva e conta i fiori.

Mentre alcuni modelli sono progettati per efficienza, altri si concentrano di più sulla precisione. Per questo progetto, l'attenzione è sulla precisione poiché è più cruciale per un monitoraggio accurato.

Costruzione del Dataset EWD

La raccolta delle immagini EWD ha coinvolto tecniche specifiche per garantire che i dati raccolti fossero utili. Ogni immagine è stata scattata da un'altezza di circa 1,5 a 1,9 metri da terra e includeva una vista chiara di un'area di circa 1 metro quadrato. La raccolta è stata effettuata durante due stagioni di fioritura complete per garantire una gamma diversificata di fiori.

Le immagini sono state scattate in vari contesti come parchi urbani, bordi stradali e terreni agricoli, offrendo una visione completa della diversità dei fiori selvatici. Come parte della raccolta dati, l'esperto ha registrato dettagli sulle piante in ciascuna immagine per garantire una corretta identificazione in seguito.

Per garantire che il dataset rimanesse riservato e non rivelasse le posizioni di piante rare, tutti i metadati sono stati rimossi.

Definizione delle Unità di Conteggio Floreale

Ogni fiore fa parte di un gruppo noto come infiorescenza, che può variare tra le diverse famiglie di piante. Comprendere questi tipi di infiorescenza è vitale per contare accuratamente i fiori. In alcuni casi, può essere difficile distinguere tra fiori individuali, specialmente se sono molto vicini. In tali casi, viene utilizzato un metodo semplice, come contare i fiori individuali o gruppi di fiori più grandi.

Questo studio utilizza unità di conteggio floreale (FCU) basate sul tipo di infiorescenza, consentendo un conteggio coerente in tutto il dataset. Per ciascuna specie fiorente nel dataset, sono state stabilite linee guida specifiche per garantire coerenza.

Annotazione dell'EWD

Aggiungere annotazioni alle immagini può essere un processo lungo. Per garantire annotazioni di alta qualità, un esperto ha seguito linee guida mirate a rendere il processo il più chiaro e obiettivo possibile.

Le regole includono garantire che tutti i fiori visibili siano annotati, che vengano utilizzati riquadri stretti e che i fiori in stati di qualità inferiore siano esclusi. Seguire queste regole aiuta l'AI a imparare a ignorare dati irrilevanti o confusi, che potrebbero influenzare negativamente le sue prestazioni.

Utilizzando uno strumento dedicato per l'annotazione, il dataset è stato costruito in modo organizzato e pronto per l'uso nell'addestramento AI.

Addestramento del Modello AI

Dopo aver preparato il dataset, il passo successivo è stato addestrare un modello AI capace di rilevare e contare automaticamente i fiori selvatici. Il processo di addestramento implica nutrire l'AI con immagini ad alta risoluzione e le loro annotazioni corrispondenti per insegnarle a riconoscere le diverse specie di fiori e le loro posizioni.

Per un'elaborazione efficiente, le immagini sono state divise in tessere più piccole per mantenere la qualità adattandosi alle dimensioni di ingresso del modello. Questo approccio aiuta a recuperare dettagli essenziali necessari per l'identificazione dei fiori.

Inoltre, per evitare bias nel modello a causa della rappresentazione non uniforme delle diverse specie di fiori nel dataset, è stato creato un sottoinsieme bilanciato. Questo metodo assicura che ogni specie sia rappresentata equamente durante l'addestramento.

Prestazioni del Modello

Dopo aver completato l'addestramento, il modello è stato testato per valutare quanto bene potesse identificare e contare i fiori. Il modello addestrato è stato in grado di generare previsioni sui luoghi e le specie dei fiori con un alto tasso di precisione, misurato mediante il punteggio di precisione media.

L'AI ha funzionato bene per la maggior parte delle specie, soprattutto quelle con infiorescenze chiare e semplici. Tuttavia, alcune specie con strutture floreali complesse si sono rivelate più difficili da rilevare per il modello.

In generale, i risultati hanno mostrato che l'AI può generalizzare bene su immagini mai viste, il che è un segnale positivo per il suo futuro utilizzo nel monitoraggio dei fiori selvatici.

Conclusione

Questo lavoro ha prodotto due contributi significativi: un dataset di alta qualità per il monitoraggio dei fiori selvatici e un modello di rilevamento degli oggetti funzionale in grado di identificare e contare le specie floreali dalle immagini.

L'EWD fornisce una solida base per ulteriori ricerche ed è disponibile per la comunità scientifica. Il modello addestrato sull'EWD è in grado di riconoscere e contare una gamma diversificata di specie floreali, rendendolo uno strumento prezioso per il monitoraggio dei fiori selvatici.

Poiché la tecnologia continua a evolversi, il potenziale per l'AI nella ricerca ecologica cresce, aprendo la strada a una migliore comprensione e protezione dei nostri ambienti naturali. Garantendo dati di alta qualità e processi di addestramento rigorosi, possiamo sviluppare soluzioni efficaci per monitorare i nostri ecosistemi e supportare la biodiversità.

Fonte originale

Titolo: Data-centric AI approach for automated wildflower monitoring

Estratto: Both researchers and policy makers are in need of standards and tools that help understanding and assessing natural capital. Wildflowers are a major component of our natural capital; they play an essential role in ecosystems, improve soil health, supply food and medicines, and curb climate change. In this paper, we present the Eindhoven Wildflower Dataset (EWD) as well as a PyTorch object detection model that is able to identify and count wildflowers. EWD, collected over two entire flowering seasons and expert annotated, contains 2002 top-view images of flowering plants captured in the wild in five different landscape types (roadsides, urban green spaces, cropland, weed-rich grassland, marshland). It holds a total of 65571 annotations for 160 species belonging to 31 different families of flowering plants and serves as a reference dataset for automating wildflower monitoring. To ensure consistent annotations, we define specific floral count units (largely based on inflorescences) and provide extensive annotation guidelines. With a 0.82 mAP (@IoU > 0.50) score the presented baseline model, trained with a balanced subset of EWD, is to the best of our knowledge superior in its class. Our approach empowers automated quantification of wildflower richness and abundance and encourages the development of standards for AI-based wildflower monitoring. The annotated EWD dataset is publicly available on the DataverseNL research data repository, and the code to train and run the baseline model is supplied as supplementary material.

Autori: Gerard Schouten, B. Michielsen, B. Gravendeel

Ultimo aggiornamento: 2024-04-22 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.04.18.590040

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.18.590040.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili