Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

IA e Monitoramento de Flores Silvestres: Uma Nova Abordagem

Usando IA pra melhorar o monitoramento de flores silvestres e a saúde dos ecossistemas.

― 9 min ler


IA para Monitoramento deIA para Monitoramento deFlores Silvestressilvestres com inteligência artificial.Melhorando o rastreamento de flores
Índice

Flores silvestres, também conhecidas como plantas floridas, são plantas que produzem flores que depois viram frutos com sementes após a polinização. Essas plantas têm um papel super importante no nosso meio ambiente. Elas estão por aqui há cerca de 130 milhões de anos, o que é relativamente novo comparado a outras formas de vida como os mamíferos. Atualmente, existem mais de 300.000 espécies de plantas floridas, que é mais do que todos os outros tipos de plantas juntos. Elas são as plantas mais comuns encontradas em terra firme.

Flores silvestres vêm em várias cores, formas e texturas. Essa variedade ajuda a atrair polinizadores como abelhas e borboletas. Além da beleza, flores silvestres fornecem serviços essenciais. Por exemplo, seus sistemas de raízes ajudam a manter o solo saudável, a água limpa e evitam a erosão. As plantas também auxiliam no controle das temperaturas nas cidades, fornecem materiais para construção, comida e muitos medicamentos. Além disso, através da fotossíntese, as plantas absorvem dióxido de carbono, o que pode ajudar a reduzir as mudanças climáticas.

Uma diversidade de plantas é crucial para manter os ecossistemas saudáveis. No entanto, muitos desses ecossistemas estão em apuros devido à perda de biodiversidade. Para ajudar a manter esses ecossistemas, é importante ter sistemas que monitorem a saúde das diferentes espécies ao longo do tempo.

Monitoramento de Flores Silvestres

Atualmente, o monitoramento de flores silvestres geralmente envolve pessoas contando flores manualmente no campo. Esse método pode ser lento e propenso a erros. Embora existam aplicativos de smartphone que podem ajudar a identificar diferentes espécies de plantas, muitos desses apps não estão preparados para lidar com imagens que mostram várias plantas ao mesmo tempo. Eles funcionam melhor com fotos close-up de flores únicas.

Como resultado, há uma necessidade de melhores métodos para monitorar flores silvestres em uma escala maior. Usar inteligência artificial (IA) para analisar imagens pode ser uma solução. A tecnologia de IA avançou em várias áreas, como carros autônomos e imagens médicas, mas ainda não foi amplamente aplicada ao monitoramento de flores silvestres.

O objetivo é criar um sistema de IA que possa contar automaticamente flores silvestres em imagens que mostram várias espécies ao mesmo tempo. Essa tarefa envolve duas etapas principais: primeiro, criar uma coleção de imagens que sejam marcadas com dados precisos sobre as flores em cada foto; segundo, treinar um modelo de IA para reconhecer e contar as diferentes espécies.

O Conjunto de Dados de Flores Silvestres de Eindhoven

O Conjunto de Dados de Flores Silvestres de Eindhoven (EWD) é uma coleção de mais de 2000 imagens de alta qualidade de flores silvestres tiradas de cima em cinco tipos diferentes de paisagens na Holanda, como beira de estrada e parques. As imagens incluem uma ampla variedade de ervas e foram capturadas ao longo de duas temporadas de florescimento.

Na criação do conjunto de dados, um especialista em plantas anotou quais espécies estavam presentes em cada imagem. A ideia era garantir que o conjunto de dados incluísse muitas espécies diferentes de flores silvestres e imagens suficientes de cada uma. Isso permitiria que o modelo de IA aprendesse e reconhecesse a variedade de flores em seus habitats naturais sem favorecer nenhuma em particular.

O conjunto de dados não só contém imagens, mas também anotações que indicam quais flores estão presentes em cada imagem e seus tipos específicos. A qualidade das anotações é essencial, pois garante que qualquer IA treinada com esses dados possa aprender de forma precisa.

Desafios no Monitoramento de Flores Silvestres

Existem desafios distintos envolvidos no monitoramento de flores silvestres. Os fundos das imagens podem ser confusos, dificultando a visualização das flores. Além disso, as flores passam por várias fases de crescimento, desde botões até flores completamente abertas e murchas, o que muda a aparência delas ao longo do tempo. Portanto, identificar as flores corretamente se torna mais complicado.

Como existem muitos tipos diferentes de flores silvestres, um modelo de IA precisa ser capaz de reconhecer diferenças sutis entre espécies semelhantes. Isso requer uma abordagem sofisticada para aprender sobre flores silvestres.

Para enfrentar esses desafios, alguns métodos básicos podem ser empregados, como usar características como cor e forma para ajudar a identificar flores. Técnicas mais avançadas envolvem usar aprendizado profundo, onde modelos aprendem a partir de grandes conjuntos de dados rotulados.

Detecção de Objetos para Monitoramento de Flores Silvestres

Em vez de apenas identificar flores individuais, a detecção de objetos envolve reconhecer e localizar várias flores em uma única imagem. Essa abordagem responde a duas perguntas: Quais flores estão presentes? E onde elas estão localizadas na imagem? Esse método é essencial para contar flores com precisão em uma cena.

Para a detecção de objetos, as imagens precisam ser rotuladas com caixas delimitadoras em torno das flores. Esses rótulos ajudam a IA a aprender quais partes de uma imagem correspondem a quais flores.

Comparando as previsões da IA com os rótulos reais, podemos medir o quão bem o modelo está se saindo. Por exemplo, a pontuação de precisão média (mAP) nos ajuda a entender o quão precisamente o modelo detecta e conta flores.

Enquanto alguns modelos são projetados para eficiência, outros focam mais na precisão. Para esse projeto, o foco é na precisão, pois é mais crucial para o monitoramento correto.

Construindo o Conjunto de Dados EWD

Coletar as imagens do EWD envolveu técnicas específicas para garantir que os dados coletados fossem úteis. Cada imagem foi tirada de cerca de 1,5 a 1,9 metros acima do solo e incluía uma visão clara de uma área de cerca de 1 metro quadrado. A coleta foi feita ao longo de duas temporadas completas de florescimento para garantir uma variedade diversificada de flores.

As imagens foram tiradas em diferentes ambientes, como parques urbanos, beiras de estrada e áreas agrícolas, oferecendo uma visão bem abrangente da diversidade de flores silvestres. Como parte da coleta de dados, o especialista registrou detalhes sobre as plantas em cada imagem para garantir uma identificação correta mais tarde.

Para garantir que o conjunto de dados permanecesse confidencial e não revelasse as localizações de plantas raras, todos os metadados foram removidos.

Definindo Unidades de Contagem Floral

Toda flor faz parte de um grupo conhecido como inflorescência, que pode variar entre diferentes famílias de plantas. Entender esses tipos de inflorescência é vital para contar flores com precisão. Em alguns casos, pode ser desafiador distinguir entre flores individuais, especialmente se estiverem muito próximas. Nesses casos, um método simples é usado, como contar flores individuais ou grupos maiores de flores.

Este estudo utiliza unidades de contagem floral (FCUs) baseadas no tipo de inflorescência, permitindo uma contagem consistente em todo o conjunto de dados. Para cada espécie em flor no conjunto de dados, diretrizes específicas foram estabelecidas para garantir consistência.

Anotando o EWD

Adicionar anotações às imagens pode ser um processo demorado. Para garantir anotações de alta qualidade, um especialista seguiu diretrizes destinadas a tornar o processo o mais claro e objetivo possível.

As regras incluem garantir que todas as flores visíveis sejam anotadas, que caixas delimitadoras apertadas sejam usadas e que flores em estados de qualidade inferior sejam excluídas. Seguir essas regras ajuda a IA a aprender a ignorar dados irrelevantes ou confusos, o que poderia afetar negativamente seu desempenho.

Usando uma ferramenta dedicada para a Anotação, o conjunto de dados foi construído de uma forma organizada e pronta para uso no treinamento de IA.

Treinamento do Modelo de IA

Depois de preparar o conjunto de dados, o próximo passo foi treinar um modelo de IA capaz de detectar e contar flores silvestres automaticamente. O processo de treinamento envolve alimentar a IA com as imagens de alta resolução e suas anotações correspondentes para ensiná-la a reconhecer diferentes espécies de flores e suas localizações.

Para processamento eficiente, as imagens foram divididas em pequenos pedaços para manter a qualidade enquanto se encaixavam no tamanho de entrada do modelo. Essa abordagem ajuda a recuperar detalhes essenciais necessários para identificação das flores.

Além disso, para evitar viés no modelo devido à representação desigual de diferentes espécies de flores no conjunto de dados, um subconjunto equilibrado foi criado. Esse método garante que cada espécie seja igualmente representada durante o treinamento.

Desempenho do Modelo

Após concluir o treinamento, o modelo foi testado para avaliar quão bem ele poderia identificar e contar flores. O modelo treinado conseguiu gerar previsões sobre localizações e espécies de flores com uma alta taxa de precisão, medida pela pontuação média de precisão.

A IA se saiu bem na maioria das espécies, especialmente aquelas com inflorescências claras e simples. No entanto, algumas espécies com estruturas florais complexas se mostraram mais difíceis para o modelo detectar.

No geral, os resultados mostraram que a IA conseguiu generalizar bem para imagens não vistas, o que é um sinal positivo para seu uso futuro no monitoramento de flores silvestres.

Conclusão

Esse trabalho produziu duas contribuições significativas: um conjunto de dados de alta qualidade para monitoramento de flores silvestres e um modelo funcional de detecção de objetos que pode identificar e contar espécies de flores a partir de imagens.

O EWD fornece uma base sólida para futuras pesquisas e está disponível para a comunidade científica usar. O modelo treinado no EWD é capaz de reconhecer e contar uma variedade diversificada de espécies de flores, tornando-se uma ferramenta valiosa para monitorar flores silvestres.

À medida que a tecnologia continua a evoluir, o potencial da IA na pesquisa ecológica cresce, abrindo caminho para um melhor entendimento e proteção dos nossos ambientes naturais. Ao garantir dados de alta qualidade e processos de treinamento rigorosos, podemos desenvolver soluções eficazes para monitorar nossos ecossistemas e apoiar a biodiversidade.

Fonte original

Título: Data-centric AI approach for automated wildflower monitoring

Resumo: Both researchers and policy makers are in need of standards and tools that help understanding and assessing natural capital. Wildflowers are a major component of our natural capital; they play an essential role in ecosystems, improve soil health, supply food and medicines, and curb climate change. In this paper, we present the Eindhoven Wildflower Dataset (EWD) as well as a PyTorch object detection model that is able to identify and count wildflowers. EWD, collected over two entire flowering seasons and expert annotated, contains 2002 top-view images of flowering plants captured in the wild in five different landscape types (roadsides, urban green spaces, cropland, weed-rich grassland, marshland). It holds a total of 65571 annotations for 160 species belonging to 31 different families of flowering plants and serves as a reference dataset for automating wildflower monitoring. To ensure consistent annotations, we define specific floral count units (largely based on inflorescences) and provide extensive annotation guidelines. With a 0.82 mAP (@IoU > 0.50) score the presented baseline model, trained with a balanced subset of EWD, is to the best of our knowledge superior in its class. Our approach empowers automated quantification of wildflower richness and abundance and encourages the development of standards for AI-based wildflower monitoring. The annotated EWD dataset is publicly available on the DataverseNL research data repository, and the code to train and run the baseline model is supplied as supplementary material.

Autores: Gerard Schouten, B. Michielsen, B. Gravendeel

Última atualização: 2024-04-22 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.18.590040

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.18.590040.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes