Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Aprendizagem de máquinas

Aprimorando o Cultivo de Algodão com Big Data

Um pipeline de big data melhora a detecção da floração do algodão para decisões de farming mais acertadas.

― 9 min ler


Big Data na AgriculturaBig Data na Agriculturado Algodãoavançadas.algodão com técnicas de dadosAprimorando a detecção da floração do
Índice

A demanda por agricultura sustentável tá crescendo por causa do aumento da população mundial. Pra atender essas necessidades, métodos de agricultura de precisão usando visão computacional e aprendizado de máquina tão ficando populares. Esses métodos permitem que os fazendeiros monitorem a saúde das plantações, as condições do solo e os rendimentos de forma eficiente. Mas coletar e processar grandes quantidades de dados de vários sensores pode ser um desafio. É aí que entra um pipeline de big data.

Desafios na Agricultura de Algodão

A agricultura de algodão enfrenta várias dificuldades, especialmente quando o assunto é prever rendimentos. Uma questão chave é a colheita no tempo certo. Se o algodão não for colhido na hora certa, a qualidade pode cair por causa das condições climáticas. Pra evitar isso, é crucial colher quando pelo menos 60% a 75% das cápsulas de algodão estão abertas e antes que elas se deteriorem depois de cerca de 50 dias. Colher algodão também é caro, já que as máquinas usadas podem pesar até 33 toneladas e podem compactar o solo, tornando-o menos produtivo. Além disso, fatores como mudanças climáticas e recursos hídricos limitados complicam ainda mais a situação.

Pra lidar com esses desafios, é importante coletar dados precisos e em tempo hábil. Isso exige uma plataforma que possa lidar com dados em tempo real e gerenciar grandes conjuntos de dados de forma eficaz.

A Necessidade de um Pipeline de Big Data

Quando se planta algodão, muitos sensores e dispositivos coletam vários tipos de dados, gerando um grande volume de informação que é tanto estruturada quanto não estruturada. Pra tomar decisões informadas, os fazendeiros precisam de um sistema que armazene, processe e analise esses dados de forma eficiente.

Um pipeline de big data é uma solução que pode ajudar nisso. Ele consegue gerenciar diferentes tipos de dados e garantir que estejam disponíveis para decisões em tempo real. Na agricultura de precisão, esses pipelines podem trazer benefícios significativos.

Nossa Abordagem: Pipeline de Detecção de Flores de Algodão

No nosso estudo, estamos apresentando um pipeline de big data projetado pra detectar flores de algodão. Esse pipeline usa uma arquitetura Lambda, que permite tanto o processamento de dados em tempo real quanto de forma batch. Nós usamos recursos da Microsoft Azure, incluindo ferramentas pra manuseio e análise de dados.

As partes principais do pipeline incluem limpeza de dados, detecção de flores de algodão com um modelo de aprendizado de máquina e visualização dos resultados. Nosso objetivo é criar um sistema que consiga lidar de forma eficiente com grandes quantidades de dados e entregar resultados rapidamente.

O que é Arquitetura Lambda?

A arquitetura Lambda é uma forma de gerenciar o processamento de dados que combina métodos batch e em tempo real. Essa estrutura tem três camadas: a camada batch, a camada de velocidade e a camada de serviço. A camada batch coleta e processa grandes volumes de dados históricos, enquanto a camada de velocidade foca no processamento de dados em tempo real. A camada de serviço torna esses dados processados disponíveis para usuários ou aplicativos.

Na agricultura, usar a arquitetura Lambda pode ajudar os fazendeiros a analisar e melhorar suas práticas processando grandes conjuntos de dados de sensores, como rendimentos de colheitas e informações meteorológicas.

Usando Computação em Nuvem

O processamento tradicional de dados muitas vezes depende de servidores locais, que podem ser caros e limitar a capacidade de escalar operações. Ao aproveitar a computação em nuvem, especialmente a Microsoft Azure, os fazendeiros podem acessar recursos computacionais poderosos a um custo mais baixo. Isso permite um armazenamento e processamento de dados mais eficientes, resultando em melhores insights a partir dos dados coletados.

Serviços de nuvem como o Azure oferecem muitos benefícios, como segurança aprimorada, escalabilidade e flexibilidade, que são essenciais na agricultura moderna.

Componentes Chave do Pipeline

Data Factory

O Azure Data Factory é uma parte crucial do nosso pipeline. Ele ajuda a criar fluxos de trabalho eficientes para processos de Extrair, Transformar e Carregar (ETL). Isso significa que os dados podem ser coletados, limpos e organizados de uma forma que seja adequada para análise. O Data Factory também permite a integração com outros serviços do Azure para capacidades de processamento aprimoradas.

Detectando Flores de Algodão

Pra identificar flores de algodão, nós treinamos um modelo de aprendizado de máquina conhecido como YOLOv5, que é projetado pra detecção de objetos. Esse modelo foi construído na plataforma de aprendizado de máquina da Azure e alcançou uma pontuação de desempenho impressionante de 0.96 em precisão.

O modelo analisa imagens de entrada e detecta flores de algodão desenhando caixas ao redor delas. Esse método fornece rapidamente aos fazendeiros insights sobre o número e a localização das flores de algodão.

Processamento Direcionado por Eventos

Um aspecto inovador do nosso pipeline é o uso de processamento direcionado por eventos. Isso significa que o sistema pode reagir imediatamente quando novos dados estão disponíveis. Por exemplo, se uma nova imagem de algodão é enviada, o sistema processa rapidamente essa imagem e fornece feedback sobre a detecção das flores.

Processo de Coleta de Dados

Fazenda de Pesquisa de Algodão

Nossos dados foram coletados em uma fazenda de pesquisa da Universidade da Georgia. Usamos uma câmera estéreo montada em um veículo autônomo pra capturar imagens de plantas de algodão. Esse método nos permitiu reunir milhares de imagens ao longo do tempo, que eram essenciais pra treinar o modelo de aprendizado de máquina.

Preparação dos Dados

Depois de coletar as imagens, rotulamos as flores de algodão para o processo de treinamento do modelo. Isso envolveu desenhar caixas ao redor das flores em cada imagem pra ajudar o modelo a aprender a identificá-las.

Pra garantir a eficiência do nosso pipeline de dados, também realizamos uma pré-processamento de dados. Isso incluiu a redução do tamanho das imagens e a organização das imagens em conjuntos menores pra facilitar o processamento.

Construindo o Pipeline de Big Data

Arquitetura em Camadas

Nosso pipeline segue a arquitetura Lambda, que é estruturada da seguinte forma:

  1. Camada Batch: Essa camada lida com a maior parte dos dados históricos e os prepara para análise. Ela processa os dados em um cronograma pra garantir que as informações estejam atualizadas.

  2. Camada de Velocidade: Essa camada lida com dados em tempo real à medida que eles chegam. O foco aqui é fornecer insights imediatos com base nos novos dados que estão sendo coletados.

  3. Camada de Serviço: Finalmente, essa camada torna os dados processados disponíveis para os usuários finais ou aplicativos, permitindo fácil acesso aos insights.

Ao separar essas camadas, conseguimos rodar o pipeline de forma mais eficiente e garantir que tanto os dados em tempo real quanto os históricos sejam analisados com precisão.

Processamento de Imagens

Uma vez que os dados são ingeridos no sistema, nos conectamos ao Azure Databricks pra pré-processamento. Essa plataforma nos permite realizar tarefas de limpeza e transformação de dados rapidamente. Ela é otimizada pra lidar com grandes conjuntos de dados de forma eficiente.

As imagens são então analisadas usando nosso modelo YOLOv5, que detecta as flores de algodão e retorna as coordenadas das caixas delimitadoras indicando suas localizações nas imagens.

Visualizando Resultados

O passo final do nosso processo é visualizar os resultados. Nós pegamos a saída do modelo YOLOv5 e sobrepomos as caixas delimitadoras nas imagens originais das plantas de algodão. Essa saída pode ser armazenada em um local central pra fácil acesso de fazendeiros ou profissionais da agricultura.

Desempenho do Pipeline

Depois de testar nosso pipeline em um conjunto de dados de 9.000 imagens, descobrimos que o tempo de processamento foi reduzido pra apenas 34 minutos. Isso demonstra a eficácia da nossa solução baseada em nuvem pra lidar com análises de dados em grande escala.

A alta precisão de 0.96 do modelo YOLOv5 também confirma que nosso sistema pode identificar com confiança as flores de algodão, o que é crucial pros fazendeiros tomarem decisões pontuais sobre a colheita.

Direções Futuras

Olhando pra frente, existem várias maneiras de aprimorar nosso pipeline. Uma área de melhoria é atualizar nossos recursos computacionais pra um processamento de dados ainda mais rápido. Usar máquinas mais poderosas e incorporar técnicas de processamento avançadas pode reduzir ainda mais o tempo necessário pra analisar os dados.

Outra área pra explorar é analisar outros tipos de culturas e aplicar as mesmas técnicas a diferentes cenários agrícolas. Isso expande as aplicações potenciais do nosso pipeline de big data além da agricultura de algodão.

Conclusão

Pra concluir, o pipeline de big data que desenvolvemos pra detectar flores de algodão mostra o potencial da computação em nuvem e das técnicas avançadas de processamento de dados na agricultura. Ao utilizar a Microsoft Azure e aproveitar a arquitetura Lambda, conseguimos gerenciar grandes conjuntos de dados de forma eficiente, fornecendo insights imediatos que ajudam os fazendeiros em seus processos de tomada de decisão.

Esse sistema não só ajuda a enfrentar os desafios da agricultura de algodão, mas também cria uma estrutura que pode ser adaptada pra várias aplicações agrícolas, contribuindo pra práticas de agricultura mais sustentáveis no futuro. Os resultados do nosso estudo indicam a importância de integrar tecnologia na agricultura pra atender as crescentes demandas de produção de alimentos.

Continuando a aprimorar nossos métodos e explorar novas oportunidades, esperamos contribuir pra um setor agrícola mais eficiente e sustentável por meio de técnicas avançadas de análise e processamento de dados.

Fonte original

Título: High-throughput Cotton Phenotyping Big Data Pipeline Lambda Architecture Computer Vision Deep Neural Networks

Resumo: In this study, we propose a big data pipeline for cotton bloom detection using a Lambda architecture, which enables real-time and batch processing of data. Our proposed approach leverages Azure resources such as Data Factory, Event Grids, Rest APIs, and Databricks. This work is the first to develop and demonstrate the implementation of such a pipeline for plant phenotyping through Azure's cloud computing service. The proposed pipeline consists of data preprocessing, object detection using a YOLOv5 neural network model trained through Azure AutoML, and visualization of object detection bounding boxes on output images. The trained model achieves a mean Average Precision (mAP) score of 0.96, demonstrating its high performance for cotton bloom classification. We evaluate our Lambda architecture pipeline using 9000 images yielding an optimized runtime of 34 minutes. The results illustrate the scalability of the proposed pipeline as a solution for deep learning object detection, with the potential for further expansion through additional Azure processing cores. This work advances the scientific research field by providing a new method for cotton bloom detection on a large dataset and demonstrates the potential of utilizing cloud computing resources, specifically Azure, for efficient and accurate big data processing in precision agriculture.

Autores: Amanda Issac, Alireza Ebrahimi, Javad Mohammadpour Velni, Glen Rains

Última atualização: 2023-05-09 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2305.05423

Fonte PDF: https://arxiv.org/pdf/2305.05423

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes