Melhorando as Previsões de Colheita de Couve-Flor com Tecnologia
Um jeito de melhorar as previsões de colheita de couve-flor usando aprendizado de máquina.
― 7 min ler
Índice
Couve-flor é uma colheita que precisa ser colhida à mão, e tem padrões rígidos de qualidade pra vendas. Isso torna o tempo da colheita super importante. Mas saber quando uma couve-flor tá pronta pra ser colhida pode ser complicado, porque a cabeça da couve-flor geralmente fica escondida pelas folhas. A tecnologia, principalmente o aprendizado profundo, pode ajudar a estimar quando as couve-flores estão prontas, mas às vezes pode errar por causa das diferenças nas condições de cultivo e dos dados limitados de treinamento.
Esse artigo discute um método pra melhorar a precisão de prever quando as couve-flores estão prontas pra colheita. O método envolve analisar a confiabilidade de um classificador que decide se uma couve-flor tá ou não pronta. Ao olhar pras partes importantes das imagens, conseguimos dar notas de confiabilidade pra cada previsão. Essas notas podem ajudar os agricultores a tomarem decisões melhores e a aumentar a precisão das previsões.
Importância do Tempo de Colheita
Previsões precisas sobre quando colher são essenciais pros agricultores. Colher na hora certa pode levar a um rendimento melhor das colheitas e mais lucros. Pra couve-flor, o tempo fica ainda mais complicado porque a qualidade precisa atender altos padrões de vendas. Couve-flores que estão prontas pra colheita podem estar boas apenas por um curto período.
O clima pode afetar bastante o crescimento da couve-flor. Campos plantados em épocas diferentes podem ter couve-flores prontas pra colheita ao mesmo tempo, e até dentro do mesmo campo, as plantas podem crescer em ritmos diferentes. Por causa disso, os trabalhadores muitas vezes têm que colher cada couve-flor à mão, o que consome tempo.
Na agricultura digital, imagens de satélites ou drones podem ajudar a monitorar as colheitas ao longo do tempo. Modelos de aprendizado de máquina analisam essas imagens pra classificar o amadurecimento das colheitas. Isso pode dar previsões úteis pros agricultores sobre quanto eles vão colher e quando. Como o agricultor depende das previsões do modelo, é essencial que ele possa confiar nesses resultados.
Visão Geral do Método
Nosso foco é determinar se as couve-flores individuais estão prontas pra colheita. Nosso objetivo é criar uma nota de confiabilidade pra cada previsão feita pelo modelo que ajuda o agricultor nas suas tomadas de decisão.
Pra isso, usamos um método chamado mapeamento de saliência, que destaca as partes de uma imagem que são importantes pra fazer uma Classificação. Nós combinamos esses mapas em grupos e relacionamos com as notas de confiança do nosso modelo pra criar notas de confiabilidade pras nossas previsões.
Embora existam trabalhos anteriores que tentam melhorar modelos adicionando explicações, eles geralmente exigem algum tipo de interação humana durante o treinamento ou re-treinamento. Nossa abordagem é diferente porque fornece uma nota de confiabilidade após o modelo ter sido treinado, sem precisar da ajuda humana. Isso significa que pode ser usada com modelos existentes sem necessidade de mudanças ou re-treinamento.
Contribuições do Trabalho
Esse trabalho tem como objetivo fornecer um método fácil de usar pós-análise pra derivar notas de confiabilidade sem exigir interação humana trabalhosa. Nós demonstramos sua eficácia com uma aplicação específica: melhorar previsões de prontidão pra colheita de couve-flores usando um conjunto de dados chamado GrowliFlower. Nossa abordagem melhora previsões por margens significativas, levando a taxas de precisão mais altas.
Detalhes do Framework
Nosso framework tem um processo de cinco etapas:
Classificação: Nós classificamos imagens de couve-flores como "Pronta" ou "Não pronta" pra colheita em até três dias.
Mapeamento de Saliência: Nós geramos mapas de saliência pras imagens pra destacar características importantes pra decisão.
Agrupamento: Nós usamos um método chamado agrupamento espectral pra agrupar mapas de saliência similares e relacioná-los com notas de confiabilidade.
Disseminação: Nós comunicamos a confiabilidade das nossas previsões pros agricultores.
Ajuste: Nós usamos a nota de confiabilidade pra melhorar as previsões de classificação iniciais.
Na etapa de classificação, usamos uma rede ResNet18, mas nosso framework pode funcionar com outros classificadores também.
Técnicas de Mapeamento de Saliência
Mapas de saliência ajudam a explicar decisões do modelo mostrando quais áreas de uma imagem influenciam as previsões. Pra nossa tarefa, esses mapas podem indicar áreas críticas a serem consideradas ao decidir se uma couve-flor está pronta pra colheita. Utilizamos três métodos de mapeamento de saliência:
Grad-CAM: Esse método usa informações de gradiente do modelo pra destacar regiões na imagem que contribuem pras previsões.
Mapeamento de Sensibilidade à Oclusão (OSM): Essa abordagem examina como a oclusão afeta as previsões do modelo mascarando partes da imagem.
Explicações Locais Interpretáveis e Independentes de Modelo (LIME): Esse método perturba a entrada pra ver como as previsões mudam e usa um modelo simples pra explicá-las.
Nós descobrimos que o Grad-CAM forneceu os mapas mais informativos pra nosso propósito. Ele destacou regiões onde a cabeça da couve-flor poderia estar, mesmo quando estava coberta por folhas.
Agrupamento de Mapas de Saliência
Depois de gerar os mapas de saliência, nós os agrupamos pra entender melhor as previsões do modelo. O agrupamento ajuda a revelar padrões e previsões problemáticas. Nós realizamos agrupamento espectral nos nossos mapas de saliência, que permite agrupar com base em similaridades pra além das cores RGB.
Nós reduzimos as dimensões dos nossos dados pra manter uma representação significativa enquanto garantimos o desempenho do modelo. Ao analisar esses grupos, podemos ver como as diferentes previsões se saem, especialmente em relação às classificações corretas e incorretas.
Resultados e Análise
Nossos experimentos mostram que grupos de mapas de saliência nem sempre combinam com classes de prontidão pra colheita. Isso é esperado em classificação binária, onde as imagens podem compartilhar características independentemente da prontidão pra colheita.
Usando matrizes de confusão, nós avaliamos o desempenho do nosso modelo em conjuntos de validação e teste. Nós conseguimos uma precisão geral de cerca de 76% no conjunto de validação. Pros dados de teste, cerca de 72% das previsões estavam corretas.
A análise de agrupamento revelou que certos grupos tinham uma alta taxa de erros, significando que as previsões provavelmente estavam erradas. Especificamente, encontramos que um determinado grupo continha cerca de 95% de previsões falsas, o que indicava que amostras nesse grupo eram geralmente não confiáveis.
Quando ajustamos as previsões com base nos resultados do nosso agrupamento, nós vimos taxas de precisão melhoradas. Os ajustes elevaram a precisão geral pra cerca de 90% no conjunto de validação, enquanto a precisão da inferência subiu pra aproximadamente 88%.
Conclusão
Esse método fornece com sucesso uma maneira de avaliar e melhorar a precisão das previsões de prontidão pra colheita de couve-flores. A integração de mapas de saliência e agrupamento nos permite derivar notas de confiabilidade pras previsões sem precisar de interação humana durante o processo.
Nossa abordagem não só aumenta a precisão, mas também fornece aos agricultores insights compreensíveis e acionáveis sobre o gerenciamento das suas colheitas. Ao gerar interpretações das decisões do modelo, nós empoderamos os agricultores a fazerem escolhas informadas sobre a colheita de couve-flores.
Olhando pra frente, esse framework pode ser aplicado a outras colheitas e tarefas multiclasse, ajudando a melhorar a confiabilidade e a tomada de decisão na agricultura. A flexibilidade do nosso método significa que pode ser facilmente integrado com modelos de aprendizado de máquina existentes usados em práticas agrícolas.
Título: Reliability Scores from Saliency Map Clusters for Improved Image-based Harvest-Readiness Prediction in Cauliflower
Resumo: Cauliflower is a hand-harvested crop that must fulfill high-quality standards in sales making the timing of harvest important. However, accurately determining harvest-readiness can be challenging due to the cauliflower head being covered by its canopy. While deep learning enables automated harvest-readiness estimation, errors can occur due to field-variability and limited training data. In this paper, we analyze the reliability of a harvest-readiness classifier with interpretable machine learning. By identifying clusters of saliency maps, we derive reliability scores for each classification result using knowledge about the domain and the image properties. For unseen data, the reliability can be used to (i) inform farmers to improve their decision-making and (ii) increase the model prediction accuracy. Using RGB images of single cauliflower plants at different developmental stages from the GrowliFlower dataset, we investigate various saliency mapping approaches and find that they result in different quality of reliability scores. With the most suitable interpretation tool, we adjust the classification result and achieve a 15.72% improvement of the overall accuracy to 88.14% and a 15.44% improvement of the average class accuracy to 88.52% for the GrowliFlower dataset.
Autores: Jana Kierdorf, Ribana Roscher
Última atualização: 2023-05-24 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2305.15149
Fonte PDF: https://arxiv.org/pdf/2305.15149
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.