Melhorando a Classificação de Culturas com Dados Combinados
Um novo método melhora a classificação de culturas usando várias fontes de dados pra maior precisão.
― 8 min ler
Índice
- A Abordagem
- Resultados e Desempenho
- Importância do Mapeamento de Tipos de Culturas
- Trabalho Relacionado em Classificação de Culturas
- Nossa Metodologia: Combinando Diferentes Tipos de Dados
- Criando um Novo Conjunto de Dados
- Avaliando e Comparando Modelos
- Enfrentando Desafios na Classificação de Culturas
- Direções Futuras
- Fonte original
- Ligações de referência
Classificar as culturas de forma certinha durante a safra é super importante. Essa classificação ajuda a estimar a produção e monitorar a terra agrícola. Mas, classificar as culturas pode ser complicado por causa dos padrões de crescimento natural e como eles mudam ao longo do tempo e em diferentes lugares.
Métodos recentes usando aprendizado profundo mostram potencial, mas a maioria usa só um tipo de dado, como imagens de satélite ou padrões de rotação de culturas. Nossa nova abordagem combina diferentes tipos de dados pra melhorar a precisão nas várias safras e países.
A Abordagem
Nossa abordagem usa três tipos de dados:
Dados de Sensoriamento Remoto: Observações de satélites, tipo o Sentinel-2 e o Landsat 8.
Dados de Rotação de Culturas: Informações sobre quais culturas foram plantadas em uma área de terra nas safras anteriores.
Dados de Distribuição Local de Culturas: Entendimento de como as culturas estão distribuídas em uma área específica.
Pra testar nosso método, criamos um novo conjunto de dados com informações de cerca de 7,4 milhões de parcelas agrícolas na França e na Holanda. Cada parcela está ligada a dados em série temporal que incluem medições de refletância da superfície e variáveis importantes de saúde das plantas. Além disso, desenvolvemos uma nova forma de agrupar tipos de culturas que ajuda a avaliar o desempenho do modelo.
Resultados e Desempenho
O desempenho do nosso método foi testado usando diferentes agrupamentos de tipos de culturas, variando de 151 a apenas 8 tipos. A precisão variou de 91% a 95% para a Holanda e de 85% a 89% para a França. Treinando em um conjunto de dados maior, nosso método também mostrou capacidade de adaptação e bom desempenho em diferentes países.
O pré-treinamento em um conjunto de dados ajudou a melhorar o desempenho do nosso modelo quando aplicado a outro, permitindo que ele se adaptasse melhor a novas tarefas com exemplos limitados.
Importância do Mapeamento de Tipos de Culturas
Mapear os tipos de culturas é vital pra monitorar a produção agrícola e a segurança alimentar global. Sistemas de satélites oferecem dados valiosos porque conseguem observar grandes áreas de forma consistente e repetida. Desde 2015, os dados do programa Copernicus da União Europeia, especialmente dos satélites Sentinel-1 e Sentinel-2, têm oferecido dados confiáveis em alta resolução.
A maioria dos métodos atuais de classificação de culturas foca só nos dados da safra, ignorando mudanças anuais cruciais nas práticas agrícolas.
Nosso método combina dados de rotação de culturas com dados de sensoriamento remoto e informações locais, oferecendo uma visão mais completa dos tipos de culturas ao longo do tempo. Também construímos um conjunto de dados com múltiplos anos de dados em série temporal das mesmas parcelas, permitindo uma análise melhor.
Trabalho Relacionado em Classificação de Culturas
A pesquisa em classificação de culturas foi dividida em várias áreas, focando em:
Usando Somente Dados de Sensoriamento Remoto: Alguns estudos classificam culturas no nível da parcela usando dados de satélites como o Sentinel-2. Esses estudos geralmente comparam modelos de aprendizado profundo como Transformers e redes de Memória de Longo e Curto Prazo (LSTM).
Integrando Dados de Rotação de Culturas: Pesquisas que combinam sensoriamento remoto com dados de rotação de culturas também surgiram. No entanto, esses métodos muitas vezes usam modelos mais simples e não conseguem capturar a complexidade das variações das culturas ao longo do tempo.
Classificação no Início da Safra: Identificar os tipos de culturas no início da safra tá se tornando um foco maior. Alguns estudos começaram a usar métodos especializados pra melhorar as capacidades preditivas no início da safra.
Apesar desses avanços, poucos estudos tentaram integrar efetivamente diferentes modalidades de dados, especialmente como as dinâmicas sazonais mudam.
Nossa Metodologia: Combinando Diferentes Tipos de Dados
Nosso método se destaca por unir dados de rotação de culturas, sensoriamento remoto e distribuição local de culturas. Usamos redes neurais pra processar essas modalidades juntas, organizadas em uma estrutura hierárquica que ajuda a analisar tanto padrões de cultivo de curto quanto de longo prazo.
Rotação de Culturas: Isso é tratado como uma sequência de palavras em uma frase, usando um método parecido com modelos de linguagem encontrados em processamento de linguagem natural. Modelando sequências de culturas, conseguimos prever melhor as culturas futuras.
Dados de Sensoriamento Remoto: Os dados do Sentinel-2 e do Landsat 8 são usados pra enriquecer nosso entendimento da saúde e características das culturas ao longo do tempo.
Distribuição Local de Culturas: Esses insights ajudam a entender como práticas agrícolas e clima afetam a distribuição das culturas.
Integrando esses tipos de dados de forma estruturada, conseguimos melhorar a capacidade do modelo de analisar os tipos de culturas com mais precisão.
Criando um Novo Conjunto de Dados
Liberamos um novo conjunto de dados que fornece informações detalhadas sobre culturas junto com dados de sensoriamento remoto, cobrindo múltiplas safras de 2016 a 2020. Nosso conjunto de dados contém mais de 7,4 milhões de parcelas, oferecendo um recurso significativo pra mais pesquisas e desenvolvimento.
Coleta de Dados
Os dados foram coletados de dois países: França e Holanda, escolhidos por causa dos registros acessíveis e da diversidade nas práticas agrícolas. Garantimos que os dados das parcelas de várias safras fossem harmonizados pra permitir comparações precisas.
Estrutura do Conjunto de Dados
O conjunto de dados inclui:
- Rótulos de tipos de culturas para cada parcela.
- Dados de séries temporais de sensoriamento remoto oferecendo insights sobre índice de área foliar (LAI) e fração de radiação fotossinteticamente ativa absorvida (FAPAR).
- Dados Históricos sobre quais culturas foram plantadas nos anos anteriores.
Esse conjunto de dados rico oferece ótimas oportunidades pra construir modelos que podem prever os tipos de culturas com mais precisão.
Avaliando e Comparando Modelos
O desempenho do nosso método foi comparado com abordagens existentes usando vários critérios de avaliação, como precisão, recall e pontuações F1. Nossos resultados mostraram que integrar vários tipos de dados levou a uma precisão maior comparado aos métodos tradicionais de um único dado.
Classificação no Início da Safra
Um aspecto significativo da nossa pesquisa é o aprimoramento da classificação no início da safra. Implementamos uma técnica de aumento de dados que permite ao modelo fazer previsões com base em dados parciais, ajudando a classificar culturas mesmo antes do fim da safra.
Adaptação entre Países
Também analisamos quão bem nosso modelo poderia transferir conhecimento entre países. Essa análise entre domínios mostrou que modelos treinados em um país poderiam ser ajustados eficazmente pra funcionar bem em outro, destacando a robustez do nosso método.
Enfrentando Desafios na Classificação de Culturas
O campo da classificação de culturas enfrenta vários desafios, incluindo:
Variabilidade dos Dados: Regiões diferentes têm práticas agrícolas diferentes, complicando a criação de modelos que funcionam pra todo mundo.
Informação Insuficiente: Muitos modelos existentes dependem muito de dados específicos, ignorando a complexidade dos sistemas agrícolas.
Dinâmicas Sazonais: A maneira como as culturas mudam ao longo do tempo precisa ser representada com precisão nos modelos pra garantir eficácia.
Nosso método enfrenta esses desafios usando uma ampla gama de tipos de dados e uma estrutura de modelo mais sofisticada que captura a complexidade das dinâmicas agrícolas.
Direções Futuras
Olhando pra frente, há vários caminhos pro futuro da pesquisa:
Expandindo Conjuntos de Dados: Adicionar mais países e regiões pode melhorar a precisão e generalização do modelo.
Aprimorando Modelos: Testar diferentes arquiteturas e configurações pode aumentar ainda mais o desempenho.
Incorporando Dados Meteorológicos: Incluir dados meteorológicos pode fornecer insights adicionais sobre como o clima afeta o crescimento e a classificação das culturas.
Desenvolvendo Modelos Regionais: Focar em áreas específicas pode ajudar a criar modelos mais ajustados às práticas agrícolas locais.
Usando Técnicas Avançadas: Implementar métodos como meta-aprendizagem pode melhorar a classificação com poucos exemplos e enfrentar desafios nas variações sazonais.
Em resumo, nosso estudo apresenta um novo método pra classificar culturas aproveitando diversas fontes de dados e técnicas avançadas de modelagem. Ao combinar com sucesso sensoriamento remoto, dados de rotação de culturas e distribuições locais, estabelecemos as bases pra um monitoramento agrícola mais preciso e eficiente. Nossas descobertas contribuem significativamente pro campo da gestão agrícola e têm potencial pra melhorar avaliações de segurança alimentar.
Título: Boosting Crop Classification by Hierarchically Fusing Satellite, Rotational, and Contextual Data
Resumo: Accurate in-season crop type classification is crucial for the crop production estimation and monitoring of agricultural parcels. However, the complexity of the plant growth patterns and their spatio-temporal variability present significant challenges. While current deep learning-based methods show promise in crop type classification from single- and multi-modal time series, most existing methods rely on a single modality, such as satellite optical remote sensing data or crop rotation patterns. We propose a novel approach to fuse multimodal information into a model for improved accuracy and robustness across multiple years and countries. The approach relies on three modalities used: remote sensing time series from Sentinel-2 and Landsat 8 observations, parcel crop rotation and local crop distribution. To evaluate our approach, we release a new annotated dataset of 7.4 million agricultural parcels in France and Netherlands. We associate each parcel with time-series of surface reflectance (Red and NIR) and biophysical variables (LAI, FAPAR). Additionally, we propose a new approach to automatically aggregate crop types into a hierarchical class structure for meaningful model evaluation and a novel data-augmentation technique for early-season classification. Performance of the multimodal approach was assessed at different aggregation level in the semantic domain spanning from 151 to 8 crop types or groups. It resulted in accuracy ranging from 91\% to 95\% for NL dataset and from 85\% to 89\% for FR dataset. Pre-training on a dataset improves domain adaptation between countries, allowing for cross-domain zero-shot learning, and robustness of the performances in a few-shot setting from France to Netherlands. Our proposed approach outperforms comparable methods by enabling learning methods to use the often overlooked spatio-temporal context of parcels, resulting in increased preci...
Autores: Valentin Barriere, Martin Claverie, Maja Schneider, Guido Lemoine, Raphaël d'Andrimont
Última atualização: 2023-11-07 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2305.12011
Fonte PDF: https://arxiv.org/pdf/2305.12011
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.latex-project.org/lppl.txt
- https://lenova.river-valley.com/svn/elsbst/trunk/elsarticle-template-1-num.tex
- https://www.overleaf.com/project/5ba8be9aff461425affd515fl
- https://github.com/maja601/EuroCrops
- https://eur-lex.europa.eu/eli/reg_impl/2023/138
- https://jeodpp.jrc.ec.europa.eu/ftp/jrc-opendata/DRLL/CropDeepTrans/data/sankey_All_crops.html
- https://github.com/WFP-VAM/vam.whittaker
- https://jeodpp.jrc.ec.europa.eu/bdap/
- https://jeodpp.jrc.ec.europa.eu/ftp/jrc-opendata/DRLL/CropDeepTrans/