Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Ecologia

Entendendo a Distribuição de Espécies Marinhas Usando Aprendizado de Máquina

Este estudo usa aprendizado profundo pra mapear a distribuição de espécies marinhas pra conservação.

― 10 min ler


Aprendizado Profundo naAprendizado Profundo naConservação Marinhaas espécies do oceano.Usando modelos avançados pra proteger
Índice

O oceano é uma parte gigantesca do nosso planeta, cobrindo mais de 70% da sua superfície. Apesar do seu tamanho, a gente ainda não entende muito bem. O oceano tem um papel fundamental em manter o clima da Terra estável e ajuda em ciclos que fornecem nutrientes importantes e capturam carbono. Por isso, a saúde do oceano é super crítica para todos os seres vivos.

Infelizmente, o oceano enfrenta muitos desafios por causa das atividades humanas. Problemas como a pesca excessiva, poluição e mudanças climáticas oferecem riscos sérios para a vida marinha. Esses desafios não só prejudicam as Espécies Marinhas, mas também impactam milhões de pessoas que dependem do oceano para se alimentar e trabalhar.

Pra lidar com esses desafios, a gente precisa primeiro saber onde as diferentes espécies vivem no oceano. Entender a distribuição da vida marinha ajuda a ver quais áreas estão ameaçadas. Esse conhecimento é essencial para criar planos de conservação eficazes pra proteger esses ecossistemas vitais.

As mudanças climáticas já estão alterando as condições no oceano, como aumento das temperaturas e mudanças nos níveis de acidez. Portanto, é urgente conectar essas mudanças à forma como as espécies estão distribuídas. Essas informações ajudam a guiar decisões pra garantir a saúde a longo prazo dos ecossistemas marinhos.

Métodos Atuais de Compreensão da Distribuição das Espécies

Existem vários métodos pra prever onde as espécies marinhas podem ser encontradas. Uma técnica comum se chama Modelos de Distribuição de Espécies (SDMs). Esses modelos focam nas Condições Ambientais que sustentam espécies específicas ao longo do tempo, moldadas pela forma como elas se adaptam ao ambiente.

Normalmente, os SDMs dependem de dados resumidos sobre o clima e as condições ambientais encontradas em pontos específicos onde as espécies são observadas. Porém, essa abordagem muitas vezes ignora a paisagem ambiental mais ampla, como a presença de características subaquáticas, como vales ou correntes. Essas características são cruciais pra entender por que algumas espécies prosperam em certas áreas e não em outras.

Uma forma de melhorar esses modelos é incluir mais dados ambientais ao mapear a existência das espécies. No entanto, mais dados geralmente significam mais complexidade, tornando difícil garantir que o modelo continue preciso. Uma solução possível é olhar os dados todos de uma vez, de um jeito que resuma as informações relevantes em menos variáveis chave.

Outra abordagem é considerar dados em tempo real quando as espécies são avistadas, em vez de fazer uma média dos dados ao longo do tempo. Esse método reconhece que as espécies se comportam de forma diferente em ambientes dinâmicos. Consequentemente, isso pode melhorar as previsões sobre onde as espécies podem ser encontradas, especialmente para aquelas que são altamente móveis ou têm mudanças populacionais rápidas.

O Potencial do Aprendizado Profundo na Modelagem de Distribuição

O aprendizado profundo, especialmente através de um método chamado Redes Neurais Convolucionais (CNNs), é útil pra analisar imagens, e também pode ser aplicado a dados ambientais. As CNNs são boas em identificar detalhes importantes em conjuntos de dados complexos. À medida que o modelo treina, ele identifica padrões simples e avança pra formas mais complexas.

Quando aplicadas a dados ambientais, as CNNs podem identificar diferentes níveis de detalhe. Por exemplo, elas conseguem encontrar valores precisos em pontos específicos, observar padrões em pontos próximos e até reconhecer grandes características, como baías ou cânions subaquáticos.

Embora outros estudos tenham usado com sucesso CNNs pra analisar plantas em terra, as condições dinâmicas do oceano apresentam um desafio diferente. A riqueza de dados do oceano, incluindo temperaturas da superfície do mar e níveis de clorofila, pode fornecer insights valiosos sobre como as espécies marinhas são afetadas pelas mudanças ambientais.

Objetivos do Estudo

Neste estudo, o objetivo é investigar como métodos de aprendizado profundo podem melhorar nossa compreensão das distribuições de espécies no oceano aberto. Vamos examinar os tipos de dados coletados, apresentar os resultados obtidos e destacar quaisquer limitações ou desafios enfrentados durante essa pesquisa.

O método envolve vincular dados de presença de espécies a fatores ambientais usando dados do Global Biodiversity Information Facility (GBIF). Isso envolve considerar as condições ao redor de cada avistamento e gerar probabilidades de observar diferentes espécies com base em vários fatores ambientais.

Coletando Dados sobre Espécies Marinhas

Para este estudo, selecionamos um total de trinta e oito espécies marinhas. Esse grupo inclui peixes grandes, elasmobrânquios (tubarões e raias), tartarugas, mamíferos marinhos e algumas aves. Escolhemos esses táxons com base na disponibilidade de dados de ocorrência e buscamos variedade pra garantir que nosso modelo pudesse ser testado de forma completa.

Os dados de ocorrência foram obtidos do GBIF, um banco de dados que fornece registros de ocorrência de espécies acessíveis gratuitamente. Embora alguns erros nos dados sejam esperados, o volume total de dados ajuda a gerenciar essas imprecisões. Para táxons com registros extensos de ocorrência, selecionamos uma amostra aleatória para trabalhar.

No total, nossos esforços resultaram em mais de 300.000 ocorrências para analisar.

Dados Ambientais Usados para Análise

Dezoito variáveis ambientais diferentes foram incluídas no nosso estudo. Algumas dessas variáveis foram derivadas de observações por satélite, enquanto outras foram geradas por modelos. Fatores chave incluíram temperatura do mar, níveis de clorofila, força do vento e correntes.

Também levamos em conta como as espécies podem responder a certas variáveis ao longo de diferentes períodos de tempo, adicionando complexidade à nossa análise. Essa abordagem abrangente resultou em um total de vinte e nove camadas de dados ambientais, contribuindo com um contexto valioso pra entender as distribuições das espécies.

Preparando os Dados

Os dados ambientais foram coletados ao redor de cada ocorrência de espécie usando uma área geográfica específica. Nosso objetivo era capturar dados relevantes perto de onde as espécies foram observadas. Após coletar esses dados, ajustamos tudo pra garantir consistência na forma como foram interpretados, permitindo que se encaixassem efetivamente no nosso modelo.

Cada camada ambiental foi processada pra garantir que correspondesse às outras em termos de tamanho e escala. Essa consistência é crucial para modelos de aprendizado profundo, que requerem dados padronizados para o treinamento.

Construindo e Treinando o Modelo

O modelo usado para este estudo foi construído usando uma estrutura de rede neural convolucional projetada para análise de distribuição de espécies. Incorporamos nossos dados ambientais e configuramos o modelo pra prever as probabilidades de observar diferentes espécies com base nas camadas de entrada fornecidas.

O treinamento envolveu duas fases principais pra ajustar a taxa de aprendizado e melhorar a precisão. Usamos uma função de perda pra avaliar o desempenho enquanto consideramos as diferenças nos relatórios de ocorrência das espécies. Essa abordagem permite que a gente estime as probabilidades de presença das espécies de forma mais precisa.

Avaliando o Desempenho do Modelo

Como parte da nossa avaliação, dividimos os dados em diferentes conjuntos: treinamento, validação e teste. O conjunto de validação ajudou a refinar o modelo durante o treinamento, enquanto o conjunto de teste forneceu uma avaliação final de quão bem o modelo se saiu em dados não vistos.

Pra medir os benefícios do nosso método, comparamos ele com um modelo mais simples que usava apenas valores centrais dos dados ambientais. Essa análise destacou as vantagens de incluir dados espaciais nas nossas previsões, levando a uma precisão melhorada.

Gerando Mapas de Distribuição

Uma vez que o modelo foi treinado, aplicamos ele a novos dados pra criar mapas de distribuição. Esses mapas mostram as probabilidades previstas para cada espécie marinha em locais e datas específicos, permitindo uma representação visual das distribuições das espécies em diferentes áreas oceânicas.

Geramos um mapa de distribuição global das espécies em quatro datas-chave de 2021. Além disso, criamos mapas regionais pra uma área específica no Oceano Índico Sul-Oeste, fornecendo uma visão detalhada da presença das espécies ao longo do tempo.

Analisando Influências das Variáveis

Pra entender quais fatores ambientais mais afetaram as distribuições das espécies, realizamos uma análise adicional sobre o desempenho do modelo. Avaliamos a importância das variáveis de entrada e determinamos como elas influenciaram as previsões.

Nossos achados indicaram que variáveis chave, como temperatura da superfície do mar, impactaram fortemente as distribuições das espécies. A análise também revelou uma variação considerável na importância entre os diferentes táxons, destacando a complexidade dos ecossistemas marinhos.

O Papel dos Modelos Dinâmicos na Conservação

Modelos dinâmicos, como o desenvolvido neste estudo, oferecem um jeito de estimar como as espécies estão distribuídas em diferentes tempos e áreas. Eles permitem ajustes com base nas condições cambiantes do oceano, oferecendo uma abordagem adaptável pra entender a vida marinha.

Esse método pode ser particularmente benéfico pra pesquisadores que estudam espécies ameaçadas. Usando tecnologia que incorpora dados ambientais, os cientistas podem gerar previsões mais precisas sobre onde essas espécies podem ser encontradas e adaptar estratégias de conservação de acordo.

Direções de Pesquisa Futuras

Há um potencial significativo pra aprimorar ainda mais esse método, além de muitas oportunidades pra futuras pesquisas. Um aspecto envolve coletar dados de ocorrência melhores, focando em uma gama mais diversificada de fontes. Maior atenção a técnicas de amostragem diferentes pode ajudar a reduzir os vieses nos dados.

Os pesquisadores também podem considerar incorporar variáveis ambientais adicionais em modelos futuros. Dados mais abrangentes sobre as condições do oceano, como correntes e profundidades, poderiam render insights mais ricos sobre como as espécies interagem com seu ambiente.

Diferentes técnicas de modelagem podem ser exploradas pra avaliar outras espécies ou regiões específicas. Ampliar o escopo do estudo poderia levar a descobertas valiosas que aumentem nossa compreensão dos ecossistemas oceânicos.

Por fim, é essencial colher opiniões de especialistas em biologia marinha pra melhorar esses modelos. As suas percepções vão ajudar a refinar previsões e descobrir novos aspectos das relações entre espécies marinhas e seus ambientes.

Conclusão

O oceano é uma parte vital do nosso planeta, mas enfrenta muitos desafios. Entender como as espécies marinhas estão distribuídas no oceano é crucial pra esforços de conservação eficazes. Usando métodos avançados como o aprendizado profundo, os cientistas podem ter uma visão melhor das complexas relações entre espécies e o ambiente oceânico em mudança.

A pesquisa contínua nesta área tem o potencial de trazer benefícios significativos para a conservação marinha. Ao equipar os pesquisadores com ferramentas e dados sofisticados, podemos esperar melhorar as estratégias de gerenciamento que protejam a vida oceânica e sustentem os ecossistemas que a suportam.

Fonte original

Título: Predicting species distributions in the open ocean with convolutional neural networks.

Resumo: As biodiversity plummets due to anthropogenic disturbances, the conservation of oceanic species is made harder by limited knowledge of their distributions and migrations. Indeed, tracking species distributions in the open ocean is particularly challenging due to the scarcity of observations and the complex and variable nature of the ocean system. In this study, we propose a new method that leverages deep learning, specifically convolutional neural networks (CNNs), to capture spatial features of environmental variables. This novelty eliminates the need to predefine these features before modelling and creates opportunities to discover unexpected correlations. Our aim is to present the results of the first trial of this method in the open ocean, discuss limitations and provide feedback for future improvements or adjustments. In this case study, we considered 38 taxa comprising pelagic fishes, elasmobranchs, marine mammals, marine turtles and birds. We trained a model to predict probabilities from the environmental conditions at any specific point in space and time, using species occurrence data from the Global Biodiversity Information Facility (GBIF) and environmental data from various sources. These variables included sea surface temperature, chlorophyll concentration, salinity and fifteen others. During the testing phase, the model was applied to environmental data at locations where species occurrences were recorded. The classifier accurately predicted the observed taxon as the most likely taxon in 69% of cases and included the observed taxon among the top three most likely predictions in 89% of cases. These findings show the adequacy of deep learning for species distribution modelling in the open ocean. Additionally, this purely correlative model was then analysed with explicability tools to understand which variables had an influence on the models predictions. While variable importance was species-dependent, we identified finite-size Lyapunov exponents (FSLEs), sea surface temperature, pH and salinity as the most influential variables, in that order. These insights can prove valuable for future species-specific ecology studies.

Autores: Gaetan Morand, A. Joly, T. Rouyer, T. Lorieul, J. Barde

Última atualização: 2024-07-08 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2023.08.11.551418

Fonte PDF: https://www.biorxiv.org/content/10.1101/2023.08.11.551418.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes