Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Biologia vegetal

Avanços na Previsão de Características de Macieiras Através da Seleção Genômica

Cientistas melhoram o cultivo de maçãs prevendo características usando dados genéticos e ambientais.

― 8 min ler


Seleção Genômica naSeleção Genômica naCriação de Maçãscom insights genômicos e ambientais.Aprimorando as características da maçã
Índice

Nos últimos anos, os cientistas têm trabalhado para melhorar o melhoramento de plantas e criar colheitas melhores. Um método importante para isso é a Seleção Genômica, que analisa os genes das plantas para ajudar a prever suas características. Esse processo se tornou muito importante em programas de melhoramento de cultivos porque pode ajudar os agricultores a cultivar plantas mais saudáveis e produtivas.

Este artigo vai focar em como os cientistas estão tentando prever características importantes em macieiras usando seleção genômica. Vai explicar como a seleção genômica funciona, os desafios enfrentados nesse campo e quais avanços recentes foram feitos para tornar essas previsões mais precisas.

O que é Seleção Genômica?

A seleção genômica é um processo que usa dados genéticos para prever quais plantas são melhores para o melhoramento. Ela analisa muitos marcadores no DNA de uma planta para estimar como ela vai se sair em termos de produtividade, resistência a doenças e outras características importantes. Usando essas informações, os melhoristas podem escolher as melhores plantas para cruzar, levando a variedades melhores.

A Importância dos Efeitos dos Marcadores

Para prever como uma planta vai crescer, os pesquisadores geralmente olham os efeitos de diferentes marcadores genéticos. Esses marcadores são locais específicos no DNA que podem influenciar características. Um método popular para analisar esses marcadores é o G-BLUP, que estima os efeitos de cada marcador no desempenho da planta. Esse método é usado para fazer previsões em diferentes condições de cultivo e Ambientes.

O Papel do Ambiente nas Previsões de Características

As plantas não crescem isoladas; elas são afetadas pelo ambiente. Isso significa que o ambiente, como condições climáticas e qualidade do solo, pode influenciar o desempenho de uma planta. Entender como as plantas interagem com seu ambiente é fundamental para fazer previsões melhores sobre suas características.

Em maçãs, por exemplo, os pesquisadores descobriram que o comportamento de uma planta pode mudar dependendo do ambiente. Um estudo mostrou que incluir essas interações com o ambiente no processo de previsão pode melhorar significativamente a precisão na previsão das características de uma planta.

Os Desafios dos Dados de Múltiplos Ambientes

Construir conjuntos de dados que incluam informações de diferentes ambientes é crucial. No entanto, isso pode ser difícil e caro. Coletar dados precisos de múltiplos locais durante vários anos exige muito tempo e esforço. Essa é uma das razões pelas quais os pesquisadores têm sido lentos em usar modelos avançados de previsão genômica.

Mas os avanços recentes em softwares e métodos computacionais tornaram mais fácil analisar esses grandes conjuntos de dados. Alguns novos programas conseguem analisar dados genéticos muito mais rápido do que os métodos antigos. Essa velocidade ajuda os pesquisadores a obter insights de forma mais rápida e eficiente.

Comparações Empíricas de Modelos de Previsão

Diferentes pacotes de software foram comparados para ver quais funcionam melhor para previsões genômicas. Uma comparação revelou que softwares mais novos podem fazer previsões até cinco vezes mais rápidas, mantendo níveis de precisão semelhantes aos métodos antigos. Isso destaca os benefícios de usar técnicas avançadas no melhoramento de plantas.

Incorporando Fatores Não Genéticos

Embora olhar para marcadores genéticos seja importante, também é crucial considerar fatores que não são genéticos. Dados sobre atributos ambientais ou marcadores não genéticos podem melhorar as previsões. Essas informações ajudam a fornecer uma visão mais completa de como as plantas podem se comportar em diferentes condições.

Ao combinar dados genéticos com dados ambientais, os pesquisadores podem entender melhor a complexa relação entre os genes de uma planta e seu ambiente. Além de melhorar a capacidade preditiva, essa abordagem permite uma melhor compreensão de como as plantas crescem em diferentes cenários.

Abordagens de Aprendizado Profundo

Recentemente, os pesquisadores começaram a explorar o aprendizado profundo como um novo método para previsões genômicas. O aprendizado profundo é um tipo de aprendizado de máquina que usa redes neurais artificiais para analisar dados de várias fontes.

Enquanto alguns estudos sugerem que o aprendizado profundo pode não ser melhor que métodos tradicionais para todas as características, ele oferece uma maneira de combinar diferentes tipos de dados. Isso o torna uma ferramenta promissora no campo da genômica. No entanto, quando os conjuntos de dados são muito grandes, a complexidade pode levar a desafios como o overfitting.

Objetivos da Pesquisa

Este estudo teve como objetivo comparar modelos estatísticos tradicionais que incluem efeitos genéticos e ambientais contra uma abordagem de aprendizado profundo para prever características das maçãs. Focou em estudar onze características ao longo de vários anos e em diferentes locais para avaliar a eficácia de diferentes modelos de previsão.

Os três principais objetivos foram comparar como diferentes componentes dos modelos contribuem para as previsões, avaliar o desempenho desses modelos e avaliar o tempo necessário para treinar e fazer previsões com cada modelo.

Coleta de Dados

Os dados usados neste estudo vieram de várias anos de observações sobre diferentes características das maçãs em vários ambientes. Alguns dados foram excluídos devido à baixa confiabilidade, garantindo que a análise incluísse apenas informações de alta qualidade.

Para os dados climáticos, temperatura, umidade e luz solar foram medidos ao longo dos anos para ver como esses fatores influenciaram o crescimento e a qualidade geral das maçãs. Dados sobre o solo também foram coletados para entender como as condições do solo poderiam afetar as características das macieiras.

Matrizes de Relação

Para analisar as informações genéticas, foram criadas matrizes de relação com base em diferentes marcadores genéticos. Essas matrizes ajudam a estimar quão próximas estão diferentes variedades de maçãs, o que pode fornecer insights sobre sua composição genética e desempenho potencial.

Para a análise, diferentes tipos de matrizes foram criadas para investigar os efeitos dos marcadores, efeitos aditivos, efeitos de dominância e a influência de fatores ambientais.

Variância Explicada por Diferentes Efeitos

Os pesquisadores usaram modelos estatísticos para entender quanto do desempenho de uma planta pode ser atribuído a fatores genéticos e suas interações com condições ambientais. Essa análise revelou que os efeitos genéticos poderiam explicar uma parte significativa da variância, com algumas características mostrando até contribuições maiores das interações ambientais.

Capacidade Preditiva de Diferentes Modelos

A eficácia de cada modelo foi avaliada usando validação cruzada, com os pesquisadores examinando quão bem cada modelo previu os resultados das características no conjunto de dados. Descobriu-se que modelos que incorporavam tanto efeitos genéticos quanto ambientais frequentemente se saíram melhor do que aqueles que focaram apenas em fatores genéticos.

Os modelos que usaram ambos os tipos de informações forneceram uma imagem mais precisa para muitas características e foram particularmente fortes na previsão de características complexas influenciadas por múltiplos fatores.

Eficiência do Modelo

Ao comparar os diferentes modelos, o tempo necessário para gerar previsões variou bastante. Modelos mais simples levaram menos tempo para calcular, enquanto modelos mais complexos exigiram períodos significativamente mais longos. Em média, os modelos de aprendizado profundo se saíram melhor do que os métodos tradicionais para algumas características, mas enfrentaram desafios com tempos de computação mais longos.

Em contraste, modelos estatísticos mais simples baseados em G-BLUP foram considerados mais rápidos. No entanto, a troca entre velocidade e capacidade preditiva teve que ser considerada ao escolher um modelo.

Conclusão

Este estudo destaca as complexidades de prever características de macieiras usando informações genômicas. Enfatiza a necessidade de uma abordagem integrada que combine dados genéticos com fatores ambientais.

Além disso, os avanços em métodos computacionais podem levar a previsões mais eficientes e eficazes no melhoramento de plantas. A capacidade de prever características com precisão é crucial para desenvolver variedades de maçãs que possam se adaptar a condições em mudança e melhorar a sustentabilidade agrícola.

Os pesquisadores agora têm várias ferramentas à disposição, desde modelos estatísticos tradicionais até abordagens avançadas de aprendizado profundo. Ao refinar ainda mais esses métodos, os cientistas podem ajudar os agricultores a escolher os melhores cultivares de maçã, abrindo caminho para colheitas mais fortes e resilientes no futuro.

Fonte original

Título: Integrative multi-environmental genomic prediction in apple

Resumo: Genomic prediction for multiple environments can aid the selection of genotypes suited to specific soil and climate conditions. Methodological advances allow effective integration of phenotypic, genomic (additive, non-additive), and large-scale environmental (enviromic) data into multi-environmental genomic prediction models. These models can also account for genotype-by-environment interaction, utilize alternative relationship matrices (kernels), or substitute statistical approaches with deep learning. However, the application of multi-environmental genomic prediction in apple remained limited, likely due to the challenge of building multi-environmental datasets and structurally complex models. Here, we applied efficient statistical and deep learning models for multi-environmental genomic prediction of eleven apple traits with contrasting genetic architectures by integrating genomic- and enviromic-based model components. Incorporating genotype-by-environment interaction effects into statistical models improved predictive ability by up to 0.08 for nine traits compared to the benchmark model. This outcome, based on Gaussian and Deep kernels, shows these alternatives can effectively substitute the standard G-BLUP. Including non-additive effects slightly improved predictive ability by up to 0.03 for two traits, but enviromic-based effects resulted in no improvement. The deep learning approach achieved the highest predictive ability for three traits with simpler genetic architectures, outperforming the benchmark by up to 0.10. Our results demonstrate that the tested statistical models capture genotype-by-environment interactions particularly well, and the deep learning models efficiently integrate data from diverse sources. This study will foster the adoption of multi-environmental genomic prediction to select apple cultivars adapted to diverse environmental conditions, providing an opportunity to address climate change impacts.

Autores: Michaela Jung, C. Quesada-Traver, M. Roth, M. J. Aranzana, H. Muranty, M. Rymenants, W. Guerra, E. Holzknecht, N. Pradas, L. Lozano, F. Didelot, F. Laurens, S. Yates, B. Studer, G. A. Broggini, A. Patocchi

Última atualização: 2024-06-22 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.06.20.599822

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.06.20.599822.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes