Avancées dans la prévision des caractéristiques des pommiers grâce à la sélection génomique
Des scientifiques améliorent la culture des pommes en prédisant les caractéristiques grâce aux données génétiques et environnementales.
― 9 min lire
Table des matières
- Qu'est-ce que la sélection génomique ?
- L'importance des effets des marqueurs
- Le rôle de l'environnement dans les prédictions de traits
- Les défis des données multi-environnementales
- Comparaisons empiriques des modèles de prédiction
- Incorporer des facteurs non-génétiques
- Approches d'Apprentissage profond
- Objectifs de recherche
- Collecte de données
- Matrices de relation
- Variance expliquée par différents effets
- Capacité prédictive de différents modèles
- Efficacité des modèles
- Conclusion
- Source originale
- Liens de référence
Ces dernières années, les scientifiques bossent sur l'amélioration de la reproduction des plantes pour créer de meilleures cultures. Un des trucs importants pour ça, c'est la Sélection génomique, qui regarde les gènes des plantes pour aider à prédire leurs caractéristiques. Ce processus est devenu super important dans les programmes de reproduction des cultures car il peut aider les agriculteurs à cultiver des plantes plus saines et plus productives.
Cet article va se concentrer sur comment les scientifiques essaient de prédire des traits importants chez les pommiers en utilisant la sélection génomique. Il va expliquer comment ça fonctionne, les défis rencontrés dans ce domaine et les avancées récentes pour rendre ces prédictions plus précises.
Qu'est-ce que la sélection génomique ?
La sélection génomique est un processus qui utilise des données génétiques pour prédire les meilleures plantes pour la reproduction. Ça regarde plein de marqueurs dans l'ADN d'une plante pour estimer comment elle va performer en termes de rendement, de résistance aux maladies et d'autres traits importants. En utilisant ces infos, les éleveurs peuvent choisir les meilleures plantes à croiser, ce qui mène finalement à de meilleures variétés.
L'importance des effets des marqueurs
Pour prédire comment une plante va pousser, les chercheurs regardent souvent les effets de différents marqueurs génétiques. Ces marqueurs sont des endroits spécifiques dans l'ADN qui peuvent influencer les caractéristiques. Une méthode populaire pour analyser ces marqueurs s'appelle G-BLUP, qui estime les effets de chaque marqueur sur la performance de la plante. Cette méthode est utilisée pour faire des prédictions dans différents conditions de culture et Environnements.
Le rôle de l'environnement dans les prédictions de traits
Les plantes ne poussent pas dans le vide ; elles sont influencées par leur environnement. Ça veut dire que des facteurs comme le temps et la qualité du sol peuvent influencer comment une plante performe. Comprendre comment les plantes interagissent avec leur environnement est crucial pour faire de meilleures prédictions sur leurs traits.
Par exemple, pour les pommes, des chercheurs ont découvert que le comportement d'une plante peut changer selon l'environnement. Une étude a montré que prendre en compte ces interactions environnementales dans le processus de prédiction peut grandement améliorer la précision des prédictions des traits d'une plante.
Les défis des données multi-environnementales
Construire des ensembles de données qui incluent des infos de différents environnements est crucial. Cependant, c'est pas toujours facile et ça peut coûter cher. Collecter des données fiables de plusieurs endroits sur plusieurs années demande beaucoup de temps et d'effort. C'est une des raisons pour lesquelles les chercheurs ont mis du temps à utiliser des modèles de prédiction génomique avancés.
Mais les récentes avancées en logiciels et méthodes informatiques ont rendu plus facile l'analyse de ces grands ensembles de données. Certains nouveaux programmes peuvent analyser des données génétiques beaucoup plus rapidement que les anciennes méthodes. Cette rapidité aide les chercheurs à obtenir des infos plus rapidement et efficacement.
Comparaisons empiriques des modèles de prédiction
Différents logiciels ont été comparés pour voir lesquels fonctionnent le mieux pour les prédictions génomiques. Une comparaison a montré que les nouveaux logiciels pouvaient faire des prédictions jusqu'à cinq fois plus rapidement tout en maintenant des niveaux de précision similaires aux anciennes méthodes. Ça met en évidence les avantages d'utiliser des techniques avancées dans la reproduction des plantes.
Incorporer des facteurs non-génétiques
Bien qu'il soit important de regarder les marqueurs génétiques, c'est aussi crucial de considérer des facteurs qui ne sont pas génétiques. Les données sur les attributs environnementaux ou les marqueurs non-génétiques peuvent améliorer les prédictions. Ces infos aident à fournir une image plus complète de comment les plantes pourraient performer dans différentes conditions.
En combinant des données génétiques avec des données environnementales, les chercheurs peuvent mieux comprendre la relation complexe entre les gènes d'une plante et son environnement. En plus d'améliorer la capacité prédictive, cette approche permet de mieux comprendre comment les plantes poussent dans divers contextes.
Apprentissage profond
Approches d'Récemment, les chercheurs ont commencé à explorer l'apprentissage profond comme une nouvelle méthode pour les prédictions génomiques. L'apprentissage profond est un type d'apprentissage machine qui utilise des réseaux de neurones artificiels pour analyser des données de diverses sources.
Bien que certaines études suggèrent que l'apprentissage profond ne soit pas meilleur que les méthodes traditionnelles pour tous les traits, ça offre une façon de combiner différents types de données. Ça en fait un outil prometteur dans le domaine de la génomique. Cependant, quand les ensembles de données sont trop grands, la complexité peut poser des défis comme le surajustement.
Objectifs de recherche
Cette étude avait pour but de comparer des modèles statistiques traditionnels qui incluent à la fois des effets génétiques et environnementaux par rapport à une approche d'apprentissage profond pour prédire les traits des pommes. Elle s'est concentrée sur l'étude de onze traits sur plusieurs années et divers endroits pour évaluer l'efficacité des différents modèles de prédiction.
Les trois principaux objectifs étaient de comparer comment différentes composantes des modèles contribuent aux prédictions, d'évaluer comment ces modèles performaient et de voir combien de temps il faut pour entraîner et faire des prédictions avec chaque modèle.
Collecte de données
Les données utilisées dans cette étude venaient de plusieurs années d'observations sur divers traits des pommes dans différents environnements. Certains points de données ont été exclus à cause de leur faible fiabilité, s'assurant que l'analyse ne comprenait que des informations de haute qualité.
Pour les données météorologiques, température, humidité et ensoleillement ont été mesurés au fil des ans pour voir comment ces facteurs influençaient la croissance et la qualité des pommes. Des données sur le sol ont aussi été collectées pour comprendre comment les conditions du sol pouvaient affecter les traits des pommiers.
Matrices de relation
Pour analyser les informations génétiques, des matrices de relation ont été créées sur la base de différents marqueurs génétiques. Ces matrices aident à estimer à quel point différentes variétés de pommes sont étroitement liées, ce qui peut donner des aperçus sur leur composition génétique et leur performance potentielle.
Pour l'analyse, différents types de matrices ont été créés pour étudier les effets des marqueurs, les effets additifs, les effets de dominance, et l'influence des facteurs environnementaux.
Variance expliquée par différents effets
Les chercheurs ont utilisé des modèles statistiques pour comprendre combien de la performance d'une plante peut être attribuée à des facteurs génétiques et à leurs interactions avec les conditions environnementales. Cette analyse a révélé que les effets génétiques pouvaient expliquer une part significative de la variance, avec certains traits montrant même des contributions plus élevées des interactions environnementales.
Capacité prédictive de différents modèles
L'efficacité de chaque modèle a été évaluée en utilisant la validation croisée, avec les chercheurs examinant à quel point chaque modèle prédisait les résultats des traits dans l'ensemble de données. Ils ont découvert que les modèles intégrant à la fois les effets génétiques et environnementaux performaient souvent mieux que ceux se concentrant uniquement sur les facteurs génétiques.
Les modèles qui utilisaient les deux types d'informations ont fourni une image plus précise pour de nombreux traits et étaient particulièrement efficaces pour prédire des traits complexes influencés par plusieurs facteurs.
Efficacité des modèles
En comparant les différents modèles, le temps nécessaire pour générer des prédictions variait énormément. Les modèles simples prenaient moins de temps à calculer, tandis que les modèles plus complexes exigeaient des périodes beaucoup plus longues. En moyenne, les modèles d'apprentissage profond ont mieux performé que les méthodes traditionnelles pour certains traits mais ont fait face à des défis avec des temps de calcul plus longs.
En revanche, des modèles statistiques plus simples basés sur G-BLUP se sont révélés plus rapides. Cependant, le compromis entre la rapidité et la capacité prédictive devait être pris en compte lors du choix d'un modèle.
Conclusion
Cette étude met en lumière les complexités de la prédiction des traits pour les pommiers en utilisant des informations génomiques. Elle souligne la nécessité d'une approche intégrée qui combine des données génétiques avec des facteurs environnementaux.
De plus, les avancées dans les méthodes informatiques pourraient conduire à des prédictions plus efficaces et précises dans la reproduction des plantes. La capacité à prédire avec précision les traits est cruciale pour développer des variétés de pommes capables de s'adapter aux conditions changeantes et d'améliorer la durabilité agricole.
Les chercheurs disposent maintenant de divers outils, des modèles statistiques traditionnels aux approches avancées d'apprentissage profond. En affinant encore ces méthodes, les scientifiques peuvent aider les agriculteurs à sélectionner les meilleures variétés de pommes, ouvrant la voie à des cultures plus fortes et plus résilientes à l'avenir.
Titre: Integrative multi-environmental genomic prediction in apple
Résumé: Genomic prediction for multiple environments can aid the selection of genotypes suited to specific soil and climate conditions. Methodological advances allow effective integration of phenotypic, genomic (additive, non-additive), and large-scale environmental (enviromic) data into multi-environmental genomic prediction models. These models can also account for genotype-by-environment interaction, utilize alternative relationship matrices (kernels), or substitute statistical approaches with deep learning. However, the application of multi-environmental genomic prediction in apple remained limited, likely due to the challenge of building multi-environmental datasets and structurally complex models. Here, we applied efficient statistical and deep learning models for multi-environmental genomic prediction of eleven apple traits with contrasting genetic architectures by integrating genomic- and enviromic-based model components. Incorporating genotype-by-environment interaction effects into statistical models improved predictive ability by up to 0.08 for nine traits compared to the benchmark model. This outcome, based on Gaussian and Deep kernels, shows these alternatives can effectively substitute the standard G-BLUP. Including non-additive effects slightly improved predictive ability by up to 0.03 for two traits, but enviromic-based effects resulted in no improvement. The deep learning approach achieved the highest predictive ability for three traits with simpler genetic architectures, outperforming the benchmark by up to 0.10. Our results demonstrate that the tested statistical models capture genotype-by-environment interactions particularly well, and the deep learning models efficiently integrate data from diverse sources. This study will foster the adoption of multi-environmental genomic prediction to select apple cultivars adapted to diverse environmental conditions, providing an opportunity to address climate change impacts.
Auteurs: Michaela Jung, C. Quesada-Traver, M. Roth, M. J. Aranzana, H. Muranty, M. Rymenants, W. Guerra, E. Holzknecht, N. Pradas, L. Lozano, F. Didelot, F. Laurens, S. Yates, B. Studer, G. A. Broggini, A. Patocchi
Dernière mise à jour: 2024-06-22 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.06.20.599822
Source PDF: https://www.biorxiv.org/content/10.1101/2024.06.20.599822.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.