Progressi nella previsione delle caratteristiche degli alberi di mele tramite selezione genomica
Gli scienziati migliorano la coltivazione delle mele prevedendo le caratteristiche usando dati genetici e ambientali.
― 7 leggere min
Indice
- Cos'è la Selezione Genomica?
- L'Importanza degli Effetti dei Marcatori
- Il Ruolo dell'Ambiente nelle Previsioni dei Tratti
- Le Sfide dei Dati Multi-Ambiente
- Confronti Empirici dei Modelli di Previsione
- Incorporare Fattori Non Genetici
- Approcci di Deep Learning
- Obiettivi della Ricerca
- Raccolta Dati
- Matrici di Relazione
- Varianza Spiegata da Diversi Effetti
- Capacità Predittiva dei Diversi Modelli
- Efficienza del Modello
- Conclusione
- Fonte originale
- Link di riferimento
Negli ultimi anni, gli scienziati hanno lavorato per migliorare la selezione delle piante per creare raccolti migliori. Un metodo importante per questo è la Selezione Genomica, che guarda ai geni delle piante per aiutare a prevedere le loro caratteristiche. Questo processo è diventato molto importante nei programmi di allevamento delle colture perché può aiutare gli agricoltori a coltivare piante più sane e produttive.
Questo articolo si concentrerà su come gli scienziati stanno cercando di prevedere tratti importanti nei meli usando la selezione genomica. Spiegherà come funziona la selezione genomica, le sfide che si affrontano in questo campo e quali recenti progressi sono stati fatti per rendere queste previsioni più accurate.
Cos'è la Selezione Genomica?
La selezione genomica è un processo che usa dati genetici per prevedere le migliori piante per l'allevamento. Guarda a molti marcatori nel DNA di una pianta per stimare quanto bene crescerà in termini di raccolto, resistenza alle malattie e altre caratteristiche importanti. Utilizzando queste informazioni, i selezionatori possono scegliere le migliori piante da incrociare, portando infine a varietà migliori.
L'Importanza degli Effetti dei Marcatori
Per prevedere quanto bene crescerà una pianta, i ricercatori spesso guardano agli effetti di diversi marcatori genetici. Questi marcatori sono posizioni specifiche nel DNA che possono influenzare i tratti. Un metodo popolare per analizzare questi marcatori si chiama G-BLUP, che stima gli effetti di ciascun marcatore sulle prestazioni della pianta. Questo metodo è usato per fare previsioni in diverse condizioni di crescita e Ambienti.
Il Ruolo dell'Ambiente nelle Previsioni dei Tratti
Le piante non crescono in isolamento; sono influenzate dall'ambiente circostante. Questo significa che l'ambiente, come le condizioni meteorologiche e la qualità del suolo, può influenzare quanto bene una pianta cresce. Comprendere come le piante interagiscono con il loro ambiente è fondamentale per fare previsioni migliori sui loro tratti.
Negli alberi di mele, per esempio, i ricercatori hanno scoperto che il comportamento di una pianta può cambiare a seconda dell'ambiente. Uno studio ha trovato che rendere queste interazioni ambientali parte del processo di previsione può migliorare significativamente l'accuratezza delle previsioni sui tratti di una pianta.
Le Sfide dei Dati Multi-Ambiente
Costruire dataset che includono informazioni da diversi ambienti è cruciale. Tuttavia, questo può essere difficile e costoso. Raccogliere dati accurati da più località per diversi anni richiede molto tempo e impegno. Questa è una delle ragioni per cui i ricercatori sono stati lenti nell'usare modelli avanzati di previsione genomica.
Ma recenti progressi nei software e nei metodi computazionali hanno reso più facile analizzare questi grandi dataset. Alcuni nuovi programmi possono analizzare i dati genetici molto più velocemente rispetto ai metodi più vecchi. Questa rapidità aiuta i ricercatori a ottenere intuizioni più rapidamente ed efficientemente.
Confronti Empirici dei Modelli di Previsione
Diversi pacchetti software sono stati confrontati per vedere quali funzionano meglio per le previsioni genomiche. Un confronto ha rivelato che i software più recenti possono fare previsioni fino a cinque volte più velocemente mantenendo comunque livelli di accuratezza simili ai metodi più vecchi. Questo evidenzia i benefici dell'uso di tecniche avanzate nell'allevamento delle piante.
Incorporare Fattori Non Genetici
Sebbene guardare ai marcatori genetici sia importante, è anche cruciale considerare fattori che non sono genetici. I dati sulle caratteristiche ambientali o sui marcatori non genetici possono migliorare le previsioni. Queste informazioni aiutano a fornire un quadro più completo su come potrebbero comportarsi le piante in diverse condizioni.
Combinando dati genetici con dati ambientali, i ricercatori possono ottenere una comprensione più profonda della complessa relazione tra i geni di una pianta e il suo ambiente. Oltre a migliorare la capacità predittiva, questo approccio consente una migliore comprensione di come le piante crescano in contesti diversi.
Deep Learning
Approcci diRecentemente, i ricercatori hanno iniziato a esplorare il deep learning come nuovo metodo per le previsioni genomiche. Il deep learning è un tipo di apprendimento automatico che utilizza reti neurali artificiali per analizzare dati provenienti da varie fonti.
Sebbene alcuni studi suggeriscano che il deep learning potrebbe non essere migliore dei metodi tradizionali per tutti i tratti, fornisce un modo per combinare diversi tipi di dati. Questo lo rende uno strumento promettente nel campo della genomica. Tuttavia, quando i dataset sono troppo grandi, la complessità potrebbe portare a sfide come l'overfitting.
Obiettivi della Ricerca
Questo studio mirava a confrontare i modelli statistici tradizionali che includono sia effetti genetici che ambientali contro un approccio di deep learning per prevedere i tratti delle mele. Si è concentrato sullo studio di undici tratti per più anni e in varie località per valutare l'efficacia dei diversi modelli di previsione.
I tre obiettivi principali erano confrontare come i diversi componenti dei modelli contribuiscono alle previsioni, valutare quanto bene questi modelli funzionano e stimare il tempo necessario per addestrare e fare previsioni con ciascun modello.
Raccolta Dati
I dati utilizzati in questo studio provenivano da più anni di osservazioni su vari tratti delle mele in diversi ambienti. Alcuni punti dati sono stati esclusi a causa di bassa affidabilità, assicurando che l'analisi includesse solo informazioni di alta qualità.
Per i dati meteorologici, temperatura, umidità e luce solare sono stati misurati nel corso degli anni per vedere come questi fattori influenzassero la crescita e la qualità complessiva delle mele. I dati sul suolo sono stati raccolti anche per capire come le condizioni del suolo potessero influenzare i tratti degli alberi di mele.
Matrici di Relazione
Per analizzare le informazioni genetiche, sono state create matrici di relazione basate su diversi marcatori genetici. Queste matrici aiutano a stimare quanto siano strettamente imparentate diverse varietà di mele, il che può fornire intuizioni sulla loro composizione genetica e sulle prestazioni potenziali.
Per l'analisi, sono stati creati diversi tipi di matrici per indagare sugli effetti dei marcatori, effetti additivi, effetti di dominanza e l'influenza dei fattori ambientali.
Varianza Spiegata da Diversi Effetti
I ricercatori hanno utilizzato modelli statistici per capire quanto delle prestazioni di una pianta possa essere attribuito a fattori genetici e alle loro interazioni con le condizioni ambientali. Questa analisi ha rivelato che gli effetti genetici possono spiegare una parte significativa della varianza, con alcuni tratti che mostrano contributi ancora maggiori dalle interazioni ambientali.
Capacità Predittiva dei Diversi Modelli
L'efficacia di ogni modello è stata valutata utilizzando la validazione incrociata, con i ricercatori che hanno esaminato quanto bene ogni modello prevedeva i risultati dei tratti nel dataset. È stato scoperto che i modelli che incorporano sia effetti genetici che ambientali spesso performano meglio rispetto a quelli che si concentrano solo su fattori genetici.
I modelli che utilizzano entrambi i tipi di informazioni forniscono un quadro più accurato per molti tratti e sono particolarmente forti nel prevedere tratti complessi influenzati da più fattori.
Efficienza del Modello
Quando si confrontano i diversi modelli, il tempo necessario per generare previsioni variava notevolmente. I modelli più semplici richiedevano meno tempo per il calcolo, mentre i modelli più complessi necessitavano di periodi significativamente più lunghi. In media, i modelli di deep learning hanno performato meglio dei metodi tradizionali per alcuni tratti, ma hanno affrontato sfide con tempi di calcolo più lunghi.
Al contrario, i modelli statistici più semplici basati su G-BLUP si sono rivelati più veloci. Tuttavia, il compromesso tra velocità e capacità predittiva doveva essere considerato nella scelta di un modello.
Conclusione
Questo studio evidenzia le complessità della previsione dei tratti per gli alberi di mele usando informazioni genomiche. Sottolinea la necessità di un approccio integrato che combina dati genetici con fattori ambientali.
Inoltre, i progressi nei metodi computazionali potrebbero portare a previsioni più efficienti ed efficaci nell'allevamento delle piante. La capacità di prevedere accuratamente i tratti è cruciale nello sviluppo di varietà di mele che possano adattarsi a condizioni in cambiamento e migliorare la sostenibilità agricola.
I ricercatori ora hanno a disposizione vari strumenti, dai modelli statistici tradizionali a quelli avanzati di deep learning. Raffinando ulteriormente questi metodi, gli scienziati possono aiutare gli agricoltori a selezionare le migliori cultivar di mele, aprendo la strada a raccolti più forti e resilienti in futuro.
Titolo: Integrative multi-environmental genomic prediction in apple
Estratto: Genomic prediction for multiple environments can aid the selection of genotypes suited to specific soil and climate conditions. Methodological advances allow effective integration of phenotypic, genomic (additive, non-additive), and large-scale environmental (enviromic) data into multi-environmental genomic prediction models. These models can also account for genotype-by-environment interaction, utilize alternative relationship matrices (kernels), or substitute statistical approaches with deep learning. However, the application of multi-environmental genomic prediction in apple remained limited, likely due to the challenge of building multi-environmental datasets and structurally complex models. Here, we applied efficient statistical and deep learning models for multi-environmental genomic prediction of eleven apple traits with contrasting genetic architectures by integrating genomic- and enviromic-based model components. Incorporating genotype-by-environment interaction effects into statistical models improved predictive ability by up to 0.08 for nine traits compared to the benchmark model. This outcome, based on Gaussian and Deep kernels, shows these alternatives can effectively substitute the standard G-BLUP. Including non-additive effects slightly improved predictive ability by up to 0.03 for two traits, but enviromic-based effects resulted in no improvement. The deep learning approach achieved the highest predictive ability for three traits with simpler genetic architectures, outperforming the benchmark by up to 0.10. Our results demonstrate that the tested statistical models capture genotype-by-environment interactions particularly well, and the deep learning models efficiently integrate data from diverse sources. This study will foster the adoption of multi-environmental genomic prediction to select apple cultivars adapted to diverse environmental conditions, providing an opportunity to address climate change impacts.
Autori: Michaela Jung, C. Quesada-Traver, M. Roth, M. J. Aranzana, H. Muranty, M. Rymenants, W. Guerra, E. Holzknecht, N. Pradas, L. Lozano, F. Didelot, F. Laurens, S. Yates, B. Studer, G. A. Broggini, A. Patocchi
Ultimo aggiornamento: 2024-06-22 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.06.20.599822
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.06.20.599822.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.