Progressi nel Genoma della Mela WA 38
La ricerca sul genoma della mela WA 38 aiuta a capire i tratti delle colture.
― 7 leggere min
Indice
- Lo Sviluppo del Genoma ‘WA 38’
- Flusso di Lavoro Pubblicamente Disponibile
- Valutazione della Qualità della Sequenza Genomica
- Assemblaggio e Struttura del Genoma
- Annotazione Strutturale
- Annotazione Funzionale
- Analisi Comparativa
- Genomi dei Cloroplasti e Mitocondriali
- Conclusione
- Fonte originale
- Link di riferimento
Avere buoni genomi per i raccolti importanti ci aiuta a capire qualità come il sapore, la resistenza alle malattie e quanto tempo possono essere conservati. Le mele sono il frutto più mangiato negli Stati Uniti, portando 3,2 miliardi di dollari dalle fattorie e 78 miliardi a livello mondiale. Ci sono oltre 7.000 diverse varietà di mele coltivate, ognuna con il proprio sapore e aspetto. Proprio per questo, un Genoma di mela non può rappresentare tutte le varietà, visto che c'è molta varietà in questa specie.
Un esempio è la mela ‘WA 38’, che è diventata nota come Cosmic Crisp® nel 2017. È stata sviluppata dal Pome Fruit Breeding Program della Washington State University. La ‘WA 38’ è un mix di due tipologie di mela: ‘Honeycrisp’ e ‘Enterprise’. La ‘Honeycrisp’ è popolare per la sua consistenza croccante e la capacità di rimanere soda durante la conservazione, ma ha problemi durante la crescita e dopo il raccolto. ‘Enterprise’, mentre è più facile da coltivare e può essere conservata a lungo, non ha un sapore buono come altre varietà.
L'incrocio tra queste due varietà ha ricevuto feedback positivi per il suo bel colore, sapore e proprietà di conservazione. Tuttavia, ha anche preso alcune Caratteristiche negative, come problemi legati ai livelli minerali che possono influenzare la qualità e il sapore delle mele. Un problema preoccupante è il “green spot”, un disturbo che si manifesta in modo unico sulle mele ‘WA 38’ ma è simile ad altre condizioni legate a problemi minerali.
Le cause di questi disturbi fisiologici possono variare tra le varietà di mele e potrebbero esserci motivi genetici dietro di essi. Quindi, è importante esaminare attentamente le differenze genomiche specifiche nelle mele per gestire meglio queste caratteristiche importanti.
Lo Sviluppo del Genoma ‘WA 38’
La mela ‘WA 38’ è stata creata alla Washington State University, combinando tratti dalle mele genitrici. Per creare genomi di riferimento di alta qualità, sono essenziali bioinformatici esperti. È stato avviato un progetto chiamato American Campus Tree Genomes (ACTG) nel 2021 per formare i futuri bioinformatici per la ricerca agricola. L’ACTG mira a dare agli studenti un’esperienza pratica nella ricerca in bioinformatica e ad aiutarli a partecipare a progetti genomici dall’inizio alla fine.
Il genoma di ‘WA 38’ è stato sviluppato attraverso l'iniziativa ACTG da studenti della Washington State University. Ci sono tre risultati principali da questo progetto:
- Un genoma completo e di alta qualità di ‘WA 38’ realizzato utilizzando metodi di Sequenziamento avanzati.
- Scoperta di aree specifiche di interesse confrontando il genoma di ‘WA 38’ con altre importanti cultivar di mele.
- Creazione di un flusso di lavoro flessibile e ad alte prestazioni per l’assemblaggio e l’Annotazione del genoma.
Flusso di Lavoro Pubblicamente Disponibile
Per assicurarsi che altri possano replicare lo studio, il flusso di lavoro per l’Assemblaggio e l’Annotazione del Genoma Completo (WGAA) di ‘WA 38’ è stato reso disponibile online. Questo flusso di lavoro è dettagliato, specificando i metodi utilizzati e come replicare i passaggi. Per rendere più facile l'uso su diversi sistemi informatici, ogni software utilizzato è stato impacchettato e condiviso. Chiunque può seguire questo flusso di lavoro per ottenere gli stessi risultati.
Questo flusso di lavoro è stato progettato per essere utile per molte specie vegetali diverse. Il progetto ACTG sta anche creando un flusso di lavoro generale che beneficerà l'intera comunità ACTG. È stato creato un repository per condividere materiali educativi per gli insegnanti coinvolti in questo progetto. Questo repository include modelli e materiali didattici mirati a migliorare il corso per i futuri studenti.
Valutazione della Qualità della Sequenza Genomica
Per iniziare il processo, i dati grezzi di sequenziamento del DNA sono stati controllati per la qualità. I dati delle letture brevi mostrano alta qualità, con milioni di letture disponibili. Allo stesso modo, i dati delle letture lunghe mostrano anche buona qualità. Insieme, questi risultati indicano un elevato standard di sequenziamento.
La complessità del genoma è stata stimata attraverso l'analisi dei k-mer, che osserva la frequenza delle sequenze di DNA. L'heterozigosi stimata è stata trovata intorno all'1,35%, che si allinea con le osservazioni della ‘Honeycrisp’. La dimensione stimata del genoma era inferiore a quella di altre mele, ma l'unicità delle sequenze era all'interno dei range previsti.
Assemblaggio e Struttura del Genoma
Il genoma è stato assemblato in due principali haplotipi utilizzando i dati delle letture brevi e lunghe. Ogni haplotipo è stato strutturato in modo simile, mostrando buona qualità. L'assemblaggio di ‘WA 38’ ha mostrato forti livelli di continuità rispetto ad altri genomi di mele, rendendolo un genoma degno di nota.
L'assemblaggio è stato ulteriormente convalidato attraverso la mappatura Hi-C, che ha rivelato l'assenza di errori nel processo di assemblaggio. Ogni haplotipo è stato attentamente controllato e ha mostrato alta completezza in base a diversi criteri.
Annotazione Strutturale
Il genoma di ‘WA 38’ contiene una percentuale significativa di elementi genetici ripetitivi, comparabile ad altre mele. Questi elementi ripetuti sono per lo più lunghi ripetizioni terminali. Lo spazio genico è stato annotato utilizzando un mix di metodi di predizione, producendo migliaia di geni, più di quanto sia stato visto nella maggior parte degli altri genomi di mele.
Metodi unici sono stati utilizzati per perfezionare i modelli genici e aggiungere caratteristiche specifiche, assicurando un alto livello di accuratezza. I geni risultanti sono stati nominati secondo una convenzione specifica per evitare confusione e migliorare gli studi futuri.
Annotazione Funzionale
L’annotazione funzionale guarda a cosa fanno questi geni. Una significativa maggioranza delle proteine identificate in ‘WA 38’ è stata assegnata a termini funzionali provenienti da vari database. C'è stata una buona sovrapposizione con altre proteine di mele note, il che aiuta a dare senso alle funzioni geniche.
Analisi Comparativa
Per vedere come il genoma ‘WA 38’ si confronta con altre varietà di mele, sono state condotte analisi di sintenia e famiglie geniche. Molte delle famiglie geniche erano condivise tra diversi genomi di mele, indicando molte somiglianze. Tuttavia, sono state trovate alcune famiglie geniche uniche in ‘WA 38’.
Questo livello di analisi aiuta a identificare sia le caratteristiche condivise che i tratti unici di questa cultivar in confronto ad altre.
Genomi dei Cloroplasti e Mitocondriali
Il genoma del cloroplasto di ‘WA 38’ è più piccolo rispetto a molte specie di mele correlate ma contiene una struttura standard. Sono stati identificati molti geni unici, simili ad altri tipi di mele.
Il genoma mitocondriale, pur essendo più lungo, ha mostrato anche una buona varietà di geni annotati. Entrambi questi genomi di organelli sono stati attentamente annotati per assicurare che tutti i geni rilevanti fossero inclusi.
Conclusione
Il lavoro fatto sul genoma di ‘WA 38’ è un passo importante per comprendere questa popolare cultivar di mela. Il genoma affinato fornisce dati vitali per ulteriori ricerche sui suoi tratti unici e benefici per la salute. Il progetto stabilisce anche un precedente per la formazione e la ricerca futura nella genomica agricola, aprendo la strada per una gestione e qualità migliori dei raccolti in futuro.
Questo lavoro evidenzia l'importanza degli sforzi collaborativi nell'avanzare la ricerca agricola e formare la prossima generazione di scienziati in bioinformatica e genomica. Le risorse e i metodi condivisi serviranno da fondamento per il progresso continuo nel campo della genomica agricola, beneficiando sia i coltivatori che i consumatori.
In sintesi, la ricerca non mira solo a comprendere meglio il genoma di ‘WA 38’ ma aiuta anche altri nel campo a costruire su questa conoscenza, portando a frutti migliori per tutti.
Creando un flusso di lavoro dettagliato e rendendolo disponibile agli altri, questo progetto promuove un ambiente collaborativo dove intuizioni e progressi possono prosperare. La meticolosa valutazione della qualità e i processi di assemblaggio garantiscono che il genoma possa servire come riferimento affidabile per studi futuri, mentre le analisi funzionali e comparative forniscono un contesto prezioso per i dati genetici.
Insieme, questi sforzi contribuiscono a un corpo di conoscenza che può aiutare a migliorare le varietà di mele e potenzialmente altri raccolti, mostrando il ruolo integrale della genomica nell'agricoltura di oggi.
Titolo: A Haplotype-resolved, Chromosome-scale Genome for Malus domestica 'WA 38'
Estratto: Genome sequencing for agriculturally important Rosaceous crops has made rapid progress both in completeness and annotation quality. Whole genome sequence and annotation gives breeders, researchers, and growers information about cultivar specific traits such as fruit quality, disease resistance, and informs strategies to enhance postharvest storage. Here we present a haplotype-phased, chromosomal level genome of Malus domestica, WA 38, a new apple cultivar released to market in 2017 as Cosmic Crisp (R). Using both short and long read sequencing data with a k-mer based approach, chromosomes originating from each parent were assembled and segregated. This is the first pome fruit genome fully phased into parental haplotypes in which chromosomes from each parent are identified and separated into their unique, respective haplomes. The two haplome assemblies, Honeycrisp originated HapA and Enterprise originated HapB, are about 650 Megabases each, and both have a BUSCO score of 98.7% complete. A total of 53,028 and 54,235 genes were annotated from HapA and HapB, respectively. Additionally, we provide genome-scale comparisons to Gala, Honeycrisp, and other relevant cultivars highlighting major differences in genome structure and gene family circumscription. This assembly and annotation was done in collaboration with the American Campus Tree Genomes project that includes WA 38 (Washington State University), dAnjou pear (Auburn University), and many more. To ensure transparency, reproducibility, and applicability for any genome project, our genome assembly and annotation workflow is recorded in detail and shared under a public GitLab repository. All software is containerized, offering a simple implementation of the workflow.
Autori: Stephen Ficklin, H. Zhang, I. Ko, A. Eaker, S. Haney, N. Khuu, K. Ryan, A. Appleby, B. Hoffmann, H. Landis, K. Pierro, N. Willsea, H. Hargarten, A. Yocca, A. Harkess, L. Honaas
Ultimo aggiornamento: 2024-05-29 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.01.10.574953
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.10.574953.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.