Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Genomica

Nuovi progressi nella ricerca sul genoma dei topi

La ricerca migliora la comprensione della genetica dei topi e colma le lacune nel genoma.

Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams

― 7 leggere min


Scoperta nel genoma deiScoperta nel genoma deitopidella struttura del DNA dei topi.Grande progresso nella comprensione
Indice

I topi sono stati una parte fondamentale della ricerca scientifica per oltre un secolo. Aiutano gli scienziati a capire le malattie umane, trovare trattamenti e comprendere come funzionano i nostri corpi. Alcune scoperte importanti fatte usando i topi includono il ruolo di certi geni nel nostro sistema immunitario e la creazione di cellule staminali speciali che possono trasformarsi in diversi tipi di cellule.

Nel 2002, gli scienziati hanno completato il primo genoma completo di un topo, specificamente della razza C57BL/6J. Il genoma è l'insieme completo di DNA in un organismo. Il genoma del topo ha 19 coppie di cromosomi e un cromosoma X, mentre il cromosoma Y è diverso perché ha una struttura unica. Alcune parti del genoma del topo sono difficili da studiare a causa del modo in cui sono costruiti i suoi cromosomi. L'attuale genoma del topo è incompleto, con circa 281 lacune. Queste lacune sono presenti in ogni cromosoma e aree importanti come Telomeri e Centromeri rimangono irrisolte.

L'importanza dei telomeri e centromeri

I telomeri sono le estremità protettive dei cromosomi che aiutano a prevenirne il danneggiamento. I centromeri giocano un ruolo importante durante la divisione cellulare, aiutando a separare correttamente i cromosomi. L'attuale genoma del topo non riflette in modo accurato queste parti importanti dei cromosomi.

Recenti progressi nella tecnologia di sequenziamento del DNA offrono un modo per creare genomi di topo più completi. Questo studio ha usato un metodo che consente agli scienziati di leggere lunghe sequenze di DNA, offrendo l'opportunità di colmare le lacune nella genetica dei topi.

Creazione dei genomi T2T dei topi

I ricercatori hanno prodotto i primi genomi completi per le razze C57BL/6J e CAST/EiJ. Questi genomi completi, chiamati T2T (Telomere-to-Telomere), contengono tutte le strutture precedentemente mancanti, inclusi telomeri e centromeri completi. I nuovi genomi sono più completi rispetto alle versioni precedenti, ampliando notevolmente la comprensione della genetica dei topi.

Il DNA è stato ottenuto da cellule staminali embrionali miste delle due razze di topo. Gli scienziati hanno utilizzato sia metodi di sequenziamento long-read che short-read per assemblare i genomi. Hanno creato sei diverse assemblaggi genomici e li hanno confrontati, selezionando il migliore in base a una serie di misure di qualità.

Trovare le parti mancanti del genoma

Alcuni cromosomi erano ancora incompleti, privi di sequenze telomeriche alle loro estremità. Per trovare queste parti mancanti, i ricercatori hanno cercato sequenze ripetute specifiche nei frammenti di DNA non assegnati. Hanno anche utilizzato un metodo chiamato long-range Hi-C per aiutare a assegnare le sequenze rimanenti ai cromosomi corretti.

Confrontando i nuovi genomi con la versione precedente, è diventato chiaro che le nuove versioni avevano una sequenza più lunga. Ad esempio, il genoma C57BL/6J T2T ha aggiunto 208 megabasi (Mbp) di sequenza rispetto alla versione precedente.

Accuratezza strutturale

Per controllare quanto erano accurate le nuove assemblaggi genomiche, i ricercatori hanno esaminato le strutture nei cromosomi. Hanno scoperto che il genoma T2T aveva meno varianti strutturali (SV) rispetto al genoma più anziano. Sono state osservate meno inserzioni, delezioni, duplicazioni e Inversioni nella nuova versione, indicando una struttura più stabile.

Comprendere la struttura dei cromosomi

I nuovi genomi hanno permesso un confronto tra la struttura dei cromosomi. È stato notato che i nuovi genomi contenevano rappresentazioni complete di telomeri e centromeri su tutti i cromosomi. Le lacune nell'assemblaggio precedente sono state riempite con nuovi dati, rivelando differenze su larga scala tra le due razze di topo.

I ricercatori hanno scoperto che telomeri e centromeri erano stati poco rappresentati nel vecchio genoma, e i nuovi assemblaggi hanno notevolmente migliorato questa rappresentazione. I nuovi genomi mostrano aumenti significativi nelle sequenze satelliti, importanti per la struttura e la funzione dei cromosomi.

Annotazione dei geni e geni nuovi

L'annotazione dei geni è stata eseguita utilizzando il sequenziamento RNA da vari tipi di tessuto. Il numero di geni codificanti proteine trovati nei nuovi genomi era comparabile al genoma di riferimento precedente. Tuttavia, i ricercatori hanno identificato nuovi geni che non erano stati visti prima.

Lo studio ha trovato diversi geni nuovi in entrambe le razze. Questi geni nuovi variavano in dimensione e contenevano molti esoni diversi, che sono parti di geni che codificano per le proteine. Alcuni di questi nuovi geni sono risultati simili a proteine conosciute, suggerendo potenziali funzioni.

Aumento del numero di copie dei geni

I ricercatori hanno anche trovato un numero di geni che avevano un numero di copie aumentato nei genomi T2T rispetto alla versione precedente. Questo significa che alcuni geni erano presenti in quantità maggiori nei nuovi genomi. Questi geni rientravano in varie categorie, comprese quelle relative al sistema immunitario. Sono state notate anche differenze nel numero di copie di alcuni geni tra le due razze.

Struttura dei telomeri e centromeri

Telomeri e centromeri giocano ruoli vitali nella stabilità dei cromosomi. I nuovi genomi hanno mostrato un miglioramento significativo nella rappresentazione di queste regioni. I genomi C57BL/6J e CAST/EiJ T2T avevano telomeri molto più lunghi rispetto al precedente genoma di riferimento.

I ricercatori hanno scoperto che le lunghezze dei telomeri erano generalmente più lunghe nei topi rispetto agli esseri umani. Lo studio ha dettagliato la dimensione e la struttura di telomeri e centromeri, evidenziando differenze tra le due razze di topo.

I centromeri nei topi sono stati trovati composti da specifici tipi di DNA satellitare, che erano stati poco caratterizzati negli studi precedenti. I nuovi genomi hanno permesso una comprensione più chiara delle regioni centromeriche, rivelando la loro complessità strutturale.

Confronto delle estremità dei cromosomi telocentrici

I cromosomi dei topi sono unici nel senso che hanno i loro centromeri situati all'estremità dei cromosomi, una struttura nota come telocentrica. I ricercatori hanno confrontato le strutture telocentriche nelle due razze di topo, rivelando differenze nel loro arrangiamento di sequenze ripetute.

Le razze C57BL/6J mostravano un'organizzazione di ripetizioni distinta, mentre CAST/EiJ aveva un'organizzazione più variabile. Questo evidenzia la diversità delle strutture cromosomiche tra le due razze.

Completare il genoma di riferimento del topo

Nonostante i tentativi precedenti, il genoma di riferimento del topo rimane incompleto. L'assemblaggio T2T C57BL/6J ha riempito con successo molte lacune, aggiungendo una quantità significativa di sequenza al genoma del topo. Il lavoro ha rivelato un totale di 301 geni codificanti proteine nelle regioni precedentemente mancanti.

I ricercatori hanno evidenziato specifiche aree di interesse, come quelle relative alla risposta immunitaria, permettendo futuri studi sulle loro funzioni. Questo approccio completo al riempimento delle lacune migliora notevolmente la qualità complessiva del genoma del topo.

Regioni pseudoautosomali

Lo studio ha anche focalizzato su una regione chiamata regione pseudoautosomale (PAR), che è condivisa tra i cromosomi X e Y. I nuovi assemblaggi hanno migliorato la comprensione della PAR e rivelato molti nuovi geni e caratteristiche strutturali.

Confrontando la PAR tra le due razze di topo, i ricercatori hanno notato differenze nel contenuto genico e nella struttura, indicando che anche piccole regioni del genoma possono mostrare variazioni significative.

Inversioni nel genoma del topo

Le inversioni sono riarrangiamenti nel genoma che possono influenzare la funzione e la regolazione dei geni. Questo studio ha identificato numerose inversioni tra le due razze di topo, facendo luce sulle loro origini e sul ruolo delle sequenze ripetute nella creazione di questi cambiamenti strutturali.

I ricercatori hanno trovato che molte inversioni erano associate a segmenti ripetuti ampi, suggerendo che questi segmenti potrebbero giocare un ruolo nell'evoluzione e nella funzione del genoma.

Proteine KRAB Zinc Finger

Le proteine KRAB zinc finger (KZFP) sono fondamentali per regolare l'espressione genica. I nuovi assemblaggi hanno notevolmente migliorato la copertura di queste proteine, permettendo una migliore comprensione dei loro ruoli nel genoma. Sono state trovate differenze nel numero e nell'organizzazione delle famiglie KZFP tra le due razze, indicando che queste regioni sono soggette a cambiamenti evolutivi.

Conclusione

Questo studio segna un significativo progresso nella genetica dei topi. Creando genomi più completi per due razze chiave, i ricercatori hanno aperto la strada a nuove indagini sulla genetica e sulle malattie. Questi genomi migliorati forniscono un quadro più chiaro delle regioni precedentemente mancanti, migliorando la nostra comprensione di come funzionano ed evolvono queste regioni.

Il lavoro offre una base per futuri studi che esploreranno le variazioni genetiche e le loro implicazioni per la salute e le malattie. Man mano che i ricercatori continueranno a costruire su questo lavoro, emergeranno ulteriori intuizioni sulle complessità della genetica, beneficiando in definitiva la nostra comprensione dei processi biologici e del potenziale per sviluppare trattamenti per le malattie.

Fonte originale

Titolo: The structural diversity of telomeres and centromeres across mouse subspecies revealed by complete assemblies

Estratto: It is over twenty years since the publication of the C57BL/6J mouse reference genome, which has been a key catalyst for understanding mammalian disease biology. However, the mouse reference genome still lacks telomeres and centromeres, contains 281 chromosomal sequence gaps, and only partially represents many biomedically relevant loci. We present the first T2T mouse genomes for two key inbred strains, C57BL/6J and CAST/EiJ. These T2T genomes reveal significant variability in telomere and centromere sizes and structural organisation. We add an additional 213 Mbp of novel sequence to the reference genome containing 517 protein-coding genes. We examined two important but incomplete loci in the mouse genome - the pseudoautosomal region (PAR) on the sex chromosomes and KRAB zinc finger proteins (KZFPs) loci. We identified distant locations of the PAR boundary, different copy number and sizes of segmental duplications, and a multitude of amino acid substitution mutations in PAR genes.

Autori: Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams

Ultimo aggiornamento: 2024-10-26 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.10.24.619615

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.24.619615.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili