Nuovi metodi nella ricerca sulla ereditarietà genetica
Uno sguardo a tecniche innovative per misurare l'ereditarietà in tratti complessi.
― 7 leggere min
Indice
- Progressi nella Ricerca Genetica
- Limitazioni dei Metodi Attuali
- Introduzione alla Regressione Interaction-LD Score
- Come Funziona l'i-LDSC
- Studi di Simulazione e Risultati
- Applicazione ai Dati Reali
- Confronto tra i-LDSC e Regressione del Punteggio LD
- Direzioni Future
- Conclusione
- Fonte originale
- Link di riferimento
L'ereditarietà è un modo per misurare quanto delle differenze che vediamo in un tratto specifico, come l'altezza o la personalità, può essere spiegato dalla genetica. Si guarda alle differenze genetiche tra gli individui e a come queste differenze riguardano i tratti che possiamo osservare. Tradizionalmente, i ricercatori usavano studi familiari per stimare l'ereditarietà, ma questi studi coinvolgevano spesso piccoli gruppi di persone imparentate. Ora, grazie ai progressi nella ricerca genetica, gli scienziati possono analizzare dataset molto più grandi, inclusi individui non correlati, per avere un quadro più chiaro dell'ereditarietà.
Progressi nella Ricerca Genetica
Con i nuovi metodi nella ricerca genetica, in particolare negli studi di associazione genomica (GWAS), i ricercatori possono raccogliere statistiche riassuntive che aiutano a stimare l'ereditarietà senza dover analizzare i dati genetici individuali. I GWAS esaminano molte varianti genetiche tra diversi individui per trovare associazioni con tratti specifici. Guardando a come queste varianti genetiche influenzano i tratti, i ricercatori possono capire meglio quanto della variazione di un tratto sia dovuta alla genetica rispetto ad altri fattori.
Questo nuovo approccio significa che molti tratti possono essere collegati a un gran numero di varianti genetiche. Infatti, è comune che migliaia di loci genetici contribuiscano alla variazione che vediamo in un singolo tratto. I ricercatori hanno sviluppato vari metodi statistici per migliorare le stime di ereditarietà dai risultati dei GWAS. Uno dei metodi più popolari è chiamato regressione del punteggio di disequilibrio di legame (LD), che aiuta a correggere gli errori nei dati e fornisce una stima più chiara dell'ereditarietà.
Limitazioni dei Metodi Attuali
Anche se la regressione del punteggio LD è ampiamente usata, ha delle limitazioni. Il metodo si concentra principalmente su correlate genetiche specifiche e potrebbe perdere informazioni importanti catturate nei dati. Inoltre, considera solo alcuni aspetti dell'architettura genetica dei tratti. Questo significa che alcuni degli effetti genetici che contribuiscono ai tratti potrebbero essere trascurati, sottostimando così l'ereditarietà.
Recenti approcci hanno iniziato a colmare queste lacune includendo informazioni aggiuntive. Ad esempio, i ricercatori hanno iniziato a includere interazioni genetiche più complesse, in particolare interazioni tra geni, quando stimano l'ereditarietà. Questo è importante perché molti tratti non dipendono solo da effetti genetici additivi, ma anche da come i diversi geni interagiscono tra loro.
Introduzione alla Regressione Interaction-LD Score
Uno degli sviluppi più recenti in questo campo è un nuovo metodo chiamato regressione del punteggio Interaction-LD (i-LDSC). Questo metodo si basa sulla regressione del punteggio LD originale aggiungendo un modo per tenere conto delle interazioni tra varianti genetiche. L'idea è che certe interazioni genetiche possano avere un impatto significativo su come i tratti si esprimono. Includendo queste interazioni, l'i-LDSC mira a fornire una stima più accurata dell'ereditarietà.
Il metodo i-LDSC funziona identificando coppie specifiche di varianti genetiche che interagiscono tra loro. Questo consente ai ricercatori di capire non solo gli effetti individuali di ciascuna variante, ma anche come esse lavorano insieme. Ad esempio, due varianti potrebbero avere ciascuna un piccolo effetto su un tratto, ma quando combinate, potrebbero portare a un effetto molto più grande.
Come Funziona l'i-LDSC
Per utilizzare l'i-LDSC, i ricercatori prima raccolgono dati genetici e creano un modello per stimare i contributi sia dagli effetti additivi sia dalle interazioni. Si basano ancora sulle statistiche riassuntive dei GWAS, ma calcolano anche un nuovo insieme di punteggi che rappresentano queste interazioni. Così facendo, possono recuperare parte dell'ereditarietà che potrebbe altrimenti essere trascurata dai metodi tradizionali.
Negli studi di simulazione, l'i-LDSC ha dimostrato di poter catturare efficacemente la varianza genetica non additiva che i modelli precedenti potrebbero perdere. Questo significa che l'i-LDSC può fornire intuizioni più chiare sulla base genetica dei tratti, rivelando quanto sia più complessa l'architettura genetica.
Studi di Simulazione e Risultati
Per dimostrare l'efficacia dell'i-LDSC, i ricercatori hanno eseguito varie simulazioni. Queste simulazioni hanno coinvolto la creazione di tratti sintetici utilizzando dati genetici reali da una popolazione diversificata. Sono stati testati diversi scenari, incluse variazioni nell'ereditarietà e le proporzioni degli effetti delle interazioni genetiche. I risultati hanno mostrato che l'i-LDSC poteva rilevare con robustezza la significativa varianza genetica non additiva attraverso molte configurazioni diverse.
È importante notare che, quando i dati genetici sono stati generati esclusivamente con effetti additivi, l'i-LDSC ha comunque funzionato bene. È riuscito a stimare accuratamente l'ereditarietà senza identificare falsamente effetti di Interazione. Al contrario, i metodi tradizionali come la regressione del punteggio LD spesso non sono riusciti a catturare la complessità totale delle architetture genetiche. Questo mette in evidenza la forza dell'i-LDSC nel recuperare contributi genetici che altrimenti sarebbero stati trascurati.
Applicazione ai Dati Reali
I ricercatori hanno anche applicato il framework i-LDSC a dati del mondo reale provenienti da grandi biobanche, esaminando tratti come altezza, pressione sanguigna e livelli di colesterolo. Hanno trovato che molte interazioni genetiche significative erano effettivamente presenti, che i metodi precedenti avevano trascurato. Negli studi del UK Biobank e di BioBank Japan, la maggior parte dei tratti analizzati mostrava forti evidenze di effetti di interazione che contribuiscono all'ereditarietà.
Utilizzando l'i-LDSC, i ricercatori hanno potuto riportare stime di ereditarietà più alte per questi tratti rispetto a quelle stabilite in precedenza. Questo non solo sottolinea l'importanza delle interazioni genetiche, ma suggerisce anche che la base genetica di molti tratti è molto più complessa di quanto suggerissero i modelli precedenti.
Confronto tra i-LDSC e Regressione del Punteggio LD
Confrontando l'i-LDSC con la tradizionale regressione del punteggio LD, è diventato chiaro che l'i-LDSC forniva una visione più olistica dei contributi genetici ai tratti. Mentre la regressione del punteggio LD si concentra principalmente sugli effetti additivi, l'i-LDSC comprende sia effetti additivi sia effetti di interazione. Questo significa che l'i-LDSC può rilevare una maggiore quantità di varianza spiegata dalla genetica, fornendo una migliore comprensione di come si sviluppano tratti complessi.
I ricercatori hanno anche sottolineato che le stime ottenute tramite l'i-LDSC erano fortemente correlate con quelle dalla regressione del punteggio LD, indicando che entrambi i metodi esplorano informazioni simili. Tuttavia, l'i-LDSC ha costantemente catturato contributi aggiuntivi dagli effetti di interazione che erano assenti nella regressione del punteggio LD.
Direzioni Future
Ci sono molti modi per sviluppare ulteriormente il metodo i-LDSC e le sue applicazioni. Un'area di interesse è esplorare come i punteggi di interazione si relazionano alle stime complessive di ereditarietà. I ricercatori hanno anche notato che, mentre l'i-LDSC si concentra su interazioni a coppie, ci sono opportunità per adattare il framework ad altri tipi di interazioni genetiche. Espandere il metodo per includere diversi contesti genetici potrebbe fornire intuizioni ancora più profonde sulla genetica dei tratti complessi.
Inoltre, l'i-LDSC potrebbe essere combinato con altri modelli, come la regressione del punteggio LD stratificato, per affinare ulteriormente le stime di ereditarietà. Integrando gruppi di annotazione funzionale, i ricercatori potrebbero sbloccare ulteriori informazioni sulla base genetica dei tratti.
Infine, mentre l'i-LDSC è stato applicato a tratti singoli negli studi descritti, sforzi futuri potrebbero beneficiare dalla valutazione di più tratti contemporaneamente. Questo potrebbe aumentare la potenza dell'analisi genetica e migliorare la nostra comprensione delle correlazioni genetiche tra diversi tratti.
Conclusione
L'introduzione del framework i-LDSC segna un passo importante nella ricerca genetica. Considerando effetti non additivi e interazioni tra varianti genetiche, l'i-LDSC fornisce un quadro più completo di come la genetica influenzi tratti complessi. La sua applicazione sia a dati simulati che reali dimostra la sua capacità di recuperare l'ereditarietà "mancante" e approfondire la nostra comprensione dell'architettura genetica che sottende vari tratti.
Con l'avanzare della ricerca in genetica, strumenti come l'i-LDSC saranno fondamentali per scoprire le complessità di come i tratti vengono ereditati ed espressi, aiutando a preparare la strada per applicazioni mediche e sanitarie più precise. Con uno sviluppo continuo e collaborazioni, il futuro promette approfondimenti molto più dettagliati sulla genetica dei tratti umani e delle malattie.
Titolo: Discovering non-additive heritability using additive GWAS summary statistics
Estratto: LD score regression (LDSC) is a method to estimate narrow-sense heritability from genome-wide association study (GWAS) summary statistics alone, making it a fast and popular approach. In this work, we present interaction-LD score (i-LDSC) regression: an extension of the original LDSC framework that accounts for interactions between genetic variants. By studying a wide range of generative models in simulations, and by re-analyzing 25 well-studied quantitative phenotypes from 349,468 individuals in the UK Biobank and up to 159,095 individuals in BioBank Japan, we show that the inclusion of a cis-interaction score (i.e., interactions between a focal variant and proximal variants) recovers genetic variance that is not captured by LDSC. For each of the 25 traits analyzed in the UK Biobank and BioBank Japan, i-LDSC detects additional variation contributed by genetic interactions. The i-LDSC software and its application to these biobanks represent a step towards resolving further genetic contributions of sources of non-additive genetic effects to complex trait variation.
Autori: Lorin Crawford, S. P. Smith, G. Darnell, D. Udwin, J. Stamp, A. Harpak, S. Ramachandran
Ultimo aggiornamento: 2024-04-15 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2022.07.21.501001
Fonte PDF: https://www.biorxiv.org/content/10.1101/2022.07.21.501001.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://github.com/lcrawlab/i-LDSC
- https://github.com/bulik/ldsc/
- https://www.ukbiobank.ac.uk
- https://jenger.riken.jp/en/result
- https://mathgen.stats.ox.ac.uk/impute/data_download_1000G_phase1_integrated.html
- https://www.ncbi.nlm.nih.gov/gap
- https://www.ebi.ac.uk/gwas/
- https://github.com/arminschoech/GRM-MAF-LD
- https://yanglab.westlake.edu.cn/software/gcta/