Nuove intuizioni sull'ASD attraverso varianti non codificanti
La ricerca esplora varianti genetiche non codificanti collegate al disturbo dello spettro autistico.
― 7 leggere min
Indice
- Contesto sugli Studi Genetici e ASD
- Sfide nell'Analizzare Varianti Noncodificanti
- Necessità di Metodi Più Semplici
- Trovare Intuizioni con il Contenuto GC Locale
- Investigare Fattori Specifici
- Struttura e Analisi di ENSAS
- Risultati dall'Analisi ENSAS
- Esplorare la Specificità del Segnale di Associazione
- Intuizioni da Altri Dataset
- Conclusione e Direzioni Future
- Fonte originale
Il Sequenziamento dell'intero genoma (WGS) è un modo per analizzare tutti i geni nel DNA di una persona. Recentemente, gli scienziati hanno cominciato a utilizzare il WGS per studiare come certe rare variazioni nel DNA, soprattutto quelle che non cambiano le proteine prodotte dai geni, siano collegate a tratti complessi nelle persone. Uno di questi tratti complessi è il disturbo dello spettro autistico (ASD), che è una condizione dello sviluppo che influisce sulla comunicazione e sul comportamento.
Contesto sugli Studi Genetici e ASD
In passato, i ricercatori utilizzavano set di informazioni genetiche più piccoli, come array o sequenziamento dell'esoma, per trovare collegamenti tra cambiamenti genetici comuni o rari che potrebbero essere legati all'ASD. Tuttavia, questi metodi non permettevano un'indagine approfondita su come le variazioni rare nelle regioni non codificanti del DNA potessero influenzare l'ASD.
Un gruppo di dati importante che i ricercatori hanno analizzato proviene dalla Simons Simplex Collection (SSC). Questo dataset include informazioni di WGS da molte famiglie con almeno un bambino con ASD. I ricercatori sono particolarmente interessati a esaminare le varianti "de novo", che sono cambiamenti genetici che sono nuovi nel bambino e non ereditati dai genitori. Queste varianti possono essere significative perché sono meno suscettibili all'influenza della selezione naturale, permettendo ai ricercatori di concentrarsi sui cambiamenti potenzialmente impattanti.
Sfide nell'Analizzare Varianti Noncodificanti
Nonostante l'accesso a questi dati preziosi, analizzare il legame tra varianti noncodificanti e ASD presenta delle sfide. Nei primi studi sui dati SSC, sono stati provati vari metodi per trovare associazioni tra queste varianti e l'ASD, ma nessuno ha mostrato collegamenti forti dopo aver corretto per i test multipli. Tuttavia, un'analisi ha trovato alcune associazioni usando un metodo di punteggio di rischio, che ha evidenziato collegamenti tra varianti e le regioni del DNA che regolano le attività geniche.
Per comprendere meglio i contributi delle varianti noncodificanti de novo all'ASD, i ricercatori hanno sviluppato un punteggio di impatto sulla malattia (DIS) basato su caratteristiche come l'accessibilità della cromatina e il legame di proteine che aiutano a controllare l'attività genica. Hanno addestrato reti neurali per prevedere queste caratteristiche in base alle sequenze di DNA. Combinando queste previsioni, hanno creato punteggi per valutare l'importanza di varianti specifiche.
Necessità di Metodi Più Semplici
L'approccio che utilizza le reti neurali, pur essendo potente, è complesso e difficile da interpretare. Questo ha spinto i ricercatori a cercare metodi più semplici per vedere se potevano trovare segnali simili o addirittura più forti senza il pesante carico computazionale. Risultati iniziali suggerivano che guardare il contenuto GC locale-essenzialmente il numero di certe basi del DNA (G e C) nella sequenza di DNA-poteva essere sufficiente per identificare associazioni simili.
Trovare Intuizioni con il Contenuto GC Locale
Le indagini iniziali hanno mostrato un forte legame tra il contenuto GC locale e i punteggi DIS. Questo ha portato i ricercatori a considerare se utilizzare solo il contenuto GC locale potesse fornire risultati di associazione simili. Hanno confrontato gruppi di varianti in base al contenuto GC locale e utilizzato varianti genomiche consolidate per testare queste associazioni.
Quando hanno condotto questi confronti, hanno trovato che il contenuto GC locale poteva effettivamente spiegare molte delle associazioni precedentemente attribuite a modelli più complessi. Tuttavia, hanno anche riconosciuto che mentre il contenuto GC locale poteva catturare segnali significativi, non esclude la possibilità che altre caratteristiche uniche della sequenza potessero essere anch'esse importanti.
Investigare Fattori Specifici
Dato che l'ASD colpisce prevalentemente i maschi, i ricercatori hanno esaminato come le differenze di sesso tra i probandi (individui con ASD) e i loro fratelli potessero influenzare il contenuto GC locale delle varianti genetiche. Hanno scoperto che i segnali più forti provenivano da famiglie in cui il probando era maschio e il fratello era femmina. Questo suggeriva una relazione più sfumata in cui le varianti vicino a certi geni potessero contribuire in modo diverso a seconda del sesso del probando e del fratello.
Alla luce di queste intuizioni, i ricercatori hanno creato un nuovo metodo analitico chiamato Expression Neighborhood Sequence Association Study (ENSAS). Questo approccio consente un'analisi più completa esaminando non solo il contenuto GC locale ma anche sequenze specifiche attorno ai geni legati ai modelli di espressione genica.
Struttura e Analisi di ENSAS
ENSAS è stato progettato per definire sistematicamente i quartieri di espressione genica. Per ogni gene, identifica geni vicini in base ai loro modelli di espressione e include varianti di questi geni nella sua analisi. Concentrandosi su questi quartieri, ENSAS può trovare associazioni che potrebbero essere trascurate considerando singoli geni o varianti da sole.
Quando i ricercatori hanno applicato ENSAS ai dati SSC, si sono concentrati specificamente sulle varianti provenienti da maschi probandi e femmine sorelle situate a monte dei loro geni assegnati. Questo approccio mirato ha migliorato la capacità di identificare differenze nel contenuto GC locale che erano significativamente legate all'ASD.
Risultati dall'Analisi ENSAS
Utilizzando ENSAS, i ricercatori hanno scoperto diversi quartieri con differenze significative nel contenuto GC locale tra le varianti del probando e quelle del fratello. I principali quartieri erano arricchiti di geni associati a funzioni sinaptiche, suggerendo che questi cambiamenti genetici potrebbero essere legati a processi biologici chiave coinvolti nell'ASD.
Analisi aggiuntive che esaminavano gli stati della cromatina-essenzialmente quanto sia accessibile o chiusa il DNA in diversi tessuti-hanno contribuito a spiegare alcune delle differenze nel contenuto GC locale osservate. I risultati hanno indicato che alcuni stati della cromatina erano più prevalenti tra le varianti dei probandi, suggerendo una base biologica per le differenze nel contenuto GC locale.
Esplorare la Specificità del Segnale di Associazione
Per garantire che i segnali rilevati non fossero semplicemente legati a problemi tecnici nel sequenziamento, i ricercatori hanno confrontato segmenti di dati provenienti da individui i cui campioni erano stati elaborati negli stessi lotti di sequenziamento. Questa analisi ha rivelato che associazioni significative persistevano anche tra campioni con lotti corrispondenti, indicando che i segnali osservati probabilmente non erano influenzati da effetti di lotto di sequenziamento.
La specificità dei segnali è stata ulteriormente testata applicando il framework ENSAS ad altri gruppi, come maschi probandi con maschi fratelli e femmine probandi con sorelle maschi o femmine. Queste analisi hanno rivelato che le associazioni più forti erano uniche per il gruppo maschio probando-femmina sorella.
Intuizioni da Altri Dataset
Infine, i ricercatori hanno cercato di convalidare i loro risultati applicando ENSAS a un dataset indipendente derivato da una popolazione in Islanda. Questo dataset conteneva anche informazioni su trio (genitori e prole) che consentivano analisi simili. Tuttavia, quando è stato applicato lo stesso metodo, i ricercatori non hanno trovato associazioni significative nei dati islandesi, il che suggeriva che i segnali identificati nel dataset SSC potessero essere specifici per il fenotipo ASD.
Conclusione e Direzioni Future
In generale, lo studio rafforza l'idea che le varianti genetiche noncodificanti svolgano un ruolo cruciale nella comprensione di tratti complessi come l'ASD. Utilizzando sia metodi analitici tradizionali che nuovi, i ricercatori possono ottenere intuizioni sulle basi genetiche dell'ASD e potenzialmente di altre condizioni psicologiche. I risultati non solo fanno luce sull'importanza delle rare varianti noncodificanti, ma evidenziano anche il valore di semplificare gli approcci analitici per rendere i risultati più chiari e interpretabili.
Con l'aumento dei dati WGS e l'analisi di più popolazioni, sarà essenziale ampliare questi metodi ed esplorare ulteriormente come le differenze genetiche si relazionano a tratti complessi in gruppi diversi. Le ricerche future potrebbero anche indagare i meccanismi biologici dietro le associazioni genetiche osservate e come queste si traducano nei comportamenti e nei sintomi associati all'ASD.
Titolo: Identifying associations of de novo noncoding variants with autism through integration of gene expression, sequence and sex information
Estratto: Whole-genome sequencing (WGS) data is facilitating genome-wide identification of rare noncoding variants, while elucidating their roles in disease remains challenging. Towards this end, we first revisit a reported significant brain-related association signal of autism spectrum disorder (ASD) detected from de novo noncoding variants attributed to deep-learning and show that local GC content can capture similar association signals. We further show that the association signal appears driven by variants from male proband-female sibling pairs that are upstream of assigned genes. We then develop Expression Neighborhood Sequence Association Study (ENSAS), which utilizes gene expression correlations and sequence information, to more systematically identify phenotype-associated variant sets. Applying ENSAS to the same set of de novo variants, we identify gene expression-based neighborhoods showing significant ASD association signal, enriched for synapse-related gene ontology terms. For these top neighborhoods, we also identify chromatin states annotations of variants that are predictive of the proband-sibling local GC content differences. Our work provides new insights into associations of non-coding de novo mutations in ASD and presents an analytical framework applicable to other phenotypes.
Autori: Jason Ernst, R. Li
Ultimo aggiornamento: 2024-03-21 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.03.20.585624
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.20.585624.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.