Delphi: Un Nuovo Modo di Stimare i Punteggi di Rischio Genetico
Delphi usa l'apprendimento profondo per migliorare le previsioni dei punteggi di rischio genetico in diverse popolazioni.
― 7 leggere min
Indice
- Metodi per Stimare i Punteggi di Rischio Poligenico
- Sfide con l'Attuale PRS
- Il Potenziale del Deep Learning
- Tentativi Precedenti con il Deep Learning
- Introducendo Delphi
- Il Framework di Delphi
- GWAS e Gestione dei Dati
- Imparare a Modificare gli Effetti
- Confronto delle Performance
- Performance su Diverse Etnie
- Osservare Tendenze nella Modulazione degli Effetti
- Limitazioni e Direzioni Future
- Conclusione
- Fonte originale
Molti tratti e malattie comuni nascono da un mix di piccoli cambiamenti nel nostro DNA. Gli scienziati studiano questi cambiamenti per capire come influenzano la salute. Un modo in cui lo fanno è attraverso gli studi di associazione dell'intero genoma, o GWAS. I GWAS aiutano i ricercatori a trovare collegamenti tra specifici cambiamenti nel DNA e certi tratti.
Quando si fa un GWAS, fornisce due informazioni chiave per ogni cambiamento di DNA testato: la dimensione dell'effetto stimata, che dice quanto impatto possa avere quel cambiamento, e un valore P, che mostra quanto sia forte il legame tra il cambiamento e il tratto.
I ricercatori possono usare queste informazioni per creare un punteggio chiamato punteggio di rischio poligenico (PRS). Questo punteggio riassume i rischi di molti cambiamenti nel DNA per dare un'idea di quanto sia probabile che qualcuno abbia un certo tratto o malattia. Il PRS può essere utile per Prevenzione, diagnosi e trattamento in ambito sanitario.
Punteggi di Rischio Poligenico
Metodi per Stimare iNegli ultimi dieci anni, i metodi per stimare il PRS sono cambiati molto. Inizialmente, si è scoperto che anche i cambiamenti nel DNA che non sembravano statisticamente significativi potevano comunque aggiungere informazioni preziose per prevedere i tratti. I ricercatori hanno anche scoperto che considerare come certi cambiamenti nel DNA siano collegati tra loro può migliorare l'accuratezza della previsione di questi punteggi.
I recenti avanzamenti nei metodi statistici e nella biologia hanno ulteriormente migliorato il PRS. Per esempio, alcuni metodi più recenti possono incorporare informazioni su quanto spesso appaiono diverse varianti di DNA nella popolazione o tenere conto delle funzioni biologiche di questi cambiamenti.
Tuttavia, questi metodi spesso hanno limitazioni simili. Un problema significativo è che l'effetto di un cambiamento nel DNA è solitamente trattato come costante, il che potrebbe non riflettere la realtà.
Sfide con l'Attuale PRS
Il PRS spesso non funziona bene quando applicato a persone di sfondi etnici diversi. Questo è in parte dovuto alle diverse frequenze di cambiamenti nel DNA in vari gruppi. Inoltre, fattori genetici e ambientali possono complicare ulteriormente queste previsioni. A causa di questi problemi, usare il PRS in medicina può essere difficile, e ci sono bisogno di più dati da popolazioni diverse per migliorare l'accuratezza.
Per affrontare queste sfide, i ricercatori hanno proposto diverse strategie. Queste includono combinare i risultati di diversi studi GWAS e concentrarsi su cambiamenti di DNA importanti noti per avere effetti significativi. Recentemente, alcuni studi hanno anche mostrato che usare modelli più avanzati potrebbe migliorare le performance predittive.
Il Potenziale del Deep Learning
Il deep learning è una tecnica che può identificare schemi complessi in grandi dataset. In genetica, è stato usato per vari compiti, come identificare varianti genetiche e analizzare immagini correlate alla genetica. Alcuni metodi di deep learning spiegabili mirano a offrire maggiori informazioni sui fattori genetici dietro le malattie.
Un approccio recente ha coinvolto la creazione di un grafo della conoscenza per fornire spiegazioni per singoli cambiamenti di DNA. Usare il deep learning per prevedere i rischi genetici potrebbe offrire vantaggi unici, specialmente visto che è stato dimostrato che avere modelli più complessi può migliorare la generalizzazione. Questo è significativo per applicare il PRS in popolazioni poco rappresentate.
Tentativi Precedenti con il Deep Learning
Sebbene ci siano stati tentativi di usare il deep learning per stimare il PRS, gli approcci finora hanno utilizzato principalmente reti poco profonde. Questi modelli spesso lavoravano con un numero ridotto di cambiamenti nel DNA e non mostravano miglioramenti significativi nell'accuratezza predittiva. Per esempio, uno studio ha ottenuto un leggero miglioramento nelle previsioni di rischio di cancro al seno usando una rete neurale, ma ha scoperto che aggiungere più cambiamenti nel DNA non aiutava.
Un altro studio ha usato una piccola rete neurale per migliorare le previsioni di rischio per la malattia di Alzheimer in una coorte limitata.
Introducendo Delphi
Questo documento introduce Delphi, un nuovo metodo che usa il deep learning per migliorare la stima dei punteggi di rischio genetici. Delphi affronta alcune delle sfide che i metodi tradizionali del PRS hanno incontrato. Lo fa usando un moderno modello di trasformatori per catturare relazioni più complesse tra cambiamenti nel DNA.
A differenza dei metodi precedenti, Delphi aggiusta l'impatto dei cambiamenti nel DNA basandosi su vari fattori, tra cui sesso, etnia e altre mutazioni. Questa flessibilità consente al metodo di perfezionare gli effetti dei metodi PRS consolidati.
I risultati iniziali usando Delphi su dati del UK Biobank hanno mostrato risultati promettenti. Il modello aumenta gli effetti previsti di mutazioni significative e dimostra una migliore generalizzazione a popolazioni diverse rispetto ad altri approcci testati.
Il Framework di Delphi
Delphi ha un framework semplice che prevede due passaggi principali. Nel primo passaggio, i dati vengono divisi in set di addestramento, validazione e test. I ricercatori usano tecniche PRS standard per stimare gli effetti delle mutazioni, preparando i dati per un accesso rapido durante l'addestramento.
Il secondo passaggio coinvolge l'addestramento di un modello basato su dati genetici e demografici. Questo modello prevede il fenotipo (tratto) da vari fattori, mentre un'altra rete neurale apprende ad aggiustare le dimensioni degli effetti delle mutazioni. In definitiva, questi effetti aggiustati vengono combinati per produrre un PRS personalizzato.
GWAS e Gestione dei Dati
La ricerca ha coinvolto l'analisi di oltre 485.000 soggetti, suddividendoli in gruppi di addestramento, validazione e test. Il set di addestramento è stato usato per varie analisi, mentre il set di validazione ha aiutato a perfezionare i modelli. Il set di test è rimasto intatto fino a quando non sono state fatte le valutazioni finali.
Nello studio, sono stati considerati solo alcuni cambiamenti nel DNA basati su specifici criteri di qualità. Vari metodi statistici hanno aiutato a identificare i migliori modelli per prevedere i tratti basati sui dati genetici.
Imparare a Modificare gli Effetti
La fase successiva si concentra sulla personalizzazione dei cambiamenti di effetto. Simile al processo GWAS, caratteristiche come età, sesso e altri fattori genetici sono stati considerati. È stato costruito un modello separato per analizzare queste variabili e gettare le basi per la rete neurale.
La rete neurale ha creato variazioni uniche delle dimensioni degli effetti. Questi aggiustamenti sono stati poi sommati con ulteriori risultati per creare una previsione finale.
Confronto delle Performance
I ricercatori hanno valutato Delphi rispetto a tre metodi PRS consolidati per verificarne l'efficacia. Hanno esaminato quanto variano i risultati di ciascun metodo per diversi tratti, con Delphi che generalmente superava gli altri metodi.
Confrontando i risultati delle diverse tecniche, Delphi ha mostrato meno grandi errori di previsione nel complesso. Questa tendenza era particolarmente evidente per certi tratti, come l'altezza, dove Delphi produceva risultati più coerenti.
Performance su Diverse Etnie
C'è stata una particolare attenzione alle performance di Delphi su soggetti di origini non britanniche. Nonostante un campione di dimensioni più ridotte, Delphi ha mantenuto il suo vantaggio rispetto ad altri metodi in termini di varianza parziale spiegata per vari tratti.
I risultati erano incoraggianti, indicando che Delphi potrebbe generalizzare bene, anche in popolazioni precedentemente poco rappresentate negli studi genetici.
Osservare Tendenze nella Modulazione degli Effetti
I ricercatori hanno notato tendenze interessanti nel modo in cui Delphi ha aggiustato gli effetti dei cambiamenti nel DNA. Tendeva a ridurre l'impatto di cambiamenti che avevano effetti minimi, mentre massimizzava l'impatto di effetti più sostanziali. Questo potrebbe informare futuri sviluppi dei modelli.
È stato anche osservato che le dimensioni degli effetti possono variare notevolmente a seconda dei dati utilizzati, aggiungendo complessità all'interpretazione di questi risultati.
Limitazioni e Direzioni Future
La ricerca riconosce alcune limitazioni, inclusi i problemi posti dall'alta dimensionalità dei dati e il potenziale rumore derivante dall'inclusione di troppi SNP a effetto minore. Questi fattori possono complicare il processo di addestramento e portare a incoerenze nelle previsioni.
Inoltre, mentre Delphi mostra promesse nel migliorare le previsioni per vari tratti, la necessità di dataset più ampi e un continuo perfezionamento rimane cruciale. C'è un urgente bisogno di garantire che i metodi PRS possano funzionare bene tra diverse popolazioni per migliorare la loro utilità in ambito sanitario.
Conclusione
Delphi rappresenta un avanzamento nella stima dei punteggi di rischio genetici, sfruttando tecniche di deep learning per affrontare le sfide che i metodi tradizionali hanno incontrato. Concentrandosi sulle interazioni sfumate tra varianti genetiche e fattori demografici, fornisce un approccio più personalizzato alla stima del rischio Genetico.
Gli studi condotti usando Delphi sottolineano il suo potenziale di migliorare significativamente la predittività per popolazioni diverse, rendendolo uno strumento prezioso nella ricerca genetica e nelle applicazioni cliniche. L'esplorazione continua delle sue capacità sarà essenziale per affrontare le limitazioni esistenti e migliorare l'efficacia complessiva della previsione del rischio genetico.
Titolo: Deep Learning for Polygenic Risk Prediction
Estratto: Polygenic risk scores (PRS) are relative measures of an individuals genetic propensity to a particular trait or disease. Most PRS methods assume that mutation effects scale linearly with the number of alleles and are constant across individuals. While these assumptions simplify computation, they increase error, particularly for less-represented racial groups. We developed and provide Delphi (deep learning for phenotype inference), a deep-learning method that relaxes these assumptions to produce more predictive PRS. In contrast to other methods, Delphi can integrate up to hundreds of thousands of SNPs as input. We compare our results to a standard, linear PRS model, lasso regression, and a gradient-boosted trees-based method. We show that deep learning can be an effective approach to genetic risk prediction. We report a relative increase in the percentage variance explained compared to the state-of-the-art by 11.4% for body mass index, 18.9% for systolic blood pressure, 7.5% for LDL, 35% for C-reactive protein, 16.2% for height, 29.6 % for pulse rate; in addition, Delphi provides 2% absolute explained variance for blood glucose while other tested methods were non-predictive. Furthermore, we show that Delphi tends to increase the weight of high-effect mutations. This work demonstrates an effective deep learning method for modeling genetic risk that also showed to generalize well when evaluated on individuals from non-European ancestries.
Autori: Costa Georgantas, Z. Kutalik, J. Richiardi
Ultimo aggiornamento: 2024-07-16 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.04.19.24306079
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.04.19.24306079.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.