Simple Science

Scienza all'avanguardia spiegata semplicemente

# Scienze della salute# Medicina genetica e genomica

Rivalutare le varianti di perdita di funzione in genetica

Nuovo framework migliora l'accuratezza nell'interpretare le varianti genetiche pLoF.

― 8 leggere min


Ridefinire le varianti diRidefinire le varianti dipLoFgenetiche.dell'importanza delle variantiIl framework migliora la comprensione
Indice

Le varianti di perdita di funzione (LoF) sono cambiamenti nel nostro DNA che possono portare a malattie riducendo o fermando la produzione di proteine. L'impatto di queste varianti dipende da quante copie di un gene sono colpite. Alcuni cambiamenti nel DNA creano una situazione in cui una proteina non può essere prodotta affatto, mentre altri potrebbero produrre una versione accorciata della proteina.

Ci sono diversi tipi di cambiamenti nel DNA che possono portare a queste varianti di perdita di funzione. Ad esempio, i cambiamenti nonsense creano un segnale di stop nel processo di produzione di proteine, i cambiamenti frameshift spostano il modo in cui la sequenza viene letta, e i cambiamenti nei siti di splicing influenzano come il DNA viene tagliato e unito. Anche altri cambiamenti strutturali possono causare problemi. Molte di queste varianti sono riconosciute come perdita di funzione prevista (pLoF) dai sistemi attuali che etichettano le informazioni genetiche. Tuttavia, non tutte le varianti pLoF fermando davvero la produzione di proteine. Questo richiede un esame attento oltre ai metodi tipici utilizzati oggi.

Importanza delle Banche Dati di Genetica delle Popolazioni

Le banche dati genetiche, come il Genome Aggregation Database, aiutano i ricercatori a guardare ai dati a livello di popolazione per capire meglio queste varianti e i loro effetti. Queste banche dati consentono agli scienziati di indagare sulla frequenza delle diverse varianti e quanto sia probabile che causino malattie.

A volte, le varianti etichettate come pLoF non portano realmente a una perdita di espressione proteica. Ad esempio, alcune varianti di truncazione in fase avanzata possono ancora produrre proteine, anche se più corte. È fondamentale considerare vari fattori quando si esaminano queste varianti, specialmente quando sono collegate a malattie.

Linee Guida Attuali per l'Interpretazione delle Varianti

L'American College of Medical Genetics and Genomics (ACMG) e l'Association for Molecular Pathology (AMP) hanno sviluppato linee guida per aiutare a valutare le varianti genetiche, incluse le varianti pLoF. Queste linee guida prevedono di esaminare diversi pezzi di evidenza, come le predizioni computazionali, come si comportano le varianti a livello funzionale, e dati di famiglia o di popolazione.

Una delle forme di evidenza più forti secondo queste linee guida è quando una variante di perdita di funzione si verifica in un gene noto per causare malattia. In certe circostanze, la sola presenza di una variante pLoF potrebbe essere sufficiente per classificarla come causa di malattia con poca evidenza aggiuntiva. Tuttavia, questo indica che le varianti pLoF hanno bisogno di un livello di valutazione più profondo.

Il gruppo di lavoro ClinGen Sequence Variant Interpretation ha creato linee guida per interpretare le varianti di perdita di funzione. Queste linee guida spiegano come contare correttamente le prove per le varianti pLoF. L'obiettivo è identificare i casi in cui una variante potrebbe sfuggire a una vera perdita di funzione e non dovrebbe avere pieno peso nel processo di valutazione.

Sfide con Grandi Coorti Popolazionali

Interpretare le varianti pLoF diventa notevolmente più difficile quando si lavora con grandi gruppi di persone. Gli studi mostrano che le varianti che dovrebbero portare a una perdita di funzione si trovano spesso insieme a molti errori di sequenziamento e annotazione. Questo significa che i ricercatori devono essere cauti quando analizzano i dati della popolazione.

Quando le varianti pLoF si trovano in geni noti legati a malattie, c'è una probabilità maggiore che siano legittime. Tuttavia, lo stesso non vale quando queste varianti vengono identificate all'interno di campioni casuali di popolazione. Ecco perché è fondamentale una supervisione attenta dei dati della coorte di popolazione per ridurre il numero di errori che possono portare a varianti genetiche erroneamente identificate.

Quadro di Curation Avanzato per le Varianti pLoF

Questo articolo introduce un quadro raffinato progettato per aiutare gli scienziati a interpretare meglio le varianti pLoF. Il quadro mira a fornire un quadro più chiaro di quando queste varianti potrebbero non portare a una perdita di produzione di proteine o quando potrebbero derivare da errori tecnici durante il sequenziamento.

Questo approccio aggiornato valuta tre categorie principali:

  1. Salvataggio tramite Proprietà di Sequenza: Alcune varianti possono ancora permettere la produzione di proteine utilizzabili grazie a cambiamenti vicini nella sequenza del DNA che ripristinano la funzione corretta.

  2. Rilevanza Biologica Incerta: Alcune varianti potrebbero non influenzare in modo significativo come funzionano le proteine, anche se portano a una perdita di funzione in un contesto.

  3. Possibili Artefatti Tecnici: Alcuni risultati possono semplicemente derivare da errori sistematici che si verificano durante il processo di sequenziamento, come imprecisioni nell'identificare le varianti a causa di problemi con il materiale genetico analizzato.

Processo di Curation Manuale

Il nuovo quadro di curation è stato sviluppato esaminando meccanismi noti che possono permettere ai geni di sfuggire alla classificazione come vera perdita di funzione. È stata scelta una selezione di 22 geni associati a malattie autosomiche recessive per una curazione dettagliata.

L'analisi è stata limitata a varianti di alta qualità che hanno superato vari filtri di controllo qualità. Ciò significa che le varianti erano state sottoposte a controlli per assicurarsi che fossero affidabili e probabilmente rappresentassero veri cambiamenti nella sequenza del DNA.

Un sistema di curation personalizzato ha permesso ai biocuratori di valutare manualmente ogni variante, utilizzando varie risorse genomiche come riferimento. Questa valutazione pratica mirava a classificare le varianti pLoF in base al loro potenziale di sfuggire a una vera perdita di funzione.

Comprendere le Categorie di Evidenza

Salvataggio Previsto tramite Proprietà di Sequenza Secondarie

Alcune varianti pLoF potrebbero essere salvate da cambiamenti vicini nella sequenza del DNA, permettendo la produzione di una proteina funzionale. Ad esempio, le varianti che sembrano causare shift di frame a causa del cambiamento del frame di lettura possono talvolta risultare in proteine che mantengono comunque funzionalità.

Le varianti nucleotidiche multipli (MNV) possono comportare diversi cambiamenti di singoli nucleotidi che, se visti insieme, potrebbero non interrompere la funzione della proteina come precedentemente pensato. Inoltre, inserimenti o cancellazioni che ripristinano il frame potrebbero consentire alla proteina interessata di mantenere la sua funzione originale.

Rilevanza Biologica Incerta

Alcune varianti potrebbero portare a una perdita di funzione in alcune situazioni ma non avere effetti significativi su come funziona la proteina in altre. I ricercatori esaminano fattori come la posizione di una variante all'interno del gene e quanto sia conservata quell'area tra le specie. Le varianti che si verificano in regioni meno biologicamente importanti potrebbero essere meno probabili di influenzare la funzione complessiva del gene.

Ad esempio, se una variante appare solo in pochi trascritti o si verifica in aree del gene che non sono altamente conservate, potrebbe non avere un impatto biologico significativo.

Possibili Artefatti Tecnici

Alcune varianti possono sorgere a causa di errori sistematici che si verificano durante il processo di sequenziamento. Ad esempio, un genotipaggio di bassa qualità o allineamenti errati possono produrre risultati spurii. Questo significa che prima di definire una variante come patologica, gli scienziati dovrebbero confermare che sia una vera variante e non un errore derivante da imperfezioni nel sequenziamento.

Risultati dal Processo di Curation

In totale, i curatori hanno valutato 1.113 varianti pLoF di alta fiducia trovate nei geni selezionati per le malattie autosomiche recessive. Il processo di curation ha rivelato che circa il 27% di queste varianti probabilmente non portava a una vera perdita di funzione.

I motivi più comuni includevano:

  • Varianti che si verificano nella parte finale di un gene.
  • Varianti situate in regioni note per causare difficoltà durante il sequenziamento.
  • Varianti che si verificano in aree che hanno bassa importanza biologica per la funzione proteica.

Variazione tra Geni e Varianti

Geni e classi di varianti diversi hanno mostrato tassi variabili di fuga dalla perdita di funzione. In particolare, le varianti di stop-gain tendevano a essere più propense a essere vere perdite di funzione rispetto alle varianti di splicing, che mostravano un tasso più elevato di essere previste come non portanti a una perdita di funzione.

Questa variazione sottolinea l'importanza di comprendere le proprietà specifiche dei geni quando si valutano le varianti pLoF.

Valutazione della Patogenicità

È essenziale riconoscere che il nuovo quadro si concentra sul predire se una variante è probabile che risulti in perdita di funzione. Determinare se una variante pLoF causa realmente una malattia richiede ulteriori indagini su altri aspetti, come il comportamento della variante in un contesto biologico e i dati provenienti da studi familiari.

Le variazioni previste come probabilmente non portanti a perdita di funzione sono state più frequentemente classificate come benigne rispetto a quelle classificate come vere perdite di funzione. Questo evidenzia la necessità di quadri robusti per valutare le varianti genetiche per evitare classificazioni errate che potrebbero fuorviare le decisioni cliniche.

Conclusione

In sintesi, il quadro di curation fornisce un approccio strutturato per interpretare meglio le varianti pLoF. Identificando i meccanismi di fuga e i potenziali problemi tecnici, i ricercatori possono ridurre le possibilità di diagnosi errate sia in contesti di ricerca che clinici. Questo può migliorare notevolmente la nostra capacità di classificare le varianti con precisione e capire le loro implicazioni per la salute e le malattie umane.

I risultati sottolineano l'importanza di valutazioni approfondite delle varianti genetiche, particolarmente negli studi su larga scala, come mezzo per evitare interpretazioni errate e garantire che il significato di ogni variante venga riconosciuto correttamente nel contesto della genetica umana.

Fonte originale

Titolo: Advanced variant classification framework reduces the false positive rate of predicted loss of function (pLoF) variants in population sequencing data

Estratto: Predicted loss of function (pLoF) variants are highly deleterious and play an important role in disease biology, but many of these variants may not actually result in loss-of-function. Here we present a framework that advances interpretation of pLoF variants in research and clinical settings by considering three categories of LoF evasion: (1) predicted rescue by secondary sequence properties, (2) uncertain biological relevance, and (3) potential technical artifacts. We also provide recommendations on adjustments to ACMG/AMP guideliness PVS1 criterion. Applying this framework to all high-confidence pLoF variants in 22 autosomal recessive disease-genes from the Genome Aggregation Database (gnomAD, v2.1.1) revealed predicted LoF evasion or potential artifacts in 27.3% (304/1,113) of variants. The major reasons were location in the last exon, in a homopolymer repeat, in low per-base expression (pext) score regions, or the presence of cryptic splice rescues. Variants predicted to be potential artifacts or to evade LoF were enriched for ClinVar benign variants. PVS1 was downgraded in 99.4% (162/163) of LoF evading variants assessed, with 17.2% (28/163) downgraded as a result of our framework, adding to previous guidelines. Variant pathogenicity was affected (mostly from likely pathogenic to VUS) in 20 (71.4%) of these 28 variants. This framework guides assessment of pLoF variants beyond standard annotation pipelines, and substantially reduces false positive rates, which is key to ensure accurate LoF variant prediction in both a research and clinical setting.

Autori: Anne O'Donnell-Luria, M. Singer-Berk, S. Gudmundsson, S. Baxter, E. G. Seaby, J. C. Wood, R. G. Son, N. A. Watts, K. Karczewski, S. Harrison, D. G. MacArthur, H. L. Rehm

Ultimo aggiornamento: 2023-03-09 00:00:00

Lingua: English

URL di origine: https://www.medrxiv.org/content/10.1101/2023.03.08.23286955

Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.03.08.23286955.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili