Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ciencias de la Salud# Medicina Genética y Genómica

GenePy avanza en el diagnóstico genético del Proyecto de 100,000 genomas

GenePy revela diagnósticos genéticos perdidos para enfermedades raras en los datos de 100,000 Genomas.

― 7 minilectura


GenePy Mejora elGenePy Mejora elDiagnóstico Genéticogenéticos.diagnósticos perdidos en datosNueva herramienta identifica
Tabla de contenidos

El Proyecto de 100,000 Genomas fue un esfuerzo importante en el Reino Unido para entender enfermedades raras. Este proyecto implicó secuenciar los genomas completos de 100,000 personas, enfocándose especialmente en familias afectadas por condiciones raras. El objetivo era reunir información genética valiosa que pudiera ayudar a identificar las causas de estas enfermedades.

Cómo Funcionó el Proyecto

El proyecto adoptó un enfoque sistemático donde los investigadores observaron la relación entre la composición genética de una persona y sus condiciones de Salud. Comparando datos genéticos específicos con información médica registrada, los investigadores pudieron identificar posibles vínculos con enfermedades. Esto implicó usar listas definidas de genes conocidos por estar asociados con ciertas condiciones de salud.

Para cuando el proyecto se completó en 2020, había logrado un índice de diagnóstico de aproximadamente 25% para las enfermedades raras que se investigaron. Esto significa que aproximadamente uno de cada cuatro participantes recibió un diagnóstico basado en sus datos genéticos.

A medida que más investigadores tuvieron acceso a los datos genómicos, encontraron vínculos adicionales, lo que llevó a más Diagnósticos. Notablemente, muchos de estos se debieron a cambios genéticos que no estaban incluidos en las listas originales usadas en el análisis. Con el tiempo, se hizo evidente que muchas Variantes que contribuyen a problemas de salud podían encontrarse fuera de las listas de genes seleccionadas, a veces haciendo que el diagnóstico fuera complicado.

El Desafío de las Variantes Bialélicas

Las variantes bialélicas son dos mutaciones diferentes encontradas en un gen que pueden llevar a una enfermedad. Estas variantes pueden ser difíciles de analizar, especialmente cuando se heredan de familiares que no muestran síntomas. Hay muchos tipos de variaciones genéticas, y la gran cantidad hace complicado evaluar todos los problemas potenciales sin limitar el enfoque.

Algunos tipos de cambios en los genes pueden tener efectos inciertos, lo que dificulta determinar si causan problemas de salud. Los paneles genéticos pueden ayudar hasta cierto punto al limitar el enfoque a genes relacionados con enfermedades conocidas, pero este método puede arriesgarse a perder diagnósticos potenciales fuera de esos genes.

GenePy: Una Nueva Herramienta de Análisis

Para enfrentar estos desafíos, los investigadores desarrollaron una nueva herramienta llamada GenePy. Este software fue diseñado para priorizar genes según la patogenicidad, es decir, qué tan probable es que un cambio genético cause una enfermedad. GenePy procesa un montón de información, incluyendo qué tan común es una variante en la población y si es probable que sea dañina o no.

Usando esta herramienta, los investigadores buscaban identificar casos perdidos de condiciones bialélicas sin importar los paneles de genes originales utilizados. El objetivo era aumentar las tasas de diagnóstico al descubrir más pistas genéticas relacionadas con problemas de salud.

Aplicando GenePy a los Datos del Proyecto de 100,000 Genomas

Los investigadores obtuvieron acceso a los datos genéticos del Proyecto de 100,000 Genomas después de completar la capacitación necesaria. Se pusieron a analizar los genomas de más de 78,000 personas usando GenePy.

Primero, prepararon una lista de genes asociados con enfermedades recesivas usando bases de datos establecidas. Esta lista incluía 2,862 genes conocidos por causar condiciones cuando ocurren variantes en ambas copias del gen. Luego ejecutaron GenePy, buscando variantes que cumplieran ciertos criterios, como estar presentes en regiones codificadoras de los genes y tener ciertos puntajes de calidad.

Por cada gen, clasificaron a los participantes según sus puntajes de GenePy, enfocándose en los individuos mejor clasificados. Este método apuntó a aquellos que probablemente tenían variantes genéticas que podrían estar causando sus problemas de salud.

Evaluando Condiciones Superpuestas

Después de identificar a las personas con altos puntajes de GenePy, los investigadores buscaron casos donde había coincidencia entre las condiciones de salud reportadas por los participantes y las características conocidas de la enfermedad relacionada con el gen. Este paso implicó comparar una lista de rasgos de salud descritos para cada gen con los rasgos registrados para cada participante.

Si las condiciones de salud reportadas por un participante coincidían con las vinculadas al gen mejor clasificado, los investigadores extraían las variantes presentes en el genoma de esa persona para un examen más detallado. Este proceso ayudó a determinar si estas variantes podrían ser la causa detrás de los problemas de salud desconocidos.

Hallazgos del Análisis de GenePy

El análisis reveló un total de 9,404 individuos únicos que se clasificaron en el top 5 para al menos uno de los 2,862 genes de enfermedades recesivas. Entre estos, alrededor del 50% eran personas sin un diagnóstico conocido, mientras que la otra mitad ya había sido diagnosticada con alguna condición.

Entre los individuos con diagnósticos conocidos, un número significativo tenía diagnósticos conectados a uno de los genes mejor clasificados. En contraste, varios habían recibido diagnósticos relacionados con otros genes, a menudo vinculados a condiciones genéticas dominantes.

De particular interés eran las personas que no habían recibido ningún diagnóstico a pesar de estar clasificadas en el top 5 para genes recesivos específicos. Los investigadores se centraron en 2,864 de esas personas, descubriendo que aproximadamente el 24% tenía condiciones de salud superpuestas con los rasgos vinculados a su gen mejor clasificado.

Después de un análisis cuidadoso, los investigadores identificaron varios diagnósticos potencialmente perdidos en estos casos. Extrajeron variantes específicas de los genomas de individuos cuyas condiciones de salud coincidían con rasgos de enfermedad conocidos, lo que llevó a la identificación de variantes que podrían ser la causa subyacente de sus problemas de salud.

La Importancia de un Fenotipado Preciso

Los hallazgos destacaron la importancia de registrar con precisión la información de salud, ya que las lagunas en estos datos dificultaron evaluar muchos casos. En muchas instancias, la información limitada sobre condiciones de salud significaba que los investigadores no podían identificar con confianza coincidencias entre los rasgos de los participantes y las características asociadas con los genes de enfermedades.

Automatizar partes de este proceso de comparación podría ahorrar tiempo y mejorar resultados. Sin embargo, es crucial mantener el juicio clínico en el análisis, ya que los expertos pueden reconocer sutilezas en los datos que los sistemas automatizados pueden pasar por alto.

Oportunidades para Mejorar GenePy

Aunque GenePy resultó útil, todavía hay áreas para mejorar. Ajustar los criterios utilizados para clasificar a los individuos podría generar mejores resultados diagnósticos. Además, explorar otras métricas y métodos para analizar variantes podría profundizar los conocimientos proporcionados por GenePy.

También hay potencial para aplicar GenePy a otros tipos de condiciones, incluidas las enfermedades genéticas dominantes. Esto podría aumentar aún más su utilidad para identificar variantes asociadas con una variedad de problemas de salud.

Conclusión: Un Paso Adelante en el Diagnóstico Genético

La aplicación de GenePy a una gran cohorte del Proyecto de 100,000 Genomas muestra promesas para identificar diagnósticos perdidos de enfermedades recesivas. A través de un análisis cuidadoso de datos genéticos y condiciones de salud, los investigadores han encontrado una manera de arrojar luz sobre casos previamente no diagnosticados, dando esperanza a individuos y familias afectadas por enfermedades genéticas raras.

El trabajo realizado por este equipo y el uso de herramientas como GenePy pueden mejorar significativamente las posibilidades de identificar las causas subyacentes de los problemas de salud, llevando a mejores resultados para los individuos a través de diagnósticos más precisos e intervenciones específicas.

Fuente original

Título: A gene pathogenicity tool 'GenePy' identifies missed biallelic diagnoses in the 100,000 Genomes Project

Resumen: The 100,000 Genomes Project (100KGP) diagnosed a quarter of recruited affected participants, but 26% of diagnoses were in genes not on the chosen gene panel(s); with many being de novo variants of high impact. However, assessing biallelic variants without a gene panel is challenging, due to the number of variants requiring scrutiny. We sought to identify potential missed biallelic diagnoses independent of the gene panel applied using GenePy - a whole gene pathogenicity metric. GenePy scores all variants called in a given individual, incorporating allele frequency, zygosity, and a user-defined deleterious metric (CADD v1.6 applied herein). GenePy then combines all variant scores for individual genes, generating an aggregate score per gene, per participant. We calculated GenePy scores for 2862 recessive disease genes in 78,216 individuals in 100KGP. For each gene, we ranked participant GenePy scores for that gene, and scrutinised affected individuals without a diagnosis whose scores ranked amongst the top-5 for each gene. We assessed these participants phenotypes for overlap with the disease gene associated phenotype for which they were highly ranked. Where phenotypes overlapped, we extracted rare variants in the gene of interest and applied phase, ClinVar and ACMG classification looking for putative causal biallelic variants. 3184 affected individuals without a molecular diagnosis had a top-5 ranked GenePy gene score and 682/3184 (21%) had phenotypes overlapping with one of the top-ranking genes. After removing 13 withdrawn participants, in 122/669 (18%) of the phenotype-matched cases, we identified a putative missed diagnosis in a top-ranked gene supported by phasing, ClinVar and ACMG classification. A further 334/669 (50%) of cases have a possible missed diagnosis but require functional validation. Applying GenePy at scale has identified potential diagnoses for 456/3183 (14%) of undiagnosed participants who had a top-5 ranked GenePy score in a recessive disease gene, whilst adding only 1.2 additional variants (per individual) for assessment.

Autores: Eleanor G Seaby, G. Leggatt, G. Cheng, N. S. Thomas, J. J. Ashton, I. Stafford, Genomics England Research Consortium, D. Baralle, H. L. Rehm, A. O'Donnell-Luria, S. Ennis

Última actualización: 2023-03-30 00:00:00

Idioma: English

Fuente URL: https://www.medrxiv.org/content/10.1101/2023.03.21.23287545

Fuente PDF: https://www.medrxiv.org/content/10.1101/2023.03.21.23287545.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares