Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ciencias de la Salud # Epidemiología

Mejorando las Predicciones de Riesgo Genético para Todos

Un nuevo método busca hacer que los puntajes de riesgo genético sean más precisos para ancestros diversos.

Yunfeng Ruan, Rohan Bhukar, Aniruddh Patel, Satoshi Koyama, Leland Hull, Buu Truong, Whitney Hornsby, Haoyu Zhang, Nilanjan Chatterjee, Pradeep Natarajan

― 6 minilectura


Puntuaciones de Riesgo Puntuaciones de Riesgo Genético para Todos diversas ancestrías. Nuevo método mejora la precisión para
Tabla de contenidos

Las Puntuaciones de Riesgo Poligénico (PRS) son como un adivino genético. Estiman la probabilidad de que una persona desarrolle ciertas características o enfermedades basándose en su ADN. Así como tu familia puede tener un historial de ser malísimos para bailar, tus genes pueden dar pistas sobre tus posibilidades de tener condiciones como diabetes o enfermedades del corazón.

Para crear estas puntuaciones, los científicos recopilan Datos de varios estudios y buscan patrones en cómo ciertos genes se relacionan con diferentes características. Cuantos más datos tengan, mejor serán sus predicciones. Sin embargo, hay un gran problema: la mayoría de estos datos provienen principalmente de personas de ascendencia europea, lo que significa que las puntuaciones pueden no ser tan precisas para individuos de otros orígenes.

El Problema con la Representación

Cuando los científicos estudian genética, a menudo se enfocan en grupos que son más fáciles de acceder, típicamente personas de ascendencia europea. Esto resulta en una falta de datos para muchos otros grupos. Imagina intentar hacer un pastel pero solo usando harina de un tipo de trigo. Podrías terminar con un pastel que no le sabe bien a quienes prefieren otros sabores. Lo mismo pasa con los PRS-sin datos diversos, las puntuaciones pueden no funcionar bien para todos.

Esta subrepresentación lleva a PRS que funcionan mal para individuos que no son de ascendencia europea. Este es un problema real, especialmente ahora que estas puntuaciones están comenzando a llegar a entornos clínicos. Queremos que todos tengan una oportunidad justa de entender sus Riesgos de salud.

La Necesidad de Mejora

Debido a este problema, los científicos han estado buscando mejores formas de crear estas puntuaciones para todos. Se dieron cuenta de que una forma de mejorar la precisión de los PRS para individuos no europeos es mezclar y combinar puntuaciones de múltiples grupos de ascendencia. Esto es un poco como intentar crear un pastel híbrido delicioso combinando diferentes recetas. Pero aquí está el truco: cuán separadas están las grupos de ascendencia, más confusos pueden ser los resultados. Es como mezclar masa de pastel de chocolate con vainilla- a veces simplemente no sale bien.

Otro desafío es que los valores de PRS pueden ser inconsistentes entre diferentes grupos de ascendencia. Básicamente, comparar puntuaciones sin tener en cuenta la ascendencia es como comparar manzanas con naranjas. Algunos hasta han sugerido usar movimientos estadísticos elegantes para tratar de equilibrar la situación, pero esto aún no resuelve completamente el problema.

Un Nuevo Enfoque: DiscoDivas

¡Entramos en DiscoDivas! Sí, esto no es solo una fiesta de baile-es un nuevo método desarrollado para ayudar a los científicos a crear mejores PRS para ascendencias diversas. DiscoDivas usa un enfoque inteligente para reunir información de diferentes grupos de ascendencia y luego la combina para individuos que pueden caer en múltiples categorías, como una persona con ascendencia europea y asiática. Es un poco como mezclar diferentes estilos musicales para crear una canción exitosa-combina lo mejor de cada género y obtienes algo que apela a una audiencia más grande.

DiscoDivas funciona observando distancias genéticas. En lugar de depender de una puntuación para cada individuo, toma puntuaciones que ya han sido afinadas para grupos específicos y las mezcla basándose en cuán similares son genéticamente. Este método reconoce la ascendencia como una variable continua en lugar de categorías distintas. Si piensas en la ascendencia como mezclar pintura, DiscoDivas no solo usa colores primarios; utiliza todos los tonos intermedios para crear un espectro más completo.

Cómo Funciona DiscoDivas

El método se basa en una idea simple: cuanto más cercana es la relación genética, más relevante es la puntuación. DiscoDivas examina la composición genética de individuos diversos y encuentra las puntuaciones más ajustadas de grupos de ascendencia relacionados. Piénsalo como pedir prestada la cortadora de césped de un vecino en lugar de comprar la tuya. Si la cortadora de tu vecino es similar a la tuya, ¡aún hará el trabajo!

DiscoDivas comienza armonizando todos los datos de puntuación, asegurándose de que todo esté en la misma escala antes de mezclarlos. Luego usa las distancias genéticas para ponderar las puntuaciones de manera adecuada. El resultado es un PRS más preciso para individuos de diversos orígenes.

Pruebas en la Vida Real

Para ver qué tan bien funcionó DiscoDivas, los científicos realizaron algunas pruebas. Crearon datos simulados para representar varios grupos de ascendencia y luego aplicaron el método para ver cómo se desempeñaba. ¡Los resultados fueron prometedores! DiscoDivas pudo producir puntuaciones de riesgo precisas para individuos mezclados, mostrando que realmente podría ayudar a cerrar las brechas dejadas por métodos tradicionales.

En la práctica, DiscoDivas se desempeñó similar o incluso mejor que los métodos convencionales que solo usaron datos de una sola ascendencia. Fue como descubrir que tu nuevo gadget de cocina realmente cocina mejor que la vieja olla de la abuela.

La Importancia de Datos de Calidad

Aunque DiscoDivas es un paso en la dirección correcta, también depende en gran medida de la calidad de los datos utilizados para crear los PRS. Si los datos originales son en gran parte eurocéntricos y no representan a otros grupos, las puntuaciones producidas aún pueden quedarse cortas. Es como intentar hacer una ensalada de frutas pero solo usando manzanas; te perderás de todas las bayas y plátanos sabrosos que la hacen deliciosa.

Los científicos se aseguraron de enfocarse en características con tamaños de muestra suficientes y datos de alta calidad. Entendieron que para mejorar estas puntuaciones, necesitan conjuntos de datos más diversos-¡muchas frutas diferentes en el tazón de ensalada!

El Panorama General

La aparición de DiscoDivas destaca un problema más grande en la investigación genética: la necesidad de inclusividad. Muchas poblaciones aún están subrepresentadas en estudios Genéticos, y sin más datos diversos, el progreso se detendrá. Es importante que los investigadores recopilen datos de una amplia gama de fuentes para asegurar que todos puedan beneficiarse de los avances en genética y salud.

Avanzando

A medida que recopilamos más datos variados, nuevos métodos como DiscoDivas pueden volverse aún más efectivos. Al permitir una comprensión continua de la ascendencia, los investigadores pueden crear mejores predicciones de salud para todos los individuos, sin importar su origen.

En conclusión, DiscoDivas no es solo un nombre ingenioso; es un faro de esperanza para mejorar los PRS para todos. Al abrazar la diversidad en los datos genéticos, podemos avanzar hacia un futuro donde las predicciones de salud sean precisas y útiles para todos. ¡La pista de baile está abierta y todos están invitados a unirse!

Fuente original

Título: Leveraging genetic ancestry continuum information to interpolate PRS for admixed populations

Resumen: Calculating optimal polygenic risk scores (PRS) across diverse ancestries, particularly in admixed populations, is necessary to enable equitable genetic research and clinical translation. However, the relatively low representation of admixed populations in both discovery and fine-tuning individual-level datasets limits PRS development for admixed populations. Under the assumption that the most informative PRS weight for a homogeneous sample, which can be approximated by a data point in the ancestry continuum space, varies linearly in that space, we introduce a Genetic Distance-assisted PRS Combination Pipeline for Diverse Genetic Ancestries (DiscoDivas) to interpolate a harmonized PRS for diverse, especially admixed, ancestries, leveraging multiple PRS weights fine-tuned within single-ancestry samples and the genetic ancestry continuum information. DiscoDivas treats ancestry as a continuous variable and does not require shifting between different models when calculating PRS for different ancestries. We generated PRS with DiscoDivas and the current conventional method, i.e. fine-tuning multiple GWAS PRS using the matched or similar ancestry sample, for simulated datasets and large-scale biobank datasets (UK Biobank [UKBB] N=415,402, Mass General Brigham Biobank N=53,306, All of Us N=245,394) and compared our method with the conventional method with quantitative traits and complex disease traits. DiscoDivas generated a harmonized PRS of the accuracy comparable to or higher than the conventional approach, with the greatest advantage exhibited in admixed samples: DiscoDivas PRS for admixed samples was more statistically accurate than the PRS fine-tuned in matched or similar ancestry sample in 12 out of 16 simulated scenarios and was statistically equivalent in the remaining four scenarios; when tested with quantitative trait data in UKBB, DiscoDivas increased the PRS accuracy of admixed sample by 5% on average; yet no statistical difference was observed when tested for binary traits in UKBB where ancestry-matched data was available. For the single ancestry samples, the accuracy of DiscoDivas PRS and PRS fine-tuned in match samples was similar. In summary, our method DiscoDivas yields a harmonized PRS of robust accuracy for individuals across the genetic ancestry spectrum, including where ancestry-matched training data may be incomplete.

Autores: Yunfeng Ruan, Rohan Bhukar, Aniruddh Patel, Satoshi Koyama, Leland Hull, Buu Truong, Whitney Hornsby, Haoyu Zhang, Nilanjan Chatterjee, Pradeep Natarajan

Última actualización: 2024-11-10 00:00:00

Idioma: English

Fuente URL: https://www.medrxiv.org/content/10.1101/2024.11.09.24316996

Fuente PDF: https://www.medrxiv.org/content/10.1101/2024.11.09.24316996.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.

Artículos similares