El mundo en evolución de la genómica
Descubre cómo la genómica está moldeando la salud y la medicina a través de tecnologías avanzadas de secuenciación.
Renato Santos, Hyunah Lee, Alexander Williams, Anastasia Baffour-Kyei, Gerome Breen, Alfredo Iacoangeli
― 9 minilectura
Tabla de contenidos
- Un Vistazo Rápido al ADN
- Tecnologías Genómicas
- Microarreglos de ADN
- Secuenciación de Lectura Corta
- Secuenciación de Lectura Larga
- Combinando Tecnologías
- La Importancia de la Calidad de Secuenciación
- Profundidad de Secuenciación
- Longitud de Lectura
- Mirando las Variantes
- Variantes de Nucleótido Individual (SNVs)
- Inserciones y Borrados (Indels)
- Variantes Estructurales (SVs)
- El Papel del Multiplexado
- Conclusión y Direcciones Futuras
- Fuente original
- Enlaces de referencia
La genómica es el estudio de los genes y sus funciones. Ha evolucionado un montón a lo largo de los años, especialmente después de que el Proyecto del Genoma Humano completara su trabajo hace casi veinte años. Este proyecto mapeó toda la secuencia de ADN humano, abriendo la puerta a un montón de estudios sobre la variación genética y cómo se relaciona con la salud y las enfermedades.
Un Vistazo Rápido al ADN
Quizás ya lo sabes, pero el ADN es básicamente el manual de instrucciones para construir y operar un organismo vivo. Consiste en secuencias de cuatro bloques químicos. Estos son adenina (A), citosina (C), guanina (G) y timina (T). Así como las letras en un libro crean palabras y oraciones, estos bloques forman el código que le dice a nuestros cuerpos qué hacer.
Tecnologías Genómicas
Con la mejora de las tecnologías, los científicos ahora pueden mirar nuestro ADN más de cerca que nunca. Esto significa que pueden detectar diferencias en nuestro ADN que podrían afectar nuestra salud. Hay varias herramientas que ayudan a los investigadores a analizar nuestra composición genética, cada una con sus pros y contras. Vamos a sumergirnos en algunas de ellas.
Microarreglos de ADN
Imagina un jardín chiquito lleno de flores diferentes, cada una representando un gen específico. Así es como funcionan los microarreglos de ADN. Son herramientas que pueden probar muchas variaciones de ADN conocidas a la vez. Piénsalos como el Ikea de la genética: ensamblan diferentes partes en un solo paquete compacto.
Un método popular que usa microarreglos de ADN son los arreglos SNP. Los SNPs, o polimorfismos de un solo nucleótido, son cambios diminutos en el ADN que pueden afectar cómo respondemos a medicamentos, qué tan propensos somos a ciertas enfermedades, y más. Las ventajas de usar arreglos SNP incluyen su rentabilidad y su capacidad para procesar grandes cantidades de datos rápidamente.
¡Pero hay una trampa! Solo pueden identificar cambios que ya hemos descubierto. Si aparece una nueva variación, los arreglos SNP no podrán encontrarla. Así que, si buscas variaciones raras, puede que quieras probar otra cosa.
Secuenciación de Lectura Corta
Luego tenemos la secuenciación de lectura corta, otra técnica que se usa a menudo en genómica. Es como leer un libro una oración a la vez en vez de mirar el panorama completo. Este método es popular porque es preciso y relativamente barato. Es perfecto para identificar mutaciones pequeñas porque puede mapear piezas diminutas de ADN con gran confianza.
Sin embargo, los científicos han notado que es complicado leer áreas complejas del ADN, que son como los giros y vueltas de una novela realmente complicada. En estas regiones, la secuenciación de lectura corta puede leer mal o pasar por alto algunas partes por completo, llevando a lagunas en nuestra comprensión. Es como tratar de encontrar tu camino a través de un laberinto con una linterna que sigue parpadeando.
Secuenciación de Lectura Larga
Para abordar estos problemas, los científicos recurrieron a la secuenciación de lectura larga, que es como leer todo el libro de una vez. Esta tecnología puede leer secciones mucho más largas de ADN de un tirón, ayudando a llenar los vacíos donde las técnicas de lectura corta a veces tropiezan. Oxford Nanopore Technologies (ONT) es una empresa que está haciendo olas en este espacio.
El método de ONT usa un enfoque único que implica pasar una hebra de ADN a través de un pequeño agujero, o nanoporo, mientras mide cambios en la electricidad. Esto permite a los científicos leer el ADN a medida que pasa a través del poro. ¿La parte más interesante? Estas lecturas largas pueden alcanzar longitudes de decenas de miles de nucleótidos, lo cual es útil para descifrar esas secciones complejas del ADN.
A pesar de algunos problemas iniciales con la precisión, las mejoras han llevado a resultados impresionantes. Los avances recientes significan que estas lecturas largas pueden ser casi tan precisas como las lecturas cortas, haciendo que la secuenciación de lectura larga sea un jugador valioso en la investigación genómica.
Combinando Tecnologías
Los investigadores a menudo usan una mezcla de tecnologías para pintar un panorama completo del genoma. Por ejemplo, pueden usar arreglos SNP para una visión general y luego secuenciación de lectura corta y larga para profundizar en áreas específicas de interés. Es como usar diferentes herramientas en tu caja de herramientas: cada una hace un trabajo mejor que las otras.
La Importancia de la Calidad de Secuenciación
Al realizar investigación genómica, la calidad importa. La calidad de la secuenciación puede afectar cuán confiados pueden estar los investigadores en los resultados. Imagina esto: estás armando muebles de Ikea y las piezas están mal etiquetadas. ¿Confiarías en que tu silla no se va a desmoronar? De manera similar, los estudios genómicos necesitan datos claros y de alta calidad para evitar errores.
Los investigadores miran varios factores, como la profundidad de secuenciación (cuántas veces se ha leído cada sección de ADN) y la longitud de lectura (cuán largas son las secuencias de ADN). Una mayor profundidad y longitudes de lectura diversas tienden a llevar a mejores resultados.
Profundidad de Secuenciación
En términos simples, si quieres saber qué está pasando en el genoma, leer más a menudo suele ser una buena estrategia. Cuando los investigadores aumentan la profundidad de secuenciación, a menudo encuentran que la precisión para identificar variantes genéticas mejora. Sin embargo, hay un punto de rendimientos decrecientes, como cuando estudiar a última hora solo funciona hasta cierto punto.
Longitud de Lectura
Las lecturas más largas no siempre son mejores, pero pueden ayudar al estudiar regiones complejas del genoma. Las lecturas más cortas pueden tener problemas para proporcionar el panorama completo, mientras que las lecturas más largas podrían brillar en estas áreas complicadas. En algunos estudios, los investigadores han notado un ligero descenso en el rendimiento de llamada de variantes a medida que aumentan las longitudes de lectura. Esto puede parecer contradictorio, pero es un recordatorio de que la genómica es un campo complejo y cada factor puede desempeñar un papel.
Mirando las Variantes
Las variantes en el ADN son como errores tipográficos en un libro. Algunas variantes son inofensivas, mientras que otras pueden llevar a enfermedades o afectar cómo respondemos a medicamentos. Por lo tanto, entender estas variantes es crucial para avanzar en la medicina personalizada y otras áreas de la atención médica.
Variantes de Nucleótido Individual (SNVs)
Entre los varios tipos de variantes genéticas, la variante de nucleótido individual (SNV) es como un solo error tipográfico en nuestro ADN. Identificar estos cambios diminutos es esencial para entender muchas condiciones. Los investigadores utilizan varias tecnologías para detectar estos SNVs, y diferentes plataformas a menudo producen resultados diferentes, dependiendo de sus fortalezas y debilidades.
Inserciones y Borrados (Indels)
A continuación están las inserciones y borrados, o indels, que son un poco como añadir o quitar palabras en una oración. Pueden cambiar el significado para mejor o para peor. Al igual que con los SNVs, los investigadores observan el rendimiento de diferentes plataformas de secuenciación al detectar estas variantes.
Encuentran que la secuenciación de lectura corta brilla cuando se trata de encontrar estos cambios en regiones más sencillas. Sin embargo, las lecturas más largas tienen mejores posibilidades de detectar indels en áreas complicadas del genoma. Así que, una vez más, no hay una solución única para todos.
Variantes Estructurales (SVs)
Ahora, hablemos de variantes estructurales. Piensa en estas como los reordenamientos de capítulos en un libro o incluso volúmenes enteros que desaparecen. Estructuralmente, estas variantes pueden ser grandes y complejas, y tanto la secuenciación de lectura larga como la corta contribuyen a identificarlas.
La secuenciación de lectura larga tiene una ventaja distinta cuando se trata de detectar variantes estructurales. Esta tecnología puede captar grandes cambios que podrían pasar desapercibidos con lecturas cortas. Por lo tanto, los investigadores pueden encontrar una mayor variedad de variantes estructurales al combinar resultados de ambas plataformas.
El Papel del Multiplexado
Los investigadores a menudo tratan de ahorrar tiempo y dinero secuenciando múltiples muestras a la vez mediante un método llamado multiplexado. Aunque esto puede ser una gran medida de ahorro de costos, a veces afecta la calidad de la secuenciación.
Es como invitar a demasiados invitados a una cena: aunque puedes alimentar a todos a la vez, la calidad de la comida puede sufrir si estiras demasiado tus recursos. Así que, mantener un equilibrio entre el número de muestras y la calidad de la secuenciación es crucial. Los investigadores encontraron que el multiplexado puede disminuir ligeramente la precisión en la detección de variantes, especialmente variantes estructurales. Sin embargo, optimizar el proceso podría ayudar a mitigar esos efectos.
Conclusión y Direcciones Futuras
A medida que la tecnología sigue evolucionando, los investigadores están emocionados por el potencial de combinar diferentes métodos de secuenciación. Esto abre puertas para explorar el genoma más que nunca. La genómica tiene el potencial de impactar la atención médica al permitir la medicina personalizada, solo piensa en ello como adaptar tratamientos a tu composición genética.
Con las mejoras continuas en las tecnologías de secuenciación y su integración en la investigación, podemos esperar obtener más información sobre la salud humana y las enfermedades. Después de todo, en el mundo de la genética, el juego apenas comienza, ¡y la búsqueda por entender nuestro ADN está lejos de terminar!
Fuente original
Título: Investigating the performance of Oxford Nanopore long-read sequencing with respect to Illumina microarrays and short-read sequencing
Resumen: Oxford Nanopore Technologies (ONT) long-read sequencing (LRS) has emerged as a promising tool for genomic analysis, but comprehensive comparisons with established platforms across diverse datasets remain limited. In this study, we present a comprehensive comparison of ONT long-read sequencing (LRS) against Illumina short- read sequencing (SRS) and microarray platforms across 14 human genomes. We performed ONT sequencing using both multiplexed and singleplexed approaches and compared the results with matched Illumina microarray and SRS data. We assessed sequencing quality metrics, variant detection performance for single nucleotide variants (SNVs), insertions/deletions (indels), and structural variants (SVs), while examining the impact of sequencing depth, read length, and multiplexing. ONT LRS demonstrated competitive performance with SRS for SNV detection, particularly in low complexity regions (F-measure: 0.763 vs 0.770), though with slightly lower performance in high complexity regions (F-measure: 0.954 vs 0.968). For indel detection, LRS showed robust performance in high complexity regions (F-measure: 0.850) which, however, decreased in low complexity regions (F-measure: 0.453). LRS identified 2.82 times more structural variants than SRS and detected variants across a broader size range (8 bp to 129 Mb vs 2 bp to 6 kb). Sequencing depth strongly correlated with variant calling performance across all variant types, with correlation coefficients of 0.80 for SNVs in high complexity regions, 0.84 for SNVs in low complexity regions, and exceeding 0.9 for indels. SV detection in LRS showed strong depth dependence (r = 0.939), while SRS SV calls remained stable across depths. Our findings demonstrate that ONT LRS complements existing sequencing technologies, offering advantages in detecting structural variants and analysing low complexity regions, while maintaining competitive performance in standard variant detection. This study provides practical insights for optimising ONT sequencing strategies and highlights areas for future methodological improvement.
Autores: Renato Santos, Hyunah Lee, Alexander Williams, Anastasia Baffour-Kyei, Gerome Breen, Alfredo Iacoangeli
Última actualización: 2024-12-22 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.12.19.629409
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.12.19.629409.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.