Squigualiser: Una Nueva Herramienta para la Visualización de Datos de Señal de Nanoporos
Una nueva herramienta para simplificar la interpretación de datos de secuenciación por nanoporo.
― 9 minilectura
Tabla de contenidos
La secuenciación por nanoporo es un método que se usa para analizar ADN, ARN y proteínas directamente. Esta tecnología tiene un montón de aplicaciones potenciales en las ciencias de la vida. Los dispositivos de Oxford Nanopore Technologies miden cómo cambia la corriente iónica cuando una molécula de ADN o ARN pasa por un pequeño poro de proteína. Este proceso crea una especie de datos de señal eléctrica, a menudo llamados datos 'squiggle'. Los investigadores pueden interpretar estos datos para leer las secuencias de las moléculas.
Lo que hace que la secuenciación por nanoporo sea diferente de otros métodos de secuenciación es cómo captura los datos. Otras tecnologías de secuenciación de alta velocidad utilizan detección óptica, que se basa en marcadores fluorescentes para identificar las bases del ADN. En cambio, la tecnología de nanoporo recopila datos continuos en múltiples dimensiones, lo que permite un análisis variado. Los datos recogidos están influenciados por cualquier característica de la molécula que pueda cambiar el flujo de corriente a través del nanoporo, así como por qué tan rápido se mueve la molécula a través de él. Esto significa que la secuenciación por nanoporo puede detectar diversas bases de ADN o ARN modificadas, daños en el ADN e incluso estructuras específicas del ARN.
Aunque la secuenciación por nanoporo ha mostrado promesas, la complejidad de los datos de señal hace que muchos investigadores tengan dificultades para interpretarlos. Si bien ha habido avances en la identificación de algunas modificaciones, muchos usuarios todavía prefieren trabajar con los datos más simples de llamadas de bases.
Un gran desafío es visualizar estos complejos datos de señal de nanoporo de manera efectiva. Para ayudar con esto, se desarrolló una nueva herramienta llamada Squigualiser. Esta herramienta facilita la Visualización de datos de señal de una manera intuitiva. Squigualiser utiliza métodos existentes para alinear los datos de señal en bruto con sus respectivas posiciones en las lecturas de llamadas de bases o secuencias de referencia, creando una representación visual más comprensible.
Squigualiser: una nueva herramienta de visualización
Squigualiser es un conjunto de herramientas diseñado para visualizar datos de señal de nanoporo, específicamente para la secuenciación de ADN y ARN. Permite a los usuarios integrar datos de señal en bruto, lecturas de llamadas de bases, secuencias de referencia y otra información genómica en un formato más fácil de entender. El software crea una vista de navegador interactiva, lo que facilita a los usuarios explorar regiones específicas de datos.
Al usar Squigualiser, los puntos de datos de señal en bruto se muestran junto a sus nucleótidos correspondientes en una lectura de llamada de bases o en una secuencia de referencia. Los puntos de datos se grafican para mostrar la corriente iónica a lo largo del tiempo mientras se secuencia la molécula. El eje horizontal muestra el tiempo y el eje vertical muestra la corriente. La visualización se puede ajustar para mostrar perspectivas basadas en el tiempo o en la molécula, dependiendo de lo que necesite el usuario.
Visualizando datos de señal alineados por secuencia
Squigualiser permite a los usuarios visualizar la relación entre los datos de señal y secuencias específicas de manera efectiva. El conjunto de herramientas puede generar vistas donde múltiples lecturas independientes se apilan verticalmente, lo que facilita la comparación de diferentes conjuntos de datos. Los usuarios pueden seleccionar qué lecturas mostrar y pueden ver información tanto de hebras sentido como antisentido, organizadas de manera clara.
Por ejemplo, los usuarios pueden ver cómo las lecturas independientes se alinean con el genoma de referencia. Esto incluye observar datos de casos con variaciones conocidas, lo que puede resaltar diferencias causadas por cambios genéticos o modificaciones. La capacidad de Squigualiser para mostrar numerosos conjuntos de datos simultáneamente proporciona profundidad al análisis, dando información sobre variantes genéticas y otras características moleculares.
Métodos de alineación de señales
Alinear los datos de señal con precisión es crucial para una visualización efectiva. Squigualiser lee y escribe en formatos de datos familiares que se utilizan comúnmente en genómica, pero los personaliza para datos de señal. Un método de codificación simple, llamado 'ss tag', se utiliza para almacenar de manera compacta información sobre la alineación de señales. Esta etiqueta ayuda a normalizar cómo se representan diferentes alineaciones de señales, permitiendo la compatibilidad con varios métodos y software utilizados en la secuenciación.
Squigualiser puede trabajar con múltiples métodos de alineación, dando a los usuarios la flexibilidad de elegir el que mejor se adapte a sus necesidades. Por ejemplo, los usuarios pueden extraer información de alineación directamente de software de llamadas de bases o usar herramientas de alineación externas. Esta diversidad en los enfoques permite a los investigadores evaluar diferentes métodos y seleccionar el más preciso para su conjunto de datos particular.
Abordando los desafíos de resolución
Una limitación de los métodos de visualización existentes es que no proporcionan la mejor resolución durante la alineación de señales. Los métodos tradicionales anclan los cambios de señal a segmentos más grandes de ADN en lugar de bases individuales. Esto lleva a huecos en la precisión, dificultando vincular cambios de señal directamente con variantes genéticas o modificaciones específicas.
Para mejorar esto, Squigualiser utiliza una estrategia llamada corrección de desplazamiento de k-mer a base. Este método asegura que cada señal esté alineada correctamente con su base genética correspondiente. Al identificar qué base afecta significativamente la señal y calcular los desplazamientos en consecuencia, Squigualiser mejora la calidad de la visualización.
Este enfoque ha sido probado con variantes genéticas conocidas, mostrando que la corrección conduce a distinciones más claras entre diferentes señales alélicas, lo cual es esencial para interpretar los datos con precisión.
Aplicaciones prácticas de Squigualiser
Squigualiser tiene muchas aplicaciones prácticas para investigadores que trabajan con ADN y ARN modificados. A menudo, estas modificaciones pueden cambiar sutilmente la señal generada durante la secuenciación. Al visualizar los datos de señal, los investigadores pueden entender y confirmar mejor la presencia de estas modificaciones.
Visualizando modificaciones del ADN
Por ejemplo, al estudiar modificaciones específicas del ADN, como la 5-metilcitosina (5mC), Squigualiser puede ayudar a los investigadores a inspeccionar visualmente los datos de secuenciación. El programa puede mostrar cómo las bases modificadas afectan la señal en comparación con las bases estándar. Al analizar estas diferencias, los usuarios pueden validar hallazgos de otras herramientas de análisis.
Por ejemplo, en un análisis reciente de datos de secuenciación de ADN, los investigadores pudieron identificar regiones donde ocurre la metilación al separar lecturas basadas en el estado de metilación predicho. Esto permitió obtener información más clara sobre cómo estas modificaciones impactan la información genética subyacente.
Visualizando modificaciones del ARN
Squigualiser también es útil para analizar modificaciones del ARN. El ARN puede experimentar varios cambios, como la adición de pseudouridina (Ψ). Estos cambios pueden afectar significativamente los datos de secuenciación. Por ejemplo, en experimentos que comparan moléculas de ARN sintéticas con y sin modificaciones Ψ, Squigualiser permitió a los investigadores visualizar claramente las diferencias.
Al usar la herramienta, los investigadores pudieron observar cómo estas modificaciones afectan la calidad de la señal y hacer ajustes en los métodos de alineación para mejorar la precisión. Esta adaptabilidad es crucial al tratar con secuencias y modificaciones de ARN diversas.
Por qué Squigualiser es importante
Squigualiser representa un avance significativo en la visualización de datos de señal de nanoporo. En comparación con otras herramientas disponibles, ofrece una experiencia más interactiva y personalizable. Las herramientas anteriores a menudo crean imágenes estáticas o carecen de la capacidad para mostrar múltiples conjuntos de datos a la vez. La interfaz dinámica de usuario de Squigualiser permite una mejor exploración y comprensión de datos de señal complejos.
La capacidad de visualizar datos en un formato de navegador facilita un enfoque más intuitivo para el análisis de datos. Los usuarios pueden personalizar sus vistas, acercarse a regiones específicas y comparar fácilmente diferentes lecturas y conjuntos de datos. Esta flexibilidad convierte a Squigualiser en una herramienta esencial para investigadores en genética y biología molecular.
Además, el enfoque de Squigualiser para la visualización de señales incorpora varios métodos innovadores, lo que permite a los investigadores lograr resolución de base única en sus análisis. Este detalle es vital al interpretar datos biológicos complejos y comprender los mecanismos subyacentes en juego.
Desarrollos futuros
De cara al futuro, los desarrolladores de Squigualiser tienen planes para mejorar aún más la experiencia del usuario al pasar a una plataforma basada en la web con una interfaz gráfica. Este movimiento tiene como objetivo hacer que la herramienta sea aún más accesible para investigadores que pueden no tener amplias habilidades de programación.
En general, Squigualiser está posicionado para tener un impacto significativo en el campo de la genómica. Al proporcionar una forma efectiva de visualizar e interpretar datos de señal de nanoporo, abre nuevas posibilidades para la investigación y el descubrimiento. A medida que más investigadores adopten esta herramienta, puede llevar a más innovaciones y mejoras en nuestra comprensión de las modificaciones del ADN y ARN, enriqueciendo en última instancia el campo de las ciencias de la vida.
Título: Interactive visualisation of raw nanopore signal data with Squigualiser
Resumen: Nanopore sequencing measures ionic current during the translocation of DNA, RNA or protein molecules through a nanoscale protein pore. This raw current signal data can be basecalled into sequence information and has the potential to identify other diverse molecular features, such as base modifications, secondary structures, etc. Despite the unique properties and potential utility of nanopore signal data, there are currently limited options available for signal data visualisation. To address this, we have developed Squigualiser, a toolkit for intuitive, interactive visualisation of sequence-aligned signal data, which currently supports both DNA and RNA sequencing data from Oxford Nanopore Technologies (ONT) instruments. A series of methodological innovations enable efficient alignment of raw signal data to a reference genome/transcriptome with single-base resolution. Squigualiser generates an interactive signal browser view (HTML file), in which the user can navigate across a genome/transcriptome region and customise the display. Multiple independent reads are integrated into a signal pileup format and different datasets can be displayed as parallel tracks to facilitate their comparison. Squigualiser provides the most sophisticated framework for nanopore signal data visualisation to date and will catalyse new advances in signal analysis. We provide Squigualiser as an open-source tool for the nanopore community: https://github.com/hiruna72/squigualiser
Autores: Ira Deveson, H. Samarakoon, K. Liyanage, J. Ferguson, S. Parameswaran, H. Gamaarachchi
Última actualización: 2024-03-01 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.19.581111
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.19.581111.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.