Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Presentamos LoVis4u: Una nueva herramienta para la visualización genómica

LoVis4u ofrece una manera simple de visualizar múltiples regiones genómicas de manera rápida.

― 7 minilectura


LoVis4u: Herramienta deLoVis4u: Herramienta deVisualización Genómicagenómicos.para análisis rápido de datosUna herramienta de línea de comandos
Tabla de contenidos

En los últimos años, el número de bases de datos de Genomas microbianos ha crecido rápido. Este aumento ofrece muchas oportunidades para estudiar y comparar diferentes genomas. Los científicos pueden hacer varias cosas, como ver cómo están organizados ciertos genes, identificar pequeñas regiones funcionales y verificar dónde ocurren diferencias genéticas. Para hacer estas tareas, los investigadores a menudo necesitan ver varias partes de los genomas a la vez.

Herramientas para Visualizar Datos Genómicos

Se han creado muchas herramientas de software para ayudar a visualizar datos genómicos. Algunas herramientas tienen interfaces fáciles de usar, lo que permite a la gente interactuar fácilmente con los datos. Ejemplos de estas herramientas incluyen:

  • Artemis Comparison Tool
  • Easyfig
  • GeneSpy
  • Geneious Prime

También hay aplicaciones en la web, como Gene Graphics, y bibliotecas de programación como:

  • Paquetes de R como genoPlotR y gggenes
  • Paquete de Python GenomeDiagram

Algunas herramientas incluso combinan diferentes métodos para ofrecer más soluciones. Por ejemplo, GEnView fusiona un pipeline de Python con una aplicación web, mientras que Clinker y clustermap.js ofrecen una Interfaz de Línea de Comandos y una interfaz basada en la web para crear gráficos vectoriales.

A pesar de las muchas herramientas disponibles, todavía hay una brecha. No hay una herramienta de línea de comandos simple que permita a los usuarios manejar múltiples genomas a la vez, ofrezca personalización flexible y produzca figuras de alta calidad rápidamente.

Presentando LoVis4u

LoVis4u, que significa Visualización de Locus, es una nueva herramienta de software diseñada para ayudar a los usuarios a visualizar múltiples áreas genómicas de manera fácil y rápida. Ofrece una interfaz de línea de comandos, por lo que los usuarios no necesitan escribir scripts complicados. También incluye una API de Python para quienes quieran más formas de personalizarlo e integrarlo en sus proyectos de Python.

Además de sus capacidades de visualización, LoVis4u también puede realizar análisis de datos opcionales. Esto incluye agrupar proteínas para juntar proteínas similares. Luego, los usuarios pueden identificar qué genes son esenciales y cuáles son más variables, y esta información se puede resaltar en la visualización.

Aunque LoVis4u fue construido principalmente para analizar genomas de bacteriófagos, también se puede usar para cualquier genoma procariota.

Cómo Funciona LoVis4u

LoVis4u tiene un flujo de trabajo sencillo que incluye varios pasos para procesar datos, aunque muchos son opcionales según lo que el usuario quiera (ver Fig 1A). LoVis4u acepta datos de entrada en formato GenBank o GFF extendido, que incluye las secuencias nucleotídicas relevantes en formato Fasta. Estos archivos GFF a menudo se crean utilizando herramientas comunes de anotación de genomas como prokka y pharokka.

Características de Visualización

Las capacidades de visualización de LoVis4u son diversas. Por ejemplo, la herramienta puede representar múltiples regiones de diferentes genomas de fagos en una sola figura. En esta visualización, los genes conservados se muestran en gris, mientras que los grupos de proteínas variables se colorean de manera diferente. Si las proteínas son homólogas y pertenecen a diferentes genomas, están conectadas con líneas grises. Los usuarios pueden elegir ocultar etiquetas para ciertas proteínas si lo desean, mientras que las etiquetas para proteínas conservadas aparecen solo una vez para evitar desorden.

Las anotaciones funcionales proporcionadas por PHROG también se muestran utilizando líneas codificadas por colores debajo de cada secuencia codificante. Si el usuario prefiere una visualización compacta, LoVis4u también puede condensar la salida para mostrar secuencias completas sin detalles adicionales.

Agrupamiento y Visualización de Proteínas

Por defecto, LoVis4u utiliza el algoritmo de agrupamiento de proteínas MMseqs2 para agrupar proteínas similares de todas las secuencias codificadas. Sin embargo, los usuarios también pueden proporcionar su propia tabla de grupos de proteínas predefinidos. Basándose en estos grupos, LoVis4u genera una matriz que muestra cuán similares son las composiciones de proteínas entre diferentes genomas.

Este agrupamiento ayuda a identificar qué proteínas son conservadas, intermedias o variables, similar a cómo la pangenómica clasifica genes en categorías de núcleo, shell y nube. Aunque hay otras herramientas, como PhamClust, que pueden realizar un agrupamiento similar, carecen de características de visualización.

Ejecutando LoVis4u

LoVis4u ofrece un modo de inicio rápido para usuarios que quieren empezar de inmediato con una configuración mínima. Sin embargo, para usuarios más avanzados, hay muchas opciones de personalización. Los usuarios pueden cambiar el orden de sus secuencias, especificar grupos y ajustar parámetros de visualización como el tamaño de la figura. Además, los usuarios tienen la opción de usar tablas para modificar colores y etiquetas en la salida.

Después de ejecutar LoVis4u, las figuras generadas se guardan en formato PDF, permitiendo una fácil edición en software de diseño gráfico como Adobe Illustrator o Inkscape.

Ejemplos de Salida

Para ilustrar sus capacidades, LoVis4u se ha utilizado para crear visualizaciones de toda la colección de 78 fagos de Basilea en una sola figura. Este proceso implicó agrupar más de 13,000 secuencias de proteínas, organizarlas en función de su similitud y generar una salida gráfica, todo en solo 50 segundos en una laptop estándar.

Bibliotecas Usadas

LoVis4u está construido usando Python3 y depende de varias bibliotecas, incluyendo biopython, bcbio-gff, y varias otras para el procesamiento y visualización de datos. También utiliza MMseqs2 como una dependencia separada integrada dentro de la biblioteca.

Los usuarios pueden instalar LoVis4u fácilmente desde PyPI y acceder al código fuente en GitHub. Hay documentación detallada, guías de instalación y manuales guiados por ejemplos disponibles en la página principal de la herramienta.

Interfaz de Línea de Comandos Amigable

Para asegurarse de que los usuarios puedan trabajar fácilmente con LoVis4u, viene con una interfaz de línea de comandos que no requiere ningún scripting complicado. La mayoría de las opciones son accesibles directamente a través de la interfaz, mientras que preferencias adicionales pueden definirse en archivos de configuración.

La API de Python permite aún más a los usuarios crear soluciones personalizadas o integrar LoVis4u en sus flujos de trabajo existentes de Python.

Conclusión

En estudios genómicos comparativos, tener las herramientas adecuadas es esencial para una visualización y análisis efectivos. LoVis4u llena una necesidad crucial al proporcionar un equilibrio entre herramientas sofisticadas de API R/Python y programas gráficos fáciles de usar. Sirve como una solución rápida y eficiente para generar múltiples figuras en flujos de trabajo de bioinformática o como una herramienta independiente para la investigación de datos. Al identificar y marcar regiones genómicas conservadas y variables, LoVis4u puede apoyar comprensiones sobre relaciones evolutivas y revelar nuevos hallazgos biológicos.

Fuente original

Título: LoVis4u: Locus Visualisation tool for comparative genomics

Resumen: SummaryComparative genomic analysis often involves visualisation of alignments of genomic loci. While several software tools are available for this task, ranging from Python and R libraries to standalone graphical user interfaces, there is lack of a tool that offers fast, automated usage and the production of publication-ready vector images. Here we present LoVis4u, a command-line tool and Python API designed for highly customizable and fast visualisation of multiple genomic loci. LoVis4u generates vector images in PDF format based on annotation data from GenBank or GFF files. It is capable of visualising entire genomes of bacteriophages as well as plasmids and user-defined regions of longer prokaryotic genomes. Additionally, LoVis4u offers optional data processing steps to identify and highlight accessory and core genes in input sequences. Availability and ImplementationLoVis4u is implemented in Python3 and runs on Linux and MacOS. The command-line interface covers most practical use cases, while the provided Python API allows usage within a Python program, integration into external tools, and additional customisation. Source code is available at the GitHub page: github.com/art-egorov/lovis4u. Detailed documentation that includes an example-driven guide is available from the software home page: art-egorov.github.io/lovis4u.

Autores: Gemma C. Atkinson, A. A. Egorov

Última actualización: 2024-09-14 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.09.11.612399

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.09.11.612399.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Artículos similares