Avances en la Anotación del Genoma: La Herramienta Compañera Toma la Delantera
La herramienta Companion simplifica la anotación del genoma, asegurando mejores resultados y una mejor experiencia para el usuario.
― 7 minilectura
Tabla de contenidos
En los últimos 15 años, las nuevas tecnologías para leer ADN han mejorado un montón. Esto incluye la secuenciación de lectura larga, que puede leer piezas más largas de ADN. El costo de la secuenciación también ha bajado. Estos cambios, junto con programas de computadora más chidos para juntar genomas, han permitido a los científicos crear secuencias completas de ADN para muchas especies. Esto es especialmente importante para especies con ADN complejo o repetitivo, que eran difíciles de leer con métodos más viejos. Un proyecto ambicioso que ha surgido de estos avances es el Proyecto Earth BioGenome, que busca secuenciar unas 1.5 millones de las aproximadamente 10-15 millones de especies en el grupo eucariota.
Aunque ahora hacer secuencias de genomas es más fácil, entender lo que significan esas secuencias-conocido como anotación-sigue siendo un tema complicado. Muchas herramientas de investigación que se usan para esta tarea a menudo producen solo un 55-70% de precisión al definir genes. Este problema viene de que diferentes organismos tienen diferentes estructuras genéticas, incluyendo varias maneras en que los genes pueden ser combinados. Incluso los métodos más nuevos que usan secuenciación de lectura larga para ARN pueden resultar en anotaciones de baja calidad.
El proceso de anotación de genomas a menudo implica múltiples herramientas que sirven para diferentes propósitos, como encontrar genes o identificar ARN no codificante. Además, enviar estas anotaciones a bases de datos internacionales puede ser difícil debido a los procedimientos complicados. Como resultado, muchas anotaciones de genomas no están fácilmente disponibles para el público, lo que va en contra de los principios que promueven hacer los datos localizables, accesibles, interoperables y reutilizables.
Herramientas para la Anotación de Genomas
Se han desarrollado varias herramientas automatizadas para ayudar con la anotación de genomas. Sin embargo, algunas de estas herramientas carecen de características amigables como interfaces web, lo que las hace más difíciles de usar. Por otro lado, hay herramientas basadas en la web como GenSAS y MEGANTE que son más fáciles de usar pero tienen sus propias limitaciones. Por ejemplo, MEGANTE tiene un límite máximo de tamaño de archivo, y el Pipeline de Anotación Eucariota de NCBI requiere que los usuarios soliciten anotaciones por correo electrónico, lo que centraliza el proceso y puede ralentizar las cosas.
En 2016, se introdujo una herramienta llamada Companion, diseñada para hacer más fácil el proceso de anotación. Companion usa genomas de referencia existentes para ayudar a proporcionar anotaciones precisas. Utiliza diferentes herramientas para comparar las secuencias y predecir ubicaciones de genes. Los resultados de Companion se pueden descargar fácilmente en varios formatos, lo que lo hace conveniente para los usuarios. También tiene características visuales, como estadísticas resumen y árboles filogenéticos, que ayudan a los usuarios a evaluar la calidad de las anotaciones generadas.
A pesar de tener un número pequeño de usuarios enfocados en parásitos, Companion ganó popularidad. A medida que el número de ensamblajes genómicos aumentó en las comunidades de vectores y artrópodos, se hizo evidente la necesidad de que Companion pudiera manejar genomas más grandes. Las pruebas con estos genomas más grandes mostraron que algunas partes de la herramienta Companion necesitaban ser actualizadas para funcionar de manera eficiente.
Mejoras en Companion
La nueva versión de Companion está configurada como un pipeline para hacerlo más rápido y confiable. Ahora puede manejar genomas de hasta 3 GB, aunque funciona mejor con genomas de alrededor de 1 GB. Se han hecho varias nuevas características y mejoras en el software. El backend ha sido optimizado para asegurar que la herramienta funcione de manera fluida y rápida.
El servidor web de Companion está alojado en un sistema potente que puede manejar múltiples solicitudes a la vez. Esto permite a los usuarios ejecutar sus trabajos sin demoras. También hay un servidor separado usado para probar nuevas características sin afectar el servicio principal.
Para comparar el rendimiento de Companion con otras herramientas, se realizaron pruebas usando las mismas secuencias de entrada. Se encontró que Companion era mucho más fácil de usar en comparación con GenSAS, con menos clics necesarios para enviar un trabajo. Además, la configuración en Companion es más directa, ya que todas las opciones están disponibles en una sola página, mientras que GenSAS requiere navegar a través de múltiples pestañas.
Comparación de Rendimiento
En varias pruebas comparando Companion y GenSAS, Companion consistentemente produjo mejores resultados. Por ejemplo, en una comparación usando especies de Plasmodium, Companion no solo encontró un mayor número de genes, sino que también tuvo un mejor emparejamiento para las ubicaciones de los genes. GenSAS tuvo problemas para identificar ciertos genes, lo que podría deberse a la forma en que combina múltiples transcritos en un solo gen.
Otra comparación se hizo usando especies de hongos. Aunque ambas herramientas subestimaron el número total de genes, Companion mostró resultados más consistentes en las métricas utilizadas. Aunque GenSAS registró una mayor precisión de nucleótidos, aún así se perdió muchos genes.
Una evaluación final se llevó a cabo usando una especie de vector. Los resultados fueron algo similares a las pruebas anteriores con hongos. Aunque ambas herramientas tuvieron problemas para predecir el número de genes, Companion demostró mayor precisión en la identificación de dominios de genes.
En general, Companion demostró ser más amigable y proporcionó anotaciones de alta calidad más rápido que GenSAS.
El Futuro de la Anotación de Genomas
Proyectos como el Proyecto Earth BioGenome buscan secuenciar genomas para millones de especies, planteando preguntas importantes sobre cómo se anotarán estos genomas. Algunos proyectos tienen sus propios pipelines para esto, pero muchos grupos están trabajando juntos para crear datos genómicos de alta calidad. Tener un servicio bien probado como Companion podría ahorrar tiempo y esfuerzo en comparación con cada grupo creando sus propios sistemas.
Una consideración importante es el cuello de botella que existe al enviar genomas a bases de datos. A pesar de los esfuerzos por agilizar este proceso, muchos secuencias genómicas se envían sin anotaciones, lo que limita su utilidad. Companion busca resolver estos problemas ofreciendo un servicio simple y gratuito que incluye opciones visuales y produce anotaciones de calidad.
También se reconoce que la anotación de genomas sigue siendo un desafío. Incluso con herramientas avanzadas, lograr alta precisión sigue siendo difícil para muchas especies, como los vectores. Esto destaca la necesidad de curaduría manual para especies clave como los humanos y Plasmodium. Aun así, Companion puede generar buenas anotaciones iniciales, que pueden servir como punto de partida para una mayor refinación.
En conclusión, Companion ofrece un robusto servidor web para la anotación de genomas, ayudando a los investigadores a enfrentar las dificultades en este campo. El número de usuarios se ha triplicado en los últimos años, sugiriendo un interés creciente en la herramienta, especialmente a medida que se secuencian más especies. Companion se posiciona como un recurso valioso para la comunidad científica, particularmente en el estudio de varios organismos.
Título: Annotation and visualisation of parasite, fungi and arthropod genomes with Companion
Resumen: Although sequencing genomes has become increasingly popular, there is still a bottleneck for the annotation of the resulting assemblies. Structural and functional annotation is still challenging as it includes finding the correct gene sequences, annotating other elements such as RNA and being able to submit those data to databases to share it with the community. We developed the Companion web server to allow non-experts to annotate their genome using a reference-based method, enabling them to analyse their results before submitting to public databases. In this update paper, we describe how we included novel methods for gene finding and made the server more efficient to annotate genomes of up to 1 GB in size. The reference set was increased to genomes from the fungi and arthropod kingdoms. We show that Companion outperforms existing comparable tools. GRAPHICAL ABSTRACT O_FIG O_LINKSMALLFIG WIDTH=200 HEIGHT=145 SRC="FIGDIR/small/580948v1_ufig1.gif" ALT="Figure 1"> View larger version (35K): [email protected]@b98a5aorg.highwire.dtl.DTLVardef@12a2d8corg.highwire.dtl.DTLVardef@144b21_HPS_FORMAT_FIGEXP M_FIG C_FIG
Autores: Thomas D Otto, W. Haese-Hill, K. Crouch
Última actualización: 2024-02-21 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.19.580948
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.19.580948.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.