Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Presentamos Goldfinder: Una Nueva Herramienta para Analizar Relaciones Genéticas

Goldfinder simplifica el estudio de combinaciones de genes en poblaciones bacterianas.

― 6 minilectura


Goldfinder: RelacionesGoldfinder: RelacionesGenealógicas Reveladascombinaciones de genes en bacterias.Una nueva herramienta para estudiar
Tabla de contenidos

El Pangenoma se refiere al conjunto completo de genes que se encuentran dentro de una población de bacterias o arqueas. Cada organismo individual en esta población lleva solo una parte de esos genes, pero juntos forman un pool genético más grande. Esto significa que algunos genes son comunes entre muchos organismos, mientras que otros solo se encuentran en unos pocos. Además, los genes deben trabajar juntos de manera efectiva para que el organismo prospere.

El Rol de las Combinaciones de Genes

Las investigaciones muestran que el efecto de un gen en la aptitud de un organismo puede variar dependiendo de otros genes presentes. Esto sugiere que algunos genes pueden interactuar positivamente, brindando beneficios cuando trabajan juntos, mientras que otros podrían competir o interferir entre sí, llevando a efectos negativos. Por ejemplo, los sistemas de defensa bacterianos que protegen contra virus u otros elementos genéticos dañinos a menudo consisten en varios genes que colaboran. Otro ejemplo incluye grupos específicos de genes responsables de producir sustancias esenciales. Estos genes necesitan estar presentes juntos para que todo el proceso de producción funcione.

Presión de Selección sobre Combinaciones de Genes

El objetivo de estudiar estas combinaciones de genes es determinar cuáles están bajo Selección Natural. Al examinar qué genes aparecen frecuentemente juntos en diferentes cepas de bacterias, los científicos pueden inferir si ciertos genes tienden a coexistir o a evitarse. Sin embargo, es importante considerar que algunos genes pueden aparecer juntos simplemente debido a su herencia conjunta de un ancestro común, en lugar de estar funcionalmente relacionados.

Si dos genes se encuentran frecuentemente juntos porque ambos fueron heredados de generaciones de un mismo ancestro, este fenómeno se conoce como vinculación por descendencia. Por el contrario, si han sido ganados o perdidos múltiples veces en una línea, indica que probablemente necesiten trabajar juntos. Por lo tanto, los científicos deben analizar las relaciones evolutivas entre diferentes cepas para separar la verdadera co-ocurrencia o evitación de la mera ascendencia compartida.

Enfoques Existentes para Estudiar Combinaciones de Genes

Se han creado muchas herramientas para analizar cómo aparecen juntos los genes y para tener en cuenta las relaciones evolutivas. Sin embargo, estas herramientas a menudo dependen de modelos matemáticos complejos, que pueden ser lentos y pueden considerar solo un pequeño número de genes a la vez. Otros modelos menos complejos son más rápidos, pero pueden no utilizar el conjunto completo de genes en el análisis.

Un área de investigación estrechamente relacionada son los estudios de asociación a nivel del genoma, que examinan los vínculos entre variaciones genéticas y rasgos específicos. En este contexto, entender las relaciones genéticas generales entre bacterias es crucial, especialmente al evaluar combinaciones de genes.

Presentando Goldfinder

Aquí llega Goldfinder, una herramienta diseñada para estudiar las relaciones entre genes mientras considera la ascendencia compartida. Goldfinder es eficiente y se basa en un método no paramétrico que utiliza simulaciones con un árbol genético proporcionado.

Goldfinder tiene como objetivo identificar pares de genes que o bien aparecen juntos frecuentemente o tienden a evitarse. Los genes pueden mostrar patrones similares no porque estén directamente relacionados, sino debido a su herencia de ancestros o la estructura de la población. Los genes que brindan un beneficio significativo cuando están presentes juntos probablemente ocurrirán juntos más a menudo en una población.

Goldfinder distingue entre pares de genes que co-ocurren debido a la ascendencia compartida y aquellos que lo hacen por selección natural. Para hacer esto, la herramienta genera patrones esperados basados en las relaciones entre cepas e identifica combinaciones que aparecen más a menudo de lo que la casualidad sugeriría.

Cómo Funciona Goldfinder

Goldfinder requiere dos piezas principales de información: un árbol filogenético radicado, que muestra cómo diferentes cepas están relacionadas, y los patrones de presencia-ausencia de genes para cada cepa. Si el árbol no está raicado, Goldfinder determinará una raíz utilizando un método de punto medio.

Una vez que obtiene estos datos, Goldfinder calcula puntajes que reflejan la probabilidad de co-ocurrencia o evitación de genes. Estos puntajes difieren en cuán efectivamente identifican relaciones genuinas en lugar de ocurrencias casuales. Goldfinder utiliza tres métodos de puntuación distintos: el puntaje terminal, el puntaje Coinfinder y el puntaje simultáneo.

El puntaje terminal evalúa cuántas cepas tienen ambos genes presentes o ausentes, mientras que el puntaje Coinfinder se enfoca en la presencia de un gen en relación con la ausencia del otro. El puntaje simultáneo lleva esto un paso más allá al observar las ramas del árbol filogenético para ver cómo los genes han cambiado de estado a lo largo del tiempo.

Simulando Distribuciones Nulas

Para entender qué constituye un nivel inusual de co-ocurrencia entre genes, Goldfinder se basa en simulaciones para crear una distribución de puntajes esperados si no hubiera relaciones genuinas entre los genes. Esto significa ejecutar simulaciones donde los genes evolucionan de manera independiente. Al comparar datos reales con esta distribución simulada, Goldfinder puede derivar valores p para pares de genes que muestran si su co-ocurrencia o evitación es estadísticamente significativa.

La herramienta también puede crear redes que visualizan estas relaciones, ilustrando qué genes tienden a agruparse y cuáles evitan entre sí. Esto ofrece una imagen más clara de las conexiones dentro del pool genético.

Identificando Grupos de Genes

Cuando se encuentra un número significativo de pares de genes asociados, Goldfinder puede conectarlos, formando redes más grandes de genes que co-ocurren. Dentro de estas redes, se pueden identificar densos grupos de genes que aparecen frecuentemente juntos usando algoritmos diseñados para este propósito.

Además, Goldfinder puede analizar las disociaciones entre estos grupos de genes, proporcionando información sobre cómo diferentes grupos de genes interactúan o se evitan entre sí.

Visualización y Aplicaciones Prácticas

Goldfinder produce varias visualizaciones que permiten a los usuarios explorar las redes de co-ocurrencia de genes. Estas visualizaciones se pueden examinar más a fondo usando software diseñado para representación gráfica, facilitando la comprensión de las relaciones entre los genes.

Los investigadores pueden aplicar Goldfinder a diversas poblaciones bacterianas, ayudándoles a descubrir información sobre las dinámicas evolutivas en juego. Al comparar los hallazgos de Goldfinder con los de herramientas existentes, se hace evidente que, aunque Goldfinder puede identificar menos pares de genes, a menudo reconoce un rango más amplio de genes involucrados en la co-selección.

Esta herramienta ayuda a los investigadores a discernir las fuerzas que dan forma a la diversidad genética en poblaciones bacterianas, ofreciendo un método para futuros estudios que busquen desentrañar las complejidades que se encuentran dentro de las comunidades microbianas.

Fuente original

Título: Goldfinder: Unraveling Networks of Gene Co-occurrence and Avoidance in Bacterial Pangenomes

Resumen: The pangenome is the set of all genes present in a prokaryotic species. Most pangenomes contain many accessory genes that are present in only some of the species members. Genes need to function together, and it has been suggested that selection for certain gene combinations affects the structure of prokaryotic pangenomes. Nevertheless, genes might also co-occur simply due to being linked on the genome, and efficient tools are needed to distinguish linkage from co-selection. Here we present Goldfinder, an approach to infer co-occurrence and co-avoidance between gene pairs by taking the phylogenetic relationships of the species into account. The approach is implemented in an efficient Python script available at https://github.com/fbaumdicker/goldfinder. We also provide scripts for clustering co-occurring genes and for visualizing the resulting co-occurrence and co-avoidance networks in Cytoscape. In comparison to the co-occurrence inference tool Coinfinder, Goldfinder finds fewer co-occurring pairs in a real species pangenome, suggesting that fewer spurious associations due to phylogenetic dependencies are detected. We conclude that Goldfinder is a fast and accurate tool to infer gene co-occurrence and co-avoidance, which will enable large-scale analyses to infer co-selected genes across bacterial pangenomes.

Autores: Franz Baumdicker, A. Gavriilidou, E. Paulitz, C. Resl, N. Ziemert, A. Kupczok

Última actualización: 2024-05-02 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.04.29.591652

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.04.29.591652.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares