Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Genómica

GALEON: Uma Nova Ferramenta para Análise de Famílias de Genes

O GALEON ajuda os pesquisadores a entender os grupos de famílias de genes e sua evolução.

― 7 min ler


GALEON Transforma AnáliseGALEON Transforma AnáliseGenéticade grupos de genes e evolução.Nova ferramenta avança na compreensão
Índice

Agrupamentos de Genes são grupos de genes que trabalham juntos para fazer funções específicas. Esses agrupamentos são frequentemente encontrados nos genomas de organismos vivos, especialmente em eucariontes, que incluem plantas, animais e fungos. Um tipo bem conhecido de agrupamento de genes é chamado de família de genes. Famílias de Genes são compostas por genes similares que evoluíram de um ancestral comum através de um processo conhecido como Duplicação de genes. Essa duplicação geralmente acontece durante a mistura de material genético na divisão celular.

Apesar de ter mais informações genômicas completas disponíveis para muitas espécies nos últimos anos, os pesquisadores ainda não analisaram completamente a evolução dessas famílias de genes. Vários fatores dificultam essa análise. Isso inclui erros que podem ocorrer ao sequenciar o DNA, dados genômicos incompletos causados por segmentos repetitivos de DNA e erros na identificação de genes.

Esses desafios tornaram difícil estudar famílias de genes de tamanho médio, que contêm cerca de 10 a 100 genes. Famílias maiores, com centenas ou milhares de genes, são ainda mais difíceis de analisar. No entanto, o custo do sequenciamento de DNA está diminuindo, e novas tecnologias para sequenciar longas sequências de DNA estão se tornando disponíveis. Também existem novos programas de computador projetados para ajudar os cientistas a entender melhor as famílias de genes no contexto de genomas inteiros. Esse conjunto crescente de ferramentas oferece esperança para superar os desafios anteriores.

Desafios na Análise de Famílias de Genes

Dois grandes problemas complicam a análise das famílias de genes. Primeiro, as famílias de genes podem ser muito grandes. Segundo, elas podem conter muitas duplicações de genes recentes, o que complica ainda mais as coisas. As técnicas atuais de análise genômica, mesmo as que usam leituras longas de DNA, têm dificuldades em juntar grandes seções de DNA que são repetitivas ou muito semelhantes. Essa incapacidade pode levar a erros em determinar como e quando esses membros da família de genes se originaram.

Os desafios também dificultam distinguir entre diferentes processos que podem levar à evolução das famílias de genes. Por exemplo, se a duplicação de genes ocorre por meio da troca de segmentos de DNA entre genes muito relacionados, isso pode afetar a história evolutiva da família de genes. Se não for medido com precisão, pode levar a mal-entendidos sobre como esses genes estão relacionados em termos de evolução.

Além disso, se a duplicação de genes acontece com frequência em uma família de genes, isso pode confundir os pesquisadores que estudam as relações entre diferentes genes. O desenvolvimento de melhores montagens genômicas em nível de cromossomo pode nos ajudar a mergulhar mais fundo na evolução e organização dessas famílias de genes.

Ferramentas Atuais para Análise de Genes

Atualmente, existem algumas ferramentas bioinformáticas disponíveis para encontrar agrupamentos de genes sem viés. No entanto, não existe uma única ferramenta abrangente que combine todas essas análises enquanto oferece informações significativas sobre a função dos genes. Essa lacuna significa que os pesquisadores muitas vezes precisam usar várias ferramentas para obter as informações que precisam, o que pode ser demorado e complicado.

Para atender a essas necessidades, uma nova ferramenta bioinformática chamada GALEON foi desenvolvida. O GALEON tem como objetivo ajudar os cientistas a identificar, analisar e visualizar agrupamentos de famílias de genes em dados genômicos. Essa ferramenta é fácil de usar e requer arquivos de entrada simples contendo informações sobre as posições dos genes e, opcionalmente, sequências de proteínas.

Como o GALEON Funciona

O GALEON funciona identificando primeiro agrupamentos de famílias de genes. Ele verifica se genes similares estão localizados próximos uns dos outros, mais do que seria esperado ao acaso, com base na densidade geral da família de genes ao longo do genoma. Se um certo número de genes localizados próximos estiver dentro de uma distância especificada, o GALEON os considera um agrupamento.

Além disso, o GALEON analisa a relação entre a disposição física desses agrupamentos de genes e sua história evolutiva. Essa análise oferece insights sobre como essas famílias de genes se originaram e evoluíram ao longo do tempo.

Para colocar essa análise em contexto, o GALEON usa ferramentas existentes para criar múltiplos alinhamentos de sequências das proteínas codificadas pelos membros da família de genes. Essa etapa é crítica para entender as semelhanças e diferenças entre as proteínas. O GALEON escolhe entre dois métodos - FastTree ou IQ-TREE - para construir uma árvore filogenética que mapeia as relações evolutivas entre os membros da família de genes.

As informações dessa árvore ajudam os pesquisadores a estimar distâncias genéticas, que podem ser comparadas às distâncias físicas entre os genes. O GALEON também calcula uma estatística específica que mostra quanto da distância genética pode ser atribuída às cópias de genes que não estão agrupadas. Isso permite uma compreensão mais profunda de se o agrupamento de genes afeta a evolução.

Resultados e Visualizações

A saída do GALEON inclui várias tabelas e visualizações, que são resumidas em um relatório. As tabelas fornecem uma visão geral dos membros focais da família de genes e os categorizam como agrupados ou não agrupados (conhecidos como singletons). Tabelas mais detalhadas também fornecem informações adicionais sobre os genes individuais dentro dos agrupamentos.

Além disso, o GALEON gera gráficos de barras que mostram quantos genes estão em cada agrupamento ao longo de diferentes cromossomos. Mapas de calor mostram exatamente onde esses agrupamentos estão localizados nos suportes do genoma. Quando dados de proteínas são fornecidos, o GALEON cria representações visuais adicionais, incluindo gráficos que mostram a relação entre distâncias físicas e evolutivas.

Os usuários podem personalizar a saída visual do GALEON, ajustando parâmetros para melhor atender às suas necessidades ou preferências de análise. Essa flexibilidade é importante para pesquisadores que buscam apresentar suas descobertas de forma eficaz.

Conclusão

O GALEON oferece uma ferramenta poderosa e abrangente para cientistas que estudam agrupamentos de famílias de genes em genomas inteiros. Ao fornecer uma maneira integrada de analisar a disposição física dos genes junto com sua história evolutiva, o GALEON ajuda os pesquisadores a esclarecer as funções e a importância das famílias de genes.

Com os avanços contínuos nas tecnologias de sequenciamento e bioinformática, o GALEON representa um passo à frente na compreensão de como os genes evoluem e interagem. Essa ferramenta pode servir como um recurso essencial para cientistas interessados nas origens, manutenção e evolução das famílias de genes, aprimorando nossa compreensão das funções e relações genéticas em vários organismos.

Fonte original

Título: GALEON: A Comprehensive Bioinformatic Tool to Analyse and Visualise Gene Clusters in Complete Genomes

Resumo: MotivationGene clusters, defined as a set of genes encoding functionally-related proteins, are abundant in eukaryotic genomes. Despite the increasing availability of chromosome-level genomes, the comprehensive analysis of gene family evolution remains largely unexplored, particularly for large and highly dynamic gene families or those including very recent family members. These challenges stem from limitations in genome assembly contiguity, particularly in repetitive regions such as large gene clusters. Recent advancements in sequencing technology, such as long reads and chromatin contact mapping, hold promise in addressing these challenges. ResultsTo facilitate the identification, analysis, and visualisation of physically clustered gene family members within chromosome-level genomes, we introduce GALEON, a user-friendly bioinformatic tool. GALEON identifies gene clusters by studying the spatial distribution of pairwise physical distances among gene family members along with the genome-wide gene density. The pipeline also enables the simultaneous analysis and comparison of two gene families, and allows the exploration of the relationship between physical and evolutionary distances. This tool offers a novel approach for studying the origin and evolution of gene families. Availability and ImplementationGALEON is freely available from http://www.ub.edu/softevol/galeon, and from https://github.com/molevol-ub/galeon

Autores: Julio Rozas, V. A. Pisarenco, J. Vizueta

Última atualização: 2024-04-17 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.15.589673

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.15.589673.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes