Descobrindo as Funções Ocultas de Regiões Únicas do DNA
Cientistas mostram os papéis importantes de regiões únicas do DNA no desenvolvimento dos mamíferos.
― 6 min ler
Índice
Transposons são pedaços de DNA que conseguem se mover dentro do genoma. Eles foram descobertos pela primeira vez em meados da década de 1940. Logo depois, os cientistas descobriram a estrutura do DNA. Essa estrutura mostra uma sequência de blocos de construção, que chamamos de nucleotídeos. A descoberta dos transposons sugere que essa sequência pode mudar.
Uma cientista chamada Barbara McClintock estudou os transposons e percebeu que eles costumam ficar ativos depois de certos eventos, como quando uma célula é danificada ou infectada. Ela aprendeu que essa atividade pode mudar como os genes funcionam nas células.
Quando os cientistas publicaram o genoma humano, descobriram que cerca de metade dele vem de transposons. Notaram que certos grupos de genes, chamados de clusters Hox, tinham muito poucos transposons em comparação com outras áreas do genoma. Os clusters Hox são importantes porque ajudam a determinar a estrutura básica do corpo de um organismo. Para os mamíferos, existem quatro clusters Hox. Os pesquisadores acreditavam que a falta de transposons nessas áreas se deve à necessidade de manter a regulação dos genes estável.
Isso gerou um grande interesse em estudar áreas do DNA que não têm transposons. Essas áreas são conhecidas como regiões sem transposons, ou TFRs. TFRs também não contêm DNA satélite, e apenas uma pequena parte delas é semelhante a outras partes do genoma. Os pesquisadores encontraram muitas dessas regiões tanto em humanos quanto em camundongos, a maioria das quais não codifica proteínas.
Importância das TFRs
Os cientistas determinaram que as TFRs são ricas em genes importantes para o Desenvolvimento. Isso significa que essas regiões podem ter papéis críticos em como os organismos crescem e se desenvolvem. Duas maneiras de entender como as TFRs podem ser mantidas são através da exclusão, ou seja, mantendo os transposons afastados, e através da seleção, onde apenas as melhores regiões permanecem ao longo do tempo. Parece que a segunda opção é a mais provável.
Pouco depois do estudo das TFRs, os pesquisadores descobriram áreas únicas no genoma que também pareciam ter funções importantes. Essas regiões, chamadas de regiões únicas (URs), não se sobrepõem com sequências de genes conhecidas. Os pesquisadores começaram a estudar essas áreas para ver como estavam relacionadas às Funções dos Genes.
Métodos para Analisar Regiões Únicas
Para detectar URs, os pesquisadores usam um programa chamado Macle. Esse programa funciona analisando a complexidade das correspondências em sequências de DNA. Ele é projetado para identificar rapidamente áreas que se destacam por sua singularidade, ou seja, que não correspondem de perto a nenhuma outra parte do genoma.
Outro programa, o RepeatMasker, é frequentemente usado para encontrar transposons. Ele procura por sequências de repetição conhecidas no genoma. O Macle, sendo mais rápido, permite que os cientistas identifiquem regiões únicas de forma muito mais eficiente. No entanto, ele pode perder alguns transposons mais antigos que mudaram ao longo do tempo.
Os pesquisadores compararam esses programas rodando em sequências que simulam mudanças no genoma. Eles observaram como cada programa se comportava com base em várias taxas de mutação. Os resultados mostraram que o Macle conseguia encontrar rapidamente áreas únicas, enquanto o RepeatMasker tinha um tempo de processamento mais longo.
Analisando 18 Genomas de Mamíferos
Para ampliar sua pesquisa, os cientistas estudaram 18 genomas de mamíferos diferentes de nove ordens, que incluíam mamíferos placentários e marsupiais. Eles queriam encontrar URs nesses genomas e ver se eram ricos em genes associados ao desenvolvimento.
Para isso, eles primeiro reuniram os dados do genoma e os anotaram. Usando um método conhecido como teste de Monte Carlo, os cientistas avaliaram quão significativos eram seus resultados. Eles descobriram que as URs em todas as espécies de mamíferos que estudaram estavam de fato enriquecidas em genes de desenvolvimento.
Essa descoberta apoiou a ideia de que as URs podem ter papéis cruciais em processos de desenvolvimento nos mamíferos.
Efeitos do Tamanho da Janela nas Regiões Únicas
Os pesquisadores também investigaram como mudar o tamanho da janela usada na análise afetou o número de URs encontradas. Eles descobriram que usar tamanhos de janela menores levou a uma maior porcentagem de regiões únicas. À medida que os tamanhos das janelas aumentavam, o número de URs encontradas diminuía.
Por exemplo, com uma janela de 1 kb, uma parte significativa do genoma foi identificada como única, enquanto janelas maiores revelaram muito menos áreas únicas. Isso faz sentido, já que seções maiores de DNA têm mais chances de conter sequências repetidas ou transposons que se inseriram ao longo do tempo.
Os pesquisadores também descobriram que a proporção de regiões únicas que se sobrepunham a promotores de genes conhecidos mudava com tamanhos de janelas variados. Janelas menores tendiam a ter uma maior sobreposição com funções de genes conhecidas, enquanto janelas maiores não.
Enriquecimento de Funções Genéticas
Enquanto os pesquisadores analisavam as regiões únicas, eles se concentraram em quais funções específicas estavam enriquecidas nessas áreas. Eles descobriram que muitas das funções gênicas enriquecidas estavam relacionadas ao desenvolvimento. Essa tendência foi consistente em todas as espécies de mamíferos que analisaram.
As descobertas indicaram uma forte conexão entre essas áreas únicas de DNA e os genes responsáveis por desenvolver os planos corporais desses animais.
Explorando Regiões Únicas Anônimas
Além do estudo de genes conhecidos, os pesquisadores também investigaram URs anônimas. Essas regiões não se cruzavam com nenhuma sequência de genes ou anotações conhecidas. Os pesquisadores queriam determinar se essas áreas tinham alguma relevância biológica.
Para verificar o conteúdo funcional dessas regiões anônimas, eles as compararam com um banco de dados de proteínas. Surpreendentemente, eles encontraram algumas coincidências, incluindo um gene que desempenha um papel na sinalização celular. Essa descoberta indica que essas regiões anteriormente negligenciadas podem conter genes importantes que ainda não foram totalmente anotados em alguns genomas.
Conclusão
O estudo dos transposons, regiões únicas e suas funções nos genomas de vários mamíferos trouxe insights significativos sobre o papel do DNA em processos biológicos. Embora muito se saiba sobre transposons e seus movimentos dentro do genoma, as regiões únicas não tinham recebido tanta atenção até recentemente.
O uso de ferramentas como Macle e RepeatMasker facilitou a identificação e análise de regiões únicas. Essas regiões são importantes para entender como os genes funcionam e como contribuem para o desenvolvimento de um organismo. Essa pesquisa destaca a importância das regiões únicas no contexto mais amplo da genômica e convida a uma exploração mais profunda de seus papéis na evolução e na biologia.
Título: Detection and Annotation of Unique Regions in Mammalian Genomes
Resumo: Long unique genomic regions have been reported to be highly enriched for developmental genes in mice and humans. In this paper we identify unique genomic regions using a highly efficient method based on fast string matching. We quantify the resource consumption and accuracy of this method before applying it to the genomes of 18 mammals. We annotate their unique regions of at least 10 kb and find that they are strongly enriched for developmental genes across the board. When investigating the subset of unique regions that lack annotations, we found in the tasmanian devil the gene encoding iniositol polyphosphate-5-phosphatase A, which is an essential part of intracellular signaling. This implies that unique regions might be given priority when annotating mammalian genomes. Our documented pipeline for annotating unique regions in any mammalian genome is available from the repository github.com/evolbioinf/auger; additional data for this study is available from the data-verse at doi.org/10.17617/3.4IKQAG.
Autores: Bernhard Haubold, B. Vieira Mourato
Última atualização: 2024-10-13 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.10.11.617789
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.11.617789.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.