Simple Science

Ciência de ponta explicada de forma simples

# Biologia Quantitativa # Biomoléculas # Populações e Evolução

Os Caminhos da Evolução das Proteínas

Descubra como as proteínas evoluem através de pequenas mudanças e conexões.

Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta

― 7 min ler


Caminhos de Evolução de Caminhos de Evolução de Proteínas através de mutações e conexões. Mapeando transformações de proteínas
Índice

As Proteínas são os "cavalos de trabalho" das nossas células. Elas fazem várias tarefas importantes, como quebrar alimentos, enviar sinais e dar forma às células. Feitas de cadeias de Aminoácidos, as proteínas assumem formas únicas que determinam o que conseguem fazer. Pense nelas como máquinas complexas; se você mudar uma parte, pode acabar com um resultado diferente.

O Mistério da Evolução das Proteínas

Agora, imagine a evolução como uma estrada longa e cheia de curvas. Com o tempo, as proteínas podem mudar suas sequências por pequenas Mutações, que são como lombadas ao longo do caminho. Algumas proteínas podem acabar parecendo e agindo de maneira bem diferente depois de muitos desvios, enquanto outras podem continuar parecendo bastante similares, mesmo tendo seguido um caminho longo.

Mas aqui está o problema: como os cientistas conseguem descobrir como essas proteínas estão relacionadas, especialmente se parecem e agem como primos distantes? É aí que as coisas ficam complicadas!

A Linguagem das Sequências de Proteínas

Assim como cada língua tem sua própria gramática, as proteínas têm uma maneira de “falar” por meio de suas sequências. Os cientistas desenvolveram ferramentas para entender essa linguagem. Uma ferramenta popular é um modelo de linguagem de proteínas, que ajuda a adivinhar como uma proteína deve se dobrar e funcionar com base em sua sequência de aminoácidos.

Esse modelo funciona como um tradutor, tentando descobrir como sequências diferentes se relacionam. Então, se você tem duas proteínas que parecem bem diferentes, esse modelo procura conexões que podem não ser óbvias à primeira vista.

Criando Caminhos Entre Proteínas

Aqui vai uma ideia divertida: e se pudéssemos criar caminhos entre proteínas, como conectar pontos entre dois lugares? É exatamente isso que os cientistas estão tentando fazer! Fazendo pequenas mudanças, como trocar um aminoácido por outro, é possível ver como uma proteína poderia, teoricamente, evoluir de uma forma para outra.

Imagine jogar um jogo onde você muda uma letra em uma palavra para criar outra palavra – mas com proteínas! Em vez de palavras, você tem sequências de aminoácidos, e o objetivo é continuar criando mutações viáveis até chegar à proteína desejada.

A Viagem de Carro das Proteínas

Vamos usar uma analogia de viagem de carro. Se você começar de uma proteína (vamos chamar de Proteína A) e quiser chegar à Proteína B, você só pode fazer pequenos ajustes (ou mutações) ao longo do caminho. Cada vez que você faz uma troca, quer garantir que sua nova proteína ainda funcione, como garantir que o carro não quebre no meio da viagem.

Para deixar essa viagem de carro interessante, os cientistas inventaram algo chamado “busca de feixe.” Isso é como usar um GPS que não apenas te aponta o caminho mais rápido, mas também verifica se seu carro (ou proteína) ainda é capaz de funcionar bem em cada parada. Ajuda a encontrar os melhores caminhos pelo universo das proteínas.

Homólogos Diretos: Parentes Próximos

Vamos começar com as proteínas conhecidas como homólogos diretos. Elas são como irmãos que compartilham uma quantidade significativa de características, semelhante a ter os mesmos pais. Por exemplo, enzimas que ajudam bactérias a resistir a antibióticos compartilham muitas semelhanças em suas sequências.

Quando os cientistas tentaram conectar essas proteínas irmãs ao longo de vários caminhos, descobriram que, desde que as mutações fossem pequenas e consistentes, o caminho permanecia funcional. É como dirigir de uma reunião de família para outra passando por bairros familiares sem bater em becos sem saída.

Homólogos Distantes: Árvores Genealógicas Mais Complicadas

Agora vamos apimentar as coisas com homólogos distantes. Essas proteínas podem ser como primos de segundo ou terceiro grau que mudaram muito ao longo do tempo, mas ainda compartilham algumas características familiares.

Uma dessas famílias inclui proteínas que ajudam bactérias a responder a diferentes ambientes. Apesar de ser um pouco mais diversa, os pesquisadores descobriram que ainda é possível encontrar conexões entre esses parentes distantes. Os caminhos podem levar a alguns estados estranhos ou instáveis, como fazer um desvio por uma área desconhecida.

Homólogos Especulativos: Os Primos Misteriosos

Próximos em nossa jornada das proteínas estão os homólogos especulativos. Essas proteínas são como primos distantes que não se parecem muito. Elas desempenham funções diferentes, mas há semelhanças estranhas que sugerem que podem ter um ancestral comum.

Por exemplo, a lactato desidrogenase e a NADH peroxidase são duas proteínas diferentes que fazem trabalhos bem diferentes. No entanto, algumas partes de sua estrutura mantêm semelhanças fantasmagóricas. Os cientistas encontraram caminhos entre essas proteínas que fazem algumas curvas e desvios inesperados, muitas vezes passando por estados instáveis que fazem você se perguntar se perdeu o caminho.

Os Desafios de Encontrar Caminhos

Encontrar caminhos entre proteínas não é tão simples quanto parece. Você pode pensar nisso como tentar conectar duas pontes antigas que desabaram com o tempo. Enquanto é fácil encontrar caminhos entre proteínas semelhantes (como irmãos), parentes distantes ou primos misteriosos geralmente requerem navegar por espaços incertos.

Às vezes, ao percorrer esses caminhos, as proteínas podem perder sua estrutura estável ou funcionalidade. É como um carro que não consegue lidar com uma estrada ruim e quebra. Ao procurar esses caminhos, os cientistas reúnem muitos dados para garantir que ainda estão indo na direção certa.

Medindo a Aptidão ao Longo do Caminho

Enquanto os cientistas criam caminhos de proteínas, eles também precisam de uma maneira de medir quão “aptas” cada variação é. Um método popular para isso é usar modelos de linguagem ESM2 para prever quão provável é que uma determinada proteína funcione efetivamente.

Imagine se você tivesse um rastreador de Fitness que te diz como você está indo na sua viagem de carro. Se você passar por alguns trechos esburacados, seu rastreador pode apitar para avisar que é hora de mudar de rota antes que o carro (ou proteína) desista.

Comparando Caminhos Diferentes

Para garantir que os caminhos sejam úteis, os cientistas costumam compará-los. Os caminhos criados pelo método de busca de feixe tendem a se manter melhores do que caminhos aleatórios.

Em uma reviravolta divertida, usar caminhos aleatórios pode levar a algumas descobertas surpreendentes, mas geralmente acabam apenas levando a becos sem saída – ou pior – quebras! Mantendo o controle de quão “aptas” as proteínas permanecem ao longo de sua jornada, os cientistas podem refinar suas técnicas para criar melhores caminhos.

Lições Aprendidas

Ao criar caminhos viáveis entre sequências de proteínas, os cientistas descobriram bastante sobre como a evolução funciona. Eles descobriram que, embora seja possível conectar homólogos diretos com facilidade, homólogos distantes e homólogos especulativos podem exigir um pouco mais de finesse.

A beleza desse trabalho reside em entender a natureza aleatória da evolução, onde às vezes, você pode tropeçar em uma conexão escondida que muda tudo.

Conclusão: O Caminho à Frente

À medida que os cientistas continuam a mapear a jornada das proteínas, eles não estão apenas encontrando caminhos, mas também desbloqueando segredos sobre como a vida se adapta. Esse conhecimento pode nos ajudar a prever como as proteínas podem evoluir no futuro, potencialmente levando a novas inovações em medicina e biotecnologia.

Então, da próxima vez que você pensar em evolução, lembre-se: é uma estrada sinuosa cheia de reviravoltas inesperadas, desvios e o ocasional desvio que leva a um novo destino incrível!

Fonte original

Título: High fitness paths can connect proteins with low sequence overlap

Resumo: The structure and function of a protein are determined by its amino acid sequence. While random mutations change a protein's sequence, evolutionary forces shape its structural fold and biological activity. Studies have shown that neutral networks can connect a local region of sequence space by single residue mutations that preserve viability. However, the larger-scale connectedness of protein morphospace remains poorly understood. Recent advances in artificial intelligence have enabled us to computationally predict a protein's structure and quantify its functional plausibility. Here we build on these tools to develop an algorithm that generates viable paths between distantly related extant protein pairs. The intermediate sequences in these paths differ by single residue changes over subsequent steps - substitutions, insertions and deletions are admissible moves. Their fitness is evaluated using the protein language model ESM2, and maintained as high as possible subject to the constraints of the traversal. We document the qualitative variation across paths generated between progressively divergent protein pairs, some of which do not even acquire the same structural fold. The ease of interpolating between two sequences could be used as a proxy for the likelihood of homology between them.

Autores: Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta

Última atualização: 2024-11-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2411.09054

Fonte PDF: https://arxiv.org/pdf/2411.09054

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes