Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Biofísica

Avanços nas Técnicas de Microscopia Eletrônica Crio

Um novo método melhora a reconstrução da forma das proteínas usando criomicroscopia eletrônica.

― 10 min ler


CryoSPHERE: Análise deCryoSPHERE: Análise deProteínas de Nova Geraçãode proteínas com técnicas avançadas.Revolucionando a reconstrução da forma
Índice

A criomicroscopia eletrônica, geralmente chamada de crio EM, é um método especial usado para observar as formas 3D de grandes estruturas biológicas, como proteínas. Nessa técnica, muitas proteínas idênticas são congeladas em uma fina camada de gelo e depois vistas com um microscópio eletrônico. Isso cria uma imagem que inclui várias fotos 2D das proteínas, chamadas de partículas. O objetivo principal é descobrir as possíveis formas dessas proteínas com base nas imagens capturadas.

As proteínas podem ter diferentes formas, e cada cópia congelada pode representar uma forma diferente. Tradicionalmente, os cientistas ignoravam essa variação e suponham que todas as proteínas estavam na mesma forma. Contudo, há um desejo de ver todas as formas diferentes em um que é conhecido como Reconstrução Heterogênea.

Desafios na Criomicroscopia Eletrônica

Reconstituir as estruturas a partir das imagens de crio EM não é simples. Existem vários desafios que tornam o processo difícil. Primeiro, cada imagem mostra a proteína de um ângulo diferente que não é conhecido de antemão. Segundo, a forma como os elétrons interagem com as proteínas deixa as imagens menos claras e altera as informações. Esse efeito é semelhante ao que acontece quando a lente de uma câmera embaça uma foto. Por fim, essas imagens geralmente têm muito ruído, o que dificulta a visualização de detalhes claros.

Por causa desses desafios, muitos métodos padrões criam imagens médias, perdendo os detalhes das diferentes formas. Alguns métodos mais novos tentam preservar os detalhes de várias formas usando restrições baseadas em uma estrutura subjacente assumida que muda para se ajustar às diferentes formas encontradas nas imagens.

Métodos Atuais

AlphaFold e RosettaFold são ferramentas que podem prever qual será a forma de uma proteína com base na sua sequência de aminoácidos. Embora sejam boas para fornecer formas iniciais, esses métodos ainda têm dificuldades para recuperar variações significativas na forma por causa do ruído nas imagens. O fato de só conseguirmos ver imagens 2D torna tudo ainda mais complicado, levando a erros na recuperação das formas.

Para resolver isso, um novo método está baseado na ideia de que as diferentes formas podem muitas vezes ser explicadas por grandes movimentos de partes da proteína. Esse novo método usa um tipo de aprendizado de máquina chamado autoencoder variacional (VAE). Esse método aprende a dividir uma proteína em partes e pode encontrar diferentes formas com base nas imagens coletadas de crio EM.

Como Funciona o Novo Método

O foco principal desse método é identificar segmentos da proteína e entender como esses segmentos se movem em resposta às imagens. Ele envolve duas etapas principais. Primeiro, o método divide a proteína em segmentos. Segundo, aprende como transformar esses segmentos para cada imagem específica capturada. Ambas as etapas acontecem ao mesmo tempo, resultando em um modelo que pode aprender e se ajustar enquanto processa novos dados.

Os segmentos aprendidos por esse método não são necessariamente os mesmos que as partes funcionalmente importantes da proteína, chamadas de domínios. No entanto, o processo de aprendizado geralmente identifica os domínios reais, o que ajuda a melhorar a precisão dos resultados.

Notação e Formulação do Problema

De forma simples, ao estudar uma proteína, podemos pensar nela como composta de unidades menores chamadas resíduos. Cada resíduo contém átomos. O objetivo é conectar os pontos entre esses resíduos com base nas imagens 2D para reconstruir a forma 3D da proteína. Queremos descobrir como cada resíduo está posicionado no espaço, o que é uma tarefa desafiadora considerando as variações nas imagens e o ruído presente.

Normalmente, os métodos antigos tentavam recuperar um mapa de densidade da proteína para cada imagem. Em contraste, o novo método visa recuperar a estrutura real da proteína para cada imagem, permitindo uma compreensão mais detalhada das variações na forma da proteína.

Trabalhos Relacionados

Existem vários métodos que podem ser usados para a reconstrução de crio EM. RELION e cryoSPARC são dois dos métodos mais comuns que não são baseados em aprendizado profundo. Eles geralmente se concentram em criar Mapas de Densidade com base nas imagens capturadas. No entanto, tendem a tratar as imagens como se fossem compostas apenas por algumas conformações, perdendo os detalhes de muitas formas.

Outros métodos utilizam aprendizado profundo para atingir uma melhor compreensão das formas das proteínas. Por exemplo, alguns métodos usam autoencoders variacionais, enquanto outros se concentram diretamente em reconstruções. Há também métodos que tentam acompanhar cada resíduo separadamente, o que muitas vezes leva a ficarem presos em mínimos locais devido aos níveis de ruído nas imagens.

Apesar dos avanços com os métodos existentes, todos enfrentam limitações, especialmente no que diz respeito ao ruído e ao desafio de modelar as imagens com precisão.

Método: CryoSPHERE

O novo método, chamado cryoSPHERE, enfatiza a reconstrução das estruturas das proteínas em vez de apenas volume. Sua principal vantagem está em como ele move partes da proteína. Em vez de ajustar cada pequena parte da proteína de forma independente, ele foca em mover segmentos maiores de forma mais rígida.

O método utiliza uma estrutura típica de autoencoder variacional. O sistema pega cada imagem e mapeia para uma variável latente. Essa variável é então passada para um decodificador que determina as transformações necessárias para cada segmento da proteína. A estrutura subjacente é então ajustada de acordo, seguida pela criação de uma imagem 2D com base na nova pose da proteína.

Modelo de Formação de Imagem

Para criar uma imagem 2D da estrutura 3D de uma proteína, primeiro é estimado um mapa de densidade. O mapa de densidade representa onde os elétrons têm mais chances de serem encontrados na proteína. Uma vez que o mapa de densidade é criado, ele é projetado em um formato de imagem 2D.

Essa etapa é crucial porque relaciona diretamente a estrutura real da proteína às imagens capturadas em crio EM. Os cálculos exatos envolvidos nesse processo podem ajudar a reduzir significativamente o tempo de computação em comparação com os métodos tradicionais.

Máxima Verossimilhança com Inferência Variacional

Para ter uma melhor compreensão das formas, esse novo método aprende a representar as variações das formas das proteínas com base nas imagens. Ele utiliza uma técnica chamada inferência variacional que ajuda a maximizar a verossimilhança de que uma imagem se encaixa em uma determinada estrutura de proteína. Isso permite uma compreensão mais precisa dos dados que estão sendo processados.

Decomposição de Segmentos

A abordagem divide a proteína em alguns segmentos, permitindo que o modelo se concentre em menos partes ao invés de cada resíduo. Os segmentos são definidos de maneira flexível, o que significa que um único resíduo pode pertencer a mais de um segmento. Essa flexibilidade ajuda a modelar melhor os movimentos e capturar a complexidade do movimento da proteína.

O método usa um modelo matemático específico para ajustar os segmentos, garantindo que haja uma conexão entre os segmentos e a estrutura geral da cadeia de aminoácidos. Assim, o aprendizado e os ajustes podem ser feitos de maneira suave, sem computações excessivas.

Arquitetura do Decodificador

O decodificador do modelo explica como as imagens se relacionam com as variáveis latentes aprendidas. Para cada imagem, há uma variável única que ajuda a ajustar a forma da proteína. O decodificador consegue isso ligando segmentos com seus respectivos movimentos, proporcionando uma compreensão clara das transformações que estão sendo feitas.

As etapas do decodificador trabalham juntas, combinando transformações para cada parte da proteína. Isso significa que, enquanto a posição de um resíduo é ajustada, isso ocorre de uma maneira que respeita o quanto ele pertence a diferentes segmentos.

Codificador e Priors

O codificador rastreia as distribuições e ajuda a criar um mapa das possíveis formas de proteínas. Ele faz isso usando uma distribuição normal para garantir que as transformações aprendidas sejam consistentes e razoáveis. Ao otimizar os parâmetros, o modelo pode continuar refinando sua compreensão das formas das proteínas.

Testando CryoSPHERE

O CryoSPHERE foi testado em diferentes conjuntos de dados para mostrar sua eficácia na reconstrução das formas das proteínas. Inicialmente, foi colocado à prova com um conjunto de dados simulado representando uma estrutura de proteína com movimento contínuo. Os resultados indicaram que o cryoSPHERE poderia prever com precisão os ângulos e distâncias entre os segmentos da proteína.

Depois disso, foi aplicado a um conjunto de dados que incluía duas formas distintas da proteína spike do SARS-CoV-2. O modelo conseguiu recuperar os ângulos entre os domínios com alta precisão, confirmando sua capacidade de lidar com formas de proteínas do mundo real de forma eficaz.

Por fim, o cryoSPHERE foi testado em um conjunto de dados criado a partir de uma simulação de dinâmica molecular, demonstrando sua capacidade de rastrear os movimentos dos segmentos de proteínas com precisão. O desempenho do cryoSPHERE foi consistentemente melhor do que os métodos concorrentes, especialmente na reconstrução de volumes a partir de imagens.

Vantagens do CryoSPHERE

Existem várias razões pelas quais o cryoSPHERE se destaca como um método para reconstruir formas de proteínas:

  1. Deformação Eficiente: Ao transformar diretamente a estrutura base, o cryoSPHERE evita computações complicadas e oferece resultados mais rápidos.

  2. Redução da Complexidade: O foco em segmentos maiores diminui o tamanho da rede neural necessária, tornando o processo mais ágil e eficiente.

  3. Transparência e Clareza: O modelo fornece informações claras sobre como diferentes partes da proteína estão se movendo, facilitando a interpretação dos resultados em comparação com métodos mais antigos.

  4. Robustez: O CryoSPHERE funciona bem mesmo com menos imagens, tornando-se uma ferramenta flexível para estudar proteínas em diversas situações.

  5. Informações Reveladoras: A metodologia permite que pesquisadores tenham insights mais profundos sobre a dinâmica das proteínas e suas várias formas, abrindo caminho para avanços futuros.

Direções Futuras

Embora o cryoSPHERE tenha mostrado grande potencial, há oportunidades para melhorias futuras. Por exemplo, poderia ser benéfico avaliar como bem os segmentos aprendidos por esse método se correlacionam com descobertas de estudos em maior escala. Além disso, entender a dinâmica das proteínas e prever diferentes conformações pode levar a avanços na biomedicina.

Em conclusão, o cryoSPHERE representa um passo importante na análise das formas de proteínas. Ao focar nas relações entre as estruturas das proteínas e seus movimentos, ele abre novas avenidas para pesquisa no campo da biologia molecular, tornando-se uma ferramenta valiosa para os cientistas que trabalham para entender as complexidades da vida em nível molecular.

Fonte original

Título: cryoSPHERE: Single-particle heterogeneous reconstruction from cryo EM

Resumo: The three-dimensional structure of a protein plays a key role in determining its function. Methods like AlphaFold have revolutionized protein structure prediction based only on the amino-acid sequence. However, proteins often appear in multiple different conformations, and it is highly relevant to resolve the full conformational distribution. Single-particle cryo-electron microscopy (cryo EM) is a powerful tool for capturing a large number of images of a given protein, frequently in different conformations (referred to as particles). The images are, however, very noisy projections of the protein, and traditional methods for cryo EM reconstruction are limited to recovering a single, or a few, conformations. In this paper, we introduce cryoSPHERE, a deep learning method that takes as input a nominal protein structure, e.g. from AlphaFold, learns how to divide it into segments, and how to move these as approximately rigid bodies to fit the different conformations present in the cryo EM dataset. This formulation is shown to provide enough constraints to recover meaningful reconstructions of single protein structures. This is illustrated in three examples where we show consistent improvements over the current state-of-the-art for heterogeneous reconstruction.

Autores: Gabriel Ducrocq, L. Grunewald, S. Westenhoff, F. Lindsten

Última atualização: 2024-06-24 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.06.19.599686

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.06.19.599686.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes