Abordando Contaminantes na Purificação de Proteínas
Este artigo fala sobre como superar desafios na purificação de proteínas a partir de amostras de nanopartículas.
― 8 min ler
Índice
A purificação de proteínas é uma etapa importante em muitos experimentos científicos. Ela serve pra separar proteínas específicas de outras substâncias em uma solução. Esse processo é fundamental pra estudar proteínas, desenvolver medicamentos e explorar processos bioquímicos. Mas, tem uns desafios na purificação de proteínas, especialmente quando proteínas indesejadas de fontes desconhecidas também são isoladas. Esse problema pode dificultar o estudo das proteínas de interesse.
Neste artigo, vamos falar sobre um caso em que enfrentamos um problema durante a purificação de um novo tipo de nanopartícula feita de proteínas. Encontramos uma proteína não identificada que estava se purificando junto com nossa nanopartícula-alvo. Essa proteína contaminante estava presente em várias amostras com as quais estávamos trabalhando, por isso era importante descobrir o que era. Usamos técnicas de imagem avançadas e ferramentas de computador pra ajudar a identificar o contaminante e melhorar nosso método de purificação.
Contexto
A purificação de proteínas é uma técnica comum usada em várias áreas da pesquisa, incluindo bioquímica e biologia molecular. O objetivo é isolar uma proteína específica ou um grupo de proteínas de uma mistura pra que possam ser estudadas em detalhes. Isso pode envolver várias etapas, incluindo a isolação inicial, separação com base em tamanho ou carga, e purificação adicional pra alcançar o nível de pureza desejado.
No nosso caso específico, estávamos trabalhando com uma nanopartícula de dois componentes projetada. Esse tipo de nanopartícula é criado combinando duas proteínas diferentes que foram engenheiradas pra se montar de uma certa forma. A nanopartícula que queríamos produzir tinha uma estrutura específica que era crítica pra sua função pretendida.
O Desafio
Durante nossos esforços de purificação, percebemos que uma proteína menor estava aparecendo junto com nossa nanopartícula-alvo. Essa proteína contaminante não estava apenas presente na amostra atual, mas também em várias outras amostras do nosso laboratório. A presença dessa proteína indesejada dificultou a determinação da quantidade e pureza da nossa nanopartícula projetada.
No começo, não sabíamos se esse contaminante era um produto do nosso processo de design, um resultado de contaminação de outras amostras, ou uma proteína que ocorria naturalmente das bactérias que estávamos usando pra expressar nossas proteínas. Pra resolver esse problema, sabíamos que precisávamos identificar a proteína contaminante e refinar nosso processo de purificação.
Técnicas Usadas pra Identificação
Pra identificar a proteína desconhecida, utilizamos duas técnicas avançadas: Microscopia eletrônica crio (Cryo-EM) e uma ferramenta de aprendizado de máquina chamada ModelAngelo.
A Cryo-EM é uma técnica poderosa de imagem que permite que os pesquisadores vejam proteínas em altíssimas resoluções. Ela envolve congelar rapidamente as amostras de proteínas e depois tirar milhares de imagens. Analisando essas imagens, conseguimos ter uma ideia clara da estrutura da proteína.
ModelAngelo, por outro lado, é uma ferramenta de software que usa aprendizado profundo pra ajudar a construir modelos atômicos de proteínas com base nos dados estruturais disponíveis. Ela pode analisar os mapas de densidade gerados a partir das imagens de Cryo-EM e construir modelos que representam a estrutura da proteína.
Combinando essas duas técnicas, conseguimos obter insights sobre a estrutura da proteína contaminante. Processamos nossos dados de Cryo-EM e usamos ModelAngelo pra ajudar a construir modelos que poderiam representar tanto nossa nanopartícula projetada quanto a proteína contaminante.
Observação do Contaminante
Quando começamos nossa análise, descobrimos que a proteína contaminante aparecia como uma partícula menor com uma forma octaédrica, semelhante à nossa nanopartícula projetada. Isso foi surpreendente, já que nosso design tinha como alvo uma arquitetura específica que era mais complexa.
Fizemos uma análise detalhada e comparamos os tamanhos e formas das partículas que observamos sob o microscópio. A nanopartícula projetada tinha uma massa e tamanho previstos que eram muito maiores que a proteína contaminante. Essa diferença possibilitou distinguir entre elas nas nossas amostras.
Apesar dos nossos esforços, a proteína contaminante constituía uma grande proporção do que isolamos durante a purificação. Isso afetou significativamente nosso rendimento e pureza, tornando as análises e caracterizações subsequentes pouco confiáveis.
Identificando o Contaminante
Pra identificar corretamente a proteína contaminante desconhecida, realizamos vários experimentos usando os dados que coletamos da Cryo-EM. Depois de gerar os mapas de densidade, usamos ModelAngelo pra gerar fragmentos de sequência que correspondessem à densidade que observamos.
A saída do ModelAngelo revelou várias sequências potenciais pra proteína contaminante. Depois, usamos uma ferramenta chamada Protein BLAST pra comparar essas sequências com um banco de dados de proteínas conhecidas pra encontrar correspondências. Curiosamente, descobrimos que um grande número dos melhores resultados correspondia a uma proteína chamada dihidrolipomato succiniltransferase (DLST). Essa proteína é conhecida por ser um contaminante comum em amostras derivadas de bactérias usadas em engenharia genética.
Revisando o Protocolo de Purificação
Com a identificação da DLST como o contaminante, precisávamos desenvolver um protocolo de purificação revisado pra eliminá-la das nossas amostras. Pesquisas anteriores mostraram que a DLST poderia se co-purificar com muitas proteínas, mas as razões pra essa co-eluição não eram claras. Começamos explorando a possibilidade de que as propriedades de superfície da DLST poderiam contribuir pra sua interação com a resina usada no processo de purificação.
Uma hipótese era que a DLST contém resíduos de histidina em sua superfície, que poderiam se ligar aos íons de níquel na resina, levando à sua co-purificação com proteínas-alvo que também tinham tags de histidina. Pra testar essa ideia, modificamos nosso método de purificação mudando a concentração de imidazol nos nossos tampões de eluição, esperando liberar a DLST de forma mais eficaz.
Apesar dessas mudanças, ainda detectamos a DLST em nossas amostras. Então tentamos aumentar a concentração de cloreto de sódio nos nossos tampões, achando que isso poderia desestabilizar qualquer interação não específica entre a DLST e nossas proteínas-alvo. Enquanto aumentar a concentração de sal ajudou a reduzir os níveis de DLST, também diminuiu significativamente o rendimento da nossa nanopartícula projetada.
Remoção Bem-Sucedida do Contaminante
Pra encontrar uma solução melhor, decidimos incorporar Excipientes, que são substâncias que podem melhorar as propriedades das proteínas durante a purificação. Adicionamos aminoácidos como glicina e arginina aos nossos tampões. Esses compostos são conhecidos por reduzir interações indesejadas entre proteínas e melhorar a estabilidade geral.
A adição desses excipientes aos nossos tampões de purificação levou a um resultado notável. Não só conseguimos quase eliminar a DLST de nossas amostras, mas também aumentamos significativamente o rendimento da nossa nanopartícula projetada. Isso foi um grande avanço para nosso projeto, permitindo-nos obter amostras altamente puras para análises futuras.
Importância da Resolução da Cryo-EM
Nosso sucesso em identificar a DLST e otimizar nosso protocolo de purificação destaca a importância de dados experimentais de alta qualidade, especialmente ao usar técnicas como Cryo-EM. A resolução dos dados afeta nossa capacidade de determinar com precisão as estruturas das proteínas. No nosso caso, alcançamos uma resolução de 2.51 Å, que nos permitiu reunir detalhes suficientes pra identificar a proteína contaminante com confiança.
Curiosos sobre a aplicabilidade da nossa abordagem, testamos a eficácia do nosso fluxo de trabalho de identificação em diferentes resoluções. Processamos os mesmos dados de Cryo-EM em várias resoluções pra ver se ainda conseguiríamos identificar a DLST corretamente. Descobrimos que, mesmo em resoluções mais baixas, nosso método continuava eficaz, indicando que poderia ser benéfico em uma gama mais ampla de situações onde dados de alta qualidade podem não ser viáveis.
Conclusão
Resumindo, a identificação e remoção da proteína contaminante DLST das nossas amostras de nanopartículas foram passos críticos pra melhorar nosso processo de purificação e garantir a qualidade dos nossos experimentos. Ao aproveitar técnicas avançadas de imagem e ferramentas computacionais, conseguimos transformar uma situação desafiadora em uma oportunidade de refinamento e otimização.
Nossa experiência enfatiza a importância de entender bem as técnicas de purificação de proteínas e os desafios que podem surgir. A integração de novas tecnologias, como Cryo-EM e ferramentas de aprendizado de máquina, oferece aos pesquisadores meios poderosos pra lidar com complexidades na purificação de proteínas, aprimorando nossa capacidade de estudar e utilizar proteínas para várias aplicações.
A aplicação bem-sucedida do nosso protocolo de purificação refinado não apenas melhorou nosso trabalho, mas também abriu portas pra estudos futuros sobre nossas nanopartículas projetadas de dois componentes. Os métodos desenvolvidos podem servir como um modelo pra outros pesquisadores enfrentando desafios semelhantes na purificação e caracterização de proteínas.
Título: Protein identification using cryo-EM and artificial intelligence guides improved sample purification
Resumo: Protein purification is essential in protein biochemistry, structural biology, and protein design. It enables the determination of protein structures, the study of biological mechanisms, and the biochemical and biophysical characterization of both natural and de novo designed proteins. Despite the broad application of various protein purification protocols, standard strategies can still encounter challenges, such as the unintended co-purification of unknown contaminants alongside the target protein. In particular, co-purification issues pose significant challenges for designed self-assembling protein nanomaterials, as it is difficult to determine whether unexpected observed geometries represent novel assembly states of the designed system, cross-contamination from other assemblies, or native proteins originating from the expression host. In this study, we assessed the ability of an automated structure-to-sequence pipeline to unambiguously identify an unknown co-purifying protein found across several purified designed protein samples. Using cryo-electron microscopy (Cryo-EM), ModelAngelos sequence-agnostic automated model-building feature, and the Basic Local Alignment Search Tool (BLAST), we identified the unknown protein as dihydrolipoamide succinyltransferase (DLST). This identification was further confirmed by comparing the cryo-EM data with available DLST structures in the Protein Data Bank (PDB) and AlphaFold 3 predictions from the top BLAST hits. The clear identification of DLST informed our subsequent literature search and led to the rational modification of our protein purification protocol, ultimately enabling the exclusion of the contaminant from preparations of our target nanoparticle. This study demonstrates the successful application of a structure-to-sequence workflow, integrating Cryo-EM, ModelAngelo, protein BLAST, PDB structures, and AlphaFold 3 predictions, to identify and remove an unknown protein from a purified sample. It also highlights the broader potential of integrating Cryo-EM with AI-driven tools for accurate protein identification across various samples and contexts within protein science. HighlightsO_LIAn unknown protein was consistently found in multiple de novo designed protein samples. C_LIO_LIThe protein was identified as dihydrolipoamide succinyltransferase (DLST) using Cryo-EM, ModelAngelo and BLAST, and further verified using AlphaFold 3 and the PDB. C_LIO_LIIdentification enabled rational modification of the purification protocol to exclude the contaminant. C_LIO_LIThis method enables accurate protein identification without requiring near-atomic resolution or prior sequence and structural data, making it broadly applicable to various areas of protein science. C_LI Graphical Abstract O_FIG O_LINKSMALLFIG WIDTH=200 HEIGHT=147 SRC="FIGDIR/small/612515v1_ufig1.gif" ALT="Figure 1"> View larger version (65K): [email protected]@4ea3f3org.highwire.dtl.DTLVardef@edd0bcorg.highwire.dtl.DTLVardef@122fba2_HPS_FORMAT_FIGEXP M_FIG C_FIG
Autores: Andrew J Borst, K. D. Carr, D. E. D. Zambrano, C. Weidle, A. Goodson, H. E. Eisenach, H. Pyles, A. Courbet, N. P. King
Última atualização: 2024-09-12 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.09.11.612515
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.09.11.612515.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.