Avanços na Engenharia de Proteínas com o EVOLVEpro
Um novo método simplifica o design e a otimização de proteínas usando IA.
― 5 min ler
Índice
- Entendendo as Proteínas e sua Diversidade
- O Papel dos Modelos de Linguagem de Proteínas
- Desafios na Engenharia de Proteínas
- Apresentando o EVOLVEpro: Uma Nova Abordagem
- Como Funciona o EVOLVEpro
- Vantagens do EVOLVEpro
- Aplicações no Mundo Real
- Otimização de Anticorpos
- Desenvolvimento de Nuclease CRISPR Miniaturizada
- Melhorias na Produção de RNA
- Comparando o EVOLVEpro com Métodos Tradicionais
- O Futuro da Engenharia de Proteínas
- Conclusão
- Fonte original
Engenharia de Proteínas é um campo que se concentra em criar e modificar proteínas pra melhorar suas funções. Essas proteínas têm papéis vitais nos nossos corpos e em várias tecnologias, desde medicamentos até ferramentas de edição genética. O objetivo da engenharia de proteínas é criar proteínas que sejam mais eficazes nas suas funções ou que tenham novas habilidades que possam ser usadas em diferentes aplicações.
Entendendo as Proteínas e sua Diversidade
As proteínas são feitas de longas cadeias de aminoácidos, que se dobram em formatos específicos pra realizar suas funções. Tem uma infinidade de combinações de aminoácidos, resultando em uma variedade enorme de proteínas com atividades bem diferentes. Essa diversidade se desenvolveu ao longo de bilhões de anos, através do processo de evolução, onde as proteínas que fazem seu trabalho melhor tendem a sobreviver e se replicar.
Modelos de Linguagem de Proteínas
O Papel dosRecentemente, cientistas começaram a usar algoritmos de computador avançados, conhecidos como modelos de linguagem de proteínas (PLMs), pra estudar proteínas. Esses modelos aprendem com grandes bancos de dados de sequências de proteínas e conseguem gerar novos designs de proteínas. Eles analisam a "gramática" das proteínas, ajudando os pesquisadores a entender como mudanças nas sequências podem afetar as funções das proteínas.
Desafios na Engenharia de Proteínas
Embora os PLMs possam sugerir novos designs, a eficácia desses designs geralmente precisa de muitos testes em laboratórios. Muitas tentativas de criar proteínas melhores não funcionaram tão bem quanto se esperava. Isso acontece porque os PLMs podem ter dificuldades pra prever como esses novos designs vão se comportar em situações do mundo real.
Apresentando o EVOLVEpro: Uma Nova Abordagem
Pra resolver esses desafios, uma nova metodologia chamada EVOLVEpro foi desenvolvida. Diferente dos métodos tradicionais que exigem muitos testes experimentais, o EVOLVEpro usa uma combinação de PLMs e um modelo de regressão. Isso permite prever quais variantes de proteínas vão funcionar melhor depois de só algumas rodadas de teste.
Como Funciona o EVOLVEpro
O EVOLVEpro opera em uma série de etapas:
- Entrada das Sequências de Proteínas: As proteínas são representadas por suas sequências de aminoácidos.
- Criação de Previsões: O PLM analisa essas sequências e prevê melhorias potenciais nas suas atividades.
- Seleção de Candidatos: Com base nessas previsões, um número pequeno de variantes de proteínas é selecionado pra testes experimentais.
- Validação Experimental: Essas variantes são testadas pra ver se desempenham melhor do que a original. Os resultados são então alimentados de volta no modelo pra melhorar previsões futuras.
Vantagens do EVOLVEpro
Essa abordagem tem várias vantagens:
- Menos Experimentos Necessários: Métodos tradicionais frequentemente exigem testes de centenas ou milhares de variantes. O EVOLVEpro consegue bons resultados com apenas algumas dezenas.
- Alta Taxa de Sucesso: O EVOLVEpro mostrou uma forte capacidade de prever quais proteínas vão ter sucesso nas suas tarefas.
- Otimização Multifuncional: Ele pode otimizar proteínas para várias funções ao mesmo tempo, o que é útil em aplicações complexas.
- Sem Conhecimento Especial Necessário: Os usuários não precisam ser especialistas em ciência das proteínas pra usar o EVOLVEpro, tornando-o acessível em vários campos.
Aplicações no Mundo Real
O EVOLVEpro foi testado em várias proteínas, incluindo aquelas usadas no tratamento de doenças, melhorando a edição genética e produzindo RNA pra vacinas. Os resultados iniciais mostram melhorias significativas nas funções das proteínas.
Otimização de Anticorpos
Uma aplicação do EVOLVEpro foi em melhorar um anticorpo usado pra combater a COVID-19. O anticorpo original foi testado junto com várias variantes. O EVOLVEpro rapidamente identificou melhorias, produzindo variantes que neutralizavam o vírus de forma bem mais eficiente.
Desenvolvimento de Nuclease CRISPR Miniaturizada
Outra aplicação empolgante envolveu engenharia de uma versão compacta do CRISPR, uma ferramenta pra edição de genes. Essa versão foi aprimorada pra ter um desempenho melhor do que os modelos existentes, provando ser valiosa pra aplicações terapêuticas onde ferramentas menores são necessárias.
Melhorias na Produção de RNA
O EVOLVEpro também foi usado pra otimizar a RNA polimerase T7, uma enzima crítica na produção de RNA. As melhorias resultaram em maior eficiência e pureza na produção de RNA, algo vital pra criar vacinas e RNA terapêutico.
Comparando o EVOLVEpro com Métodos Tradicionais
Métodos tradicionais na engenharia de proteínas geralmente envolvem tentativa e erro, onde várias variantes são projetadas e testadas sem previsões precisas. Isso pode ser demorado e caro. Em contraste, a dependência do EVOLVEpro em previsões baseadas em dados simplifica o processo e aumenta as taxas de sucesso. Esse método economiza tempo e recursos, levando a inovações mais rápidas.
O Futuro da Engenharia de Proteínas
À medida que os pesquisadores continuam explorando as capacidades do EVOLVEpro, há otimismo sobre seu potencial. A integração da inteligência artificial com a engenharia de proteínas está abrindo caminho pra avanços rápidos na biotecnologia. À medida que mais proteínas são estudadas, o conhecimento adquirido ajudará a refinar o EVOLVEpro, tornando-o uma ferramenta ainda mais poderosa.
Conclusão
A engenharia de proteínas está na vanguarda da inovação científica, impactando áreas como medicina, agricultura e ciência ambiental. Com ferramentas como o EVOLVEpro, os pesquisadores podem projetar proteínas melhores mais eficientemente do que nunca. Conforme a tecnologia evolui, ela promete ajudar a lidar com desafios complexos e desenvolver soluções que podem melhorar nossa qualidade de vida.
Título: Rapid protein evolution by few-shot learning with a protein language model
Resumo: Directed evolution of proteins is critical for applications in basic biological research, therapeutics, diagnostics, and sustainability. However, directed evolution methods are labor intensive, cannot efficiently optimize over multiple protein properties, and are often trapped by local maxima. In silico-directed evolution methods incorporating protein language models (PLMs) have the potential to accelerate this engineering process, but current approaches fail to generalize across diverse protein families. We introduce EVOLVEpro, a few-shot active learning framework to rapidly improve protein activity using a combination of PLMs and protein activity predictors, achieving improved activity with as few as four rounds of evolution. EVOLVEpro substantially enhances the efficiency and effectiveness of in silico protein evolution, surpassing current state-of-the-art methods and yielding proteins with up to 100-fold improvement of desired properties. We showcase EVOLVEpro for five proteins across three applications: T7 RNA polymerase for RNA production, a miniature CRISPR nuclease, a prime editor, and an integrase for genome editing, and a monoclonal antibody for epitope binding. These results demonstrate the advantages of few-shot active learning with small amounts of experimental data over zero-shot predictions. EVOLVEpro paves the way for broader applications of AI-guided protein engineering in biology and medicine.
Autores: Omar O. Abudayyeh, K. Jiang, Z. Yan, M. D. Bernardo, S. R. Sgrizzi, L. Villiger, A. Kayabolen, B. Kim, J. K. Carscadden, M. Hiraizumi, H. Nishimasu, J. S. Gootenberg
Última atualização: 2024-07-18 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.07.17.604015
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.07.17.604015.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.