Avanços na Previsão da Estrutura de Proteínas
Novas ferramentas expandem nossa compreensão da função e produção de proteínas.
― 6 min ler
Índice
Avanços recentes em prever a estrutura de proteínas aumentaram bastante a quantidade de dados de proteínas disponíveis. Ferramentas como AlphaFold e ESMFold conseguem modelar a estrutura das proteínas com precisão, ajudando os pesquisadores a entender como as proteínas funcionam nos organismos vivos. O AlphaFold DB, por exemplo, tem mais de 200 milhões de estruturas de proteínas previstas, abrangendo uma grande variedade de organismos. Essa quantidade de dados permite que os cientistas investiguem as características e funções das proteínas de formas que antes não eram possíveis.
Importância da Estrutura das Proteínas
As proteínas são cruciais para quase todos os processos biológicos. A função de cada proteína está intrinsicamente ligada à sua forma. Entender a estrutura de uma proteína pode dar pistas sobre como ela funciona, como interage com outras moléculas e como contribui para a saúde e doenças. Com o surgimento de novos métodos de previsão, os pesquisadores agora podem estudar e modelar proteínas em uma escala muito maior do que antes.
Aplicações dos Dados de Proteínas
Essas enormes coleções de estruturas de proteínas possibilitam várias aplicações. Os pesquisadores estão usando esses dados para identificar novas famílias de proteínas, encontrar alvos potenciais para drogas, melhorar métodos de design de proteínas e aprimorar Árvores Filogenéticas, que ajudam a traçar relações evolutivas entre os organismos. Essa nova pesquisa é só o começo do que os cientistas podem fazer com biologia estrutural e design de proteínas.
Analisando Estruturas de Proteínas
Em uma análise extensa, os pesquisadores examinaram as estruturas previstas de várias proteínas para ver se características específicas poderiam indicar quão bem uma proteína é produzida nos sistemas vivos. Eles usaram uma ferramenta de software chamada DE-STRESS para calcular várias características estruturais de um conjunto de anticorpos projetados. Essa ferramenta avaliou aspectos como densidade de empacotamento, qualidade de Ligações de Hidrogênio, potencial de agregação e ponto isoelétrico.
Com métodos de aprendizado diferentes, eles descobriram que essas características podiam prever quão bem as proteínas eram produzidas. Depois, aplicaram as mesmas técnicas em um conjunto de dados muito maior, com mais de meio milhão de estruturas de proteínas previstas, para ver se as tendências se mantinham em uma escala maior.
Principais Descobertas da Análise
A análise revelou diferenças sistemáticas nas características das proteínas com base nos organismos de onde elas vieram. Por exemplo, tipos de estruturas secundárias, como alfa-hélixes e beta-folhas, variaram nos dados, mostrando distinções claras entre as proteínas. Isso destaca a importância da estrutura secundária na classificação das proteínas, que se alinha com esforços de pesquisa anteriores.
Ao analisar as propriedades médias das proteínas de diferentes organismos, os pesquisadores encontraram diferenças significativas entre organismos eucarióticos (como animais e plantas) e procarióticos (como bactérias). Essa observação pode estar relacionada a diferenças conhecidas em suas estruturas de proteínas, como o nível de regiões desordenadas ou proteínas de múltiplos domínios.
Além disso, características específicas foram essenciais para distinguir esses grupos, como termos de energia relacionados à estrutura e estabilidade das proteínas. Isso sugere que as características das proteínas variam de maneiras que estão ligadas aos seus históricos evolutivos.
Agrupando Organismos com Base nas Propriedades das Proteínas
Usando as propriedades físico-químicas das proteínas, os pesquisadores agruparam organismos em clusters que geralmente se pareciam com a árvore da vida. Essa abordagem os permitiu descobrir relações que se alinham com dados genéticos, mostrando que características estruturais podem refletir a história evolutiva de um organismo.
Por exemplo, os mamíferos tendiam a se agrupar, enquanto várias bactérias se agrupavam com base em suas características compartilhadas. No entanto, algumas discrepâncias interessantes foram notadas. Por exemplo, certas bactérias que normalmente pertencem aos arqueobactérias foram agrupadas com bactérias com base em suas propriedades estruturais, e algumas bactérias patogênicas formaram clusters distintos devido às suas adaptações ambientais únicas.
Prevendo a Produção de Proteínas
Os pesquisadores também conseguiram prever quão bem as proteínas poderiam ser produzidas com base apenas em suas características estruturais. A análise indicou que características específicas eram indicadores confiáveis dos níveis de produção de proteínas. Por exemplo, proteínas com certas características hidrofóbicas ou potencial de agregação eram mais propensas a estarem associadas a altas ou baixas taxas de produção. Essas informações poderiam ser usadas para melhorar o design de proteínas, visando características que aumentam a produção.
Implicações Mais Amplas
As descobertas desses estudos têm implicações mais amplas para vários campos, incluindo biotecnologia e medicina. Ao entender como as estruturas das proteínas se relacionam com suas funções e taxas de produção, os cientistas poderiam projetar proteínas de forma mais eficaz para uso em terapias, vacinas e outras aplicações.
A capacidade de analisar propriedades de proteínas em uma ampla gama de organismos também abre novas possibilidades para entender relações evolutivas e o desenvolvimento de proteínas em diferentes ambientes.
Conclusão
Com o acesso crescente a dados estruturais de proteínas, os pesquisadores podem fazer avanços significativos na compreensão do papel das proteínas na vida. A capacidade de prever e analisar estruturas de proteínas oferece uma imagem mais clara de como as proteínas funcionam e interagem. Essa pesquisa contínua está transformando nossa abordagem à bioquímica, biologia estrutural e além, levando a soluções inovadoras para desafios científicos complexos.
À medida que esse campo avança, o conhecimento adquirido não apenas ampliará nossa compreensão da vida em nível molecular, mas também fornecerá uma base para desenvolver novas tecnologias e estratégias terapêuticas em saúde e medicina. O futuro da ciência das proteínas parece promissor, com aplicações potenciais que podem mudar muitos aspectos da ciência e tecnologia.
Título: Large scale analysis of predicted protein structures links model features to in vivo behaviour
Resumo: Rapid advancements in protein structure prediction methods have ushered in a new era of abundant and accurate structural data, providing opportunities to analyse proteins at a scale that has not been possible before. Here we show that features derived solely from predicted structures can be used to understand in vivo protein behaviour using data-driven methods. We found that these features were predictive of in vivo protein production for a set of designed antibodies, enabling identification of high-quality designs. Following on from this result, we calculated these features for a diverse set of {approx}500,000 predicted structures, and our analysis showed systematic variation between proteins from different organisms to such an extent that the tree of life could be recapitulated from these data. Given the high degree of functional constraint around the chemistry of proteins, this result is surprising, and could have important implications for the design and engineering of novel proteins.
Autores: Christopher W Wood, M. J. Stam, N. Laohakunakorn, D. A. Oyarzun
Última atualização: 2024-04-14 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.10.588835
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.10.588835.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.