Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

Desafios Atuais nas Previsões de Estrutura de RNA

Analisando erros estruturais nas previsões de modelos de RNA e suas implicações.

― 6 min ler


Erros na Modelagem daErros na Modelagem daEstrutura do RNAsignificativos.produzem erros estruturaisMétodos de aprendizado de máquina
Índice

Nos últimos anos, o interesse em estudar as estruturas tridimensionais (3D) do RNA cresceu, especialmente após a pandemia de COVID-19. O vírus da COVID-19 é um vírus de RNA, e a corrida para desenvolver vacinas baseadas em RNA trouxe bastante atenção para a pesquisa sobre RNA. Além disso, o sucesso das técnicas de aprendizado profundo em prever estruturas de proteínas incentivou os pesquisadores a explorar Métodos similares para o RNA. Como resultado, novas maneiras de prever estruturas de RNA estão surgindo, muitas das quais dependem de machine learning.

No entanto, apesar desses avanços, as competições recentes para avaliar previsões de estruturas de RNA mostraram que nenhum dos novos métodos melhorou significativamente a qualidade e a precisão dessas previsões. Os pesquisadores usam vários métodos para medir o quanto as estruturas de RNA previstas combinam com estruturas conhecidas, mas nenhum pode avaliar diretamente o layout geral e a compatibilidade dos modelos 3D. Isso significa que falta percepção sobre os erros que ocorrem nessas previsões, levando a modelos com erros estruturais.

Esses erros podem se manifestar como irregularidades nas formas 3D do RNA, como partes da estrutura do RNA se sobrepondo ou se entrelaçando de maneiras não naturais. Este relatório analisa esses problemas com mais detalhes, focando em dois tipos principais de erros estruturais: Emaranhamentos e nós.

Tipos de Erros Estruturais

Os erros estruturais no RNA podem ser divididos em duas categorias principais: emaranhamentos de elementos estruturais e nós topológicos.

Emaranhamentos de Elementos Estruturais

Emaranhamentos acontecem quando duas partes de uma estrutura de RNA interferem uma na outra. Por exemplo, um pedaço de RNA pode dar uma volta em torno de outro, criando uma espécie de nó ou laço que não deveria estar lá de acordo com o que sabemos sobre como o RNA normalmente se dobra. Isso pode envolver várias partes do RNA, incluindo laços, fitas duplas e fitas simples.

Em termos de estrutura do RNA, entrelaçamentos ocorrem quando duas partes distintas se entrelaçam dentro da forma 3D, enquanto laços se referem a estruturas circulares que se envolvem em outras partes do RNA. Os pesquisadores classificam esses emaranhamentos em vários tipos com base nos componentes envolvidos.

Nós Topológicos

Nós topológicos, por outro lado, envolvem emaranhamentos mais complexos onde seções do RNA estão torcidas de uma forma que cria um verdadeiro nó. Existem diferentes tipos de nós na matemática, e o mais simples é conhecido como nó trefoil.

Algumas pesquisas anteriores identificaram estruturas com nós no RNA, mas esses casos são raros no RNA que ocorre naturalmente. Modelos gerados por meio de previsões computacionais frequentemente contêm esses nós, que são considerados erros por esse motivo.

Analisando Previsões de RNA

Para avaliar as previsões de RNA feitas em uma competição recente, os pesquisadores examinaram modelos previstos para ambos os tipos de erros. Eles utilizaram várias ferramentas computacionais para filtrar as previsões e identificar quaisquer emaranhamentos ou nós presentes.

Os dados analisados vieram de múltiplos alvos de RNA, resultando em um total de 62 estruturas de referência e aproximadamente 1.660 modelos previstos submetidos por 41 grupos diferentes de modelagem. A análise revelou que 162 modelos continham ou emaranhamentos ou nós topológicos, indicando uma presença significativa de erros estruturais.

Visão Geral dos Resultados

Entre os modelos previstos, um número considerável apresentou emaranhamentos ou nós. Dos modelos previstos, 83 apresentaram apenas emaranhamentos, 34 tinham apenas nós topológicos, e 43 tinham ambos. Notavelmente, a ocorrência desses erros estruturais estava intimamente ligada aos métodos usados para criar os modelos.

Impacto da Metodologia

Um olhar mais atento nas metodologias usadas pelos diferentes grupos de modelagem indicou que aqueles que usaram métodos de machine learning eram mais propensos a produzir modelos com erros estruturais. Dos modelos previstos que continham emaranhamentos, impressionantes 80% vieram de abordagens de machine learning, enquanto os 20% restantes foram de métodos tradicionais.

Da mesma forma, para os modelos com nós, 87% foram previstos usando técnicas de machine learning. Isso sugere que os métodos de machine learning são interessantes, mas podem ter mais dificuldades com estruturas complexas.

Diferenças Entre Alvos Naturais e Sintéticos

Ao analisar os alvos dos modelos de RNA, os pesquisadores descobriram que as estruturas de RNA naturais geralmente apresentavam menos emaranhamentos em comparação com os alvos sintéticos. As previsões para RNA sintético eram mais propensas a emaranhamentos e nós, refletindo as diferenças na complexidade estrutural.

Entre as previsões para estruturas de RNA naturais, apenas uma pequena porcentagem apresentou emaranhamentos. Em contraste, os modelos com alvos de RNAS sintéticos mostraram uma tendência muito maior para emaranhamentos e nós.

Exemplos Específicos de Erros Estruturais

Alguns exemplos específicos ilustram os tipos de erros que ocorrem nas previsões de machine learning. Um exemplo notável incluiu um modelo que continha um laço emaranhado, onde uma seção do RNA estava incorretamente envolvida em outra. Essa estrutura em particular não refletia com precisão a estrutura alvo, mostrando desvios significativos.

Outro exemplo apresentou múltiplos emaranhamentos de diferentes tipos dentro de uma estrutura complexa de RNA sintético. Esses modelos exibiram vários erros que são indicativos dos desafios enfrentados ao prever estruturas de RNA computacionalmente.

Conclusão

A análise das previsões de estrutura de RNA revelou que os métodos de machine learning estão significativamente mais inclinados a produzir erros estruturais do que as abordagens tradicionais. Os problemas identificados vão desde emaranhamentos simples até nós complexos que não são representativos do RNA natural.

As descobertas sugerem que, à medida que os pesquisadores continuam a refinar as técnicas de modelagem de RNA, eles devem incorporar verificações para esses erros estruturais para melhorar a qualidade das previsões. Esforços futuros poderiam se beneficiar do desenvolvimento de métodos que não só prevejam estruturas de RNA, mas também validem sua topologia, garantindo que os modelos gerados sejam mais confiáveis e precisos.


Entendendo as armadilhas comuns na modelagem de RNA, os pesquisadores podem trabalhar em direção a melhores métodos de Previsão que oferecem representações mais precisas da estrutura do RNA, beneficiando significativamente o campo da biologia molecular.

Fonte original

Título: Knotted artifacts in predicted 3D RNA structures

Resumo: Unlike proteins, RNAs deposited in the Protein Data Bank do not contain topological knots. Recently, admittedly, the first trefoil knot and some lasso-type conformations have been found in experimental RNA structures, but these are still exceptional cases. Meanwhile, algorithms predicting 3D RNA models have happened to form knotted structures not so rarely. Interestingly, machine learning-based predictors seem to be more prone to generate knotted RNA folds than traditional methods. A similar situation is observed for the entanglements of structural elements. In this paper, we analyze all models submitted to the CASP15 competition in the 3D RNA structure prediction category. We show what types of topological knots and structure element entanglements appear in the submitted models and highlight what methods are behind the generation of such conformations. We also study the structural aspect of susceptibility to entanglement. We suggest that predictors take care of an evaluation of RNA models to avoid publishing structures with artifacts, such as unusual entanglements, that result from hallucinations of predictive algorithms. Author summaryO_LI3D RNA structure prediction contests such as CASP and RNA-Puzzles lack measures for topology-wise evaluation of predicted models. Thus, predictors happen to submit potentially inappropriate conformations, for example, containing entanglements that are prediction artifacts. C_LIO_LIAutomated identification of entanglements in 3D RNA structures is computationally hard. Distinguishing correct from incorrectly entangled conformations is not trivial and often requires expert knowledge. C_LIO_LIWe analyzed 3D RNA models submitted to CASP15 and found that all entanglements in these models are artifacts. C_LIO_LICompared to non-ML, machine learning-based methods are more prone to generating entanglements that are not present in natural RNAs. C_LIO_LITo increase the reliability of 3D RNA structure prediction, it is necessary to reject abnormally entangled structures in the modeling stage. C_LI

Autores: Marta Szachniuk, B. A. Gren, M. Antczak, T. Zok, J. I. Sulkowska

Última atualização: 2024-03-07 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.03.04.583268

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.04.583268.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes