Avanços na Pesquisa de Proteínas que Se Ligam ao RNA
Novos dados melhoram nossa compreensão sobre proteínas que se ligam ao RNA e seus papéis em diferentes espécies.
Quaid Morris, A. Sasse, D. Ray, K. U. Laverty, C. L. Tam, M. Albu, H. Zheng, O. Lyudovyk, T. Dalal, K. Nie, C. Magis, C. Notredame, M. T. Weirauch, T. R. Hughes
― 6 min ler
Índice
Proteínas que se ligam ao RNA (RBPs) são moléculas importantes nas células que se grudam ao RNA, a molécula que carrega a informação genética. Elas têm um papel chave depois da fase inicial da expressão gênica, ajudando a controlar o que acontece com o RNA. As RBPs podem influenciar o splicing do RNA (o processo de edição do RNA antes de ser usado), decidir pra onde o RNA vai na célula e determinar se ele vai ser traduzido em uma proteína ou destruído.
As RBPs reconhecem sequências ou estruturas específicas no RNA. Essa habilidade é muitas vezes caracterizada usando ferramentas matemáticas conhecidas como motivos, que ajudam a prever quão provável é que uma certa sequência de RNA se ligue a uma RBP específica.
Conhecimento Atual e Limitações
A maior parte do que sabemos sobre como as RBPs funcionam foca em um número limitado de proteínas bem estudadas e organismos específicos, principalmente mamíferos e moscas da fruta. Uma fração bem pequena de todas as RBPs em formas de vida mais complexas, como plantas e fungos, tem dados disponíveis sobre como elas se ligam ao RNA.
Pra conectar as RBPs que compartilham sequências similares, os cientistas usam regras de homologia. Isso significa que as RBPs com sequências de aminoácidos parecidas nas suas partes de ligação tendem a se comportar da mesma forma em relação à ligação com o RNA. No entanto, muitas RBPs menos estudadas não compartilham semelhanças suficientes com nenhuma RBP que tenha dados de ligação conhecidos.
Entre os vários tipos de RBPs, o motivo de reconhecimento de RNA (RRM) é um dos mais comuns. Outro tipo, o domínio K-homologia (KH), também é encontrado com frequência. A capacidade desses domínios de se adaptar e mudar nas suas sequências de ligação provavelmente é uma das razões do seu sucesso ao longo do tempo. Mas, ainda não tá claro como essas proteínas evoluíram pra ter habilidades específicas de ligação ao RNA.
Melhorando Previsões de Ligação
Os pesquisadores estão agora buscando maneiras de melhorar os modelos que predictam como as RBPs reconhecem o RNA. Métodos tradicionais se basearam na similaridade de sequências, mas talvez não contemplem toda a complexidade das interações do RNA. Novas abordagens incluem o uso de modelos de "código de reconhecimento", que relacionam partes específicas da proteína com suas habilidades de ligação ao RNA.
Um novo método que está sendo desenvolvido é o "Embutido Conjunto de Proteína-Ligante" (JPLE). Essa técnica aprende padrões analisando sequências curtas de aminoácidos nas RBPs e seus perfis de ligação ao RNA correspondentes. Treinando com dados de ligação existentes, o JPLE visa ampliar suas previsões para uma gama mais ampla de RBPs, incluindo aquelas que não foram estudadas antes.
Gerando Novos Dados
Pra superar as limitações de estudos anteriores, novos dados foram coletados para 174 RBPs de uma variedade de organismos. Usando JPLE, os pesquisadores desenvolveram um algoritmo que cria modelos baseados nessas novas descobertas. Combinando esses novos dados com dados existentes, conseguiram atribuir especificidades de ligação ao RNA a um grande número de RBPs que antes não eram caracterizadas.
Analisando RNAs de cerca de 690 organismos eucariotos, eles conseguiram reconstruir motivos de ligação ao RNA para milhares de RBPs. Esse esforço resultou na criação de um recurso chamado EuPRI, que contém uma lista abrangente de diversos motivos de ligação ao RNA.
Insights a Partir dos Dados de Ligação ao RNA
A pesquisa descobriu que os motivos de RNA, que são sequências específicas que as RBPs reconhecem, não estão distribuídos uniformemente entre as espécies. Por exemplo, muitos motivos de RNA apareceram recentemente em organismos multicelulares, especialmente em grupos específicos como plantas com flores e nematóides. Essas descobertas sugerem que as RBPs em diferentes organismos podem evoluir rapidamente de acordo com suas necessidades ambientais.
Prevendo Funções das RBPs
Usando os novos dados, os cientistas conseguiram prever os papéis das RBPs na regulação da Estabilidade do RNA em plantas, especialmente em Arabidopsis thaliana, um organismo modelo para estudos de plantas. Analisando como diferentes RBPs se correlacionam com a estabilidade do RNA em vários tipos de tecido, puderam identificar aquelas RBPs que desempenham papéis importantes na estabilização ou desestabilização das moléculas de RNA.
Essa análise revelou 12 RBPs que afetam a estabilidade do mRNA, com algumas estabilizando e outras desestabilizando o RNA associado. Isso ilustra uma rede regulatória complexa nas plantas, onde a mesma sequência de RNA pode ter diferentes resultados de estabilidade dependendo de qual RBP se liga a ela.
A Importância do Novo Recurso
O recurso recém-criado, EuPRI, serve como um avanço significativo na compreensão de como as RBPs funcionam em várias espécies. Ele oferece uma coleção abrangente de motivos de ligação e permite que os pesquisadores estudem os vários papéis das RBPs na regulação do RNA. Além disso, esse recurso pode ajudar em pesquisas relacionadas a doenças causadas por mutações nas RBPs ou nos RNAs-alvo delas.
O método JPLE se mostrou eficaz para atribuir motivos de RNA a uma ampla gama de RBPs, aumentando significativamente o número de especificidades conhecidas. Essa abordagem contrasta com outros métodos mais complexos, tornando-se acessível e eficiente para os pesquisadores.
Implicações para Pesquisas Futuras
Com o EuPRI e o JPLE, os pesquisadores podem explorar questões sobre a evolução e a função das RBPs em maior profundidade. As descobertas levantam perguntas importantes sobre como diferentes RBPs se adaptaram ao longo do tempo, como elas contribuem para processos celulares e como podem ser alvos para propósitos terapêuticos.
Ao entender melhor essas proteínas, os cientistas também podem obter insights sobre a evolução da regulação do RNA, o desenvolvimento de organismos multicelulares e as relações entre várias formas de vida.
Em conclusão, o desenvolvimento de novos recursos e modelos de dados está abrindo caminho para estudos mais abrangentes sobre as RBPs. Esse trabalho é crucial para avançar nossa compreensão da regulação pós-transcricional e das interações complexas entre proteínas e RNA em diversos contextos biológicos.
Título: Reconstructing the sequence specificities of RNA-binding proteins across eukaryotes
Resumo: RNA-binding proteins (RBPs) are key regulators of gene expression. Here, we introduce EuPRI (Eukaryotic Protein-RNA Interactions) - a freely available resource of RNA motifs for 34,736 RBPs from 690 eukaryotes. EuPRI includes in vitro binding data for 504 RBPs, including newly collected RNAcompete data for 174 RBPs, along with thousands of reconstructed motifs. We reconstruct these motifs with a new computational platform -- Joint Protein-Ligand Embedding (JPLE) -- which can detect distant homology relationships and map specificity-determining peptides. EuPRI quadruples the number of known RBP motifs, expanding the motif repertoire across all major eukaryotic clades, and assigning motifs to the majority of human RBPs. EuPRI drastically improves knowledge of RBP motifs in flowering plants. For example, it increases the number of Arabidopsis thaliana RBP motifs 7-fold, from 14 to 105. EuPRI also has broad utility for inferring post-transcriptional function and evolutionary relationships. We demonstrate this by predicting a role for 12 Arabidopsis thaliana RBPs in RNA stability and identifying rapid and recent evolution of post-transcriptional regulatory networks in worms and plants. In contrast, the vertebrate RNA motif set has remained relatively stable after its drastic expansion between the metazoan and vertebrate ancestors. EuPRI represents a powerful resource for the study of gene regulation across eukaryotes.
Autores: Quaid Morris, A. Sasse, D. Ray, K. U. Laverty, C. L. Tam, M. Albu, H. Zheng, O. Lyudovyk, T. Dalal, K. Nie, C. Magis, C. Notredame, M. T. Weirauch, T. R. Hughes
Última atualização: 2024-10-18 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.10.15.618476
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.15.618476.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.