Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Genómica

Entendendo Variantes de Proteínas Através da Análise de RNA

Um estudo sobre como variações de RNA levam a funções diferentes de proteínas.

― 8 min ler


Variantes de Proteínas aVariantes de Proteínas apartir da Análise de RNAas funções das proteínas.Analisando como variações de RNA moldam
Índice

Nos nossos corpos, os genes têm um papel importante na criação de Proteínas, que são essenciais para várias funções. Cada gene pode gerar várias versões de uma proteína devido a processos como transcrição alternativa, splicing e poliadenilação. Isso significa que de cerca de 20.000 genes, podemos ter mais de 180.000 Variantes diferentes de proteínas. No entanto, esse sistema complexo pode às vezes falhar, levando a problemas como câncer ou doenças cardíacas. Cientistas estão procurando maneiras de estudar e entender essas variações e como elas impactam a saúde.

Analisando RNA e Proteínas

Para entender a complexidade da expressão gênica, os cientistas podem analisar RNA, que é um jogador crucial no processo de fabricação de proteínas. Avanços em tecnologia permitem uma análise profunda da diversidade de RNA em amostras. O sequenciamento de RNA de leitura longa é uma técnica que ajuda os cientistas a ver a estrutura completa das moléculas de RNA. Ela fornece insights mais detalhados em comparação com métodos tradicionais, revelando padrões intricados de como o RNA é formado e modificado.

O sequenciamento de leitura longa pode conectar diferentes seções de RNA, conhecidas como exons, e pode identificar eventos complexos de splicing. O splicing permite a mistura e combinação de diferentes segmentos de RNA, levando à criação de várias formas de proteínas. Isso pode afetar como as proteínas funcionam e interagem dentro dos nossos corpos.

A questão chave agora é: como essas variações de RNA afetam as proteínas que são produzidas? Para responder a isso, é essencial definir quais poderiam ser as versões completas das proteínas.

Prevendo Variantes de Proteínas

Pesquisadores desenvolveram métodos para prever toda a gama de variantes de proteínas que podem derivar do sequenciamento de RNA. Isso envolve usar as sequências detalhadas obtidas da análise de RNA de leitura longa para prever estruturas potenciais de proteínas. Mapeando essas variantes proteicas previstas, os cientistas podem obter uma compreensão mais ampla da diversidade presente sob diferentes condições biológicas.

Um Mergulho Profundo nas Variações de Splicing

O splicing é uma fonte significativa de diversidade proteica, e pode ocorrer em vários pontos do RNA. Ele pode alterar a maneira como as proteínas são construídas, mesmo que as mudanças iniciais na sequência de RNA sejam pequenas. Às vezes, pequenas mudanças podem levar a impactos maiores na estrutura da proteína, como alterações em suas extremidades ou outras regiões importantes.

Entender como essas variações ocorrem e seus efeitos sobre as proteínas é crucial para desvendar as complexidades de como nossos genes se traduzem em unidades funcionais. Não se trata apenas da presença ou ausência de certos segmentos no RNA; é sobre como esses pedaços se conectam e interagem para formar o produto final da proteína.

Ferramentas para Análise

Para estudar as variações de proteínas causadas pelo splicing, várias ferramentas e bancos de dados foram desenvolvidos. Eles ajudam a anotar e analisar como diferentes formas de proteínas podem funcionar. Algumas ferramentas se concentram em quantificar as diferenças na quantidade de cada variante de proteína utilizada. Outras ajudam a mapear características das proteínas para entender como os eventos de splicing modificam sua estrutura e função.

Apesar desses avanços, ainda há necessidade de ferramentas abrangentes que possam capturar todos os possíveis efeitos das variações nas sequências de proteínas com base nas mudanças subjacentes do RNA.

Apresentando o Biosurfer

Biosurfer é uma nova ferramenta projetada para analisar Isoformas de proteínas, rastreando mudanças em três níveis: RNA, quadros de leitura abertos (que são os segmentos que determinam como o RNA é traduzido em proteínas) e as próprias proteínas. Ela fornece uma comparação detalhada das diferentes formas de proteínas, ligando as mudanças de volta às suas origens no RNA.

Ao inserir dados de sequências de RNA, a ferramenta Biosurfer organiza essas informações em um formato fácil de entender. Ela ajuda a analisar como diferentes mudanças no RNA afetam a proteína que é feita, revelando insights que podem não ser imediatamente óbvios ao olhar apenas os dados genéticos.

Analisando Variantes de Proteínas a Partir de Dados Humanos

O Biosurfer foi aplicado para analisar um grande conjunto de isoformas de proteínas derivadas de bancos de dados de genes humanos conhecidos. Ao olhar para essas proteínas, os pesquisadores identificaram várias regiões alteradas que poderiam levar a diferentes funções proteicas. Descobriram que muitas proteínas tinham múltiplas variantes, indicando que até pequenas mudanças no RNA podem produzir resultados diferentes na função das proteínas.

Essa análise incluiu examinar diferenças no início, meio e fim das sequências de proteínas. Os resultados mostraram que muitas dessas diferenças surgem de mudanças diretas no RNA ou de mecanismos mais complexos, como shifts de quadro que podem alterar drasticamente a proteína resultante.

Variações N-Terminais

Uma área significativa de mudança ocorre no começo da proteína, conhecido como N-terminus. Mudanças aqui podem ser devido a diferentes pontos de partida no RNA. Algumas proteínas podem começar com uma sequência em uma variante e uma diferente em outra. Ao rastrear as razões por trás dessas variações, os pesquisadores descobriram que muitas delas provinham de sites de início alternativos no RNA.

Outras surgiram de pontos de partida compartilhados. Esses padrões destacam como variações no RNA podem ditar quais versões de proteínas são produzidas e como elas podem funcionar de maneira diferente.

Mudanças Internas nas Proteínas

As proteínas costumam ter regiões no meio que podem mudar devido a alterações no RNA. Um grande número dessas variações internas de proteína está ligado a eventos específicos de splicing. Por exemplo, pular um exon pode levar a uma peça faltando no produto final da proteína.

Algumas variações surgem de combinações de eventos de splicing, levando a mudanças mais extensas dentro da estrutura da proteína. Identificar essas mudanças é importante para entender como as proteínas podem diferir umas das outras, mesmo que venham do mesmo gene.

Variações C-Terminais

Mudanças também ocorrem no final das proteínas, conhecidas como C-terminus. Essas podem resultar de mudanças diretas no RNA que introduzem diferentes códons de parada ou de shifts de quadro que mudam a forma como o ribossomo lê o RNA. Entender essas variações pode oferecer insights sobre como as proteínas são formadas e sua potencial funcionalidade em processos biológicos.

Caracterizando Variantes de Proteínas em Diferentes Contextos

Para explorar mais essas mudanças nas proteínas, os pesquisadores examinaram como as variações diferem em várias situações biológicas. Isso incluiu estudar variantes de proteínas de uma linha específica de células-tronco humanas, permitindo uma comparação entre variantes previstas e aquelas encontradas em bancos de dados de genes existentes.

Os achados demonstraram que, enquanto muitos padrões eram consistentes, as isoformas previstas muitas vezes revelavam novas dimensões da diversidade proteica, particularmente em mudanças C-terminais, onde muitas proteínas exibiam variações não vistas em anotações anteriores.

Ligando Mudanças à Funcionalidade

No final das contas, poder ligar mudanças nas proteínas de volta a sequências específicas de RNA melhora nossa compreensão de como variações genéticas podem impactar a saúde e doenças. Ao melhorar as ferramentas e técnicas que usamos para analisar esses processos, conseguimos ter uma imagem mais clara das complexas relações entre nossos genes, as proteínas que eles produzem e como elas funcionam no corpo.

Conclusão

O estudo da diversidade proteica e dos mecanismos que a impulsionam é essencial para desvendar as complexidades da biologia humana. Ferramentas como o Biosurfer desempenham um papel vital em desmembrar essas complexidades, permitindo que os pesquisadores façam conexões mais profundas entre variações de RNA, diversidade proteica e potenciais impactos na saúde. Com os avanços contínuos em tecnologia e bioinformática, o futuro se mostra promissor para aproveitar esse conhecimento e melhorar nossa compreensão da biologia e da medicina.

Fonte original

Título: Biosurfer for systematic tracking of regulatory mechanisms leading to protein isoform diversity

Resumo: Long-read RNA sequencing has shed light on transcriptomic complexity, but questions remain about the functionality of downstream protein products. We introduce Biosurfer, a computational approach for comparing protein isoforms, while systematically tracking the transcriptional, splicing, and translational variations that underlie differences in the sequences of the protein products. Using Biosurfer, we analyzed the differences in 32,799 pairs of GENCODE annotated protein isoforms, finding a majority (70%) of variable N-termini are due to the alternative transcription start sites, while only 9% arise from 5 UTR alternative splicing. Biosurfers detailed tracking of nucleotide-to-residue relationships helped reveal an uncommonly tracked source of single amino acid residue changes arising from the codon splits at junctions. For 17% of internal sequence changes, such split codon patterns lead to single residue differences, termed "ragged codons". Of variable C-termini, 72% involve splice- or intron retention-induced reading frameshifts. We found an unusual pattern of reading frame changes, in which the first frameshift is closely followed by a distinct second frameshift that restores the original frame, which we term a "snapback" frameshift. We analyzed long read RNA-seq-predicted proteome of a human cell line and found similar trends as compared to our GENCODE analysis, with the exception of a higher proportion of isoforms predicted to undergo nonsense-mediated decay. Biosurfers comprehensive characterization of long-read RNA-seq datasets should accelerate insights of the functional role of protein isoforms, providing mechanistic explanation of the origins of the proteomic diversity driven by the alternative splicing. Biosurfer is available as a Python package at https://github.com/sheynkman-lab/biosurfer.

Autores: Gloria Sheynkman, M. Murali, J. Saquing, S. Lu, Z. Gao, B. Jordan, Z. Wakefield, A. Fiszbein, D. Cooper, P. Castaldi, D. Korkin

Última atualização: 2024-03-18 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.03.15.585320

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.15.585320.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes