Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Genómica

Novas Descobertas sobre a Genética de Camundongos com Sequenciamento Avançado

Pesquisadores melhoram a anotação do genoma de camundongos usando tecnologia de sequenciamento de leitura longa.

― 7 min ler


Revolucionando a GenômicaRevolucionando a Genômicado Camundongoexpressões gênicas complexas.Novas sequências de long-read mostram
Índice

O camundongo foi um organismo chave na pesquisa científica por muitos anos. Os pesquisadores usam camundongos para estudar biologia e doenças porque eles são pequenos, fáceis de manusear e têm uma vida curta. Os camundongos são parecidos com os humanos em muitos aspectos; eles compartilham milhares de genes e podem desenvolver várias doenças que também afetam as pessoas.

Uma sequência de genoma de referência completa e precisa para o camundongo é crucial para a pesquisa. Isso ajuda os cientistas a identificar e entender os genes e suas funções. Embora um genoma de camundongo tenha sido publicado há duas décadas, a anotação do genoma de referência, que nos diz onde os genes estão localizados, ainda não é perfeita. As anotações existentes fornecem algumas informações sobre genes e suas partes, mas não incluem dados detalhados sobre como esses genes funcionam em diferentes tecidos.

Nova Tecnologia de Sequenciamento

Avanços recentes na tecnologia de sequenciamento, especificamente o sequenciamento de leitura longa, mudaram o cenário da pesquisa genética. Plataformas como Oxford Nanopore Technologies (ONT) e Pacific Biosciences (PacBio) permitem que os cientistas gerem sequências genéticas longas com precisão. Isso significa que os pesquisadores podem capturar transcrições completas, incluindo todas as partes dos genes, facilitando o estudo de como os genes se expressam em vários tecidos.

Anotação Abrangente do Camundongo

Recentemente, uma anotação mais completa do genoma do camundongo foi criada usando a mais recente tecnologia de sequenciamento de leitura longa. Esse esforço produziu mais de 60 milhões de sequências genéticas completas e precisas de diferentes tecidos de camundongos. Analisando essas sequências, os pesquisadores conseguiram fornecer informações detalhadas sobre quantas versões de cada gene estão presentes e em quais quantidades em diferentes tecidos.

O recurso resultante, conhecido como Atlas de Isoformas de Camundongo em Nível de Tecido (TAMI), permite que os pesquisadores acessem uma riqueza de informações sobre a Expressão Gênica em vários tecidos. Essa ferramenta será útil para projetar experimentos e aprofundar nosso entendimento da genética do camundongo.

Coleta e Preparação de Tecidos

Para esse projeto, RNA de alta qualidade foi coletado de 12 tecidos diferentes de camundongos, incluindo cérebro, coração, fígado, entre outros. O RNA foi então transformado em DNA complementar de comprimento completo (CDNA) usando técnicas laboratoriais específicas. Ao focar em pedaços mais longos de cDNA, os pesquisadores garantiram que pudessem capturar uma ampla gama de informações genéticas.

Os tecidos de vários camundongos foram agrupados para criar uma amostra representativa para cada tipo de tecido. Essa preparação cuidadosa ajudou a melhorar a precisão dos resultados de sequenciamento.

Geração de Dados e Precisão

Os métodos de sequenciamento de leitura longa usados nesta pesquisa permitiram a produção de um grande número de sequências cDNA de comprimento completo e precisas. Cada tecido teve milhões de sequências geradas, e a precisão geral foi muito alta. Esse nível de detalhe é vital para entender a expressão gênica e as variações que existem entre os tecidos.

Os pesquisadores usaram ferramentas computacionais avançadas para processar os dados, identificar as diferentes versões de genes (isoformas) e quantificar quanto de cada uma está presente nos tecidos. A coleta de dados de isoformas é especialmente crítica para entender como os genes podem funcionar de forma diferente em tecidos específicos.

Análise da Expressão Gênica

Para avaliar o quanto o sequenciamento capturou todos os genes expressos, os pesquisadores compararam os resultados com dados existentes de outro método de sequenciamento. Eles descobriram que, embora o novo método se aproximasse da cobertura de todos os genes, ainda havia diferenças no número total de genes detectados. O número limitado de leituras contribuiu para essas discrepâncias, mas, no geral, um número significativo de genes foi detectado.

Além disso, investigações mostraram que o novo método de sequenciamento permite uma quantificação precisa da expressão. Ao comparar os níveis de expressão gênica entre os dados novos e os existentes, os pesquisadores encontraram uma forte correlação em muitos casos. Isso mostra que, apesar de algumas diferenças, o novo método é eficaz para identificar e quantificar a expressão gênica.

Caracterização de Isoformas

Um objetivo principal deste projeto era entender as várias isoformas presentes nos 12 tecidos estudados. Isoformas são diferentes versões de um gene que podem existir devido ao splicing alternativo, que é um processo que permite que um único gene produza múltiplas proteínas. Os pesquisadores usaram software avançado para identificar e classificar essas isoformas com base em como elas correspondiam às anotações existentes.

Na análise, milhares de isoformas foram descobertas para cada tecido. A maioria dessas isoformas correspondia a anotações conhecidas, mas muitas novas isoformas também foram identificadas. Essa descoberta é significativa porque aumenta nosso conhecimento sobre a diversidade gênica e como os genes podem funcionar em diferentes contextos biológicos.

Características Únicas nos Tecidos Testiculares

Ao olhar especificamente para os tecidos testiculares, os pesquisadores descobriram que muitas isoformas se originavam de locais de início de transcrição únicos (TSS). Esses TSS são importantes porque indicam onde a expressão gênica começa. Os tecidos testiculares mostraram o maior número de TSS únicos em comparação com outros tecidos. Essa descoberta destaca a complexidade da expressão gênica nos testículos, que são conhecidos por ter uma ampla variedade de genes e isoformas.

Os pesquisadores investigaram ainda se os TSS únicos nos testículos estavam ligados a Fatores de Transcrição específicos, que são proteínas que ajudam a controlar a expressão dos genes. Eles descobriram que muitos desses fatores de transcrição estavam, de fato, altamente expressos nos testículos, sugerindo uma conexão direta entre esses fatores e as expressões gênicas únicas nesse tecido.

Uso Diferencial de Isoformas

Os pesquisadores também queriam analisar como a expressão gênica variava entre os diferentes tecidos. Medindo os níveis de expressão das isoformas, eles podiam determinar com que frequência certas isoformas eram usadas em cada tecido. Alguns tecidos mostraram um alto grau de sobreposição nas isoformas que expressaram, enquanto os testículos se destacaram com uma sobreposição menor em comparação com outros tecidos.

Essa análise forneceu insights sobre a expressão diferencial de isoformas, o que significa que alguns genes podem ser processados de maneira diferente em vários tecidos. Por exemplo, as isoformas de um gene podem ser mais usadas no cérebro do que no fígado ou vice-versa. Tais variações podem ter implicações críticas para entender a função gênica na saúde e na doença.

Conclusão

O recurso abrangente criado neste estudo representa um avanço significativo na anotação do genoma do camundongo. Com dados detalhados sobre expressão gênica e isoformas em diferentes tecidos, os pesquisadores agora têm uma ferramenta inestimável para a pesquisa em genômica. O recurso TAMI ajudará a aumentar nosso entendimento sobre as funções dos genes e a melhorar os projetos experimentais em vários estudos.

Essa nova anotação do genoma não só apoia as pesquisas existentes, mas também estabelece uma base para estudos futuros em outros organismos. À medida que novas tecnologias continuam a se desenvolver, o potencial para análises genômicas profundas cresce, permitindo uma compreensão mais aprofundada da genética e da biologia como um todo.

Fonte original

Título: Generation and analysis of a mouse multi-tissue genome annotation atlas

Resumo: Generating an accurate and complete genome annotation for an organism is complex because the cells within each tissue can express a unique set of transcript isoforms from a unique set of genes. A comprehensive genome annotation should contain information on what tissues express what transcript isoforms at what level. This tissue-level isoform information can then inform a wide range of research questions as well as experiment designs. Long-read sequencing technology combined with advanced full-length cDNA library preparation methods has now achieved throughput and accuracy where generating these types of annotations is achievable. Here, we show this by generating a genome annotation of the mouse (Mus musculus). We used the nanopore-based R2C2 long-read sequencing method to generate 64 million highly accurate full length cDNA consensus reads - averaging 5.4 million reads per tissue for a dozen tissues. Using the Mandalorion tool we processed these reads to generate the Tissue-level Atlas of Mouse Isoforms (TAMI - available at https://genome.ucsc.edu/s/vollmers/TAMI) which we believe will be a valuable complement to conventional, manually curated reference genome annotations.

Autores: Christopher Vollmers, M. S. Adams

Última atualização: 2024-02-01 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.01.31.578267

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.31.578267.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes