Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

Nicheformer: Avançando Genômica de Célula Única e Análise Espacial

O Nicheformer integra dados de célula única e dados espaciais pra uma análise celular melhor.

― 6 min ler


Nicheformer TransformaNicheformer TransformaAnálise Celularinterações celulares.Novo modelo melhora a compreensão das
Índice

Avanços recentes nas tecnologias de genômica de Célula única mudaram a forma como os cientistas estudam as células. Essas tecnologias ajudam a entender como diferentes células em um tecido ou órgão funcionam e se comportam. Os cientistas têm coletado muitos dados para criar mapas detalhados da variedade de células encontradas em partes específicas do corpo, como os pulmões e o coração. Mas um desafio aparece porque os métodos frequentemente exigem que os cientistas separem as células do seu ambiente original, o que significa perder informações importantes sobre como elas interagem com o que está ao redor.

Avanços em Transcriptômica Espacial

Pra resolver esse problema, surgiram novos métodos chamados transcriptômica espacial. Esses métodos permitem que os cientistas estudem as células mantendo elas em seu ambiente natural, proporcionando uma visão mais clara de seus papéis e interações. Essa técnica foi usada com sucesso para analisar vários tecidos e órgãos, revelando como as células se comunicam entre si e como formam diferentes estruturas dentro do tecido.

A Necessidade de um Modelo Base

Conforme os cientistas coletam mais dados espaciais, há uma necessidade crescente de modelos que possam aprender com esses dados e aplicá-los em diferentes tarefas de pesquisa. Um modelo base é um tipo de sistema de aprendizado profundo que pode ser treinado em uma ampla gama de dados e adaptado para várias tarefas. Recentemente, modelos base melhoraram significativamente em áreas como processamento de linguagem e análise de imagens, utilizando grandes quantidades de dados de diferentes fontes.

Fundamentos do Modelo Nicheformer

O modelo Nicheformer é introduzido como uma nova abordagem para conectar dados de célula única com dados espaciais. Esse modelo é treinado em um dataset enorme de mais de 110 milhões de células tanto de fontes humanas quanto de camundongos. O conjunto de treinamento inclui duas formas de dados: uma de células únicas que foram separadas e outra de células medidas em seu contexto espacial original. Ao combinar esses conjuntos de dados, o Nicheformer aprende a criar representações que consideram ambos os tipos de dados.

Como o Nicheformer Funciona

O Nicheformer usa uma arquitetura de transformador, que é conhecida pela sua capacidade de lidar com dados complexos. O modelo recebe informações sobre as expressões gênicas de cada célula e detalhes contextuais, ajudando-o a aprender melhores representações dos comportamentos celulares. Ao alimentar o modelo com vários tipos de informações, ele consegue captar as sutilezas entre como diferentes células funcionam com base em seu contexto.

Avaliação do Modelo

Pra ver como o Nicheformer se sai, os pesquisadores o testaram em várias tarefas que envolvem prever tipos de células, regiões e interações em tecidos. O modelo superou as técnicas tradicionais ao prever esses aspectos, mostrando que é eficaz em transferir informações espaciais para dados de célula única.

O Papel do Contexto Celular

Entender o contexto em que uma célula opera é crucial. Cada célula interage com suas células vizinhas, e essas interações influenciam significativamente seu comportamento. Analisando as relações entre as células no ambiente do tecido, os pesquisadores podem obter insights sobre como os tecidos se desenvolvem e funcionam. O Nicheformer melhora a compreensão dessas relações intercelulares ao fornecer uma imagem mais precisa de como as células se comunicam e operam dentro de seu microambiente.

Previsões de Vizinhanças e Densidade Celular

O Nicheformer também pode prever a composição de células próximas, o que é importante para entender a funcionalidade do tecido. Por exemplo, no contexto do câncer, saber a densidade e o tipo de células ao redor pode oferecer insights sobre como um tumor pode se comportar. O modelo previu com sucesso composições de vizinhança e densidades celulares em diferentes tecidos, mostrando sua versatilidade.

Aplicações na Pesquisa do Câncer

A capacidade de prever mudanças em vizinhanças celulares abre novas portas para a pesquisa do câncer. Entender como células imunológicas interagem com células tumorais em seu ambiente pode fornecer informações cruciais que podem levar a melhores opções de tratamento. O Nicheformer permite que os pesquisadores analisem essas interações de forma mais aprofundada, fornecendo insights baseados em dados de expressão gênica.

Aprendendo com Tipos de Dados Diversos

Conforme os dados de várias fontes continuam a crescer, a capacidade de modelos como o Nicheformer de integrar informações de diferentes modalidades se torna cada vez mais importante. Isso inclui dados sobre expressão gênica, níveis de proteínas e outros fatores biológicos. O futuro da pesquisa biológica está em combinar eficazmente esses tipos de dados diversos para gerar uma compreensão abrangente do comportamento celular.

Desafios e Direções Futuras

Embora o Nicheformer represente um avanço significativo, ainda existem desafios a serem superados. O desempenho do modelo é influenciado pela quantidade e diversidade dos dados em que é treinado. À medida que mais dados espaciais se tornam disponíveis, espera-se que as previsões feitas pelo Nicheformer melhorem.

Os pesquisadores também buscam aprimorar o Nicheformer incorporando informações espaciais diretamente em seu treinamento, o que poderia fortalecer suas capacidades preditivas. Iterações futuras do modelo podem usar diferentes técnicas, como redes neurais gráficas, para capturar melhor as relações entre células.

Conclusão

Resumindo, o Nicheformer é um desenvolvimento promissor no campo da genômica de célula única e transcriptômica espacial. Ao aprender efetivamente a partir de uma combinação de dados de célula única e espaciais, ele abre caminho para análises mais nuançadas de tecidos e seus componentes celulares. Esse modelo pode acelerar a descoberta científica, ajudando os pesquisadores a projetar melhores experimentos e aprofundar nossa compreensão dos comportamentos celulares em saúde e doença.

Com mais desenvolvimento e refinamento, o Nicheformer e modelos semelhantes têm o potencial de revolucionar o estudo da biologia, oferecendo insights que eram difíceis de obter antes, melhorando assim nossa compreensão das complexas relações que governam a função celular em diversos ambientes.

Fonte original

Título: Nicheformer: a foundation model for single-cell and spatial omics

Resumo: Tissue makeup relies fundamentally on the cellular microenvironment. Spatial single-cell genomics allows probing the underlying cellular interactions in an unbiased, scalable fashion. To learn a unified cell representation that accounts for local dependencies in the cellular microenvironment, we propose Nicheformer, a transformer-based foundation model that combines human and mouse dissociated single-cell and targeted spatial transcriptomics data. Pretrained on over 57 million dissociated and 53 million spatially resolved cells across 73 tissues on cellular reconstruction, the model is fine-tuned on spatial tasks for spatial omics data to decode spatially resolved cellular information. Nicheformer excels in linear-probing and fine-tuning scenarios for a novel set of downstream tasks, in particular spatial composition prediction and spatial label prediction. We further show that existing foundation models trained on dissociated single-cell data alone are not capable of recapitulating the spatial complexity of cells in their microenvironments, indicating that multiscale models are required to understand complex local dependencies at scale. Nicheformer enables the prediction of the spatial context of dissociated cells, allowing the transfer of rich spatial information to scRNA-seq datasets. Overall, Nicheformer sets the stage for the next generation of machine-learning models in spatial single-cell analysis. Extended AbstractTissue makeup and the corresponding orchestration of vital biological activities, ranging from development and differentiation to immune response and regeneration, rely fundamentally on the cellular microenvironment and the interactions between cells. Spatial single-cell genomics allows probing such interactions in an unbiased and, increasingly, scalable fashion. To learn a unified cell representation that accounts for local dependencies in the cellular microenvironment and the underlying cell interactions, we propose to generalize recent foundation modeling approaches for disassociated single-cell transcriptomics to the spatial omics setting. Our model, Nicheformer, is a transformer-based foundation model that combines human and mouse dissociated single-cell and targeted spatial transcriptomics data to learn a cellular representation useful for a large variety of downstream tasks. Nicheformer is pretrained on over 57 million dissociated and 53 million spatially resolved cells across 73 tissues from both human and mouse. Subsequently, the model is fine-tuned on spatial tasks for spatial omics data to decode spatially resolved cellular information. We demonstrate the usefulness of Nicheformer in both linear-probing as well as fine-tuning scenarios on a novel set of spatially-relevant downstream tasks such as spatial density prediction or niche and region label prediction. In particular, we show that Nicheformer enables the prediction of the spatial context of dissociated cells, allowing the transfer of rich spatial information to scRNA-seq datasets. We define a series of novel spatial prediction problems and observe consistent top performance of Nicheformer, demonstrating the advantage of the improved model capacity of the underlying transformer. Additionally, we benchmarked Nicheformer in these tasks against scGPT1, Geneformer2, scVI3 and PCA and show that the Nicheformer architecture excels in these tasks. Altogether, our large-scale resource of more than 110 million cells in a partial spatial context, together with the set of novel spatial learning tasks and the Nicheformer model itself, will pave the way for the next generation of machine-learning models for spatial single-cell analysis.

Autores: Fabian J Theis, A. C. Schaar, A. Tejada-Lapuerta, G. Palla, R. Gutgesell, L. Halle, M. Minaeva, L. Vornholz, L. Dony, F. Drummer, M. Bahrami

Última atualização: 2024-10-26 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.15.589472

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.15.589472.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes