Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

ニッチフォーマー:単一細胞ゲノミクスと空間分析の進展

Nicheformerは、シングルセルと空間データを統合して、細胞分析を向上させるよ。

Fabian J Theis, A. C. Schaar, A. Tejada-Lapuerta, G. Palla, R. Gutgesell, L. Halle, M. Minaeva, L. Vornholz, L. Dony, F. Drummer, M. Bahrami

― 1 分で読む


Nicheformerが細Nicheformerが細胞解析を変えるる。新しいモデルが細胞の相互作用の理解を深め
目次

最近の単一細胞ゲノミクス技術の進歩は、科学者たちが細胞を研究する方法を変えたよ。この技術は、組織や臓器内の異なる細胞がどう機能しているか、どう振る舞うかを理解する手助けをしてくれる。科学者たちは、肺や心臓など特定の体の部分に見られる様々な細胞の詳細なマップを作るためにたくさんのデータを集めてきた。ただ、方法によっては、細胞を元の環境から分離する必要があって、それによって細胞が周囲とどう相互作用するかの重要な情報を失ってしまうという課題があるんだ。

空間トランスクリプトミクスの進展

この問題を克服するために、空間トランスクリプトミクスという新しい方法が登場した。これによって、科学者たちは細胞をそのままの環境で研究できるようになり、細胞の役割や相互作用をより明確に見ることができる。この技術は、様々な組織や臓器を分析するのに成功していて、細胞同士がどうコミュニケーションを取っているか、組織内でどう異なる構造を形成しているかを明らかにしている。

基盤モデルの必要性

科学者たちがより多くの空間データを集める中で、このデータから学び、異なる研究タスクに応用できるモデルの必要性が高まっている。基盤モデルは、幅広いデータでトレーニングされ、様々なタスクに適応できる深層学習システムの一種だ。最近、基盤モデルは、異なるソースからの大量のデータを使って言語処理や画像解析の分野で大きな改善を見せている。

Nicheformerモデルの基盤

Nicheformerモデルは、単一細胞データと空間データをつなげる新しいアプローチとして紹介されている。このモデルは、人間とマウスのデータを合わせて1億1000万以上の細胞からなる巨大なデータセットでトレーニングされている。トレーニングセットは、分離された単一細胞からのデータと、その元の空間的コンテキストで測定された細胞からのデータの2つの形式を含んでいる。これらのデータセットを組み合わせることで、Nicheformerは両方のデータタイプを考慮した表現を学ぶんだ。

Nicheformerの動作

Nicheformerは、複雑なデータを管理する能力で知られるトランスフォーマーアーキテクチャを利用している。モデルは、各細胞の遺伝子発現と文脈の詳細に関する情報を取り込んで、細胞の振る舞いのより良い表現を学ぶのを助ける。モデルに様々な種類の情報を提供することで、異なる細胞がその文脈に基づいてどう機能するかの微妙な違いを捉えることができる。

モデルの評価

Nicheformerのパフォーマンスを確認するために、研究者たちは細胞タイプ、地域、および組織内の相互作用を予測する様々なタスクでテストした。このモデルは、これらの側面を予測する際に従来の技術よりも優れていて、空間情報を単一細胞データにうまく転送できることを示している。

細胞のコンテキストの役割

細胞がどのようなコンテキストで機能しているかを理解するのは重要だ。各細胞は隣接する細胞と相互作用していて、これらの相互作用は細胞の振る舞いに大きな影響を与える。組織環境内の細胞間の関係を分析することで、研究者たちは組織がどのように発展し、機能しているかの洞察を得られる。Nicheformerは、細胞がどのようにコミュニケーションを取り、マイクロエンバイロメント内でどのように機能しているかのより正確な描写を提供することで、これらの細胞間の関係の理解を深めている。

近隣と細胞密度の予測

Nicheformerはまた、周囲の細胞の構成を予測することもできて、これは組織の機能を理解する上で重要だ。例えば、癌の文脈では、周囲の細胞の密度や種類を知ることで、腫瘍がどのように振る舞うかの洞察を得られる。モデルは、様々な組織の近隣構成と細胞密度を成功裏に予測し、その多様性を示している。

癌研究への応用

細胞の近隣の変化を予測する能力は、癌研究に新たな扉を開く。免疫細胞が腫瘍細胞とどのように相互作用するかを理解することは、より良い治療オプションに繋がる重要な情報を提供するかもしれない。Nicheformerは、遺伝子発現データに基づいてこれらの相互作用をより徹底的に分析できるようにしてくれる。

多様なデータタイプから学ぶ

様々なソースからのデータが増え続ける中で、Nicheformerのようなモデルが異なるモダリティから情報を統合する能力はますます重要になっている。これは遺伝子発現、タンパク質レベル、その他の生物学的要因に関するデータを含む。今後の生物学研究は、これらの多様なデータタイプを効果的に組み合わせて細胞の振る舞いを包括的に理解することにある。

課題と今後の方向性

Nicheformerは大きな前進を示しているものの、まだ克服すべき課題がある。モデルのパフォーマンスは、トレーニングに使われるデータの量と多様性に影響される。より多くの空間データが利用可能になるにつれて、Nicheformerが行う予測は改善されることが期待されている。

研究者たちは、Nicheformerのトレーニングに空間情報を直接組み込むことで、その予測能力を強化することを目指している。モデルの今後のバージョンは、細胞間の関係をよりよく捉えるために、グラフニューラルネットワークなどの異なる技術を活用するかもしれない。

結論

要するに、Nicheformerは単一細胞ゲノミクスと空間トランスクリプトミクスの分野で有望な進展だ。単一細胞データと空間データの組み合わせから効果的に学ぶことで、組織とその細胞成分のより詳細な分析への道を開いている。このモデルは、科学者がより良い実験をデザインし、健康や病気における細胞の振る舞いを深く理解するのを助けることで、科学的発見を加速させるかもしれない。

さらなる開発と改良を通じて、Nicheformerや同様のモデルは、生物学の研究を革命的に変える可能性を秘めていて、以前は得るのが難しかった洞察を提供することで、様々な環境における細胞機能を支配する複雑な関係の理解を深めることができるだろう。

オリジナルソース

タイトル: Nicheformer: a foundation model for single-cell and spatial omics

概要: Tissue makeup relies fundamentally on the cellular microenvironment. Spatial single-cell genomics allows probing the underlying cellular interactions in an unbiased, scalable fashion. To learn a unified cell representation that accounts for local dependencies in the cellular microenvironment, we propose Nicheformer, a transformer-based foundation model that combines human and mouse dissociated single-cell and targeted spatial transcriptomics data. Pretrained on over 57 million dissociated and 53 million spatially resolved cells across 73 tissues on cellular reconstruction, the model is fine-tuned on spatial tasks for spatial omics data to decode spatially resolved cellular information. Nicheformer excels in linear-probing and fine-tuning scenarios for a novel set of downstream tasks, in particular spatial composition prediction and spatial label prediction. We further show that existing foundation models trained on dissociated single-cell data alone are not capable of recapitulating the spatial complexity of cells in their microenvironments, indicating that multiscale models are required to understand complex local dependencies at scale. Nicheformer enables the prediction of the spatial context of dissociated cells, allowing the transfer of rich spatial information to scRNA-seq datasets. Overall, Nicheformer sets the stage for the next generation of machine-learning models in spatial single-cell analysis. Extended AbstractTissue makeup and the corresponding orchestration of vital biological activities, ranging from development and differentiation to immune response and regeneration, rely fundamentally on the cellular microenvironment and the interactions between cells. Spatial single-cell genomics allows probing such interactions in an unbiased and, increasingly, scalable fashion. To learn a unified cell representation that accounts for local dependencies in the cellular microenvironment and the underlying cell interactions, we propose to generalize recent foundation modeling approaches for disassociated single-cell transcriptomics to the spatial omics setting. Our model, Nicheformer, is a transformer-based foundation model that combines human and mouse dissociated single-cell and targeted spatial transcriptomics data to learn a cellular representation useful for a large variety of downstream tasks. Nicheformer is pretrained on over 57 million dissociated and 53 million spatially resolved cells across 73 tissues from both human and mouse. Subsequently, the model is fine-tuned on spatial tasks for spatial omics data to decode spatially resolved cellular information. We demonstrate the usefulness of Nicheformer in both linear-probing as well as fine-tuning scenarios on a novel set of spatially-relevant downstream tasks such as spatial density prediction or niche and region label prediction. In particular, we show that Nicheformer enables the prediction of the spatial context of dissociated cells, allowing the transfer of rich spatial information to scRNA-seq datasets. We define a series of novel spatial prediction problems and observe consistent top performance of Nicheformer, demonstrating the advantage of the improved model capacity of the underlying transformer. Additionally, we benchmarked Nicheformer in these tasks against scGPT1, Geneformer2, scVI3 and PCA and show that the Nicheformer architecture excels in these tasks. Altogether, our large-scale resource of more than 110 million cells in a partial spatial context, together with the set of novel spatial learning tasks and the Nicheformer model itself, will pave the way for the next generation of machine-learning models for spatial single-cell analysis.

著者: Fabian J Theis, A. C. Schaar, A. Tejada-Lapuerta, G. Palla, R. Gutgesell, L. Halle, M. Minaeva, L. Vornholz, L. Dony, F. Drummer, M. Bahrami

最終更新: 2024-10-26 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.15.589472

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.15.589472.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事