Simple Science

最先端の科学をわかりやすく解説

# 生物学# 神経科学

RNAシーケンシングにおけるデコンボリューション手法のベンチマーキング

この研究は、RNA-seqデータでの細胞タイプの割合を推定する方法を評価してるよ。

― 1 分で読む


RNARNAseqデコンボリューション手法ベンチマークムを評価する。正確な細胞型割合の推定のためのアルゴリズ
目次

最近のRNAシーケンシング技術の進歩によって、単一細胞や核に焦点を当てたRNA-seqデータセットがたくさん生成されているんだ。バルクRNA-seqは、細胞のグループの平均遺伝子発現を見ているから、単一細胞RNA-seqよりも一般的に入手が安いんだ。これが、バルクRNA-seqデータをサンプル内の異なる細胞タイプの推定に分解する方法の開発を促進している。これらの方法は、しばしば単一細胞RNA-seqのデータを基準として使って、バルクサンプル内のさまざまな細胞タイプの割合を推定するんだ。結果として、研究者たちはバルクRNA-seqデータだけを見ていると明らかにならない特定の遺伝子発現パターンを特定できるようになるんだ。

細胞タイプの割合の変動性の課題

細胞タイプの割合を推定するためのさまざまな方法を使用する際の一つの課題は、結果が方法によって大きく異なることがあるから、研究者が自分の特定の研究に適した方法を選ぶのが難しいってことなんだ。いくつかの研究では、さまざまなシナリオにわたってこれらの方法をベンチマークしてきたけれど、結果はしばしば一貫性がなく、いくつかの要因が関係している。使われる組織の種類、基準データセットのバイアス、さまざまなアルゴリズムがどの遺伝子に焦点を当てるかの違いなんかが含まれる。

もう一つの大きな問題は、これらの計算方法を検証するために使える標準的な細胞タイプの割合がないことだ。多くの場合、研究者はテストのためにシミュレーションデータや既存の単一細胞データセットを使ってバルクRNA-seqデータを作成してきたけれど、これらも自分たちのバイアスを導入する可能性がある。免疫組織化学やフローサイトメトリーのような他の技術は、細胞タイプの割合の独立した測定を提供できるけれど、精度を向上させるためにはこれらの方法を取り入れたデータセットがもっと必要だ。

RNA抽出とライブラリ作成の違い

バルクRNA-seqの方法は、さまざまなRNA抽出プロトコルやライブラリ作成技術によって異なる場合があるんだ。いくつかの方法は、細胞内の特定の成分、例えば細胞質や核の部分を強化するかもしれないし、他の方法は細胞全体からRNAをキャッチするんだ。異なるライブラリ作成戦略は異なる結果をもたらすことがある。たとえば、ポリ(A)濃縮を使うとメッセンジャーRNAのプロファイリングができ、リボソームRNAの除去はより広範なRNAタイプをキャッチできる。

これらの違いは、ベンチマークの精度に影響を与え、細胞タイプの割合の推定に不一致をもたらすことがある。したがって、これらの変動を理解することは、バルクRNA-seqデータからデコンボリューション結果を正確に解釈するために重要なんだ。

早期のデコンボリューション方法

遺伝子発現データのデコンボリューションのために設計された初期のアルゴリズムは、特定のサイトが細胞タイプを示すDNAメチル化のために開発されたんだ。でも、RNA-seqデータはマーカー遺伝子の特定に依存していて、これはあまり明確じゃないことがあるんだ。これらのマーカー遺伝子を選択するための効果的な戦略の開発は、まだ進行中の課題なんだ。

このプロセスを手助けするために、この研究では、バルクRNA-seqデータと単一細胞RNA-seq、さらに人間の脳組織からの追加の測定方法を統合したデータセットを生成したんだ。目的は、さまざまな計算デコンボリューション方法をより正確にベンチマークすることだよ。

データセットの概要

この研究では、複数の提供者から収集した人間の脳の背外側前頭皮質(DLPFC)の組織を利用したんだ。六つの広い細胞タイプの細胞タイプの割合を推定するために、免疫蛍光と組み合わせた単一分子蛍光原位ハイブリダイゼーションを含むさまざまなアッセイが行われた。このデータセットには、三つのRNA抽出プロトコルと二つの種類のRNAライブラリが含まれていて、計算方法のベンチマークに多様なデータを提供しているよ。

実験デザイン

このデザインでは、死後の脳組織を使用して、さまざまなRNA-seq条件でのデコンボリューション方法の性能を評価するためのマルチモーダルデータセットを作成したんだ。研究では、さまざまなRNA抽出方法やライブラリ作成が遺伝子発現プロファイルの一貫性にどのように影響するかを扱ったよ。

デコンボリューションアルゴリズムのベンチマーク

このマルチアッセイデータセットで六つの先進的なデコンボリューションアルゴリズムがテストされたんだ。これらの方法の性能は、六つの広い細胞タイプの割合を推定する際にかなり異なった。アルゴリズムには、加重最小二乗法や機械学習などのさまざまな統計技術が含まれていて、予測精度を最適化することを目指しているんだ。

ライブラリタイプ間の差異についての発見

分析では、使用された二つのライブラリタイプ間で遺伝子発現にかなりの違いがあることが示された。いくつかの遺伝子が異なる発現を持つことが確認され、これがデコンボリューション結果に影響を与える可能性があることがわかった。これは、データを解釈する際にRNA抽出方法やライブラリ作成のタイプを考慮する重要性を強調しているよ。

細胞タイプの割合の推定

細胞タイプの割合を推定するために、免疫蛍光を組み合わせたマルチプレックス単一分子蛍光原位ハイブリダイゼーションが利用された。この技術は、異なる細胞タイプの割合に関する貴重な情報を提供して、計算アルゴリズムで得られた結果を検証するのに役立つよ。

マーカー遺伝子の選択

適切な細胞タイプのマーカー遺伝子を選ぶことは、正確なデコンボリューションにとって重要なんだ。この研究では、ターゲット細胞タイプで特定の発現を持つより信頼性のあるマーカー遺伝子を特定するために、「平均比」と呼ばれる新しい手法を導入したんだ。従来の方法と比較して、このアプローチはデコンボリューション分析での精度を向上させる結果となったよ。

デコンボリューション方法の性能評価

デコンボリューション方法の精度がRNAScope/免疫蛍光の定量化と比較され評価された。最も性能が良い二つの方法、Bisqueとhspeは、測定された細胞タイプの割合と強い相関を示した。他の方法、たとえばMuSiCやBayesPrismは比較的に性能が悪かったんだ。

マーカー遺伝子選択への感度

マーカー遺伝子の選択は、デコンボリューションアルゴリズムの性能に大きな影響を与えるよ。この研究では、異なるセットのマーカー遺伝子がアルゴリズムの結果にどのように影響したかを評価したんだ。発見によると、特に「平均比」の上位25遺伝子のようなより安定したマーカー遺伝子セットを使うことで、さまざまな方法での精度が向上したんだ。

細胞タイプの割合の一貫性

興奮性および抑制性ニューロンの推定割合の一貫性をテストした結果、異なるアルゴリズム間でかなりの変動が見られた。この変動は、特定の細胞タイプの推定割合の信頼性に影響を与える可能性があるよ。

外部データセットのベンチマーク

デコンボリューション方法をさらに検証するために、外部データセットが使用されたんだ。方法の性能は、異なるソースからの追加の単一細胞RNA-seqデータを使って評価され、一部の不一致が浮き彫りになったけれど、最も性能が良いアルゴリズムの堅牢性も示されたんだ。

結論

この研究は、人間の脳組織から得られた豊富なマルチアッセイデータセットを取り入れた計算デコンボリューション方法のベンチマークのための貴重な資源を提供するよ。発見は、マーカー遺伝子を適切に選ぶことと、RNA抽出技術やライブラリ作成の違いを考慮する重要性を強調している。RNA-seq技術と方法論が進化し続ける中、このリソースはバルクRNA-seqデータにおける細胞タイプの割合推定の精度を向上させるための重要なツールとなるだろう。

今後の方向性

今後の研究は、より広範な細胞タイプや多様なサンプルを含むようにデータセットを拡大することに焦点を当てるべきだ。細胞サイズや総RNA量を考慮する改良された方法論がデコンボリューションの精度を高める可能性があるよ。データ統合のためのアルゴリズムや技術の ongoingな開発は、人間の脳のような複雑な組織をさらに理解することを約束しているんだ。

要約

最終的に、この研究はRNA-seqデータを異種組織で分析する複雑さに光を当てるんだ。データセット生成、抽出方法、計算手法の変動を扱うことで、この研究は生物サンプルの細胞タイプの組成をより良く解釈する方法に新しい洞察を提供しているよ。さまざまなアッセイ方法の組み合わせと、平均比のような新しいマーカー遺伝子選択技術の導入は、RNA-seqデコンボリューション分析の将来の研究のための堅実な基盤を形成しているんだ。

オリジナルソース

タイトル: Benchmark of cellular deconvolution methods using a multi-assay reference dataset from postmortem human prefrontal cortex

概要: BackgroundCellular deconvolution of bulk RNA-sequencing (RNA-seq) data using single cell or nuclei RNA-seq (sc/snRNA-seq) reference data is an important strategy for estimating cell type composition in heterogeneous tissues, such as human brain. Computational methods for deconvolution have been developed and benchmarked against simulated data, pseudobulked sc/snRNA-seq data, or immunohistochemistry reference data. A major limitation in developing improved deconvolution algorithms has been the lack of integrated datasets with orthogonal measurements of gene expression and estimates of cell type proportions on the same tissue sample. Deconvolution algorithm performance has not yet been evaluated across different RNA extraction methods (cytosolic, nuclear, or whole cell RNA), different library preparation types (mRNA enrichment vs. ribosomal RNA depletion), or with matched single cell reference datasets. ResultsA rich multi-assay dataset was generated in postmortem human dorsolateral prefrontal cortex (DLPFC) from 22 tissue blocks. Assays included spatially-resolved transcriptomics, snRNA-seq, bulk RNA-seq (across six library/extraction RNA-seq combinations), and RNAScope/Immunofluorescence (RNAScope/IF) for six broad cell types. The Mean Ratio method, implemented in the DeconvoBuddies R package, was developed for selecting cell type marker genes. Six computational deconvolution algorithms were evaluated in DLPFC and predicted cell type proportions were compared to orthogonal RNAScope/IF measurements. ConclusionsBisque and hspe were the most accurate methods, were robust to differences in RNA library types and extractions. This multi-assay dataset showed that cell size differences, marker genes differentially quantified across RNA libraries, and cell composition variability in reference snRNA-seq impact the accuracy of current deconvolution methods.

著者: Leonardo Collado-Torres, L. A. Huuki-Myers, K. D. Montgomery, S. H. Kwon, S. Cinquemani, N. J. Eagles, D. Gonzalez-Padilla, S. K. Maden, J. E. Kleinman, T. M. Hyde, S. C. Hicks, K. R. Maynard

最終更新: 2024-04-07 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.09.579665

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.09.579665.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事