Simple Science

最先端の科学をわかりやすく解説

# 生物学# 発生生物学

初期哺乳類発生モデルの進展

研究は、高度なモデルを使って初期の哺乳類細胞タイプの発展を理解するのを深めてる。

― 1 分で読む


哺乳類の発生における新しい哺乳類の発生における新しいモデルする。研究が哺乳類の初期細胞タイプの予測を改善
目次

哺乳類は、精子が卵子を受精して、受精卵という単一の細胞が形成されることで発生を始める。この受精卵は特別で、体の中のどんな細胞にも成長する可能性を秘めている。受精卵が形成されてすぐに、何度も分裂して同じサイズを保ちながら細胞の集まりになる。卵子が母体のRNAを通じていくつかの指示を与えるけど、受精卵は早い段階から自分自身の発生を制御し始める。マウスでは、受精卵が2細胞期のときにこの制御が始まり、人間では8細胞期から始まる。

細胞が分裂を続けると、モルラと呼ばれるコンパクトな球体が形成される。この段階で、いくつかの細胞が2つの異なるグループに組織され始める。1つのグループは胎盤になり、これらの細胞は外側の層であるトロフェクトダームを形成する。もう1つの内側のグループには、最終的に胚に発展する細胞が含まれている。胚がブラストシストに成熟すると、液体で満たされた空洞を作る。この時点で、内側の細胞はさらに分化し、胚を形成するエピブラストと、外胚膜構造の形成を助ける原始内胚葉の2種類に変わる。この組織化が完了すると、胚は母親の子宮に付着して発展を続ける準備が整う。

早期発達段階では、科学者たちは「シングルセルシーケンシング」という新しい方法を使って、これらの初期段階を詳しく研究している。さまざまな技術から集めた多くのデータセットが、これらの初期細胞が異なる細胞タイプになる選択をどう行うかを理解するために集められている。幹細胞技術の進歩により、科学者たちは実験室で早期の人間の発達を模倣するモデルを作り出すことができるようになった。これらのモデルは、異なる細胞タイプが形成される仕組みや、それらがどのように相互に関連しているかを理解するのに役立つ。

研究の課題

でも、これらの初期段階を研究するのは難しい。研究者たちは倫理的な懸念や、十分な細胞を得るのが難しいためにしばしば困難に直面している。人間の胚は非常に貴重で限られているため、少量のデータでも非常に重要になる。だから、既存のデータセットを組み合わせて新しいモデルをテストするための役に立つツールを作ることが不可欠だ。これを効果的に行うためには、異なるデータセットを集約して同時に分析するより良い方法が必要だ。

従来のデータセットを統合する方法は、物事が思ったより簡単だと仮定していることが多い。データがクリーンでシンプルな時にはうまくいくけど、初期発達はずっと複雑で、たくさんの信号や出来事が同時に起こる。異なるシーケンシング手法も異なる結果を生むから、データの統合が難しい。データ量が増えるにつれて、現在の方法で分析するのがますます難しくなっている。新しい深層学習やニューラルネットワークを使った技術がこれらの問題に取り組むために登場して、科学者たちはデータを低次元にグループ化できるようになり、それにより分析が楽になっている。

初期発達モデルの構築

この研究では、科学者たちはマウスと人間の初期発達段階のモデルを作成するために高度な計算ツールを使用した。双方の種からシングルセルデータを集めて、発達のさまざまな時点で異なる細胞タイプを識別するための分類器を作った。さらに、複雑なモデルを解釈する方法も考え出したが、これは深層学習システムの「ブラックボックス」な特性のために難しい作業だった。

研究者たちは、実験室で培養された幹細胞でモデルをテストして、どれだけうまくこれらの実験室で作られた細胞がどの細胞タイプになるかを予測できるかを確認したいと考えた。彼らは、モデルが細胞タイプに関する洞察を提供し、実験室で増えている細胞タイプを基準にするのに役立つリソースになることを望んでいた。

参照モデルの作成

信頼できるモデルを作成するために、研究者たちはマウスと人間の前胚のデータセットを集め、高品質な出版物にのみ焦点を当て、細胞やそのタイプに関する詳細な情報を提供した。彼らは、研究のための「グラウンドトゥルース」を構築することを目指した。合計で、13のマウスデータセットと6のヒューマンデータセットを集め、10年以上にわたる多くの研究をカバーした。

選ばれたデータセットは、最も多くの細胞を含んでいた。彼らは前処理を自動化する作業を行い、これにより複雑なデータセットを管理しやすく分析しやすくすることができた。使用した方法は、将来の更新や新しいデータの追加も可能にして、研究を最新の状態に保つことができた。

前処理とデータ統合

データ処理の最初の段階では、データセットをフィルタリングして低品質なデータを排除し、最も関連性のある情報のみを保持した。研究者たちは、曖昧または信頼性のないラベルのデータセットを取り除き、最良のデータのみが参照モデルに含まれるようにした。彼らは、分析を簡素化するために最も変動の大きい上位3,000遺伝子を特定することに焦点を当てた。この選択により、細胞タイプの識別が改善され、結果が明確で正確になる。

マウスデータセットでは、研究者たちはさまざまなシーケンシング手法からのデータを正規化して互いに整合させた。彼らは変動がエラーを引き起こす可能性のある遺伝子を取り除き、質の高い細胞のみを対象とした。この努力によって、2,000以上の細胞が分析された。

人間のデータセットでは、曖昧なラベルのためにいくつかの課題があった。分類器が正確に機能するように、彼らは不確かな細胞に「不明」とラベルを付け、モデル最適化中にこれらを検証に使用した。課題があったにもかかわらず、研究者たちは利用可能なデータを最大限に活用するためにすべての細胞を保持した。

モデル構築と評価

データセットを統合するために、研究者たちはさまざまな最新の計算ツールを利用した。彼らは、高度な機械学習技術を使用してデータを効果的に分類・分析するモデルを作成した。彼らは、自分たちのモデルが強固で信頼できるものであることを保証するために、その性能を厳密に評価しながらモデルを洗練させることを目指した。

研究者たちは、トレーニング中にさまざまなパフォーマンスの指標を追跡し、精度を向上させるために必要な調整を行った。彼らは、さまざまな統合手法を組み合わせて、モデルのパフォーマンスを評価し、最良の結果を見つけた。彼らは、異なる細胞タイプを検出する能力と、それらの相互関係を分析することでモデルを検証した。

結果と洞察

研究の結果、研究者たちのモデルは、マウスと人間の細胞の発達のさまざまな段階を正確に特定する能力があることが示された。彼らは細胞タイプのクラスタリングが、胚の発達に関する既存の知識とかなりよく一致していることを発見した。彼らは、異なる細胞タイプがさまざまな段階を通じてどのように移行するかを追跡することができた。

マウスモデルでは、研究者たちは3つの主要な細胞系統を特定した:トロフェクトダーム、エピブラスト、原始内胚葉。データを分析することで、研究者たちは自分たちのモデルがこれらの系統間の関係や移行を正確に反映していることを確認した。しかし、類似した細胞タイプを区別する能力には課題が残った。

人間モデルでは、胚の入手が限られていることが分析に制約を与えた。多くの細胞がトロフェクトダームの特性を持つと分類され、データセットに不均衡を生んでいた。これらの課題にもかかわらず、モデルは主要な発生段階を特定できたが、個々の細胞タイプを区別するのはより難しかった。

機械学習分類器

研究者たちは、遺伝子発現データに基づいて細胞タイプを自動的に分類するための機械学習分類器を開発した。モデルは、知られているマーカーと新たに特定された特徴を組み合わせて精度を高めた。彼らは、データセット上で分類器をトレーニングするために勾配ブースティング決定木やニューラルネットワークを使用し、その性能を最適化しようとした。

マウスの分類器は非常に良好に機能し、正確さに関して期待を大きく上回った。研究者たちは、これらの分類器が既知の細胞タイプと未知の細胞タイプの両方を効果的に特定できるようにするために努力した。分類器は、特に人間のデータセットに存在する不均衡を考慮に入れることを目指した。

モデルの説明

モデルをより解釈可能にするために、研究者たちはSHAP(SHapley Additive exPlanations)を利用して、特定のアイデンティティを細胞タイプに割り当てるために最も重要な遺伝子を理解した。従来の方法は特徴の重要性についてのいくつかの洞察を提供したが、ニューラルネットワークモデルは解釈が難しいままだった。

研究者たちは、特定のモデルのためにSHAPを適応させ、異なる細胞タイプを定義するための重要な特徴を抽出した。彼らは、その特徴が先行研究からの期待にどれほど合致しているかをテストし、伝統的なマーカーと新しい遺伝子の興味深い混合を明らかにした。

この分析は、モデルが細胞をどのように分類したかについてより明確な理解を可能にし、機械学習の結果と生物学的理解のギャップを埋めることができた。

実践的な応用

研究の最もエキサイティングな側面の1つは、研究者たちが実験データセットにモデルを適用できたことだった。彼らは、実験室で生成された細胞タイプをモデルがどれほどよく特定できるかをチェックするために、in vitroモデルでその予測をテストした。

マウスの実験では、二重報告幼若胚細胞が原始内胚葉に発展する様子を調べ、特に発達の後期段階での予測の正確性を確認した。彼らは細胞の進行をマッピングし、既存の知識と照らし合わせて結果を検証した。

人間モデルにおいて、研究者たちは胚性幹細胞由来のブラストイドから得たデータを使用して、分類器が細胞のアイデンティティをどれほど予測できるかを評価した。マウスに比べて予測は少し不確かだったが、モデルは依然として信頼できる性能を示し、実験室での適用可能性を証明した。

結論

結論として、この研究は、早期哺乳類発生に関する理解を深めるための高度な計算ツールの可能性を示している。さまざまなシングルセルデータセットを統合し、機械学習分類器を利用することで、研究者たちは異なる種間での細胞タイプを予測できる堅牢なモデルを開発した。

これらのモデルは、早期胚発生中に存在する細胞タイプに関する貴重な洞察を提供するだけでなく、新しいin vitroモデルのベンチマークとして機能する有用なリソースにもなる。研究者たちがこれらのモデルをさらに洗練し拡張し続けるに連れて、複雑な生物学的プロセスを理解する可能性はさらに広がるかもしれない。

この研究は、細胞状態のアイデンティティを定義する際に、歴史的なマーカーに厳密に依存するのではなく、より偏りのないアプローチへの道を開く。また、細胞タイプを定義するために関与する遺伝子の広範囲な理解が重要であることを強調し、発生生物学への新しい視点を提供する。

研究者たちは、これらのモデルが分野の進展を促進し、将来的な幹細胞研究や再生医療においてより良い洞察と革新をもたらすことを期待している。

オリジナルソース

タイトル: Deep Learning Based Models for Preimplantation Mouse and Human Development

概要: The rapid growth of single-cell transcriptomic technology has produced an increasing number of datasets for both embryonic development and in vitro pluripotent stem cell derived models. This avalanche of data about pluripotency and the process of lineage specification has meant it has become increasingly difficult to define specific cell types or states and compare these to in vitro differentiation. Here we utilize a set of deep learning (DL) tools to integrate and classify multiple datasets. This allows for the definition of both mouse and human embryo cell types, lineages and states, thereby maximising the information one can garner from these precious experimental resources. Our approaches are built on recent initiatives for large scale human organ atlases, but here we focus on the difficult to obtain and process material that spans early mouse, and in particular, human development. Using publicly available data for these stages, we test different deep learning approaches and develop both a model to classify cell types in an unbiased fashion and define the set of genes required to identify lineages, cell types and states. We have used our predictions to probe pluripotent stem cell models for both mouse and human development, showcasing the importance of this resource as a dynamic reference for early embryogenesis.

著者: Joshua M Brickman, M. Proks, N. Salehin

最終更新: 2024-02-16 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.16.580649

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.16.580649.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事