RNAの類似性:マウスモデルの新しい見方
この研究は、RNAデータに基づいて人間とマウスの遺伝子の類似性についての洞察を明らかにしてるよ。
― 1 分で読む
マウスモデルは、人間の病気を研究したり、新しい薬を試したり、遺伝子の働きを理解するためによく使われるんだ。人間とマウスの遺伝子がどれだけ似ているかを知るのは大事なんだけど、両方の種のゲノムがシーケンスされているからこそなんだ。これで、人間とマウスのDNAを見比べて、似ている遺伝子を探ることができるんだよ。
でも、DNAの中で2つの遺伝子が同じように見えるからって、体の中で同じ働きをするわけじゃない。研究によれば、マウスで行われた研究の結果が人間にそのまま当てはまらないこともあるんだ。これは細胞、臓器、環境の違いが原因かもしれないし、DNAの類似性だけに頼ると、本当の遺伝子の働きを捉えられないこともある。遺伝子は通常、RNAやタンパク質を作ることで機能していて、RNAを見れば遺伝子の働きについてもっとよく理解できるかもしれない。
研究の焦点
この研究では、人間とマウスの遺伝子をRNAデータに基づいて比較することを目指したんだ。410,000以上の人間のRNAサンプルと366,000のマウスのRNAサンプルを使ったよ。私たちの目標は、人間とマウスの遺伝子がRNAレベルでどれほど似ているかを見られる方法を作ることだったんだ。それを実現するために、深層学習の先進技術を使って、大量のデータの中からパターンを見つけることができるようにしたんだ。
遺伝子の表現の作成
最初に、両方の種のRNAデータを使って、タンパク質コーディング遺伝子を表現したんだ。これは膨大なRNA-seqデータを処理するモデルを使って行ったよ。各遺伝子は、その生物学的役割に関する情報を含むユニークな表現を持つことになるんだ。この表現には、遺伝子に関連する病気の詳細や、遺伝子がタンパク質とどう相互作用するか、他の重要な生物学的情報が含まれるんだ。
比較を意味のあるものにするには、両方の種の遺伝子表現を同じ枠組みの中に入れる必要があったんだ。違う表現になっちゃうと、比較が難しくなるからね。
遺伝子表現の整列
人間とマウスのRNAサンプルを組み合わせて、混合トレーニング法を実施したんだ。この方法では、両方の種の遺伝子が独自の特徴を学ぶ一方で、モデルの中で一般的な特徴も共有するんだ。最初は、モデルが人間とマウスの遺伝子表現を近づけようとし始めたけど、まだ別々の空間に残ってたから、直接比較できなかったんだ。
整列をさらに改善するために、種間で似ている遺伝子を同じ表現に強制的にする戦略を使ったんだ。このアプローチで遺伝子表現をさらに近づけることができたけど、完全には整列しなかったんだ。
次に、遺伝子表現の整列を進めるための先進的な技術を試みた。これは、人間とマウスの遺伝子の間の既知の類似性に基づいて整列をガイドする監視メソッドを使うもので、これによって多くの類似した遺伝子ペアが密接に整列されたんだ。
遺伝子関係の分析
遺伝子の埋め込みが共通の枠組みに入ったことで、人間とマウスの遺伝子間の類似性を分析できるようになったんだ。DNA配列で似ているように見える遺伝子ペアがRNA表現でも似ていることもあったけど、いくつか面白いパターンも見つけたよ。特定の遺伝子ペアはDNAではあまり似ていなかったのに、RNAデータではかなり似ていることがあった。これは、これらの遺伝子の発現や機能がDNA配列の違いにかかわらず密接に関連している可能性があることを示しているんだ。
私たちの分析は、RNAの類似性が高い遺伝子ペアは、低い遺伝子ペアよりも共通の生物学的情報を持つ傾向があることを確認したんだ。これは、RNAの類似性に注目することで、DNAの比較では見逃してしまうつながりを明らかにできるかもしれないことを示唆しているよ。
遺伝子類似性の役割の理解
遺伝子の類似性は病気や状態についての洞察を提供してくれるかもしれない。人間とマウスの病気に関するデータを見てみると、RNAの類似性が高い遺伝子は共通の病気との関連が多いことがわかったんだ。この発見は、RNAから得られる情報が特定の人間の病気に対するマウスモデルの関連性を予測するのにもっと役立つ可能性があることを示しているんだ。
それに、RNAの類似性が共通の病気との関連をどれだけ予測できるかを、DNAデータに依存するより伝統的な方法と比較してテストしてみたんだ。結果として、RNAに基づく類似性がこれらのDNA中心の指標よりも優れていることが多かったんだ。これは重要な発見で、RNAデータが人間の病気に対して使われるマウスモデルの評価により良い方法を提供するかもしれないことを意味しているんだ。
分析の拡張
私たちの研究では、タンパク質コーディング遺伝子だけに焦点を当てたわけじゃないよ。長いノンコーディングRNAや擬似遺伝子も含めて、タンパク質をコードしない他のタイプの遺伝子も調べたんだ。これらの遺伝子タイプを含めることで、より広範囲にわたる遺伝子の機能における類似性と違いを見ることができたよ。
遺伝子表現を比較したとき、タンパク質コーディング遺伝子が最も高い類似性を持っていることがわかったんだ。これは、人間とマウスの間でその特性がよく保存されていることを示している。だけど、擬似遺伝子みたいな他のタイプの遺伝子は、両方の種の間で表現にもっと変動があったことに気づいたんだ。
この情報は、生物医学研究において、これらのノンコーディング遺伝子の機能を理解することが、遺伝子の挙動や病気のプロセスに対する新しい洞察につながる可能性があるから、非常に重要かもしれない。
研究への影響
この研究は、人間の病気の研究にマウスモデルを使用する際に、人間とマウスの遺伝子の違いを理解する必要性を強調しているんだ。DNAの類似性は役立つこともあるけれど、それだけでは全体像は見えないんだ。研究者は、特に複雑な人間の病気のためにマウスモデルを選ぶ際には、RNAの類似性も考慮に入れるべきだと思うよ。私たちの発見は、DNAレベルで似ているように見えても、実際には異なる働きを持つ遺伝子がいるかもしれないことを示唆しているんだ。
RNAデータを使うことで、研究者は遺伝子の機能に関する貴重な洞察を得られるし、動物モデルの使用を洗練させるのにも役立つだろうね。今後は、研究者がRNAの比較を従来のDNAスタディと統合して、異なる種の遺伝子がどう関連しているかをより包括的に理解していくことが奨励されているよ。
結論
全体的に、RNA情報を使って種間の遺伝子表現を整列することで、種間の遺伝子関係をよりよく理解するための扉を開いたんだ。私たちの方法は、遺伝子の機能を比較するための頑丈な手段を提供していて、最終的には人間の病気研究におけるマウスモデルの信頼性を改善するかもしれない。この研究は、遺伝子の複雑な性質と、DNAとRNAデータの両方を含む多面的なアプローチの重要性を強調しているんだ。
研究が進化し続ける中で、これらの先進技術を統合することは、生物学的な洞察を深め、さまざまな種の遺伝子機能の理解を高めるために必要不可欠になるだろうね。
タイトル: Genes in Humans and Mice: Insights from Deep learning of 777K Bulk Transcriptomes
概要: Mice are widely used as animal models in biomedical research, favored for their small size, ease of breeding, and anatomical and physiological similarities to humans1,2. However, discrepancies between mouse gene experimental results and the actual behavior of human genes are not uncommon, despite their shared DNA sequence similarity3-8. This suggests that DNA sequence similarity does not always reliably predict functional similarity. On the other hand, RNA-level gene expression could offer additional information about gene function9,10. In this study, we undertook characterization and inter-species comparison of human and mouse genes by applying innovative deep learning methodologies to a large dataset of 410K human and 366K mouse bulk RNA-seq samples. This was achieved by using gene representations from our Transformer-based GeneRAIN model11,12. These gene representations aggregate information from large gene expression datasets, and provide insights beyond DNA sequence similarity. We identified 2,407 human-mouse homologous genes with high DNA similarity but distinct RNA characteristics, and showed that these genes are more likely to have differing disease/phenotype associations between the two species. Additionally, we found 3,070 homologous genes with low similarity at both the DNA and RNA levels, suggesting the highest risk of discrepancies in study results between the two species. We propose that this approach will support future decision making around whether the mouse will be an appropriate model for studying specific human genes, and whether the results of specific mouse gene studies are likely to be recapitulated in humans. Our methodological innovations offer valuable lessons for future deep learning applications in cross-species omics data. The interspecies gene relationship findings from our study also contribute valuable insights into the gene biology and evolution of the two species.
著者: Emily Oates, Z. Su, M. Fang, A. Smolnikov, F. Vafaee, M. E. Dinger
最終更新: 2024-07-19 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.01.587517
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.01.587517.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。