Simple Science

最先端の科学をわかりやすく解説

# 生物学# 癌生物学

癌研究における微生物の役割を再評価する

新しい発見が微生物と癌の関係についての以前の見解に疑問を投げかけて、汚染の問題が浮き彫りになってる。

― 1 分で読む


微生物と癌:もっと深く見て微生物と癌:もっと深く見てみようらかになった。新しい研究で微生物がん研究の汚染問題が明
目次

最近の研究では、細菌やウイルスのような小さな生き物が癌に関連しているかもしれないことに注目されてるんだ。この研究は「癌ゲノムアトラス(TCGA)」という、人間の遺伝子や病気に焦点を当てた大きなプロジェクトのデータを使ってる。主な目的は人間の遺伝子を研究することだったけど、このデータを集めてる過程で腫瘍に存在する微生物も捉えたかもしれない。ただ、これらの微生物を特定するのは簡単じゃなくて、大部分が人間のDNAでできてるから、研究中の汚染なんかによる間違いを防ぐことが大事なんだ。

研究の目的

私たちの研究は、TCGAからの全ゲノム配列サンプルを慎重に調べて、これらのサンプルに微生物がいるのかどうかを見つけることを目指してたんだ。私たちは結果を公開して、他の研究者が私たちの発見を確認したり、そこから進めたりできるようにしたよ。また、微生物と癌の関連を示唆している最近の研究と私たちの結果を比較したんだけど、その研究は結果に汚染の問題があったんだ。

以前の研究と問題

ある研究では、TCGAの17,000以上のサンプルを調べて、さまざまな癌のタイプでユニークな微生物の組み合わせを見つけたって主張してた。その情報を使って、異なる癌の種類を高精度で見分けられるとも言ってたんだ。別の研究は癌サンプルの真菌に特化してて、多くの癌タイプでこれらの生物の特徴を見つけたんだ。でも、どちらの研究も汚染の問題に直面していて、一部の発見が正確でない可能性があるんだ。

データのフィルタリングの重要性

微生物を調べる時には、汚染にしっかり対処することが重要なんだ。汚染は、人間のDNAが微生物サンプルと間違って混ざることから起こることがある。人間のDNA配列が繰り返されると、実際よりも多くの細菌がいるように見えることがあるんだ。特に微生物DNAが少ないサンプル、例えば癌サンプルではよくあることだよ。

さらに、汚染は研究中に使う材料、機器や化学物質からも発生することがある。例えば、材料の配列が微生物の内容の一部として間違って現れることもあるんだ。

分析方法

私たちは2023年末までにTCGAからの5,734の全ゲノム配列サンプルを分析したよ。微生物の内容を調べるのに適さない他のタイプのシーケンシングは除外して、全ゲノムシーケンシングに特に焦点を当てたんだ。

サンプルから人間のDNAを取り除くために、シーケンシングのリードを人間のゲノム参照と照合した。人間の配列を取り除いた後、平均して、各サンプルには少数のリードしか残ってなかったんだ。それらの多くはシーケンシングプロセス自体からの汚染物質と特定されたよ。

微生物種に関する発見

特別なソフトウェアを使って、残りの配列を分類して微生物種を見つけたんだ。全サンプルで11,349種類の非人間微生物を特定したよ。ただ、これらのカウントの大部分は少なくて、有意な数のリードがあるエントリーはほんの一部だった。

興味深いことに、特定の病原体による感染の兆候がいくつかのサンプルで見られたんだ。例えば、胃癌のサンプルでは、胃癌と関連があることで知られるヘリコバクター・ピロリのリードが大量に検出されたよ。同様に、他の既知の病原体もいくつかの癌サンプルに現れてるのを確認したんだ。

汚染の証拠

いくつかの潜在的な感染が見られたものの、全体的な分析では癌サンプル内に持続的な微生物群の証拠は見つからなかったよ。観察した微生物のカウントのほとんどは、癌に関連した微生物群が実際に存在するのではなく、汚染によるものだったんだ。

例えば、人間のDNAをフィルタリングした後でも、まだ多くのリードが人間として分類されてた。これは、微生物の内容を分析する際に人間のデータを考慮することがどれだけ重要かを示してるね。

最も一般的に特定された種の多くが、人間の体の皮膚や腸から来ることが知られていて、これらの発見がサンプル取り扱いや処理の際の汚染によるものである可能性が高いことを示しているんだ。

以前の研究との比較

私たちは、以前の研究が同じTCGAデータを使って報告した微生物カウントと比較したよ。その研究のカウントは膨らんでいたんだ。私たちの分析では、以前の研究でのリードカウントのほとんどが過剰に表現されていて、時には実際の量の10倍以上になってたんだ。

特に、以前の研究で報告された微生物の属の範囲を特定したんだけど、私たちの結果ではずっと低いレベルになってた。例えば、一般的に言及される属の中には、カウントが何万から何百万も違うものがあったんだ。こうした不一致は、微生物データを扱う際の慎重な分析とフィルタリング技術の重要性を浮き彫りにしてるよ。

真菌の内容分析

私たちは、癌に関連した独自の「マイコバイオーム」の主張にも取り組んだんだ。ある以前の研究では、研究者たちがさまざまな癌タイプに関連する特定の真菌種を見つけたと言ってたけど、私たちが同じサンプルを分析したときには、この真菌のカウントがかなり低いことがわかったんだ。

この不一致は、真菌のゲノム配列自体の汚染から生じてるよ。以前に高いカウントが報告された多くは、人間のDNAや他の汚染物質によるものだったんだ。例えば、以前は豊富だと思われてた特定の真菌種は、実際には人間由来の配列によって支えられてたんだ。

結論

要するに、私たちのTCGAデータの研究は、癌サンプルの微生物内容についてのより明確なイメージを提供してるよ。改善された技術とフィルタリング方法を使うことで、癌における微生物群の豊富な存在の以前の主張は、汚染の問題により誇張されてる可能性があることがわかったんだ。

私たちの研究では、さらなる調査が必要な個々の微生物が示されたけど、全体的な証拠は明確なマイクロバイオームよりも汚染に向いてるんだ。私たちの発見は、微生物と癌を結びつける主張にさらなる精査が必要であることを示していて、微生物研究における厳密な方法の重要性を強調してるよ。

この研究は今後の研究の基盤に役立つと思うし、研究者が微生物と癌の関係をより正確に研究できるようになることを期待してるんだ。より信頼できるデータセットを提供することで、この複雑な関係を明らかにするさらなる調査を奨励したいんだ。

オリジナルソース

タイトル: Comprehensive analysis of microbial content in whole-genome sequencing samples from The Cancer Genome Atlas project

概要: In recent years, a growing number of publications have reported the presence of microbial species in human tumors and of mixtures of microbes that appear to be highly specific to different cancer types. Our recent re-analysis of data from three cancer types revealed that technical errors have caused erroneous reports of numerous microbial species found in sequencing data from The Cancer Genome Atlas (TCGA) project. Here we have expanded our analysis to cover all 5,734 whole-genome sequencing (WGS) data sets currently available from TCGA, covering 25 distinct types of cancer. We analyzed the microbial content using updated computational methods and databases, and compared our results to those from two major recent studies that focused on bacteria, viruses, and fungi in cancer. Our results expand upon and reinforce our recent findings, which showed that the presence of microbes is far smaller than had been previously reported, and that many species identified in TCGA data are either not present at all, or are known contaminants rather than microbes residing within tumors. As part of this expanded analysis, and to help others avoid being misled by flawed data, we have released a dataset that contains detailed read counts for bacteria, viruses, archaea, and fungi detected in all 5,734 TCGA samples, which can serve as a public reference for future investigations. One-sentence summaryAnalysis of microbial content in 5,734 whole-genome sequencing samples from TCGA yields a comprehensive new resource for investigating the role of microbes in cancer.

著者: Yuchen Ge, J. Lu, D. Puiu, M. Revsine, S. L. Salzberg

最終更新: 2024-08-19 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.05.24.595788

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.05.24.595788.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事