微生物と酸素の利用に関する新しい知見
研究で、酸素の必要性に基づく微生物の遺伝的な違いが明らかになった。
― 1 分で読む
目次
酸素は地球上の生命にとって重要な分子だよね。これは好気呼吸っていうプロセスに欠かせなくて、これによって生物はエネルギーを作ることができるんだ。人間から小さな微生物まで、ほとんどの生物はこのプロセスに頼ってる。でも、酸素はすごく反応しやすいから、一部の生物には害になることもあるんだ。酸素を使って成長する微生物(好気性微生物って呼ばれる)もいれば、酸素が無くても成長するやつ(嫌気性微生物って言う)もいるんだよね。面白いことに、酸素を使うかどうかに関わらず、多くの微生物は酸素と反応する酵素を持ってるんだ。これが、科学者たちがどの生物が酸素を必要とするかを遺伝情報だけで判断するのを難しくしているんだ。
好気性微生物と嫌気性微生物の違い
好気性微生物と嫌気性微生物には遺伝的な違いがあって、これは微妙だけど見えるよ。好気性微生物は一般的にゲノムが大きくて、酸素を使う酵素が多いんだ。多くの好気性微生物は生命の樹の特定のグループに属してる一方で、嫌気性微生物は酸素が少ないか無い状態でエネルギーを生成するためにいろんな発酵法を使ってるんだ。これらの遺伝的な違いは、研究者が生物が酸素をどう使うかを予測するのに役立つけど、詳しい分析が必要になることが多いんだ。
微生物の酸素利用を分類する課題
微生物が酸素をどのように利用しているかを分類するには、通常、かなりの処理が必要なんだ。これは、使用する酵素を他の既知の配列と比較して特定したり、これらの比較に基づいて完全な代謝経路を再構築することを意味するよ。この2つの方法はコストがかかるし、遺伝子の機能についてどれだけ知っているかに制限されることがある。そこで疑問が浮かぶんだ:すべての詳細なステップを経ずに、遺伝子配列に基づいて微生物を分類できるのかな?
分類の新しいアプローチ
この問題に取り組むために、研究者たちは酸素利用に基づいて微生物を分類するためにDNAとタンパク質の配列を直接使う方法を考えたんだ。彼らは3つのカテゴリーに焦点を合わせたよ:必須好気性微生物(酸素が必要なやつ)、必須嫌気性微生物(酸素が必要ないやつ)、および選択的好気性微生物(酸素があっても無くても生きられるやつ)。データが限られているから、研究者たちは通常、交差検証っていう方法で精度を確認するんだ。これは、データの小さな部分を繰り返し使ってモデルをトレーニングして、そのパフォーマンスをテストすることを含むよ。
この研究では、約3300の酸素利用が知られているゲノムを使って分類器をトレーニングし、独立したデータセットでその精度を評価するという、より徹底したアプローチが取られたんだ。
分類のためのゲノム処理
ゲノムデータを分類のために処理するための方法はいくつかあるよ。一般的なアプローチは、まずゲノムのタンパク質コーディング部分を特定してから、比較手法を使って遺伝子の機能を決定することが多いんだ。これには時間がかかるし、多くのステップが関与する。でも、短い配列(K-merと呼ばれる)を数えることに焦点を当てた速い方法も適用可能だよ。K-merは特定の長さのDNAやタンパク質の配列の小さな文字列なんだ。一部の高度な技術は、機械学習を使ってタンパク質の配列を固定の次元に要約して分類器のトレーニングに使うんだ。
酸素利用の予測方法の比較
研究者たちが微生物が酸素をどのように利用するかを予測するための異なる方法を評価したところ、最良のモデルは広範なゲノムアノテーションを含むことがわかったんだ。この方法は、酸素利用を予測するのに約74%の精度を達成したんだけど、アミノ酸トリプレットを数えるだけのシンプルなモデルも結構良くて、約70%の精度に達してたんだ。
アミノ酸トリプレットを数えるのは、ゲノムを徹底的に処理するよりもずっと早くて、研究者たちは環境サンプルから集めた大量のゲノムを分析することができたんだ。酸素が低いことで知られる環境では、嫌気性の生物が多く見られるだろうって期待してたんだけど、その期待は確認されたよ。
酸素と微生物コミュニティの関係
研究は、酸素が様々な環境における微生物コミュニティの遺伝的構成に大きく影響していることを示したんだ。特定の動物の腸内や嫌気性消化器から取った低酸素地域のサンプルは、高い割合の嫌気性微生物を含んでいた。一方、酸素が多い環境(淡水湖など)では、ほとんどが好気性の微生物だったんだ。
ある特定のケーススタディでは、酸素グラデーションと層状水構造で知られるよく研究された地域、黒海を見たんだ。研究者たちは、異なる深さで酸素と硫化水素のレベルの変化を観察した。彼らのモデルを使って、酸素レベルが高い表層付近では好気性微生物が多くて、深い無酸素水域では嫌気性微生物が支配していることがわかったんだ。
化学の関連性
研究者たちはさらに、地元の化学条件、特に酸素レベルが好気性と嫌気性の生物の豊富さとどのように関連しているかを調べたよ。黒海では、酸素と硫化水素の比率が、好気性と嫌気性微生物の予測比率と強く相関していたんだ。これは、こうした環境で見つかったDNA配列を調べることで、酸素レベルなどの重要な化学濃度を推定できることを示唆しているよ。
環境モニタリングのための新しいツール
この研究の発見は、DNAの配列を調べることで、自然環境における様々な化学条件をモニタリングするための実用的なツールになる可能性を示唆しているんだ。従来の環境化学の研究法はしばしば難しくてコストがかかるんだけど、遺伝子分析を使うことで、エコシステムの化学をより良く理解し追跡するためのスケーラブルな解決策を提供できるかもしれないんだ。
研究者たちはこのアプローチの可能性に興奮しているよ。迅速なDNA配列解析の方法を活用することで、自然界や微生物が環境とどのように相互作用しているかについて、重要な洞察を提供できるんだ。
結論
要するに、酸素は多くの生物の生存にとって非常に重要な役割を果たしているんだ。この研究は、好気性と嫌気性の違い、そして彼らの酸素ニーズを理解することの重要性を強調している。研究者たちは、詳細なアノテーションではなく、遺伝子配列の分析に焦点を当てたシンプルな方法が、生物が酸素をどのように使うかを予測するのに同じくらい効果的であることを発見しているよ。環境条件をモニタリングするためにDNA配列を使う可能性は、この研究分野においてワクワクする一歩前進を意味するんだ。
科学者たちがこれらの方法をさらに洗練させ続けることで、微生物の生命のさらなる秘密を解き明かし、私たちの自然エコシステムを管理して保護するための新しい戦略を開発できるかもしれないね。
タイトル: Annotation-free prediction of microbial dioxygen utilization
概要: Aerobes require dioxygen (O2) to grow; anaerobes do not. But nearly all microbes -- aerobes, anaerobes, and facultative organisms alike -- express enzymes whose substrates include O2, if only for detoxification. This presents a challenge when trying to assess which organisms are aerobic from genomic data alone. This challenge can be overcome by noting that O2 utilization has wide-ranging effects on microbes: aerobes typically have larger genomes, encode more O2-utilizing enzymes, and tend to use different amino acids in their proteins. Here we show that these effects permit high-quality prediction of O2 utilization from genome sequences, with several models displaying >70% balanced accuracy on a ternary classification task wherein blind guessing is only 33.3% accurate. Since genome annotation is compute-intensive and relies on many assumptions, we asked if annotation-free methods also perform well. We discovered that simple and efficient models based entirely on genome sequence content -- e.g. triplets of amino acids -- perform about as well as intensive annotation-based algorithms, enabling the rapid processing of global-scale sequence data to predict aerobic physiology. To demonstrate the utility of efficient physiological predictions we estimated the prevalence of aerobes and anaerobes along a well-studied O2 gradient in the Black Sea, finding strong quantitative correspondence between local chemistry (O2:sulfide concentration ratio) and the composition of microbial communities. We therefore suggest that statistical methods like ours can be used to estimate, or "sense," pivotal features of the environment from DNA sequencing data. ImportanceWe now have access to sequence data from a wide variety of natural environments. These data document a bewildering diversity of microbes, many known only from their genomes. Physiology -- an organisms capacity to engage metabolically with its environment -- may provide a more useful lens than taxonomy for understanding microbial communities. As an example of this broader principle, we developed algorithms that accurately predict microbial dioxygen utilization directly from genome sequences without first annotating genes, e.g. by considering only the amino acids in protein sequences. Annotation-free algorithms enabled rapid characterization of natural samples, demonstrating a quantitative correspondence between sequences and local O2 levels. These results suggest that DNA sequencing can be repurposed as a multi-pronged chemical sensor, estimating concentrations of O2 and other key facets of complex natural settings.
著者: Dianne K. Newman, A. I. Flamholz, J. E. Goldford, E. M. Larsson, A. Jinich, W. W. Fischer
最終更新: 2024-01-16 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.01.16.575888
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.01.16.575888.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。