インフルエンザ菌株の分類の進展
新しい方法がH. influenzaeの遺伝的変異の理解を深める。
― 1 分で読む
目次
インフルエンザ桿菌(Haemophilus influenzae)は、小さくて棒状のバイ菌で、人間の体の中、特に上気道に自然に生息できるんだ。普段は害を与えないけど、時々感染症を引き起こすこともあるよ。このバイ菌にはいくつかのタイプがあって、主に糖分子でできた保護層、つまりカプセルの有無で分類されてる。主なタイプはaからfまであって、さらにNTHiという非型別タイプも存在する。
H. influenzaeによる感染症は、耳の感染症や副鼻腔炎のような軽いものから、髄膜炎や敗血症みたいな重い病気まで様々だよ。Hibという特定のタイプに対するワクチンが普及する前は、このタイプがH. influenzaeによる重い感染症の主な原因だった。でも今は、ほとんどの感染(70%以上)がNTHiグループに関連してる。最近、このグループの感染がさまざまな年齢層で増えてきてるのも心配な点なんだ。さらに、このNTHi株が多くの一般的な抗生物質に対して耐性を持つようになってきてる。残念ながら、NTHiグループ用のワクチンは現在利用できなくて、最近の新しいワクチン開発もないんだ。いくつかの監視プログラムはあるけど、異なる株のバイ菌を正確に特定するための標準化された方法が欠けてることが多い。
分子分類の重要性
分子分類は、異なるバイ菌株を特定する上で重要で、感染症の診断や広がりの追跡に役立つよ。バイ菌を分類するための一つの広く使われている方法は、多重座位配列型(MLST)っていうんだ。この技術は、バイ菌の特定の遺伝子断片を調べて、異なるタイプにグループ分けするんだ。もっと進化したバージョンが、コアゲノムMLST(CgMLST)で、これはより多くの遺伝子を分析することで、バイ菌株間の遺伝的な違いをより詳しく理解できるようにしてる。
H. influenzae、特にNTHiは遺伝的な変異が多くて、主にバイ菌同士の遺伝子移転によるものなんだ。研究によると、これらの株は遺伝的な構成にかなりの違いがあることがわかってる。この変異性が、バイ菌を分類して理解するための効果的な方法を開発することが重要だってことを示してるんだ。それが感染症の治療やワクチン開発に役立つんだよ。
H. influenzaeのためのcgMLSTスキームの開発
H. influenzaeをよりよく分類するために、研究者たちはcgMLSTスキームを開発して検証したんだ。このスキームは、異なるH. influenzae株の遺伝情報を集めて整理するもので、この情報を公開することで、世界中の公衆衛生機関がH. influenzaeの遺伝学と病気との関係をよりよく理解できるようになるんだ。
パンゲノム分析のための分析ツールの選定
cgMLSTスキームを開発するために、研究者たちは関連したバイ菌群の遺伝子の完全なセットを見るパンゲノム分析用のいくつかのソフトウェアを使ったんだ。更新されていないソフトウェアや、アクセサリー遺伝子のサイズを膨らませる可能性のあるものは分析から除外されたよ。
分析には、PIRATE、PEPPAN、chewBBACA、Panarooの4つのソフトウェアパッケージを使ったんだ。H. influenzaeのコア遺伝子を特定するために最適なパイプラインを見つけるために、二段階の評価を行ったよ。
高品質データセットの作成
研究のためのデータセットは、公開されているH. influenzaeのゲノムからまとめられたんだ。すべてのゲノムは品質を慎重にレビューされた後、合計2,397のH. influenzae分離株が選ばれたの。これらはcgMLSTスキームの開発用と検証用の2つのグループに分けられたよ。
コア遺伝子の特定
コア遺伝子は、少なくとも95%の分離株に存在するものとして定義されたんだ。これらのコア遺伝子を特定した後、研究者たちは様々なプログラムを使ってエラーをチェックして、発見の妥当性を確認したんだ。この作業は重要で、もし間違いがあれば、異なるH. influenzae株間の関係について誤った結論に至る可能性があるからね。
cgMLSTスキームの検証
cgMLSTスキームの正確性を確保するために、研究者たちは検証データセットに適用したんだ。このステップで、異なるゲノムセットに対してテストしたときにコア遺伝子が一貫していることが確認されたよ。さらに、遺伝子の変動性、機能的分類、組換えについて追加の分析が行われた。
系統解析
H. influenzaeのコアゲノムが確立されると、異なる株間の関係を視覚化するために系統樹が作成されたんだ。この系統樹は、異なる分離株がどれほど近い関係にあるかを理解するのに役立つよ。遺伝子データに基づいて株がクラスタリングされた結果、似たようなカプセルタイプを共有する株間に明確なつながりが見られたんだ。
H. influenzaeの集団構造
H. influenzaeの集団構造は、コアゲノムクラスターを使って調査されたよ。このクラスタリングは遺伝的な関係を反映してて、似たようなカプセルタイプを持つ株が一緒にグループ化される傾向があったんだ。この特徴は、特に型別株に顕著で、NTHiグループはより多様な配置を示したよ。
遺伝的関係の評価
研究者たちは、コアゲノムのアレルプロファイルがH. influenzaeの分離株間の遺伝的関係をどれだけ反映してるかも調べたんだ。遺伝的な違いと系統的な関係の間に強い相関が見つかって、cgMLSTスキームがH. influenzaeの遺伝学を理解するための効果的なツールとして使えることが支持されたよ。
既存の分類システムとの比較
新しいcgMLSTスキームは、H. influenzaeのための以前の分類システムと比較されたんだ。これらの古い方法は、遺伝的関係を正確に反映するために必要な精度が欠けてることが多かったよ。cgMLSTアプローチは、H. influenzaeの集団構造をより詳細で信頼できる形で表現してくれたんだ。
結論
開発されたcgMLSTスキームは、H. influenzae株を分類するための効果的なツールを提供するよ。この方法を使うことで、遺伝的関係を詳細に調べることができて、公衆衛生当局がこのバイ菌による感染症の広がりをよりよく理解できるようになるんだ。さらに、この詳細な遺伝情報は、特に治療や予防において重要な課題を持つ非型別株のためのワクチン開発の努力を支えることになるよ。
タイトル: Development and Implementation of a Core Genome Multilocus Sequence Typing (cgMLST) scheme for Haemophilus influenzae
概要: 2.Haemophilus influenzae is part of the human nasopharyngeal microbiota and a pathogen causing invasive disease. The extensive genetic diversity observed in H. influenzae necessitates discriminatory analytical approaches to evaluate its population structure. This study developed a core genome MLST (cgMLST) scheme for H. influenzae using pangenome analysis tools and validated the cgMLST scheme using datasets consisting of complete reference genomes (N=14) and high-quality draft H. influenzae genomes (N=2,297). The draft genome dataset was divided into a development (N=921) and a validation dataset (N=1,376). The development dataset was used to identify potential core genes with the validation dataset used to refine the final core gene list to ensure the reliability of the proposed cgMLST scheme. Functional classifications were made for all resulting core genes. Phylogenetic analyses were performed using both allelic profiles and nucleotide sequence alignments of the core genome to test congruence, as assessed by Spearmans correlation and Ordinary Least Square linear regression tests. Preliminary analyses using the development dataset identified 1,067 core genes, which were refined to 1,037 with the validation dataset. More than 70% of core genes were predicted to encode proteins essential for metabolism or genetic information processing. Phylogenetic and statistical analyses indicated that the core genome allelic profile accurately represented phylogenetic relatedness among the isolates (R2 = 0.945). We used this cgMLST scheme to define a high-resolution population structure for H. influenzae, which enhances the genomic analysis of this clinically relevant human pathogen. 3. Impact statementDiscriminating H. influenzae variants and evaluating population structure has been challenging and largely unstandardised. To address this, we have developed a cgMLST scheme for H. influenzae. Since an accurate typing approach relies on precise reflection of the underlying population structure, we explored various methods to define the scheme. The core genes included in this scheme were predicted to encode functions in essential biological pathways, such as metabolism and genetic information processing, and could be reliably assembled from short-read sequence data. Single-linkage clustering, based on core genome allelic profiles, showed high congruence to genealogy reconstructed by Maximum-Likelihood (ML) methods from the core genome nucleotide alignment. The cgMLST scheme v1 enables rapid and accurate depiction of high-resolution H. influenzae population structure, and making this scheme accessible via the PubMLST database, ensures that microbiology reference laboratories and public health authorities worldwide can use it for genomic surveillance. 4. Data summaryThe H. influenzae cgMLST scheme is accessible via https://pubmlst.org/organisms/haemophilus-influenzae. The list of isolate IDs available publicly from pubmlst.org is provided in Supplementary File 1. The pipeline for cgMLST scheme development and validation is published at https://www.protocols.io/private/EF6DB7FE429311EEB8630A58A9FEAC02. All in-house R and Python scripts for data processing and analysis are available from https://gitfront.io/r/user-4399403/ZHt8DArALHcY/cgmlst-hinf/.
著者: Odile B. Harrison, M. A. Krisna, K. A. Jolley, W. Monteith, A. Boubour, R. L. Hamers, A. B. Brueggemann, M. C. J. Maiden
最終更新: 2024-04-16 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.15.589521
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.15.589521.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。