Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 感染症(HIV/AIDSを除く)

SARS-CoV-2の診断のためのMALDI-MSの評価

この研究は、MALDI-MSを使った呼吸器感染症の診断の新しい方法を検討してるよ。

― 1 分で読む


MALDI-MSとSARS-CoVMALDI-MSとSARS-CoV2:研究かにした。研究が呼吸器感染症の新しい診断方法を明ら
目次

COVID-19のパンデミックで、急性呼吸器感染症(ARI)の診断方法に問題があることが明らかになったよ。アウトブレイクの初めには、新しいウイルスであるSARS-CoV-2を素早く安く検査する方法が不足してた。このギャップから研究者たちは他の検査オプションを探し始めたんだ。その一つが、マトリックス支援レーザー脱離/イオン化質量分析(MALDI-MS)という技術。普段はタンパク質や小分子の研究に使われるけど、SARS-CoV-2の検査にも期待が持たれてる。

うちのラボは「対象外」MALDI-MSに注目してる。この方法は、特別な準備なしで鼻咽頭スワブみたいな呼吸器サンプルのデータを機械学習(ML)で調べるんだ。この研究では、カザフスタンでこのアプローチがSARS-CoV-2感染と他の非COVID呼吸器感染をうまく区別できるか見たかった。

研究デザイン

SARS-CoV-2の陽性者、非COVID-19の呼吸器感染者、無症状の人たちの鼻咽頭スワブを3つのグループから集めたよ。この参加者募集は2020年5月25日から2022年12月20日まで行われた。成人参加者全員からは書面で同意をもらって、18歳未満は親が同意したよ。ARIを診断するために、発熱や鼻づまり、咳のような少なくとも1つの症状を探したんだ。

SARS-CoV-2の陽性者は地元の病院から選んだ。非COVID-19感染者も病院とプライマリケアセンターから取り出して、適度から重度のARI症状を示してたんだ。これらの人たちは、一般的な呼吸器ウイルスやバクテリアに陽性反応が出てた。SARS-CoV-2の人たちは症状が出てから約3日後にサンプルを集めて、非COVIDグループは約5日後だった。無症状グループは大学のスタッフからで、彼らのSARS-CoV-2の状態はラボで確認されたよ。すべてのサンプルは分析の準備が整うまで冷凍保存されてた。

地元のサンプルに加えて、南アメリカからのMALDI-MSデータも使って比較したよ。

MALDI-MS分析

サンプルの準備とデータ収集には標準的な方法を使ったけど、ちょっとした調整もしたよ。スペクトルは特別なレーザーが装備された機械を使って集めた。サンプルを準備した後、マトリックスとして働く溶液を塗って乾燥させた。このセッティングを機械に入れて、サンプルのランダムなポイントにレーザーを当ててデータを集めたんだ。

生データを理解するために、ソフトウェアを使って処理したよ。特定の範囲にフォーカスするためにデータをトリミングして、明瞭性を高めるために調整して、ノイズを除去した。データを標準化して、一貫性を確保したよ。ピークを特定した後は、ほとんどのサンプルで共通しているものだけを残した。このプロセスで、さらなる分析に使うマトリックスが作られたんだ。

Analysis Iでは、南アメリカのオリジナルデータを使ってモデルをトレーニングした。Analysis IIでは、南アメリカとカザフスタンのデータセットを使って新しいピークマトリックスを作ったよ。

データ分析

いろんなデータ分析を行い、主成分分析(PCA)でデータを視覚化したり、階層クラスタリングで似たサンプルをグループ化したよ。これらの方法で異なるサンプル同士の関係を理解できたんだ。

サンプルを分類するために7つの異なる機械学習アルゴリズムを適用したよ。最初の分析は南アメリカのサンプルだけを使ってトレーニングした。2回目の分析では、カザフスタンのサンプルも入れて、より多様なデータセットでモデルのパフォーマンスを見たんだ。

最初はデータを2つのグループに分けたよ:モデルのトレーニング用とその精度をテストする用。各アルゴリズムのパフォーマンスを最適化するために複雑な方法を使って、何度もこのプロセスを繰り返して結果の信頼性を確認したんだ。そして、特定のパフォーマンスメトリックに基づいて最良のモデルを選んだよ。

結果

最初の分析では、南アメリカのデータだけでトレーニングしたモデルがカザフスタンのサンプルではあまり良い結果を出さなかったんだ。でも、カザフスタンの情報を含めて再トレーニングしたとき、精度が大幅に向上したことがわかった。これで、この方法が異なる環境でも効果的に機能することが示されたんだ。

機械学習アルゴリズムは、カザフスタンのデータでテストすると様々な成功レベルを示したよ。ランダムフォレストモデルは特に強くて、SARS-CoV-2のケースを91%の確率で正しく特定した。ただ、2021年のSARS-CoV-2のケースでは精度が60%を下回っちゃった。このモデルは無症状のコントロールグループともまあまあ良い結果を出した。

2回目の分析では、両地域のサンプルを含めてモデルを再トレーニングして、新しいデータセットで見つかったピークを考慮したよ。またモデルは良い結果を出して、サポートベクターマシン(SVM)とラジアル基底関数を使ったアルゴリズムがグループを区別するのに高い精度を示したんだ。

研究の重要性

うちらの研究の目的は、臨床ラボでMALDI-MSと機械学習がどれだけ効果的かを評価することだったんだ。特に、最小限のサンプル準備でSARS-CoV-2と他のARIを区別できるかどうか。初期のMALDI-MS/MLパイプラインの結果は、カザフスタンのサンプルを特定するのに低い効果を示した。でも、地元のデータでモデルを再トレーニングしたら、検出精度が大幅に向上したよ。

この研究は診断ツールを異なる地域や集団に適応させる重要性を強調してる。結果に変動があるのは、呼吸器サンプルに含まれるさまざまなタンパク質や微生物の違いからくるかもしれないし、個々人の感染への反応も異なるから、診断方法の感度や特異性に影響を与える可能性があるんだ。

制限事項

うちらの研究はいくつかの課題に直面したよ。サンプルの特別な準備がなかったのは、資源の限られた環境では便利だけど、データに変動やノイズをもたらす可能性があるんだ。非COVID-19感染群のサンプルサイズが小さかったから、これらの感染の具体的な原因についてはさらに調べることができなかった。さらに、サンプル収集の期間が2年間に及んだことで、結果に違いが生じたかもしれないし、参加者の特徴の変動も結果に影響を与えるかもしれない。もっと大規模な研究が、幅広い臨床コンテキストでの結果の検証に必要だね。

結論

うちらの研究は、急性呼吸器感染症の診断にMALDI-MSを実用的なツールとして使う可能性についての洞察を提供してる。結果は期待できるけど、実際の臨床環境でこの方法を最適化し、検証するためにはさらなる作業が必要だよ。引き続きどの具体的な要素がMALDI-MSデータで異なる呼吸器感染を区別するのに最も役立つかを調査する予定だ。この継続的な努力が、特に迅速で信頼性のある検査が求められる健康危機の際に、この診断ツールを将来的に洗練させるのに役立つだろうね。

オリジナルソース

タイトル: Application of MALDI-MS and Machine Learning to Detection of SARS-CoV-2 and non-SARS-CoV-2 Respiratory Infections.

概要: BackgroundMatrix-assisted laser desorption/ionization mass spectrometry (MALDI-MS) could aid the diagnosis of acute respiratory infections (ARI) owing to its affordability and high-throughput capacity. MALDI-MS has been proposed for use on commonly available respiratory samples, without specialized sample preparation, making this technology especially attractive for implementation in low-resource regions. Here, we assessed the utility of MALDI-MS in differentiating SARS-CoV-2 versus non-COVID acute respiratory infections (NCARI) in a clinical lab setting of Kazakhstan. MethodsNasopharyngeal swabs were collected from in- and outpatients with respiratory symptoms and from asymptomatic controls (AC) in 2020-2022. PCR was used to differentiate SARS-CoV-2+ and NCARI cases. MALDI-MS spectra were obtained for a total of 252 samples (115 SARS-CoV-2+, 98 NCARI and 39 AC) without specialized sample preparation. In our first sub-analysis, we followed a published protocol for peak preprocessing and Machine Learning (ML), trained on publicly available spectra from South American SARS-CoV-2+ and NCARI samples. In our second sub-analysis, we trained ML models on a peak intensity matrix representative of both South American (SA) and Kazakhstan (Kaz) samples. ResultsApplying the established MALDI-MS pipeline "as is" resulted in a high detection rate for SARS-CoV-2+ samples (91.0%), but low accuracy for NCARI (48.0%) and AC (67.0%) by the top-performing random forest model. After re-training of the ML algorithms on the SA-Kaz peak intensity matrix, the accuracy of detection by the top-performing Support Vector Machine with radial basis function kernel model was at 88.0, 95.0 and 78% for the Kazakhstan SARS-CoV-2+, NCARI, and AC subjects, respectively with a SARS-CoV-2 vs. rest ROC AUC of 0.983 [0.958, 0.987]; a high differentiation accuracy was maintained for the South American SARS-CoV-2 and NCARI. ConclusionsMALDI-MS/ML is a feasible approach for the differentiation of ARI without a specialized sample preparation. The implementation of MALDI-MS/ML in a real clinical lab setting will necessitate continuous optimization to keep up with the rapidly evolving landscape of ARI.

著者: Sergey Yegorov, I. Kadyrova, I. Korshukov, A. Sultanbekova, V. Barkhanskaya, T. Bashirova, Y. Zhunusov, Y. Li, V. Parakhina, S. Kolesnichenko, Y. Baiken, B. Matkarimov, D. Vazenmiller, M. S. Miller, G. H. Hortelano, A. Turmuhambetova, A. E. Chesca, D. Babenko

最終更新: 2023-09-02 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.08.31.23294891

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.08.31.23294891.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事