Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

ListPredを使ったリステリアリスク予測の進展

ListPredは食品中のL. monocytogenesの危険を予測するのを簡単にするよ。

― 1 分で読む


ListPred:ListPred:食品安全のゲームチェンジャする効率的な予測。リステリア・モノサイトゲネスのリスクに関
目次

リステリア・モノサイトゲネスは、有害なバイ菌で、特に免疫が弱い人や高齢者、妊婦、幼い子供にとって深刻な健康問題を引き起こすことがあるんだ。これに感染すると、死亡率は20%から30%になることもあるんだけど、すべてのバージョンがそんなに危険というわけではないんだよ。最近の研究では、リステリアにはいろんな種類があって、それぞれの性質や危険度が異なることが分かってきた。

このバイ菌は通常、汚染された食べ物を通じて広がるから、食品業界にとっては大きな懸念なんだ。環境のほとんどどこにでもいるし、生鮮食品や器具、さらには食べ物を扱う人たちからも食品加工エリアに入ってくるんだ。生産現場に入ると、リステリアはいろんな場所で長い間生き残ることができる。だから、しっかりとした清掃が大事だね。

全ゲノム解析と機械学習

最近、全ゲノム解析(WGS)の利用が増えてきていて、食品由来のバイ菌を調べる方法として注目されてるんだ。デンマークやフランスなどの国では、WGSを使って危険なバイ菌を追跡していて、これがはっきりした情報を提供してくれるんだ。WGSのデータに機械学習(ML)を組み合わせると、抗生物質への抵抗性や危険度、成長のしやすさなどの重要な特性を予測できるんだ。

これが、WGSとMLが食品業界の食品由来バイ菌をよりよく理解するために役立つかもしれないことを示してるけど、多くの食品生産者はまだWGSを使い始めていないんだ。これには、WGSデータを分析するための必要な技術や専門知識がないという理由があるかもしれない。解決策として、使いやすい分析ツールがあれば、WGSの手法を食品業界に導入しやすくなるかも。

ListPredの紹介

そこでListPredが登場!これは、リステリア・モノサイトゲネスが特定の株レベルでどれだけ危険で消毒剤に抵抗できるかを予測するためのユーザーフレンドリーなMLツールなんだ。ListPredはいくつかの方法でアクセスできて、ユーザーの知識レベルやコンピュータのリソースに応じた3つのバージョンがあるんだ。ListPredの予測が異なるシーケンシング方法やデータ入力でどれだけ一貫性があるかを小規模な研究で確認したりもしたんだ。将来的には、ListPredがリスク管理や食品生産における清掃方法の改善を手助けして、安全な食品を提供できるようになるかもしれない。

ListPredの仕組み

異なるタイプの入力間での予測の一致度を調べるために、まずデータセット1を見たんだ。生データと組み立てデータを比較したところ、8%から10%の違いがあることが分かった。ロングリードデータでは、危険度の予測が92.8%という高い一致率を示した。ショートリードの予測は89.7%で、少し低かったね。

2回目のベンチマーク研究では、生のショートリードとその組み立て形との間で強い一致(99.4%)が見られた。1つだけ不一致があって、生のリードは「低リスク」と予測したのに対し、組み立ては「中リスク」と予測したんだ。

ショートリードとロングリードデータを比較したとき、両者の間での一致率は88%から98%の範囲だった。悪影響の予測に関しては、ショートリードとロングリードの生データ間で12%の不一致があった一方、組み立て予測は95%の強い重なりを示したね。

消毒剤耐性の予測評価

ListPredがリステリア・モノサイトゲネスが消毒剤に抵抗できるかどうかを予測する際の正確さもチェックしたよ。最初のデータセットでは、生データより組み立てデータを使う方が明らかに有利で、最大14%の精度差があった。ショートリードの組み立てが最高の精度0.96、次いでロングリードが0.93、そして生データはそれぞれロングで0.83、ショートで0.82と、正確さが劣ってたんだ。

異なるシーケンシングプラットフォーム間の予測を見たとき、大きな変動は見られなかった。正確さのスコアは、生データと組み立てデータのショートとロングリード間で0.01から0.03の小さな差しかなかったね。

実際の危険度と予測の比較

2回目のベンチマークデータセットでは、危険度予測の正確さに関してさまざまな入力タイプ間でわずかな違いしか見られなかった。ショートリードの生データは完璧な精度1.0を記録し、すべての予測が正しく一致した。一方、組み立てデータの精度スコアは0.99で、1つだけ分類ミスがあって、モデルが「中リスク」と予測したところを「低リスク」と訂正すれば良かったんだ。

ショートリードのシーケンシングは今でも最も一般的な方法なんだ。これは、高精度でコストが低く、こういうシーケンシングを提供するサービスが多いからだと思う。でも、技術が進化する中で、ロングリードシーケンシングもますます正確で手頃になってきてる。WGSが食品業界で普及するにつれて、生産者はどの方法が自分たちにとって最適かを評価する必要があるね。WGSが広く使われるようになると、食品生産者は両方のシーケンシングを使用するだろうね。

ListPredを使う上での課題

ListPredはWGSデータ分析を食品業界にとって簡単にする大きな一歩だけど、いくつかの制限があるんだ。まず、モデルを効果的に訓練するのに十分なデータがないことが問題で、これが結果を幅広い状況に応用するのを難しくしているんだ。他の課題は、WGSの実施にあたる企業が直面する障壁に関連してる。WGSの利点には一般的に合意があるけど、手法は多くのリソースやスキルを要するため、財政的な負担になることもある。このため、小さい食品企業はコストと利益を比べるのが難しいかもしれない。

シーケンシングや分析を外部のサービスに委託するのが解決策かもしれないけど、これには納期が遅くなるという問題があって、緊急の状況では危険になることもある。もう一つの障壁は、食品業界においてWGS手法に関する明確な規制がないことだ。適切なガイドラインがないと、企業は食品由来の病気をよりよく追跡することによる影響を恐れるかもしれない。

ListPredと未来

要するに、ListPredは食品生産者がWGSデータを迅速かつ簡単に分析できるようにすることを目指しているんだ。食品会社がシーケンシング技術をますます導入するにつれて、高度なコンピュータースキルを必要としないシンプルなツールの需要が高まるだろうね。ListPredの予測は、食品安全管理者がリステリア・モノサイトゲネスのリスクを理解し、より効果的に管理できるように役立つかもしれない。この情報は、リスクを減らしたり清掃計画を強化したりするために重要なんだ。

食品業界でのWGS利用の増加は、広範なユーザー向けのツールが必要であることを示している。ListPredが行う予測は、食品安全対策を向上させ、潜在的な脅威にどう対処するかを示すのに重要かもしれない。新しいツールの開発が進んだりシーケンシングコストが下がったりすることで、現在の利益とコストのバランスが変わり、食品セクターにおけるWGSのより広い活用につながるかもしれない。

結論

WGS技術の普及が進むにつれて、利用可能なデータが増えてくるから、既存のモデルを更新するタイミングを考えることが重要になるね。一般的には、現在のモデルに新しいデータを組み入れるためにさまざまな戦略が用いられるけど、再訓練するとリソースがかかることがある。インクリメンタルラーニングと呼ばれる代替手法も使えるけど、ListPredは今のところこれに対応していないんだ。モデルが小さなデータセットで訓練されているから、新しいデータが入ってくる際には新しいモデルを作る方が良いかもしれないね。

全体的に、ListPredは食品業界におけるWGSデータ分析をよりアクセスしやすくするための大きな第一歩を提供しているんだ。使いやすいツールを食品生産者に提供することで、食品由来の脅威に対する対応を強化し、私たちが食べるものの安全性を向上させることができる。それに、食品業界が新しい技術や手法を採用し続ける中で、ListPredのようなツールは時代に遅れず、食品安全を最優先に保つために必要不可欠なんだ。

オリジナルソース

タイトル: ListPred: A predictive ML tool for virulence potential and disinfectant tolerance in Listeria monocytogenes

概要: Despite current surveillance and sanitation strategies, foodborne pathogens continue to threaten the food industry and public health. Whole genome sequencing (WGS) has reached an unprecedented resolution to analyse and compare pathogenic bacterial isolates. The increased resolution significantly enhances the possibility of tracing transmission routes and contamination sources of foodborne pathogens. In addition, machine learning (ML) on WGS data has shown promising applications for predicting important microbial traits such as virulence, growth potential, and resistance to antimicrobials. Many regulatory agencies have already adapted WGS and ML methods. However, the food industry hasnt followed a similarly enthusiastic implementation. Some possible reasons for this might be the lack of computational resources and limited expertise to analyse WGS and ML data and interpret the results. Here, we present ListPred, a ML tool to analyse WGS data of Listeria monocytogenes, a very concerning foodborne pathogen. ListPred is able to predict two important bacterial traits, namely virulence potential and disinfectant tolerance, and only requires limited computational resources and practically no bioinformatic expertise, which is essential for a broad application in the food industry. AUTHOR SUMMARYThe contamination of food products with microbes such as pathogenic bacteria is a big concern for the food industry. The rapid detection, characterisation and eradication of microbial contaminants are of utmost importance to ensure safe food products. Fortunately, strict food safety regulations and stringent cleaning protocols prevent the transmission of harmful bacteria to humans. Individual bacteria of the same species can have varying abilities to resist cleaning agents or infect a host, meaning that some pathogen isolates might be more dangerous than others. Novel techniques such as genome sequencing and machine learning can help to determine such differences in individual bacteria. Unfortunately, these techniques require a lot of computational power and expertise that is limited in the food industry. This is why we developed an easy-to-use software tool called ListPred that can be used with few computational requirements and little expertise. ListPred helps food companies to answer two essential questions: how dangerous are Listeria monocytogenes pathogens, and how to get rid of them most efficiently?

著者: Alexander Gmeiner, M. Ivanova, R. S. Kaas, Y. Xiao, S. Otani, P. Leekitcharoenphon

最終更新: 2024-01-29 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.01.29.577690

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.01.29.577690.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事