Simple Science

La science de pointe expliquée simplement

# Biologie# Bioinformatique

DeepMRG : Une nouvelle approche pour les gènes de résistance aux métaux

DeepMRG propose des prédictions améliorées pour les gènes de résistance aux métaux chez les bactéries.

― 7 min lire


DeepMRG : Lutter contreDeepMRG : Lutter contrela résistance aux métauxdes gènes de résistance aux métaux.Nouveau modèle améliore la prédiction
Table des matières

La Résistance aux antibiotiques devient un gros souci pour la santé mondiale. On peut voir ça comme une crise silencieuse parce que c'est pas toujours visible, mais ça touche plein de gens. La raison de tout ça, c'est l'usage excessif et inapproprié des antibiotiques. Pour régler ce problème, les chercheurs se penchent sur des agents Antibactériens à base de métaux. Mais faut savoir que les bactéries peuvent aussi devenir résistantes aux métaux, ce qui peut empirer la situation.

Le besoin de recherche sur les gènes de résistance aux métaux

Pour piger comment les bactéries développent une résistance aux antibiotiques et aux métaux, les scientifiques doivent détecter et étudier les gènes de résistance aux métaux (GRM). Ces gènes aident les bactéries à survivre dans des environnements où il y a des métaux. Il y a plusieurs façons d'identifier les GRM, mais beaucoup de méthodes ont leurs limites. Par exemple, une méthode courante appelée "meilleur hit" compare la séquence d'un gène avec des Bases de données existantes pour trouver des gènes similaires. Cette approche nécessite de fixer des valeurs de coupure spécifiques pour la similarité. Si la coupure est trop haute, ça peut rater certains gènes, mais si elle est trop basse, ça peut signaler des gènes incorrects.

Méthodes actuelles d'identification des GRM

Il existe plusieurs outils pour identifier les GRM, dont MEGARes, AMR-meta et AMRFinderPlus. Cependant, beaucoup de ces outils ne sont pas adaptés à certains types de données et ne donnent pas d'infos détaillées sur les gènes qui résistent à plusieurs métaux. Par exemple, ils pourraient juste donner une étiquette générale pour la résistance multi-métaux sans préciser quels métaux spécifiques les gènes résistent.

Introduction de DeepMRG

Pour répondre au besoin d'outils plus performants, on présente DeepMRG, un nouveau modèle d'apprentissage profond conçu pour classifier et prédire les GRM. Contrairement aux méthodes précédentes, DeepMRG peut donner des infos spécifiques sur quels métaux un gène peut résister. Le modèle fonctionne en comparant une nouvelle séquence de gène avec des GRM déjà confirmés et en extrayant des données pertinentes. Il peut gérer des gènes qui pourraient appartenir à plusieurs catégories en même temps.

Comment DeepMRG fonctionne

DeepMRG prend une séquence de gène et la compare à une base de données de GRM confirmés expérimentalement. Il vérifie les similarités et génère un vecteur de caractéristiques qui représente à quel point le gène correspond à différents types de GRM. Ce vecteur est ensuite traité par un réseau de neurones profonds, qui classe le gène dans une ou plusieurs catégories de résistance selon les données qu'il a reçues.

Collecte et préparation des données

Pour entraîner DeepMRG, on a collecté des infos sur les gènes antibactériens et de résistance aux métaux à partir de diverses bases de données. On a cherché des métaux spécifiques dans les données de gènes et on s'est concentré sur ceux qui confèrent une résistance aux métaux plutôt qu'uniquement aux substances antibactériennes. Ça a donné une liste de séquences de gènes soigneusement sélectionnées pour développer notre modèle.

Entraînement et test du modèle

On a utilisé plusieurs jeux de données pour entraîner DeepMRG. En regroupant des séquences de gènes similaires, on a créé des jeux de données d'entraînement, de validation et de test qui minimisent le chevauchement entre eux. Ce design aide à s'assurer que le modèle apprend efficacement tout en étant testé sur des données qu'il n'a jamais vues.

Évaluation de la performance

On a vérifié la performance de DeepMRG avec plusieurs métriques, y compris la précision, le rappel et les scores F1. Ces métriques aident à évaluer à quel point le modèle est bon pour prédire les bonnes catégories pour les gènes. Pendant les tests, DeepMRG a montré des résultats solides, indiquant qu'il peut prédire les GRM avec précision dans divers scénarios.

Comparaison avec les outils existants

On a aussi comparé DeepMRG avec des méthodes existantes comme BLAST, qui utilise l'alignement de séquences, et AMRFinderPlus, qui combine plusieurs techniques. Même si BLAST est efficace dans certains cas, il peut rater des GRM potentiels à cause de ses valeurs de coupure strictes. AMRFinderPlus peut parfois manquer des GRM aussi, en particulier ceux liés à des métaux spécifiques.

Dans nos tests, DeepMRG a surpassé ces outils existants, surtout dans des situations où les séquences de gènes avaient une similarité plus faible avec des GRM connus. Par exemple, dans un cas, DeepMRG a réussi à prédire des gènes de résistance aux métaux qu'AMRFinderPlus n'a pas pu détecter du tout.

Applications dans le monde réel

DeepMRG peut être super utile dans des contextes réels. Par exemple, des chercheurs qui étudient certaines bactéries pourraient vouloir mieux comprendre leur résistance aux métaux. Dans une étude sur une souche de bactéries Cupriavidus, DeepMRG a bien réussi à prédire des gènes liés à la résistance contre des métaux lourds comme le nickel et le zinc.

Simulation des conditions réelles

Pour valider encore plus DeepMRG, on a mené des expériences où on a introduit quelques GRM connus dans un plus grand jeu de données de gènes non liés. L'objectif était de voir à quel point DeepMRG pouvait trouver ces gènes de résistance parmi beaucoup de gènes non ciblés. Étonnamment, il a obtenu un taux de succès élevé, confirmant sa fiabilité dans des ensembles de données complexes.

Application aux données de gènes

DeepMRG peut analyser à la fois des données métagénomiques et des séquences de gènes assemblées provenant de diverses sources. Le processus inclut la prédiction de gènes à partir de données assemblées et la vérification de ces prédictions contre des GRM connus pour classification. Cette capacité aide les chercheurs à mieux comprendre la résistance aux métaux dans différentes communautés microbiennes.

Conclusion

DeepMRG se démarque comme un outil précieux pour prédire la résistance des bactéries aux métaux. Il permet aux chercheurs d'obtenir des insights sur comment des gènes spécifiques confèrent une résistance, même dans les cas où les gènes diffèrent beaucoup des exemples connus. Avec le défi constant de la résistance aux antibiotiques en tête, des outils comme DeepMRG sont cruciaux pour développer des stratégies contre ce problème urgent. Les chercheurs peuvent combiner DeepMRG avec d'autres outils pour créer une image complète de la résistance antimicrobienne, en s'attaquant à plusieurs types de résistance en même temps.

Dans l'ensemble, les avancées réalisées avec DeepMRG promettent d'améliorer notre compréhension de la résistance aux métaux chez les bactéries, menant finalement à des stratégies éclairées pour atténuer les impacts de la résistance aux antibiotiques à l'échelle mondiale.

Source originale

Titre: DeepMRG: a multi-label deep learning classifier forpredicting bacterial metal resistance genes

Résumé: The widespread misuse of antibiotics has escalated antibiotic resistance into a critical global public health concern. Beyond antibiotics, metals function as antibacterial agents. Metal resistance genes (MRGs) enable bacteria to tolerate metal-based antibacterials and may also foster antibiotic resistance within bacterial communities through co-selection. Thus, predicting bacterial MRGs is vital for elucidating their involvement in antibiotic resistance and metal tolerance mechanisms. The "best hit" approach is mainly utilized to identify and annotate MRGs. This method is sensitive to cutoff values and produces a high false negative rate. Other than the best hit approach, only a few antimicrobial resistance (AMR) detection tools exist for predicting MRGs. However, these tools lack comprehensive annotation for MRGs conferring resistance to multiple metals. To address such limitations, we introduce DeepMRG, a deep learning-based multi-label classifier, to predict bacterial MRGs. Because a bacterial MRG can confer resistance to multiple metals, DeepMRG is designed as a multi-label classifier capable of predicting multiple metal labels associated with an MRG. It leverages bit score-based similarity distribution of sequences with experimentally verified MRGs. To ensure unbiased model evaluation, we employed a clustering method to partition our dataset into six subsets, five for cross-validation and one for testing, with non-homologous sequences, mitigating the impact of sequence homology. DeepMRG consistently achieved high overall F1-scores and significantly reduced false negative rates across a wide range of datasets. It can be used to predict bacterial MRGs in metagenomic or isolate assemblies. The web server of DeepMRG can be accessed at https://deepmrg.cs.vt.edu/deepmrg and the source code is available at https://github.com/muhit-emon/DeepMRG under the MIT license.

Auteurs: Liqing Zhang, M. I. Emon

Dernière mise à jour: 2024-04-10 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2023.11.14.566903

Source PDF: https://www.biorxiv.org/content/10.1101/2023.11.14.566903.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires