Techniques d'apprentissage automatique dans le diagnostic du COVID-19
Analyser les symptômes des patients grâce à l'apprentissage automatique pour améliorer les diagnostics de COVID-19.
― 8 min lire
Table des matières
COVID-19, aussi appelé la maladie à coronavirus 2019, est causé par un virus nommé SARS-CoV-2. Les premiers cas ont été signalés à Wuhan, en Chine, à la fin de 2019. En mars 2020, l'Organisation mondiale de la santé (OMS) l'a reconnu comme une pandémie mondiale. Ce virus se propage facilement entre les gens et peut évoluer, entraînant de nouvelles variantes. Ces changements et la manière dont le virus se propage ont conduit à des vagues répétées d'infections dans le monde entier.
Pour réduire le nombre de personnes malades, les Tests sont devenus essentiels, surtout pour ceux montrant des Symptômes ou ayant été en contact avec des individus infectés. Quand les tests n'étaient pas disponibles, les médecins se basaient sur les descriptions de symptômes par les patients pour comprendre leur état. Analyser ces signes et symptômes est crucial pour établir des Diagnostics rapides et précis, ce qui peut mener à un meilleur traitement.
Apprentissage Machine en Santé
L'apprentissage machine (AM) fait partie de l'intelligence artificielle (IA) qui est utilisé en santé depuis le milieu du 20e siècle. Son rôle a considérablement augmenté grâce à la collecte numérique des données des patients. L'AM est reconnu pour son potentiel à apporter de nouvelles idées en santé en analysant de grandes quantités de données diverses en beaucoup moins de temps que les humains.
Cependant, certains systèmes d'AM sont complexes et difficiles à interpréter pour les professionnels de santé. Cette complexité peut rendre difficile leur confiance dans les résultats produits par ces systèmes.
Objectifs de l'Étude
Le principal objectif de cette étude était d'examiner les méthodes et modèles d'AM pour diagnostiquer le COVID-19 uniquement sur la base des symptômes des patients. L'objectif est d'aider les prestataires de soins lors des épidémies. Les objectifs spécifiques sont :
- Évaluer l'efficacité des techniques d'AM pour diagnostiquer le COVID-19, surtout pendant les différentes vagues de contagion.
- Améliorer la clarté des diagnostics de COVID-19 pour aider les prestataires de soins à décider du meilleur traitement.
- Identifier les symptômes les plus courants durant les différentes vagues d'infections.
- Analyser comment les symptômes varient à travers les différentes vagues de COVID-19.
Études Connexes
Des études précédentes ont utilisé diverses méthodes pour construire des outils pour diagnostiquer le COVID-19. Par exemple, une étude en Jordanie a créé un outil de diagnostic utilisant des techniques d'AM, atteignant plus de 90 % de précision. Une autre étude en Angleterre a analysé des données de plus d'un million de participants pour évaluer les taux d'infection. En se concentrant sur les symptômes et les résultats des tests, ces études ont trouvé que certains symptômes étaient des indicateurs plus fiables du COVID-19.
Bien que de nombreuses études aient utilisé l'AM pour aider au diagnostic du COVID-19, cette recherche se distingue en mettant l'accent sur la manière dont les symptômes changent au fil du temps et comment différents tests influencent les résultats. L'étude souligne également l'importance de données équilibrées, garantissant que les résultats ne soient pas biaisés d'un côté.
Méthodologie
La recherche a impliqué plusieurs étapes pour analyser les données efficacement. La première étape était de collecter des données sur les symptômes des patients et les résultats des tests à partir des systèmes de santé ou de formulaires en ligne. Ensuite, une phase de prétraitement des données a commencé, où les informations collectées ont été organisées et les données manquantes ou aberrantes ont été traitées. Les données ont ensuite été regroupées en fonction des différentes vagues d'infection.
Une fois les données préparées, divers algorithmes d'AM ont été testés pour voir à quel point ils pouvaient prédire le COVID-19 sur la base des symptômes identifiés. Cinq algorithmes ont été sélectionnés à cet effet : Random Forest, Multi-Layer Perceptron, XGBoost, Régression Logistique et une méthode appelée Shapley Additive Explanation pour comprendre les résultats du modèle.
Vue d'Ensemble des Résultats
L'étude s'est concentrée sur un établissement de santé à Rio de Janeiro, où les données de patients diagnostiqués avec COVID-19 ont été analysées. La recherche visait à évaluer comment les différents symptômes rapportés par les patients ont changé au cours des différentes vagues de la pandémie. Les symptômes ont été regroupés et analysés pour créer une image plus claire de ce qui pourrait indiquer une infection.
Après une analyse détaillée, différents symptômes ont émergé comme influents durant chaque vague. Par exemple, des symptômes comme la fièvre et la toux étaient toujours importants, mais d'autres comme la congestion nasale sont devenus plus pertinents lors des vagues suivantes.
Analyse des Données et Constatations
L'étude a divisé les données en divers groupes basés sur les différentes vagues et types de tests. Cela a permis une meilleure compréhension de la manière dont les symptômes se présentaient durant chaque vague et de l'efficacité des différentes méthodes de test.
Lors de l'analyse, il a été découvert que l'algorithme Random Forest surpassait les autres dans de nombreux scénarios. La performance a été mesurée à l'aide de diverses métriques, y compris la précision, la sensibilité et la spécificité, qui montrent à quel point les modèles identifiaient correctement les cas positifs et négatifs de COVID-19.
Dans l'ensemble, les résultats ont indiqué que certains symptômes étaient de forts prédicteurs d'une infection au COVID-19. Des symptômes comme la fièvre, la toux et la myalgie étaient significatifs à travers plusieurs vagues, tandis que d'autres variaient en importance.
Impact des Méthodes de Test
L'étude a comparé différentes méthodes de test, y compris les tests RT-PCR, RT-anticorps et RT-antigène. Les tests RT-PCR ont généralement fourni les résultats les plus fiables pour diagnostiquer les infections actives au COVID-19. En revanche, les tests RT-anticorps ont souvent conduit à des résultats moins fiables, surtout au début de l'infection.
Il a été noté que les tests effectués dans un certain délai après le début des symptômes ont donné de meilleurs résultats. Par exemple, lorsque les tests étaient faits dans les 3 à 7 jours suivant l'apparition des symptômes, la précision s'améliorait considérablement, montrant l'importance de tests opportuns dans la gestion de la maladie.
Variation des Symptômes à Travers les Vagues
Une partie importante de l'analyse a impliqué la compréhension des changements de symptômes au cours de la pandémie. Au cours de différentes vagues, la signification de certains symptômes a fluctué. Par exemple, lors de la première vague, des symptômes comme l'anosmie (perte de l'odorat) étaient des indicateurs critiques, mais au fur et à mesure que la pandémie avançait, des symptômes comme la congestion nasale et le mal de gorge devenaient plus proéminents.
Les résultats ont mis en évidence que les modèles formés sur des données d'une vague ne fonctionnaient pas bien avec des données d'une autre vague. Cela suggère que les stratégies de santé publique pourraient avoir besoin de s'adapter à mesure que le virus évolue et que les symptômes associés à l'infection changent.
Explication des Résultats
Pour aider les prestataires de soins à interpréter les résultats des modèles d'AM, une méthode explicable a été utilisée. Cette approche a aidé à clarifier quels symptômes influençaient le plus les prédictions de diagnostic. En comprenant ces relations, les professionnels de santé peuvent prendre des décisions plus éclairées sur les options de traitement.
Par exemple, en utilisant des techniques de visualisation, l'étude a illustré quels symptômes avaient le plus grand effet sur le diagnostic du COVID-19 à chaque vague. Elle a également indiqué que certains symptômes pouvaient signifier des résultats positifs ou négatifs, guidant les prestataires de santé dans leurs évaluations.
Conclusions et Perspectives Futures
En conclusion, cette étude montre que les techniques d'AM peuvent analyser efficacement les symptômes pour aider au diagnostic du COVID-19. Les résultats soulignent la nécessité de tests opportuns et précis et l'importance de comprendre la variation des symptômes au fil du temps.
Cependant, les modèles ont également révélé des limites, notamment lorsqu'il s'agit d'appliquer les résultats d'une vague à une autre. Il est clair qu'à mesure que le virus change, les signes et symptômes qui lui sont associés évoluent également, indiquant une nécessité de recherche continue et d'adaptation dans les approches diagnostiques.
Pour les études futures, les chercheurs visent à intégrer de nouvelles données liées aux variants du virus et au statut vaccinal. Cela pourrait fournir des aperçus plus profonds sur la façon dont différents signes et symptômes se corrèlent avec des variants spécifiques. Il y a aussi des projets pour appliquer les mêmes méthodologies à d'autres maladies, ce qui pourrait élargir leur impact sur la santé publique.
Titre: Analysis of signs and symptoms of SARS-CoV-2 virus infection considering different waves using Machine Learning
Résumé: In March 2020, the World Health Organization declared a world pandemic of COVID-19, which can manifest in humans as a consequence of virus infection of SARS-CoV-2. On this context, this work uses Data Mining and Machine Learning techniques for the infection diagnosis. A methodology was created to facilitate this task and can be applied in any outbreak or pandemic wave. Besides generating diagnosis models based only on signals and symptoms, the method can evaluate if there are differences in signals and symptoms between waves (or outbreaks) through explainable techniques of the machine learning models. Another aspect is identifying possible quality differences between exams, for example, Rapid Test (RT) and Reverse Transcription-Polymerase Chain Reaction (RT-PCR). The case study in this work is based on data from patients who sought care at Piquet Carneiro Polyclinic of the State University of Rio de Janeiro. In this work, the results obtained with the tests were used to diagnose symptomatic infection of the SARS-CoV-2 virus, based on related signals and symptoms, and the date of the initial of these signals and symptoms. Using the Random Forrest model, it was possible to achieve the result of up to 76% sensitivity, 86% specificity, and 79% accuracy in the results of tests in one contagion wave of the SARS-CoV-2 virus. Moreover, differences were found in signals and symptoms between contagion waves, in addition to the observation that exams RT-PCR and RT Antigen tests are more reliable than RT antibody test.
Auteurs: Felipe Cassemiro Ulrichsen, A. da Costa Sena, K. Figueiredo, L. C. Porto
Dernière mise à jour: 2024-02-13 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.02.12.24302722
Source PDF: https://www.medrxiv.org/content/10.1101/2024.02.12.24302722.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.