Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Informatique de santé

Utiliser le machine learning pour détecter le CKD tôt

Cette étude examine le rôle de l'apprentissage automatique dans le diagnostic de la maladie rénale chronique au Rwanda.

Rugamba Rugero Fiacre, S. Majyambere, B. Noella Confiance, G. Niyomugaba, A. Uwera, P. Nemeyimana, P. Dukuziyaturemye

― 9 min lire


L'apprentissageL'apprentissageautomatique s'attaque audiagnostic de la MRC.chroniques.détection précoce des maladies rénalesDes modèles innovants améliorent la
Table des matières

La Maladie Rénale Chronique (MRC) est un problème de santé qui ne reçoit pas assez d'attention, surtout en Afrique. Cette condition peut causer de graves problèmes de santé et même la mort. Par exemple, en 2017, la MRC a causé environ 1,23 million de décès dans le monde, dont 1 046 au Rwanda. Des recherches estiment qu'environ 10 % des adultes de plus de 18 ans au Rwanda pourraient avoir une MRC.

En plus, la Société Internationale de Néphrologie a rapporté qu'en 2020, environ 850 millions de personnes dans le monde étaient touchées par la MRC, et ce nombre continue d'augmenter. La MRC est connue comme une cause majeure de maladies cardiaques, qui sont la principale cause de décès dans le monde.

La MRC est un processus graduel où les reins perdent leur capacité à bien fonctionner. Cette condition peut toucher n'importe qui, mais elle est plus fréquente chez les personnes âgées et celles qui ont des problèmes de santé comme le diabète et l'hypertension. À mesure que la condition s'aggrave, la fonction rénale diminue, rendant plus difficile l'élimination des déchets et le maintien de l'équilibre des fluides et des acides.

Au fur et à mesure que la MRC progresse, elle peut entraîner de graves complications de santé qui nécessitent une attention médicale immédiate. Ces complications peuvent affecter divers organes et avoir un impact significatif sur la santé globale. La MRC peut aussi causer ou aggraver l'hypertension, ce qui peut endommager davantage les reins et augmenter le risque de problèmes cardiaques, y compris l'insuffisance cardiaque et les AVC.

Diagnostic de la MRC au Rwanda

Au Rwanda, diagnostiquer la MRC implique des tests urinaires à tous les niveaux de soins de santé. Ces tests visent à vérifier les niveaux de protéines dans l'urine, ce qui peut indiquer des problèmes rénaux. Un test courant recherche des globules rouges dans l'urine. Si des globules rouges sont trouvés, cela suggère des dommages dans la partie du rein qui filtre le sang.

En plus des tests standards, une méthode plus précise appelée le rapport albumine/créatinine (ACR) est parfois utilisée. Ce test mesure les niveaux de protéines dans l'urine et est meilleur pour détecter les signes précoces de MRC que des tests plus simples. Cependant, l’ACR peut être affecté par le flux urinaire et ne donne pas toujours une image complète de la santé rénale.

Un autre test appelé le Taux de filtration glomérulaire estimé (eGFR) aide à évaluer comment bien les reins filtrent les déchets du sang. Ce test peut être influencé par d'autres conditions comme la déshydratation. Un eGFR élevé indique des reins en bonne santé, tandis qu'un eGFR bas (en dessous de 15) suggère que le patient pourrait avoir besoin de dialyse ou d'une greffe de rein.

Malgré ces méthodes, les tests ne détectent souvent pas la MRC à un stade précoce, quand les dommages sont encore mineurs. Dans les premiers stades, les reins peuvent encore fonctionner suffisamment bien, ce qui entraîne des changements légers dans les résultats des tests qui peuvent passer inaperçus. De plus, l'âge et le sexe peuvent rendre l'interprétation des résultats plus difficile, augmentant le risque de diagnostics manqués.

Rôle du Machine Learning dans le diagnostic de la MRC

Récemment, il y a eu une poussée pour utiliser le machine learning (ML) dans le domaine de la santé pour diagnostiquer la MRC et d'autres maladies qui peuvent ne pas montrer de symptômes précoces. Des chercheurs, des professionnels de la santé et des experts technologiques travaillent ensemble pour découvrir comment le ML peut être appliqué pour identifier le risque de MRC.

Un avantage significatif de l'utilisation du ML est la disponibilité des dossiers médicaux électroniques (DME). Ces dossiers fournissent des données précieuses qui peuvent aider à améliorer la prise de décision dans le secteur de la santé. Les informaticiens de la santé peuvent également utiliser ces données pour former des systèmes de ML pour aider à faire des diagnostics précoces.

Des études montrent que le machine learning peut prédire efficacement le risque de MRC, en particulier chez les patients atteints de diabète et d'hypertension, qui sont plus susceptibles de contracter la maladie. En utilisant des données pertinentes, comme l'âge, la pression artérielle, l'état diabétique et les tests de fonction rénale, les algorithmes de ML peuvent identifier les facteurs de risque et prédire la probabilité de MRC chez de nouveaux patients.

Différents modèles de ML ont été utilisés pour prévoir la progression de la MRC. Parmi les modèles notables, on trouve Random Forest, Support Vector Machines et Neural Networks. Des études montrent que Random Forest et Gradient Boosting ont montré de bonnes performances, en particulier avec des données non linéaires, comme les mesures de fonction rénale.

L'efficacité de ces modèles s'étend à la stratification des risques, ce qui aide à cibler le traitement vers des groupes de patients spécifiques. Par exemple, le modèle XGBoost, parmi d'autres, a montré une grande précision dans la classification des patients atteints de MRC en fonction de données cliniques et démographiques.

Aperçu de l'étude de recherche

Dans une étude récente, un ensemble de données complet a été collecté à partir de l'Hôpital Universitaire de Kigali, axé sur les patients souffrant de diabète. Cet ensemble de données comprend diverses informations cliniques et démographiques collectées sur dix ans, de 2013 à 2023.

L'ensemble de données contenait 6 900 instances et se composait de variables numériques et catégorielles. Certaines caractéristiques ont été ajoutées pour améliorer l'ensemble de données, y compris l'état d'anémie et le nombre de jours passés à l'hôpital. Seules les caractéristiques pertinentes ont été conservées pour garantir l'exactitude du modèle.

Pour préparer les données à l'analyse, elles ont été soigneusement vérifiées pour des problèmes de qualité. Les valeurs manquantes ont été traitées à l'aide d'une méthode d'imputation, permettant une meilleure interprétation des données. Les données ont ensuite été divisées en deux parties : 75 % pour former le modèle et 25 % pour le tester.

Quatre classificateurs de machine learning différents ont été utilisés dans cette étude : Random Forest, XGBoost, Decision Tree et Logistic Regression. Chacun de ces modèles a été évalué en fonction de la précision et des indicateurs de performance.

Évaluation de la performance des modèles

Pour mesurer les performances de chaque modèle, une matrice de confusion a été créée. Ce tableau décrit des indicateurs clés comme la précision, le rappel, la précision et le score F1. Ces indicateurs aident à déterminer avec quelle précision chaque modèle prédit la MRC.

Les Vrais Positifs (TP) montrent quand le modèle identifie correctement la MRC, tandis que les Vrais Négatifs (TN) reflètent l'exactitude du modèle à identifier l'absence de la maladie. Les Faux Positifs (FP) indiquent des prédictions incorrectes de MRC, tandis que les Faux Négatifs (FN) montrent quand la MRC est manquée.

L'étude a généré un rapport de classification résumant la performance de chaque modèle. Les résultats ont montré que XGBoost et la Régression Logistique avaient les meilleures performances, atteignant un score AUC de 0,98. Le modèle Decision Tree a obtenu le pire score, avec un AUC de 0,89.

Bien que la Régression Logistique et XGBoost aient eu les mêmes scores AUC et de précision, XGBoost a été sélectionné comme le meilleur modèle en raison de son score F1 plus fort, indiquant un meilleur équilibre global des performances.

Comparaison avec des études précédentes

Les résultats de cette étude soulignent l'efficacité du modèle XGBoost dans la prédiction de la MRC, atteignant une précision de 95,76 % et un AUC de 0,98. Comparé à des études antérieures, nos résultats sont compétitifs.

Bien que certaines études aient atteint une précision légèrement supérieure, le score AUC élevé de notre étude suggère qu'XGBoost performe bien pour distinguer entre les cas de MRC et ceux qui n'en ont pas. La constance des performances élevées d'XGBoost à travers diverses études renforce sa fiabilité en tant qu'outil de machine learning pour les prédictions médicales, en particulier pour la MRC.

Conclusion

Les résultats prometteurs de cette étude mettent en avant comment le machine learning peut jouer un rôle significatif dans le diagnostic des maladies rénales chroniques. À mesure que les systèmes de santé adoptent des analyses avancées, le modèle XGBoost développé peut améliorer la précision et l'efficacité des diagnostics précoces.

En améliorant les soins aux patients grâce à une détection précoce et des stratégies de traitement personnalisées, le machine learning offre une approche proactive pour gérer la MRC. Bien que cette étude ait des limites, comme ne pas avoir examiné des marqueurs chimiques spécifiques dans le sang ou des facteurs génétiques, elle suggère que l'élargissement de la gamme des caractéristiques cliniques prises en compte, couplé à des techniques d'ensemble, pourrait encore améliorer les modèles prédictifs.

L'intégration du machine learning dans les milieux cliniques pourrait ouvrir la voie à de meilleurs résultats pour les patients et une allocation optimisée des ressources dans les systèmes de santé, représentant un pas en avant dans la lutte contre les défis posés par la maladie rénale chronique.

Source originale

Titre: Using Machine learning to predict chronic kidney diseases among diabetic patients in Rwanda.

Résumé: BackgroundChronic Kidney Disease (CKD) is a significant complication in people with diabetes, leading to serious adverse health outcomes and increased healthcare costs globally individually and on healthcare systems. This problem become more complicated when it is in Low and middle in countries including Rwanda when access to early diagnostic services is limited. Early prediction and intervention can improve patient outcomes and reduce the burden on healthcare systems. ObjectiveThis study aimed to develop and evaluate a machine learning model for predicting CKD in diabetic patients, tailored to the Rwandan population, using Electronic Medical record Data. MethodologySecondary data were extracted from OpenClinic, an electronic medical record (EMR) system used at Kigali University Hospital, covering a period of 10 years from 2013 to 2023. The final cleaned dataset was used to train four machine-learning models: Logistic Regression (LR), Random Forest (RF), Decision Tree (DT), and Extra Gradient Boosting Machine (XGBoost). XGboost was noted as the best performer with the AUC score of 0.98 and accuracy of 95.67%. ResultsThe findings revealed that XGBoost was highly effective in predicting chronic kidney disease, achieving an accuracy of 95.76% and an AUC score of 0.98. Given that the dataset was collected from the local population, this study confirms that machine learning algorithms can assist clinicians in Rwanda in diagnosing chronic kidney disease in its early stages. ConclusionThis study demonstrates the potential of machine learning models in predicting chronic kidney disease (CKD) in diabetic patients, highlighting the importance of local datasets for optimizing model performance in specific populations. These findings suggest that machine learning can effectively assist existing medical techniques in the early diagnosis of CKD in Rwanda. Author summaryIn this study, we trained machine learning model to predict the risk of chronic kidney disease (CKD) in patients with diabetes, using a dataset collected in Rwanda. Early detection of CKD is crucial, as it allows healthcare providers to intervene sooner, improving patient outcomes, potentially reducing financial, and health burden on the patients. We processed the data, by handling different available data issues and statistically created new features such as anemia status and length of hospital stay to improve the models predictions. The final model, XGBoost provides insights that it can help health providers to identify high-risk patients and plan personalized care more effectively. This study highlights how data-driven solutions can support healthcare delivery in resource-limited settings, by enhancing early diagnosis especially at primary healthcare level. By integrating this predictive tool into routine clinical workflows of Electronic Medical Record, healthcare institutions can make better clinical decisions that improve patient care and outcomes. This project contributes to the growing field of health informatics in Africa and shows the potential of applying advanced analytics to solve local health challenges.

Auteurs: Rugamba Rugero Fiacre, S. Majyambere, B. Noella Confiance, G. Niyomugaba, A. Uwera, P. Nemeyimana, P. Dukuziyaturemye

Dernière mise à jour: 2024-10-23 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.10.23.24315998

Source PDF: https://www.medrxiv.org/content/10.1101/2024.10.23.24315998.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires

Vision par ordinateur et reconnaissance des formesAvancées dans la détection de panneaux de signalisation avec l'apprentissage par peu d'exemples

Améliorer la détection des panneaux de signalisation pour des véhicules autonomes plus sûrs avec des méthodes d'apprentissage par peu d'exemples.

Md. Atiqur Rahman, Nahian Ibn Asad, Md. Mushfiqul Haque Omi

― 8 min lire