Uso del Machine Learning per la rilevazione precoce della CKD
Questo studio esamina il ruolo del machine learning nella diagnosi della malattia renale cronica in Ruanda.
Rugamba Rugero Fiacre, S. Majyambere, B. Noella Confiance, G. Niyomugaba, A. Uwera, P. Nemeyimana, P. Dukuziyaturemye
― 7 leggere min
Indice
La Malattia Renale Cronica (MRC) è un problema di salute che non riceve abbastanza attenzione, specialmente in Africa. Questa condizione può portare a gravi problemi di salute e persino alla morte. Ad esempio, nel 2017, la MRC è stata responsabile di circa 1,23 milioni di morti in tutto il mondo, di cui 1.046 in Ruanda. Le ricerche stimano che circa il 10% degli adulti sopra i 18 anni in Ruanda potrebbe avere la MRC.
Inoltre, la Società Internazionale di Nefrologia ha riportato che nel 2020 circa 850 milioni di persone nel mondo erano affette da MRC, e questo numero continua a crescere. La MRC è conosciuta come una delle principali cause di malattie cardiache, che sono la causa principale di morte in tutto il mondo.
La MRC è un processo graduale in cui i reni perdono la loro capacità di funzionare correttamente. Questa condizione può colpire chiunque, ma è più comune negli anziani e in quelli con problemi di salute come diabete e ipertensione. Man mano che la condizione peggiora, la funzione renale diminuisce, rendendo più difficile per il corpo eliminare i rifiuti e mantenere l'equilibrio di fluidi e acidi.
Con il progredire della MRC, possono verificarsi gravi complicazioni sanitarie che richiedono un’attenzione medica immediata. Queste complicazioni possono colpire vari organi e avere un impatto significativo sulla salute complessiva. La MRC può anche causare o aggravare l'ipertensione, che può danneggiare ulteriormente i reni e aumentare il rischio di problemi cardiaci, tra cui insufficienza cardiaca e ictus.
Diagnosi della MRC in Ruanda
In Ruanda, la diagnosi della MRC prevede test delle urine a tutti i livelli di assistenza sanitaria. Questi test mirano a controllare i livelli di proteine nelle urine, che possono indicare problemi ai reni. Un test comune cerca globuli rossi nelle urine. Se vengono trovati, suggerisce danni nella parte del rene che filtra il sangue.
Oltre ai test standard, a volte viene utilizzato un metodo più preciso chiamato rapporto albumina-creatinina (ACR). Questo test misura i livelli di proteine nelle urine ed è migliore nel rilevare segni precoci di MRC rispetto ai test più semplici. Tuttavia, l'ACR può essere influenzato dal flusso urinario e potrebbe non fornire sempre un quadro completo della salute renale.
Un altro test chiamato Tasso di Filtrazione Glomerulare Stimato (eGFR) aiuta a valutare quanto bene i reni filtrano i rifiuti dal sangue. Questo test può essere influenzato da altre condizioni come la disidratazione. Un'elevata eGFR indica reni sani, mentre un'eGFR bassa (sotto 15) suggerisce che il paziente potrebbe aver bisogno di dialisi o di un trapianto di rene.
Nonostante questi metodi, spesso i test non rilevano la MRC in fase iniziale, quando il danno è ancora lieve. Nelle fasi iniziali, i reni possono ancora funzionare abbastanza bene, portando a lievi cambiamenti nei risultati dei test che potrebbero passare inosservati. Inoltre, età e sesso possono rendere più difficile interpretare i risultati, aumentando la possibilità di diagnosi mancate.
Ruolo del Machine Learning nella Diagnosi della MRC
Recentemente, c'è stata una spinta per utilizzare il machine learning (ML) nella sanità per diagnosticare la MRC e altre malattie che potrebbero non manifestarsi subito. Ricercatori, professionisti della salute e esperti di tecnologia stanno collaborando per scoprire come il ML può essere applicato per identificare i rischi di MRC.
Un vantaggio significativo dell'uso del ML è la disponibilità di cartelle cliniche elettroniche (EMR). Questi registri forniscono dati preziosi che possono aiutare a migliorare il processo decisionale in sanità. Gli informatici della salute possono anche utilizzare questi dati per addestrare sistemi ML ad aiutare a fare diagnosi precoci.
Gli studi mostrano che il machine learning può prevedere efficacemente i rischi di MRC, in particolare nei pazienti con diabete e ipertensione, che sono più suscettibili alla malattia. Utilizzando dati pertinenti, come età, pressione sanguigna, stato di diabete e test della funzione renale, gli algoritmi ML possono identificare i fattori di rischio e prevedere la probabilità di MRC nei nuovi pazienti.
Vari modelli di ML sono stati utilizzati per prevedere la progressione della MRC. Alcuni dei modelli più notevoli includono Random Forest, Support Vector Machines e Neural Networks. Gli studi mostrano che Random Forest e Gradient Boosting hanno mostrato buone prestazioni, in particolare con dati non lineari, come le misurazioni della funzione renale.
L'efficacia di questi modelli si estende alla stratificazione del rischio, che aiuta a mirare il trattamento a specifici gruppi di pazienti. Ad esempio, il modello XGBoost, tra gli altri, ha mostrato alta accuratezza nella classificazione dei pazienti con MRC in base a dati clinici e demografici.
Panoramica dello Studio di Ricerca
In un recente studio, è stato raccolto un ampio set di dati dall'Ospedale Universitario di Kigali, focalizzandosi su pazienti con diabete. Questo set di dati include varie informazioni cliniche e demografiche raccolte nel corso di dieci anni, dal 2013 al 2023.
Il set di dati conteneva 6.900 casi e consistava in variabili sia numeriche che categoriali. Alcune caratteristiche sono state aggiunte per migliorare il set di dati, inclusi lo stato di anemia e il numero di giorni trascorsi in ospedale. Solo le caratteristiche rilevanti sono state mantenute per garantire l'accuratezza del modello.
Per preparare i dati per l'analisi, sono stati controllati attentamente per problemi di qualità. I valori mancanti sono stati affrontati utilizzando un metodo di imputazione, permettendo una migliore interpretazione dei dati. I dati sono stati quindi suddivisi in due parti: il 75% per addestrare il modello e il 25% per testarlo.
Sono stati utilizzati quattro diversi classificatori di machine learning in questo studio: Random Forest, XGBoost, Decision Tree e Logistic Regression. Ognuno di questi modelli è stato valutato in base all'accuratezza e ai parametri di prestazione.
Valutazione delle Prestazioni dei Modelli
Per misurare quanto bene ogni modello ha funzionato, è stata creata una matrice di confusione. Questa tabella delinea i principali parametri come accuratezza, richiamo, precisione e F1-score. Questi parametri aiutano a determinare quanto precisamente ogni modello prevede la MRC.
I veri positivi (TP) mostrano quando il modello identifica correttamente la MRC, mentre i veri negativi (TN) riflettono l'accuratezza del modello nell'identificare l'assenza della malattia. I falsi positivi (FP) indicano previsioni errate di MRC, mentre i falsi negativi (FN) mostrano quando la MRC è stata trascurata.
Lo studio ha generato un rapporto di classificazione che riassume le prestazioni di ogni modello. I risultati hanno mostrato che XGBoost e Logistic Regression hanno ottenuto le migliori prestazioni, raggiungendo un punteggio AUC di 0.98. Il modello Decision Tree ha performato peggio, con un punteggio AUC di 0.89.
Anche se Logistic Regression e XGBoost hanno avuto gli stessi punteggi AUC e di accuratezza, XGBoost è stato selezionato come modello principale grazie al suo punteggio F1 più forte, indicando un miglior equilibrio complessivo nelle prestazioni.
Confronto con Studi Precedenti
I risultati di questo studio evidenziano l'efficacia del modello XGBoost nella previsione della MRC, ottenendo un'accuratezza del 95,76% e un AUC di 0.98. Rispetto agli studi precedenti, i nostri risultati sono competitivi.
Sebbene alcuni studi abbiano raggiunto un'accuratezza leggermente più alta, l'alto AUC nel nostro studio suggerisce che XGBoost funziona bene nel distinguere tra casi di MRC e quelli senza. La coerenza delle alte prestazioni di XGBoost in vari studi rafforza la sua affidabilità come strumento di machine learning per previsioni mediche, in particolare per la MRC.
Conclusione
I risultati promettenti di questo studio evidenziano come il machine learning possa giocare un ruolo significativo nella diagnosi delle malattie renali croniche. Man mano che i sistemi sanitari adottano analisi avanzate, il modello XGBoost sviluppato può migliorare l'accuratezza e l'efficienza delle diagnosi precoci.
Migliorando la cura dei pazienti attraverso la rilevazione precoce e strategie di trattamento personalizzate, il machine learning offre un approccio proattivo alla gestione della MRC. Sebbene questo studio avesse limitazioni, come il non esaminare specifici marcatori chimici nel sangue o fattori genetici, suggerisce che espandere la gamma di caratteristiche cliniche considerate, insieme all'uso di tecniche di ensemble, potrebbe ulteriormente migliorare i modelli predittivi.
L'integrazione del machine learning nelle impostazioni cliniche potrebbe aprire la strada a migliori risultati per i pazienti e un'ottimizzazione dell'allocazione delle risorse nei sistemi sanitari, segnando un passo avanti nella gestione delle sfide poste dalla malattia renale cronica.
Titolo: Using Machine learning to predict chronic kidney diseases among diabetic patients in Rwanda.
Estratto: BackgroundChronic Kidney Disease (CKD) is a significant complication in people with diabetes, leading to serious adverse health outcomes and increased healthcare costs globally individually and on healthcare systems. This problem become more complicated when it is in Low and middle in countries including Rwanda when access to early diagnostic services is limited. Early prediction and intervention can improve patient outcomes and reduce the burden on healthcare systems. ObjectiveThis study aimed to develop and evaluate a machine learning model for predicting CKD in diabetic patients, tailored to the Rwandan population, using Electronic Medical record Data. MethodologySecondary data were extracted from OpenClinic, an electronic medical record (EMR) system used at Kigali University Hospital, covering a period of 10 years from 2013 to 2023. The final cleaned dataset was used to train four machine-learning models: Logistic Regression (LR), Random Forest (RF), Decision Tree (DT), and Extra Gradient Boosting Machine (XGBoost). XGboost was noted as the best performer with the AUC score of 0.98 and accuracy of 95.67%. ResultsThe findings revealed that XGBoost was highly effective in predicting chronic kidney disease, achieving an accuracy of 95.76% and an AUC score of 0.98. Given that the dataset was collected from the local population, this study confirms that machine learning algorithms can assist clinicians in Rwanda in diagnosing chronic kidney disease in its early stages. ConclusionThis study demonstrates the potential of machine learning models in predicting chronic kidney disease (CKD) in diabetic patients, highlighting the importance of local datasets for optimizing model performance in specific populations. These findings suggest that machine learning can effectively assist existing medical techniques in the early diagnosis of CKD in Rwanda. Author summaryIn this study, we trained machine learning model to predict the risk of chronic kidney disease (CKD) in patients with diabetes, using a dataset collected in Rwanda. Early detection of CKD is crucial, as it allows healthcare providers to intervene sooner, improving patient outcomes, potentially reducing financial, and health burden on the patients. We processed the data, by handling different available data issues and statistically created new features such as anemia status and length of hospital stay to improve the models predictions. The final model, XGBoost provides insights that it can help health providers to identify high-risk patients and plan personalized care more effectively. This study highlights how data-driven solutions can support healthcare delivery in resource-limited settings, by enhancing early diagnosis especially at primary healthcare level. By integrating this predictive tool into routine clinical workflows of Electronic Medical Record, healthcare institutions can make better clinical decisions that improve patient care and outcomes. This project contributes to the growing field of health informatics in Africa and shows the potential of applying advanced analytics to solve local health challenges.
Autori: Rugamba Rugero Fiacre, S. Majyambere, B. Noella Confiance, G. Niyomugaba, A. Uwera, P. Nemeyimana, P. Dukuziyaturemye
Ultimo aggiornamento: 2024-10-23 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.10.23.24315998
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.10.23.24315998.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.