Simple Science

Scienza all'avanguardia spiegata semplicemente

# Scienze della salute# Chirurgia

L'apprendimento automatico aiuta a prevedere la ricomparsa del cancro rettale

Uno studio ha trovato metodi di machine learning efficaci per prevedere la recidiva del cancro rettale.

― 7 leggere min


L'AI prevede un ritornoL'AI prevede un ritornodel cancro rettale.rettale.prevedere la ricorrenza del cancroUno studio mostra come l'IA possa
Indice

Il cancro colorettale è una malattia comune e seria che colpisce il colon e il retto. Si classifica come il terzo tipo di cancro più comune e ha il secondo tasso di mortalità più alto a livello globale. In questo gruppo, il cancro rettale rappresenta circa un terzo di tutti i casi e tende a tornare più spesso rispetto al cancro al colon. Questo succede principalmente perché la parte bassa del retto non ha uno strato protettivo chiamato serosa, rendendo più facile per i tumori invadere i tessuti circostanti. Inoltre, è più complicato per i medici assicurarsi di aver rimosso abbastanza tessuto attorno al tumore durante l'intervento chirurgico. Dopo l'operazione, la probabilità che il cancro ritorni entro cinque anni può variare tra il 6% e il 27,5%. Questo rischio è influenzato da fattori legati al tumore stesso e al trattamento fornito. La diagnosi precoce e il trattamento tempestivo di qualsiasi ricaduta del cancro possono aiutare a prevenire complicazioni serie per i pazienti. Pertanto, è fondamentale che i medici identifichino i fattori che aumentano il rischio di recidiva del cancro rettale e rimangano vigili durante le visite di follow-up dopo l'intervento.

Intelligenza Artificiale in Medicina

Recentemente, l'intelligenza artificiale (IA) ha attirato l'attenzione in molti settori, inclusa la medicina. I sistemi di IA, in particolare quelli basati sul machine learning, sono stati sviluppati per aiutare a prevedere malattie, i loro esiti e i percorsi di trattamento. In studi recenti, l'IA ha mostrato promesse nel prevedere la recidiva di vari tipi di cancro, inclusi il cancro colorettale, quello mammario e quello gastrico. Tuttavia, ci sono solo pochi studi che si concentrano specificamente sulla previsione della ricaduta del cancro rettale utilizzando metodi di machine learning. Questo studio mira a confrontare quattro diversi metodi di machine learning per vedere quanto bene possono identificare fattori importanti che potrebbero indicare una maggiore probabilità di recidiva del cancro rettale dopo l'operazione.

Selezione dei Pazienti e Dati

Per questo studio, sono state raccolte informazioni da un database che contiene dati di pazienti che hanno subito un intervento per cancro colorettale al Gil Medical Center. I dati sono stati raccolti da gennaio 2004 a dicembre 2018. Per garantire la privacy dei pazienti, tutte le informazioni personali sono state anonimizzate. Inizialmente, c'erano 3.320 pazienti, ma dopo aver escluso quelli con determinate condizioni come cancro in stadio IV o cancro al colon, 961 pazienti sono stati inclusi nello studio. Tra questi, 834 pazienti non hanno avuto recidive, mentre 127 pazienti sì. I dati sono stati suddivisi in due gruppi: uno per addestrare i modelli di machine learning e un altro per testarne le prestazioni.

Considerazioni Etiche

Lo studio ha ricevuto l'approvazione dal Comitato Etico del Gil Medical Center. Essendo uno studio retrospettivo, il comitato ha rinunciato alla necessità di un consenso individuale da parte dei pazienti.

Affrontare il Disequilibrio dei Dati

In questo studio, c'era una differenza significativa nel numero di pazienti nei gruppi di recidiva e non recidiva. Per gestire questo disequilibrio, i ricercatori hanno utilizzato una tecnica chiamata SMOTETomek. Questo metodo combina due tecniche: una per aumentare il numero di campioni nel gruppo più piccolo e un'altra per ridurre il numero in quello più grande. Dopo aver applicato questo metodo, c'erano numeri uguali di pazienti in entrambi i gruppi, il che ha aiutato a creare un dataset bilanciato per l'analisi.

Fattori Chiave Analizzati

Il database conteneva 43 caratteristiche cliniche, ma i ricercatori si sono concentrati su 16 caratteristiche ritenute correlate alla recidiva del cancro rettale. Queste caratteristiche includevano dettagli di base sui pazienti come età e indice di massa corporea, fattori legati al trattamento e fattori legati al tumore come la posizione e lo stadio del tumore, e se c'erano stati osservati alcuni tipi di invasione nel tumore. Tutte le variabili continue sono state categorizzate in base alla loro rilevanza clinica per facilitare l'analisi.

Algoritmi di Machine Learning Utilizzati

Lo studio ha testato quattro algoritmi di machine learning: Regressione Logistica (LR), Macchina a Vettori di Supporto (SVM), Random Forest (RF) e XGBoost. Ogni algoritmo utilizza metodi diversi per analizzare i dati e fare previsioni sui fattori che possono portare a recidive di cancro. Ad esempio, LR utilizza una funzione logistica per classificare i valori, mentre SVM trasforma i dati in una dimensione più alta per trovare il miglior confine per la classificazione. RF combina più alberi decisionali per migliorare l'accuratezza, e XGBoost migliora la velocità e le prestazioni delle previsioni rispetto ai metodi tradizionali.

Selezione dei Fattori Importanti

Per determinare quali fattori erano più importanti per prevedere la recidiva, i ricercatori hanno utilizzato un metodo chiamato importanza di permutazione. Questa tecnica misura quanto aumenta l'errore di previsione quando i valori di una caratteristica vengono mescolati casualmente. Esaminando come ogni caratteristica influisce sulle previsioni del modello, i ricercatori hanno identificato otto fattori chiave che erano più significativi per prevedere la recidiva del cancro rettale.

Ottimizzazione dei Parametri del Modello

I ricercatori hanno utilizzato una tecnica chiamata grid search per trovare le migliori combinazioni di impostazioni per ciascun modello di machine learning. Questo metodo testa tutte le possibili combinazioni di parametri e seleziona quelle che forniscono le migliori prestazioni in base ai dati utilizzati per l'addestramento.

Confronto delle Prestazioni del Modello

Dopo aver selezionato i fattori chiave, i quattro algoritmi di machine learning sono stati addestrati e le loro prestazioni sono state confrontate. I ricercatori hanno considerato diversi indicatori, come sensibilità, specificità, accuratezza e l'area sotto la curva (AUC), che aiuta a valutare quanto bene i modelli distinguono tra pazienti che avranno recidive e quelli che non le avranno.

Demografia dei Pazienti

Un totale di 961 pazienti sono stati analizzati nello studio, con un periodo di follow-up che mediamente era di circa 60,8 mesi. Durante questo periodo, il 13,2% dei pazienti ha sperimentato una recidiva. Fattori come età, livelli iniziali di antigene carcinoembrionario, stadio del tumore e certi tipi di invasione sono risultati statisticamente significativi nella previsione delle recidive.

Risultati delle Prestazioni del Modello

Tra i modelli testati, SVM ha avuto il punteggio AUC più alto, il che indica che ha eseguito meglio nella previsione delle recidive. Altri modelli come XGBoost hanno mostrato anch’essi buone prestazioni, specialmente in termini di specificità, che si riferisce alla capacità del modello di identificare correttamente i pazienti che non hanno recidive. In generale, mentre SVM ha avuto il punteggio AUC più alto, Random Forest ha fornito un buon equilibrio tra sensibilità e specificità.

Importanza dei Fattori

L'analisi ha identificato alcuni fattori come particolarmente importanti attraverso diversi modelli. Lo stadio del tumore (pT) è stato riconosciuto costantemente come un predittore chiave. Stadi più alti indicano un cancro più avanzato, il che si associa a un maggiore rischio di recidive. Inoltre, il sesso è stato evidenziato come un fattore importante, con studi precedenti che suggeriscono che i maschi possano avere un rischio più alto di recidive rispetto alle femmine.

Limitazioni dello Studio

Questo studio aveva alcune limitazioni. È stato condotto in un solo centro, il che può portare a bias di selezione. Inoltre, l'analisi ha incluso un numero limitato di fattori, escludendo altri dettagli potenzialmente importanti, come la storia di fumo o specifiche caratteristiche del tumore. I ricercatori hanno affrontato il disequilibrio dei dati, ma hanno notato che la dimensione del campione per il test potrebbe non essere stata sufficiente per convalidare completamente i loro risultati. Infine, lo studio non ha distinto tra i diversi stadi dei tumori, il che potrebbe influenzare i risultati.

Conclusione

In sintesi, questo studio ha confrontato l'importanza di vari fattori nella previsione della recidiva del cancro rettale utilizzando diversi metodi di machine learning. Il modello SVM ha mostrato le migliori prestazioni in generale. Fattori chiave identificati, come lo stadio del tumore e il sesso del Paziente, potrebbero aiutare i medici a monitorare i pazienti più da vicino dopo l'operazione. In definitiva, aumentare l'accuratezza di queste previsioni potrebbe portare a migliori risultati per i pazienti che affrontano il cancro rettale.

Fonte originale

Titolo: Machine learning based prediction of recurrence after curative resection for rectal cancer

Estratto: PurposePatients with rectal cancer without distant metastases are typically treated with radical surgery. Post curative resection, several factors can affect tumor recurrence. This study aimed to analyze factors related to rectal cancer recurrence after curative resection using different machine learning techniques. MethodsConsecutive patients who underwent curative surgery for rectal cancer between 2004 and 2018 at Gil Medical Center were included. Patients with stage IV disease, colon cancer, anal cancer, other recurrent cancer, emergency surgery, or hereditary malignancies were excluded from the study. The SMOTETomek technique was used to compensate for data imbalance between recurrent and no-recurrent groups. Four machine learning methods, logistic regression (LR), support vector machine (SVM), random forest (RF), and XGBoost (XGB), were used to identify significant factors. To overfit and improve the model performance, feature importance was calculated using the permutation importance technique. ResultsA total of 3320 patients were included in the study. However, after exclusion, the total sample size of the study was 961 patients. The median follow-up period was 60.8 months (range:1.2-192.4). The recurrence rate during follow-up was 13.2% (n=127). After applying the SMOTETomek method, the number of patients in both groups, recurrent and non-recurrent group were equalized to 667 patients. After analyzing for 16 variables, the top eight ranked variables (pT, sex, concurrent chemoradiotherapy, pN, age, postoperative chemotherapy, pTNM, and perineural invasion) were selected based on the order of permutational importance. The highest area under the curve (AUC) was for the SVM method (0.831). The sensitivity, specificity, and accuracy were found to be 0.692, 0.814, and 0.798, respectively. The lowest AUC was obtained for the XGBloost method (0.804), with a sensitivity, specificity, and accuracy of 0.308, 0.928, and 0.845, respectively. The variable with highest importance was pT as assessed through SVM, RF, and XGBoost (0.06, 0.12, and 0.13, respectively), whereas pTNM had the highest importance when assessed by LR (0.05). ConclusionsIn the current study, SVM showed the best AUC, and the most influential factor across all machine learning methods except LR was found to be pT. Clinicians should be more alert if patients have a high pT stage during postoperative follow-up in rectal cancer patients.

Autori: Jeong-Heum Baek, Y. Jeon, Y.-J. Kim, J. Jeon, K.-H. Nam, T.-S. Hwang, K.-G. Kim

Ultimo aggiornamento: 2023-08-06 00:00:00

Lingua: English

URL di origine: https://www.medrxiv.org/content/10.1101/2023.08.03.23293601

Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.08.03.23293601.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili