Simple Science

Scienza all'avanguardia spiegata semplicemente

# Biologia quantitativa# Elaborazione di immagini e video# Metodi quantitativi

Impatto delle Differenze di Colorazione sul Deep Learning nel Cancro ai Polmoni

Uno studio mostra che le variazioni di colorazione ostacolano le reti neurali profonde nella previsione del cancro.

Siyu, Lin, Haowen Zhou, Richard J. Cote, Mark Watson, Ramaswamy Govindan, Changhuei Yang

― 5 leggere min


Problemi di macchie neiProblemi di macchie neimodelli di deep learningcancro ai polmoni.alla prova le DNN nei valutazioni sulLe differenze di colorazione mettono
Indice

Negli ultimi anni, i modelli di deep learning, in particolare le reti neurali profonde (DNN), sono stati usati nei test e nella diagnosi medica. Questi modelli possono imparare da molte immagini per riconoscere schemi che potrebbero sfuggire agli esperti umani. Tuttavia, una sfida è rappresentata dalle differenze nelle colorazioni dei campioni di tessuto, che possono influenzare le prestazioni del modello. Questo studio si concentra su come queste differenze di colorazione impattino sulla capacità di un DNN di prevedere gli esiti dei pazienti nei casi di cancro ai polmoni.

Il Problema delle Differenze di Colorazione

Quando i patologi esaminano campioni di tessuto, usano un processo chiamato colorazione per evidenziare diversi tipi di cellule e strutture. Tuttavia, la colorazione può variare da un campione all'altro, anche se provengono dallo stesso paziente. Questa variazione può derivare da diversi lotti di colorazione, tecniche o anche differenze nei tempi di lavorazione. Tali differenze possono confondere i DNN che imparano dalle immagini, rendendoli meno affidabili nella previsione delle condizioni dei pazienti.

In questo studio, i ricercatori hanno utilizzato un dataset di campioni di cancro ai polmoni non a piccole cellule (NSCLC). Hanno addestrato un DNN con campioni che erano stati colorati e lavorati contemporaneamente, raggiungendo un'alta precisione nel prevedere quali tumori si sarebbero diffusi. Tuttavia, quando testato con campioni colorati in un momento diverso, le prestazioni del DNN sono diminuite significativamente.

Metodi Utilizzati nello Studio

Per indagare su questo problema, i ricercatori hanno utilizzato campioni di pazienti diagnosticati con NSCLC. Hanno ottenuto nuove vetrine di tessuto dallo stesso tipo di tumori ma preparate in momenti diversi. Il DNN è stato addestrato per prevedere se il cancro si sarebbe diffuso in base alle immagini del primo set di vetrine. Quando testato con immagini del secondo set, il DNN ha faticato. Questo risultato ha evidenziato l'impatto delle differenze di colorazione sulla generalizzabilità del modello.

Lo studio ha coinvolto due metodi diversi di Normalizzazione del colore per minimizzare la variazione di colorazione:

  1. Normalizzazione Tradizionale del Colore: Questo metodo ha regolato i colori sulla base di un set di immagini di riferimento. Mira a rendere le immagini più simili, ma non è riuscito a colmare completamente il divario tra i diversi lotti di campioni.
  2. Normalizzazione del Colore CycleGAN: Questa tecnica più recente ha utilizzato un modello di machine learning per trasformare le immagini in uno spazio colore comune, rendendole più simili. Sfortunatamente, anche questo metodo avanzato non è riuscito a eliminare completamente le differenze.

Risultati dell'Analisi

I risultati dello studio sono stati significativi. Quando il DNN è stato addestrato e testato sullo stesso lotto di immagini, ha funzionato bene. Tuttavia, quando è stato testato su immagini di un lotto diverso, la sua precisione è diminuita drasticamente. Entrambi i metodi di normalizzazione hanno cercato di ridurre le differenze di colorazione, ma nessuno è riuscito a rendere il DNN affidabile tra i lotti.

La normalizzazione tradizionale ha mostrato alcune migliorie nei test sullo stesso lotto, ma non ha aiutato nei test su lotti diversi. Anche la normalizzazione CycleGAN non è riuscita a migliorare le prestazioni del DNN nei test tra i lotti. In sostanza, l'incapacità di questi metodi di affrontare la variabilità della colorazione mette in evidenza una barriera significativa per i DNN in patologia.

Imparare dai Risultati

Questa ricerca mette in luce alcune cose importanti. Prima di tutto, mentre i DNN possono essere strumenti potenti nella diagnosi medica, le loro prestazioni dipendono fortemente dalla qualità e dalla coerenza dei dati di addestramento. Se i dati variano troppo, anche i modelli più sofisticati possono fallire.

Inoltre, lo studio sottolinea la necessità di metodi migliori per standardizzare il processo di colorazione. Quando i campioni di tessuto sono colorati in modo diverso, diventa difficile utilizzare modelli addestrati su un insieme di immagini per le previsioni su un altro, anche se provengono dallo stesso paziente.

Guardando al Futuro

Per migliorare l'affidabilità dei DNN nell'imaging medico, i ricercatori potrebbero dover concentrarsi su due aree principali:

  1. Tecniche Avanzate di Normalizzazione del Colore: C'è bisogno di nuovi metodi che possano gestire efficacemente le differenze di colorazione. I metodi esistenti non sono sufficienti, come mostrato in questo studio.
  2. Approcci Innovativi all'Imaging: Gli scienziati potrebbero voler esplorare alternative alla colorazione tradizionale, come l'uso di tecniche di imaging che non dipendono dal colore. Ad esempio, i metodi di imaging senza etichetta potrebbero fornire dati coerenti senza le complicazioni introdotte dalla colorazione.

Conclusione

Lo studio evidenzia le sfide che la variabilità della colorazione presenta allo sviluppo e all'applicazione dei DNN in patologia. Anche se questi modelli hanno grandi potenzialità per migliorare la cura e gli esiti dei pazienti, la loro efficacia dipende dalla capacità di preparare e lavorare costantemente i campioni di tessuto. Andando avanti, una combinazione di una migliore gestione dei dati e tecniche di imaging innovative potrebbe aprire la strada a applicazioni più robuste del deep learning nella diagnosi del cancro e di altre malattie.

Con ulteriori ricerche e aggiustamenti su come vengono preparati i campioni, è possibile migliorare le prestazioni dei DNN, rendendoli più affidabili nella previsione degli esiti dei pazienti. Questo porterà, in ultima analisi, a una migliore assistenza ai pazienti e a diagnosi più accurate nel campo della patologia.

Fonte originale

Titolo: Impact of Stain Variation and Color Normalization for Prognostic Predictions in Pathology

Estratto: In recent years, deep neural networks (DNNs) have demonstrated remarkable performance in pathology applications, potentially even outperforming expert pathologists due to their ability to learn subtle features from large datasets. One complication in preparing digital pathology datasets for DNN tasks is variation in tinctorial qualities. A common way to address this is to perform stain normalization on the images. In this study, we show that a well-trained DNN model trained on one batch of histological slides failed to generalize to another batch prepared at a different time from the same tissue blocks, even when stain normalization methods were applied. This study used sample data from a previously reported DNN that was able to identify patients with early stage non-small cell lung cancer (NSCLC) whose tumors did and did not metastasize, with high accuracy, based on training and then testing of digital images from H&E stained primary tumor tissue sections processed at the same time. In this study we obtained a new series of histologic slides from the adjacent recuts of same tissue blocks processed in the same lab but at a different time. We found that the DNN trained on the either batch of slides/images was unable to generalize and failed to predict progression in the other batch of slides/images (AUC_cross-batch = 0.52 - 0.53 compared to AUC_same-batch = 0.74 - 0.81). The failure to generalize did not improve even when the tinctorial difference correction were made through either traditional color-tuning or stain normalization with the help of a Cycle Generative Adversarial Network (CycleGAN) process. This highlights the need to develop an entirely new way to process and collect consistent microscopy images from histologic slides that can be used to both train and allow for the general application of predictive DNN algorithms.

Autori: Siyu, Lin, Haowen Zhou, Richard J. Cote, Mark Watson, Ramaswamy Govindan, Changhuei Yang

Ultimo aggiornamento: 2024-09-12 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2409.08338

Fonte PDF: https://arxiv.org/pdf/2409.08338

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili