Progressi nella segmentazione degli organi con il deep learning
Un nuovo modello migliora la segmentazione degli organi nelle immagini CT usando il deep learning.
― 5 leggere min
Indice
Segmentare gli organi a rischio nelle immagini mediche è un compito importante ma complicato. Questo è particolarmente vero per le scansioni CT, che sono comunemente usate nella pianificazione della radioterapia. Identificare correttamente questi organi può aiutare a evitare esposizioni non necessarie alla radiazione. I metodi tradizionali per segmentare questi organi possono essere lenti e possono variare da un medico all'altro, il che può portare a differenze nel trattamento.
Negli ultimi anni, la tecnologia del deep learning ha fatto progressi nell'automatizzare questo processo. Tuttavia, ci sono ancora sfide a causa delle variazioni nelle forme degli organi, della scarsa visibilità dei tessuti molli e delle inconsistenze nei dati usati per addestrare gli algoritmi. Mentre i modelli di deep learning tendono a funzionare bene con organi più grandi e chiari, quelli più piccoli con forme variabili sono più difficili da segmentare con precisione.
La Sfida
Un problema è che diversi medici possono avere opinioni diverse su dove finisce un organo e dove iniziano altri tessuti, introducendo Incertezza nei dati di addestramento. Le funzioni di perdita comuni usate per addestrare i modelli si concentrano principalmente sulla forma degli organi e su quanto si sovrappongono le forme previste e quelle reali. Spesso trascurano il contrasto dei tessuti, che è cruciale per delineare accuratamente i confini, soprattutto in situazioni a bassa visibilità.
Per affrontare queste sfide, è stato sviluppato un nuovo modello U-Net multi-decoder. Questo modello usa le differenze nei risultati di Segmentazione di due decoder per valutare l'incertezza. Questa incertezza viene poi utilizzata per creare un meccanismo di attenzione che aiuta a perfezionare il processo di segmentazione. Inoltre, è stato introdotto un metodo che combina le informazioni di intensità CT con altri calcoli di perdita per aiutare il modello a comprendere meglio il contrasto dei tessuti.
Panoramica del Metodo
Il modello proposto consiste in un'architettura U-net dotata di due decoder. Il decoder principale elabora l'immagine, mentre il decoder ausiliario aiuta a valutare l'incertezza attraverso il rumore casuale. La combinazione degli output di entrambi i decoder genera due tipi di maschere: una che mostra dove concordano e un'altra che mostra dove non concordano. Queste informazioni vengono utilizzate per creare una mappa di multi-confidenza che evidenzia le aree più affidabili per la segmentazione.
Il meccanismo di attenzione viene poi applicato alle caratteristiche identificate come importanti per una segmentazione accurata. Utilizzando questa attenzione mirata, il modello può migliorare le performance nell'identificare gli organi nelle immagini CT. Inoltre, il metodo tiene conto delle diverse intensità di luce nei tessuti per assistere nella segmentazione.
Impostazione Sperimentale
Per testare il nuovo modello, sono stati utilizzati due dataset disponibili al pubblico. Il primo dataset, SegThor, consiste in immagini raccolte da pazienti affetti da linfoma di Hodgkin. Il secondo dataset, LCTSC, include varie immagini CT con annotazioni degli organi. Il modello è stato addestrato e testato su questi dataset utilizzando vari metriche per valutare le sue performance.
L'addestramento ha comportato la suddivisione del dataset SegThor in set di addestramento e test separati, poiché erano disponibili solo un numero limitato di immagini di addestramento. Per il dataset LCTSC, è stata impiegata una validazione incrociata a cinque pieghe per combattere l'overfitting. Entrambi i dataset hanno subito gli stessi passaggi di preprocessing, inclusa l'estrazione di fette 2D da volumi 3D e il miglioramento del contrasto per migliorare la visibilità.
Risultati
Dataset SegThor
Le performance del modello sono state confrontate con altre varianti del U-net. I risultati hanno mostrato che il metodo che incorpora l'attenzione guidata dall'incertezza ha performato eccezionalmente bene su varie metriche. Ad esempio, il metodo ha fornito la massima accuratezza per il cuore, mentre altri modelli hanno performato meglio per organi diversi come l'esofago e l'aorta.
Dataset LCTSC
Risultati simili sono stati notati nel dataset LCTSC, dove il modello proposto ha mostrato buone performance in vari organi. Ha eccelso particolarmente in aree come l'esofago, la colonna vertebrale e il cuore. Altri modelli popolari, come Unet++ e Attention U-net, hanno anche performato bene, ma generalmente, il nuovo modello si è distinto.
Studio di Ablazione
È stato condotto uno studio di ablation per valutare l'efficacia dei diversi componenti del modello. Sono state testate varie combinazioni di funzioni di perdita e del meccanismo di attenzione. I risultati hanno indicato che l'inclusione del modulo di attenzione guidata dall'incertezza ha costantemente portato a una maggiore accuratezza nella segmentazione tra i diversi organi e combinazioni di perdita.
Discussione
I risultati suggeriscono che utilizzare diversi output di rete può aiutare a stimare l'incertezza in modo efficace. Questa incertezza può essere utilizzata come una forma di attenzione che aiuta a perfezionare i risultati di segmentazione. Il design del modello è relativamente semplice, poiché si concentra sull'architettura U-net 2D addestrata esclusivamente su viste assiali.
Introdurre una nuova perdita di regolarizzazione basata sull'intensità CT aiuta ulteriormente il modello a apprendere in modo più accurato le texture e le forme degli organi. I risultati confermano che comprendere il contrasto dei tessuti è fondamentale per segmentare gli organi, specialmente quelli difficili da identificare.
Direzioni Future
La ricerca apre a possibilità di miglioramenti futuri. C'è potenziale per migliorare l'accuratezza del regolarizzatore, specialmente attorno ai confini degli organi che sono vicini tra loro. L'esplorazione continua in quest'area potrebbe portare a migliori risultati nella pianificazione della radioterapia.
Considerazioni Etiche
Questo studio ha utilizzato dataset esistenti disponibili per l'accesso pubblico. Poiché ha coinvolto un'analisi retrospettiva dei dati, non c'era bisogno di approvazione etica. Tutta la ricerca aderisce agli standard etici.
Conclusione
L'approccio discusso offre una soluzione promettente per l'automazione della segmentazione degli organi nelle immagini CT. Utilizzando un U-net multi-decoder insieme a un'attenzione guidata dall'incertezza, il modello affronta efficacemente le sfide spesso presenti in quest'area. L'incorporazione delle informazioni sull'intensità CT rafforza ulteriormente la capacità del modello di distinguere accuratamente tra vari tipi di tessuti.
In generale, i risultati evidenziano il potenziale del modello per migliorare l'accuratezza della segmentazione degli organi, contribuendo infine a una migliore pianificazione del trattamento nella radioterapia. Con il continuo progresso della ricerca in questo campo, i miglioramenti nelle tecniche di deep learning potrebbero ulteriormente migliorare i metodi di segmentazione automatizzata nelle immagini mediche.
Titolo: Uncertainty Driven Bottleneck Attention U-net for Organ at Risk Segmentation
Estratto: Organ at risk (OAR) segmentation in computed tomography (CT) imagery is a difficult task for automated segmentation methods and can be crucial for downstream radiation treatment planning. U-net has become a de-facto standard for medical image segmentation and is frequently used as a common baseline in medical image segmentation tasks. In this paper, we propose a multiple decoder U-net architecture and use the segmentation disagreement between the decoders as attention to the bottleneck of the network for segmentation refinement. While feature correlation is considered as attention in most cases, in our case it is the uncertainty from the network used as attention. For accurate segmentation, we also proposed a CT intensity integrated regularization loss. Proposed regularisation helps model understand the intensity distribution of low contrast tissues. We tested our model on two publicly available OAR challenge datasets. We also conducted the ablation on each datasets with the proposed attention module and regularization loss. Experimental results demonstrate a clear accuracy improvement on both datasets.
Autori: Abdullah Nazib, Riad Hassan, Zahidul Islam, Clinton Fookes
Ultimo aggiornamento: 2024-02-26 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2303.10796
Fonte PDF: https://arxiv.org/pdf/2303.10796
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.