Un nuovo modo per classificare le immagini dei tumori
Questo metodo usa informazioni di etichette parziali per migliorare la classificazione dei tumori nelle immagini mediche.
― 5 leggere min
Indice
La segmentazione dei tumori nelle immagini mediche è fondamentale per aiutare i dottori a fare diagnosi accurate. Un modo per analizzare queste immagini è attraverso le immagini a resezione totale (WSI), che sono immagini ad alta risoluzione di campioni di tessuto. Questo articolo parla di un nuovo approccio che usa informazioni di etichettatura parziale per classificare queste immagini in diversi sottotipi tumorali e aree non tumorali.
Comprendere le Immagini a Resezione Totale
Le immagini a resezione totale catturano l'intero campione di tessuto e possono includere molti tipi diversi di cellule. Ogni cellula nell'immagine può appartenere a una categoria specifica, come un sottotipo tumorale o una cellula sana. I dottori devono spesso esaminare attentamente queste immagini per identificare il cancro in modo preciso. Tuttavia, la risoluzione delle WSI può rendere questo processo complesso e che richiede tempo.
In un contesto clinico, i dottori di solito raccolgono dati sulle proporzioni dei diversi tipi di tumori presenti nel campione di tessuto. Questi dati vengono registrati anche se non includono informazioni sulle cellule non tumorali. Questo significa che, anche se i dottori possono sapere quanto del campione consiste in diversi tipi di tumori, non hanno informazioni sulla porzione non tumorale.
La Sfida delle Informazioni Incomplete
Nel nostro approccio, ci riferiamo alla situazione di avere solo informazioni parziali sulle etichette come "apprendimento da proporzioni di etichette parziali" o LPLP. Anche se i dottori possono fornire le proporzioni dei sottotipi tumorali, spesso non registrano quanto del campione sia tessuto sano. Questa informazione mancante può rendere difficile classificare l'intera immagine in modo preciso.
Il problema nasce quando si tratta di addestrare un classificatore che possa comprendere queste immagini. Ad esempio, se un dottore dice che il 70% del tumore è sottotipo A e il 30% è sottotipo B, non sappiamo ancora quanto del campione totale sia tessuto sano.
Utilizzare Campioni Sani
Fortunatamente, i campioni sani, che non contengono tumori, possono essere molto utili. Questi campioni possono fungere da guida per aiutare il processo di Classificazione. Utilizzando immagini che sono completamente sane, possiamo identificare meglio come appare un'area non tumorale. Questa informazione è vitale perché ci permette di creare un modello più efficace per classificare i patch cellulari nelle WSI.
Struttura del Metodo Proposto
Il metodo che proponiamo scompone il problema in due compiti più piccoli. Il primo compito è chiamato apprendimento di istanze multiple (MIL), che si concentra sul determinare se un patch campione è tumorale o non tumorale. Il secondo compito è chiamato apprendimento da proporzioni di etichette (LLP), che utilizza le proporzioni disponibili dei sottotipi tumorali per affinare ulteriormente la classificazione.
Apprendimento di Istanze Multiple (MIL)
Nel compito MIL, scopriamo se ciascun patch individuale all'interno della WSI è positivo (contenente cellule tumorali) o negativo (contenente cellule non tumorali). Utilizzando una rete neurale, possiamo fare previsioni basate sulle caratteristiche dei patch. Questo significa che per ogni patch, possiamo affermare con certezza se appartiene a uno dei sottotipi tumorali o se è un patch sano.
Apprendimento da Proporzioni di Etichette (LLP)
Una volta che abbiamo classificato i patch, passiamo al compito LLP. Questo passaggio coinvolge l'uso delle informazioni raccolte dal compito MIL per classificare i patch in modo più preciso. Utilizziamo la proporzione dei sottotipi tumorali per aiutare a informare la nostra comprensione di come i patch sani e tumorali si relazionano tra loro.
Mettere Tutto Insieme
La bellezza del nostro approccio risiede nella sua capacità di apprendimento congiunto. Invece di trattare MIL e LLP come compiti separati, ottimizziamo entrambi simultaneamente. Questo significa che l'output del primo compito aiuta a migliorare l'accuratezza del secondo compito. Tale integrazione consente un processo di classificazione più coeso e affidabile.
Lavori Correlati
In passato, diversi metodi hanno cercato di svolgere compiti simili, ma la maggior parte si è concentrata o sulla classificazione binaria (tumore vs. non tumore) o ha richiesto informazioni complete sulle etichette per tutte le classi. Il nostro metodo è unico in quanto consente l'uso di etichette parziali, che sono spesso disponibili negli scenari del mondo reale.
Implementazione e Risultati Sperimentali
Per valutare l'efficacia del nostro approccio, lo abbiamo testato su due set di dati. Il primo set di dati, CRC100K, contiene immagini con nove classi di annotazioni tissutali relative al cancro colorettale. Nei nostri esperimenti, ci siamo concentrati solo su due classi tumorali e abbiamo raggruppato le classi restanti come non tumorali.
Il secondo set di dati ha riguardato campioni di chemioterapia che contenevano classificazioni sane, legate al tumore e tumore residuo. Nella pratica clinica, la vitalità dei tumori è determinata in base alle proporzioni delle classi positive, mentre le proporzioni delle regioni non tumorali rimangono sconosciute.
Valutazione dell'Accuratezza
I nostri risultati sono stati promettenti. Abbiamo misurato l'accuratezza del nostro metodo rispetto a tecniche di apprendimento supervisionato tradizionali e ad altri metodi esistenti. Nonostante le sfide poste dalle etichette parziali, il nostro metodo ha performato in modo comparabile ai modelli che utilizzano dati più completi.
Risultati Comparativi
In entrambi i set di dati, il nostro approccio ha superato i metodi di base che non ottimizzavano i due compiti insieme. Ad esempio, abbiamo scoperto che i metodi che estendevano approcci tradizionali non riuscivano a classificare accuratamente le istanze negative. Ottimizzando insieme sia MIL che LLP, il nostro metodo ha dimostrato prestazioni migliorate.
Risultati di Segmentazione
Abbiamo analizzato anche qualitativamente i risultati di segmentazione. Quando abbiamo visualizzato l'output del nostro metodo rispetto ai metodi tradizionali, la nostra segmentazione era più chiara e precisa. Questo dimostra che il nostro approccio può identificare efficacemente i sottotipi tumorali anche con dati limitati.
Conclusione
In sintesi, questo nuovo metodo per classificare le WSI dimostra che è possibile lavorare efficacemente con informazioni parziali sulle etichette. Scomponendo il problema in compiti gestibili e ottimizzandoli congiuntamente, possiamo ottenere risultati competitivi rispetto a quelli che utilizzano una etichettatura più completa. Questo potrebbe portare a un migliore supporto per i patologi nel prendere decisioni cruciali riguardo alla diagnosi e al trattamento del cancro.
I risultati suggeriscono che l'uso di proporzioni di etichette parziali può aiutare a costruire modelli di classificazione efficaci senza una precedente etichettatura estesa, beneficiando in ultima analisi scenari sanitari in cui le risorse possono essere limitate.
Titolo: Learning from Partial Label Proportions for Whole Slide Image Segmentation
Estratto: In this paper, we address the segmentation of tumor subtypes in whole slide images (WSI) by utilizing incomplete label proportions. Specifically, we utilize `partial' label proportions, which give the proportions among tumor subtypes but do not give the proportion between tumor and non-tumor. Partial label proportions are recorded as the standard diagnostic information by pathologists, and we, therefore, want to use them for realizing the segmentation model that can classify each WSI patch into one of the tumor subtypes or non-tumor. We call this problem ``learning from partial label proportions (LPLP)'' and formulate the problem as a weakly supervised learning problem. Then, we propose an efficient algorithm for this challenging problem by decomposing it into two weakly supervised learning subproblems: multiple instance learning (MIL) and learning from label proportions (LLP). These subproblems are optimized efficiently in the end-to-end manner. The effectiveness of our algorithm is demonstrated through experiments conducted on two WSI datasets.
Autori: Shinnosuke Matsuo, Daiki Suehiro, Seiichi Uchida, Hiroaki Ito, Kazuhiro Terada, Akihiko Yoshizawa, Ryoma Bise
Ultimo aggiornamento: 2024-05-14 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2405.09041
Fonte PDF: https://arxiv.org/pdf/2405.09041
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.