Migliorare la classificazione delle immagini mediche con SPLAL
Un nuovo metodo migliora l'accuratezza nella classificazione delle immagini mediche utilizzando l'apprendimento semi-supervisionato.
― 7 leggere min
Indice
La classificazione delle immagini mediche è un compito che consiste nell'identificare e categorizzare immagini provenienti da fonti mediche, come scansioni o foto di condizioni della pelle. Questo compito può essere difficile a causa di campioni etichettati limitati e un numero irregolare di immagini per diverse condizioni. Per fortuna, usare l'Apprendimento semi-supervisionato (SSL) può aiutare permettendoci di usare sia dati etichettati che non etichettati. Tuttavia, i metodi SSL devono affrontare due problemi principali: creare etichette affidabili per le immagini non etichettate e gestire le differenze nelle dimensioni delle classi.
Il nostro approccio: SPLAL
Abbiamo sviluppato un nuovo metodo chiamato Pseudo-etichettatura basata su somiglianza con Perdita di allineamento (SPLAL). SPLAL affronta queste sfide in modo efficace. Prima di tutto, utilizza Prototipi di Classe e combina le previsioni di più classificatori per creare etichette affidabili per alcune delle immagini non etichettate. In secondo luogo, introduce una funzione di perdita che aiuta a ridurre i pregiudizi verso le classi rappresentate più comunemente.
Per vedere quanto bene funziona SPLAL, l'abbiamo testato su due dataset di immagini mediche ben noti: il dataset delle lesioni cutanee (ISIC 2018) e il dataset di classificazione delle cellule del sangue (BCCD). I nostri risultati mostrano che SPLAL ha superato altri metodi SSL di punta basati su diversi criteri di valutazione. In particolare, ha mostrato un miglioramento notevole in accuratezza e punteggio F1 sul dataset ISIC 2018.
Contesto: Sfide nella classificazione delle immagini mediche
Squilibrio delle classi
Una delle principali sfide nella classificazione delle immagini mediche è l'imballaggio delle dimensioni delle classi, il che significa che potremmo avere molte immagini per alcune malattie ma molto poche per altre. Questo può rendere il modello più propenso a prevedere correttamente le classi più comuni mentre fatica con quelle meno comuni.
Scarsità di etichette
Ottenere campioni etichettati di alta qualità richiede tempo e sforzi da parte degli esperti medici, il che può essere costoso. Di conseguenza, non ci sono molte immagini etichettate disponibili per la maggior parte delle condizioni, il che significa che i modelli potrebbero non imparare in modo efficace dai pochi dati di cui dispongono.
Importanza dei dati non etichettati
Nei contesti medici si generano spesso enormi quantità di immagini non etichettate. I metodi SSL usano queste immagini per migliorare l'addestramento dei modelli, riducendo la necessità di un grande dataset etichettato. È qui che il nostro approccio SPLAL può essere particolarmente utile.
Pseudo-etichettatura in SSL
La pseudo-etichettatura è una tecnica usata in SSL che consiste nel creare etichette temporanee per i dati non etichettati basate sulle previsioni di un modello. L'idea è di addestrare il modello su queste pseudo-etichette insieme alle vere etichette del dataset etichettato. Tuttavia, se un modello si basa completamente sulle sue previsioni per la pseudo-etichettatura, può diventare parziale, portando a prestazioni scadenti.
Panoramica di SPLAL
Selezione dei campioni affidabili
SPLAL inizia con la selezione di campioni non etichettati affidabili. Determiniamo l'affidabilità di un campione non etichettato basandoci sulla sua somiglianza con i prototipi di classe, che sono rappresentazioni medie di ciascuna classe. Questo aiuta a scegliere solo i campioni che sono rappresentativi delle rispettive classi.
Predizione delle pseudo-etichette
Dopo aver identificato campioni affidabili, SPLAL utilizza tre diversi classificatori: un classificatore di somiglianza, un classificatore K-Nearest Neighbors (KNN) e un classificatore lineare. Combinando le loro previsioni, SPLAL può creare pseudo-etichette più accurate per i campioni non etichettati.
Perdita di allineamento
Per affrontare il problema dello squilibrio delle classi, SPLAL include una perdita di allineamento. Questa funzione di perdita incoraggia previsioni coerenti per le augmentazioni della stessa immagine. Utilizzando forme più deboli e più forti della stessa immagine, il modello impara a fare previsioni coerenti, il che aiuta con le classi minoritarie.
Esperimenti e risultati
Dataset
L'efficacia di SPLAL è stata testata su due dataset pubblicamente disponibili:
ISIC 2018: Questo dataset include 10.015 immagini per lesioni cutanee, categorizzate in sette tipi. Per i nostri test, abbiamo utilizzato un insieme più piccolo di immagini etichettate e valutato le prestazioni del modello basandoci su vari criteri come accuratezza e punteggio F1.
BCCD: Il dataset di classificazione delle cellule del sangue contiene 12.442 immagini su quattro tipi. Questo dataset è più bilanciato, permettendo diversi tipi di confronti con il dataset ISIC 2018.
Impostazione sperimentale
Abbiamo utilizzato un modello di deep learning per i nostri esperimenti, con impostazioni specifiche come un modello backbone pre-addestrato su un ampio dataset (ImageNet). L'addestramento è stato effettuato su più epoche, concentrandosi su immagini etichettate e pseudo-etichettate. Abbiamo anche utilizzato varie tecniche per aumentare le immagini per migliorare il processo di addestramento.
Metriche di valutazione
Per valutare le prestazioni di SPLAL, ci siamo basati su metriche come accuratezza, sensibilità, specificità, precisione e punteggio F1. Queste metriche aiutano a fornire una visione complessiva di quanto bene il modello sta funzionando attraverso le classi.
Confronto con altri metodi
Abbiamo confrontato SPLAL con diversi metodi SSL contemporanei, tra cui l'auto-addestramento e approcci di apprendimento avversariale. Nella maggior parte dei casi, SPLAL ha mostrato miglioramenti significativi, in particolare in come ha gestito le classi minoritarie.
Studi di ablazione
Abbiamo condotto ulteriori test per vedere come ciascun componente di SPLAL contribuisse al suo successo. Alterando diversi parametri e valutandone l'impatto, abbiamo identificato fattori chiave che migliorano le prestazioni complessive del modello.
Discussione
Generazione di prototipi di classe
Per creare prototipi di classe, abbiamo utilizzato un sistema di coda di memoria. Questo assicura che i prototipi riflettano i campioni di addestramento più recenti senza introdurre pregiudizi dovuti a squilibri di classe. Mediando i vettori caratteristici dei campioni più rilevanti, abbiamo aiutato a mantenere l'integrità delle previsioni del modello.
Impatto della perdita di allineamento
I nostri studi hanno chiaramente dimostrato che l'incorporazione della perdita di allineamento migliora significativamente le prestazioni del modello, in particolare nei casi con pochi esempi di determinate classi. Questa perdita aiuta il modello a fare previsioni coerenti, portando a una migliore classificazione complessiva.
Importanza della combinazione di classificatori
Usare una combinazione ponderata di diversi classificatori ha permesso a SPLAL di superare i pregiudizi che potrebbero sorgere affidandosi a un solo classificatore. Considerando le previsioni provenienti da più fonti, il modello può creare un sistema di classificazione più equilibrato ed efficace.
Conclusione
In questo lavoro, abbiamo introdotto un nuovo metodo, SPLAL, che migliora significativamente i compiti di classificazione delle immagini mediche che affrontano sfide come i dati etichettati limitati e lo squilibrio delle classi. Concentrandoci sulla selezione di campioni affidabili, pseudo-etichettatura efficace e sfruttando la perdita di allineamento, SPLAL migliora le prestazioni del modello su diversi dataset.
In definitiva, SPLAL mostra grande potenziale per migliorare l'accuratezza della classificazione delle immagini mediche, il che può portare a strumenti diagnostici migliori nei contesti sanitari. Utilizzando efficacemente sia dati etichettati che non etichettati, possiamo muoverci verso modelli più robusti e affidabili che assistano nelle applicazioni mediche reali.
Lavoro futuro
Guardando al futuro, ci sono diverse aree per potenziali miglioramenti ed esplorazioni:
Dataset aggiuntivi: Testare SPLAL su dataset più diversi potrebbe aiutare a convalidare la sua efficacia su un'ampia gamma di compiti di imaging medico.
Applicazioni nel mondo reale: Implementare SPLAL in contesti clinici potrebbe fornire indicazioni su quanto bene funziona sotto vincoli e variazioni di qualità dei dati reali.
Ottimizzazione dei parametri: Esplorare le impostazioni ottimali per i pesi utilizzati nei vari classificatori e l'impatto della perdita di allineamento potrebbe produrre performance ancora migliori.
Indagare metodi di apprendimento alternativi: Sebbene SPLAL si concentri su SSL, combinarlo con altri paradigmi di apprendimento, come l'apprendimento non supervisionato o il transfer learning, potrebbe ulteriormente migliorare le capacità del modello.
Design centrato sull'utente: Coinvolgere i professionisti medici per comprendere le loro esigenze e preferenze potrebbe portare a modifiche che rendano SPLAL ancora più user-friendly nella pratica.
Pursuendo queste strade, possiamo affinare meglio SPLAL e contribuire ai progressi nella classificazione delle immagini mediche che possono fare la differenza nella cura dei pazienti.
Titolo: SPLAL: Similarity-based pseudo-labeling with alignment loss for semi-supervised medical image classification
Estratto: Medical image classification is a challenging task due to the scarcity of labeled samples and class imbalance caused by the high variance in disease prevalence. Semi-supervised learning (SSL) methods can mitigate these challenges by leveraging both labeled and unlabeled data. However, SSL methods for medical image classification need to address two key challenges: (1) estimating reliable pseudo-labels for the images in the unlabeled dataset and (2) reducing biases caused by class imbalance. In this paper, we propose a novel SSL approach, SPLAL, that effectively addresses these challenges. SPLAL leverages class prototypes and a weighted combination of classifiers to predict reliable pseudo-labels over a subset of unlabeled images. Additionally, we introduce alignment loss to mitigate model biases toward majority classes. To evaluate the performance of our proposed approach, we conduct experiments on two publicly available medical image classification benchmark datasets: the skin lesion classification (ISIC 2018) and the blood cell classification dataset (BCCD). The experimental results empirically demonstrate that our approach outperforms several state-of-the-art SSL methods over various evaluation metrics. Specifically, our proposed approach achieves a significant improvement over the state-of-the-art approach on the ISIC 2018 dataset in both Accuracy and F1 score, with relative margins of 2.24\% and 11.40\%, respectively. Finally, we conduct extensive ablation experiments to examine the contribution of different components of our approach, validating its effectiveness.
Autori: Md Junaid Mahmood, Pranaw Raj, Divyansh Agarwal, Suruchi Kumari, Pravendra Singh
Ultimo aggiornamento: 2023-07-10 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2307.04610
Fonte PDF: https://arxiv.org/pdf/2307.04610
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.