Avanzando l'analisi delle immagini a scansione intera con HistoROI
HistoROI migliora la classificazione dei tessuti nella diagnostica medica usando immagini a tutta diapositiva.
― 6 leggere min
Indice
Le immagini a scivolo intero (WSI) sono immagini digitali di campioni di tessuto usate nella diagnosi medica. Svolgono un ruolo fondamentale nella patologia, soprattutto nella diagnosi del cancro. Tuttavia, utilizzare queste immagini per sviluppare software diagnostici può essere complicato. Il software spesso ha problemi con pregiudizi ed errori che possono sorgere sia dai Dati di addestramento che da quelli di test.
Il Problema con i Dati
Le WSI contengono vari tipi di tessuto, alcuni dei quali potrebbero non essere rilevanti per la diagnosi. Questo può portare a risultati imprecisi. Inoltre, problemi come l'errore umano nell'etichettatura e le variazioni nella qualità durante la preparazione del campione possono aggiungere ulteriori sfide all'uso efficace delle WSI.
Quando si crea un software per analizzare le WSI, i ricercatori spesso si concentrano su piccole porzioni di immagini piuttosto che sull'intera diapositiva. Questo rende più facile gestire e analizzare i dati. Eppure, man mano che i ricercatori ottengono una maggiore potenza di calcolo, l'attenzione si è spostata di nuovo sull'uso delle WSI complete. Questa transizione richiede spesso una etichettatura dettagliata delle aree nelle immagini o l'uso di metodi che non necessitano di un'etichettatura estesa.
Presentazione di HistoROI
HistoROI è un nuovo strumento progettato per classificare le WSI in sei principali tipi di tessuto: epitelio, stroma, linfociti, tessuto adiposo, artefatti e altri. Combina l'expertise umana con l'apprendimento attivo, il che significa che impara dai dati mentre coinvolge anche il contributo umano nel processo di addestramento. Questo approccio aiuta a garantire che i dati usati per l'addestramento siano vari e accurati.
HistoROI è stato testato su vari tipi di organi. Nonostante sia stato addestrato su un singolo dataset, ha dimostrato di saper generalizzare bene su altri dataset. Questo significa che HistoROI può essere utilizzato in contesti diversi senza necessità di un riaddestramento completo ogni volta.
Migliorare la Diagnosi con HistoROI
Una delle principali applicazioni di HistoROI è nel migliorare le prestazioni di altri strumenti diagnostici che si basano sul deep learning. Ad esempio, sono stati condotti test utilizzando due dataset relativi al cancro: il dataset CAMELYON per il cancro al seno e il dataset TCGA per il cancro ai polmoni. I risultati hanno mostrato che filtrando i dati con HistoROI, l'accuratezza della diagnosi è migliorata significativamente.
In un test con il dataset CAMELYON, l'accuratezza nella diagnosi delle metastasi, ovvero la diffusione del cancro, è aumentata da un'area sotto la curva (AUC) di 0,88 a 0,92. Allo stesso modo, per la classificazione del cancro ai polmoni, l'AUC è migliorata da 0,88 a 0,93. HistoROI ha anche superato uno strumento esistente usato per la rilevazione di artefatti, indicando il suo potenziale come soluzione superiore per migliorare l'accuratezza diagnostica.
Controllo Qualità in Patologia
Il controllo qualità (CQ) è essenziale in patologia per garantire che i risultati degli strumenti diagnostici siano affidabili. HistoROI mira a migliorare il CQ filtrando dati irrilevanti. I metodi tradizionali spesso affrontano sfide quando si tratta di artefatti-imperfezioni indesiderate che possono verificarsi durante la preparazione, colorazione e scansione dei tessuti.
Gli artefatti possono influenzare notevolmente le prestazioni degli strumenti diagnostici. Possono essere introdotti a causa di errori umani o problemi tecnici durante la preparazione e la scansione. Questi problemi possono includere questioni come una scarsa fissazione del tessuto, tagli irregolari, bolle d'aria e colorazione errata. Pertanto, rimuovere gli artefatti prima dell'analisi è fondamentale.
Annotazione Efficiente
Processo diAnnotare le WSI può essere un compito lungo. Per velocizzare il processo, HistoROI utilizza un approccio con umani nel loop. Questo significa che mentre HistoROI analizza automaticamente i dati, esperti umani sono ancora coinvolti per garantire che le annotazioni siano accurate.
Nel processo, HistoROI utilizza il clustering per raggruppare insieme porzioni simili di immagini. Quando un gruppo di patch (come una piccola griglia di 5x5 immagini) appare omogeneo, possono essere etichettate con lo stesso tipo di tessuto. Questo metodo riduce il tempo necessario per annotare una WSI e aumenta la qualità dei dati utilizzati per l'addestramento.
Preparazione del Dataset
Per addestrare HistoROI, i ricercatori hanno creato un dataset contenente oltre 2 milioni di patch provenienti da varie WSI. Questo dataset includeva diversi tipi di tessuti e artefatti, assicurando che HistoROI potesse imparare in modo efficace. Il dataset iniziale proveniva da 50 WSI selezionate con cura che mostravano la varietà necessaria per un addestramento robusto.
Per convalidare l'efficacia di HistoROI, è stato testato anche con un dataset di cancro del colon. Questo ha mostrato la capacità di HistoROI di generalizzare e classificare le patch da una sorgente diversa rispetto a quella su cui era stato inizialmente addestrato.
Risultati dai Test di HistoROI
L'accuratezza di HistoROI è stata alta quando testata su diversi dataset. Nel dataset di cancro del colon, ad esempio, è riuscito a classificare le patch di tessuto con un tasso di accuratezza del 77%. Questo indica che può effettivamente generalizzare bene, anche quando applicato a diversi tipi di cancro.
Il confronto delle prestazioni con un altro strumento di CQ ha mostrato che HistoROI ha avuto prestazioni migliori nella rilevazione di artefatti su varie WSI. Ha identificato con successo più aree di tessuto rilevanti, filtrando quelle non necessarie.
Sfide Affrontate
Sebbene HistoROI abbia dimostrato promesse, non è privo di sfide. Un problema è l'assegnazione di etichette singole alle patch. A volte, le patch possono contenere più tipi di tessuto, rendendo difficile classificarle accuratamente.
Per affrontare ciò, i ricercatori suggeriscono di migliorare gli approcci all'etichettatura. Ad esempio, raccomandano di utilizzare maschere di segmentazione o di consentire più etichette per i tipi di tessuto all'interno di una singola patch. Questo potrebbe migliorare l'accuratezza delle classificazioni e rendere lo strumento più robusto.
Andare Avanti
Le future migliorie per HistoROI dovrebbero concentrarsi sull'espansione del suo dataset di addestramento. Includendo più tipi di tessuti e artefatti, HistoROI può essere ulteriormente perfezionato per garantire che funzioni efficacemente in diversi scenari. I ricercatori pianificano anche di indagare sulle sue prestazioni su altri tipi di immagini acquisite attraverso diverse tecniche microscopiche.
L'obiettivo è sviluppare uno strumento che non solo migliori la qualità delle WSI ma che assista anche i patologi nel fare diagnosi accurate in modo più efficiente.
Conclusione
HistoROI rappresenta un significativo avanzamento nell'analisi delle immagini a scivolo intero in patologia. Combinando il contributo umano con processi automatizzati, offre un modo per classificare efficacemente i tipi di tessuto mentre migliora l'accuratezza diagnostica. Con l'evoluzione della tecnologia, offre il potenziale per un miglior controllo qualità e diagnosi nel campo della patologia medica, portando infine a migliori risultati per i pazienti.
Titolo: Efficient Quality Control of Whole Slide Pathology Images with Human-in-the-loop Training
Estratto: Histopathology whole slide images (WSIs) are being widely used to develop deep learning-based diagnostic solutions, especially for precision oncology. Most of these diagnostic softwares are vulnerable to biases and impurities in the training and test data which can lead to inaccurate diagnoses. For instance, WSIs contain multiple types of tissue regions, at least some of which might not be relevant to the diagnosis. We introduce HistoROI, a robust yet lightweight deep learning-based classifier to segregate WSI into six broad tissue regions -- epithelium, stroma, lymphocytes, adipose, artifacts, and miscellaneous. HistoROI is trained using a novel human-in-the-loop and active learning paradigm that ensures variations in training data for labeling-efficient generalization. HistoROI consistently performs well across multiple organs, despite being trained on only a single dataset, demonstrating strong generalization. Further, we have examined the utility of HistoROI in improving the performance of downstream deep learning-based tasks using the CAMELYON breast cancer lymph node and TCGA lung cancer datasets. For the former dataset, the area under the receiver operating characteristic curve (AUC) for metastasis versus normal tissue of a neural network trained using weakly supervised learning increased from 0.88 to 0.92 by filtering the data using HistoROI. Similarly, the AUC increased from 0.88 to 0.93 for the classification between adenocarcinoma and squamous cell carcinoma on the lung cancer dataset. We also found that the performance of the HistoROI improves upon HistoQC for artifact detection on a test dataset of 93 annotated WSIs. The limitations of the proposed model are analyzed, and potential extensions are also discussed.
Autori: Abhijeet Patil, Harsh Diwakar, Jay Sawant, Nikhil Cherian Kurian, Subhash Yadav, Swapnil Rane, Tripti Bameta, Amit Sethi
Ultimo aggiornamento: 2024-09-29 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2409.19587
Fonte PDF: https://arxiv.org/pdf/2409.19587
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.