Faire avancer l'analyse des images de diapositives complètes avec HistoROI
HistoROI améliore la classification des tissus en diagnostic médical avec des images de coupe entière.
Abhijeet Patil, Harsh Diwakar, Jay Sawant, Nikhil Cherian Kurian, Subhash Yadav, Swapnil Rane, Tripti Bameta, Amit Sethi
― 7 min lire
Table des matières
Les images de lames entières (WSIs) sont des images numériques d'échantillons de tissu utilisées dans le diagnostic médical. Elles jouent un rôle crucial en pathologie, surtout dans le diagnostic du cancer. Toutefois, utiliser ces images pour développer des logiciels de diagnostic peut être compliqué. Les logiciels rencontrent souvent des biais et des erreurs qui peuvent provenir des Données d'entraînement et de test.
Le Problème avec les Données
Les WSIs contiennent divers types de tissus, dont certains peuvent ne pas être pertinents pour le diagnostic. Ça peut mener à des résultats inexactes. De plus, des problèmes comme l'erreur humaine dans l'étiquetage et les variations de qualité lors de la préparation des lames peuvent compliquer davantage l'utilisation efficace des WSIs.
En créant des logiciels pour analyser les WSIs, les chercheurs se concentrent souvent sur de plus petits morceaux d'images plutôt que sur la lame entière. Ça rend l'analyse et la gestion des données plus faciles. Pourtant, avec l'augmentation de la puissance de calcul, l'attention s'est de nouveau portée vers l'utilisation de WSIs complètes. Ce changement nécessite souvent un étiquetage détaillé des régions dans les images ou l'utilisation de méthodes qui ne nécessitent pas un étiquetage poussé.
Présentation de HistoROI
HistoROI est un nouvel outil conçu pour classer les WSIs en six types de tissus principaux : épithélium, stroma, lymphocytes, tissu adipeux, artefacts et divers. Il combine l'expertise humaine avec l'apprentissage actif, ce qui signifie qu'il apprend des données tout en impliquant l'apport humain dans le processus d'entraînement. Cette approche aide à garantir que les données utilisées pour l'entraînement sont variées et précises.
HistoROI a été testé sur plusieurs types d'organes. Bien qu'il ait été formé sur un seul ensemble de données, il a montré la capacité de bien se généraliser à d'autres ensembles. Ça veut dire qu'HistoROI peut être utilisé dans différents contextes sans avoir besoin d'un réentraînement complet à chaque fois.
Améliorer le Diagnostic avec HistoROI
L'une des principales applications de HistoROI est d'améliorer les performances d'autres outils de diagnostic qui s'appuient sur l'apprentissage en profondeur. Par exemple, des tests ont été réalisés en utilisant deux ensembles de données liés au cancer : l'ensemble de données CAMELYON pour le cancer du sein et l'ensemble de données TCGA sur le cancer du poumon. Les résultats ont montré qu'en filtrant les données avec HistoROI, l'exactitude du diagnostic s'est considérablement améliorée.
Dans un test avec l'ensemble de données CAMELYON, la précision du diagnostic des métastases, ou de la propagation du cancer, est passée d'une aire sous la courbe (AUC) de 0,88 à 0,92. De même, pour la classification du cancer du poumon, l'AUC est passée de 0,88 à 0,93. HistoROI a également surpassé un outil existant utilisé pour la détection d'artefacts, indiquant son potentiel comme solution supérieure pour améliorer l'exactitude du diagnostic.
Contrôle de qualité en Pathologie
Le contrôle de qualité (CQ) est essentiel en pathologie pour s'assurer que les résultats des outils de diagnostic sont fiables. HistoROI vise à améliorer le CQ en filtrant les données non pertinentes. Les méthodes traditionnelles rencontrent souvent des défis face aux artefacts-des imperfections indésirables qui peuvent survenir lors de la préparation des tissus, de la coloration et des processus de numérisation.
Les artefacts peuvent grandement affecter les performances des outils de diagnostic. Ils peuvent être introduits à cause d'erreurs humaines ou de problèmes techniques lors de la préparation et de la numérisation. Ces problèmes incluent des soucis comme une mauvaise fixation des tissus, des coupes inégales, des bulles d'air et une coloration incorrecte. Donc, retirer les artefacts avant l'analyse est crucial.
Processus d’Annotation Efficace
Annoter des WSIs peut être une tâche chronophage. Pour accélérer le processus, HistoROI utilise une approche avec un humain dans la boucle. Ça veut dire que pendant qu'HistoROI analyse automatiquement les données, des experts humains sont toujours impliqués pour s'assurer que les Annotations sont précises.
Dans le processus, HistoROI utilise le clustering pour regrouper des morceaux d'images similaires. Quand un groupe de patches (comme une petite grille de 5x5 images) semble homogène, ils peuvent être étiquetés avec le même type de tissu. Cette méthode réduit le temps nécessaire pour annoter une WSI et augmente la qualité des données utilisées pour l'entraînement.
Préparation des Données
Pour former HistoROI, les chercheurs ont créé un ensemble de données contenant plus de 2 millions de patches provenant de diverses WSIs. Cet ensemble incluait différents types de tissus et d'artefacts, garantissant qu'HistoROI puisse apprendre efficacement. L'ensemble de données initial provenait de 50 WSIs soigneusement sélectionnées qui montraient la variété nécessaire pour un entraînement robuste.
Pour valider l'efficacité d'HistoROI, il a également été testé avec un ensemble de données sur le cancer du côlon. Cela a montré la capacité d'HistoROI à se généraliser et à classer des patches provenant d'une source différente de celle sur laquelle il a été initialement formé.
Résultats des Tests d'HistoROI
L'exactitude d'HistoROI était élevée lorsqu'il a été testé sur différents ensembles de données. Dans l'ensemble de données sur le cancer du côlon, par exemple, il a pu classer des patches de tissu avec un taux de précision de 77%. Cela indique qu'il peut effectivement se généraliser, même lorsqu'il est appliqué à différents types de cancer.
La comparaison de performance avec un autre outil de CQ a montré qu'HistoROI a mieux réussi à détecter les artefacts à travers diverses WSIs. Il a réussi à identifier plus de zones de tissu pertinentes tout en filtrant celles qui étaient inutiles.
Défis Rencontrés
Bien qu'HistoROI ait montré du potentiel, il n'est pas sans défis. Un problème est l'attribution d'étiquettes uniques aux patches. Parfois, les patches peuvent contenir plusieurs types de tissus, rendant leur classification précise difficile.
Pour y remédier, les chercheurs suggèrent d'améliorer les approches d'étiquetage. Par exemple, ils recommandent d'utiliser des masques de segmentation ou de permettre plusieurs étiquettes pour les types de tissus dans un seul patch. Cela pourrait améliorer la précision des classifications et rendre l'outil plus robuste.
Avancer
Les futures améliorations pour HistoROI devraient se concentrer sur l'expansion de son ensemble de données d'entraînement. En incluant plus de types de tissus et d'artefacts divers, HistoROI peut être affiné pour garantir qu'il fonctionne efficacement dans différents scénarios. Les chercheurs prévoient aussi d'explorer sa performance sur d'autres types d'images acquises par différentes techniques de microscopie.
Le but est de développer un outil qui non seulement améliore la qualité des WSIs mais aide aussi les pathologistes à poser des diagnostics précis plus efficacement.
Conclusion
HistoROI représente une avancée significative dans l'analyse des images de lames entières en pathologie. En combinant l'apport humain avec des processus automatisés, il offre un moyen de classifier efficacement les types de tissus tout en améliorant l'exactitude des diagnostics. À mesure que la technologie évolue, elle offre un potentiel pour un meilleur contrôle de qualité et des diagnostics dans le domaine de la pathologie médicale, menant finalement à de meilleures issues pour les patients.
Titre: Efficient Quality Control of Whole Slide Pathology Images with Human-in-the-loop Training
Résumé: Histopathology whole slide images (WSIs) are being widely used to develop deep learning-based diagnostic solutions, especially for precision oncology. Most of these diagnostic softwares are vulnerable to biases and impurities in the training and test data which can lead to inaccurate diagnoses. For instance, WSIs contain multiple types of tissue regions, at least some of which might not be relevant to the diagnosis. We introduce HistoROI, a robust yet lightweight deep learning-based classifier to segregate WSI into six broad tissue regions -- epithelium, stroma, lymphocytes, adipose, artifacts, and miscellaneous. HistoROI is trained using a novel human-in-the-loop and active learning paradigm that ensures variations in training data for labeling-efficient generalization. HistoROI consistently performs well across multiple organs, despite being trained on only a single dataset, demonstrating strong generalization. Further, we have examined the utility of HistoROI in improving the performance of downstream deep learning-based tasks using the CAMELYON breast cancer lymph node and TCGA lung cancer datasets. For the former dataset, the area under the receiver operating characteristic curve (AUC) for metastasis versus normal tissue of a neural network trained using weakly supervised learning increased from 0.88 to 0.92 by filtering the data using HistoROI. Similarly, the AUC increased from 0.88 to 0.93 for the classification between adenocarcinoma and squamous cell carcinoma on the lung cancer dataset. We also found that the performance of the HistoROI improves upon HistoQC for artifact detection on a test dataset of 93 annotated WSIs. The limitations of the proposed model are analyzed, and potential extensions are also discussed.
Auteurs: Abhijeet Patil, Harsh Diwakar, Jay Sawant, Nikhil Cherian Kurian, Subhash Yadav, Swapnil Rane, Tripti Bameta, Amit Sethi
Dernière mise à jour: Sep 29, 2024
Langue: English
Source URL: https://arxiv.org/abs/2409.19587
Source PDF: https://arxiv.org/pdf/2409.19587
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.