Progrès dans la détection des artefacts pour la pathologie computationnelle
Une nouvelle approche améliore la détection des artefacts dans le diagnostic du cancer, augmentant la précision et l'efficacité.
― 9 min lire
Table des matières
Le cancer apparaît dans les organes quand des changements génétiques dans des cellules normales les transforment en cellules tumorales. Ça peut arriver à cause d'une exposition régulière à des substances nocives ou d'autres facteurs qui peuvent provoquer le cancer. Diagnostiquer le cancer de manière précise et rapide est essentiel pour un traitement efficace et pour réduire le nombre de personnes qui meurent de la maladie. Le cancer est l'une des maladies les plus létales dans le monde, avec environ 29 millions de décès attendus d'ici 2040.
L'histopathologie est couramment utilisée pour identifier les cellules cancéreuses. Ce processus consiste à examiner des échantillons de tissus sous un microscope sur des lames de verre spéciales. Cependant, cette inspection manuelle peut être lente, subjective et peut varier d'un observateur à l'autre. De plus, avec le nombre croissant de cas de cancer et le manque de pathologistes formés, il y a des défis importants pour un diagnostic et un traitement rapides, ce qui peut nuire à la prise de décision clinique. Pour améliorer la vitesse et la précision, il est nécessaire de moderniser le processus de diagnostic par des moyens numériques.
La pathologie numérique (DP) peut aider à relever ces défis en permettant des diagnostics plus rapides et un partage plus facile d'avis entre différents experts. Ces dernières années, la recherche et le développement en pathologie numérique ont considérablement augmenté, permettant l'analyse de lames histologiques numérisées, souvent appelées images de lames entières (WSIs).
Pathologie computationnelle
Comprendre laLes systèmes de pathologie computationnelle (CPATH) peuvent extraire des informations précieuses à partir d'images de lames entières en utilisant des outils automatisés alimentés par l'intelligence artificielle (IA) et le traitement d'images. En intégrant CPATH avec la pathologie numérique, on peut améliorer les méthodes de diagnostic et faire gagner du temps aux pathologistes. Néanmoins, des problèmes surviennent lors de la préparation des lames, ce qui peut créer des artefacts-des zones dans l'image qui ne fournissent pas de données utiles. Les pathologistes ignorent généralement ces artefacts lors des inspections manuelles, mais ils peuvent interférer avec la performance des systèmes CPATH automatisés.
Pour lutter contre ce problème, il est crucial d'équiper les systèmes CPATH d'un processus de détection des artefacts. En identifiant et en supprimant les artefacts, on peut s'assurer que seul le tissu pertinent est analysé, menant à des prédictions plus fiables et à un contrôle de qualité dans les procédures de laboratoire.
Comment ça Marche
Les images de lames entières sont divisées en sections plus petites, ou patches, pour faciliter le traitement par des modèles d'Apprentissage profond. Ces patches sont ensuite analysés à l'aide d'une combinaison de modèles d'experts ou de modèles multiclasses, utilisant des structures d'apprentissage profond avancées pour diverses tâches de classification. Seuls les patches contenant du tissu pertinent sont utilisés pour une analyse plus approfondie. En fin de compte, ce processus produit différents résultats, comme une carte montrant où se trouvent les artefacts, un rapport sur la qualité de l'échantillon de tissu, et une WSI affinée qui est exempte d'artefacts.
Les récents progrès des techniques d'apprentissage profond ont attiré l'attention dans le domaine de CPATH grâce à leur capacité à identifier des motifs complexes dans les données histologiques. Les réseaux de neurones convolutifs profonds (DCNNs) et les transformateurs de vision (ViTs) sont des structures populaires utilisées pour différencier les motifs tissulaires pour divers types de cancer.
Bien que certaines recherches montrent que les DCNNs fonctionnent bien avec des jeux de données plus petits, d'autres soutiennent que les ViTs sont meilleurs pour la structure globale et la robustesse. Néanmoins, les deux types de modèles peuvent rencontrer des défis comme le surapprentissage, ce qui signifie que le modèle peut avoir de mauvaises performances sur de nouvelles données, entraînant des prédictions incorrectes. Pour y remédier, les chercheurs peuvent utiliser des ensembles de modèles d'apprentissage profond, où plusieurs modèles travaillent ensemble pour améliorer la précision.
Un modèle de Mélange d'experts (MoE) peut être particulièrement utile dans ce contexte. Il combine des modèles spécialisés pour des sous-tâches spécifiques, menant à de meilleures performances globales. Dans notre travail, nous nous concentrons sur la construction d'une approche efficace de détection des artefacts en utilisant des MoEs, en équilibrant performance et complexité.
Approche Proposée pour la Détection des Artefacts
Dans cette étude, nous introduisons une approche d'apprentissage profond basée sur MoE pour détecter divers types d'artefacts dans les images de lames histologiques entières. Nous créons plusieurs modèles à travers MoE, où chaque modèle se spécialise dans la détection d'un type spécifique d'artefact, comme les zones floues, les tissus pliés, les bulles d'air, et d'autres caractéristiques sans pertinence diagnostique.
Les pipelines d'apprentissage profond que nous avons développés peuvent générer quatre résultats clés :
- Une carte de segmentation des artefacts.
- Un rapport sur les artefacts pour le contrôle qualité, catégorisé en six classes (cinq types d'artefacts et une catégorie sans artefacts).
- Un masque sans artefacts qui met en évidence les zones de pertinence diagnostique potentielle.
- Une WSI affinée pour une analyse computationnelle supplémentaire.
Matériaux de Données
Données de Formation et de Développement
Pour nos expériences, nous avons utilisé des échantillons de tissus provenant de patients atteints de cancer de la vessie. Les lames ont été teintées pour mettre en évidence des caractéristiques spécifiques et scannées pour créer des images haute résolution. Une personne formée a annoté ces images pour identifier la présence de divers artefacts et marquer les zones sans artefacts. Cet ensemble de données sert de base pour l'entraînement et la validation de nos modèles d'apprentissage profond.
Données de Validation Externe
Pour évaluer à quel point nos modèles se généralisent à différents types de données, nous avons utilisé plusieurs ensembles de données externes. Ces ensembles de données comprenaient des images de cancer de la vessie à haut risque et des échantillons de patients atteints de cancer du sein et de la peau. Les ensembles de données externes ont été collectés dans différents hôpitaux et représentent une gamme de types de tissus et de procédures de teinture.
Méthodologie
Notre processus de détection des artefacts suit deux étapes principales :
- Nous formons des modèles pour classer les patches d'images en fonction de leur contenant des artefacts.
- Nous utilisons ces modèles formés pour créer un MoE pour faire des prédictions et réaliser un post-traitement.
La première étape consiste à diviser les images de lames entières en patches et à appliquer diverses architectures d'apprentissage profond pour l'entraînement. Nous avons utilisé à la fois des DCNNs et des ViTs comme extracteurs de caractéristiques. Dans la seconde étape, nous avons intégré les prédictions par patch en utilisant un mécanisme de gating pour combiner la sortie des modèles formés.
Pour optimiser la sensibilité de notre détection des artefacts, nous avons appliqué un seuil probabiliste, ce qui nous a permis d'augmenter la précision d'identification des régions sans artefacts. Ce processus en deux étapes aboutit à la génération de prédictions concernant la présence d'artefacts dans la WSI.
Résultats Expérimentaux
Pour évaluer la performance de nos pipelines d'apprentissage profond, nous avons effectué divers tests sur les ensembles de données d'entraînement, de validation et externes.
Performance de Validation
Nos résultats montrent que les modèles basés sur MoE ont surpassé les modèles multiclasses traditionnels dans la détection des patches sans artefacts. Les pipelines MoE ont efficacement minimisé les faux négatifs tout en maintenant une grande sensibilité dans la classification du tissu pertinent. Bien que les deux modèles présentent des avantages, les modèles MoE se sont révélés supérieurs dans la détection des artefacts, bien qu'ils nécessitent plus de ressources informatiques.
Tests de Généralisation et de Robustesse
Pour tester comment nos modèles se comportent sur des données invisibles, nous les avons évalués sur des ensembles de données externes. Même si les modèles MoE ont connu une certaine réduction de la sensibilité face à ces différents types de tissus, ils ont néanmoins réussi à maintenir un niveau élevé de spécificité. Cela signifie qu'ils ont correctement identifié la plupart des artefacts présents dans les images externes, indiquant une bonne généralisabilité.
Évaluation Qualitative
Des experts ont évalué les cartes de segmentation produites par nos modèles, en examinant à quel point les artefacts étaient détectés et comment les régions sans artefacts étaient préservées. Bien que les retours soient globalement positifs, des cas de mauvaise classification ont montré qu'il y a encore des domaines à améliorer. Cette évaluation qualitative renforce la nécessité d'une révision par des experts en plus des mesures quantitatives pour évaluer correctement la performance du modèle.
Conclusion et Perspectives Futures
En résumé, nous avons développé des pipelines d'apprentissage profond innovants capables de raffiner les images de lames entières grâce à un processus complet de détection des artefacts. L'approche MoE capture les nuances de diverses morphologies d'artefacts et combine efficacement les prédictions de différents modèles. Grâce à des tests rigoureux, nous avons établi que le modèle MoE utilisant des DCNNs surpasse les modèles multiclasses en performance, malgré un besoin accru en ressources informatiques.
Le travail présenté ici jette les bases pour améliorer les systèmes de pathologie computationnelle, en les équipant de la capacité à filtrer le bruit et à améliorer les processus diagnostiques. À l'avenir, nous visons à élargir nos ensembles de données de formation en intégrant des échantillons de plusieurs cohortes et en mettant en œuvre des stratégies adaptatives pour optimiser la performance des modèles en fonction de types de cancer spécifiques. Ce faisant, nous espérons affiner encore l'efficacité des pipelines de traitement des artefacts et leur applicabilité dans des contextes cliniques.
Titre: Equipping Computational Pathology Systems with Artifact Processing Pipelines: A Showcase for Computation and Performance Trade-offs
Résumé: BackgroundHistopathology is a gold standard for cancer diagnosis. It involves extracting tissue specimens from suspicious areas to prepare a glass slide for a microscopic examination. However, histological tissue processing procedures result in the introduction of artifacts, which are ultimately transferred to the digitized version of glass slides, known as whole slide images (WSIs). Artifacts are diagnostically irrelevant areas and may result in wrong predictions from deep learning (DL) algorithms. Therefore, detecting and excluding artifacts in the computational pathology (CPATH) system is essential for reliable automated diagnosis. MethodsIn this paper, we propose a mixture of experts (MoE) scheme for detecting five notable artifacts, including damaged tissue, blur, folded tissue, air bubbles, and histologically irrelevant blood from WSIs. First, we train independent binary DL models as experts to capture particular artifact morphology. Then, we ensemble their predictions using a fusion mechanism. We apply probabilistic thresholding over the final probability distribution to improve the sensitivity of the MoE. We developed four DL pipelines to evaluate computational and performance trade-offs. These include two MoEs and two multiclass models of state-of-the-art deep convolutional neural networks (DCNNs) and vision transformers (ViTs). These DL pipelines are quantitatively and qualitatively evaluated on external and out-of-distribution (OoD) data to assess generalizability and robustness for artifact detection application. ResultsWe extensively evaluated the proposed MoE and multiclass models. DCNNs-based MoE and ViTs-based MoE schemes outperformed simpler multiclass models and were tested on datasets from different hospitals and cancer types, where MoE using (MobiletNet) DCNNs yielded the best results. The proposed MoE yields 86.15 % F1 and 97.93% sensitivity scores on unseen data, retaining less computational cost for inference than MoE using ViTs. This best performance of MoEs comes with relatively higher computational trade-offs than multiclass models. Furthermore, we apply post-processing to create an artifact segmentation mask, a potential artifact-free RoI map, a quality report, and an artifact-refined WSI for further computational analysis. During the qualitative evaluation, pathologists assessed the predictive performance of MoEs over OoD WSIs. They rated artifact detection and artifact-free area preservation, where the highest agreement translated to the Cohen kappa of 0.82, indicating substantial agreement for the overall diagnostic usability of the DCNN-based MoE scheme. ConclusionsThe proposed artifact detection pipeline will not only ensure reliable CPATH predictions but may also provide quality control. In this work, the best-performing pipeline for artifact detection is MoE with DCNNs. Our detailed experiments show that there is always a trade-off between performance and computational complexity, and no straightforward DL solution equally suits all types of data and applications. The code and dataset for training and development can be found online at Github and Zenodo, respectively.
Auteurs: Neel Kanwal, F. Khoraminia, U. Kiraz, A. Mosquera-Zamudio, C. Monteagudo, E. A. M. Janssen, T. C. M. Zuiverloon, C. Rong, K. Engan
Dernière mise à jour: 2024-03-13 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.03.11.24304119
Source PDF: https://www.medrxiv.org/content/10.1101/2024.03.11.24304119.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.