Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo# Vision par ordinateur et reconnaissance des formes

Amélioration de la classification des images de diapositives entières avec DGR-MIL

DGR-MIL améliore la détection du cancer en se concentrant sur la diversité des instances dans des images de diapositives entières.

― 8 min lire


DGR-MIL : Un bond dans leDGR-MIL : Un bond dans lediagnostic du cancerpour une meilleure détection du cancer.DGR-MIL améliore l'analyse d'instances
Table des matières

Les images de lames entières (WSIs) sont des images haute résolution utilisées dans le diagnostic médical, surtout pour la détection du cancer. Elles offrent une vue détaillée des échantillons de tissus, aidant les pathologistes à identifier les tumeurs et autres anomalies. Cependant, analyser ces images est un vrai casse-tête à cause de leur taille énorme, qui peut atteindre des gigapixels. Les méthodes traditionnelles d'apprentissage profond ont du mal à traiter des images aussi grandes en raison des énormes ressources informatiques nécessaires.

Pour contourner ce problème, les chercheurs divisent souvent les WSIs en morceaux plus petits appelés patches. Chaque patch peut ensuite être analysé avec des modèles d'apprentissage automatique. Cette approche, cependant, pose ses propres défis, principalement parce que des étiquettes précises pour chaque patch ne sont généralement pas disponibles. Au lieu de cela, toute la lame est étiquetée, ce qui en fait une tâche d'apprentissage faiblement supervisé.

Apprentissage par Instances Multiples : Une Solution

L'apprentissage par instances multiples (MIL) est une méthode populaire pour gérer ce genre de tâches faiblement supervisées. Dans ce cadre, un ensemble de patches d'une seule WSI est traité comme un "sac", tandis que chaque patch représente une "instance". L'objectif est de classifier le sac en fonction des instances qu'il contient, même quand on ne connaît que les étiquettes au niveau du sac.

Malgré ses avantages, les méthodes MIL traditionnelles négligent souvent la diversité parmi les instances au sein du même sac ou entre différents sacs. Ce manque d'attention à la diversité peut mener à de mauvaises performances, surtout lorsque le modèle ne prend pas en compte les variations dans les données, comme les différences d'apparence des tumeurs chez les patients.

Le Besoin de Diversité dans MIL

La diversité est essentielle pour une classification efficace dans les WSIs. Les instances au sein du même sac peuvent avoir des variations significatives dues à des différences dans les caractéristiques des tumeurs, la réponse immunitaire et d'autres facteurs. Par exemple, certaines instances négatives peuvent ressembler étroitement à des instances positives, entraînant une confusion dans le processus de classification. Donc, un modèle qui peut capturer efficacement la diversité des instances peut améliorer la précision de la classification.

La plupart des modèles MIL existants se concentrent principalement sur la corrélation entre les instances. Ils supposent que les instances de la même catégorie sont similaires, ce qui peut aboutir à des prédictions trompeuses. Sans tenir compte des différences entre les instances, le modèle peut les agréger incorrectement, produisant des résultats inexactes.

Présentation de DGR-MIL

Pour aborder le problème de la diversité dans MIL, nous proposons une nouvelle approche appelée DGR-MIL (Représentation Globale Diversifiée dans l'Apprentissage par Instances Multiples). DGR-MIL modélise la diversité parmi les instances en utilisant un ensemble de vecteurs globaux qui résument les informations contenues dans toutes les instances.

Caractéristiques Clés de DGR-MIL

  1. Vecteurs Globaux : DGR-MIL utilise des vecteurs globaux pour représenter la diversité des instances. Ces vecteurs capturent des informations essentielles sur les instances, permettant une compréhension plus nuancée des données.

  2. Mécanisme d'Attention Croisée : Le modèle utilise un mécanisme d'attention croisée pour déterminer la similarité entre les représentations des instances et les vecteurs globaux. Cette approche aide à aligner des instances similaires avec le vecteur global correspondant, améliorant la capacité du modèle à modéliser la diversité.

  3. Alignement des Instances Positives : Le modèle pousse les vecteurs globaux vers les centres des instances positives, s'assurant qu'ils sont étroitement liés aux tumeurs étudiées. Cela aide à améliorer la discrimination entre les instances positives et négatives.

  4. Paradigme d'Apprentissage de la Diversité : DGR-MIL intègre un mécanisme d'apprentissage de la diversité qui utilise des propriétés mathématiques pour encourager les vecteurs globaux à être plus diversifiés. Cela garantit que le modèle capture la variabilité présente dans les données.

Aperçu Méthodologique

La méthode proposée a deux composantes principales : (1) la conception de la représentation globale pour le pooling MIL, et (2) la stratégie pour apprendre des représentations globales diverses.

Représentation Globale dans le Pooling MIL

Dans DGR-MIL, la représentation globale des instances cibles est définie comme un ensemble de vecteurs apprenables. Ces vecteurs sont conçus pour capturer les caractéristiques critiques des instances positives dans un sac. Le modèle utilise un réseau de neurones à propagation avant pour générer des embeddings à la fois pour les vecteurs d'instance et les vecteurs globaux.

Corrélation des Instances comme Attention Croisée

Le cadre MIL traditionnel traite les instances comme indépendantes, mais cela peut entraîner des défis informatiques et négliger des corrélations importantes. DGR-MIL utilise l'attention croisée pour modéliser la relation entre les instances et les vecteurs globaux, réduisant significativement la complexité computationnelle par rapport aux méthodes d'auto-attention.

Apprentissage d'une Représentation Globale Diversifiée

Pour apprendre efficacement des représentations globales, DGR-MIL emploie deux stratégies : l'alignement des instances positives et l'apprentissage de la diversité grâce à des propriétés mathématiques. Les vecteurs globaux sont alignés avec les centres des instances positives, les rapprochant des points d'intérêt. En même temps, une perte de diversité encourage les vecteurs globaux à rester distincts les uns des autres, favorisant la capture d'instances diverses.

Validation Expérimentale de DGR-MIL

Pour valider l'efficacité de DGR-MIL, nous avons réalisé des expériences sur deux ensembles de données : CAMELYON16 et TCGA-cancer du poumon. Ces ensembles de données servent de références pour évaluer la performance des modèles MIL dans le contexte de la classification WSI.

Aperçu des Ensembles de Données

  1. CAMELYON16 : Cet ensemble de données inclut des images de lames entières provenant de sections de ganglions lymphatiques, ce qui en fait une ressource précieuse pour tester des méthodes visant à la détection du cancer du sein.

  2. TCGA-cancer du poumon : Cet ensemble de données comprend des échantillons de patients atteints de cancer du poumon, fournissant une gamme diverse d'instances pour l'analyse.

Métriques d'Évaluation

La performance de DGR-MIL a été évaluée sur la base de trois métriques clés : précision, score F1 et AUC (Aire sous la courbe). Ces métriques offrent des aperçus sur la performance globale du modèle et sa capacité à distinguer les instances positives et négatives.

Mise en Place Expérimentale

Différentes stratégies ont été employées pour extraire les caractéristiques des instances des ensembles de données. Nous avons comparé DGR-MIL à plusieurs méthodes MIL de pointe pour évaluer sa performance. Les modèles de référence comprenaient des variations de MIL basées sur l'attention et des techniques de clustering/prototypes.

Résultats et Discussion

Les résultats de nos expériences montrent que DGR-MIL surpasse significativement les modèles MIL existants. Pour les deux ensembles de données, DGR-MIL a constamment obtenu des scores plus élevés en précision, F1 et AUC par rapport à ses concurrents.

Importance des Vecteurs Globaux

L'inclusion de vecteurs globaux dans DGR-MIL a joué un rôle clé dans l'amélioration de la performance. En résumant les informations des instances diverses, le modèle était mieux équipé pour classifier les sacs avec précision.

Impact de l'Alignement des Instances Positives

La stratégie d'alignement des instances positives a contribué à des améliorations significatives de la performance. L'alignement des vecteurs globaux avec des instances positives a facilité une meilleure discrimination entre les classes positives et négatives.

Efficacité de la Perte de Diversité

Le mécanisme de perte de diversité s'est avéré bénéfique, empêchant des solutions triviales où les vecteurs globaux perdraient leur distinctivité. Cet aspect a assuré que DGR-MIL maintenait une large représentation d'instances diverses tout au long du processus de classification.

Conclusion

DGR-MIL représente une avancée significative dans l'application de l'apprentissage par instances multiples pour la classification des images de lames entières. En se concentrant sur la diversité parmi les instances, DGR-MIL améliore la précision et la robustesse de la classification. Cette approche est particulièrement pertinente dans le domaine médical, où les variations d'apparence des tumeurs peuvent influencer le diagnostic et les décisions de traitement.

La mise en œuvre de vecteurs globaux, de mécanismes d'attention croisée et de processus d'apprentissage stratégiques contribuent tous au succès du modèle. Des travaux futurs pourraient explorer des améliorations supplémentaires à DGR-MIL, visant une précision et une efficacité encore plus grandes dans la classification WSI.

Remerciements

Ce travail a été partiellement soutenu par des subventions de recherche et des contributions de diverses institutions, démontrant l'effort collaboratif impliqué dans l'avancement du domaine de l'analyse d'images médicales.

Source originale

Titre: DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification

Résumé: Multiple instance learning (MIL) stands as a powerful approach in weakly supervised learning, regularly employed in histological whole slide image (WSI) classification for detecting tumorous lesions. However, existing mainstream MIL methods focus on modeling correlation between instances while overlooking the inherent diversity among instances. However, few MIL methods have aimed at diversity modeling, which empirically show inferior performance but with a high computational cost. To bridge this gap, we propose a novel MIL aggregation method based on diverse global representation (DGR-MIL), by modeling diversity among instances through a set of global vectors that serve as a summary of all instances. First, we turn the instance correlation into the similarity between instance embeddings and the predefined global vectors through a cross-attention mechanism. This stems from the fact that similar instance embeddings typically would result in a higher correlation with a certain global vector. Second, we propose two mechanisms to enforce the diversity among the global vectors to be more descriptive of the entire bag: (i) positive instance alignment and (ii) a novel, efficient, and theoretically guaranteed diversification learning paradigm. Specifically, the positive instance alignment module encourages the global vectors to align with the center of positive instances (e.g., instances containing tumors in WSI). To further diversify the global representations, we propose a novel diversification learning paradigm leveraging the determinantal point process. The proposed model outperforms the state-of-the-art MIL aggregation models by a substantial margin on the CAMELYON-16 and the TCGA-lung cancer datasets. The code is available at \url{https://github.com/ChongQingNoSubway/DGR-MIL}.

Auteurs: Wenhui Zhu, Xiwen Chen, Peijie Qiu, Aristeidis Sotiras, Abolfazl Razi, Yalin Wang

Dernière mise à jour: 2024-07-03 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.03575

Source PDF: https://arxiv.org/pdf/2407.03575

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires