Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Améliorer la segmentation d'images médicales avec peu de données

Une nouvelle méthode améliore la segmentation d'images médicales en utilisant l'apprentissage semi-supervisé.

― 6 min lire


Améliorer les techniquesAméliorer les techniquesd'analyse d'imagesmédicalesétiquetées.de segmentation avec peu de donnéesNouvelle approche booste la précision
Table des matières

La Segmentation d'images médicales est une étape cruciale pour diagnostiquer des maladies et planifier des traitements. Mais obtenir suffisamment de données étiquetées pour ça peut être super galère, car collecter ces images coûte cher et prend du temps. Comme les données non étiquetées sont souvent plus accessibles, l'Apprentissage semi-supervisé (SSL) est devenu une méthode qui utilise à la fois un petit nombre de données étiquetées et plein d'images non étiquetées.

Les méthodes SSL se concentrent généralement sur l'utilisation des images non étiquetées disponibles pour améliorer l'apprentissage après avoir compris quelques infos de base à partir des données étiquetées limitées. Cependant, beaucoup de méthodes existantes n'arrivent pas à bien apprendre des données étiquetées restreintes. Pour y remédier, les avancées récentes qui utilisent des modèles de segmentation généraux, comme le Segment Anything Model (SAM), offrent une solution potentielle en utilisant moins de données étiquetées pour s'adapter à de nouvelles tâches.

Aperçu du Segment Anything Model (SAM)

Le Segment Anything Model est un outil puissant qui a montré une grande adaptabilité dans différentes tâches. Il apprend à partir de grands ensembles de données naturels, ce qui lui permet de transférer ses connaissances à de nouvelles tâches avec seulement un petit nombre de données étiquetées supplémentaires. Cependant, beaucoup d'approches utilisant SAM pour la segmentation d'images médicales se concentrent principalement sur un entraînement complet avec une tonne de données étiquetées. Ce n’est pas la meilleure utilisation de ses capacités, surtout quand les données étiquetées sont limitées.

Quelques efforts récents ont essayé d'utiliser SAM dans un contexte semi-supervisé, mais ils le traitent souvent comme un élément séparé pour générer des pseudo-labels pour les images médicales. Cela peut entraîner des problèmes de performance à cause des différences entre les images naturelles et médicales.

Méthode Proposée

Pour améliorer l'utilisation de SAM pour la segmentation d'images médicales avec peu de données étiquetées, on propose une nouvelle méthode qu'on appelle Cross Prompting Consistency avec Segment Anything Model (CPC-SAM). Notre approche tire parti de la conception unique des prompts de SAM et crée un système où deux branches interagissent pour guider l'apprentissage. En procédant ainsi, elle apprend efficacement à la fois des données étiquetées limitées et de la masse d'images non étiquetées.

Stratégie de Cross Prompting

Le cœur de notre méthode réside dans la stratégie de cross prompting, qui implique deux branches du modèle. Chaque branche génère des prompts pour l'autre en fonction de leurs sorties. L'idée de base est que quand une branche fournit une sortie sans prompts, la seconde branche peut utiliser cette sortie pour créer des prompts qui guideront la première branche. Ce prompting bidirectionnel permet un apprentissage plus efficace.

Cependant, comme les données non étiquetées peuvent mener à des prompts bruyants, on a besoin d'une façon de s'assurer que les sorties restent fiables. Pour ça, on a intégré une stratégie de régularisation de la cohérence des prompts. Ça veut dire qu'on veut s'assurer que les sorties de SAM restent cohérentes même quand on utilise différents prompts, minimisant la sensibilité de SAM à l'endroit où les prompts sont placés.

Évaluation Expérimentale

Pour valider notre méthode, on a testé CPC-SAM sur deux ensembles de données d'images médicales publiques : un pour le cancer du sein et un autre pour les structures cardiaques. On a découvert que notre approche surpassait les méthodes semi-supervisées les plus avancées, atteignant des améliorations significatives en précision de segmentation.

Détails des Ensembles de Données

  1. Ensemble de Données sur le Cancer du Sein : Cet ensemble se compose d'images ultrasonores utilisées pour identifier les tumeurs bénignes et malignes.
  2. Ensemble de Données sur les Structures Cardiaques : Cet ensemble comprend des IRM du cœur, en se concentrant sur différentes régions nécessitant une segmentation précise.

Dans nos tests, on n'a utilisé qu'un petit nombre d'images étiquetées et on a beaucoup compté sur les non étiquetées pour montrer à quel point notre méthode peut fonctionner même avec peu d'infos initiales.

Résultats

Les résultats ont montré que notre méthode a obtenu plus de 9 % d'amélioration sur le Coefficient de Dice dans la tâche de segmentation du cancer du sein tout en montrant aussi une performance supérieure sur l'ensemble de données cardiaque. Ça confirme que CPC-SAM peut utiliser efficacement des données non étiquetées pour améliorer le processus d'apprentissage.

Avantages de la Méthode Proposée

Les points forts de notre approche peuvent se résumer comme suit :

  1. Utilisation Efficace des Données Étiquetées Limitées : En tirant parti des capacités de SAM, on peut obtenir de bons résultats d'apprentissage avec seulement un petit ensemble de données étiquetées au départ.

  2. Apprentissage Bidirectionnel : La stratégie de cross prompting permet au modèle de continuellement affiner sa compréhension en utilisant les sorties des deux branches pour s’informer mutuellement.

  3. Stabilité grâce à la Régularisation : La régularisation de la cohérence des prompts aide à garantir que les sorties restent fiables, en s'attaquant au bruit potentiel introduit par les prompts de données non étiquetées.

  4. Performance Robuste : Notre méthode montre des améliorations constantes par rapport à diverses méthodes existantes, surtout quand les données étiquetées sont rares.

Conclusion et Travaux Futurs

En conclusion, notre cadre CPC-SAM comble efficacement le fossé entre l'utilisation de données étiquetées limitées et d'abondantes données non étiquetées dans les tâches de segmentation d'images médicales. Il démontre qu'avec les bonnes stratégies, même de petits ensembles de données étiquetées peuvent mener à des modèles robustes qui fonctionnent bien sur des tâches complexes.

Pour l'avenir, on prévoit d'explorer d'autres stratégies pour sélectionner des prompts qui mèneront à des sorties encore plus fiables. On veut aussi étudier l'utilisation d'autres types de prompts ou de différentes modalités pour améliorer encore les résultats de segmentation. Nos recherches en cours continueront de se concentrer sur l'optimisation de l'apprentissage semi-supervisé pour le domaine de l'imagerie médicale.

Source originale

Titre: Cross Prompting Consistency with Segment Anything Model for Semi-supervised Medical Image Segmentation

Résumé: Semi-supervised learning (SSL) has achieved notable progress in medical image segmentation. To achieve effective SSL, a model needs to be able to efficiently learn from limited labeled data and effectively exploiting knowledge from abundant unlabeled data. Recent developments in visual foundation models, such as the Segment Anything Model (SAM), have demonstrated remarkable adaptability with improved sample efficiency. To harness the power of foundation models for application in SSL, we propose a cross prompting consistency method with segment anything model (CPC-SAM) for semi-supervised medical image segmentation. Our method employs SAM's unique prompt design and innovates a cross-prompting strategy within a dual-branch framework to automatically generate prompts and supervisions across two decoder branches, enabling effectively learning from both scarce labeled and valuable unlabeled data. We further design a novel prompt consistency regularization, to reduce the prompt position sensitivity and to enhance the output invariance under different prompts. We validate our method on two medical image segmentation tasks. The extensive experiments with different labeled-data ratios and modalities demonstrate the superiority of our proposed method over the state-of-the-art SSL methods, with more than 9% Dice improvement on the breast cancer segmentation task.

Auteurs: Juzheng Miao, Cheng Chen, Keli Zhang, Jie Chuai, Quanzheng Li, Pheng-Ann Heng

Dernière mise à jour: 2024-07-07 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.05416

Source PDF: https://arxiv.org/pdf/2407.05416

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires