Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo# Vision par ordinateur et reconnaissance des formes

Avancées dans la segmentation d'images médicales avec DiffRect

DiffRect améliore la segmentation d'images médicales en renforçant la qualité des pseudo-étiquettes et la compréhension de la distribution.

― 7 min lire


DiffRect : Redéfinir laDiffRect : Redéfinir lasegmentation médicalede la segmentation d'images médicales.Un nouveau modèle améliore la précision
Table des matières

La Segmentation d'images médicales est un outil essentiel en santé qui aide les médecins à comprendre et analyser les images générées par divers examens médicaux. Ce processus consiste à diviser les images en différentes parties, permettant une meilleure identification des organes, des tissus et de toute anomalie comme des tumeurs. Cependant, créer des segmentations précises demande souvent une grande quantité de données annotées, ce qui est long et coûteux à rassembler.

Le défi des données annotées

Un problème majeur dans la segmentation d'images médicales est la forte demande de données annotées. Pour entraîner un modèle à segmenter efficacement, un grand nombre d'images doit être soigneusement annoté. Ce processus d'annotation peut être long pour les professionnels de santé, entraînant une pénurie de données annotées disponibles pour l'entraînement. Pour résoudre ce problème, les chercheurs ont développé des méthodes d'apprentissage semi-supervisé.

Méthodes d'apprentissage semi-supervisé

L'apprentissage semi-supervisé combine des données annotées et non annotées pour améliorer l'entraînement des modèles. Ces méthodes peuvent être divisées en deux grandes catégories : l'auto-apprentissage et la régularisation de cohérence.

Auto-apprentissage

Dans l'auto-apprentissage, un modèle génère des Pseudo-étiquettes pour des images non annotées. Ces pseudo-étiquettes sont ensuite utilisées avec de vraies images annotées pour améliorer la performance du modèle. Cette technique permet au modèle d'apprendre à partir de données supplémentaires, bien que l'efficacité dépende fortement de la qualité des pseudo-étiquettes.

Régularisation de cohérence

Les méthodes de régularisation de cohérence partent du principe que de petits changements dans l'entrée ou dans le modèle ne devraient pas modifier radicalement les prédictions du modèle. En appliquant du bruit ou des changements aux données, le modèle est entraîné à maintenir des prédictions cohérentes, ce qui améliore sa capacité à généraliser à de nouvelles données non vues.

Problèmes courants dans l'apprentissage semi-supervisé

Malgré les progrès réalisés dans l'apprentissage semi-supervisé pour la segmentation d'images médicales, plusieurs défis persistent :

Dépendance aux pseudo-étiquettes

De nombreuses méthodes reposent sur la qualité des pseudo-étiquettes générées par le modèle. Si ces étiquettes sont incorrectes, le modèle peut apprendre de mauvais schémas, conduisant à une mauvaise performance de segmentation. Cette dépendance à des étiquettes potentiellement défectueuses peut entraîner une chute significative de la précision.

Difficulté à capturer les distributions d'étiquettes

Les modèles ont souvent du mal à comprendre la distribution des étiquettes dans les données. Comprendre comment les points de données sont regroupés ou liés peut améliorer la capacité du modèle à généraliser des données annotées à des données non annotées. Lorsque cette distribution n'est pas bien capturée, le modèle peut ne pas bien performer sur de nouvelles données.

Présentation de DiffRect

Pour surmonter les défis dans la segmentation d'images médicales semi-supervisée, un nouveau modèle appelé DiffRect a été introduit. Ce modèle se concentre sur l'amélioration de la qualité des pseudo-étiquettes et une meilleure compréhension de la distribution des étiquettes dans les données.

Module de calibration de contexte des étiquettes (LCC)

Le premier composant important de DiffRect est le Module de Calibration de Contexte des Étiquettes (LCC). Ce module ajuste les relations entre différentes classes dans les pseudo-étiquettes pour réduire les erreurs. Il commence par transformer les pseudo-étiquettes encodées en one-hot en une représentation visuelle utilisant des couleurs correspondant à chaque classe. Cette coloration visuelle aide le modèle à mieux comprendre le contexte de chaque étiquette et à améliorer les prédictions.

LCC fournit également une guidance de calibration basée sur la similarité entre les pseudo-étiquettes et les vraies étiquettes de vérité terrain. En faisant cela, le modèle peut apprendre à affiner la qualité de ses étiquettes plus efficacement.

Module de rectification des caractéristiques latentes (LFR)

Le deuxième composant crucial de DiffRect est le Module de Rectification des Caractéristiques Latentes (LFR). Ce module s'attaque au défi de l'alignement des distributions d'étiquettes. Il utilise une méthode appelée modèles de diffusion probabiliste avec débruitage (DDPM) pour y parvenir.

LFR crée un processus qui améliore progressivement la qualité des pseudo-étiquettes en apprenant à transporter la distribution des qualités d'étiquettes de représentations grossières à des représentations plus précises. Essentiellement, il commence avec une version brute des étiquettes et les améliore progressivement, s'assurant que le modèle apprend à produire de meilleurs signaux de supervision pour la segmentation.

Comment fonctionne DiffRect

Le processus global commence par la collecte d'images médicales annotées et non annotées. Le module LCC calibre les pseudo-étiquettes générées pour les images non annotées, assurant qu'elles sont plus fiables. Pendant ce temps, le module LFR travaille sur les représentations latentes de ces étiquettes.

En combinant les forces des deux modules, DiffRect peut produire des segmentations de haute qualité même lorsque seule une petite partie des données est annotée. C'est particulièrement précieux en imagerie médicale, où obtenir des données annotées peut être difficile.

Résultats expérimentaux

DiffRect a été testé sur divers ensembles de données publics, y compris ACDC et MS-CMRSEG 2019. Les résultats ont montré que DiffRect dépassait les méthodes existantes en termes de précision de segmentation, même avec très peu de données annotées disponibles. Par exemple, il a obtenu un score Dice impressionnant de 82,40 % sur l'ensemble de données ACDC en utilisant seulement 1 % des scans annotés.

Comparaison avec d'autres méthodes

Comparé à d'autres méthodes de pointe, DiffRect a montré un avantage clair sur tous les ensembles de données testés. Il a non seulement amélioré la performance de segmentation de manière significative, mais a également maintenu des résultats cohérents lorsqu'il a été testé avec différentes quantités de données annotées. Cela suggère que DiffRect est capable de gérer efficacement les défis posés par des données annotées limitées.

Importance de chaque composant

Pour mieux comprendre l'efficacité de DiffRect, les chercheurs ont également réalisé des études d'ablation pour évaluer les contributions de chaque module. Les résultats ont confirmé l'importance des modules LCC et LFR. En retirant l'un ou l'autre composant, on a observé des baisses de la performance de segmentation, soulignant leur rôle dans l'assurance de prédictions de haute qualité.

Conclusion

En résumé, DiffRect présente une approche prometteuse face aux défis rencontrés dans la segmentation d'images médicales semi-supervisée. En abordant la dépendance aux pseudo-étiquettes et en capturant mieux les distributions d'étiquettes, ce modèle démontre un potentiel d'améliorations significatives en précision de segmentation. Alors que l'imagerie médicale continue d'évoluer, des modèles comme DiffRect joueront un rôle crucial pour s'assurer que les médecins puissent compter sur des segmentations précises pour de meilleurs résultats diagnostiques et thérapeutiques.

Source originale

Titre: DiffRect: Latent Diffusion Label Rectification for Semi-supervised Medical Image Segmentation

Résumé: Semi-supervised medical image segmentation aims to leverage limited annotated data and rich unlabeled data to perform accurate segmentation. However, existing semi-supervised methods are highly dependent on the quality of self-generated pseudo labels, which are prone to incorrect supervision and confirmation bias. Meanwhile, they are insufficient in capturing the label distributions in latent space and suffer from limited generalization to unlabeled data. To address these issues, we propose a Latent Diffusion Label Rectification Model (DiffRect) for semi-supervised medical image segmentation. DiffRect first utilizes a Label Context Calibration Module (LCC) to calibrate the biased relationship between classes by learning the category-wise correlation in pseudo labels, then apply Latent Feature Rectification Module (LFR) on the latent space to formulate and align the pseudo label distributions of different levels via latent diffusion. It utilizes a denoising network to learn the coarse to fine and fine to precise consecutive distribution transportations. We evaluate DiffRect on three public datasets: ACDC, MS-CMRSEG 2019, and Decathlon Prostate. Experimental results demonstrate the effectiveness of DiffRect, e.g. it achieves 82.40\% Dice score on ACDC with only 1\% labeled scan available, outperforms the previous state-of-the-art by 4.60\% in Dice, and even rivals fully supervised performance. Code is released at \url{https://github.com/CUHK-AIM-Group/DiffRect}.

Auteurs: Xinyu Liu, Wuyang Li, Yixuan Yuan

Dernière mise à jour: 2024-07-13 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.09918

Source PDF: https://arxiv.org/pdf/2407.09918

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires