Avancées dans la segmentation d'images médicales grâce à l'apprentissage profond
De nouvelles techniques améliorent la précision de la segmentation dans les radiographies thoraciques.
― 8 min lire
Table des matières
Les récents développements en intelligence artificielle, surtout en deep learning, ont vraiment amélioré la façon dont on analyse les images médicales. Ça a eu un impact énorme sur des tâches comme la Segmentation d’images, qui consiste à identifier les différentes parties d’une image. Par exemple, l'IA peut aider à segmenter des lésions mammaires, classifier les différents stades du cancer du poumon, caractériser des types de tissus, et détecter l'agrandissement du cœur.
En radiologie, la segmentation est super importante pour diagnostiquer et traiter des maladies. Mais les techniques de deep learning ont besoin de beaucoup de données d'entraînement pour bien fonctionner. Cette nécessité de grandes quantités de données a mené à la création de nouvelles méthodes pour la segmentation d'images. Une innovation majeure dans ce domaine est le réseau de neurones entièrement convolutifs (FCN), qui permet une segmentation sémantique détaillée en traitant les images dans leur ensemble plutôt que par petits morceaux. Une version améliorée du FCN, le modèle U-Net, capture plus de contexte dans les images avec moins d'échantillons d'entraînement, ce qui en fait un choix populaire pour segmenter des images médicales provenant de sources variées comme les radiographies, les IRM et les tomodensitogrammes.
Avant que les techniques de deep learning ne deviennent courantes, l'amélioration d’image jouait un rôle vital dans l'analyse des images médicales. Une technique d'amélioration populaire est l'égalisation d'histogramme adaptative, qui fonctionne en divisant les images en sections plus petites pour améliorer le contraste local. Une version plus avancée connue sous le nom d'égalisation d'histogramme adaptatif à contraste limité (CLAHE) a été développée pour contrôler le contraste et réduire le bruit. Des études récentes ont montré que le CLAHE pouvait vraiment apporter des bénéfices aux tâches de deep learning, comme prédire les stades de la maladie oculaire diabétique et classifier des infections comme le COVID-19.
Dans notre recherche, on a introduit une nouvelle méthode appelée ps-KDE pour le prétraitement des images. Cette technique vise principalement à améliorer les résultats de segmentation dans les radiographies thoraciques. Ps-KDE offre trois avantages clés : 1) elle propose un moyen simple et adaptable d'augmenter les données d'entraînement, 2) elle montre son efficacité dans la segmentation précise des organes importants dans les radiographies thoraciques, et 3) elle aide à évaluer les algorithmes de segmentation en utilisant des cartes thermiques générées.
Données et Méthodes
On a utilisé une base de données publique composée de 247 radiographies thoraciques, collectées dans plusieurs institutions au Japon et aux États-Unis. Les images ont été fournies par une organisation radiologique et comprenaient des annotations manuelles soulignant des structures anatomiques spécifiques. Chaque image est en format niveaux de gris et possède cinq masques binaires mettant en évidence le cœur, le poumon gauche, le poumon droit, la clavicule gauche et la clavicule droite.
Le dataset incluait un mélange d’individus avec et sans nodules pulmonaires. La répartition par sexe montrait 68 hommes et 86 femmes parmi les patients avec nodules, tandis que 51 hommes et 42 femmes n'avaient pas de nodules pulmonaires. L'âge moyen des patients avec nodules était de 60 ans.
Notre étude respectait les normes éthiques, car on n'a utilisé que des données publiquement disponibles, qui ne nécessitaient pas d'examen par des comités d'éthique. On s'est assuré de ne pas avoir d'informations identifiables sur les participants.
Augmentation des Données
Pour entraîner efficacement les modèles de deep learning, de grands jeux de données sont cruciaux. Quand il n'y a pas de jeux de données étendus, l'augmentation des données devient essentielle pour éviter le surapprentissage. Dans notre étude, cinq types d'augmentation ont été appliqués aux images originales et à leurs masques correspondants pour s'assurer que les structures anatomiques étaient représentées avec précision. Les augmentations incluaient des rotations, des retournements, des zooms, et des redimensionnements.
Toutes les images ont été redimensionnées à 256x256 pixels et normalisées sur une plage de 0 à 1 pour aider les modèles à s'entraîner plus rapidement et de manière cohérente.
Prétraitement d’Image
Égalisation d'Histogramme Adaptative à Contexte Limité (CLAHE)
L'égalisation d'histogramme est une méthode courante utilisée pour améliorer le contraste des images. Elle redistribue les valeurs de pixels pour créer un aspect plus uniforme. Cependant, comme la plupart des images utilisent déjà une large gamme d'intensité, l'efficacité de cette méthode peut être limitée. Pour surmonter ce problème, l'égalisation d'histogramme adaptative (AHE) divise une image en sections plus petites pour une amélioration indépendante.
CLAHE améliore l’AHE en limitant le contraste dans certaines zones, ce qui aide à réduire le bruit tout en améliorant les détails locaux. Cette méthode a été appliquée avec succès dans plusieurs études, montrant des bénéfices significatifs.
Substitution de Pixel par Estimation de Densité de Noyau (ps-KDE)
Lors de notre première analyse des données, on a remarqué que les distributions de valeurs de pixels différaient entre les organes. On a utilisé l'estimation de densité de noyau (KDE) pour créer une fonction de densité de probabilité (PDF) pour les valeurs de pixels dans chaque organe. En remplaçant les valeurs de pixels d'origine par leur densité correspondante, on cherchait à obtenir une méthode de prétraitement plus uniforme et efficace.
Cette méthode nous a permis de remplacer les valeurs de pixels par des fréquences, donnant des valeurs plus significatives aux valeurs de pixels couramment rencontrées dans chaque organe.
Développement du Modèle
Pour réaliser la segmentation des radiographies thoraciques, on a utilisé l'architecture U-Net, qui est bien adaptée aux tâches de segmentation. Le réseau suit une structure avec un chemin de contraction et un chemin d'expansion. Le chemin de contraction aide à extraire les caractéristiques, tandis que le chemin d'expansion restaure la taille d'entrée d'origine.
On a implémenté le modèle en utilisant un package Python qui intègre le design U-Net avec un backbone ResNet34, connu pour ses capacités en deep learning. La combinaison de ces deux modèles vise à améliorer la performance de segmentation.
Pour entraîner le modèle efficacement, on a utilisé diverses fonctions de perte qui aident le modèle à apprendre de ses prédictions. Ces fonctions aident à mesurer à quel point la sortie du modèle correspond aux vraies données, guidant ainsi l'amélioration de sa performance au fil du temps.
Évaluation du Modèle et Interprétabilité
Pour évaluer les performances de notre modèle, on a utilisé des métriques comme l'intersection sur l'union (IoU) et le coefficient de Dice, qui nous aident à mesurer à quel point les segments prédit alignent avec les données réelles.
Après l’entraînement, on a examiné la performance du modèle en utilisant les images originales, les images traitées par CLAHE, et les images traitées avec notre nouvelle méthode ps-KDE. Cette analyse nous a aidés à comparer l’efficacité de différentes techniques de prétraitement et à comprendre leur impact sur les tâches de segmentation.
Les résultats ont montré que les modèles entraînés avec CLAHE avaient une meilleure performance globale par rapport à ceux utilisant ps-KDE. Cependant, ps-KDE a montré sa force dans certains domaines, mettant en avant le potentiel des approches combinées dans de futures études.
Les cartes thermiques générées ont offert des aperçus sur la confiance du modèle et les zones nécessitant un examen plus approfondi. On a noté que les modèles affichaient des motifs cohérents, indiquant une segmentation fiable, en particulier autour des grandes structures comme les poumons et le cœur.
Directions Futures
Bien que nos découvertes soient prometteuses, des limitations ont été notées. Notre dataset était relativement petit pour des applications de deep learning, et on n'a entraîné que pour un nombre limité d'époques à cause de contraintes de ressources. Par conséquent, augmenter à la fois la taille du dataset et le nombre d'époques d'entraînement pourrait donner de meilleurs résultats à l'avenir.
De plus, notre étude a utilisé des images PNG alors que les pratiques cliniques s'appuient généralement sur le format DICOM. Pour augmenter l'applicabilité de nos découvertes dans des contextes réels, une adaptation supplémentaire de nos modèles est nécessaire pour accommoder les données DICOM. S'attaquer à ces lacunes aidera à rapprocher la recherche et l'application dans les flux de travail cliniques.
En conclusion, notre travail met en avant le potentiel de la méthode ps-KDE pour améliorer la précision de segmentation dans les radiographies thoraciques. Bien qu'on ait fait des progrès significatifs dans l'amélioration des capacités de segmentation, une exploration et une validation supplémentaires sont nécessaires pour réaliser pleinement les avantages de cette nouvelle technique.
Titre: Enhancing Semantic Segmentation in Chest X-Ray Images through Image Preprocessing: ps-KDE for Pixel-wise Substitution by Kernel Density Estimation
Résumé: BackgroundDeep-learning-based semantic segmentation algorithms, in combination with image preprocessing techniques, can reduce the need for human annotation and advance disease classification. Among established preprocessing techniques, CLAHE has demonstrated efficacy in enhancing the segmentations algorithms across various modalities. MethodThis study proposes a novel preprocessing technique, ps-KDE, to investigate its impact on deep learning algorithms to segment major organs in posterior-anterior chest X-rays. Ps-KDE augments image contrast by substituting pixel values based on their normalized frequency across all images. Our approach employs a U-Net architecture with ResNet34 (pre-trained on ImageNet) serving as the decoder. Five separate models are trained to segment the heart, left lung, right lung, left clavicle, and right clavicle. ResultsThe model trained to segment the left lung using ps-KDE achieved a Dice score of 0.780 (SD=0.13), while that trained on CLAHE achieved a Dice score of 0.717 (SD=0.19), p
Auteurs: Zifan Gu, Y. Wang, Y. Guo, Z. Wang, L. Yu, Y. Yan
Dernière mise à jour: 2024-02-17 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871
Source PDF: https://www.medrxiv.org/content/10.1101/2024.02.15.24302871.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.