Améliorer la détection des noyaux avec CycleGAN et le filtrage DCT
Une nouvelle méthode améliore les images de noyaux synthétiques pour de meilleures performances de segmentation.
― 8 min lire
Table des matières
- Détection des Noyaux dans les Images de Microscopie
- Le Rôle du Filtrage DCT
- Création de Masques Synthétiques
- Configuration d'Évaluation
- Évaluation de la Fidélité des Images
- Résultats Qualitatifs des Images Synthétiques
- Performance de Segmentation sur DSB
- Performance de Segmentation sur BBBC039v1
- Conclusion
- Source originale
- Liens de référence
Annoter les noyaux dans les images de microscopie peut être galère et ça prend un temps fou. Ça demande souvent des connaissances d'expert et ça peut mener à des différences de résultats selon qui fait le travail. Ce problème est particulièrement visible en microscopie à fluorescence. Les réseaux génératifs, comme CycleGAN, peuvent créer des images de microscopie synthétiques à partir de masques donnés, ce qui aide à produire plus de données d'entraînement. Cependant, des tentatives passées ont montré qu'il y avait des incohérences entre le masque et l'image générée. Ça vient en partie du fait que CycleGAN a tendance à cacher des détails importants de l'image pour faciliter la reconstruction.
Dans ce travail, on propose une méthode pour améliorer les images produites par CycleGAN en éliminant des raccourcis cachés, appelés stéganographie. On applique une technique appelée filtrage passe-bas basée sur la Transformée Cosinus Discrète (DCT). L'objectif est d'augmenter la cohérence entre les images générées et les masques originaux. En testant nos ensembles de données synthétiques pour une tâche de segmentation de noyaux, on a constaté des améliorations de performance par rapport à l'approche CycleGAN standard.
Détection des Noyaux dans les Images de Microscopie
Détecter les noyaux et les structures cellulaires dans les images de microscopie est courant en analyse d'image biomédicale. Ça nous donne un aperçu de divers processus cellulaires. Alors que les réseaux de neurones profonds peuvent automatiser cette détection, ils nécessitent souvent beaucoup de données étiquetées manuellement. Cette étiquetage manuel n'est pas seulement chronophage mais peut aussi varier en qualité à cause de plein de facteurs, comme des noyaux qui se chevauchent ou des artefacts dans les images.
Les méthodes non supervisées peuvent être une alternative. Il y a généralement deux approches : l'une est une méthode en deux étapes où un modèle génératif crée des ensembles de données synthétiques pour entraîner un Réseau de segmentation supervisé. L'autre est une méthode en une étape où un modèle génératif fait directement la segmentation. Les deux méthodes utilisent des modèles génératifs entraînés avec de vraies images de microscopie et des masques synthétiques, qui peuvent être créés par des méthodes de synthèse plus simples.
CycleGAN est une architecture souvent utilisée dans ce contexte. Elle utilise plusieurs générateurs et discriminateurs pour traduire entre différents domaines d'images. La perte de cohérence cyclique garantit que l'image conserve son contenu en passant d'un domaine à un autre. Cependant, ça ne garantit pas toujours que le contenu des images originales et générées soit en accord.
Pour essayer de minimiser la perte de cohérence cyclique, les générateurs intègrent parfois une version compressée de l'image d'entrée, créant une reconstruction parfaite sans transférer le contenu essentiel. Ce processus a été appelé stéganographie CycleGAN, où le générateur cache des informations du discriminateur, menant à un décalage entre les images originales et générées.
Le Rôle du Filtrage DCT
Pour régler le problème de la stéganographie, on utilise le filtrage DCT. Cette technique est bien connue en compression d'image, notamment dans le format JPEG. En éliminant les motifs de pixels à haute fréquence que les CycleGAN utilisent pour cacher des informations, on vise à produire des images plus claires et plus cohérentes.
On met à zéro les coefficients de haute fréquence dans les images générées en utilisant DCT. Bien que ce filtrage puisse enlever certains détails réels dans les images, on pense que ce n'est pas crucial pour nos besoins. Après filtrage, on pourrait encore voir quelques écarts entre les masques d'entrée et les images de noyaux générées, mais on s'assure que les masques cyclés reflètent fidèlement le contenu des images générées.
Les images filtrées servent de données d'entraînement pour des réseaux qui segmentent les noyaux. Notre approche montre une augmentation de la Précision lorsque le filtrage DCT est appliqué, améliorant ainsi la relation entre le masque et les images générées.
Création de Masques Synthétiques
Pour produire des masques synthétiques, on peut utiliser des ellipses pour modéliser les formes des noyaux. Bien que ce soit efficace, il faut faire des ajustements minutieux pour que ces masques synthétiques correspondent précisément aux vraies images de microscopie. S'il y a un grand écart entre les distributions synthétiques et réelles, le CycleGAN a du mal à apprendre efficacement.
Lors de la création des masques, on varie aléatoirement les paramètres pour assurer la diversité. Cela inclut l'échantillonnage pour la taille des axes, l'excentricité et l'angle de rotation. Les images de masque finales permettent aux noyaux de se toucher mais jamais de se chevaucher, gardant la représentation réaliste.
Configuration d'Évaluation
Pour voir à quel point notre filtrage DCT est efficace, on a généré des ensembles de données synthétiques en utilisant CycleGAN avec et sans le filtrage, ainsi qu'en comparant d'autres méthodes de la littérature. Après l'entraînement, on a utilisé ces images et masques synthétiques pour former un réseau de segmentation, StarDist. On a testé le réseau de segmentation entraîné sur des données réelles pour évaluer la performance.
Dans nos expériences avec le Data Science Bowl (DSB) 2018 Nuclei Dataset et le dataset BBBC039v1, on a trouvé que notre CycleGAN proposé avec filtrage DCT surpassait le CycleGAN standard, ce qui a conduit à des scores de précision améliorés et à moins de faux positifs.
Évaluation de la Fidélité des Images
Bien que l'objectif principal de nos méthodes soit d'améliorer la segmentation des noyaux, on a aussi évalué la qualité des images générées. En comparant les données générées aux images originales en utilisant la Distance Fréchet Inception (FID), on a découvert que le CycleGAN combiné avec le filtrage DCT avait le meilleur score, indiquant une fidélité d'image améliorée.
Résultats Qualitatifs des Images Synthétiques
En examinant les images générées, on a remarqué des écarts par rapport aux masques d'entrée originaux. Bien que cela puisse sembler négatif, ça peut être bénéfique tant que les changements sont reflétés dans les masques cyclés. Notre filtrage DCT proposé a montré que la stéganographie était efficacement réduite, résultant en masques cyclés s'accordant étroitement avec les images générées.
En revanche, d'autres méthodes comme le débruitage et l'injection de bruit ont réduit un peu de la stéganographie mais n'étaient pas aussi efficaces. Les images produites par injection de bruit avaient plus de variance, ce qui a conduit à un résultat moins stable pour les tâches de segmentation.
Performance de Segmentation sur DSB
Le réseau de segmentation testé sur le dataset DSB a montré des améliorations significatives lorsqu'il a été entraîné sur des ensembles de données synthétiques générés par le CycleGAN avec filtrage DCT. Notre approche a dépassé le CycleGAN standard, montrant une précision plus élevée pour des seuils plus faciles et plus difficiles.
Performance de Segmentation sur BBBC039v1
Pour le dataset BBBC039v1, toutes les méthodes ont montré une haute précision. La méthode de filtrage DCT a été la plus performante, montrant un léger avantage sur les autres méthodes. La structure plus simple du dataset BBBC039v1 a conduit à des scores plus élevés sur toutes les métriques à cause de sa variabilité réduite.
Conclusion
Dans ce travail, on a proposé une nouvelle méthode pour attaquer le problème des informations cachées dans les images générées par CycleGAN. Notre approche de filtrage DCT a mené à une meilleure cohérence dans les images synthétiques et a finalement amélioré les performances sur les tâches de segmentation suivantes.
En se concentrant sur la création d'ensembles de données synthétiques avec un meilleur alignement entre les masques et les images générées, on a pu améliorer le processus d'apprentissage des réseaux impliqués. Cette recherche montre non seulement l'efficacité du filtrage DCT mais ouvre aussi la voie à d'autres explorations pour ajuster les CycleGAN à diverses applications.
Les travaux futurs pourraient explorer d'autres méthodes pour améliorer les capacités de segmentation des CycleGAN. Cela inclut potentiellement l'adaptation de l'architecture pour générer directement des masques d'instances au lieu de s'appuyer sur un post-traitement. Explorer comment l'approche de suppression de stéganographie pourrait être appliquée à d'autres tâches similaires pourrait avoir un impact plus large dans le domaine des réseaux génératifs.
Titre: Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN
Résumé: Annotating nuclei in microscopy images for the training of neural networks is a laborious task that requires expert knowledge and suffers from inter- and intra-rater variability, especially in fluorescence microscopy. Generative networks such as CycleGAN can inverse the process and generate synthetic microscopy images for a given mask, thereby building a synthetic dataset. However, past works report content inconsistencies between the mask and generated image, partially due to CycleGAN minimizing its loss by hiding shortcut information for the image reconstruction in high frequencies rather than encoding the desired image content and learning the target task. In this work, we propose to remove the hidden shortcut information, called steganography, from generated images by employing a low pass filtering based on the DCT. We show that this increases coherence between generated images and cycled masks and evaluate synthetic datasets on a downstream nuclei segmentation task. Here we achieve an improvement of 5.4 percentage points in the F1-score compared to a vanilla CycleGAN. Integrating advanced regularization techniques into the CycleGAN architecture may help mitigate steganography-related issues and produce more accurate synthetic datasets for nuclei segmentation.
Auteurs: Jonas Utz, Tobias Weise, Maja Schlereth, Fabian Wagner, Mareike Thies, Mingxuan Gu, Stefan Uderhardt, Katharina Breininger
Dernière mise à jour: 2023-08-03 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2308.01769
Source PDF: https://arxiv.org/pdf/2308.01769
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.