Avancées en histopathologie grâce aux techniques d'apprentissage profond
Utiliser l'apprentissage profond pour améliorer la classification des maladies en histopathologie.
― 6 min lire
Table des matières
La Histopathologie est un domaine qui étudie les maladies en regardant des tissus au microscope. Les médecins et spécialistes analysent ces tissus pour identifier différentes conditions et maladies. Récemment, la technologie a fait de grands progrès pour aider dans ces tâches, surtout grâce à l'Apprentissage profond. L'apprentissage profond est une partie de l'intelligence artificielle qui apprend aux ordinateurs à reconnaître des motifs dans les données. Ça inclut la reconnaissance de caractéristiques dans les images, ce qui peut améliorer le diagnostic et le traitement.
Le défi des données
Un gros défi en histopathologie, c'est le besoin d'une grande quantité de données étiquetées pour entraîner les modèles d'apprentissage profond. Étiqueter les données est non seulement long, mais aussi cher. Ça nécessite des professionnels compétents, comme des pathologistes, pour étiqueter correctement les échantillons de tissus. En plus, certaines conditions sont assez rares, donc il n'y a pas beaucoup de données disponibles pour entraîner ces modèles efficacement. Avoir des données limitées augmente le risque de surapprentissage, où un modèle apprend à bien performer sur les données d'entraînement mais échoue à se généraliser sur de nouvelles données.
Une nouvelle approche
Pour résoudre ces problèmes, on peut utiliser un seul modèle d'apprentissage profond qui a déjà été entraîné sur de gros jeux de données pour extraire des caractéristiques importantes d'images nouvelles. Ce modèle aide à convertir les images en un format plus simple appelé Embeddings. Ces embeddings contiennent des informations importantes sur les images et sont beaucoup plus faciles à manipuler. Après cette conversion, de plus petits modèles, appelés têtes de classification, peuvent être entraînés pour effectuer des tâches spécifiques comme détecter certaines maladies.
Utiliser cette méthode a plusieurs avantages :
- Efficacité : On peut utiliser le même modèle entraîné pour différentes tâches.
- Moins de données nécessaires : Les petits modèles demandent moins de données étiquetées pour s'entraîner.
- Entraînement plus rapide : Les petits modèles peuvent être entraînés beaucoup plus rapidement.
Processus de sélection du backbone
Pour assurer la meilleure performance, on doit choisir le bon modèle de backbone qui extraira efficacement les caractéristiques. On a créé un jeu de données constitué de milliers d'images de histopathologie mammaire. Ce jeu de données nous aide à évaluer différents modèles de backbone. En comparant divers modèles, on a identifié celui qui fonctionne le mieux pour les images d'histopathologie.
Dans nos expériences, on a trouvé que les backbones entraînés sur des jeux de données généraux comme ImageNet avaient souvent de meilleures performances que ceux entraînés spécifiquement sur des images médicales. Cette découverte suggère que la façon dont les modèles ont été entraînés affecte beaucoup leur performance dans des tâches spécifiques.
Tâches de classification
On a appliqué notre approche à trois tâches de classification principales :
- Microcalcifications : Ce sont de petits dépôts de calcium dans les tissus qui peuvent indiquer un cancer du sein.
- Métastases des ganglions lymphatiques : Ça consiste à déterminer si le cancer s'est propagé aux ganglions lymphatiques.
- Mitoses : Ça se réfère au processus de division cellulaire et est important pour comprendre le comportement des tumeurs.
Pour chacune de ces tâches, on a entraîné nos têtes de classification en utilisant les embeddings générés par notre backbone sélectionné. En utilisant des embeddings à plusieurs niveaux de zoom, on pouvait capturer plus d'informations, ce qui aide à améliorer la performance du modèle.
Résultats des tâches de classification
Notre méthode a montré des améliorations claires dans toutes les tâches :
- Pour les microcalcifications, il y a eu une augmentation de 29,1 % de précision.
- Pour la détection des métastases des ganglions lymphatiques, on a vu une augmentation de 12,5 %.
- Dans la classification des mitoses, notre méthode a amélioré la précision de 15,0 %.
Ces améliorations montrent que l'utilisation d'embeddings profonds et la sélection soignée des backbones peuvent vraiment aider dans les tâches de classification en histopathologie.
Avantages de l'apprentissage de caractéristiques profondes
La méthode d'apprentissage de caractéristiques profondes a plusieurs avantages clés :
- Temps d'entraînement plus courts : Au lieu de prendre des heures, l'entraînement peut maintenant prendre juste quelques minutes.
- Meilleure performance : Nos modèles surpassent les approches traditionnelles d'apprentissage profond, surtout quand ils sont entraînés sur des petits jeux de données.
- Flexibilité avec plusieurs entrées : Ça peut gérer des images prises à différents niveaux de zoom efficacement, capturant à la fois le large contexte et les détails fins.
Défis d'augmentation d'image
Un des difficultés qu'on a rencontrées concernait l'augmentation d'image, qui est une technique utilisée pour améliorer le jeu de données d'entraînement en ajoutant plus de variations. Dans l'apprentissage profond traditionnel, ça se fait généralement à la volée pendant l'entraînement. Cependant, comme on travaille avec des embeddings, on ne peut pas augmenter les images de la même manière.
Pour contourner ce problème, on a appliqué du bruit directement sur les embeddings pendant l'entraînement. Cette approche s'est avérée efficace et peut aider les modèles à mieux performer. Les futurs travaux pourraient explorer d'autres méthodes pour augmenter les embeddings afin d'améliorer encore la performance.
Conclusion
En résumé, notre approche d'apprentissage de caractéristiques profondes offre une solution prometteuse pour les tâches de classification en histopathologie. En extrayant des caractéristiques significatives des images et en entraînant des modèles plus petits, on peut surmonter les défis liés à la rareté des données et au temps d'entraînement. Notre processus de sélection de backbone identifie clairement quels modèles performent le mieux, entraînant une meilleure précision dans l'identification des maladies. Les résultats de nos trois tâches soulignent l'efficacité de cette méthode pour améliorer la performance de classification.
Alors que la pathologie numérique continue d'évoluer, l'intégration de techniques d'apprentissage profond comme celles-ci peut améliorer la précision et l'efficacité diagnostiques, au bénéfice des patients et des fournisseurs de soins de santé. C'est un pas en avant significatif dans l'utilisation de la technologie pour améliorer les résultats de santé, et il reste encore beaucoup d'opportunités à explorer dans ce domaine.
Titre: Classification in Histopathology: A unique deep embeddings extractor for multiple classification tasks
Résumé: In biomedical imaging, deep learning-based methods are state-of-the-art for every modality (virtual slides, MRI, etc.) In histopathology, these methods can be used to detect certain biomarkers or classify lesions. However, such techniques require large amounts of data to train high-performing models which can be intrinsically difficult to acquire, especially when it comes to scarce biomarkers. To address this challenge, we use a single, pre-trained, deep embeddings extractor to convert images into deep features and train small, dedicated classification head on these embeddings for each classification task. This approach offers several benefits such as the ability to reuse a single pre-trained deep network for various tasks; reducing the amount of labeled data needed as classification heads have fewer parameters; and accelerating training time by up to 1000 times, which allows for much more tuning of the classification head. In this work, we perform an extensive comparison of various open-source backbones and assess their fit to the target histological image domain. This is achieved using a novel method based on a proxy classification task. We demonstrate that thanks to this selection method, an optimal feature extractor can be selected for different tasks on the target domain. We also introduce a feature space augmentation strategy which proves to substantially improve the final metrics computed for the different tasks considered. To demonstrate the benefit of such backbone selection and feature-space augmentation, our experiments are carried out on three separate classification tasks and show a clear improvement on each of them: microcalcifications (29.1% F1-score increase), lymph nodes metastasis (12.5% F1-score increase), mitosis (15.0% F1-score increase).
Auteurs: Adrien Nivaggioli, Nicolas Pozin, Rémy Peyret, Stéphane Sockeel, Marie Sockeel, Nicolas Nerrienet, Marceau Clavel, Clara Simmat, Catherine Miquel
Dernière mise à jour: 2023-03-09 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2303.05180
Source PDF: https://arxiv.org/pdf/2303.05180
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.