Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo# Vision par ordinateur et reconnaissance des formes# Apprentissage automatique

Modèles de Deep Learning pour la détection du cancer du sein

Cette étude examine des modèles pour détecter le cancer du sein dans des images d'histopathologie.

― 6 min lire


Modèles d'IA pour laModèles d'IA pour ladétection du cancerdu sein.profond sur l'identification du cancerAnalyser l'impact de l'apprentissage
Table des matières

Le cancer du sein est un gros souci de santé qui touche pas mal de gens, surtout des femmes. Ça peut aussi arriver aux hommes. Détecter et traiter le cancer du sein tôt, c'est super important, car ça augmente beaucoup les chances de succès et réduit le risque de mort.

Les images d'Histopathologie sont des photos microscopiques des tissus mammaires qui aident les docs à savoir si le cancer est là. Ces images donnent des infos cruciales sur les cellules dans le sein. Avec les avancées technologiques, utiliser le deep learning, un type d'intelligence artificielle, devient courant dans la santé. Ce truc peut aider à identifier et diagnostiquer le cancer du sein de manière plus précise.

Vue d’ensemble de l'étude

Dans notre étude, on a examiné plusieurs modèles de deep learning pour voir lequel est le meilleur pour détecter le cancer du sein à partir d'un jeu de données d'images d'histopathologie. On s'est concentrés sur quatre modèles pré-entraînés : ResNet50, ResNet101, VGG16 et VGG19. On a utilisé un total de 2 453 images, classées en deux groupes : celles avec carcinome canalaire invasif (CCI) et celles sans.

L'importance de la détection précoce

Le cancer du sein est l'un des cancers les plus fréquents chez les femmes. Rien qu'aux États-Unis, des milliers de nouveaux cas sont diagnostiqués chaque année. La Société américaine du cancer a rapporté des stats alarmantes, estimant qu'en 2022, plus de 287 000 nouveaux cas étaient attendus, avec près de 44 000 décès.

Détecter le cancer du sein tôt peut mener à des traitements réussis. Des dépistages réguliers et l'utilisation de techniques d'imagerie avancées peuvent aider à repérer les changements dans le tissu mammaire avant que le cancer ne se propage. Diverses méthodes, comme les radiographies, IRM et échographies, sont utilisées pour détecter le cancer du sein. Parmi elles, les images d'histopathologie sont particulièrement précieuses car elles offrent des aperçus détaillés sur le comportement des cellules dans le sein.

Techniques de détection du cancer du sein

Il existe plein de techniques pour trouver le cancer du sein. Les méthodes courantes incluent :

  • Mammographie par rayons X : Un test standard pour le cancer du sein.
  • Échographie : Utilise des ondes sonores pour créer des images du tissu mammaire.
  • IRM : Fournit des images détaillées du sein.
  • Histopathologie : Analyse des échantillons de tissus pour identifier des cellules cancéreuses.

Le deep learning est un outil puissant dans ce domaine, permettant une meilleure Précision pour reconnaître les motifs dans les images. En entraînant ces modèles de deep learning sur un ensemble d'images d'histopathologie, on a voulu identifier lequel pourrait détecter le cancer du sein le plus efficacement.

Modèles utilisés dans cette étude

Modèles ResNet

ResNet signifie Réseau Résiduel. Il est conçu pour aider à l'entraînement des réseaux profonds grâce à des connexions de raccourci qui sautent des couches, ce qui facilite l'apprentissage du modèle.

  • ResNet50 : Ce modèle a 50 couches et est bien considéré pour sa capacité à apprendre à partir de données complexes.
  • ResNet101 : Cette version a 101 couches, permettant un apprentissage plus profond mais peut aussi compliquer l'entraînement.

Modèles VGG

Les modèles VGG, nommés d'après le Visual Geometry Group, sont une autre série de modèles basés sur le deep learning. Ils sont structurés pour exceller dans les tâches de classification d'images.

  • VGG16 : Contient 16 couches et est connu pour son efficacité à reconnaître des images.
  • VGG19 : Une version plus complexe, avec 19 couches, visant à améliorer la performance de VGG16.

Collecte et traitement des données

On a récupéré notre jeu de données à partir d'une source publique. Il se compose d'images d'histopathologie scannées en haute résolution. Les images ont été triées en deux groupes selon qu'elles montrent ou non des signes de CCI.

Prétraitement

Avant d'utiliser les images pour entraîner les modèles, on a dû les prétraiter. Cette étape consiste à nettoyer les images et à les préparer pour l'analyse. Les techniques de prétraitement courantes incluent :

  • Redimensionnement des images : Ajuster la taille des images pour les rendre uniformes.
  • Dénombrement : Enlever le bruit indésirable des images.
  • Segmentation : Focaliser sur des zones spécifiques montrant le CCI.

Ces processus garantissent que les modèles peuvent apprendre efficacement à partir des images.

Entraînement et validation des modèles

On a divisé le jeu de données en trois sections : 80 % pour l'entraînement, 10 % pour les tests et 10 % pour la validation. Cette approche aide à s'assurer que les modèles sont bien entraînés tout en étant capables d'évaluer leur précision avec des données séparées.

Chacun des quatre modèles qu'on a testés a passé un entraînement, utilisant les images qu'on a préparées. Après l'entraînement, on a évalué la performance des modèles sur plusieurs indicateurs, notamment :

  • Précision : À quelle fréquence le modèle identifie correctement le cancer du sein.
  • Aire sous la courbe (AUC) : Une mesure de la capacité du modèle à distinguer les cas cancéreux et non cancéreux.
  • Rappel : Cela montre combien de cas réels de cancer ont été identifiés par le modèle.
  • Perte : Une mesure de la performance du modèle, avec des valeurs plus basses indiquant une meilleure performance.

Résultats et discussion

Les performances des modèles ont montré que ResNet50 était le plus efficace pour détecter le cancer du sein. Il a atteint une précision de 90,2 %, une AUC de 90,0 % et un rappel de 94,7 %. La valeur de perte pour ResNet50 était également basse à 3,5 %, indiquant une meilleure performance globale par rapport aux autres modèles.

Bien que ResNet101 et VGG16 aient également bien performé, leurs scores n'étaient pas aussi élevés que ceux de ResNet50. VGG19 a eu la performance la plus basse parmi les quatre modèles, avec une précision de 83,3 % et une AUC de 83,0 %. Cela montre que tous les modèles complexes ne sont pas forcément les meilleurs pour chaque tâche.

Conclusion et perspectives d'avenir

Le cancer du sein reste une préoccupation majeure pour beaucoup, mais avec les bons outils, la détection précoce et précise est à portée de main. Notre étude a montré qu'en utilisant des modèles de deep learning, spécifiquement ResNet50, on peut améliorer significativement la détection du cancer du sein à partir d'images d'histopathologie.

Pour l'avenir, d'autres recherches peuvent impliquer l'utilisation de Jeux de données plus vastes et de modèles plus avancés pour améliorer les capacités de détection. Le machine learning continue d'évoluer, et au fur et à mesure que plus de données deviennent disponibles, on peut s'attendre à des améliorations dans la façon dont le cancer du sein est diagnostiqué et traité.

Source originale

Titre: A Deep Analysis of Transfer Learning Based Breast Cancer Detection Using Histopathology Images

Résumé: Breast cancer is one of the most common and dangerous cancers in women, while it can also afflict men. Breast cancer treatment and detection are greatly aided by the use of histopathological images since they contain sufficient phenotypic data. A Deep Neural Network (DNN) is commonly employed to improve accuracy and breast cancer detection. In our research, we have analyzed pre-trained deep transfer learning models such as ResNet50, ResNet101, VGG16, and VGG19 for detecting breast cancer using the 2453 histopathology images dataset. Images in the dataset were separated into two categories: those with invasive ductal carcinoma (IDC) and those without IDC. After analyzing the transfer learning model, we found that ResNet50 outperformed other models, achieving accuracy rates of 90.2%, Area under Curve (AUC) rates of 90.0%, recall rates of 94.7%, and a marginal loss of 3.5%.

Auteurs: Md Ishtyaq Mahmud, Muntasir Mamun, Ahmed Abdelgawad

Dernière mise à jour: 2023-04-11 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2304.05022

Source PDF: https://arxiv.org/pdf/2304.05022

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires