Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Interaction homme-machine

Automatiser la reconnaissance des motifs de maladies de la peau

Un nouveau système aide les dermatologues à identifier les motifs de la peau grâce à l'apprentissage automatique.

― 7 min lire


Analyse automatisée desAnalyse automatisée desmotifs de la peauproblèmes de peau.dermatologues à identifier lesL'apprentissage automatique aide les
Table des matières

En dermatologie, reconnaître et décrire correctement les maladies de la peau est super important pour un bon diagnostic. Avec l'augmentation des données d'imagerie, revoir les images manuellement devient impraticable. Cet article parle d'une méthode pour automatiser la découverte de motifs importants dans les images de peau en utilisant des algorithmes informatiques et de l'apprentissage machine.

Contexte

La dermatoscopie est une technique utilisée pour examiner de plus près les lésions cutanées. Au fil des ans, de nombreux motifs associés à différentes conditions de peau ont été documentés. Traditionnellement, ces motifs étaient identifiés par des médecins qui passaient en revue les cas manuellement. Avec le nombre d'images qui augmente, cette approche manuelle engendre une charge de travail écrasante pour les professionnels de santé, rendant difficile le maintien de la précision.

Les réseaux de neurones, surtout un type appelé réseaux de neurones convolutifs (CNN), sont devenus des outils qui peuvent aider à classer les images médicales. Les recherches montrent que ces réseaux peuvent égaler, voire dépasser, la précision des dermatologues dans des environnements expérimentaux. Ils peuvent analyser les images et identifier des caractéristiques automatiquement, ce qui aide à la classification et à la récupération d'images.

Cette étude vise à créer un système automatisé qui extrait des motifs visuels significatifs des images dermatoscopiques de tumeurs cutanées. Cet outil devrait aider les professionnels de santé en fournissant des données interprétables pour le diagnostic.

Méthodologie

Collecte de données

L'étude a utilisé un dataset public existant connu sous le nom de HAM10000. Ce dataset contient des images de 10 015 lésions cutanées, avec des annotations sur leurs diagnostics et la disposition de la lésion. Au lieu d'analyser les images complètes, les chercheurs se sont concentrés sur de plus petites sections, appelées tuiles. En découpant les images en tuiles de 128x128 pixels, ils pouvaient isoler des caractéristiques spécifiques dans les lésions.

Au total, 29 420 tuiles ont été extraites pour analyse. Pour garantir une représentation équilibrée des différents diagnostics, une sélection aléatoire a été effectuée.

Entraînement du Réseau de neurones

Un type spécifique de réseau de neurones appelé VGG16 a été utilisé pour classer les tuiles de lésions cutanées en sept catégories de conditions cutanées. Le modèle a été entraîné en utilisant 70 % des tuiles totales tout en réservant 30 % pour les tests. Cet entraînement était conçu pour extraire des caractéristiques des tuiles plutôt que d'atteindre la précision maximale en prédiction.

Des techniques d'Augmentation de données ont été appliquées pendant l'entraînement pour créer de la diversité dans les données d'entrée. Ces techniques comprenaient la rotation et le retournement des images. Après l'entraînement, des caractéristiques ont été obtenues à partir des tuiles, ce qui a permis aux chercheurs d'analyser les images plus efficacement.

Regroupement des motifs

Pour trouver et regrouper des motifs similaires à partir des caractéristiques extraites, une technique de regroupement appelée k-means a été utilisée. K-means aide à identifier des regroupements naturels dans les données. Les chercheurs ont développé deux méthodes pour déterminer le nombre de clusters : la méthode du coude et une métrique de compacité sur mesure. La méthode du coude identifie les clusters en fonction de la variance, tandis que la métrique de compacité a été conçue pour affiner le regroupement en gardant les clusters pertinents et informatifs.

L'objectif était de conserver des clusters qui seraient significatifs pour l'interprétation humaine tout en minimisant l'inclusion de motifs redondants qui n'apportent pas de valeur.

Résultats

Les résultats ont révélé des conclusions distinctes des deux méthodes de regroupement. En utilisant la méthode du coude, une moyenne de 24,7 clusters a été créée pour chaque diagnostic, avec une part notable étant non informative. En revanche, la méthode de compacité a donné moins de clusters-une moyenne d'environ 13,4-et un pourcentage significativement plus bas de clusters non informatifs.

La plupart des clusters générés à partir de la méthode de compacité pouvaient être liés à des motifs diagnostiques bien connus issus de la littérature existante. Cela a indiqué que le modèle était capable d'identifier des traits visuels importants dans les lésions cutanées.

Implications pour la pratique clinique

La recherche a montré que l'analyse automatisée peut aider efficacement les cliniciens à identifier des motifs clés dans les lésions cutanées. Les clusters résultants servent d'outil pour les médecins et les chercheurs pour examiner et interpréter les motifs diagnostiques.

La métrique de compacité a montré un bon potentiel pour rationaliser la quantité de données présentées, ce qui est précieux dans un cadre clinique. Bien que l'exactitude du modèle à identifier des conditions spécifiques en tant qu'outil autonome ne soit pas garantie, il fournit une ressource complémentaire efficace.

Défis et limites

Malgré les avantages, l'étude a également rencontré des défis. La méthode a montré des limites dans la classification des conditions cutanées moins courantes, ce qui indique que des biais pourraient exister dans le dataset lié à de telles maladies. Cela souligne la nécessité pour les chercheurs de considérer la diversité des conditions lors de l'entraînement des algorithmes.

De plus, bien que trouver un seul motif pour décrire une lésion soit souvent insuffisant, la nécessité de plusieurs motifs montre la complexité des manifestations des maladies de la peau. Cela peut indiquer que les études futures devraient se concentrer sur la combinaison de plusieurs caractéristiques lors de l'analyse des lésions cutanées.

Directions futures

Vu les résultats prometteurs, il est essentiel pour les futures recherches d'élargir l'application de cette méthode. Tester le modèle sur des tumeurs non pigmentées et d'autres démographies, y compris les types de peau plus foncés, fournirait une vue plus complète de ses capacités.

De plus, les chercheurs devraient explorer comment ces techniques peuvent être utilisées à travers diverses modalités d'imagerie, y compris la dermatopathologie et les images cliniques. Cela pourrait améliorer considérablement la reconnaissance des motifs dans des applications médicales plus larges et améliorer les processus diagnostiques.

Conclusion

En conclusion, le système automatisé développé dans cette étude montre un potentiel significatif pour aider les dermatologues à reconnaître des motifs importants de la peau. En utilisant l'apprentissage machine et des techniques de regroupement avancées, les professionnels de santé peuvent devenir plus efficaces dans le diagnostic des conditions cutanées et ainsi améliorer les soins aux patients.

Les résultats soulignent l'importance d'intégrer la technologie dans les pratiques médicales, ce qui peut alléger la charge de surcharge de données et améliorer la qualité des processus diagnostics en dermatologie. À mesure que le domaine évolue, de telles méthodes pourraient finalement devenir une partie intégrante de la pratique courante, changeant fondamentalement la façon dont les maladies de la peau sont diagnostiquées et traitées.

Source originale

Titre: Automated dermatoscopic pattern discovery by clustering neural network output for human-computer interaction

Résumé: Background: As available medical image datasets increase in size, it becomes infeasible for clinicians to review content manually for knowledge extraction. The objective of this study was to create an automated clustering resulting in human-interpretable pattern discovery. Methods: Images from the public HAM10000 dataset, including 7 common pigmented skin lesion diagnoses, were tiled into 29420 tiles and clustered via k-means using neural network-extracted image features. The final number of clusters per diagnosis was chosen by either the elbow method or a compactness metric balancing intra-lesion variance and cluster numbers. The amount of resulting non-informative clusters, defined as those containing less than six image tiles, was compared between the two methods. Results: Applying k-means, the optimal elbow cutoff resulted in a mean of 24.7 (95%-CI: 16.4-33) clusters for every included diagnosis, including 14.9% (95% CI: 0.8-29.0) non-informative clusters. The optimal cutoff, as estimated by the compactness metric, resulted in significantly fewer clusters (13.4; 95%-CI 11.8-15.1; p=0.03) and less non-informative ones (7.5%; 95% CI: 0-19.5; p=0.017). The majority of clusters (93.6%) from the compactness metric could be manually mapped to previously described dermatoscopic diagnostic patterns. Conclusions: Automatically constraining unsupervised clustering can produce an automated extraction of diagnostically relevant and human-interpretable clusters of visual patterns from a large image dataset.

Auteurs: Lidia Talavera-Martinez, Philipp Tschandl

Dernière mise à jour: 2023-09-15 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.08533

Source PDF: https://arxiv.org/pdf/2309.08533

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires