Présentation de Texture-AD : un nouveau benchmark pour la détection d'anomalies dans les usines
Le dataset Texture-AD comble les lacunes de données dans la détection d'anomalies industrielles.
Tianwu Lei, Bohan Wang, Silin Chen, Shurong Cao, Ningmu Zou
― 10 min lire
Table des matières
- Qu'est-ce qu'il y a dans le jeu de données Texture-AD ?
- Le défi de la détection d'anomalies
- Différences dans les méthodes d'évaluation
- Les contributions de Texture-AD
- L'importance des jeux de données connexes
- Détails du jeu de données
- Acquisition et annotation des données
- Tendances actuelles dans les méthodes de détection d'anomalies
- Évaluation des méthodes de détection
- Source originale
- Liens de référence
La Détection d'anomalies est un processus important dans les usines qui aide à identifier les problèmes dans les produits. Ce processus a évolué au fil des ans, mais il y a encore un fossé entre les données utilisées pour développer des méthodes de détection et les données réelles collectées pendant la production. Pour y remédier, un nouveau référentiel appelé Texture-AD a été créé. Ce jeu de données se concentre sur la détection d'anomalies basée sur la texture pour tester l'efficacité des méthodes de détection non supervisées dans des situations réelles.
Qu'est-ce qu'il y a dans le jeu de données Texture-AD ?
Le jeu de données Texture-AD est composé d'images de différents types de matériaux, y compris 15 types de tissus, 14 types de plaques de silicium et 10 types de plaques métalliques. Ces images ont été prises dans différentes conditions d'éclairage. Le jeu de données inclut également divers défauts pouvant survenir pendant le processus de fabrication, comme des rayures, des plis, des changements de couleur et de petites imperfections. Ces défauts sont souvent plus difficiles à détecter que ceux des jeux de données existants. Chaque zone défectueuse dans les images est marquée au niveau des pixels pour que différents modèles de détection puissent être évalués en profondeur.
Le défi de la détection d'anomalies
Dans un environnement d'usine automatisée, chaque ligne peut traiter de nombreux produits similaires, comme différentes couleurs de tissu ou types de métal. Bien que ces produits puissent partager certaines caractéristiques, ils peuvent avoir des différences significatives. De plus, de petits changements dans les conditions, comme l'éclairage ou les réglages de la caméra, peuvent rendre les données collectées pendant la production différentes de celles utilisées pour entraîner les méthodes de détection. Cela signifie que les algorithmes doivent être suffisamment robustes pour gérer ces différences.
Les humains sont naturellement bons pour repérer les similitudes et les différences dans les images, ainsi que pour détecter les défauts. Cependant, les jeux de données actuels pour former des méthodes de détection varient largement dans leurs réglages et la quantité de données fournies. Par exemple, il existe de nombreux jeux de données axés sur les textures de tissu, mais ils ne reflètent pas souvent les conditions de production réelles. De plus, à mesure que le secteur de la fabrication de puces se développe, il y a un plus grand besoin de jeux de données axés sur les défauts de plaques. Malheureusement, il n'existe pas beaucoup de jeux de données disponibles au public pour la détection des défauts de plaques.
Les jeux de données existants liés aux défauts métalliques ont également leurs limites. Ils se concentrent généralement sur des types de matériaux spécifiques et peuvent ne pas couvrir un large éventail de scénarios. Bien qu'il existe des jeux de données pour les fissures sur diverses surfaces, ils peuvent ne pas être adéquatement adaptés aux environnements industriels. Dans l'ensemble, les méthodes de détection modernes font face à des défis significatifs car les jeux de données actuellement disponibles ne sont pas idéaux pour des conditions réelles.
Différences dans les méthodes d'évaluation
Les projets de détection d'anomalies actuels testent souvent des algorithmes en utilisant des données qui ne représentent pas réellement les environnements de production. De nombreux algorithmes sont développés à partir de données dans des conditions idéales, ce qui peut conduire à des métriques de performance gonflées lorsqu'ils sont évalués sur des jeux de données plus contrôlés.
Le jeu de données Texture-AD vise à combler ce fossé en offrant des scénarios de formation et de test diversifiés. Alors que les jeux de données précédents comme MVTec se concentrent sur des catégories uniques de produits pendant la formation et le test, Texture-AD fournit un mélange de spécifications de produits différentes pour des tests plus difficiles. Les données d'entraînement consistent en des images sans défaut provenant de diverses sous-catégories, tandis que le jeu de test inclut à la fois des images défectueuses et sans défaut. Cette conception permet une évaluation plus précise des capacités des méthodes de détection à reconnaître les défauts dans des environnements de production.
Les contributions de Texture-AD
Le jeu de données Texture-AD offre plusieurs avantages clés :
Jeu de données complet : Ce jeu de données est spécifiquement conçu pour la détection d'anomalies non supervisée dans les environnements industriels. Il collecte une grande variété d'Images de haute qualité provenant de plusieurs sous-catégories à travers trois grandes catégories, ce qui en fait une ressource précieuse pour tester les méthodes de détection dans des conditions réelles.
Évaluation approfondie des méthodes : Le jeu de données permet une évaluation détaillée des méthodes existantes pour détecter les anomalies. Les chercheurs peuvent évaluer à quel point ces méthodes peuvent segmenter et classifier les images contenant des défauts.
Protocole d'évaluation bien conçu : Le jeu de données Texture-AD est accompagné d'un protocole d'évaluation qui peut comparer efficacement la performance des méthodes de détection d'anomalies dans des scénarios de développement réels.
L'importance des jeux de données connexes
Ces dernières années, divers jeux de données ont été créés pour la détection de défauts de surface, rendant les inspections manuelles moins nécessaires dans plusieurs industries, comme l'électronique, l'automobile et la machinerie. Les méthodes traditionnelles reposent souvent sur un traitement d'image de base et des caractéristiques conçues à la main, tandis que les avancées récentes ont privilégié les techniques d'apprentissage profond.
Cependant, les jeux de données existants ont leurs lacunes. Par exemple, le jeu de données DAGM2007 offre certaines informations, mais peut être trompeur en raison de générations artificielles qui ne reflètent pas complètement les problèmes réels. Le jeu de données AITEX, qui se concentre sur les textiles, vise à soutenir les applications d'apprentissage automatique et de vision par ordinateur, mais souffre d'un étiquetage de défauts peu clair et d'une variété de données limitée.
Plusieurs autres jeux de données existent, comme le WM-811K, qui traite des défauts de plaques mais manque de détails sur la texture. D'autres, comme la base de données NEU-surface-defect, se concentrent sur les défauts de bandes d'acier mais rencontrent des défis avec l'apparence des défauts et les variations d'éclairage. De nombreux jeux de données, y compris ceux pour la détection des fissures, ont également des difficultés avec la qualité de l'image et la complexité de l'arrière-plan.
Le jeu de données MVTec est populaire pour la détection d'anomalies non supervisée, fournissant des étiquettes de vérité de terrain au niveau des pixels pour évaluer divers algorithmes. Malgré ses forces, il ne reflète pas les déséquilibres trouvés dans les environnements industriels où les échantillons normaux sont plus courants que les défectueux.
Détails du jeu de données
Le jeu de données Texture-AD contient :
- Jeu de données de tissus : Un total d'images, avec des images désignées pour les ensembles d'entraînement et de test.
- Jeu de données de plaques : Un autre total d'images avec une division claire entre les échantillons d'entraînement et de test.
- Jeu de données de plaques métalliques : Enfin, cet ensemble comprend des images, regroupées de manière similaire pour l'entraînement et le test.
Acquisition et annotation des données
Les images dans le jeu de données Texture-AD ont été capturées à l'aide de caméras haute résolution sous des conditions d'éclairage contrôlées. Le processus de capture des images a impliqué l'ajustement des positions d'éclairage et des niveaux de luminosité pour simuler des conditions réelles. Les images contiennent divers types de défauts qui se produisent naturellement pendant la production, comme des marques, des coupures et des incohérences de couleur sur les tissus, ainsi que des rayures et des taches sur les plaques et les plaques métalliques.
Chaque image est complétée par des annotations précises au niveau des pixels des défauts, qui sont essentielles pour évaluer la performance des algorithmes de détection des anomalies.
Tendances actuelles dans les méthodes de détection d'anomalies
L'accent commun dans la détection d'anomalies s'est déplacé vers des méthodes non supervisées. Cela est largement dû aux défis de l'obtention d'un nombre significatif d'échantillons défectueux pour l'entraînement. Dans ce contexte, l'entraînement consiste souvent uniquement en échantillons normaux, tandis que les tests incluent des échantillons normaux et anormaux.
Trois principales directions de recherche pour les méthodes de détection d'anomalies incluent :
Détection basée sur la synthèse : Certaines méthodes synthétisent des échantillons d'anomalies supplémentaires à partir d'un nombre limité de défauts. Des techniques comme CycleGAN et SDGAN ont été développées pour améliorer l'efficacité de l'entraînement.
Détection basée sur la reconstruction : Ces méthodes supposent qu'un modèle de reconstruction entraîné sur des échantillons normaux va échouer lorsqu'il est appliqué à des zones anormales. Différentes stratégies ont été mises en œuvre pour améliorer leur efficacité.
Méthodes d'incorporation de caractéristiques : Celles-ci se concentrent sur la différenciation entre les échantillons normaux et anormaux au niveau de la représentation des caractéristiques. De nouveaux modèles ont émergé qui utilisent une meilleure extraction et représentation des caractéristiques pour une détection d'anomalies plus précise.
Évaluation des méthodes de détection
Texture-AD permet l'évaluation de diverses méthodes de détection d'anomalies, y compris SimpleNet, DRAEM et d'autres. Des métriques de performance telles que l'aire sous la courbe des récepteurs (AUROC) sont couramment utilisées pour évaluer à quel point différentes méthodes classifient et localisent les anomalies dans les images.
Dans l'ensemble, le jeu de données Texture-AD offre un moyen complet d'évaluer les méthodes de détection des anomalies non supervisées. Il met en évidence les domaines où des améliorations peuvent être apportées et sert de référence pour les futurs développements dans le domaine. En fournissant des conditions réalistes pour les tests, le jeu de données vise à stimuler l'innovation dans les méthodes de détection d'anomalies adaptées aux besoins industriels.
Titre: Texture-AD: An Anomaly Detection Dataset and Benchmark for Real Algorithm Development
Résumé: Anomaly detection is a crucial process in industrial manufacturing and has made significant advancements recently. However, there is a large variance between the data used in the development and the data collected by the production environment. Therefore, we present the Texture-AD benchmark based on representative texture-based anomaly detection to evaluate the effectiveness of unsupervised anomaly detection algorithms in real-world applications. This dataset includes images of 15 different cloth, 14 semiconductor wafers and 10 metal plates acquired under different optical schemes. In addition, it includes more than 10 different types of defects produced during real manufacturing processes, such as scratches, wrinkles, color variations and point defects, which are often more difficult to detect than existing datasets. All anomalous areas are provided with pixel-level annotations to facilitate comprehensive evaluation using anomaly detection models. Specifically, to adapt to diverse products in automated pipelines, we present a new evaluation method and results of baseline algorithms. The experimental results show that Texture-AD is a difficult challenge for state-of-the-art algorithms. To our knowledge, Texture-AD is the first dataset to be devoted to evaluating industrial defect detection algorithms in the real world. The dataset is available at https://XXX.
Auteurs: Tianwu Lei, Bohan Wang, Silin Chen, Shurong Cao, Ningmu Zou
Dernière mise à jour: Sep 10, 2024
Langue: English
Source URL: https://arxiv.org/abs/2409.06367
Source PDF: https://arxiv.org/pdf/2409.06367
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.