Le défi des ensembles de données ouverts dans la fabrication additive
La fabrication additive fait face à un gros manque de jeux de données ouverts dispo pour le machine learning.
― 10 min lire
Table des matières
- Importance des ensembles de données ouverts
- Paysage actuel des ensembles de données en fabrication additive
- Le besoin d'ensembles de données basés sur l'image
- Défis dans la collecte d'ensembles de données annotées
- Revue systématique des ensembles de données
- Critères d'inclusion des ensembles de données
- Recherche d'ensembles de données
- Résultats des recherches dans les bases de données
- Informations complémentaires dans les articles de revues
- Résultats sur l'accessibilité des ensembles de données
- Conclusion : L'avenir des ensembles de données en fabrication additive
- Source originale
- Liens de référence
La Fabrication additive, souvent appelée impression 3D, a pris de l'ampleur dans divers secteurs. Cette technologie crée des objets en ajoutant du matériel couche par couche. À mesure que l'utilisation de cette méthode augmente, le besoin de surveiller le processus de fabrication grandit aussi. La surveillance aide à garantir la qualité des objets produits et peut détecter des défauts pendant la production. Cela implique souvent de collecter des données à l'aide de technologies visuelles et de capteurs, ce qui produit d'énormes quantités d'informations. Ces données peuvent être précieuses pour améliorer encore le processus de fabrication.
Cependant, pour tirer le meilleur parti de ces données, les chercheurs en Apprentissage automatique ont besoin d'accès à des ensembles de données ouverts qui sont bien organisés et étiquetés. Ces ensembles de données peuvent aider à entraîner des modèles pour identifier des défauts dans le processus de fabrication. Malheureusement, il n'y a pas assez d'ensembles de données ouverts en fabrication additive qui répondent aux besoins des chercheurs, ce qui peut limiter les avancées dans le domaine.
Importance des ensembles de données ouverts
Les ensembles de données ouverts sont des collections de données qui sont librement accessibles à quiconque. Ils jouent un rôle crucial dans la recherche et le développement, notamment dans des domaines comme l'apprentissage automatique et l'apprentissage profond. Quand les ensembles de données sont ouverts et bien structurés, les chercheurs peuvent les utiliser pour entraîner des algorithmes, tester leurs idées et partager leurs résultats avec d'autres.
Dans des domaines comme la vision par ordinateur, de grands ensembles de données variés peuvent mener à des améliorations significatives dans la capacité des machines à reconnaître des motifs, identifier des objets et détecter des anomalies. En matière de fabrication additive, avoir des ensembles de données ouverts peut aider à améliorer les processus, promouvoir l'innovation et mener à des produits de meilleure qualité.
Paysage actuel des ensembles de données en fabrication additive
Bien qu'il existe de nombreux ensembles de données ouverts à usage général dans des domaines comme la reconnaissance d'images, le nombre d'ensembles de données spécifiques à la fabrication additive est limité. Des ensembles de données comme ImageNet et COCO contiennent des millions d'images qui aident à entraîner des modèles d'apprentissage automatique. Cependant, les ensembles de données directement pertinents pour les processus de fabrication additive sont rares.
Les ensembles de données existants en fabrication additive ciblent souvent des applications ou des processus spécifiques, rendant l'application plus large difficile. Par exemple, certains ensembles de données peuvent se concentrer sur des objets fabriqués particuliers comme des engrenages, alors que la même méthode pourrait ne pas s'appliquer à d'autres objets, comme des vannes. Cette spécificité peut freiner la capacité de généraliser les résultats à d'autres domaines.
Le besoin d'ensembles de données basés sur l'image
Dans la fabrication additive, la surveillance in situ permet de collecter des données qui reflètent le processus en temps réel. Cela peut inclure des images des couches en cours de construction, ainsi que d'autres métriques comme la température et le son. Ces images sont essentielles pour identifier les défauts, comme les variations de porosité, les fissures et d'autres problèmes qui peuvent affecter la qualité du produit final.
Avoir un ensemble riche de Données d'images permet aux algorithmes d'apprentissage automatique d'apprendre les caractéristiques de ces défauts, améliorant ainsi leur capacité à détecter des problèmes pendant le processus de fabrication. Cependant, le nombre actuel d'ensembles de données d'images en fabrication additive est insuffisant. Les quelques ensembles de données disponibles manquent souvent de documentation adéquate ou d'accessibilité, ce qui les rend difficiles à utiliser.
Défis dans la collecte d'ensembles de données annotées
Collecter des ensembles de données annotées en fabrication additive peut être coûteux et chronophage. Les ensembles de données annotées comprennent des images ou des points de données qui ont été étiquetés pour identifier des caractéristiques ou des défauts. Par exemple, les images de pièces fabriquées peuvent être annotées pour montrer où se trouvent les défauts. Ce processus de marquage nécessite une expertise et des ressources substantielles.
D'un autre côté, des données non étiquetées peuvent être collectées sans trop de frais. Les chercheurs peuvent trouver diverses images liées à la fabrication additive, mais sans annotations appropriées, ces ensembles de données ne peuvent pas être utilisés efficacement pour des tâches d'apprentissage automatique. Cela pose un défi pour les chercheurs qui souhaitent travailler sur des applications de vision par ordinateur dans ce domaine.
Revue systématique des ensembles de données
Pour résoudre le problème des ensembles de données insuffisants en fabrication additive, une revue systématique des ensembles de données disponibles a été réalisée. Cette revue visait à identifier les ensembles de données existants, à évaluer leur pertinence et à mettre en évidence les lacunes dans les ressources disponibles.
Le processus de revue a impliqué plusieurs étapes, y compris la formation d'une équipe pour planifier les méthodes, interroger la disponibilité des données, filtrer les ensembles de données pour vérifier leur adéquation et reporter les résultats. Un ensemble spécifique de critères a été établi pour évaluer les ensembles de données, garantissant que seuls ceux répondant aux exigences étaient inclus dans la revue.
Critères d'inclusion des ensembles de données
Pour être considérée pour inclusion dans la revue, un ensemble de données devait répondre à des critères spécifiques :
- Ouverture : L'ensemble de données doit être accessible aux chercheurs sans restrictions.
- Format d'image : L'ensemble de données doit être au format image, excluant les figures ou graphiques, car l'accent est mis sur les images.
- Pertinence pour la fabrication additive : L'ensemble de données doit se rapporter spécifiquement à la fabrication additive.
- Application en apprentissage automatique : L'ensemble de données doit être utilisable pour des tâches d'apprentissage automatique ou d'apprentissage profond.
- Disponibilité prête : L'ensemble de données ne doit pas nécessiter de prétraitement complexe pour être utilisé.
Ces critères ont aidé à garantir que la revue se concentre sur des ensembles de données pouvant apporter une contribution significative au domaine de la fabrication additive.
Recherche d'ensembles de données
La revue systématique impliquait de rechercher à travers diverses bases de données pour identifier des ensembles de données pertinents. Neuf bases de données ont été sélectionnées pour le processus de recherche, y compris DOE Data Explorer, Mendeley, Figshare, Zenodo, et d'autres. Chaque base de données a été recherchée à l'aide d'une combinaison de mots-clés spécifiques liés à la fabrication additive et à l'apprentissage automatique.
Les résultats ont donné une gamme d'ensembles de données, mais beaucoup étaient des doublons ou non pertinents. Les résultats recueillis ont ensuite été filtrés pour identifier ceux qui répondaient aux critères d'inclusion. Le nombre d'ensembles de données pertinents récupérés de chaque base de données variait, mettant en évidence les défis de la recherche de ressources adaptées dans ce domaine de niche.
Résultats des recherches dans les bases de données
Après un filtrage minutieux, il a été constaté qu'un nombre limité d'ensembles de données était disponible à travers les neuf bases de données. Un total de dix ensembles de données uniques associés à la fabrication additive a été identifié. Cependant, beaucoup de ces ensembles de données ne se concentraient pas sur les défauts de microstructure ou étaient trop spécifiques à certaines tâches, limitant leur applicabilité plus large.
Le processus de filtrage a indiqué que la plupart des ensembles de données étaient mieux adaptés aux tâches de détection liées à de grands composants plutôt qu'aux problèmes de microstructure. Cette constatation a encore souligné le besoin d'ensembles de données plus complets qui se concentrent spécifiquement sur les caractéristiques nécessaires pour un Contrôle de qualité efficace en fabrication additive.
Informations complémentaires dans les articles de revues
Pour élargir la recherche d'ensembles de données, une revue des articles de revues dans le domaine de la fabrication additive a été réalisée. L'objectif était d'identifier des ensembles de données qui pourraient avoir été fournis comme information complémentaire avec les recherches publiées dans ces articles.
La recherche s'est concentrée sur une revue à comité de lecture de premier plan qui publie régulièrement des recherches de haute qualité liées à la fabrication additive. Les articles ont été examinés pour mentionner des ensembles de données, en recherchant spécifiquement ceux qui étaient ouverts et accessibles.
Malgré de nombreux articles discutant de l'apprentissage automatique en fabrication additive, peu ont proposé des ensembles de données pour un usage public. De nombreux ensembles de données étaient soit confidentiels, disponibles uniquement sur demande, ou manquaient d'instructions claires pour l'accès.
Résultats sur l'accessibilité des ensembles de données
Dans l'ensemble, une part significative des articles n'a pas fourni d'ensembles de données accessibles ouvertement. Parmi les articles examinés, plusieurs ont indiqué que leurs ensembles de données étaient confidentiels, tandis que d'autres ont précisé que l'accès serait accordé uniquement sur demande. De plus, de nombreux articles qui mentionnaient des ensembles de données n'ont pas donné d'informations directes sur la façon de les accéder, laissant aux chercheurs des options limitées.
Sur le total des articles examinés, seulement un petit nombre était directement lié à des ensembles de données accessibles. Après un filtrage minutieux, il a été déterminé que la plupart des ensembles de données ne répondaient pas aux critères spécifiques établis pour une utilité maximale dans les pratiques d'apprentissage automatique.
Conclusion : L'avenir des ensembles de données en fabrication additive
La revue systématique a mis en évidence une lacune substantielle dans la disponibilité d'ensembles de données d'images ouverts et facilement accessibles en fabrication additive. Cette rareté de ressources pose un défi significatif pour les chercheurs cherchant à appliquer efficacement des techniques d'apprentissage automatique dans ce domaine.
Pour une application efficace de l'apprentissage automatique, notamment dans les tâches de vision par ordinateur, il est crucial d'avoir des ensembles de données suffisamment annotés. Sans eux, l'opportunité d'améliorer la détection automatique des défauts dans les processus de fabrication additive restera inexploitée. Ce manque d'ensembles de données peut freiner les progrès en matière de contrôle qualité et de conservation des ressources pendant la fabrication.
Pour favoriser l'innovation et le progrès en fabrication additive, il y a un besoin urgent de plus d'ensembles de données ouverts et organisés que les chercheurs peuvent accéder librement et utiliser. En s'attaquant à cette lacune, le domaine peut faire des avancées significatives vers l'amélioration de l'efficacité des processus et de la qualité des produits, au bénéfice ultérieur des fabricants et des consommateurs.
Titre: A Systematic Review of Available Datasets in Additive Manufacturing
Résumé: In-situ monitoring incorporating data from visual and other sensor technologies, allows the collection of extensive datasets during the Additive Manufacturing (AM) process. These datasets have potential for determining the quality of the manufactured output and the detection of defects through the use of Machine Learning during the manufacturing process. Open and annotated datasets derived from AM processes are necessary for the machine learning community to address this opportunity, which creates difficulties in the application of computer vision-related machine learning in AM. This systematic review investigates the availability of open image-based datasets originating from AM processes that align with a number of pre-defined selection criteria. The review identifies existing gaps among the current image-based datasets in the domain of AM, and points to the need for greater availability of open datasets in order to allow quality assessment and defect detection during additive manufacturing, to develop.
Auteurs: Xiao Liu, Alessandra Mileo, Alan F. Smeaton
Dernière mise à jour: 2024-01-27 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2401.15448
Source PDF: https://arxiv.org/pdf/2401.15448
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.osti.gov/dataexplorer/
- https://data.mendeley.com/
- https://figshare.com/
- https://zenodo.org/
- https://data.amerigeoss.org/
- https://data.nist.gov/
- https://www.kaggle.com/
- https://datacite.org/
- https://datasetsearch.research.google.com/
- https://doi.org/10.17632/zyz6cznm5h.3
- https://doi.org/10.17632/8rm9d4ykbt.1
- https://doi.org/10.17632/h8tzpxkvdc.1
- https://doi.org/10.17863/cam.84082