Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Présentation de Slice-100K : une nouvelle ressource pour l'impression 3D

Slice-100K propose plein de fichiers G-code et STL pour la recherche en impression 3D.

― 10 min lire


Slice-100K transformeSlice-100K transformel'impression 3Dl'accès au G-code pour les chercheurs.Un jeu de données qui révolutionne
Table des matières

Ces dernières années, la technologie a vraiment changé notre façon de concevoir et de créer des objets grâce à l'impression 3D. Ce processus, qu'on appelle fabrication additive, nous permet de fabriquer des pièces complexes à partir de designs numériques. Mais, il y a un manque de grandes bases de données contenant les fichiers nécessaires à l'impression 3D. Pour combler cette lacune, un nouveau jeu de données appelé Slice-100K a été créé. Ce jeu comprend plus de 100 000 fichiers qui aident dans le processus d'impression 3D.

C'est quoi le G-code ?

Le G-code est un langage de programmation qui dit à une imprimante 3D comment bouger. Ça comprend des instructions pour la buse de l'imprimante et les matériaux à utiliser. Chaque fois qu'un design numérique est transformé en objet physique, le G-code est utilisé pour guider l'imprimante sur la façon de procéder. Bien qu'il existe des ensembles de données avec du G-code, la plupart sont petits et n'offrent pas assez de variété pour la recherche et le développement en impression 3D.

C'est quoi Slice-100K ?

Slice-100K est un jeu de données unique qui inclut des fichiers G-code et leurs modèles 3D correspondants au format STL. Ce jeu fournit à la fois les instructions pour imprimer et les designs réels, ce qui en fait une ressource précieuse. Il est constitué de données provenant de grandes collections de modèles 3D existants. L'objectif est de soutenir la recherche et le développement en impression 3D en permettant aux développeurs de tester et d'implémenter de nouvelles idées.

Pourquoi a-t-on besoin de Slice-100K ?

Le besoin de grands ensembles de données comme Slice-100K vient des défis rencontrés dans l'impression 3D. Les inventeurs et chercheurs ont souvent du mal à traduire leurs idées en objets physiques. Les outils disponibles pour créer le G-code nécessaire peuvent parfois être inefficaces, nécessitant beaucoup d'ajustements manuels. En ayant une grande collection de fichiers G-code et STL, les chercheurs peuvent travailler plus efficacement et innover de nouvelles solutions.

Création de modèles 3D pour l'impression

Avant qu'une imprimante 3D puisse fonctionner, un modèle numérique doit d'abord être créé avec un logiciel de conception assistée par ordinateur (CAO). Ce modèle est ensuite généralement converti dans un format que l'imprimante peut comprendre. Le format STL est couramment utilisé à cet effet car il permet des formes complexes nécessaires dans de nombreux designs.

Une fois le modèle créé, il subit un processus de découpe. Ici, le modèle est divisé en couches, et chaque couche est convertie en G-code. Cette transformation permet à l'imprimante de savoir comment construire l'objet couche par couche. L’imprimante reçoit des instructions pour déplacer la buse et déposer le matériau dans les bons motifs.

Le rôle des logiciels de découpe

Les logiciels de découpe sont essentiels pour préparer le modèle CAO en vue de l'impression. Ils prennent le modèle 3D et le découpent en tranches, créant du G-code qui dit à l'imprimante comment bouger. Ce logiciel peut aussi ajuster les paramètres d'impression, comme la hauteur des couches, la densité de remplissage et les structures de support. Ces ajustements sont cruciaux pour s'assurer que l'objet imprimé ait la qualité désirée.

Le processus de découpe implique de déterminer comment les différentes couches s'assembleront. Les instructions de chaque couche peuvent inclure des détails sur la quantité de matériau à extruder et comment la buse doit bouger. Cela signifie que la phase de découpe est une étape complexe qui nécessite un réglage minutieux.

Défis avec le G-code

Bien que le G-code soit essentiel pour l'impression 3D, il a ses limites. Beaucoup de fichiers G-code peuvent différer considérablement, rendant difficile leur utilisation sur différents modèles d'imprimantes. Cette diversité peut entraîner des erreurs lors de l'impression d'un objet. En plus, les scripts G-code sont souvent longs, ce qui complique le dépannage des problèmes.

La nature technique du G-code signifie qu'il peut être difficile pour ceux qui n'ont pas de bagage technique de travailler avec. Par exemple, le G-code n'inclut pas toujours des commentaires descriptifs, ce qui signifie que les utilisateurs peuvent devoir avoir des connaissances préalables pour comprendre ce que fait chaque ligne.

IA et G-code

L'intelligence artificielle (IA) fait des vagues dans de nombreux domaines, y compris la fabrication. Cependant, son potentiel dans l'impression 3D, en particulier avec le G-code, n'a pas encore été pleinement exploité. Les grands modèles de langage (LLM) ont montré des promesses pour automatiser des tâches, comme la génération et le débogage de code, mais leur application au G-code a été limitée.

En utilisant l'IA pour analyser le G-code, il pourrait être possible de créer un logiciel qui aide les utilisateurs à générer et optimiser le G-code plus efficacement. Cela pourrait aider dans des tâches comme la traduction entre différentes versions de G-code, améliorant ainsi le processus d'impression global.

La valeur des ensembles de données multimodaux

Les ensembles de données multimodaux combinent différents types de données pour améliorer les efforts de recherche et développement. Pour l'impression 3D, un ensemble de données qui inclut à la fois des fichiers G-code et STL permet une analyse plus complète. Les chercheurs peuvent étudier les relations entre le design et les instructions nécessaires pour le produire physiquement.

Slice-100K est précieux car il sert à cet effet. Il contient non seulement des fichiers G-code et STL, mais aussi des représentations visuelles et des métadonnées qui peuvent aider les chercheurs à comprendre la relation entre les différentes parties de l'ensemble de données.

Comment Slice-100K a été créé

Slice-100K a été construit à partir de ressources publiques. Les données ont été collectées à partir de deux sources principales : Objaverse-XL et Thingi10K. Ces sources contiennent divers modèles 3D utilisés pour différentes applications. À partir des données collectées, les modèles ont été filtrés pour leur qualité et conçus pour être adaptés à l'impression 3D.

Après avoir collecté les modèles, ils ont été traités pour créer le G-code nécessaire. Le logiciel PrusaSlicer a été utilisé à cet effet, et il permet un contrôle détaillé sur le processus de découpe, garantissant une sortie G-code de haute qualité.

Analyser l'ensemble de données

L'ensemble de données comprend des métadonnées qui fournissent des informations sur les propriétés géométriques des modèles. Des caractéristiques comme le nombre de vertex et les caractéristiques structurelles sont incluses, faisant de l'ensemble de données une ressource complète pour comprendre différents modèles. Ces données sont utiles pour les chercheurs qui veulent optimiser des designs ou améliorer le processus d'impression 3D.

De plus, des rendus des modèles sont inclus dans l'ensemble de données. Ces images fournissent un contexte visuel qui peut aider dans les analyses et faciliter le classement des modèles.

Catégories LVIS

Pour améliorer l'utilisabilité de l'ensemble de données, chaque modèle se voit attribuer des catégories basées sur le système de classification LVIS. Ce système comprend plus de 1200 catégories, permettant aux utilisateurs de trier et filtrer efficacement les modèles selon leurs besoins de recherche spécifiques.

En catégorisant les modèles, Slice-100K devient plus accessible pour les chercheurs qui peuvent chercher des types d'objets ou de caractéristiques particuliers. Cette approche systématique rend l'ensemble de données plus facile à utiliser et améliore son utilité dans diverses applications de recherche.

Traduction G-code

Une des fonctions clés de Slice-100K est sa capacité à supporter la traduction de G-code. Le G-code peut venir dans différentes variantes, ce qui signifie qu'un G-code généré pour une imprimante peut ne pas fonctionner sur une autre. Donc, traduire entre ces variantes est crucial pour maximiser l'utilité de l'ensemble de données.

En entraînant des modèles sur les données de Slice-100K, les chercheurs peuvent développer des outils qui convertissent automatiquement le G-code entre différents formats. Cette capacité peut faire gagner du temps et simplifier le processus pour ceux qui n'ont peut-être pas les compétences techniques pour ajuster manuellement leur G-code.

Tester les modèles de langage existants

Divers modèles de langage existants ont été évalués en utilisant Slice-100K pour voir à quel point ils peuvent bien effectuer des tâches liées au G-code, comme les transformations géométriques et les traductions de variantes. Les chercheurs ont mis en place des tests pour déterminer l'efficacité de ces modèles à interpréter et générer du G-code.

Les résultats initiaux suggèrent que, même si certains modèles fonctionnent de manière adéquate, il reste des défis. Par exemple, certains modèles ont eu du mal à reproduire des designs complexes avec précision, indiquant qu'il y a encore des améliorations à apporter aux méthodologies de formation.

Évaluer la génération de G-code

Pour évaluer la qualité des sorties G-code générées par les modèles de langage, une métrique spéciale a été développée basée sur des comparaisons d'images. Au lieu de se fier uniquement aux évaluations textuelles, qui peuvent être trompeuses, le processus consiste à examiner les images rendues des couches imprimées.

Cette méthode permet aux chercheurs de voir à quel point le G-code de sortie correspond aux résultats attendus sous un format visuel. Grâce aux évaluations visuelles, il devient plus facile d’identifier les écarts qui pourraient impacter l'objet imprimé final.

Directions futures

Bien que Slice-100K soit une ressource majeure, il reste encore du travail à faire pour améliorer son utilité. Une limite est que les modèles inclus dans l'ensemble de données n'ont été découpés que le long d'un axe par défaut. De futures mises à jour pourraient envisager des stratégies de découpe plus complexes pour mieux refléter les scénarios d'impression du monde réel.

De plus, les chercheurs pourraient explorer des moyens d'automatiser encore plus le processus de génération et de débogage du G-code. En intégrant des techniques d'IA plus avancées, il pourrait être possible de créer un système qui apprend des interactions des utilisateurs, faisant des suggestions pour améliorer le G-code en fonction des projets précédents.

Conclusion

Slice-100K représente un grand pas en avant pour répondre au besoin d'ensembles de données complets dans le domaine de l'impression 3D. En fournissant une ressource riche qui combine des fichiers G-code et STL avec des métadonnées supplémentaires, il ouvre de nouvelles opportunités pour la recherche et le développement. Les applications potentielles de cet ensemble de données pourraient mener à de meilleurs processus de fabrication, des itérations de design plus faciles et plus d'innovation dans le monde de la fabrication additive.

Source originale

Titre: Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing

Résumé: G-code (Geometric code) or RS-274 is the most widely used computer numerical control (CNC) and 3D printing programming language. G-code provides machine instructions for the movement of the 3D printer, especially for the nozzle, stage, and extrusion of material for extrusion-based additive manufacturing. Currently there does not exist a large repository of curated CAD models along with their corresponding G-code files for additive manufacturing. To address this issue, we present SLICE-100K, a first-of-its-kind dataset of over 100,000 G-code files, along with their tessellated CAD model, LVIS (Large Vocabulary Instance Segmentation) categories, geometric properties, and renderings. We build our dataset from triangulated meshes derived from Objaverse-XL and Thingi10K datasets. We demonstrate the utility of this dataset by finetuning GPT-2 on a subset of the dataset for G-code translation from a legacy G-code format (Sailfish) to a more modern, widely used format (Marlin). SLICE-100K will be the first step in developing a multimodal foundation model for digital manufacturing.

Auteurs: Anushrut Jignasu, Kelly O. Marshall, Ankush Kumar Mishra, Lucas Nerone Rillo, Baskar Ganapathysubramanian, Aditya Balu, Chinmay Hegde, Adarsh Krishnamurthy

Dernière mise à jour: 2024-07-11 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.04180

Source PDF: https://arxiv.org/pdf/2407.04180

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires