Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Transformer des croquis 2D en modèles 3D

Une nouvelle méthode pour transformer des croquis architecturaux 2D en modèles 3D modifiables.

― 8 min lire


Modèles 3D à partir deModèles 3D à partir decroquis 2Dl'apprentissage automatique.conception architecturale grâce àUne nouvelle méthode simplifie la
Table des matières

Créer des modèles 3D à partir de dessins 2D, c'est super important, surtout en architecture. Les méthodes traditionnelles ont quelques problèmes. Elles produisent souvent des modèles difficiles à modifier ou qui ont l'air brut. Cet article présente une nouvelle manière de créer des modèles 3D à partir d'un seul croquis 2D, aidant les architectes et les designers à bosser plus efficacement.

Le Problème avec les Méthodes Actuelles

Les méthodes actuelles pour créer des modèles 3D à partir de croquis 2D produisent généralement des sorties comme des voxels, des nuages de points ou des maillages. Chacune de ces méthodes a ses inconvénients. Par exemple, les modèles générés peuvent avoir des surfaces rugueuses et des formes étranges. Ça rend la tâche difficile pour les architectes qui veulent faire des changements ou peaufiner leurs designs.

Les architectes commencent souvent par des croquis 2D pour brainstormer des idées. Une fois qu'ils choisissent le design, ils le traduisent en un modèle 3D pour avoir une vision plus claire. Ce processus peut être long. Les méthodes existantes qui convertissent les croquis en modèles 3D ne fonctionnent pas trop bien pour les Designs architecturaux, qui impliquent souvent des formes simples.

Une Nouvelle Approche

La nouvelle méthode décrite ici essaie de résoudre ces problèmes. Elle utilise un type spécial de machine learning appelé transformer visuel. Ce système prédit ce qu'on appelle un "descripteur de scène" à partir d'une seule image fil de fer. Ce descripteur inclut des détails comme le type d'objets, leur taille, position et rotation.

Une fois qu'on a ces infos, on peut utiliser des logiciels de modélisation 3D populaires, comme Blender ou Rhino Grasshopper, pour créer des modèles 3D détaillés et modifiables. Cette intégration simplifie le processus de design, rendant plus facile pour les architectes de créer et modifier leurs designs basés sur leurs croquis 2D.

Évaluer la Nouvelle Méthode

Pour tester cette nouvelle approche, on a créé deux ensembles d'exemples : un avec des scènes simples et un autre avec des scènes plus complexes. Les résultats ont montré que le modèle fonctionnait bien pour les scènes simples mais avait du mal avec les exemples plus complexes.

Design Architectural et Modèles 3D

En architecture, le croquis est crucial. Ces croquis sont la première étape pour créer un design. Une fois un concept choisi, il doit être représenté dans un modèle 3D. Ça aide tout le monde impliqué à mieux comprendre le projet.

Cependant, transformer des croquis 2D en modèles 3D peut prendre beaucoup de temps. Bien que certaines recherches précédentes se soient concentrées sur cette conversion, elles ne traitent souvent pas des défis uniques du design architectural. Les modèles courants ne représentent pas fidèlement les structures architecturales, qui sont généralement constituées de formes simples.

Défis des Méthodes Actuelles de Reconstruction 3D

Des méthodes comme les voxels et les nuages de points échouent souvent à fournir le niveau de détail nécessaire en architecture. D'autre part, les formats de maillage peuvent mener à des résultats problématiques, comme des surfaces inégales et des bords flous. Ces limitations freinent le processus de conception et rendent difficile pour les architectes d'apporter les ajustements nécessaires à leur travail.

Au contraire, notre nouvelle approche vise à lier sans couture le processus de croquis avec les logiciels de modélisation 3D. Cela pourrait vraiment améliorer la façon dont les designers travaillent.

Objectifs du Projet

L'objectif de notre projet est simple : développer un modèle de machine learning capable de créer un modèle 3D d'un bâtiment à partir d'un seul croquis 2D. Le modèle devrait s'intégrer facilement dans des logiciels de modélisation 3D standard, permettant des modifications rapides.

Le transformer visuel que nous avons entraîné prend une image et produit une liste de "Descripteurs de scène". Ces descripteurs détaillent la forme, la position, la rotation et la taille de chaque objet dans la scène. On a programmé Rhino Grasshopper pour prendre cette sortie et construire la scène.

Avantages de la Nouvelle Méthode

Notre projet vise non seulement à accélérer la modélisation 3D en architecture. Les robots utilisant des systèmes de vision pourraient aussi bénéficier de descripteurs de scène simplifiés. En reconstruisant une scène 3D approximative à partir d'une simple image, les robots peuvent mieux comprendre leur environnement et interagir efficacement avec les objets.

Travaux Connexes

Il y a des recherches en cours sur l'utilisation du machine learning pour la reconstruction 3D. Beaucoup de méthodes existent, mais notre approche combine différents éléments de segmentation sémantique et de classification d'objets. Un projet similaire, Sketch2CAD, nécessite que les utilisateurs dessinent précisément. Notre méthode permet plus de liberté dans les styles de dessin, car on accepte les croquis faits à la main.

Comment Fonctionne la Reconstruction 3D

Actuellement, les pratiques courantes pour la reconstruction 3D utilisent souvent des modèles de machine learning de bout en bout. Ces modèles peuvent générer des formes 3D à partir d'une seule image ou de plusieurs images. Souvent, la sortie est sous forme de voxel, maillage polygonal ou nuage de points.

Un défi majeur avec ces modèles est leur capacité limitée à généraliser. Ils construisent généralement des modèles spécifiques à des classes qui ne peuvent créer des formes que dans une catégorie étroite. Notre projet vise à surmonter cela en prédisant une plus large gamme de formes.

Création de Données pour l'Entraînement

Pour entraîner notre modèle, nous avons créé un programme dans Rhino Grasshopper pour générer des données synthétiques. Cela incluait le développement à la fois d'une scène 3D et du rendu des bords 2D correspondant. Nous avons fait deux ensembles de données : un pour des scènes simples et un autre pour des scènes complexes.

Les scènes 3D incluent plusieurs formes comme des cubes, des cylindres et des pyramides, choisies pour représenter des bâtiments résidentiels typiques. L'ensemble de données simple contient uniquement des cubes et des cylindres sans rotation, tandis que l'ensemble complexe inclut diverses formes avec leurs rotations aléatoires.

Descripteurs de Scène

Pour chaque scène, on crée une liste de paramètres appelée "descripteur de scène". Ce descripteur inclut des détails sur le nombre d'objets, leurs formes, positions, rotations et tailles.

Pour rassembler des données, on rend plusieurs images 2D sous différents angles pour chaque scène. On s'assure d'avoir une bonne variété dans nos images pour aider le modèle à apprendre efficacement. Pour chaque scène, on produit deux types d'images : une avec des informations détaillées sur les bords et une avec des bords basiques.

Classification des Objets et Amélioration

On a développé notre modèle en utilisant le cadre Pix2Seq, qui traite la détection d'objets comme un problème de génération de texte. Notre modèle utilise un encodeur pour lire une image et un décodeur pour créer une séquence de tokens détaillant les objets.

En entraînant le modèle avec des ensembles de données spécifiques, on a noté comment il reconstruisait des scènes 3D à partir de dessins simples. Le modèle apprend à prédire l'agencement des formes tout en améliorant son exactitude en cours de route.

Entraînement et Résultats

Pour préparer le modèle à un usage réel, on l'a d'abord entraîné avec un ensemble de données simple. Après avoir réussi des tests sur des scènes faciles, on a tenté l'ensemble de données plus complexe. Malheureusement, le modèle n'a pas bien fonctionné avec les scènes compliquées.

Cet échec peut venir de la complexité accrue des scènes, qui a introduit plus de bruit dans le processus d'apprentissage du modèle. La génération aléatoire des ensembles de données pourrait aussi avoir causé un manque de contexte, rendant difficile pour le modèle de comprendre les relations entre les objets.

Conclusion et Directions Futures

Notre projet introduit une méthode prometteuse pour convertir des croquis 2D en modèles architecturaux 3D, améliorant ainsi la vitesse et l'efficacité du processus de design. Bien qu'on ait réussi à montrer des résultats avec des croquis simples, des défis demeurent pour reconstruire des scènes complexes.

Le modèle actuel a des limites, notamment avec des objets ayant des formes complexes. La reconstruction 3D à partir d'une seule image est un souci compliqué, mais notre approche fournit une nouvelle manière de s'attaquer à ces défis.

À l'avenir, on espère affiner nos méthodes et explorer comment notre modèle peut être amélioré pour gérer des designs plus complexes. En s'intégrant parfaitement dans les logiciels de modélisation 3D établis, cette avancée pourrait mener à des applications pratiques dans l'architecture et la robotique.

Source originale

Titre: Sketch2CADScript: 3D Scene Reconstruction from 2D Sketch using Visual Transformer and Rhino Grasshopper

Résumé: Existing 3D model reconstruction methods typically produce outputs in the form of voxels, point clouds, or meshes. However, each of these approaches has its limitations and may not be suitable for every scenario. For instance, the resulting model may exhibit a rough surface and distorted structure, making manual editing and post-processing challenging for humans. In this paper, we introduce a novel 3D reconstruction method designed to address these issues. We trained a visual transformer to predict a "scene descriptor" from a single wire-frame image. This descriptor encompasses crucial information, including object types and parameters such as position, rotation, and size. With the predicted parameters, a 3D scene can be reconstructed using 3D modeling software like Blender or Rhino Grasshopper which provides a programmable interface, resulting in finely and easily editable 3D models. To evaluate the proposed model, we created two datasets: one featuring simple scenes and another with complex scenes. The test results demonstrate the model's ability to accurately reconstruct simple scenes but reveal its challenges with more complex ones.

Auteurs: Hong-Bin Yang

Dernière mise à jour: 2023-09-28 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.16850

Source PDF: https://arxiv.org/pdf/2309.16850

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires