L'essor de la vectorisation dans la création d'images
Explorer les méthodes et les défis dans la génération d'images vectorielles.
― 6 min lire
Table des matières
Ces dernières années, on a vu apparaître plein de méthodes pour créer des images à partir de texte ou d'autres entrées. Bien que ces méthodes soient pratiques pour des images standards, elles ont souvent du mal à produire des images en très haute résolution. Les graphiques vectoriels, qui utilisent des formes au lieu de pixels, ont un avantage dans ce domaine, ce qui en fait une option prometteuse pour la création d'images.
C'est quoi la Vectorisation ?
La vectorisation, c'est le processus qui permet de transformer une image classique faite de pixels (image raster) en une image vectorielle. Une image vectorielle est faite de formes et garde un aspect top même quand on la redimensionne. Pour y arriver, le processus de vectorisation cherche à représenter l'image originale avec le minimum de formes possible.
Pourquoi choisir les graphiques vectoriels ?
Les images raster sont faites de petits points appelés pixels, ce qui les rend idéales pour des images détaillées comme les photos. À l'inverse, les images vectorielles sont constituées de formes, ce qui les rend plus simples. Les graphiques vectoriels sont souvent utilisés pour des icônes, des logos et des illustrations simples. En plus, elles prennent moins de place en termes de fichier, ce qui est pratique pour partager en ligne.
Tendances actuelles dans la création d'images
Récemment, les modèles génératifs ont attiré l'attention pour la création d'images. Ces modèles utilisent des algorithmes complexes pour apprendre des données et générer de nouvelles images. Bien que ces méthodes soient efficaces, elles produisent généralement des images de résolution plus basse, ce qui limite leur utilisation pour des tâches détaillées, comme l'impression de logos ou la création d'illustrations.
Malgré ces avancées, il y a eu peu de recherches sur la génération d'images vectorielles. La plupart des images vectorielles sont encore créées manuellement, car travailler directement avec du code vectoriel peut être compliqué. Du coup, la capacité de générer des images vectorielles automatiquement est vraiment nécessaire.
Catégories de méthodes de vectorisation
Les méthodes de vectorisation peuvent être classées en deux grandes catégories : les méthodes algorithmiques et celles basées sur l'apprentissage automatique.
Méthodes algorithmiques : Ces techniques impliquent généralement de découper une image en petites parties et de convertir les couleurs. On peut les classer en méthodes basées sur des maillages ou sur des courbes.
- Méthodes basées sur des maillages : Elles divisent l'image en morceaux et attribuent des couleurs aux formes à l'intérieur de ces morceaux.
- Méthodes basées sur des courbes : Elles utilisent des courbes mathématiques pour définir des couleurs le long des bords et créer des transitions douces.
Méthodes d'apprentissage automatique : Ces méthodes utilisent des algorithmes qui apprennent à partir d'exemples pour générer des images vectorielles. Elles promettent souvent des résultats plus rapides et précis, mais peuvent être très complexes.
Défis de la vectorisation
Les méthodes d'apprentissage automatique actuelles ont quelques limites. Elles prennent souvent beaucoup de temps à s'entraîner et ne reproduisent pas toujours l'image originale avec précision. Il est généralement nécessaire d'intervenir manuellement pour ajuster ces méthodes.
Comparaison des différentes méthodes
En comparant les méthodes de vectorisation, plusieurs critères sont importants :
- Similarité : À quel point l'image vectorielle générée ressemble à l'originale ?
- Simplicité : Combien de formes l'image vectorielle utilise-t-elle ?
- Vitesse : Combien de temps faut-il pour créer l'image ?
- Polyvalence : La méthode peut-elle générer des copies précises sans nécessiter beaucoup d'entraînement préalable ?
- Contrôle humain : Combien l'utilisateur doit-il ajuster les paramètres pendant le processus ?
Méthodes compatibles avec l'apprentissage automatique
Quelques méthodes d'apprentissage automatique notables incluent :
DiffVG : Cette méthode relie les images raster et vectorielles à l'aide d'une fonction spéciale. Elle commence avec une image raster et ajuste des formes. Bien que ça fonctionne, générer une bonne image vectorielle peut prendre du temps.
Im2Vec : Ce modèle mappe les images raster au format vectoriel mais a montré des résultats incohérents. Il nécessite une formation soignée sur un grand ensemble d'images vectorielles, ce qui peut être difficile à obtenir.
LIVE : Cette approche améliore DiffVG en ajoutant des formes en couches. Elle vise à créer des images vectorielles précises avec moins de formes, mais ça peut prendre très longtemps à traiter.
Méthodes de vectorisation en ligne
Il existe plusieurs outils en ligne qui peuvent convertir facilement les images raster en format vectoriel. Ces services offrent généralement différentes options comme la sélection du format de fichier et des paramètres de qualité. Quelques outils populaires incluent svgstorm.com et vectorizer.io. Bien que ces méthodes soient conviviales, elles peuvent produire des images avec un grand nombre de formes, ce qui les rend moins efficaces.
Informations pratiques
D'après des expériences, on a trouvé que des méthodes d'apprentissage automatique comme Mang2Vec et DVoTD se concentrent sur les images en noir et blanc et peuvent avoir des difficultés avec des images en couleur complexe. Bien qu'elles puissent produire des résultats satisfaisants pour des images simples, elles tendent à créer beaucoup de formes inutiles, surtout pour de grandes surfaces d'une seule couleur.
La méthode DiffVG peut être efficace mais génère des artefacts et peut nécessiter beaucoup de traitements intermédiaires, causant des délais. En revanche, LIVE offre plus de contrôle sur le processus de génération d'images, mais prend aussi beaucoup de temps pour produire des résultats.
Conclusion
En résumé, bien qu'il existe diverses méthodes pour vectoriser des images, chacune a ses avantages et inconvénients. Il y a un besoin clair de solutions capables d'équilibrer qualité d'image, vitesse et simplicité. À mesure que la technologie évolue, il est probable que de nouvelles méthodes apparaissent pour relever ces défis et rendre la génération d'images vectorielles plus facile et accessible. Pour l'instant, une combinaison de différentes méthodes semble être la meilleure approche pour une vectorisation efficace.
Titre: Image Vectorization: a Review
Résumé: Nowadays, there are many diffusion and autoregressive models that show impressive results for generating images from text and other input domains. However, these methods are not intended for ultra-high-resolution image synthesis. Vector graphics are devoid of this disadvantage, so the generation of images in this format looks very promising. Instead of generating vector images directly, you can first synthesize a raster image and then apply vectorization. Vectorization is the process of converting a raster image into a similar vector image using primitive shapes. Besides being similar, generated vector image is also required to contain the minimum number of shapes for rendering. In this paper, we focus specifically on machine learning-compatible vectorization methods. We are considering Mang2Vec, Deep Vectorization of Technical Drawings, DiffVG, and LIVE models. We also provide a brief overview of existing online methods. We also recall other algorithmic methods, Im2Vec and ClipGEN models, but they do not participate in the comparison, since there is no open implementation of these methods or their official implementations do not work correctly. Our research shows that despite the ability to directly specify the number and type of shapes, existing machine learning methods work for a very long time and do not accurately recreate the original image. We believe that there is no fast universal automatic approach and human control is required for every method.
Auteurs: Maria Dziuba, Ivan Jarsky, Valeria Efimova, Andrey Filchenkov
Dernière mise à jour: 2023-06-10 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.06441
Source PDF: https://arxiv.org/pdf/2306.06441
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.