Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Améliorer la segmentation des bâtiments avec la technique DeNISE

DeNISE améliore les contours des bâtiments dans les images aériennes pour une meilleure cartographie et planification.

― 7 min lire


DeNISE : Segmentation deDeNISE : Segmentation debâtiment de nouvellegénérationmeilleure efficacité de cartographie.bâtiments aériens améliorés pour uneDeNISE propose des contours de
Table des matières

La segmentation des bâtiments est une partie clé de la vision par ordinateur qui se concentre sur l'identification et le contour des bâtiments dans les images. Ça joue un rôle important dans différentes applications comme l'urbanisme, la gestion des catastrophes et la mise à jour des cartes. Mais, y a des défis pour obtenir des contours de qualité, surtout à cause de la clarté des images et des conditions environnementales.

Le Problème

Dans les Images aériennes, la présence d'ombres, de reflets et d'obstructions peut rendre difficile l'obtention de contours clairs des bâtiments. Ça peut limiter l'utilisation de ces résultats de segmentation. Par exemple, beaucoup de méthodes actuelles ne sont pas assez bonnes pour des applications précises comme la création de cartes. C'est important parce que les autorités ont besoin de données précises et fiables pour prendre des décisions et planifier.

But de la Nouvelle Technique

Pour résoudre ces problèmes, une nouvelle technique appelée DeNISE a été développée. L'objectif est d'améliorer la façon dont les bâtiments sont délimités dans les Masques de segmentation. La méthode combine les résultats de deux types de réseaux différents pour affiner les bords qui marquent les limites des bâtiments. En faisant ça, elle vise à améliorer la qualité globale des masques de segmentation.

Comment fonctionne DeNISE

DeNISE se compose de deux approches principales : Seg-DeNISE et Edge-DeNISE.

Seg-DeNISE

L'approche Seg-DeNISE utilise deux réseaux de segmentation. Elle prend une image comme entrée et produit des prédictions pour chaque bâtiment. Le premier réseau génère ces prédictions, qui sont ensuite combinées avec l'image originale pour créer de nouvelles données d'entraînement pour le deuxième réseau. L'objectif est d'améliorer les prédictions grâce à ces données combinées.

Edge-DeNISE

D'un autre côté, Edge-DeNISE utilise un réseau de détection de contour avec un réseau de segmentation. Ça veut dire que le premier réseau se concentre sur l'identification des bords des bâtiments, et sa sortie est utilisée pour améliorer l'étape suivante de segmentation. Comme pour Seg-DeNISE, les données combinées aident à affiner les résultats du deuxième réseau.

Importance d'une Segmentation Précise des Bâtiments

Il y a plein de situations où des contours de bâtiments clairs et précis sont critiques, comme le développement urbain, l'évaluation des dommages après une catastrophe, ou le suivi des changements dans les paysages urbains. Une meilleure segmentation peut fournir les infos nécessaires pour ces applications.

L'Administration norvégienne de la cartographie, par exemple, se base beaucoup sur les données des bâtiments pour mettre à jour les ressources cartographiques. Ces données sont généralement collectées manuellement, ce qui peut prendre beaucoup de temps et de ressources. Utiliser des techniques d'apprentissage plus profond peut alléger cette charge et aider à garder les données à jour.

Défis pour Produire des Masques de Segmentation de Qualité

Créer des masques de segmentation clairs peut être difficile à cause de la qualité des données d'entraînement. Les images aériennes contiennent souvent divers problèmes optiques qui peuvent nuire à la performance des modèles. Par exemple, les ombres et les reflets peuvent obscurcir des parties des bâtiments. En plus, des objets comme les arbres et les lignes électriques peuvent bloquer les vues, rendant ça encore plus compliqué.

Du coup, les méthodes existantes échouent souvent à fournir la segmentation précise nécessaire pour des applications de haute qualité comme la création de cartes. Ça laisse un vide dans la recherche sur comment améliorer les masques de segmentation.

Le Besoin d'Améliorer la Précision

Bien que plusieurs applications puissent fonctionner avec moins de précision, comme l'évaluation des dégâts ou la simple détection de changements, le besoin d'exactitude est très élevé quand il s'agit de production de cartes. Donc, le manque de précision des méthodes actuelles doit être abordé.

Beaucoup de modèles doivent bien fonctionner avec une variété de types de bâtiments, de formes et de leurs environnements environnants. Ça inclut tout, des centres urbains aux zones reculées.

Aperçu du Processus DeNISE

La méthode DeNISE fonctionne en combinant les sorties de différents réseaux pour améliorer la précision. Ça commence avec un réseau qui produit des prédictions à partir des données originales. Cette sortie est ensuite améliorée soit en modifiant directement l'image originale soit en ajoutant les prédictions comme une couche d'information supplémentaire.

Les données modifiées sont ensuite fournies à un deuxième réseau pour l'entraînement ou la prédiction des résultats. Cette méthode permet d'essayer différents modèles pour voir quelles combinaisons fonctionnent le mieux ensemble, rendant l'expérimentation plus rapide et plus facile.

Utiliser les Images Aériennes pour la Segmentation

Pour tester DeNISE, un ensemble d'images spécifique appelé le dataset NMA a été utilisé. Ce dataset inclut diverses images aériennes avec des données de vérité terrain correspondantes qui montrent les emplacements réels des bâtiments. Il a un mélange d'images utilisées pour l'entraînement, la validation et le test.

Configuration de l'Expérience

Pour les expériences, deux types de réseaux ont été utilisés : des réseaux de segmentation et un réseau de détection de contours. Différents modèles ont été employés pour voir comment ils se comportaient.

Les modèles ont été entraînés pendant un certain nombre d'époques (répétitions) avec des réglages spécifiques comme la taille des lots et le taux d'apprentissage. La performance de chaque modèle a été mesurée en utilisant des métriques importantes, y compris l'Intersection-sur-Union (IoU), qui aide à déterminer à quel point les segments prédits correspondent aux segments réels.

Résultats de DeNISE

Les résultats ont montré que DeNISE a amélioré la qualité de la segmentation pour plusieurs modèles testés. Cependant, la performance variait. Certains modèles ont mieux performé que d'autres, et les résultats ont indiqué que l'efficacité du premier modèle avait une influence significative sur le résultat global.

En utilisant Seg-DeNISE, il y avait des résultats incohérents, ce qui signifie que le deuxième modèle ne corrigeait pas toujours les erreurs faites par le premier réseau. En revanche, Edge-DeNISE avait tendance à donner de meilleurs résultats, montrant que la performance du réseau de détection des contours était cruciale pour améliorer les résultats.

Directions Futures pour la Recherche

Il y a plein de domaines où DeNISE pourrait évoluer davantage. Quelques suggestions incluent :

  1. Essayer des modèles de détection d'objets comme premier réseau pour potentiellement améliorer l'apprentissage.
  2. Expérimenter d'autres combinaisons de réseaux pour voir quels réglages donnent les meilleurs résultats.
  3. Se concentrer sur l'amélioration des techniques de détection des bords qui pourraient booster encore plus la performance d'Edge-DeNISE.
  4. Examiner le potentiel d'entraîner les deux réseaux de façon unifiée où ils peuvent partager l'information plus efficacement.
  5. Considérer l'ordre inverse d'Edge-DeNISE, en plaçant le réseau de segmentation en premier suivi de la détection des bords.

Conclusion

En conclusion, la technique DeNISE montre un potentiel pour améliorer les masques de segmentation dans les tâches de segmentation des bâtiments. Bien que Seg-DeNISE ait eu des résultats mitigés, Edge-DeNISE a mieux performé de manière plus consistante. La recherche continue sur ces méthodes et leurs combinaisons pourrait mener à de meilleurs outils pour l'urbanisme, la gestion des catastrophes et d'autres applications qui dépendent de contours de bâtiments clairs. En renforçant la puissance des modèles existants, on peut finalement créer des systèmes plus efficaces et performants.

Source originale

Titre: DeNISE: Deep Networks for Improved Segmentation Edges

Résumé: This paper presents Deep Networks for Improved Segmentation Edges (DeNISE), a novel data enhancement technique using edge detection and segmentation models to improve the boundary quality of segmentation masks. DeNISE utilizes the inherent differences in two sequential deep neural architectures to improve the accuracy of the predicted segmentation edge. DeNISE applies to all types of neural networks and is not trained end-to-end, allowing rapid experiments to discover which models complement each other. We test and apply DeNISE for building segmentation in aerial images. Aerial images are known for difficult conditions as they have a low resolution with optical noise, such as reflections, shadows, and visual obstructions. Overall the paper demonstrates the potential for DeNISE. Using the technique, we improve the baseline results with a building IoU of 78.9%.

Auteurs: Sander Riisøen Jyhne, Per-Arne Andersen, Morten Goodwin

Dernière mise à jour: 2023-09-05 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.02091

Source PDF: https://arxiv.org/pdf/2309.02091

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires