Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Intelligence artificielle

Améliorer la détection des piétons en basse lumière

Combiner des images infrarouges et visibles améliore la détection des piétons la nuit.

― 7 min lire


Détection des piétonsDétection des piétonsrefaitetechniques de visibilité avancées.Améliorer la sécurité grâce à des
Table des matières

Détecter les piétons la nuit ou dans des conditions de faible luminosité est super important pour plein de technologies, surtout en sécurité et en transport. Le défi, c'est d'obtenir des images claires des gens quand la visibilité est nulle. Les caméras infrarouges, qui peuvent voir la chaleur, aident bien dans ces situations. En combinant des images infrarouges avec des images normales, ce qu’on appelle la fusion d’images, on peut obtenir de meilleurs résultats pour détecter les piétons. Cet article explique comment ça fonctionne, les techniques et les outils utilisés pour identifier les gens sur ces images.

Fusion d'images

La fusion d'images combine plusieurs images en une seule. Ça aide à créer une image plus claire avec les avantages des deux. Par exemple, une caméra normale capture la couleur et les détails, tandis qu'une caméra infrarouge détecte les signatures thermiques. Quand on mélange tout ça, le résultat montre plus de caractéristiques, comme la chaleur d'une personne sur un fond froid.

Il existe plusieurs techniques de fusion d'images. Une méthode s'appelle la Fusion par Transfert de Gradient. Cette technique prend les détails nets d'une image couleur et les patterns de chaleur d'une image infrarouge. En combinant les deux, on obtient des détails plus clairs, comme les contours d'une personne dans un décor nocturne.

Une autre méthode populaire est FusionGAN, qui utilise de l'intelligence artificielle pour créer une nouvelle image fusionnée. Ici, une partie du système crée l'image en mixant les éléments importants des deux types d'images, tandis qu'une autre partie vérifie que la nouvelle image a l'air bien et garde les détails importants. Ça permet une fusion d'images efficace sans nécessiter des règles manuelles complexes.

DenseFuse est une autre méthode qui utilise une façon structurée pour garder les détails fins dans les images. Elle décompose les images en parties et les combine de manière à conserver les caractéristiques les plus importantes. Cette technique a montré de bons résultats pour créer des images de haute qualité.

IFCNN est une approche différente basée sur un type de réseau de neurones. Elle se concentre sur l'extraction de caractéristiques des deux images, les fusionne, puis crée une nouvelle image. Cette approche a bien fonctionné, fournissant des résultats de qualité dans diverses tâches.

Une méthode plus récente, appelée SeAFusion, ajoute une dimension différente en se concentrant sur les détails importants et le contexte. Elle utilise des techniques avancées pour maintenir les détails et améliorer l'apparence globale de l'image finale. Cette méthode montre des résultats prometteurs pour de nombreuses applications.

Détection d'objets

Une fois les images fusionnées, l'étape suivante est d'identifier les piétons. Les systèmes de détection d'objets sont conçus pour trouver et identifier des objets dans une image. Un des systèmes les plus connus pour ça, c'est YOLO, ou You Only Look Once. Ce système analyse une image et prédit où se trouvent les objets et ce qu'ils sont.

Il existe différentes versions de YOLO. Par exemple, YOLOv3 utilise une bonne architecture de base, ce qui l'aide à mieux performer que les versions précédentes. YOLOv5 est même plus récent et se concentre sur le fait d'être plus petit et plus rapide sans perdre en précision. Ces systèmes sont populaires pour leur efficacité et leur précision à détecter divers objets, y compris les gens.

Une tendance récente dans la détection d'objets utilise un système appelé Vision Transformer (ViT). À l'origine conçu pour traiter le langage, ce système a montré qu'il fonctionne bien avec les images aussi. Il examine les images d'une manière unique et obtient des résultats compétitifs dans les tâches de détection d'objets.

Pour notre projet, on va travailler avec un ensemble spécifique d'images appelé le jeu de données LLVIP. Cette collection contient un grand nombre d'images capturées dans des conditions de faible luminosité, ce qui en fait un choix parfait pour tester des techniques de détection de piétons.

Nouvelle approche

Bien qu'il existe plein de méthodes pour détecter les piétons, il y a un manque d'utilisation de ViT comme méthode principale pour cette tâche dans les images fusionnées. Notre projet vise à combler cette lacune en utilisant ViT pour détecter spécifiquement les piétons à partir de ces images fusionnées. Cette approche rend notre projet unique, car elle combine la fusion d'images avec une technique de détection d'objets à la pointe.

Plan de projet

Notre projet a deux grands objectifs :

  1. Choisir la meilleure méthode de fusion d'images et l'appliquer pour créer des images plus claires.
  2. Utiliser le système Vision Transformer pour trouver les piétons dans ces nouvelles images fusionnées.

Pour s'assurer que nous avons une base solide, nous allons d'abord configurer les outils nécessaires et reproduire des travaux existants pour établir une référence. Ce processus aidera à s'assurer que nos résultats peuvent être comparés aux résultats précédents.

Rôles et responsabilités

Pour que le projet se déroule bien, nous avons réparti les tâches entre les membres de l'équipe :

  • Un membre va configurer les systèmes nécessaires et reproduire les résultats antérieurs pour créer une base de comparaison.
  • Un autre membre va se concentrer sur la sélection de la meilleure technique de fusion d'images et l'appliquer à nos images test.
  • Le dernier membre sera responsable de la mise en œuvre du système Vision Transformer pour détecter les piétons dans les images fusionnées.

Importance de la recherche

La recherche sur la détection des piétons, surtout dans des conditions de faible luminosité, a une grande valeur. À mesure que les villes grandissent et que la technologie progresse, assurer la sécurité des piétons et améliorer la sécurité des transports devient crucial. La capacité à détecter les gens avec précision dans des environnements sombres peut mener à des systèmes de sécurité améliorés dans les véhicules, des applications pour des villes intelligentes, et diverses technologies de sécurité.

Utiliser des techniques avancées comme la fusion d'images et la détection d'objets aide non seulement à répondre aux défis actuels mais pave aussi la voie pour des innovations futures. En améliorant notre capacité à voir et à comprendre notre environnement, nous faisons des pas vers un monde plus sûr et plus efficace.

Conclusion

Détecter les piétons dans des conditions de faible luminosité reste un problème pressant à mesure que la technologie continue de se développer. Grâce à la combinaison d'images infrarouges et visibles, on peut créer des visuels plus clairs qui aident à identifier les piétons. Notre approche unique d'utiliser Vision Transformer pour ça met en avant l'importance d'intégrer des techniques modernes dans le traitement d'images et la détection d'objets.

En continuant à affiner nos méthodes et techniques, nous contribuons à une avancée significative dans les systèmes de sécurité et de détection des piétons, favorisant un futur où la technologie répond avec succès aux défis du monde réel.

Articles similaires