Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Intelligence artificielle# Apprentissage automatique

Avancées dans les réseaux de neurones binarisés pour la reconnaissance des panneaux de signalisation

La recherche se concentre sur des modèles efficaces pour la détection des panneaux de signalisation en utilisant des BNN.

― 6 min lire


BNNs pour la détection deBNNs pour la détection depanneaux de signalisationsignalisation dans la conduitereconnaissance des panneaux deDes modèles efficaces améliorent la
Table des matières

Les panneaux de signalisation jouent un rôle super important pour garder les routes sécurisées et gérer le trafic. Ils sont essentiels pour tout système qui veut aider les voitures à conduire toutes seules. Reconnaître ces panneaux correctement est crucial pour que ces systèmes fonctionnent bien. Même si les méthodes de deep learning, surtout les réseaux de neurones convolutionnels (CNN), ont montré des résultats impressionnants dans la classification des panneaux de signalisation, il y a encore un manque de connaissance sur les Réseaux de neurones binarisés (BNN). Les BNN peuvent être plus petits et plus rapides que les CNN, ce qui les rend adaptés aux appareils qui n’ont pas beaucoup de puissance de calcul, comme ceux des véhicules autonomes.

Qu'est-ce que les réseaux de neurones binarisés ?

Les réseaux de neurones binarisés sont des types spéciaux de réseaux de neurones qui n’utilisent que deux valeurs pour leurs poids (les valeurs qui aident l’algorithme à apprendre) et leurs activations (les résultats des calculs dans le réseau). Cette approche binaire réduit considérablement la taille du modèle et accélère les calculs, ce qui est super important pour les appareils qui ont des ressources limitées. L’objectif est de créer des BNN qui soient suffisamment efficaces pour fonctionner dans des conditions réelles, comme celles des voitures qui roulent sans aide humaine.

Défis de la reconnaissance des panneaux de signalisation

Créer un système qui reconnaît les panneaux de signalisation, c’est pas simple. Les scènes de trafic peuvent être compliquées avec divers facteurs comme les conditions météorologiques, l’éclairage, et la présence d’obstacles qui peuvent cacher les panneaux. Un problème courant pour ces systèmes, c’est leur sensibilité aux entrées inhabituelles ou inattendues, connues sous le nom d’exemples adversaires. Ces derniers peuvent faire en sorte que le système identifie mal les panneaux ou ne les reconnaisse pas du tout. Résoudre ces faiblesses est essentiel pour rendre les systèmes de reconnaissance des panneaux plus fiables.

Une solution à ce souci est de vérifier que le modèle entraîné peut gérer ces situations délicates efficacement. Cela implique de vérifier si le modèle se comporte correctement lorsqu'il rencontre des entrées adversaires ou des occlusions (quand des objets bloquent la vue des panneaux).

Objectifs de la recherche

Le principal objectif de cette recherche est de créer des architectures pour les BNN qui excellent dans la reconnaissance des panneaux de signalisation. Plus précisément, l’idée est de trouver des designs de réseau qui non seulement performent bien en termes de précision, mais qui ont aussi une taille de modèle plus petite. Ça facilite la vérification de leurs performances, surtout dans les tâches de conduite autonome où la fiabilité est cruciale.

Pour y arriver, les chercheurs explorent différentes configurations pour les couches de ces réseaux, y compris différentes tailles de noyaux, nombres de filtres et neurones. Ils utilisent des ensembles de données de panneaux de signalisation allemands pour l’entraînement et testent leurs modèles sur d'autres ensembles de données venant de Belgique et de Chine.

Ensembles de données utilisés pour les tests

Le German Traffic Sign Recognition Benchmark (GTSRB) est un ensemble de données largement utilisé qui contient plein d’images de panneaux de signalisation. Il inclut 43 classes de panneaux, certaines classes ayant jusqu’à 2 250 images. Les chercheurs utilisent aussi les ensembles de données belges et chinois pour voir comment leurs modèles performent sur des panneaux qui ne sont pas inclus dans le GTSRB.

L’ensemble de données belge contient 6 095 images de panneaux de signalisation réparties sur 62 classes, tandis que l’ensemble chinois compte 5 998 images de 58 classes. Pour la cohérence, les chercheurs renomme les classes dans ces ensembles de données pour les faire correspondre à celles du GTSRB.

Création des architectures

La recherche implique une approche systématique pour créer des architectures de réseaux de neurones efficaces. Les auteurs se concentrent sur la conception des blocs internes des réseaux de neurones-qui incluent des couches qui transforment les données-comme les couches convolutionnelles et les couches de normalisation.

En analysant comment différentes combinaisons de ces couches performent, les chercheurs peuvent identifier des designs qui offrent une meilleure précision tout en maintenant une taille de modèle plus petite. Ils adoptent une approche ascendante, en commençant par des blocs de base et en ajoutant progressivement de la complexité en fonction des performances observées.

Résultats de la recherche

Les chercheurs réussissent à obtenir plusieurs architectures de réseau qui montrent une grande précision dans la reconnaissance des panneaux de signalisation tout en gardant un nombre réduit de paramètres. Ils constatent que certaines configurations performent mieux que d’autres, surtout en ce qui concerne la gestion du compromis entre précision et taille du modèle.

Avec ces architectures, ils atteignent des niveaux de précision significatifs sur le GTSRB et les autres ensembles de données. Ils remarquent aussi que les réseaux avec moins de paramètres mais une précision supérieure performent bien lors des tests.

Cependant, ils trouvent aussi un peu de confusion dans les résultats de classification. Par exemple, certains panneaux comme "Fin de la limitation de vitesse" peuvent être mal classés à cause de similarités visuelles avec d'autres panneaux. C’est pareil pour d'autres ensembles de données où les panneaux ressemblent moins à ceux utilisés pendant l’entraînement.

Importance de la vérification du modèle

Bien que d’atteindre une haute précision soit important, vérifier qu’un modèle se comportera correctement dans des conditions réelles est tout aussi critique. Le défi réside dans le fait de s'assurer que l'architecture conçue peut gérer divers scénarios inattendus sans faillir. Cette vérification sera un domaine clé de travail futur pour les chercheurs, car garantir la fiabilité est essentiel pour l'application plus large des technologies de conduite autonome.

Conclusion

Cette recherche présente avec succès plusieurs nouvelles architectures pour des réseaux de neurones binarisés visant la reconnaissance des panneaux de signalisation. Les résultats indiquent que les BNN peuvent obtenir de bons résultats tout en étant suffisamment efficaces pour une utilisation dans des appareils avec des ressources de calcul limitées. Ces avancées promettent un développement continu de systèmes plus fiables et précis pour la conduite autonome. En continuant à se concentrer sur la vérification, les chercheurs visent à assurer que ces systèmes peuvent fonctionner en toute sécurité dans les diverses conditions de conduite quotidienne.

En gros, à mesure que la technologie progresse vers des véhicules entièrement autonomes, le travail sur la reconnaissance des panneaux de signalisation devient de plus en plus vital, ouvrant la voie à des routes plus sûres et de meilleurs systèmes.

Source originale

Titre: Architecturing Binarized Neural Networks for Traffic Sign Recognition

Résumé: Traffic signs support road safety and managing the flow of traffic, hence are an integral part of any vision system for autonomous driving. While the use of deep learning is well-known in traffic signs classification due to the high accuracy results obtained using convolutional neural networks (CNNs) (state of the art is 99.46\%), little is known about binarized neural networks (BNNs). Compared to CNNs, BNNs reduce the model size and simplify convolution operations and have shown promising results in computationally limited and energy-constrained devices which appear in the context of autonomous driving. This work presents a bottom-up approach for architecturing BNNs by studying characteristics of the constituent layers. These constituent layers (binarized convolutional layers, max pooling, batch normalization, fully connected layers) are studied in various combinations and with different values of kernel size, number of filters and of neurons by using the German Traffic Sign Recognition Benchmark (GTSRB) for training. As a result, we propose BNNs architectures which achieve more than $90\%$ for GTSRB (the maximum is $96.45\%$) and an average greater than $80\%$ (the maximum is $88.99\%$) considering also the Belgian and Chinese datasets for testing. The number of parameters of these architectures varies from 100k to less than 2M. The accompanying material of this paper is publicly available at https://github.com/apostovan21/BinarizedNeuralNetwork.

Auteurs: Andreea Postovan, Mădălina Eraşcu

Dernière mise à jour: 2023-03-27 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.15005

Source PDF: https://arxiv.org/pdf/2303.15005

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires