Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Améliorer la reconnaissance de plaques d'immatriculation avec plusieurs angles

Une nouvelle méthode améliore la reconnaissance des plaques d'immatriculation en utilisant des images prises sous différents angles de caméra.

― 7 min lire


Percée en reconnaissancePercée en reconnaissancede plaquesd'immatriculationplaques d'immatriculation de manièrel'exactitude de la reconnaissance desUne nouvelle méthode booste
Table des matières

Reconnaître les plaques d'immatriculation à partir d'images prises par des caméras, c'est un vrai casse-tête. Même si certaines méthodes ont amélioré la précision, il y a encore besoin de meilleures solutions qui fonctionnent dans des situations de la vie réelle. Cet article examine une nouvelle méthode qui utilise plusieurs angles de caméra et combine différentes images pour reconnaître les plaques.

L'Importance de la Reconnaissance de Plaques

Avec la population mondiale qui augmente, le trafic est devenu plus compliqué. Des Systèmes de Transport Intelligent (STI) ont été développés pour aider à gérer le trafic. Une partie clé de ces systèmes est la capacité de reconnaître automatiquement les plaques d'immatriculation. Le processus comprend généralement plusieurs étapes : transformer les images des caméras en un format exploitable par ordinateur, trouver la plaque dans l'image, reconnaître les caractères sur la plaque, et ensuite afficher les résultats.

Méthodes Traditionnelles de Reconnaissance de Plaques

Dans les méthodes traditionnelles, les plaques sont considérées comme des zones spécifiques à examiner, et les caractères sont reconnus dans un certain ordre. Certains systèmes utilisent des techniques qui comparent les caractères à des modèles stockés dans une base de données. Ça fonctionne bien, mais seulement si la plaque est claire et non obstruée. Si la plaque est difficile à voir ou mal fixée au véhicule, les résultats peuvent être erronés.

Pour améliorer la reconnaissance, certains chercheurs ont suggéré d'utiliser des caractéristiques supplémentaires de la plaque au lieu de se fier uniquement au texte. Les modèles d'apprentissage profond gagnent également en popularité. Ces modèles apprennent des caractéristiques des images directement, sans avoir besoin d'extraire d'abord des caractéristiques spécifiques. Certains modèles récents utilisent deux flux d'informations : un pour les caractéristiques du véhicule et un autre pour celles de la plaque. Cependant, beaucoup de ces modèles ne fonctionnent qu'à un seul angle.

Avec les avancées technologiques des caméras, il est désormais possible de collecter des images sous plusieurs angles. Plusieurs angles offrent différentes vues de la plaque, ce qui peut aider à améliorer la précision de la reconnaissance. Cet article présente un nouveau modèle qui utilise une architecture d'apprentissage profond spécifique pour mieux reconnaître les plaques d'immatriculation en prenant des photos sous différents angles.

Étapes de Reconnaissance de Plaques

Le processus de reconnaissance des plaques peut être divisé en deux parties principales : détecter la plaque et reconnaître le texte qui y est inscrit.

Détection de Plaques

Récemment, des méthodes basées sur la vision par ordinateur ont attiré l'attention dans les applications STI. Une détection précise des plaques d'immatriculation est cruciale pour le suivi du trafic. De nombreux systèmes à caméra unique utilisant des Réseaux de Neurones Convolutionnels (RNC) ont été explorés, mais ils ont souvent du mal à détecter les plaques partiellement bloquées. Les systèmes multi-caméras peuvent aider en utilisant les données de différentes caméras pour améliorer les chances de détection réussie.

Certains chercheurs ont utilisé des techniques comme les transformations en ondelettes pour détecter et localiser les plaques. D'autres ont développé des cadres de segmentation populaires pour faciliter l'identification des objets potentiels. Le modèle YOLO (You Only Look Once) et ses versions plus récentes sont particulièrement appréciés pour leur rapidité et leur précision.

Reconnaissance de Plaques

Dans la phase de reconnaissance, certains systèmes décomposent les caractères sur la plaque en parties avant de les identifier. Ces méthodes peuvent varier, y compris des techniques traditionnelles qui analysent les composants connectés ou les contours. D’autres chercheurs se sont concentrés sur la reconnaissance des caractères sans les séparer, transformant le problème en une tâche de labellisation de séquence. Certains modèles avancés segmentent et reconnaissent les caractères individuels simultanément.

Méthode Proposée

Cet article présente une nouvelle approche qui inclut trois composants principaux : un modèle YOLO pour détecter les plaques, un algorithme de fusion d'images pour sélectionner la meilleure image, et un modèle de Reconnaissance Optique de Caractères (OCR) pour reconnaître les caractères.

Modèle YOLO pour la Détection

Le modèle YOLOv8 est utilisé pour détecter les plaques dans les images. Ce modèle a été choisi pour sa capacité à traiter les images rapidement tout en maintenant une haute précision, ce qui est essentiel pour les applications en temps réel. Le système fonctionne avec des images haute résolution collectées de différents types de véhicules et de plaques vietnamiennes. Le modèle YOLO identifie non seulement les plaques mais aussi différents types de véhicules.

Si plusieurs plaques sont détectées dans une seule image, le système peut prendre plus de temps pour reconnaître chacune par rapport à des images avec une seule plaque.

Algorithme de Fusion d'Images

Pour améliorer la précision de détection, un algorithme de fusion d'images est mis en œuvre. Ce processus combine des images provenant de différents angles pour produire une vue plus claire de la plaque. L'algorithme évalue les zones de chevauchement des images pour créer une image unique de la meilleure qualité. Cette image améliorée aide à extraire avec précision les caractères pour la reconnaissance.

Modèle OCR pour la Reconnaissance de Caractères

Au cœur du processus de reconnaissance de caractères se trouve le modèle CnOCR. Il commence par une couche convolutionnelle qui capture les caractéristiques de base de l'image d'entrée. Ensuite, plusieurs couches travaillent à réduire la taille de l'image tout en conservant les détails importants. Après avoir traversé toutes les couches, le modèle utilise une technique avancée pour prédire les caractères sur la plaque d'immatriculation.

Le modèle CnOCR est conçu pour la rapidité et la précision, atteignant des performances impressionnantes dans la reconnaissance rapide des plaques.

Ensemble de Données et Processus d'Entraînement

L'ensemble de données utilisé comprend 500 images étiquetées de plaques d'immatriculation, collectées à travers diverses caméras. Ces images sont prises sous différents angles dans divers emplacements pour assurer la diversité. L'entraînement implique de régler divers paramètres et de perfectionner les modèles pour atteindre de meilleures performances au fil du temps.

Des fonctions de perte sont appliquées pendant l'entraînement pour mesurer à quel point le modèle apprend bien. En analysant les valeurs de perte, les chercheurs peuvent voir comment le modèle s'améliore à chaque cycle d'entraînement.

Résultats Expérimentaux

La performance du modèle proposé est évaluée à l'aide du Score F1, qui mesure l'équilibre entre la précision et le rappel. Les résultats montrent que la nouvelle méthode surpasse les techniques existantes, atteignant des scores F1 de 91,3% sur le nouvel ensemble de données et 90,8% sur un ensemble de données disponible publiquement.

La matrice de confusion indique que bien que le modèle puisse identifier correctement la plupart des plaques d'immatriculation, des défis demeurent lors de la manipulation d'images floues ou d'autres problèmes.

Application dans le Monde Réel

Pour tester le modèle dans un cadre pratique, il a été intégré dans un système qui gère plusieurs caméras dans une zone industrielle. Cette application réelle a démontré la capacité du modèle à traiter les images rapidement, avec un temps de détection moyen de seulement 0,1 seconde.

Conclusion

Cet article a discuté d'une nouvelle méthode de reconnaissance de plaques qui combine des images sous plusieurs angles et utilise des techniques avancées d'apprentissage profond. Les résultats expérimentaux montrent que cette approche peut significativement améliorer la précision, même dans des conditions difficiles. Les travaux futurs pourraient inclure l'utilisation de méthodes comme les Réseaux Antagonistes Génératifs (GAN) pour l'amélioration des données et l'exploration de l'apprentissage auto-supervisé pour affiner encore le modèle.

Source originale

Titre: License Plate Recognition Based On Multi-Angle View Model

Résumé: In the realm of research, the detection/recognition of text within images/videos captured by cameras constitutes a highly challenging problem for researchers. Despite certain advancements achieving high accuracy, current methods still require substantial improvements to be applicable in practical scenarios. Diverging from text detection in images/videos, this paper addresses the issue of text detection within license plates by amalgamating multiple frames of distinct perspectives. For each viewpoint, the proposed method extracts descriptive features characterizing the text components of the license plate, specifically corner points and area. Concretely, we present three viewpoints: view-1, view-2, and view-3, to identify the nearest neighboring components facilitating the restoration of text components from the same license plate line based on estimations of similarity levels and distance metrics. Subsequently, we employ the CnOCR method for text recognition within license plates. Experimental results on the self-collected dataset (PTITPlates), comprising pairs of images in various scenarios, and the publicly available Stanford Cars Dataset, demonstrate the superiority of the proposed method over existing approaches.

Auteurs: Dat Tran-Anh, Khanh Linh Tran, Hoai-Nam Vu

Dernière mise à jour: 2023-09-22 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.12972

Source PDF: https://arxiv.org/pdf/2309.12972

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires