Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Progrès dans la détection de petits objets avec HIC-YOLOv5

HIC-YOLOv5 améliore la détection des petits objets dans les images prises par des drones.

― 8 min lire


HIC-YOLOv5 améliore laHIC-YOLOv5 améliore ladétection d'objets.la détection des petits objets.Nouveau modèle améliore l'efficacité de
Table des matières

Détecter de petits objets dans les images, c'est vraiment un défi pour la technologie qui essaie de reconnaître ce qu'il y a sur les photos. C'est surtout compliqué avec les drones, qui prennent des images d'en haut. Vu de là-haut, beaucoup d'objets semblent plus petits. Ça complique le boulot des systèmes pour les repérer correctement, ce qui peut mener à des erreurs dans la reconnaissance des piétons, des véhicules et d'autres trucs.

Une méthode populaire pour reconnaître des objets dans les images, c'est YOLO, ça veut dire "You Only Look Once." Ce truc traite les images super vite et a montré de bons résultats dans divers domaines, y compris ceux avec des drones. Mais même YOLO a des soucis pour détecter les petits objets, qui sont souvent perdus ou pas reconnus. Il y a eu des tentatives pour améliorer la capacité de YOLO à détecter ces petits objets, mais beaucoup de ces solutions coûtent cher en puissance de calcul, ce qui rend leur utilisation en temps réel difficile, comme quand un drone vole.

Pour régler ces soucis, une nouvelle version de YOLO a été développée pour mieux détecter les petits objets avec moins de puissance de calcul. Ce modèle mis à jour introduit quelques changements clés qui rendent la détection des petits items non seulement plus facile mais aussi plus rapide.

Améliorations Clés

Nouvelle Tête de Prédiction

Un changement majeur, c'est l'ajout d'une nouvelle partie appelée tête de prédiction qui se concentre uniquement sur les petits objets. Cette nouvelle tête est conçue pour fonctionner avec des images de résolution plus élevée, permettant de capturer plus de détails sur les petits items dans l'image. En utilisant ces images plus nettes, le système peut plus facilement identifier les petits objets qui auraient pu être ratés dans des images de basse résolution.

Involution Block

Ensuite, le nouveau modèle inclut quelque chose appelé un involution block. Cette fonction se situe entre deux sections principales du modèle - le backbone et le neck. Le backbone est là où le traitement initial de l'image a lieu, tandis que le neck aide à combiner l'information de différentes étapes avant de faire des prévisions finales. L'involution block aide à améliorer les informations partagées entre ces deux sections, assurant que plus de détails utiles soient conservés pendant le traitement.

Mécanisme d'Attention

Enfin, un mécanisme d'attention nommé CBAM (Convolutional Block Attention Module) a été ajouté à la fin du backbone. Ce mécanisme aide à se concentrer sur les caractéristiques les plus importantes dans l'image tout en réduisant les informations inutiles. En priorisant les détails utiles, le système peut faire de meilleures prévisions tout en utilisant moins de ressources de calcul.

Applications de la Détection d'Objets avec des Drones

La détection d'objets est de plus en plus importante dans divers domaines, surtout dans la technologie qui dépend des drones. Les drones peuvent être utilisés pour surveiller le trafic, repérer des accidents, ou même chercher des personnes perdues. Mais, beaucoup d'images prises par des drones contiennent des petits objets qui pourraient facilement être négligés.

Par exemple, si un drone cherche des piétons ou des véhicules dans des zones urbaines animées, sa capacité à identifier correctement ces objets peut être cruciale. Si les petites voitures ou les gens ne sont pas détectés, ça pourrait fausser l’analyse générale de la scène.

Défis de la Détection de Petits Objets

La détection de petits objets présente divers défis, surtout quand il s'agit de drones. Quand on les regarde de loin, ces objets peuvent ne représenter qu'une petite partie de l'image. Cette petite représentation peut entraîner des problèmes comme :

  • Occlusion : Quand plusieurs objets sont proches les uns des autres, certains peuvent en bloquer d'autres, rendant difficile l'identification de tous.
  • Basse Densité : Dans certaines situations, les petits objets sont éparpillés dans l'image, rendant leur reconnaissance efficace plus hardue.
  • Conditions d'Éclairage Variées : Les images prises sous différents éclairages peuvent affecter la visibilité des objets, compliquant le processus de détection.

Tous ces soucis peuvent mener à moins de précision dans la détection des petits objets.

Fondamentaux de l'Algorithme YOLO

L'algorithme YOLO fonctionne en découpant une image en une grille et en prédisant des boîtes englobantes et des probabilités pour chaque cellule de la grille simultanément. Cela permet une détection plus rapide par rapport aux anciennes méthodes, qui prennent souvent plus d'étapes pour identifier les objets.

YOLO est efficace, mais la version originale avait du mal avec les petits objets. Au fur et à mesure des évolutions de YOLO, des améliorations ont été introduites, mais des défis restaient, surtout pour détecter les petits items depuis de grandes hauteurs.

Améliorations dans HIC-YOLOv5

Le modèle mis à jour, connu sous le nom de HIC-YOLOv5, inclut trois améliorations importantes visant à augmenter la détection des petits objets et à rendre le processus plus efficace :

  1. Tête de Détection de Petits Objets : Cette tête permet au modèle de se concentrer sur les petits items dans des images haute résolution, assurant une meilleure extraction des caractéristiques.

  2. Involution Block : Cet ajout aide à maintenir des informations cruciales entre le backbone et le neck, permettant de partager des détails riches sans perdre des données importantes.

  3. Attention CBAM : Un mécanisme d'attention qui affine quelles caractéristiques sur lesquelles se concentrer, s'assurant que les données les plus pertinentes soient mises en avant, ce qui améliore en fin de compte la performance globale.

Résultats Expérimentaux

Le nouveau modèle a été testé sur un ensemble de données spécifique collecté à partir de vidéos de drones appelé le dataset VisDrone-2019. Cet ensemble de données est conçu pour évaluer comment différentes méthodes de détection peuvent identifier des objets dans diverses conditions, y compris des environnements urbains encombrés et des zones rurales.

Lors des tests, HIC-YOLOv5 a montré des améliorations par rapport aux versions précédentes de YOLO dans plusieurs domaines clés :

  • Precision Moyenne (mAP) : Indicateur de la précision de détection globale. Le nouveau modèle a obtenu un score significativement plus élevé, montrant sa capacité améliorée à trouver des petits objets.
  • Précision et Rappel : Ces métriques se sont également améliorées, ce qui signifie que le modèle a non seulement détecté plus d'objets correctement mais aussi eu moins de fausses alertes.

Des comparaisons visuelles entre l'ancien et le nouveau modèle révèlent que HIC-YOLOv5 est plus capable d'identifier des petits objets, surtout dans des environnements encombrés.

Comparaison avec d'Autres Modèles

HIC-YOLOv5 a également été évalué par rapport à d'autres algorithmes de détection d'objets actuels. Les résultats ont montré qu'il surclassait beaucoup d'entre eux, surtout en ce qui concerne la détection des petits objets. C'est une réussite notable car certains modèles concurrents s'appuient sur des structures complexes qui augmentent les coûts de calcul, tandis que HIC-YOLOv5 maintient l'efficacité avec son design plus simple.

Efficacité Computationnelle

Une autre force de HIC-YOLOv5 réside dans son efficacité computationnelle. En utilisant la nouvelle tête de prédiction, l'involution block et le mécanisme d'attention, le modèle réussit à maintenir une bonne performance tout en minimisant le temps et les ressources nécessaires pour le traitement. C'est crucial lorsque l'on considère des applications dans des systèmes en temps réel comme les drones.

Conclusion

En résumé, la détection de petits objets reste un défi critique dans la reconnaissance d'images, particulièrement dans des scénarios impliquant des drones. Le développement de HIC-YOLOv5 offre une solution prometteuse en se concentrant sur les petites cibles avec de meilleures méthodes qui mettent l'accent sur l'efficacité et la précision. Avec ses nouvelles fonctionnalités, ce modèle peut considérablement améliorer la capacité à détecter des petits objets, en faisant un outil précieux dans diverses applications pratiques. À mesure que la technologie continue de s'améliorer, il est probable qu'elle soit utilisée plus largement dans des domaines comme la gestion du trafic, les opérations de recherche et de sauvetage, et l'aménagement urbain.

Source originale

Titre: HIC-YOLOv5: Improved YOLOv5 For Small Object Detection

Résumé: Small object detection has been a challenging problem in the field of object detection. There has been some works that proposes improvements for this task, such as adding several attention blocks or changing the whole structure of feature fusion networks. However, the computation cost of these models is large, which makes deploying a real-time object detection system unfeasible, while leaving room for improvement. To this end, an improved YOLOv5 model: HIC-YOLOv5 is proposed to address the aforementioned problems. Firstly, an additional prediction head specific to small objects is added to provide a higher-resolution feature map for better prediction. Secondly, an involution block is adopted between the backbone and neck to increase channel information of the feature map. Moreover, an attention mechanism named CBAM is applied at the end of the backbone, thus not only decreasing the computation cost compared with previous works but also emphasizing the important information in both channel and spatial domain. Our result shows that HIC-YOLOv5 has improved mAP@[.5:.95] by 6.42% and [email protected] by 9.38% on VisDrone-2019-DET dataset.

Auteurs: Shiyi Tang, Shu Zhang, Yini Fang

Dernière mise à jour: 2023-11-09 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.16393

Source PDF: https://arxiv.org/pdf/2309.16393

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires