Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Le Défi AI City met en avant les innovations dans le commerce de détail et les systèmes de circulation

La septième édition a montré comment l'IA aide à faire avancer la gestion du retail et du trafic.

― 8 min lire


Le défi de l'IA boosteLe défi de l'IA boosteles innovations dans leretail et la circulation.concrets en utilisant l'IA.impressionnantes pour des défisLes équipes ont présenté des solutions
Table des matières

Le AI City Challenge est un événement qui promeut l'utilisation de l'intelligence artificielle (IA) pour améliorer divers domaines pratiques. Pour sa septième édition, le Challenge s'est concentré sur deux grandes thématiques : les commerces de détail et les systèmes de circulation intelligents (ITS). Les deux domaines ont beaucoup d'opportunités d'amélioration. En 2023, le Challenge a attiré un nombre record de 508 équipes de 46 pays, une participation qui a nettement augmenté par rapport à l'année précédente.

Sujets du Challenge

Cette année, le Challenge a présenté cinq pistes différentes, chacune avec son propre focus.

Piste 1 : Suivi de Personnes Multi-Cibles Multi-Caméras (MTMC)

Dans cette nouvelle piste, les équipes ont travaillé sur le suivi de plusieurs personnes en mouvement à travers différentes caméras. Elles ont utilisé à la fois des vidéos réelles et des données synthétiques créées pour ressembler aux environnements réels. Le but était de suivre les individus alors qu'ils apparaissaient dans différents flux de caméras.

Piste 2 : Récupération de Suivi de Véhicules Basée sur le Langage Naturel

Pour cette piste, les équipes devaient rechercher des véhicules dans des vidéos enregistrées à l’aide de descriptions en langage naturel. Elles avaient un ensemble de vidéos avec des véhicules suivis et devaient faire correspondre ces véhicules aux descriptions fournies.

Piste 3 : Reconnaissance d'Actions de Conduite Naturelle

Dans cette piste, les équipes se concentraient sur l'identification des comportements de conduite distraits, comme envoyer des textos ou parler au téléphone. Elles utilisaient des vidéos enregistrées de l'intérieur des véhicules pour analyser les actions du conducteur et les classer en conséquence.

Piste 4 : Caisse Automatisée de Vente au Détail

Cette piste visait à créer un système capable d'identifier et de compter automatiquement les produits dans un cadre de vente au détail à l'aide d'une seule caméra. Les équipes ont reçu des données synthétiques pour s'entraîner et devaient développer des modèles fonctionnant efficacement dans un scénario de caisse réel.

Piste 5 : Détection de Non-Respect du Règle du Casque pour Motards

Dans cette piste, les équipes devaient déterminer si les motards portaient des casques. Elles utilisaient des vidéos provenant de caméras de circulation pour se concentrer sur la détection de l'utilisation des casques parmi les conducteurs.

Méthodes d'Évaluation

Pour évaluer la performance de chaque équipe, deux classements ont été créés : un pour les soumissions publiques, où les équipes ne pouvaient pas utiliser de données privées externes, et un classement général pour tous les résultats. Les participants ont soumis leurs résultats en fonction des méthodes qu'ils ont utilisées, qui ont ensuite été notées selon des critères prédéfinis.

Métriques Notables

Pour chaque piste, différentes métriques d'évaluation ont été utilisées. Par exemple, dans la Piste 1, le score IDF1 mesurait à quel point les équipes détectaient précisément les individus. La Piste 2 utilisait le Classement Réciproque Moyen (MRR) pour évaluer l'efficacité de la récupération de véhicules. Chaque piste avait des moyens spécifiques de calculer les scores pour garantir l'équité et un environnement compétitif.

Engagement des Participants

Cette année, la participation au Challenge a plus que doublé par rapport à l'année précédente. L'augmentation a été marquée par un intérêt croissant pour résoudre des problèmes complexes grâce à l'IA. Des équipes du monde entier ont soumis leurs approches et solutions, favorisant un environnement de collaboration et de partage des connaissances.

Défis et Solutions

Alors que les équipes travaillaient sur leurs projets, elles ont rencontré divers défis. Dans la Piste 1, par exemple, de nombreuses équipes ont eu du mal avec le grand nombre de vues de caméra et la nécessité de les étalonner précisément. Les futurs défis visent à simplifier ce processus et encourager les participants à utiliser des méthodes efficaces pour l'étalonnage des caméras.

Dans la Piste 2, les équipes devaient discuter de la relation entre le mouvement des véhicules et les descriptions en langage, en mettant l'accent sur l'importance de la structure des données. Elles ont exploré diverses approches pour améliorer leurs méthodes de récupération, ce qui a conduit à une augmentation significative de la performance.

Sources de Données et Innovation

Le Challenge a fourni aux équipes des ensembles de données diversifiés, comprenant à la fois des données du monde réel et des données synthétiques créées pour l'entraînement. L'utilisation de données synthétiques a permis aux équipes de simuler des scénarios qui pourraient être difficiles à capturer dans la vie réelle. Par exemple, un ensemble de données utilisait un environnement synthétique pour faciliter le suivi des personnes.

Les équipes ont utilisé une variété de techniques pour générer leurs ensembles de données, certaines incluant des animations de personnages et des conditions environnementales changeantes. Les ensembles de données synthétiques visaient à refléter les défis du monde réel, permettant aux équipes de pratiquer et d'affiner efficacement leurs modèles d'IA.

Principales Conclusions et Observations

Après la compétition, plusieurs conclusions clés ont émergé des expériences et soumissions des équipes participantes.

Piste 1 : Suivi de Personnes MTMC

Les équipes ont bien performé dans cette piste, atteignant des taux de précision impressionnants. Cependant, il a été noté que de nombreuses équipes ont traité les données réelles et synthétiques séparément au lieu de les intégrer efficacement. Cela indique une opportunité pour de futurs travaux axés sur l'amélioration des techniques d'adaptation au domaine.

Piste 2 : Récupération de Véhicules

Dans cette piste, l'utilisation de techniques avancées combinant informations textuelles et visuelles a considérablement amélioré les résultats de récupération. De nombreuses équipes ont utilisé des méthodes de post-traitement pour améliorer la performance de leurs modèles en fonction des requêtes en langage.

Piste 3 : Reconnaissance de Conduite Distrait

Les équipes se sont concentrées sur une série de techniques pour classer les comportements de conduite et identifier précisément quand des distractions se produisaient. Le défi a mis en lumière la nécessité d'améliorer les ensembles de données et d'obtenir un étiquetage propre pour faciliter des évaluations plus précises à l'avenir.

Piste 4 : Comptage de Produits de Vente au Détail

Une tendance notable a été l'accent mis sur l'optimisation de la qualité des données tant pour l'entraînement que pour les tests. Les équipes ont donné la priorité à l'amélioration de leurs ensembles de données, ce qui a contribué à de meilleurs algorithmes de reconnaissance et des résultats plus précis.

Piste 5 : Détection de Violation du Casque

Les équipes ont également montré d'importants progrès dans la détection des violations de port de casque parmi les motards. Des techniques innovantes pour la détection d'objets et le suivi ont contribué à atteindre une grande précision dans cette mesure de sécurité cruciale.

Directions Futures

Les organisateurs du Challenge visent à encourager davantage de recherche et développement dans les applications de l'IA pour des problèmes du monde réel. Les futurs défis chercheront à introduire de nouvelles pistes et à améliorer continuellement les ensembles de données fournis, s'assurant qu'ils restent pertinents et utiles pour les participants.

Le raffinement continu des méthodologies d'évaluation aidera à améliorer la qualité globale des soumissions. Les observations faites lors de ce Challenge serviront de guide pour ajuster le format et le focus des prochaines éditions afin de garantir qu'elles favorisent des progrès significatifs.

Conclusion

Le 7ème AI City Challenge s'est révélé être un événement significatif qui a mis en avant le potentiel de l'IA dans les systèmes de circulation et les environnements de vente au détail. Avec une participation accrue et des solutions innovantes proposées par les équipes, le Challenge a fait avancer la conversation sur la façon dont la technologie peut améliorer les opérations quotidiennes.

En fin de compte, les conclusions et développements de cet événement ouvriront la voie à de futures avancées, contribuant à la création d'environnements plus intelligents et plus sûrs. Le travail réalisé dans la communauté de l'IA continue d'inspirer une exploration plus poussée de ce qui est possible à l'intersection de la technologie et de la vie quotidienne.

Source originale

Titre: The 7th AI City Challenge

Résumé: The AI City Challenge's seventh edition emphasizes two domains at the intersection of computer vision and artificial intelligence - retail business and Intelligent Traffic Systems (ITS) - that have considerable untapped potential. The 2023 challenge had five tracks, which drew a record-breaking number of participation requests from 508 teams across 46 countries. Track 1 was a brand new track that focused on multi-target multi-camera (MTMC) people tracking, where teams trained and evaluated using both real and highly realistic synthetic data. Track 2 centered around natural-language-based vehicle track retrieval. Track 3 required teams to classify driver actions in naturalistic driving analysis. Track 4 aimed to develop an automated checkout system for retail stores using a single view camera. Track 5, another new addition, tasked teams with detecting violations of the helmet rule for motorcyclists. Two leader boards were released for submissions based on different methods: a public leader board for the contest where external private data wasn't allowed and a general leader board for all results submitted. The participating teams' top performances established strong baselines and even outperformed the state-of-the-art in the proposed challenge tracks.

Auteurs: Milind Naphade, Shuo Wang, David C. Anastasiu, Zheng Tang, Ming-Ching Chang, Yue Yao, Liang Zheng, Mohammed Shaiqur Rahman, Meenakshi S. Arya, Anuj Sharma, Qi Feng, Vitaly Ablavsky, Stan Sclaroff, Pranamesh Chakraborty, Sanjita Prajapati, Alice Li, Shangru Li, Krishna Kunadharaju, Shenxin Jiang, Rama Chellappa

Dernière mise à jour: 2023-04-15 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2304.07500

Source PDF: https://arxiv.org/pdf/2304.07500

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires