Nouvelle méthode pour compter les foules par mauvais temps
Une nouvelle méthode améliore la précision du comptage de foule même par temps mauvais.
― 10 min lire
Table des matières
- Le Problème du Mauvais Temps
- Présentation de la Nouvelle Méthode
- Comptage de Foules par Mauvais Temps
- Aperçu de la Méthode
- Nouveau Jeu de Données Météo
- Résultats
- Apprentissage Contrastif
- Mise en Œuvre du Multi-queue MoCo
- Affinage des Représentations de Caractéristiques
- Expériences et Résultats
- Conclusion
- Source originale
- Liens de référence
Le Comptage de foules est super important pour des domaines comme la sécurité publique, la gestion du trafic et la surveillance vidéo. Beaucoup de méthodes actuelles fonctionnent bien par beau temps, mais elles galèrent sous des conditions difficiles comme la pluie ou la neige. Le problème, c'est que la qualité des images prises par mauvais temps est souvent moins bonne, ce qui mène à des estimations de foules inexactes.
Les chercheurs ont remarqué qu'il n'y a pas beaucoup d'images dispos pour entraîner les modèles sous des conditions Météo défavorables. Ça complique la tâche des modèles pour apprendre à compter les foules quand le temps change. Pour résoudre ce souci, on propose une nouvelle méthode qui aide les modèles à mieux performer dans ces situations difficiles.
Le Problème du Mauvais Temps
Les méthodes de comptage de foules donnent d'excellents résultats quand il fait beau. Par contre, sous la pluie, le brouillard ou la neige, leur performance chute. C'est à cause des différences flagrantes dans les images prises par temps différent. Par exemple, il y a seulement un petit nombre d'images de pluie dans les jeux de données actuels, ce qui rend compliqué pour les modèles d'apprendre à compter les foules sous la pluie.
Une façon d'améliorer les performances serait de retoucher les images avec des techniques de restauration avant de compter. Mais même les images retouchées peuvent sembler différentes de celles prises par temps clair. En plus, ajouter des étapes supplémentaires pour améliorer les images peut ralentir le processus de comptage.
Former des modèles séparés pour chaque type de météo, ce n'est pas une bonne idée non plus, car il n'y a pas assez d'images de mauvais temps pour chaque catégorie.
Présentation de la Nouvelle Méthode
Pour contourner ces problèmes, on a conçu une méthode en deux étapes pour améliorer le comptage de foules sous un temps difficile. Dans la première étape, on utilise une technique appelée Apprentissage contrastif multi-queue MoCo. Ça aide le modèle à mieux apprendre les caractéristiques importantes des différents types de temps.
La deuxième étape affine ce que le modèle a appris, en ajustant les caractéristiques conscientes de la météo pour qu'elles correspondent à celles des images sous un temps clair. Ça aide le modèle à bien fonctionner peu importe les conditions météo.
Malgré l'amélioration de la robustesse du modèle, notre nouvelle méthode n'augmente pas significativement sa taille ou sa complexité. On a aussi créé un jeu de données synthétique qui inclut différents types de mauvais temps pour aider aux tests.
Comptage de Foules par Mauvais Temps
Le comptage de foules est devenu un point central grâce à ses nombreuses applications. Bien que la plupart des méthodes actuelles puissent compter les foules avec précision sous des conditions normales, elles ont du mal sous des conditions météorologiques défavorables. C'est la conséquence du nombre limité d'images disponibles pour l'entraînement et des différences entre les images normales et celles de mauvais temps.
Par exemple, dans le jeu de données JHU-Crowd++, les images prises sous la pluie ne représentent que 3% de l'ensemble du jeu de données. Ce manque de données pour l'entraînement pose des problèmes quand le modèle est confronté à des images réelles prises par mauvais temps.
Une solution simple pourrait être d'utiliser des outils de restauration d'image avant de compter. Cependant, même avec ces outils, les images peuvent toujours ne pas correspondre aux conditions des images prises par temps clair. En plus, ajouter des étapes de restauration d'image peut allonger le temps de traitement.
Créer un modèle différent pour chaque condition météorologique n'est pas non plus pratique. Le nombre limité d'images sous des conditions défavorables ne peut pas soutenir une telle approche.
Aperçu de la Méthode
L'objectif de cette recherche est de renforcer les modèles de comptage de foules lorsqu'ils sont confrontés à des conditions météo défavorables inconnues tout en maintenant une performance stable sous des conditions normales. Pour cela, on traite le comptage de foules comme un problème d'apprentissage où le modèle rencontre différents types de conditions météo. Cette méthode, conçue pour apprendre à travers différents domaines, exige que le modèle capte des caractéristiques distinctes de chaque type de météo.
Pour réussir ça, on propose un système appelé Apprentissage Contrastif Multi-queue (MQCL). Cette technique permet au modèle de capturer des caractéristiques conscientes de la météo à partir des images, que l'on affine ensuite.
Dans la première étape, le modèle utilise l'apprentissage contrastif pour identifier les caractéristiques des différents types de météo. Malheureusement, le déséquilibre des classes dans les données d'entraînement signifie que les méthodes contrastives classiques ont tendance à favoriser les images sous temps normaux, ce qui mène à une mauvaise performance en conditions défavorables.
Pour résoudre ce problème, on a créé une méthode d'apprentissage contrastif simple et efficace appelée multi-queue MoCo. Cette approche utilise plusieurs queues pour équilibrer le processus d'apprentissage à travers les différentes classes de météo.
Dans la deuxième étape, on traite toutes les images sous temps normaux comme des échantillons positifs. Ça aide le modèle à raffiner sa compréhension, en ajustant les caractéristiques du mauvais temps pour qu'elles correspondent à celles du temps normal.
Notre approche permet au raffineur et au décodeur de rester légers, garantissant un impact minimal sur la taille générale du modèle. Comparé à notre modèle de base, notre méthode n'introduit qu'une légère augmentation des paramètres.
Nouveau Jeu de Données Météo
Comme il n'y a qu'un seul jeu de données public avec des images de mauvais temps, on a créé un nouveau jeu de données synthétique appelé NWPU-Weather. Ce jeu de données est basé sur le jeu de données NWPU-Crowd et inclut des conditions pluvieuses et brumeuses. L'objectif de ce jeu de données est de stimuler plus de recherches sur le comptage de foules par mauvais temps.
Plusieurs modèles de comptage bien connus ont été évalués par rapport à notre nouveau jeu de données pour donner un aperçu des performances actuelles.
Résultats
Nos résultats montrent que la nouvelle méthode améliore considérablement la capacité du modèle à compter les foules sous des conditions défavorables tout en maintenant une précision sous des conditions normales. On a observé que notre approche réduit significativement les erreurs de comptage par rapport aux modèles existants.
Les expériences que l'on a menées ont mis en évidence comment le modèle a réussi à mieux comprendre les caractéristiques météo tout en améliorant sa capacité à identifier différentes scènes.
De plus, on a noté des améliorations significatives des performances, surtout pour les modèles testés sous des conditions météo défavorables. La méthode d'apprentissage contrastif utilisée dans notre approche aide non seulement à la conscience de la météo, mais renforce aussi la capacité du modèle à reconnaître diverses scènes.
Apprentissage Contrastif
L'apprentissage contrastif est une méthode qui a attiré beaucoup d'attention grâce à son succès dans l'apprentissage non supervisé. L'objectif principal ici est de rapprocher des représentations similaires et d'éloigner celles qui sont différentes en termes de similarité.
Malgré ce succès, certaines recherches ont montré que les méthodes d'apprentissage contrastif existantes pourraient négliger certains aspects, surtout quand il s'agit de données déséquilibrées. Pour remédier à ce problème, notre nouvelle méthode utilise le multi-queue MoCo, facilitant l'apprentissage efficace du modèle.
Mise en Œuvre du Multi-queue MoCo
La méthode multi-queue MoCo permet au modèle de maintenir une distribution uniforme des classes. En développant plusieurs petites queues, chacune associée à un type de météo spécifique, on s'assure que le modèle peut accéder à une représentation équilibrée des classes durant l'entraînement.
Chaque image subit différentes augmentations, permettant au modèle de traiter des images similaires comme des échantillons positifs tout en considérant celles provenant d'images différentes comme négatives. Cela favorise un meilleur apprentissage et améliore la capacité du modèle à distinguer les conditions météo.
Affinage des Représentations de Caractéristiques
Une fois la première étape terminée, l'encodeur est stabilisé, ce qui permet d'entraîner un raffineur qui transforme les représentations conscientes de la météo en celles de temps normal. Cette étape est cruciale car elle garantit que le décodeur peut se concentrer uniquement sur un seul domaine, à savoir le temps normal, afin de produire des cartes de densité précises.
L'ensemble du processus d'apprentissage comprend des composants significatifs qui améliorent les performances et la précision du modèle dans le comptage des foules.
Expériences et Résultats
Pour valider notre méthode, on a mené des expériences approfondies en utilisant notre nouveau jeu de données NWPU-Weather ainsi que d'autres jeux de données existants. Les résultats ont clairement montré que notre méthode MQCL donne des performances nettement meilleures que d'autres méthodes à la pointe de la technologie.
On a aussi évalué la performance du modèle en fonction des différentes conditions météo, assurant que la méthode reste robuste dans divers scénarios.
Conclusion
En conclusion, on a introduit une nouvelle approche pour le comptage de foules qui s'attaque efficacement aux défis posés par le mauvais temps. Notre méthode, appelée MQCL, renforce non seulement la performance du modèle dans des conditions difficiles, mais elle garantit aussi qu'il maintienne l'exactitude quand le temps est clair.
Bien qu'on ait fait des progrès significatifs pour remédier aux limitations des méthodes existantes, des défis demeurent. Notre concentration sur l'utilisation d'un modèle léger a permis de maintenir les performances, mais cela a légèrement réduit la précision par rapport à des méthodes plus complexes utilisant des architectures avancées.
Les recherches futures pourraient explorer l'application de notre approche à d'autres domaines et tester son efficacité avec des images du monde réel. On espère que notre travail encouragera d'autres études sur le comptage de foules en conditions météo défavorables et au-delà.
Titre: Boosting Adverse Weather Crowd Counting via Multi-queue Contrastive Learning
Résumé: Currently, most crowd counting methods have outstanding performance under normal weather conditions. However, they often struggle to maintain their performance in extreme and adverse weather conditions due to significant differences in the domain and a lack of adverse weather images for training. To address this issue and enhance the model's robustness in adverse weather, we propose a two-stage crowd counting method. Specifically, in the first stage, we introduce a multi-queue MoCo contrastive learning strategy to tackle the problem of weather class imbalance. This strategy facilitates the learning of weather-aware representations by the model. In the second stage, we propose to refine the representations under the guidance of contrastive learning, enabling the conversion of the weather-aware representations to the normal weather domain. While significantly improving the robustness, our method only marginally increases the weight of the model. In addition, we also create a new synthetic adverse weather dataset. Extensive experimental results show that our method achieves competitive performance.
Auteurs: Tianhang Pan, Xiuyi Jia
Dernière mise à jour: 2024-10-26 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2408.05956
Source PDF: https://arxiv.org/pdf/2408.05956
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.