ScatSpotter : Le jeu de données qui révolutionne la détection de crottes de chien
ScatSpotter fournit un gros dataset pour améliorer la détection de crottes de chien sur les images.
― 7 min lire
Table des matières
- Le processus de collecte
- Qu'est-ce qui rend ce dataset spécial ?
- Le défi de la détection
- Entraînement du modèle
- Partage du dataset
- Applications du dataset
- Datasets connexes
- L'importance d'une bonne annotation
- Études d'observation sur la distribution
- Dernières réflexions
- L'avenir de ScatSpotter
- Merci à nos amis canins
- Informations supplémentaires sur le dataset
- Conclusion
- Source originale
- Liens de référence
ScatSpotter est un gros dataset dédié à la détection de crottes de chien dans les Images. Il contient 6 648 photos de crottes de chien prises avec des téléphones, accompagnées d'Annotations détaillées qui aident à identifier l'emplacement de la crotte dans ces images. Ce dataset est unique car il est constamment mis à jour, ajoutant environ 1 gigaoctet chaque mois. La collecte d'images a commencé fin 2020, avec de nouvelles images ajoutées en continu alors que les propriétaires de chiens capturent des moments dans les parcs et autres espaces publics.
Le processus de collecte
Le dataset a été compilé en prenant des photos lors de promenades avec les chiens. Chaque fois qu'une crotte était repérée, une image était prise. Parfois, une deuxième photo était prise après que la crotte ait été ramassée, et enfin, une troisième image d'un endroit voisin était capturée pour éviter toute confusion avec le système. Cette approche "avant/après/négatif" garantit qu'il y a suffisamment de données disponibles pour entraîner un modèle à mieux identifier les crottes dans différentes conditions.
Qu'est-ce qui rend ce dataset spécial ?
Le dataset ScatSpotter est important non seulement en raison de sa taille mais aussi de son objectif. Il contient des images haute résolution de crottes de chien dans divers environnements, comme des parcs et des trottoirs, montrant différentes conditions météorologiques et saisons. Cette diversité en fait une excellente ressource pour entraîner des Modèles d'apprentissage machine à repérer les crottes dans des conditions difficiles, comme quand elles se fondent dans les feuilles ou autres détritus.
Le défi de la détection
Détecter les crottes n'est pas une tâche simple. Les images comportent souvent des distractions comme de la terre, des bâtons, et des ombres qui peuvent cacher la crotte. Les chercheurs ont découvert que les crottes camouflées sont particulièrement difficiles à détecter pour les modèles. En fait, la qualité variable des images, les différences de lumière et les arrière-plans présentent des obstacles majeurs. Ce dataset représente un défi à la fois amusant et informatif pour les chercheurs en vision par ordinateur.
Entraînement du modèle
Pour explorer à quel point les modèles peuvent détecter les crottes de chien, les chercheurs ont formé des modèles spécifiques tels que VIT et MaskRCNN. Ces modèles utilisent différentes techniques pour identifier des objets dans les images. Le meilleur modèle a obtenu des scores impressionnants pour identifier correctement les pixels de crottes, montrant qu'il peut apprendre à distinguer les crottes des objets similaires.
Partage du dataset
Le dataset peut être accessible de différentes manières : à travers des systèmes centralisés et des plateformes décentralisées comme IPFS et BitTorrent. Bien que les méthodes centralisées soient plus rapides, les méthodes décentralisées offrent une plus grande fiabilité pour un accès à long terme, car elles sont moins susceptibles de disparaître soudainement. Cela est particulièrement important pour les données scientifiques, où la reproductibilité est essentielle.
Applications du dataset
Les utilisations potentielles de ce dataset vont au-delà de la simple curiosité. Pour les propriétaires de chiens, ces infos peuvent vraiment changer la donne. Imagine avoir une appli sur ton téléphone qui t'aide à localiser les crottes de ton chien dans un parc verdoyant, rendant le nettoyage plus facile et moins salissant. De plus, ça pourrait mener à des outils qui surveillent la faune à travers les déjections ou même des lunettes intelligentes qui te préviennent des surprises sur le sol.
Datasets connexes
Bien que ScatSpotter soit actuellement le plus grand et le plus complet des datasets axés sur les crottes de chien, ce n'est pas le premier. Il existe des collections plus petites, mais elles manquent souvent de la profondeur et de la variété présentes dans ScatSpotter. Un de ces datasets n'avait que 100 images, ce qui n'est vraiment pas assez pour entraîner un système de détection fiable. La collection de près de 7 000 images de ScatSpotter offre un avantage substantiel pour les développeurs et les chercheurs.
L'importance d'une bonne annotation
Annoter correctement les images est crucial pour entraîner les modèles. Chaque image est soigneusement étiquetée pour montrer où se trouve la crotte. L'utilisation d'annotations polygonales permet de marquer précisément les zones de crottes, garantissant que les modèles peuvent voir la forme et l'emplacement exact de l'objet. Bien que certaines annotations aient été générées à l'aide d'outils d'intelligence artificielle, elles ont toutes été vérifiées par des humains pour garantir leur précision.
Études d'observation sur la distribution
Un aspect intéressant du développement de ScatSpotter est l'étude de la manière dont les datasets sont partagés. Les chercheurs ont comparé différentes méthodes de distribution pour voir à quelle vitesse et avec quelle efficacité les utilisateurs peuvent accéder aux données. À travers leurs découvertes, il est devenu clair que, bien que les méthodes décentralisées puissent être plus lentes dans certains cas, elles peuvent offrir une meilleure fiabilité à long terme.
Dernières réflexions
ScatSpotter ne se limite pas à la collecte d'images ; c'est un pas vers un monde de vision par ordinateur plus ludique et informatif. Les chercheurs espèrent que le succès de ce dataset incitera d'autres à créer des ressources similaires, encourageant la collaboration ouverte et le partage au sein de la communauté scientifique. Qui aurait cru que les crottes de chien pouvaient mener à des avancées aussi intéressantes et utiles en technologie ?
L'avenir de ScatSpotter
Le parcours de ScatSpotter ne s'arrête pas là. Des plans sont en cours pour développer des modèles plus efficaces pouvant fonctionner sur des appareils mobiles, rendant la détection des crottes encore plus facile pour les propriétaires de chiens. Il y a aussi une volonté d'élargir la collecte de données, capturant plus d'images et diversifiant le dataset existant. L'objectif final est de créer un outil qui aide les propriétaires de chiens à non seulement repérer les crottes mais aussi à contribuer à des parcs plus propres et à de meilleurs environnements pour tous.
Merci à nos amis canins
À la fin, il est important de remercier tous les chiens qui ont fourni le "sujet" pour cette recherche. Sans leurs contributions, nous n'aurions pas un dataset qui promet de changer notre façon de penser à la détection et à la gestion des déchets des animaux de compagnie. Avec ScatSpotter, les chercheurs ne se contentent pas de compter les crottes ; ils ouvrent la voie à des solutions plus intelligentes dans la vie quotidienne.
Informations supplémentaires sur le dataset
Dans le cadre d'études supplémentaires, les chercheurs se sont penchés sur divers aspects statistiques du dataset, comme le schéma des images collectées au fil du temps et comment les conditions météorologiques ont affecté la qualité des images. En analysant les distributions d'intensité des pixels et les caractéristiques des annotations, ils visent à comprendre comment ces facteurs peuvent influencer la performance des modèles de détection.
Conclusion
ScatSpotter illustre comment un sujet léger peut conduire à de sérieuses avancées en technologie. En se concentrant sur un problème commun aux propriétaires de chiens, ce dataset ajoute non seulement de la valeur au domaine de la vision par ordinateur, mais crée également une opportunité amusante pour les chercheurs et les développeurs. En regardant vers l'avenir, les possibilités d'applications ludiques et d'outils sérieux inspirés par ScatSpotter sont infinies.
Titre: "ScatSpotter" 2024 -- A Distributed Dog Poop Detection Dataset
Résumé: We introduce a new -- currently 42 gigabyte -- ``living'' dataset of phone images of dog feces, annotated with manually drawn or AI-assisted polygon labels. There are 6k full resolution images and 4k detailed polygon annotations. The collection and annotation of images started in late 2020 and the dataset grows by roughly 1GB a month. We train VIT and MaskRCNN baseline models to explore the difficulty of the dataset. The best model achieves a pixelwise average precision of 0.858 on a 691-image validation set and 0.847 on a small independently captured 30-image contributor test set. The most recent snapshot of dataset is made publicly available through three different distribution methods: one centralized (Girder) and two decentralized (IPFS and BitTorrent). We study of the trade-offs between distribution methods and discuss the feasibility of each with respect to reliably sharing open scientific data. The code to reproduce the experiments is hosted on GitHub, and the data is published under the Creative Commons Attribution 4.0 International license. Model weights are made publicly available with the dataset. Experimental hardware, time, energy, and emissions are quantified.
Dernière mise à jour: Dec 20, 2024
Langue: English
Source URL: https://arxiv.org/abs/2412.16473
Source PDF: https://arxiv.org/pdf/2412.16473
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://media.icml.cc/Conferences/CVPR2023/cvpr2023-author_kit-v1_1-1.zip
- https://github.com/wacv-pcs/WACV-2023-Author-Kit
- https://github.com/MCG-NKU/CVPR_Template
- https://www.overleaf.com/learn/how-to/LaTeX_checklist_for_arXiv_submissions
- https://github.com/ox-vgg/vgg_face2/issues/52
- https://paperswithcode.com/dataset/tackknnno
- https://paperswithcode.com/dataset/zerowaste
- https://paperswithcode.com/dataset/taco
- https://paperswithcode.com/dataset/trashcan
- https://paperswithcode.com/datasets?mod=images&task=semantic-segmentation&page=2
- https://paperswithcode.com/dataset/domestic-trash-garbage-dataset
- https://universe.roboflow.com/dataset-vmyna/poop-yxidr/dataset/1
- https://dat-ecosystem.org/
- https://datproject.org/
- https://blog.mauve.moe/posts/protocol-comparisons
- https://distributed.press/
- https://github.com/tradle/why-hypercore/blob/master/FAQ.md#how-is-hypercore-different-from-ipfs
- https://gist.github.com/liamzebedee/224494052fb6037d07a4293ceca9d6e7
- https://gist.github.com/liamzebedee/4be7d3a551c6cddb24a279c4621db74c
- https://git.gnunet.org/bibliography.git/plain/docs/Long_Term_Study_of_Peer_Behavior_in_the_kad_DHT.pdf
- https://www.reddit.com/r/technology/comments/1dpinuw/south_korean_telecom_company_attacks_torrent/
- https://academictorrents.com/docs/about.html
- https://github.com/iterative/dvc/discussions/6777