L'impact des délais sur les tâches de crowdsourcing
Une étude révèle que les délais améliorent les performances et la satisfaction des travailleurs de foule.
Gordon Lim, Stefan Larson, Yu Huang, Kevin Leach
― 7 min lire
Table des matières
- Le Problème des Paiements
- L’Étude : Limites de temps et Performance des Travailleurs
- Pourquoi A-t-on Besoin de Limites de Temps?
- Le Challenge : Coût Cognitif vs. Coût Psychomoteur
- Mise en Place de l’Étude
- Recrutement et Formation
- Les Tests Commencent !
- Collecte de Retours
- Les Résultats
- Source originale
- Liens de référence
Dans le monde de la tech et des données, on se tourne souvent vers un groupe de gens lambda, appelés les travailleurs de la foule, pour nous aider à étiqueter et classifier des infos. Ce truc s'appelle le crowdsourcing. C’est un peu comme demander à tes voisins de t’aider quand tu captes pas quelle plante envahit ton jardin. Mais au lieu de plantes, on parle d'images et de données dans le domaine du machine learning.
Le Problème des Paiements
Les travailleurs de la foule sont généralement payés à un tarif fixe pour leurs tâches, ce qui veut dire qu'ils reçoivent un montant déterminé pour chaque job terminé. Ce tarif fixe peut sembler pratique, mais il y a un hic : le temps que mettent les différents travailleurs pour finir la même tâche peut varier énormément. Imagine demander à trois personnes de faire un gâteau. L'une finit en une heure, l'autre en deux, et la dernière met trois heures parce qu'elle a oublié d'ajouter du sucre et a dû tout recommencer. Dans les tâches de données, cette inégalité peut faire que certains travailleurs sont surpayés ou sous-payés. En fait, parfois, ils peuvent être surpayés de 168% ou sous-payés de 16%. C’est comme filer 20 dollars à ton voisin pour tondre la pelouse alors qu'il y a passé que 10 minutes, mais puis donner 10 dollars à un autre voisin pour un boulot qui a pris deux heures.
Pour lisser ces irrégularités de paiement, mettre une limite de temps pour finir une tâche peut être utile. Si les travailleurs savent qu'ils ont un temps précis à consacrer, ça aide à garder les paiements équitables et prévisibles tout en s'assurant qu'ils sont payés pour leurs efforts.
Limites de temps et Performance des Travailleurs
L’Étude :Dans ce contexte, des chercheurs ont regardé de plus près comment ces limites de temps affectent la performance et la Satisfaction des travailleurs de la foule. Une étude axée sur des tâches de classification d'images a impliqué de donner aux travailleurs une limite de temps maximale pour regarder une image avant de donner leur réponse. Ils ont constaté que plus le temps de visionnage était long, moins il y avait d'impact sur la performance des travailleurs. Donc, même si certaines images étaient délicates sous des limites de temps serrées, les travailleurs pouvaient tout de même fournir des réponses de qualité grâce à un algorithme de consensus intelligent qui filtrait les cas les plus difficiles.
Fait intéressant, même face à des limites de temps, beaucoup de travailleurs ont montré une performance constante tout au long de la tâche. Quand on leur a demandé leurs préférences, ils ont en fait dit qu'ils préféraient des limites plus courtes. Donc, on dirait qu'une limite de temps courte, c'est comme une fête surprise : ça garde les choses excitantes, mais pas trop.
Pourquoi A-t-on Besoin de Limites de Temps?
L'objectif de mettre des limites de temps dans des tâches de crowdsourcing tourne autour de trois idées principales :
-
Aider les Travailleurs : Une limite de temps peut aider les travailleurs à gérer leurs attentes et à gagner du temps tout en s'assurant qu'ils sont payés équitablement. S'ils savent qu'il y a un plafond sur le temps qu'ils doivent passer sur une tâche, ça les aide à travailler plus vite.
-
Stratégies de Paiement Équitable : Une limite de temps simplifie les décisions de paiement pour ceux qui demandent le travail. Ça crée une méthode simple pour budgéter les tâches sans se soucier des temps de complétion individuels.
-
Prévenir le Surnombre de Paiement : En ayant des limites fixes, il est plus facile d'éviter de payer trop les travailleurs et de garder les coûts sous contrôle.
Le Challenge : Coût Cognitif vs. Coût Psychomoteur
Quand on fixe une limite de temps, il est important de tenir compte des coûts cognitifs. Ça fait référence à la difficulté pour les travailleurs de réfléchir et de prendre des décisions sous pression, par rapport aux coûts psychomoteurs, qui concernent l'acte physique de soumettre une réponse. C’est comme essayer de manger une part de gâteau avec juste une fourchette ; ça peut devenir compliqué si tu es pressé !
Pour faire les choses équitables, les chercheurs ont décidé de permettre aux travailleurs de prendre le temps qu'ils veulent pour soumettre une réponse après que leur temps de visionnage a expiré. L'objectif principal était de garder la qualité des données élevée et la satisfaction des travailleurs intacte.
Mise en Place de l’Étude
Dans l'étude, les participants ont été montrés des images de chiens et devaient identifier la race sous différentes limites de temps de 100ms, 1000ms, ou 2500ms. Ces chiffres peuvent sembler bizarres, mais ils font une différence dans la performance. C’est comme essayer de lire un panneau de loin ; plus tu as de temps pour regarder, plus c'est clair !
Recrutement et Formation
Pour avoir les bons participants, les chercheurs se sont tournés vers une plateforme de crowdsourcing pour trouver des gens prêts à aider avec l'étude. Ils se sont assurés que les participants étaient à l'aise en leur faisant une petite formation. Cela impliquait de leur montrer des exemples de chaque race de chien avant de plonger dans les tests chronométrés. Les participants devaient aussi identifier correctement des images random de chiens sans aucune limite de temps pour s'assurer qu'ils pouvaient distinguer entre des races qui se ressemblent.
Les Tests Commencent !
Une fois qualifiés, les participants sont passés au vrai test. Ils ont été montrés une image de chien à la fois pour une durée de visionnage déterminée, puis l'image disparaissait. Après cela, les participants devaient choisir la race d'une liste d'options. Certains participants avaient un temps de visionnage court de 100ms, tandis que d'autres avaient un plus généreux 2500ms pour identifier leurs amis poilus. Après visionnage, une séquence d'images défilait rapidement, donnant aux travailleurs un moment pour réfléchir avant de soumettre leur réponse.
Collecte de Retours
Après ces tests, les participants ont rempli une enquête qui a aidé les chercheurs à recueillir des retours sur la difficulté de la tâche et l'expérience globale. Certains participants ont même commenté à quel point la tâche était amusante, tandis que d'autres estimaient que le timing pouvait être mieux ajusté—comme certaines personnes préfèrent leur café chaud, d'autres le préfèrent froid.
Les Résultats
Une fois toutes les données recueillies, les chercheurs ont analysé comment les différentes limites de temps avaient influencé la Précision et la satisfaction des travailleurs de la foule. Ils ont comparé leurs résultats avec des études précédentes ayant une configuration similaire mais sans aucune limite de temps et ont découvert des motifs intéressants :
-
Précision : En gros, il s'est avéré que la précision pour identifier les races de chiens augmentait avec le temps accordé. Ceux avec 1000ms avaient de bonnes performances par rapport aux autres, tandis que la fenêtre très courte de 100ms s'est avérée être un défi. C’est comme jouer à "Quel est ce son ?" avec ton pote quand tu n'as qu'un instant pour répondre !
-
Images Difficiles : Certain
Titre: Towards Fair Pay and Equal Work: Imposing View Time Limits in Crowdsourced Image Classification
Résumé: Crowdsourcing is a common approach to rapidly annotate large volumes of data in machine learning applications. Typically, crowd workers are compensated with a flat rate based on an estimated completion time to meet a target hourly wage. Unfortunately, prior work has shown that variability in completion times among crowd workers led to overpayment by 168% in one case, and underpayment by 16% in another. However, by setting a time limit for task completion, it is possible to manage the risk of overpaying or underpaying while still facilitating flat rate payments. In this paper, we present an analysis of the impact of a time limit on crowd worker performance and satisfaction. We conducted a human study with a maximum view time for a crowdsourced image classification task. We find that the impact on overall crowd worker performance diminishes as view time increases. Despite some images being challenging under time limits, a consensus algorithm remains effective at preserving data quality and filters images needing more time. Additionally, crowd workers' consistent performance throughout the time-limited task indicates sustained effort, and their psychometric questionnaire scores show they prefer shorter limits. Based on our findings, we recommend implementing task time limits as a practical approach to making compensation more equitable and predictable.
Auteurs: Gordon Lim, Stefan Larson, Yu Huang, Kevin Leach
Dernière mise à jour: 2024-11-29 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2412.00260
Source PDF: https://arxiv.org/pdf/2412.00260
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.