Les Kényans se lâchent : Les rapports des citoyens façonnent la réalité des élections
Un aperçu de l'impact du journalisme citoyen sur les élections générales kényanes de 2022.
Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
― 12 min lire
Table des matières
- L'Importance d'Organiser les Données
- Reporting Citoyen en Action
- Aperçu du Jeu de Données
- Classification des Sujets
- Géolocalisation des Rapports
- Défis de l'Annotation des Données
- Longueur et Contenu des Rapports
- Distribution Géographique des Rapports
- Tendances au Fil du Temps
- Évaluation de la Qualité des Données
- Automatisation de la Catégorisation des Rapports
- Automatisation de la Géolocalisation
- Résultats et Conclusions
- Comprendre les Travaux Associés
- Considérations Éthiques
- Conclusion
- Source originale
- Liens de référence
En 2022, les Kényans ont voté pour une élection générale qui a vu un bon paquet de reportages citoyens. Ce reporting a été largement rendu possible grâce à diverses plateformes en ligne où les gens pouvaient partager leurs avis et expériences en temps réel. Imagine un grand tableau d'affichage communautaire où tout le monde peut poster ses pensées, ses plaintes et ses observations sur ce qui se passe autour d'eux le jour des élections. Ça, c'est le Journalisme citoyen aujourd'hui !
Les citoyens ont signalé des problèmes comme des comportements inappropriés, des comptes de votes bizarres, et même des cas de violence. Ce jeu de Données contient plus de 14 000 Rapports liés à l'Élection Générale Kényane de 2022. Ces rapports ont été collectés via une plateforme qui a aidé les gens à envoyer leurs avis par SMS, sur les réseaux sociaux et d'autres moyens numériques. La beauté de ce processus, c'est qu'il donne une voix à la personne lambda, lui permettant de rapporter ce qu'elle voit et ressent alors que les événements se déroulent.
L'Importance d'Organiser les Données
Quand un flot d'infos arrive, c'est super important de bien les organiser. Pense à ça comme à un énorme puzzle — sans trier les pièces d'abord, c'est un peu le bazar ! Chaque rapport a été catégorisé en fonction de problèmes spécifiques, et l'endroit de chaque incident a été marqué, pour pouvoir le cartographier. Cette organisation est cruciale pour les autorités et les décideurs, les aidant à tirer des enseignements de ces informations pour promouvoir des changements positifs dans la société.
La tâche d'organiser tous ces rapports n'est pas simple et nécessite souvent beaucoup de travail manuel. C'est comme avoir une montagne de linge — ça prend du temps et des efforts pour plier et ranger le tout correctement. C'est pourquoi ce jeu de données est significatif ; il vise à simplifier le processus en utilisant la technologie pour aider à catégoriser et étiqueter les rapports.
Reporting Citoyen en Action
Les plateformes de rapport en ligne ont permis aux citoyens de signaler les problèmes au fur et à mesure qu'ils se produisaient. Ces rapports couvrent une variété de sujets, tels que des plaintes concernant le fonctionnement des bureaux de vote, des allégations de fraude, et des observations sur le comportement des électeurs. La nature du journalisme citoyen en fait un outil puissant pour éclairer les réalités des élections, surtout dans des endroits où les médias traditionnels n'ont pas accès.
Cependant, tous les rapports ne sont pas fiables. Certains peuvent se baser sur de simples opinions ou rumeurs plutôt que sur des faits. C'est pourquoi il est crucial que les plateformes vérifient les rapports. Sans vérification, du contenu non filtré peut répandre des informations erronées comme une traînée de poudre. C'est comme passer une rumeur sur quelqu'un ; ça peut vite devenir incontrôlable (et crois-nous, personne n'aime être au milieu d'une rumeur !).
Pour suivre comment les rapports affectent différentes communautés, les plateformes les ont également catégorisés par sujet et par lieu. Cela signifie que quand quelqu'un lit un rapport, il peut voir comment les événements se déroulent dans sa région, restant ainsi informé sur sa communauté. C'est comme avoir une chaîne de nouvelles locale qui diffuse des mises à jour en direct de ton quartier, directement sur ton téléphone.
Aperçu du Jeu de Données
Ce jeu de données contient 14 169 rapports liés aux Élections Générales Kényanes de 2022. Ces rapports ont été soumis à travers un système conçu spécifiquement à cet effet. Sur une période de deux mois précédant les élections, les citoyens ont partagé leurs expériences et observations.
Les rapports ont été soigneusement examinés par des bénévoles formés qui se sont assurés que les données étaient précises et correctement catégorisées. Ces bénévoles parlaient aussi bien anglais que swahili, ce qui est super utile dans un pays avec une riche diversité linguistique ! Après révision, ces rapports ont été rendus disponibles au public, offrant des aperçus précieux aux journalistes, chercheurs, et citoyens.
Classification des Sujets
Pour donner un sens aux rapports, ils ont été divisés en catégories selon leurs sujets. Pense aux sujets comme aux chapitres d'un livre, chaque chapitre se concentrant sur un thème différent. Par exemple, certains rapports concernaient des irrégularités dans le vote, tandis que d'autres étaient axés sur des problèmes de sécurité ou des tâches administratives dans les bureaux de vote.
Les bénévoles ont attribué des sujets à chaque rapport en fonction de leur contenu. En plus, des étiquettes spécifiques ont été ajoutées pour fournir encore plus de détails. C'est similaire à la façon dont tu pourrais étiqueter tes cartons quand tu déménages ; ça t'évite d'ouvrir chacun d'eux pour retrouver tes vêtements d'hiver !
Géolocalisation des Rapports
Chaque rapport incluait également une étiquette géographique, ce qui signifie que l'endroit où l'incident s'est produit était marqué. Les bénévoles ont fait ça en cherchant des mentions de lieux dans les rapports. Dans le cas où aucun lieu n'était spécifié, un point par défaut a été mis au centre de Nairobi. C'est un moyen pratique, un peu comme mettre "chez soi" comme localisation quand tu perds ton chemin.
Cette information géographique aide à créer une carte visuelle des endroits où les événements ont eu lieu. En traçant ces rapports sur une carte, on peut facilement voir quelles zones ont connu des problèmes pendant l'élection. Cela peut informer les discussions et les décisions prises par divers acteurs, y compris les gouvernements et les ONG.
Défis de l'Annotation des Données
Comme tu peux l'imaginer, trier des milliers de rapports et les organiser n'est pas une promenade de santé. Ça demande du temps, de l'attention, et beaucoup de patience. L'annotation manuelle est en effet très gourmande en main-d'œuvre, ce qui entraîne souvent des retards dans la publication des informations.
Dans le cas des rapports des élections kenyans, un nombre impressionnant de 86 000 rapports a été reçu, mais ils n'ont pas été annotés en raison d'un manque de ressources. Ça montre à quel point une approche automatisée pourrait être précieuse pour gérer de grandes quantités de données.
Longueur et Contenu des Rapports
Les rapports variaient en longueur, beaucoup respectant une limite de caractères spécifique en raison des plateformes utilisées pour les soumissions. Cette limite est un peu comme celle d'un SMS — ça encourage à être concis !
De plus, comme de nombreuses langues sont parlées au Kenya, le jeu de données a capturé un mélange de langues, y compris l'anglais et le swahili. Certains rapports ont même montré du code-switching, où les locuteurs passent d'une langue à l'autre au sein de la même conversation. C'est comme quand tu vois quelqu'un mélanger des plats préférés pour en faire un nouveau plat savoureux !
Distribution Géographique des Rapports
En regardant de plus près d'où venaient ces rapports, on a noté que la plupart provenaient de Nairobi et des comtés environnants. Pas étonnant qu'une ville grouillante de monde génère un tas de rapports ! En revanche, les zones rurales avaient moins de soumissions.
Cette distribution inégale souligne l'importance de s'assurer que toutes les voix soient entendues, peu importe la géographie. C'est comme un petit village où tout le monde crie à pleins poumons, tandis que dans les zones plus calmes, les chuchotements portent un poids différent.
Tendances au Fil du Temps
Le jeu de données permet également d'analyser les tendances au fil du temps. En examinant quand les rapports arrivaient, les chercheurs peuvent voir comment le sentiment public a changé tout au long des phases électorales. Par exemple, avant l'élection, les gens rapportaient des scandales, tandis que le jour des élections, ils se concentraient sur les résultats et la participation des électeurs.
Ces tendances aident à comprendre le paysage électoral et peuvent révéler des problèmes clés nécessitant des interventions. C'est comme suivre les saisons ; savoir quand une tempête a frappé peut aider à se préparer pour la prochaine !
Évaluation de la Qualité des Données
Pour garantir la qualité des rapports, des échantillons aléatoires ont été examinés par des annotateurs experts pour comparer leurs conclusions avec celles des annotateurs bénévoles. Cette étape est cruciale pour s'assurer que l'information partagée est précise.
Fait intéressant, l'accord entre bénévoles et experts a montré certaines incohérences, suggérant que certains rapports étaient très subjectifs — un peu comme quand quelqu'un te dit que sa chanson préférée est la meilleure de toutes, et que tu n'es tout simplement pas d'accord ! Cette subjectivité est attendue compte tenu du volume de rapports et souligne le besoin de systèmes Automatisés pour améliorer encore la précision des données.
Automatisation de la Catégorisation des Rapports
Comme pour tout grand jeu de données, le but était d'explorer comment les modèles linguistiques pouvaient aider à catégoriser et étiqueter les rapports efficacement. En utilisant des techniques d'apprentissage automatique, l'objectif était de réduire le travail manuel et d'améliorer la vitesse de traitement des rapports.
Cette approche innovante peut aider les agences à se concentrer davantage sur la compréhension des enseignements tirés des données plutôt que de simplement les trier. C'est comme avoir un assistant intelligent qui peut filtrer des piles de papiers pour trouver exactement l'information dont tu as besoin !
Automatisation de la Géolocalisation
La géolocalisation implique deux tâches clés : extraire les lieux mentionnés dans les rapports et récupérer les coordonnées de ces lieux. Si la catégorisation des rapports est un côté de la pièce, la géolocalisation en est l'autre, complétant l'image !
Plusieurs méthodes ont été explorées, y compris l'utilisation de modèles avancés qui peuvent s'adapter et reconnaître les lieux mentionnés dans les rapports. Bien sûr, la technologie trébuche parfois. Il y a eu des cas où le lieu n'a pas été trouvé, soulignant le besoin d'amélioration continue des systèmes utilisés.
Résultats et Conclusions
Les résultats des tâches d'automatisation de la catégorisation et de la géolocalisation fournissent des aperçus précieux sur l'efficacité de ces systèmes. La performance a été évaluée en fonction de différentes métriques, s'assurant que l'exactitude et la couverture des étiquettes de localisation respectaient les normes attendues.
Fait intéressant, alors que les modèles plus grands montraient de meilleures performances pour identifier les lieux, des défis persistaient pour localiser des sites ou des repères spécifiques. C'est un peu comme essayer de retrouver ton ami dans une foule ; parfois, tu as juste besoin de plus qu'une simple description !
Comprendre les Travaux Associés
Les études électorales ont été un sujet brûlant, surtout à l'ère des réseaux sociaux. De nombreux efforts de recherche ont porté sur la manière dont les élections sont analysées via des plateformes en ligne. Cependant, la plupart des études se sont déroulées dans le contexte des États-Unis ou de l'Europe.
Ce jeu de données se distingue car il se concentre spécifiquement sur les élections kenyans, apportant une perspective fraîche au dialogue sur l'intégrité électorale. Il s'appuie fortement sur les contributions citoyennes, donnant la priorité aux voix des gens ordinaires dans ce processus démocratique crucial.
Considérations Éthiques
Quand on manipule des données, surtout concernant des individus et des événements, les considérations éthiques sont primordiales. Les données de ce jeu de données ont été collectées à partir de sources accessibles au public, garantissant qu'aucune information confidentielle n'a été partagée.
De plus, les chercheurs souhaitant accéder à ce jeu de données doivent respecter un accord de licence qui interdit les abus. Cette mesure aide à protéger l'intégrité des données et assure qu'elles sont utilisées à bon escient.
Conclusion
Le jeu de données sur les rapports citoyens concernant les Élections Kényanes de 2022 est une ressource puissante pour comprendre le sentiment public et les problèmes autour des élections. Avec 14 169 rapports collectés, il reflète un large éventail d'opinions et d'expériences.
En avançant, l'automatisation de la catégorisation et de l'étiquetage peut grandement améliorer le traitement des données, permettant des réponses plus rapides aux problèmes émergents.
Dans le grand schéma des choses, le reporting citoyen et l'utilisation de la technologie peuvent aider à renforcer la démocratie en veillant à ce que la voix de chacun soit entendue — même si cela signifie trier un panier à linge en désordre d'opinions et d'observations ! Au fur et à mesure que les citoyens continuent de participer et de partager leurs histoires, nous ne pouvons qu'espérer que ces efforts mènent à des élections plus équitables et plus transparentes à l'avenir.
Titre: Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election
Résumé: Online reporting platforms have enabled citizens around the world to collectively share their opinions and report in real time on events impacting their local communities. Systematically organizing (e.g., categorizing by attributes) and geotagging large amounts of crowdsourced information is crucial to ensuring that accurate and meaningful insights can be drawn from this data and used by policy makers to bring about positive change. These tasks, however, typically require extensive manual annotation efforts. In this paper we present Uchaguzi-2022, a dataset of 14k categorized and geotagged citizen reports related to the 2022 Kenyan General Election containing mentions of election-related issues such as official misconduct, vote count irregularities, and acts of violence. We use this dataset to investigate whether language models can assist in scalably categorizing and geotagging reports, thus highlighting its potential application in the AI for Social Good space.
Auteurs: Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
Dernière mise à jour: 2024-12-17 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2412.13098
Source PDF: https://arxiv.org/pdf/2412.13098
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://github.ushahidi.org/uchaguzi-ai/
- https://uchaguzi.or.ke/
- https://www.ushahidi.com/
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/digital-response-teams-overview
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/publishing
- https://www.ushahidi.com/in-action/ushahidi-s-uchaguzi-platform-empowers-citizen-participation-in-2022-kenya-general-elections/
- https://nominatim.org/
- https://en.wikipedia.org/wiki/Null_Island