I Keniani Parlano: Le Segnalazioni dei Cittadini Modellano la Realtà Elettorale
Uno sguardo a come il giornalismo dei cittadini ha influenzato le elezioni generali in Kenya del 2022.
Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
― 10 leggere min
Indice
- L'importanza di organizzare i Dati
- Segnalazione dei cittadini in azione
- Panoramica del dataset
- Categorizzazione per argomento
- Geotagging delle segnalazioni
- Sfide con l'annotazione dei dati
- Lunghezza e contenuto delle segnalazioni
- Distribuzione geografica delle segnalazioni
- Tendenze nel tempo
- Valutazione della qualità dei dati
- Automazione della categorizzazione delle segnalazioni
- Automazione del geotagging
- Risultati e scoperte
- Comprendere il lavoro correlato
- Considerazioni etiche
- Conclusione
- Fonte originale
- Link di riferimento
Nel 2022, i keniani sono andati alle urne per un'elezione generale che ha visto un sacco di segnalazioni da parte dei cittadini. Questa segnalazione è diventata possibile grazie a diverse piattaforme online dove la gente poteva condividere le proprie opinioni e esperienze in tempo reale. Immagina un grande pannello di avvisi in comunità dove tutti possono pubblicare i propri pensieri, lamentele e osservazioni su quel che accade intorno a loro il giorno delle elezioni. Ecco cos'è il Giornalismo dei cittadini oggi!
I cittadini hanno segnalato problemi come cattiva condotta, conteggi di voti strani e persino episodi di violenza. Questo dataset comprende oltre 14.000 segnalazioni relative alle Elezioni Generali del Kenya nel 2022. Queste segnalazioni sono state raccolte da una piattaforma che ha aiutato le persone a inviare le proprie opinioni tramite SMS, social media e altri mezzi digitali. La bellezza di questo processo è che dà voce alla persona comune, permettendo loro di riportare ciò che vedono e sentono mentre gli eventi si svolgono.
Dati
L'importanza di organizzare iQuando arriva un diluvio di informazioni, è essenziale organizzarle in modo efficace. Pensaci come cercare di dare senso a un gigantesco puzzle — senza prima ordinare i pezzi, è un gran casino! Ogni segnalazione è stata categorizzata in base a problemi specifici, e la posizione di ogni incidente è stata contrassegnata, così da poter essere mappata. Questa organizzazione è fondamentale per le autorità e i decisori, aiutandoli a ottenere spunti da queste informazioni per promuovere cambiamenti positivi nella società.
Il compito di organizzare tutte queste segnalazioni non è facile e richiede spesso molto lavoro manuale. È come avere una montagna di bucato — ci vuole tempo e impegno per piegare e riporre tutto in ordine. Ecco perché questo dataset è significativo; mira a semplificare il processo usando la tecnologia per aiutare nella categorizzazione e nel tagging delle segnalazioni.
Segnalazione dei cittadini in azione
Le piattaforme di segnalazione online hanno permesso ai cittadini di riportare problemi mentre accadevano. Queste segnalazioni coprono una varietà di argomenti, come lamentele sulle operazioni dei seggi, accuse di frode e osservazioni sul comportamento degli elettori. La natura del giornalismo dei cittadini lo rende uno strumento potente per illuminare le realtà delle elezioni, soprattutto in luoghi dove i media tradizionali potrebbero non avere accesso.
Tuttavia, non tutte le segnalazioni sono affidabili. Alcune potrebbero basarsi su mere opinioni o voci piuttosto che su fatti. Ecco perché è cruciale per le piattaforme verificare le segnalazioni. Senza verifica, contenuti non filtrati possono diffondere disinformazione come un incendio. È come diffondere una voce su qualcuno; può facilmente prendere piede (e fidati, nessuno ama trovarsi dall'altra parte di una voce!).
Per tenere traccia di come le segnalazioni influenzino diverse comunità, le piattaforme le hanno anche categorizzate per argomento e posizione. Questo significa che quando qualcuno legge una segnalazione, può vedere come si svolgono gli eventi nella propria area, rimanendo così informato sulla propria comunità. È come avere un canale di notizie locali che trasmette aggiornamenti in diretta dal tuo quartiere, proprio sul tuo telefono.
Panoramica del dataset
Il dataset contiene 14.169 segnalazioni relative alle Elezioni Generali del Kenya nel 2022. Queste segnalazioni sono state presentate attraverso un sistema progettato specificamente per questo scopo. Nel periodo di due mesi che ha preceduto l'elezione, i cittadini hanno condiviso le loro esperienze e osservazioni.
Le segnalazioni sono state attentamente esaminate da volontari formati che hanno garantito che i dati fossero accurati e categorizzati correttamente. Questi volontari parlavano sia inglese che swahili, il che è piuttosto utile in un paese con una ricca diversità linguistica! Dopo la revisione, queste segnalazioni sono diventate disponibili al pubblico, fornendo spunti preziosi per giornalisti, ricercatori e cittadini.
Categorizzazione per argomento
Per dare senso alle segnalazioni, sono state suddivise in categorie basate sui loro argomenti. Pensa agli argomenti come ai capitoli di un libro, con ogni capitolo che si concentra su un tema diverso. Ad esempio, alcune segnalazioni riguardavano irregolarità nel voto, mentre altre si concentravano su questioni di sicurezza o compiti amministrativi nei seggi elettorali.
I volontari hanno assegnato argomenti a ciascuna segnalazione in base al contenuto. Inoltre, sono stati aggiunti tag specifici per fornire ancora più dettagli. Questo è simile a come potresti etichettare le tue scatole quando ti trasferisci; ti salva dall'aprire ogni singola scatola per trovare i tuoi vestiti invernali!
Geotagging delle segnalazioni
Ogni segnalazione includeva anche un tag geografico, il che significa che la posizione in cui è avvenuto l'incidente è stata contrassegnata. I volontari lo hanno fatto cercando menzioni di luoghi nelle segnalazioni. Nel caso in cui non fosse specificata alcuna posizione, è stato impostato un punto predefinito al centro di Nairobi. È una soluzione pratica, simile a mettere "casa" come tua posizione quando ti perdi.
Queste informazioni geografiche aiutano a creare una mappa visiva di dove sono avvenuti gli eventi. Mappando queste segnalazioni, si può facilmente vedere quali aree hanno vissuto problemi durante l'elezione. Questo può informare discussioni e decisioni prese da vari stakeholder, tra cui governi e ONG.
Sfide con l'annotazione dei dati
Come puoi immaginare, setacciare migliaia di segnalazioni e organizzarle non è solo una passeggiata nel parco. Richiede tempo, attenzione e molta pazienza. L'annotazione manuale è davvero laboriosa, il che spesso porta a ritardi nel rendere pubbliche le informazioni.
Nel caso delle segnalazioni delle elezioni keniane, è stato ricevuto un numero impressionante di 86.000 segnalazioni, ma non sono state annotate a causa della mancanza di risorse. Questo dimostra quanto potrebbe essere prezioso un approccio Automatizzato per affrontare grandi quantità di dati.
Lunghezza e contenuto delle segnalazioni
Le segnalazioni variavano in lunghezza, con molte che rientravano in un limite di caratteri specifico a causa delle piattaforme utilizzate per le presentazioni. Questo limite è molto simile a come l'invio di un messaggio di testo ha un limite di caratteri — incoraggia la sintesi!
Inoltre, poiché in Kenya si parlano molte lingue, il dataset ha catturato un mix di lingue, tra cui inglese e swahili. Alcune segnalazioni hanno persino mostrato il code-switching, dove i parlanti passano tra lingue all'interno della stessa conversazione. È come quando vedi qualcuno mescolare senza sforzo i propri piatti preferiti in un nuovo, delizioso pasto!
Distribuzione geografica delle segnalazioni
Guardando più da vicino da dove provenivano queste segnalazioni, è stato notato che la maggior parte proveniva da Nairobi e dalle contee circostanti. Non c'è da sorprendersi che una città affollata di gente generasse molte segnalazioni! Al contrario, le aree rurali avevano meno invii.
Questa distribuzione irregolare sottolinea l'importanza di garantire che tutte le voci siano ascoltate, indipendentemente dalla geografia. È come un paese pettegolo dove tutti parlano ad alta voce, mentre nelle aree più tranquille le voci hanno un peso diverso.
Tendenze nel tempo
Il dataset consente anche di analizzare le tendenze nel tempo. Esaminando quando sono arrivate le segnalazioni, i ricercatori possono vedere come è cambiato il sentiment pubblico durante le fasi elettorali. Ad esempio, prima dell'elezione, la gente segnalava scandali, mentre il giorno delle elezioni si concentrava su risultati e affluenze degli elettori.
Queste tendenze aiutano a comprendere il panorama elettorale e possono indicare questioni chiave che necessitano di attenzione. È come tracciare le stagioni; sapere quando è arrivata una tempesta può aiutare a prepararsi per la successiva!
Valutazione della qualità dei dati
Per garantire la qualità delle segnalazioni, campioni casuali sono stati esaminati da annotatori esperti per confrontare i loro risultati con quelli degli annotatori volontari. Questo passaggio è cruciale per assicurarsi che le informazioni condivise siano accurate.
Interessante notare, l'accordo tra volontari ed esperti ha mostrato alcune incongruenze, suggerendo che alcune segnalazioni erano molto soggettive — come quando qualcuno ti dice che la sua canzone preferita è la migliore di sempre, e tu semplicemente non sei d'accordo! Questa soggettività è attesa data l'enorme quantità di segnalazioni e evidenzia la necessità di sistemi automatizzati per migliorare ulteriormente l'accuratezza dei dati.
Automazione della categorizzazione delle segnalazioni
Come per qualsiasi grande dataset, l'obiettivo era esplorare come i modelli di linguaggio potessero aiutare a categorizzare e taggare le segnalazioni in modo efficiente. Utilizzando tecniche di machine learning, l'aim era ridurre il lavoro manuale e migliorare la velocità di elaborazione delle segnalazioni.
Questo approccio innovativo può aiutare le agenzie a concentrarsi di più sulla comprensione degli spunti tratti dai dati piuttosto che semplicemente setacciarli. È come avere un assistente intelligente che può filtrare pile di documenti per trovare solo le informazioni di cui hai bisogno!
Automazione del geotagging
Il geotagging comporta due compiti principali: estrarre i luoghi menzionati dalle segnalazioni e recuperare le coordinate per questi luoghi. Se la categorizzazione delle segnalazioni è un lato della medaglia, il geotagging è l'altro, completando l'immagine!
Sono stati esplorati diversi metodi, compreso l'uso di modelli avanzati che possono adattarsi e riconoscere i luoghi menzionati nelle segnalazioni. Naturalmente, a volte la tecnologia inciampa. Ci sono stati casi in cui il luogo non è stato trovato, mettendo in evidenza la necessità di un miglioramento continuo nei sistemi utilizzati.
Risultati e scoperte
I risultati delle attività di categorizzazione automatizzata e geotagging forniscono spunti preziosi su quanto siano efficaci questi sistemi. Le prestazioni sono state valutate in base a diversi parametri, assicurando che sia l'accuratezza che la copertura dei tag di posizione soddisfacessero gli standard previsti.
Curiosamente, mentre i modelli più grandi hanno mostrato prestazioni migliori nell'identificare luoghi, le sfide sono persistite nel localizzare siti o punti di riferimento specifici. È molto simile a cercare il tuo amico in una folla; a volte hai solo bisogno di qualcosa di più di una semplice descrizione!
Comprendere il lavoro correlato
Gli studi elettorali sono stati un argomento caldo, soprattutto nell'era dei social media. Molti sforzi di ricerca si sono concentrati su come le elezioni siano analizzate attraverso piattaforme online. Tuttavia, la maggior parte degli studi è stata condotta nel contesto degli Stati Uniti o dell'Europa.
Questo dataset si distingue perché si concentra specificamente sulle elezioni keniane, contribuendo a una nuova prospettiva sul dialogo riguardante l'integrità elettorale. Si basa fortemente sui contributi dei cittadini, dando priorità alle voci delle persone comuni in questo processo democratico critico.
Considerazioni etiche
Quando si tratta di dati, specialmente riguardo a individui e eventi, le considerazioni etiche sono fondamentali. I dati in questo dataset sono stati raccolti da fonti pubblicamente disponibili, assicurando che nessuna informazione riservata fosse condivisa.
Inoltre, i ricercatori che desiderano accedere a questo dataset devono aderire a un accordo di licenza che vieta l'uso improprio. Questa misura aiuta a proteggere l'integrità dei dati e assicura che vengano utilizzati per scopi giusti.
Conclusione
Il dataset delle segnalazioni dei cittadini sulla Elezione Keniana del 2022 è una risorsa potente per comprendere il sentiment pubblico e le questioni legate alle elezioni. Con 14.169 segnalazioni raccolte, riflette una varietà di opinioni ed esperienze.
Man mano che ci muoviamo avanti, l'automazione della categorizzazione e del tagging può migliorare notevolmente il modo in cui i dati vengono elaborati, consentendo risposte più rapide alle questioni emergenti.
Nel grande schema delle cose, la segnalazione dei cittadini e l'uso della tecnologia possono aiutare a rafforzare la democrazia assicurando che la voce di tutti sia ascoltata — anche se significa setacciare un cesto di bucato disordinato di opinioni e osservazioni! Mentre i cittadini continuano a partecipare e condividere le loro storie, possiamo solo sperare che questi sforzi portino a elezioni più giuste e trasparenti in futuro.
Fonte originale
Titolo: Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election
Estratto: Online reporting platforms have enabled citizens around the world to collectively share their opinions and report in real time on events impacting their local communities. Systematically organizing (e.g., categorizing by attributes) and geotagging large amounts of crowdsourced information is crucial to ensuring that accurate and meaningful insights can be drawn from this data and used by policy makers to bring about positive change. These tasks, however, typically require extensive manual annotation efforts. In this paper we present Uchaguzi-2022, a dataset of 14k categorized and geotagged citizen reports related to the 2022 Kenyan General Election containing mentions of election-related issues such as official misconduct, vote count irregularities, and acts of violence. We use this dataset to investigate whether language models can assist in scalably categorizing and geotagging reports, thus highlighting its potential application in the AI for Social Good space.
Autori: Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
Ultimo aggiornamento: 2024-12-17 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2412.13098
Fonte PDF: https://arxiv.org/pdf/2412.13098
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://github.ushahidi.org/uchaguzi-ai/
- https://uchaguzi.or.ke/
- https://www.ushahidi.com/
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/digital-response-teams-overview
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/publishing
- https://www.ushahidi.com/in-action/ushahidi-s-uchaguzi-platform-empowers-citizen-participation-in-2022-kenya-general-elections/
- https://nominatim.org/
- https://en.wikipedia.org/wiki/Null_Island