Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Computación y lenguaje# Redes sociales y de información

Los kenianos hablan: Los informes de los ciudadanos moldean la realidad electoral

Una mirada a cómo el periodismo ciudadano impactó las Elecciones Generales de Kenia en 2022.

Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes

― 11 minilectura


Los Reportes deLos Reportes deCiudadanos Transformanlas Elecciones en Keniael panorama electoral de 2022.Cómo las voces cotidianas transformaron
Tabla de contenidos

En 2022, los kenianos fueron a las urnas para una elección general que vio una cantidad significativa de reportes ciudadanos. Esta reporting fue posible gracias a varias plataformas en línea donde la gente podía compartir sus opiniones y experiencias en tiempo real. Imagina un gran tablero de anuncios comunitario donde todos pueden publicar sus pensamientos, quejas y observaciones sobre lo que está pasando a su alrededor en el día de las elecciones. ¡Esto es lo que es el Periodismo ciudadano hoy en día!

Los ciudadanos reportaron problemas como mala conducta, conteos de votos extraños e incluso casos de violencia. Este conjunto de Datos consiste en más de 14,000 reportes relacionados con las Elecciones Generales de Kenia de 2022. Estos reportes se recogieron de una plataforma que ayudó a la gente a enviar sus opiniones usando SMS, redes sociales y otros medios digitales. La belleza de este proceso es que le da voz a la persona común, permitiéndole reportar lo que ve y siente mientras los eventos se desarrollan.

La Importancia de Organizar los Datos

Cuando llega un aluvión de información, es esencial organizarla de manera efectiva. Piensa en ello como tratar de armar un enorme rompecabezas: sin clasificar las piezas primero, ¡es un poco un lío! Cada reporte fue categorizado según problemas específicos, y la ubicación de cada incidente fue etiquetada, para que pudiera ser mapeada. Esta organización es vital para las autoridades y los encargados de políticas, ayudándoles a obtener información de esta data para promover cambios positivos en la sociedad.

La tarea de organizar todos estos reportes no es fácil y a menudo requiere mucho trabajo manual. Es como tener una montaña de ropa limpia: lleva tiempo y esfuerzo doblar y guardar todo de manera ordenada. Por eso este conjunto de datos es significativo; busca simplificar el proceso usando tecnología para ayudar en la categorización y etiquetado de reportes.

Reportes Ciudadanos en Acción

Las plataformas de reportes en línea permitieron a los ciudadanos reportar problemas mientras sucedían. Estos reportes cubren una variedad de temas, como quejas sobre el funcionamiento de las estaciones de votación, alegaciones de fraude y observaciones sobre el comportamiento de los votantes. La naturaleza del periodismo ciudadano lo convierte en una herramienta poderosa para arrojar luz sobre las realidades de las elecciones, especialmente en lugares donde los medios tradicionales pueden no tener acceso.

Sin embargo, no todos los reportes son confiables. Algunos pueden basarse en meras opiniones o rumores en lugar de hechos. Es por eso que es crucial que las plataformas verifiquen los reportes. Sin verificación, el contenido sin filtrar puede propagar desinformación como un incendio forestal. Es como pasar un rumor sobre alguien; puede salir totalmente de control (y créenos, a nadie le gusta estar del lado receptor de un rumor).

Para hacer un seguimiento de cómo los reportes afectan a diferentes comunidades, las plataformas también los clasificaron por tema y ubicación. Esto significa que cuando alguien lee un reporte, puede ver cómo se desarrollan los eventos en su área, manteniéndose informado sobre su comunidad. Es como tener un canal de noticias local que transmite actualizaciones en vivo de tu vecindario, directamente en tu celular.

Descripción General del Conjunto de Datos

El conjunto de datos contiene 14,169 reportes relacionados con las Elecciones Generales de Kenia de 2022. Estos reportes fueron enviados a través de un sistema diseñado específicamente para este propósito. Durante un período de dos meses previos a la elección, los ciudadanos compartieron sus experiencias y observaciones.

Los reportes fueron revisados cuidadosamente por voluntarios capacitados que aseguraron que la información fuera precisa y categorizada correctamente. Estos voluntarios hablaban tanto inglés como swahili, lo cual es bastante útil en un país con una rica diversidad lingüística. Después de la revisión, estos reportes se hicieron disponibles al público, proporcionando valiosos insights para periodistas, investigadores y ciudadanos por igual.

Clasificación de Temas

Para dar sentido a los reportes, fueron divididos en categorías según sus temas. Piensa en los temas como los capítulos de un libro, con cada capítulo enfocándose en un tema diferente. Por ejemplo, algunos reportes hablaban de irregularidades en la votación, mientras que otros se centraban en problemas de seguridad o tareas administrativas en las estaciones de votación.

Los voluntarios asignaron temas a cada reporte según su contenido. Además, se añadieron etiquetas específicas para proporcionar aún más detalle. Esto es similar a cómo podrías etiquetar tus cajas al mudarte; ¡te ahorra de abrir cada una para encontrar tu ropa de invierno!

Geolocalización de los Reportes

Cada reporte también incluía una etiqueta geográfica, lo que significa que se marcó la ubicación donde ocurrió el incidente. Los voluntarios hicieron esto buscando menciones de lugares en los reportes. En caso de que no se especificara ninguna ubicación, se estableció un punto predeterminado en el centro de Nairobi. Es una solución práctica, similar a poner "hogar" como tu ubicación cuando te pierdes.

Esta información geográfica ayuda a crear un mapa visual de dónde ocurrieron los eventos. Al trazar estos reportes en un mapa, uno puede ver fácilmente qué áreas experimentaron problemas durante la elección. Esto puede informar discusiones y decisiones tomadas por diversas partes interesadas, incluidos gobiernos y ONG.

Desafíos con la Anotación de Datos

Como puedes imaginar, clasificar miles de reportes y organizarlos no es un paseo por el parque. Requiere tiempo, atención y mucha paciencia. La anotación manual es, de hecho, intensiva en mano de obra, lo que a menudo lleva a retrasos en hacer la información pública.

En el caso de los reportes de elecciones en Kenia, se recibieron un impresionante número de 86,000 reportes, pero no fueron anotados debido a la falta de recursos. Esto muestra cuán valioso podría ser un enfoque automatizado para ayudar a manejar grandes cantidades de datos.

Longitud del Reporte y Contenido

Los reportes variaron en longitud, con muchos ajustándose a un límite específico de caracteres debido a las plataformas utilizadas para las presentaciones. Este límite es muy similar a cómo enviar un mensaje de texto tiene un límite de caracteres - ¡fomenta la concisión!

Además, dado que se hablan muchos idiomas en Kenia, el conjunto de datos capturó una mezcla de idiomas, incluido el inglés y el swahili. Algunos reportes incluso mostraron cambio de código, donde los hablantes alternan entre idiomas en la misma conversación. ¡Es como cuando ves a alguien mezclar sin esfuerzo sus platos favoritos en una nueva comida sabrosa!

Distribución Geográfica de los Reportes

Al observar más de cerca de dónde provenían estos reportes, se notó que la mayoría provenía de Nairobi y sus condados circundantes. ¡No es sorpresa que una ciudad llena de gente genere muchos reportes! En contraste, las áreas rurales tuvieron menos presentaciones.

Esta distribución desigual subraya la importancia de asegurar que todas las voces sean escuchadas, independientemente de la geografía. Es como un pueblo chismoso donde todos están hablando en voz alta, mientras que en áreas más tranquilas, los susurros llevan un peso diferente.

Tendencias a lo Largo del Tiempo

El conjunto de datos también permite analizar tendencias a lo largo del tiempo. Al examinar cuándo llegaron los reportes, los investigadores pueden ver cómo cambió el sentimiento público a lo largo de las fases de la elección. Por ejemplo, antes de la elección, la gente reportaba escándalos, mientras que en el día de la elección, se centraron en los resultados y la participación de los votantes.

Estas tendencias ayudan a comprender el panorama electoral y pueden señalar problemas clave que necesitan atención. Es como seguir las estaciones; saber cuándo llegó una tormenta puede ayudar a prepararse para la próxima.

Evaluación de la Calidad de los Datos

Para asegurar la calidad de los reportes, se revisaron muestras aleatorias por anotadores expertos para comparar sus hallazgos con los de los anotadores voluntarios. Este paso es crucial para garantizar que la información compartida sea precisa.

Curiosamente, el acuerdo entre voluntarios y expertos mostró algunas inconsistencias, sugiriendo que algunos reportes eran muy subjetivos - como cuando alguien te dice que su canción favorita es la mejor de todas, y tú simplemente no estás de acuerdo. ¡Esta subjetividad es esperada dada la cantidad de reportes y destaca la necesidad de sistemas Automatizados para mejorar aún más la precisión de los datos!

Automatizando la Categorización de Reportes

Como con cualquier conjunto de datos grande, el objetivo era explorar cómo los modelos de lenguaje podrían ayudar a categorizar y etiquetar reportes de manera eficiente. Usando técnicas de aprendizaje automático, la meta era reducir el trabajo manual y mejorar la velocidad del procesamiento de reportes.

Este enfoque innovador puede ayudar a las agencias a enfocarse más en entender los insights extraídos de los datos en lugar de simplemente filtrar a través de ellos. Es como tener un asistente inteligente que puede filtrar montones de papeles para encontrar exactamente la información que necesitas.

Automatización de la Geotagging

La geotagging implica dos tareas clave: extraer las ubicaciones mencionadas de los reportes y recuperar las coordenadas de estas ubicaciones. Si categorizar reportes es un lado de la moneda, la geotagging es el otro, ¡completando el cuadro!

Se exploraron varios métodos, incluyendo el uso de modelos avanzados que pueden adaptarse y reconocer las ubicaciones mencionadas en los reportes. Claro, la tecnología a veces tropieza. Hubo casos en los que no se encontró la ubicación, lo que resalta la necesidad de una mejora continua en los sistemas utilizados.

Resultados y Hallazgos

Los resultados de las tareas de categorización automatizada y geotagging proporcionan valiosos insights sobre cuán efectivas pueden ser estos sistemas. El rendimiento se evaluó en función de diferentes métricas, asegurando que tanto la precisión como la cobertura de las etiquetas de ubicación cumplieran con los estándares esperados.

Curiosamente, aunque los modelos más grandes mostraron un mejor rendimiento en la identificación de ubicaciones, persistieron los desafíos en localizar sitios específicos o puntos de referencia. Esto es muy similar a tratar de encontrar a tu amigo en una multitud; ¡a veces solo necesitas un poco más que una simples descripción!

Entendiendo el Trabajo Relacionado

Los estudios electorales han sido un tema candente, especialmente en la era de las redes sociales. Muchos esfuerzos de investigación se han centrado en cómo se analizan las elecciones a través de plataformas en línea. Sin embargo, la mayoría de los estudios han tenido lugar en el contexto de Estados Unidos o Europa.

Este conjunto de datos se destaca porque se centra específicamente en las elecciones kenianas, contribuyendo con una nueva perspectiva al diálogo sobre la integridad electoral. Se apoya fuertemente en las contribuciones ciudadanas, priorizando las voces de la gente común en este proceso democrático crítico.

Consideraciones Éticas

Al tratar con datos, especialmente en relación a individuos y eventos, las consideraciones éticas son primordiales. La data en este conjunto se recopiló de fuentes disponibles públicamente, asegurando que no se compartiera información confidencial.

Además, los investigadores que deseen acceder a este conjunto de datos deben cumplir con un acuerdo de licencia que prohíbe el uso indebido. Esta medida ayuda a proteger la integridad de los datos y asegura que se utilicen para los fines correctos.

Conclusión

El conjunto de datos de reportes ciudadanos sobre las Elecciones Kenianas de 2022 es un recurso poderoso para entender el sentimiento público y los problemas alrededor de las elecciones. Con 14,169 reportes recopilados, refleja una diversa gama de opiniones y experiencias.

A medida que avanzamos, la automatización de la categorización y etiquetado puede mejorar considerablemente cómo se procesan los datos, permitiendo respuestas más rápidas a los problemas emergentes.

En la gran scheme de las cosas, el periodismo ciudadano y el uso de tecnología pueden ayudar a fortalecer la democracia al garantizar que se escuche la voz de todos - ¡incluso si eso significa clasificar una cesta desordenada de opiniones y observaciones! A medida que los ciudadanos continúen participando y compartiendo sus historias, solo podemos esperar que estos esfuerzos conduzcan a elecciones más justas y transparentes en el futuro.

Fuente original

Título: Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election

Resumen: Online reporting platforms have enabled citizens around the world to collectively share their opinions and report in real time on events impacting their local communities. Systematically organizing (e.g., categorizing by attributes) and geotagging large amounts of crowdsourced information is crucial to ensuring that accurate and meaningful insights can be drawn from this data and used by policy makers to bring about positive change. These tasks, however, typically require extensive manual annotation efforts. In this paper we present Uchaguzi-2022, a dataset of 14k categorized and geotagged citizen reports related to the 2022 Kenyan General Election containing mentions of election-related issues such as official misconduct, vote count irregularities, and acts of violence. We use this dataset to investigate whether language models can assist in scalably categorizing and geotagging reports, thus highlighting its potential application in the AI for Social Good space.

Autores: Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes

Última actualización: Dec 17, 2024

Idioma: English

Fuente URL: https://arxiv.org/abs/2412.13098

Fuente PDF: https://arxiv.org/pdf/2412.13098

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares