Quenianos Falam: Relatos de Cidadãos Moldam a Realidade da Eleição
Um olhar sobre como o jornalismo cidadão impactou as Eleições Gerais do Quênia em 2022.
Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
― 11 min ler
Índice
- A Importância de Organizar Dados
- Relatos Cidadãos em Ação
- Visão Geral do Conjunto de Dados
- Classificação de Tópicos
- Geotagging dos Relatos
- Desafios com Anotação de Dados
- Comprimento e Conteúdo dos Relatos
- Distribuição Geográfica dos Relatos
- Tendências ao Longo do Tempo
- Avaliando a Qualidade dos Dados
- Automatizando a Categorização de Relatos
- Automação do Geotagging
- Resultados e Descobertas
- Entendendo o Trabalho Relacionado
- Considerações Éticas
- Conclusão
- Fonte original
- Ligações de referência
Em 2022, os quenianos foram às urnas para uma eleição geral que teve uma quantidade significativa de relatos de cidadãos. Essa reportagem foi possível através de várias plataformas online onde as pessoas podiam compartilhar suas opiniões e experiências em tempo real. Imagine um grande mural comunitário onde todo mundo pode postar seus pensamentos, reclamações e observações sobre o que tá rolando no dia da eleição. Isso é o que o Jornalismo Cidadão parece hoje!
Os cidadãos relataram problemas como má conduta, contagens de votos estranhas e até casos de violência. Esse conjunto de Dados contém mais de 14.000 relatos relacionados à Eleição Geral do Quênia em 2022. Esses relatos foram coletados de uma plataforma que ajudou as pessoas a enviar suas opiniões usando SMS, redes sociais e outros meios digitais. A beleza desse processo é que ele dá voz à pessoa comum, permitindo que elas relatem o que veem e sentem à medida que os eventos acontecem.
A Importância de Organizar Dados
Quando uma enxurrada de informações chega, é essencial organizá-las de maneira eficaz. Pense nisso como tentar montar um gigantesco quebra-cabeça — sem organizar as peças primeiro, é um verdadeiro caos! Cada relato foi categorizado com base em problemas específicos, e a localização de cada incidente foi marcada, para que pudesse ser mapeada. Essa organização é vital para as autoridades e formuladores de políticas, ajudando-os a obter insights dessas informações para promover mudanças positivas na sociedade.
A tarefa de organizar todos esses relatos não é fácil e muitas vezes exige muito trabalho manual. É como ter uma montanha de roupas para dobrar — leva tempo e esforço para colocar tudo em ordem. É por isso que esse conjunto de dados é significativo; ele visa simplificar o processo usando tecnologia para ajudar na categorização e na marcação dos relatos.
Relatos Cidadãos em Ação
As plataformas de relato online permitiram que os cidadãos reportassem problemas à medida que aconteciam. Esses relatos abrangem uma variedade de tópicos, como reclamações sobre o funcionamento das seções eleitorais, alegações de fraudes e observações sobre o comportamento dos eleitores. A natureza do jornalismo cidadão torna-o uma ferramenta poderosa para iluminar as realidades das eleições, especialmente em lugares onde a mídia tradicional pode não ter acesso.
No entanto, nem todo relato é confiável. Alguns podem ser baseados em meras opiniões ou rumores ao invés de fatos. É por isso que é crucial que as plataformas verifiquem os relatos. Sem verificação, o conteúdo não filtrado pode espalhar desinformação como fogo em palha. É como passar um boato sobre alguém; isso pode facilmente sair do controle (e acredite, ninguém gosta de estar do outro lado de um rumor!).
Para acompanhar como os relatos afetam diferentes comunidades, as plataformas também os categorizaram por tópico e localização. Isso significa que quando alguém lê um relato, pode ver como os eventos se desenrolam em sua área, assim, se mantendo informado sobre sua comunidade. É como ter um canal de notícias local que transmite atualizações ao vivo do seu bairro, direto no seu celular.
Visão Geral do Conjunto de Dados
O conjunto de dados contém 14.169 relatos relacionados às Eleições Gerais do Quênia de 2022. Esses relatos foram enviados através de um sistema criado especificamente para esse propósito. Ao longo de dois meses antes da eleição, os cidadãos compartilharam suas experiências e observações.
Os relatos foram cuidadosamente revisados por voluntários treinados que garantiram que os dados fossem precisos e categorizados corretamente. Esses voluntários falavam inglês e suaíli, o que é bem útil em um país com uma rica diversidade linguística! Após a revisão, esses relatos ficaram disponíveis ao público, oferecendo insights valiosos para jornalistas, pesquisadores e cidadãos.
Classificação de Tópicos
Para dar sentido aos relatos, eles foram divididos em categorias com base em seus tópicos. Pense nos tópicos como os capítulos de um livro, com cada capítulo focando em um tema diferente. Por exemplo, alguns relatos eram sobre irregularidades na votação, enquanto outros se concentravam em questões de segurança ou tarefas administrativas nas seções eleitorais.
Os voluntários atribuíram tópicos a cada relato com base no conteúdo. Além disso, tags específicas foram adicionadas para fornecer ainda mais detalhes. Isso é semelhante a como você poderia rotular suas caixas ao se mudar; isso evita que você tenha que abrir cada uma delas para encontrar suas roupas de inverno!
Geotagging dos Relatos
Cada relato também incluía uma tag geográfica, ou seja, a localização onde o incidente ocorreu foi marcada. Os voluntários fizeram isso procurando menções de lugares nos relatos. No caso em que nenhuma localização fosse especificada, um ponto padrão foi definido no centro de Nairóbi. É uma solução prática, como colocar "casa" como sua localização quando você se perde.
Essas informações geográficas ajudam a criar um mapa visual de onde os eventos ocorreram. Ao plotar esses relatos em um mapa, é fácil ver quais áreas enfrentaram problemas durante a eleição. Isso pode informar discussões e decisões feitas por diferentes partes interessadas, incluindo governos e ONGs.
Desafios com Anotação de Dados
Como você pode imaginar, separar milhares de relatos e organizá-los não é moleza. Isso requer tempo, atenção e muita paciência. A anotação manual é, de fato, intensiva em mão de obra, o que muitas vezes leva a atrasos na divulgação das informações.
No caso dos relatos da eleição queniana, um impressionante número de 86.000 relatos foi recebido, mas não foram anotados devido à falta de recursos. Isso mostra quão valiosa uma abordagem automatizada poderia ser para ajudar a lidar com grandes quantidades de dados.
Comprimento e Conteúdo dos Relatos
Os relatos variavam em comprimento, com muitos se encaixando em um limite específico de caracteres devido às plataformas usadas para envios. Esse limite é muito parecido com o de enviar uma mensagem de texto, que tem um cap de caracteres — isso incentiva a objetividade!
Além disso, como muitas línguas são faladas no Quênia, o conjunto de dados capturou uma mistura de idiomas, incluindo inglês e suaíli. Alguns relatos até apresentavam alternância de códigos, onde os falantes trocam de idiomas dentro da mesma conversa. É como quando você vê alguém misturar seus pratos favoritos em uma nova refeição saborosa!
Distribuição Geográfica dos Relatos
Ao dar uma olhada mais de perto em onde esses relatos vieram, foi notado que a maioria se originou em Nairóbi e seus condados vizinhos. Não é surpresa que uma cidade cheia de gente gerasse muitos relatos! Em contraste, áreas rurais tiveram menos envios.
Essa distribuição desigual sublinha a importância de garantir que todas as vozes sejam ouvidas, independentemente da geografia. É como uma cidade cheia de fofocas onde todo mundo fala alto, enquanto em áreas mais silenciosas, os sussurros têm um peso diferente.
Tendências ao Longo do Tempo
O conjunto de dados também permite analisar tendências ao longo do tempo. Ao examinar quando os relatos chegaram, os pesquisadores podem ver como o sentimento público mudou durante as fases da eleição. Por exemplo, antes da eleição, as pessoas relataram escândalos, enquanto no dia da eleição, elas se concentraram em resultados e comparecimento dos eleitores.
Essas tendências ajudam a entender o cenário eleitoral e podem apontar questões-chave que precisam ser abordadas. É como acompanhar as estações; saber quando uma tempestade atingiu pode ajudar a se preparar para a próxima!
Avaliando a Qualidade dos Dados
Para garantir a qualidade dos relatos, amostras aleatórias foram revisadas por anotadores especialistas para comparar suas descobertas com as dos voluntários. Essa etapa é crucial para garantir que as informações compartilhadas sejam precisas.
Curiosamente, o acordo entre voluntários e especialistas mostrou algumas inconsistências, sugerindo que alguns relatos eram fortemente subjetivos — como quando alguém te diz que sua música favorita é a melhor de todas e você simplesmente não concorda! Essa subjetividade é esperada, dada a quantidade de relatos e destaca a necessidade de sistemas Automatizados para aprimorar ainda mais a precisão dos dados.
Automatizando a Categorização de Relatos
Como em qualquer conjunto de dados grande, o objetivo era explorar como modelos de linguagem poderiam ajudar a categorizar e marcar relatos de maneira eficiente. Usando técnicas de aprendizado de máquina, o objetivo era reduzir o trabalho manual e aumentar a velocidade do processamento dos relatos.
Essa abordagem inovadora pode ajudar as agências a se concentrarem mais em entender os insights extraídos dos dados do que apenas em filtrar isso. É como ter um assistente inteligente que pode filtrar montanhas de papéis para encontrar apenas a informação que você precisa!
Automação do Geotagging
O geotagging envolve duas tarefas principais: extrair as localizações mencionadas nos relatos e recuperar as coordenadas para essas localizações. Se categorizar relatos é um lado da moeda, o geotagging é o outro, completando a imagem!
Vários métodos foram explorados, incluindo o uso de modelos avançados que podem se adaptar e reconhecer locais mencionados nos relatos. Claro, a tecnologia às vezes falha. Houve casos em que a localização não foi encontrada, destacando a necessidade de melhorias contínuas nos sistemas utilizados.
Resultados e Descobertas
Os resultados das tarefas de categorização automatizada e geotagging fornecem insights valiosos sobre quão eficazes esses sistemas podem ser. O desempenho foi avaliado com base em diferentes métricas, garantindo que tanto a precisão quanto a cobertura das tags de localização atendesse aos padrões esperados.
Curiosamente, enquanto modelos maiores mostraram melhor desempenho na identificação de locais, desafios persistiram em localizar sites ou marcos específicos. Isso é muito parecido com tentar encontrar seu amigo em uma multidão; às vezes você só precisa de um pouco mais do que uma descrição simples!
Entendendo o Trabalho Relacionado
Estudos eleitorais têm sido um assunto quente, especialmente na era das redes sociais. Muitos esforços de pesquisa se concentraram em como as eleições são analisadas por meio de plataformas online. A maioria dos estudos, no entanto, ocorreu no contexto dos Estados Unidos ou da Europa.
Esse conjunto de dados se destaca porque se centra especificamente nas eleições quenianas, contribuindo com uma nova perspectiva para o diálogo sobre a integridade eleitoral. Ele se apoia fortemente nas contribuições dos cidadãos, priorizando as vozes das pessoas comuns nesse processo democrático crítico.
Considerações Éticas
Ao lidar com dados, especialmente sobre indivíduos e eventos, considerações éticas são fundamentais. Os dados desse conjunto foram coletados a partir de fontes públicas, garantindo que nenhuma informação confidencial fosse compartilhada.
Além disso, os pesquisadores que desejam acessar esse conjunto de dados devem aderir a um acordo de licenciamento que proíbe o uso indevido. Essa medida ajuda a proteger a integridade dos dados e garante que sejam usados para os fins corretos.
Conclusão
O conjunto de dados de relatos de cidadãos sobre a Eleição Queniana de 2022 é um recurso poderoso para entender o sentimento público e as questões em torno das eleições. Com 14.169 relatos coletados, reflete uma diversidade de opiniões e experiências.
À medida que avançamos, a automação da categorização e marcação pode melhorar bastante como os dados são processados, permitindo respostas mais rápidas a questões emergentes.
No grande esquema das coisas, o relato cidadão e o uso da tecnologia podem ajudar a fortalecer a democracia, garantindo que a voz de todos seja ouvida — mesmo que isso signifique passar por uma cesta de roupa suja cheia de opiniões e observações! À medida que os cidadãos continuam a participar e compartilhar suas histórias, só podemos esperar que esses esforços levem a eleições mais justas e transparentes no futuro.
Fonte original
Título: Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election
Resumo: Online reporting platforms have enabled citizens around the world to collectively share their opinions and report in real time on events impacting their local communities. Systematically organizing (e.g., categorizing by attributes) and geotagging large amounts of crowdsourced information is crucial to ensuring that accurate and meaningful insights can be drawn from this data and used by policy makers to bring about positive change. These tasks, however, typically require extensive manual annotation efforts. In this paper we present Uchaguzi-2022, a dataset of 14k categorized and geotagged citizen reports related to the 2022 Kenyan General Election containing mentions of election-related issues such as official misconduct, vote count irregularities, and acts of violence. We use this dataset to investigate whether language models can assist in scalably categorizing and geotagging reports, thus highlighting its potential application in the AI for Social Good space.
Autores: Roberto Mondini, Neema Kotonya, Robert L. Logan, Elizabeth M Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes
Última atualização: Dec 17, 2024
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.13098
Fonte PDF: https://arxiv.org/pdf/2412.13098
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://github.ushahidi.org/uchaguzi-ai/
- https://uchaguzi.or.ke/
- https://www.ushahidi.com/
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/digital-response-teams-overview
- https://docs.ushahidi.com/uchaguzi-support/digital-response-teams/publishing
- https://www.ushahidi.com/in-action/ushahidi-s-uchaguzi-platform-empowers-citizen-participation-in-2022-kenya-general-elections/
- https://nominatim.org/
- https://en.wikipedia.org/wiki/Null_Island