Sentimento sobre Transporte Público na África Subsaariana
Analisando as experiências dos passageiros no Quênia, Tanzânia e África do Sul.
Rozina L. Myoya, Vukosi Marivate, Idris Abdulmumin
― 10 min ler
Índice
- A Necessidade de Análise de Sentimentos dos Usuários
- Redes Sociais como Fonte de Dados
- O Poder do NLP
- O Layout do Estudo
- Coleta de Dados
- Processamento de Dados
- Extração de Recursos
- Entendendo os Sentimentos dos Passageiros por País
- Quênia
- Tanzânia
- África do Sul
- Teste e Avaliação dos Modelos
- Principais Descobertas
- Conclusões e Direções Futuras
- Considerações Éticas
- Últimos Pensamentos
- Fonte original
- Ligações de referência
O transporte público tem um papel super importante na vida diária de milhões de pessoas ao redor do mundo. Na África Subsaariana, sistemas de ônibus, ferrovias e táxis coletivos são essenciais para quem se desloca. Mas, muitas vezes, esses sistemas recebem menos atenção do que setores como saúde ou educação, resultando em problemas na qualidade do serviço e na experiência do usuário. Saber o que os passageiros pensam sobre o transporte público pode ajudar a melhorar esses sistemas, mas como a gente consegue coletar e analisar essas informações de forma eficiente?
Com o crescimento das redes sociais, as pessoas estão cada vez mais vocalizando suas experiências. Plataformas como o Twitter (agora X) se tornaram ótimos lugares para os passageiros compartilharem suas opiniões. Isso cria uma fonte rica de dados que pode ser usada para entender o sentimento público. Então, vamos dar uma volta pelo mundo do sentimento dos usuários de transporte público, especialmente no Quênia, Tanzânia e África do Sul!
Análise de Sentimentos dos Usuários
A Necessidade dePor que devemos nos importar com o que os usuários pensam sobre o transporte público? Bem, entender o sentimento dos passageiros pode levar a serviços melhores e experiências aprimoradas. Com muita gente dependendo do transporte público, é essencial que as autoridades de transporte saibam onde estão arrasando e onde estão falhando.
Por exemplo, se muitos passageiros estão expressando preocupações sobre a segurança, é um sinal claro de que algo precisa ser feito. Por outro lado, se há elogios a um novo serviço de ônibus, pode valer a pena expandir esse serviço. Coletar dados das redes sociais não só oferece feedback em tempo real, mas também é uma solução econômica, já que demanda menos trabalho e recursos em comparação com pesquisas tradicionais.
Redes Sociais como Fonte de Dados
As plataformas de redes sociais estão cheias de opiniões e permitem que os usuários expressem seus pensamentos livremente. Os passageiros frequentemente compartilham suas experiências, seja elogiando uma viagem tranquila ou reclamando de longos atrasos. Esses dados podem ser uma mina de ouro para entender o sentimento dos usuários.
Mas, também tem desafios. Tweets podem ser informais, cheios de gírias ou até incluir várias línguas em um único post. Isso é especialmente comum em regiões multilíngues como a África Subsaariana. Para entender tudo isso, os pesquisadores têm que usar técnicas de Processamento de Linguagem Natural (NLP) para filtrar o ruído.
O Poder do NLP
Então, o que é esse NLP? Basicamente, é um ramo da inteligência artificial que lida com a interação entre computadores e as línguas humanas. Usando algoritmos avançados, o NLP pode ajudar a analisar dados textuais para extrair informações úteis. No contexto da análise de sentimentos do transporte público, o NLP pode identificar se um tweet expressa uma opinião positiva, negativa ou neutra.
Neste estudo, foram usados vários modelos de linguagem pré-treinados especificamente projetados para línguas africanas. Isso significa que as máquinas foram "treinadas" nessas línguas, permitindo que entendessem e analisassem melhor os tweets feitos em línguas como suaíli, isiZulu e SeTswana.
O Layout do Estudo
Os pesquisadores focaram em três países: Quênia, Tanzânia e África do Sul. Eles coletaram uma variedade de tweets relacionados ao transporte público entre janeiro de 2007 e março de 2023, de grandes cidades como Nairóbi, Dar es Salaam e Joanesburgo. Filtrando os dados irrelevantes e focando nas principais palavras-chave do transporte, eles queriam ter uma ideia mais clara dos sentimentos dos passageiros.
O estudo envolveu várias etapas, incluindo sourcing de dados, processamento, análise e, finalmente, a aplicação de modelos de análise de sentimento. Cada etapa foi crucial para garantir que os dados coletados fossem relevantes e informativos.
Coleta de Dados
A coleta de dados envolveu o uso de palavras-chave específicas relacionadas ao transporte público em cada país. Isso incluiu termos que as pessoas poderiam usar ao tweetar sobre suas experiências de viagem. Os pesquisadores se concentraram em áreas metropolitanas onde o transporte público é uma parte fundamental do deslocamento diário.
Após reunir um conjunto de dados substancial, os pesquisadores se voltaram para o processamento dessas informações. Essa etapa é chave, pois garante que apenas dados significativos sejam analisados, removendo qualquer coisa que não tenha a ver com o estudo.
Processamento de Dados
Depois que os dados foram coletados, eles precisavam ser limpos e preparados para análise. Isso envolveu várias tarefas, como remover pontuações, corrigir contrações e descartar palavras irrelevantes. O objetivo era focar nas características mais críticas dos tweets que poderiam revelar o sentimento dos usuários.
Durante essa fase, os pesquisadores também realizaram testes de identificação de língua para garantir que estavam analisando tweets nas línguas certas. Descobriram que alguns tweets continham uma mistura de línguas, conhecida como alternância de códigos. Isso era especialmente comum em um contexto multilíngue, com palavras de diferentes línguas misturadas em tweets únicos.
Extração de Recursos
Após o processamento dos dados, os pesquisadores usaram uma técnica chamada extração de recursos para determinar os temas subjacentes nos tweets. Esse processo envolveu a criação de embeddings de palavras, uma maneira de converter palavras em representações numéricas que as máquinas conseguem entender.
Ao empregar métodos como Word2Vec e agrupamento K-Means, os pesquisadores puderam agrupar palavras e termos semelhantes. Isso ajudou a identificar temas comuns nos tweets, como preocupações com segurança ou preços de tarifas. Essas características extraídas foram essenciais para entender o sentimento dos passageiros em diferentes países.
Entendendo os Sentimentos dos Passageiros por País
Quênia
No conjunto de dados queniano, a análise revelou sentimentos predominantemente negativos. Os temas principais incluíram Preocupações com a segurança, especialmente em relação ao setor de táxis coletivos (chamados de Matatus). Os passageiros expressaram medos sobre aumentos de preço imprevisíveis, possíveis incidentes de crimes violentos e questões de segurança em geral.
A indústria de Matatus tem sido alvo de críticas por suas medidas de segurança, e os tweets refletem frustrações contínuas dos passageiros em relação às suas experiências. Apesar das tentativas de reforma, problemas como velocidade excessiva e assédio de passageiros persistem, levando a uma visão negativa do transporte público no Quênia.
Tanzânia
Em contraste, a análise de sentimentos da Tanzânia mostrou sentimentos principalmente positivos. No entanto, essa positividade veio com uma ressalva – muitos dos dados eram promocionais ou relacionados a propaganda. Os tweets frequentemente focavam no novo sistema de Bus Rapid Transit (BRT) em Dar es Salaam, que recebeu aplausos pela sua eficiência.
O lado negativo foi que alguns tweets estavam relacionados a aumentos de tarifas, o que, no entanto, destaca um aspecto importante: a relação entre preços e sentimentos. Se os sistemas de transporte público quiserem manter um sentimento positivo, devem ser cautelosos com mudanças de preço que possam desagradar os passageiros.
África do Sul
A África do Sul apresentou uma imagem menos animadora, com sentimentos predominantemente negativos emergindo da análise. As principais preocupações giravam em torno da deterioração da qualidade do sistema de transporte público, especialmente os serviços ferroviários. Os passageiros expressaram frustrações sobre vandalismo, falhas de serviço e questões relacionadas à transparência do governo na gestão dos desafios do transporte público.
Os sentimentos negativos refletiam problemas sistêmicos mais amplos dentro do setor de transporte. À medida que os passageiros expressavam sua insatisfação, ficou claro que a qualidade da infraestrutura e a responsabilidade do governo eram as principais preocupações.
Teste e Avaliação dos Modelos
Para clareza, a pesquisa envolveu o uso de GPUs para teste dos modelos, o que significa que eles aproveitaram o poder de unidades de processamento gráfico avançadas para conduzir suas análises de forma eficaz. Avaliaram vários modelos pré-treinados equipados para lidar com as línguas presentes nos conjuntos de dados.
Através de testes e ajustes, os pesquisadores selecionaram os modelos com melhor desempenho com base em sua pontuação F1, um métrica que avalia a precisão de um modelo. Isso garantiu que a análise fosse robusta e confiável.
Principais Descobertas
As descobertas deste estudo foram reveladoras. Os sentimentos dos passageiros nos três países exibiram tendências distintas. Enquanto Quênia e África do Sul enfrentavam desafios significativos em relação à segurança e infraestrutura, os sentimentos da Tanzânia pareciam mais favoráveis, embora com algumas preocupações relacionadas a preços.
As principais preocupações em geral estavam relacionadas ao custo do transporte público, dinâmicas de segurança e a qualidade percebida dos serviços. Ao destacar essas questões, o estudo fornece insights valiosos para as partes interessadas no setor de transporte público.
Conclusões e Direções Futuras
A pesquisa destaca o potencial de empregar técnicas de NLP para analisar o sentimento dos usuários no transporte público. Dados de redes sociais podem oferecer insights valiosos sobre as experiências dos passageiros, permitindo que os provedores de transporte tomem decisões informadas sobre melhorias.
Avançando, há espaço para aprimorar os métodos de coleta de dados e processos de validação. Incorporar mais conjuntos de dados que representem a experiência mais ampla do passageiro pode levar a insights mais informados. Além disso, empregar técnicas avançadas como mineração de opinião baseada em aspectos poderia ajudar a aprofundar-se em áreas específicas de preocupação.
Considerações Éticas
Embora a pesquisa tenha utilizado dados de redes sociais, priorizou a privacidade dos usuários. Todas as informações identificáveis, como nomes de usuários e tags de localização, foram removidas meticulosamente do conjunto de dados. Proteger a privacidade e a confidencialidade dos usuários das redes sociais é crucial, e este estudo se esforçou para manter esses padrões éticos.
Últimos Pensamentos
No grande esquema das coisas, o sentimento dos usuários em relação ao transporte público é um aspecto vital, mas muitas vezes negligenciado, que pode impulsionar mudanças reais. Ao entender o que os passageiros pensam e sentem, podemos trabalhar em direção a serviços melhores, segurança aprimorada e, em última análise, uma experiência de transporte público mais amigável. Afinal, todo mundo merece uma viagem tranquila!
Fonte original
Título: Analysing Public Transport User Sentiment on Low Resource Multilingual Data
Resumo: Public transport systems in many Sub-Saharan countries often receive less attention compared to other sectors, underscoring the need for innovative solutions to improve the Quality of Service (QoS) and overall user experience. This study explored commuter opinion mining to understand sentiments toward existing public transport systems in Kenya, Tanzania, and South Africa. We used a qualitative research design, analysing data from X (formerly Twitter) to assess sentiments across rail, mini-bus taxis, and buses. By leveraging Multilingual Opinion Mining techniques, we addressed the linguistic diversity and code-switching present in our dataset, thus demonstrating the application of Natural Language Processing (NLP) in extracting insights from under-resourced languages. We employed PLMs such as AfriBERTa, AfroXLMR, AfroLM, and PuoBERTa to conduct the sentiment analysis. The results revealed predominantly negative sentiments in South Africa and Kenya, while the Tanzanian dataset showed mainly positive sentiments due to the advertising nature of the tweets. Furthermore, feature extraction using the Word2Vec model and K-Means clustering illuminated semantic relationships and primary themes found within the different datasets. By prioritising the analysis of user experiences and sentiments, this research paves the way for developing more responsive, user-centered public transport systems in Sub-Saharan countries, contributing to the broader goal of improving urban mobility and sustainability.
Autores: Rozina L. Myoya, Vukosi Marivate, Idris Abdulmumin
Última atualização: 2024-12-09 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.06951
Fonte PDF: https://arxiv.org/pdf/2412.06951
Licença: https://creativecommons.org/publicdomain/zero/1.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.