Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem# Inteligência Artificial# Aprendizagem de máquinas

Novos Métodos para Prever a Posição Política nas Notícias

Essa pesquisa melhora a previsão de viés político em artigos de notícias.

― 6 min ler


Prevendo o Viés dasPrevendo o Viés dasNotícias de FormaEficientenotícias.de posicionamento político nasTécnicas avançadas melhoram previsões
Índice

A previsão da Posição Política em artigos de notícias é uma área de pesquisa bem importante. Esse trabalho busca lidar com um problema comum onde a galera geralmente lê notícias que combinam com as crenças que já têm, resultando no que chamam de efeito de câmara de eco. Esse fenômeno limita a exposição a diferentes pontos de vista e contribui para a polarização social.

Tradicionalmente, os estudos nesse campo se concentraram em duas tarefas principais: identificar fatores que indicam a posição política dos artigos e capturar esses fatores de forma eficaz. No entanto, muitos desses estudos não mostram de forma convincente a eficácia dos fatores que identificam. Para resolver isso, foi realizado um estudo com usuários para descobrir quais fatores eles acreditam serem importantes na determinação da posição política dos artigos de notícias. O estudo descobriu que o contexto e o tom de um artigo, junto com o conhecimento externo sobre entidades do mundo real discutidas no artigo, desempenham papéis vitais na previsão da posição política.

Método Proposto

Com base nas informações do estudo com usuários, foi desenvolvida uma nova abordagem para a previsão da posição política, que integra conhecimento sobre o conteúdo e o contexto político dos artigos. Esse método utiliza dois componentes principais: redes de atenção hierárquica e Codificação de Conhecimento.

Redes de Atenção Hierárquica

O primeiro componente, redes de atenção hierárquica, analisa as relações entre palavras e frases em três níveis: nível de palavra, nível de frase e nível de título. Focando nesses níveis, o modelo consegue entender melhor o contexto local (dentro das frases) e o contexto global (em todo o artigo). Essa abordagem em múltiplos níveis ajuda a captar nuances sutis no contexto e no tom do artigo.

  1. Camada de Pré-processamento: Os artigos de notícias são primeiro estruturados em frases e, em seguida, em vetores de palavras.

  2. Atenção no Nível de Palavra: Essa camada foca em aprender as relações entre palavras dentro de frases individuais. Isso permite que o modelo capture o contexto local de forma eficaz.

  3. Atenção no Nível de Frase: Depois disso, o modelo examina o artigo completo analisando as conexões entre as frases, assim ganhando um melhor contexto global.

  4. Atenção no Nível de Título: Por fim, ele presta atenção especial ao título, que contém a mensagem-chave que o autor quer passar. O contexto do título informa como as frases devem ser ponderadas.

Codificação de Conhecimento

O segundo componente, codificação de conhecimento, incorpora conhecimento externo sobre as entidades mencionadas nos artigos. Esse conhecimento pode ser tanto geral (conhecimento comum) quanto político (específico para contextos liberais ou conservadores).

  1. Preparação do Conhecimento: O conhecimento relevante sobre as entidades é coletado de várias fontes, construindo gráficos de conhecimento político que representam as relações entre as entidades políticas.

  2. Injeção de Conhecimento: O modelo injeta esse conhecimento externo na sua compreensão dos artigos de notícias, melhorando sua capacidade de prever a posição.

Estudo com Usuários

Para informar o desenvolvimento do modelo, um estudo com usuários foi realizado. Os participantes foram convidados a avaliar a importância de vários fatores na determinação da posição política. O estudo revelou que o contexto do artigo era o fator mais significativo, seguido de perto por tom, palavras-chave e menção de indivíduos específicos.

Conjuntos de dados

Para fins de avaliação, três conjuntos de dados foram utilizados:

  1. SemEval: Um conjunto de dados menor composto por artigos rotulados como hiperpartidários ou neutros.
  2. AllSides-S: Um conjunto de dados de tamanho médio com artigos categorizados em três classes: esquerda, centro e direita.
  3. AllSides-L: Um conjunto de dados grande que abrange uma gama mais ampla de posições políticas com cinco classes distintas.

Validação Experimental

O método proposto foi rigorosamente avaliado por meio de vários experimentos para estabelecer sua precisão, eficiência e eficácia em comparação com métodos existentes.

Precisão e Eficiência

Os resultados mostraram que a nova abordagem superou consistentemente todos os métodos de referência em precisão em todos os conjuntos de dados. Especificamente, ela alcançou melhorias significativas em relação a métodos de ponta. Além da precisão, o modelo mostrou tempos de convergência mais rápidos e eficiência no treinamento em comparação com modelos tradicionais.

Importância dos Componentes

Um estudo de ablação foi realizado para entender a eficácia de cada componente do método proposto. Foi constatado que todos os componentes contribuíram positivamente para a precisão geral, destacando a importância tanto do mecanismo de atenção hierárquica quanto do processo de codificação de conhecimento.

Sensibilidade aos Hiperparâmetros

O desempenho do modelo foi avaliado em relação a variações nos hiperparâmetros relacionados a quanto conhecimento externo foi injetado nas previsões. As descobertas indicaram que uma abordagem equilibrada na utilização de conhecimento externo era crucial para um desempenho ótimo.

Conclusão

Esse trabalho enfatiza a importância de fatores explícitos e implícitos na previsão da posição política dos artigos de notícias. Ao integrar redes de atenção hierárquica e codificação de conhecimento, o método proposto captura efetivamente as nuances de contexto e sentimento, resultando em uma precisão melhorada na previsão da posição política. Esses avanços não apenas contribuem para o campo do aprendizado de máquina, mas também oferecem implicações práticas para mitigar o efeito da câmara de eco e promover a exposição a opiniões políticas diversas no consumo de notícias.

Ao fomentar uma melhor compreensão das posições políticas na mídia, esse trabalho busca aprimorar o pensamento crítico e a discussão informada entre o público, incentivando uma abordagem mais sutil ao consumo de notícias.

Fonte original

Título: KHAN: Knowledge-Aware Hierarchical Attention Networks for Accurate Political Stance Prediction

Resumo: The political stance prediction for news articles has been widely studied to mitigate the echo chamber effect -- people fall into their thoughts and reinforce their pre-existing beliefs. The previous works for the political stance problem focus on (1) identifying political factors that could reflect the political stance of a news article and (2) capturing those factors effectively. Despite their empirical successes, they are not sufficiently justified in terms of how effective their identified factors are in the political stance prediction. Motivated by this, in this work, we conduct a user study to investigate important factors in political stance prediction, and observe that the context and tone of a news article (implicit) and external knowledge for real-world entities appearing in the article (explicit) are important in determining its political stance. Based on this observation, we propose a novel knowledge-aware approach to political stance prediction (KHAN), employing (1) hierarchical attention networks (HAN) to learn the relationships among words and sentences in three different levels and (2) knowledge encoding (KE) to incorporate external knowledge for real-world entities into the process of political stance prediction. Also, to take into account the subtle and important difference between opposite political stances, we build two independent political knowledge graphs (KG) (i.e., KG-lib and KG-con) by ourselves and learn to fuse the different political knowledge. Through extensive evaluations on three real-world datasets, we demonstrate the superiority of DASH in terms of (1) accuracy, (2) efficiency, and (3) effectiveness.

Autores: Yunyong Ko, Seongeun Ryu, Soeun Han, Youngseung Jeon, Jaehoon Kim, Sohyun Park, Kyungsik Han, Hanghang Tong, Sang-Wook Kim

Última atualização: 2023-04-04 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2302.12126

Fonte PDF: https://arxiv.org/pdf/2302.12126

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes