Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem# Inteligência Artificial

Uma Nova Abordagem para Contra-Fala contra o Discurso de Ódio

Esse artigo apresenta um esquema pra contrarrespostas diversas que visam o discurso de ódio online.

― 6 min ler


Contraponto: Uma NovaContraponto: Uma NovaFerramenta Contra o Ódioeficaz.discurso de ódio online de formaApresentando um esquema pra combater
Índice

A contrarresposta é um método usado pra combater Discurso de ódio online. Discurso de ódio inclui comentários prejudiciais que atacam grupos com base em atributos como raça, gênero ou religião. As maneiras tradicionais de lidar com isso têm limitações, e às vezes só uma contrarresposta não é o suficiente. Situações diferentes podem precisar de Respostas variadas. Este artigo fala sobre uma nova abordagem de contrarresposta que considera as intenções ou objetivos específicos por trás das respostas.

A Necessidade de Diversidade nas Contrarrespostas

Com o aumento do discurso de ódio na internet, a necessidade de contrarrespostas eficazes cresce. As pessoas conseguem se esconder atrás do anonimato pra compartilhar opiniões odiosas, dificultando o combate a esse problema. Proibições simples de discurso de ódio podem não funcionar; elas podem até piorar a situação. Em vez disso, a contrarresposta pode oferecer uma reação positiva que educa e muda a conversa. No entanto, criar uma única resposta pra cada comentário de ódio pode não ser eficaz. Grupos diferentes podem responder melhor a vários tipos de contrarresposta, como humor, declarações informativas ou perguntas.

Desenvolvimento de um Conjunto de Dados Específico por Intenção

Pra lidar com a diversidade necessária na contrarresposta, foi criado um conjunto de dados com várias respostas com base em cinco intenções específicas. Essas intenções são:

  1. Informativa: Fornecendo informações para desmentir alegações falsas.
  2. Denunciativa: Deixando claro que discurso odioso é inaceitável.
  3. Pergunta: Questionando o raciocínio de quem fala com perguntas.
  4. Humor: Usando humor pra desmerecer o discurso de ódio.
  5. Positiva: Oferecendo encorajamento ou apoio pra combater a negatividade.

O conjunto de dados tem 6.831 contrarrespostas únicas ligadas a essas cinco intenções.

O Modelo Proposto

Foi introduzido um modelo em duas fases pra gerar contrarrespostas com base na intenção. A primeira fase foca em entender as diferentes intenções através de um modelo especializado. A segunda fase usa esse entendimento pra criar respostas de contrarresposta relevantes. Essa abordagem garante que as respostas geradas correspondam ao estilo e ao objetivo pretendido.

Fase Um: Aprendizado da Intenção

Nesta fase, o modelo aprende a reconhecer diferentes intenções ligadas à contrarresposta. Ele prepara representações específicas pra essas intenções. Esse passo é essencial pra que o modelo entenda como gerar uma resposta apropriada depois.

Fase Dois: Gerando Contrarrespostas

A segunda fase usa as informações da primeira fase pra criar contrarrespostas. O modelo combina as informações da intenção aprendidas com o contexto do discurso de ódio pra produzir uma resposta adequada. Esse método garante que as respostas sejam não só coerentes, mas também alinhadas com a intenção desejada.

Avaliação Humana do Modelo

Pra avaliar a eficácia do método proposto, foram realizados testes extensivos. Isso incluiu métricas automatizadas e avaliações humanas. O objetivo era ver como as respostas geradas alinham-se com o propósito pretendido. Avaliadores humanos deram notas às saídas com base em vários fatores, como se as respostas eram apropriadas pro discurso de ódio apresentado e se eram fáceis de entender.

Análise Comparativa

O novo modelo foi comparado com modelos existentes em termos de desempenho. Várias métricas-chave foram usadas pra avaliar como as contrarrespostas corresponderam às intenções desejadas. Isso incluiu medidas de sintaxe, semântica e a qualidade geral das respostas. Os resultados mostraram que o novo método superou os sistemas existentes em várias métricas.

Implicações dos Resultados

As descobertas sugerem que gerar contrarrespostas personalizadas pode impactar positivamente as interações em redes sociais e fóruns online. Ao oferecer respostas diversas que consideram a intenção por trás do discurso de ódio original, o modelo pode ajudar a direcionar conversas pra longe da negatividade. Isso pode melhorar a compreensão e o ambiente nas plataformas de mídia social.

Desafios e Direções Futuras

Embora o novo método mostre potencial, ainda existem desafios. O conjunto de dados precisa ser maior e incluir exemplos mais diversos, especialmente de grupos sub-representados. Também é necessário garantir que as respostas geradas não sejam tóxicas ou ofensivas. Pesquisas futuras vão se concentrar em minimizar a toxicidade enquanto mantêm a eficácia na contrarresposta.

Conclusão

A introdução da geração de contrarrespostas específicas por intenção representa um passo significativo pra lidar com discurso de ódio online. Focando nos objetivos específicos das respostas, o modelo pode criar contrarrespostas mais eficazes. Avaliações contínuas e melhorias no conjunto de dados e no modelo vão ajudar a aumentar o impacto geral da contrarresposta no combate ao discurso de ódio.

Considerações Éticas

Os pesquisadores reconhecem a natureza sensível de interagir com discurso de ódio. Enquanto o objetivo final é produzir respostas úteis, é essencial estar ciente do potencial de viés ou desinformação no conteúdo gerado. Garantir a correção factual e as implicações éticas é crucial no desenvolvimento dessa tecnologia pra um uso mais amplo.

Diretrizes pra Contrarrespostas Eficazes

Pra garantir que a contrarresposta gerada seja benéfica, algumas diretrizes foram seguidas durante o processo de desenvolvimento:

  1. Contrarresposta Informativa: Essas respostas devem buscar desmentir alegações falsas ou fornecer informações factuais. Prestar atenção à precisão é essencial pra evitar desinformação.

  2. Contrarresposta Denunciativa: É vital transmitir que discurso de ódio não é aceitável sem recorrer a linguagem ofensiva ou ataques pessoais.

  3. Contrarresposta Questionadora: Respostas devem ser formuladas de forma a incentivar o diálogo. Perguntas devem desafiar alegações odiosas de uma maneira construtiva.

  4. Contrarresposta Humorística: O humor deve ser usado pra destacar a ridicularidade do discurso de ódio. No entanto, é preciso ter cuidado pra não ofender ou alienar outros.

  5. Contrarresposta Positiva: Isso deve focar em empatia e apoio, ajudando a elevar quem foi afetado pelo discurso de ódio.

Direções Futuras de Pesquisa

Seguindo em frente, o modelo poderia se beneficiar das seguintes melhorias:

  • Conjuntos de dados Maiores: Ampliar o conjunto de dados pra incluir uma variedade maior de instâncias de discurso de ódio e perspectivas da comunidade.

  • Reduzir Toxicidade: Desenvolver métodos melhores pra filtrar linguagem potencialmente prejudicial enquanto mantém a eficácia da contrarresposta.

  • Incorporar Conhecimento do Mundo Real: Garantir que as respostas geradas sejam baseadas em informações factuais pra minimizar o risco de espalhar alegações falsas.

Resumo

O problema do discurso de ódio na internet requer soluções inovadoras. A abordagem de usar geração de contrarresposta específica por intenção mostrou potencial em criar respostas eficazes. Através de avaliação cuidadosa e melhoria contínua dos métodos usados, há uma perspectiva esperançosa de promover conversas mais saudáveis online. Ao ajustar respostas pra corresponder a intenções específicas, se torna possível combater discurso de ódio de uma forma educativa e construtiva, em vez de confrontacional.

Fonte original

Título: Counterspeeches up my sleeve! Intent Distribution Learning and Persistent Fusion for Intent-Conditioned Counterspeech Generation

Resumo: Counterspeech has been demonstrated to be an efficacious approach for combating hate speech. While various conventional and controlled approaches have been studied in recent years to generate counterspeech, a counterspeech with a certain intent may not be sufficient in every scenario. Due to the complex and multifaceted nature of hate speech, utilizing multiple forms of counter-narratives with varying intents may be advantageous in different circumstances. In this paper, we explore intent-conditioned counterspeech generation. At first, we develop IntentCONAN, a diversified intent-specific counterspeech dataset with 6831 counterspeeches conditioned on five intents, i.e., informative, denouncing, question, positive, and humour. Subsequently, we propose QUARC, a two-stage framework for intent-conditioned counterspeech generation. QUARC leverages vector-quantized representations learned for each intent category along with PerFuMe, a novel fusion module to incorporate intent-specific information into the model. Our evaluation demonstrates that QUARC outperforms several baselines by an average of 10% across evaluation metrics. An extensive human evaluation supplements our hypothesis of better and more appropriate responses than comparative systems.

Autores: Rishabh Gupta, Shaily Desai, Manvi Goel, Anil Bandhakavi, Tanmoy Chakraborty, Md. Shad Akhtar

Última atualização: 2023-05-23 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2305.13776

Fonte PDF: https://arxiv.org/pdf/2305.13776

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes