Enfrentando a Discurso de Ódio: Um Desafio Global
Este artigo examina as leis de discurso de ódio e os métodos de detecção em todo o mundo.
Katerina Korre, John Pavlopoulos, Paolo Gajo, Alberto Barrón-Cedeño
― 6 min ler
Índice
- O Que É Discurso de Ódio?
- O Cenário Legal
- A Necessidade de Um Quadro Unificado
- Perguntas de Pesquisa
- Coleta de Dados
- Processo de Anotação
- Os Desafios da Anotação
- Modelos de Aprendizado de Máquina
- Avaliação de Desempenho
- Desafios no Desempenho dos Modelos
- O Papel dos Grandes Modelos de Linguagem
- Conclusão e Trabalho Futuro
- Considerações Éticas
- Pensamentos Finais
- Fonte original
- Ligações de referência
Discurso de ódio é um problema sério na sociedade de hoje. Não é só uma questão online; pode ter consequências reais. Os países estão tentando lidar com isso criando leis que tornam o discurso de ódio um ato punível. Mas essas leis variam de um lugar pro outro, tornando difícil pros plataformas online gerenciarem os relatórios de discurso de ódio de forma eficaz.
O Que É Discurso de Ódio?
Discurso de ódio é qualquer forma de comunicação que menospreza, assedia ou incita violência contra indivíduos ou grupos com base em sua raça, religião, gênero ou qualquer outra característica. Ele pode aparecer de várias formas: comentários online, posts em redes sociais ou até discursos. O desafio é que o que uma pessoa considera discurso de ódio pode não ser visto da mesma forma por outra. Essa subjetividade torna complicado criar uma definição clara e universal.
Legal
O CenárioOs países têm leis diferentes sobre discurso de ódio, e existem três abordagens principais para defini-lo:
-
Baseado no conteúdo: Essa abordagem olha para a linguagem em si. Se as palavras são geralmente consideradas ofensivas, elas se enquadram nessa categoria.
-
Baseado na intenção: Esse método foca na intenção do falante. Se alguém pretende incitar ódio ou violência contra um grupo específico, isso é considerado discurso de ódio.
-
Baseado no dano: Essa perspectiva considera o dano causado à vítima, como sofrimento emocional ou exclusão social.
Essas abordagens têm uma coisa em comum: todas visam proteger indivíduos e comunidades de linguagem prejudicial.
A Necessidade de Um Quadro Unificado
Criar um quadro universal para detectar discurso de ódio é complicado porque não existe uma única definição. Diferentes culturas interpretam a linguagem e o contexto de maneiras diferentes. Por exemplo, uma piada em um contexto pode ser ofensiva em outro. Por isso, os pesquisadores estão olhando para as leis existentes sobre discurso de ódio. Essas leis podem oferecer uma base mais clara para entender o que constitui discurso de ódio punível.
Perguntas de Pesquisa
Ao tentar resolver o problema da detecção de discurso de ódio, surgem algumas perguntas:
- Como o uso de definições legais influencia o acordo entre especialistas na identificação de discurso de ódio?
- As variações no acordo entre especialistas refletem na performance dos Modelos de aprendizado de máquina em detectar discurso de ódio?
- Dadas as dificuldades em coletar dados sobre discurso de ódio punível, os dados gerados por modelos de aprendizado de máquina podem melhorar o desempenho na detecção?
Coleta de Dados
Para responder a essas perguntas, os pesquisadores coletam dados de casos de discurso de ódio em três países: Grécia, Itália e Reino Unido. Analisando leis e consultando especialistas, eles criam um conjunto de dados que serve para entender as implicações legais e melhorar os métodos de detecção de discurso de ódio.
Processo de Anotação
O conjunto de dados inclui vários exemplos do que pode ser considerado discurso de ódio. Especialistas em direito e criminologia avaliam esses exemplos com base nas leis nacionais. Cada especialista analisa os mesmos casos e os rotula de acordo com o que acham que é punível ou não. O processo é demorado e exige uma compreensão profunda das leis de cada país.
Os Desafios da Anotação
Durante o processo de anotação, os especialistas frequentemente discordam. Essa inconsistência pode levar a confusões sobre o que constitui discurso de ódio. Alguns casos são simples, mas outros exigem uma pesquisa extensa para interpretar a linguagem e a intenção. Fatores como contexto, momento e eventos atuais desempenham um papel significativo em como o discurso de ódio é percebido. Os especialistas costumam ter opiniões diferentes com base em suas experiências e formações únicas.
Modelos de Aprendizado de Máquina
Uma vez que o conjunto de dados é criado, os pesquisadores recorrem a modelos de aprendizado de máquina para analisar os dados. Vários modelos pré-treinados são usados para ver se conseguem identificar com precisão casos de discurso de ódio. O objetivo não é apenas automatizar o processo de detecção, mas também garantir que esses modelos entendam as nuances das leis em que são treinados.
Avaliação de Desempenho
Após treinar os modelos, os pesquisadores avaliam seu desempenho medindo as taxas de erro. Taxas de erro mais baixas indicam um desempenho melhor. Os modelos passam por diversos testes para determinar como interpretam o discurso de ódio com base nas estruturas legais de cada país.
Desafios no Desempenho dos Modelos
Apesar dos avanços em aprendizado de máquina, os modelos ainda têm dificuldades em entender os aspectos mais sutis do discurso de ódio. Eles tendem a ser excessivamente cautelosos, muitas vezes rotulando os casos como "não puníveis". Essa hesitação reflete as complexidades enfrentadas por especialistas humanos ao determinar o que constitui discurso de ódio.
O Papel dos Grandes Modelos de Linguagem
Os pesquisadores também experimentam com modelos de linguagem maiores para explorar sua eficácia na detecção de discurso de ódio. Esses modelos são testados com várias técnicas para ver se conseguem melhorar a precisão da classificação de discurso de ódio. No entanto, os resultados mostram que esses modelos muitas vezes falham em incluir as nuances legais que os especialistas humanos compreendem.
Conclusão e Trabalho Futuro
A detecção de discurso de ódio é uma tarefa complicada que combina desafios legais, sociais e linguísticos. Este estudo destaca a importância do conhecimento legal no desenvolvimento de algoritmos de aprendizado de máquina capazes de detectar discurso de ódio com precisão. Contudo, está claro que a contribuição humana continua sendo essencial nesse processo.
No futuro, os pesquisadores planejam expandir seus estudos para incluir leis de mais países e várias perspectivas culturais. Ao refinar constantemente esses métodos, esperam criar um sistema mais eficaz para identificar e combater o discurso de ódio.
Considerações Éticas
Enquanto trabalham para detectar discurso de ódio, é essencial manter um equilíbrio entre proteger a liberdade de expressão e prevenir danos. Os pesquisadores seguem diretrizes éticas e consideram as implicações reais de seu estudo, garantindo que seu trabalho não infrinja involuntariamente os direitos dos indivíduos.
No fim das contas, essa pesquisa busca tornar o espaço online mais seguro, respeitando os direitos dos usuários em diferentes plataformas. O objetivo é promover um ambiente onde o discurso respeitoso possa prosperar, livre de ódio e discriminação.
Pensamentos Finais
Detectar discurso de ódio é como tentar acertar um alvo em movimento. Com a evolução da linguagem e das normas sociais, o desafio é constante. Mas ao combinar conhecimento legal com tecnologia avançada, podemos avançar na compreensão e manejo desse problema crítico em nosso mundo. Afinal, a única coisa que deveríamos odiar é o próprio ódio!
Fonte original
Título: Hate Speech According to the Law: An Analysis for Effective Detection
Resumo: The issue of hate speech extends beyond the confines of the online realm. It is a problem with real-life repercussions, prompting most nations to formulate legal frameworks that classify hate speech as a punishable offence. These legal frameworks differ from one country to another, contributing to the big chaos that online platforms have to face when addressing reported instances of hate speech. With the definitions of hate speech falling short in introducing a robust framework, we turn our gaze onto hate speech laws. We consult the opinion of legal experts on a hate speech dataset and we experiment by employing various approaches such as pretrained models both on hate speech and legal data, as well as exploiting two large language models (Qwen2-7B-Instruct and Meta-Llama-3-70B). Due to the time-consuming nature of data acquisition for prosecutable hate speech, we use pseudo-labeling to improve our pretrained models. This study highlights the importance of amplifying research on prosecutable hate speech and provides insights into effective strategies for combating hate speech within the parameters of legal frameworks. Our findings show that legal knowledge in the form of annotations can be useful when classifying prosecutable hate speech, yet more focus should be paid on the differences between the laws.
Autores: Katerina Korre, John Pavlopoulos, Paolo Gajo, Alberto Barrón-Cedeño
Última atualização: 2024-12-08 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.06144
Fonte PDF: https://arxiv.org/pdf/2412.06144
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://www.cfr.org/backgrounder/hate-speech-social-media-global-comparisons
- https://www.theguardian.com/uk-news/2016/dec/07/racist-troll-guilty-harassing-labour-mp-luciana-berger-joshua-bonehill-paine
- https://www.coe.int/en/web/no-hate-campaign/no-hate-speech-movement
- https://www.theguardian.com/technology/2016/may/31/
- https://commission.europa.eu/law/law-topic/data-protection/data-protection-eu_en
- https://futurefreespeech.com/global-handbook-on-hate-speech-laws/
- https://github.com/google-research/bert/blob/master/multilingual.md