Contrarrespuesta: Un Nuevo Enfoque para el Odio en Línea
El contramos habla contra el discurso perjudicial en línea mientras apoya a las víctimas y fomenta el diálogo.
― 11 minilectura
Tabla de contenidos
El contradicho es una respuesta a discursos dañinos que se encuentran En línea, con el objetivo de desafiar a quienes propagan el odio y apoyar a las Víctimas de ese abuso. Ofrece un enfoque diferente para lidiar con el odio en línea en comparación con los métodos tradicionales, como eliminar contenido o prohibir usuarios. En lugar de centrarse solo en eliminar publicaciones dañinas, el contradicho promueve conversaciones positivas. Con la ayuda de tecnología avanzada, sobre todo modelos de lenguaje grandes, crear contradicho podría volverse más fácil y efectivo. Sin embargo, todavía necesitamos entender cómo funciona mejor el contradicho, incluyendo qué tipos son más efectivos y en qué condiciones se utilizan.
El creciente problema del odio y el abuso en línea en las redes sociales ha levantado preocupaciones en muchas personas. Aunque plataformas como Twitter siguen llenas de comentarios abusivos, estas plataformas se están volviendo menos estrictas con la moderación de contenido. Las personas que son blanco del Discurso de odio a menudo sufren efectos negativos en su salud mental, y aquellos que son testigos del abuso también se ven afectados. Las figuras públicas enfrentan desafíos importantes porque el odio que reciben puede alejarlas de interactuar con el público, lo que puede dañar los procesos democráticos.
En respuesta a este problema, los investigadores están trabajando en diferentes maneras de contrarrestar el abuso en línea, y un enfoque prometedor es el contradicho. Este enfoque no requiere que las plataformas o las fuerzas del orden intervengan, sino que alienta a las personas a responder positivamente al odio. Grupos ya han comenzado a usar el contradicho para desafiar comentarios de odio directamente, y algunas plataformas han interactuado con comunidades para promover herramientas para el contradicho.
Detectar y generar contradicho es crucial, ya que forma la base para usar tecnología en la lucha contra el odio. Entender cómo identificar el contradicho también es importante para la investigación, ya que puede ayudar a aclarar la relación entre quienes propagan odio, quienes son blanco y quienes son testigos del abuso. Además, tener formas automatizadas de producir contradicho puede ahorrar tiempo y esfuerzo a quienes quieren ayudar a combatir el odio en línea.
A pesar de estos beneficios potenciales, el campo del contradicho sigue siendo relativamente nuevo y está dividido en diferentes áreas de estudio. Los científicos sociales que examinan el contradicho a menudo no interactúan con los informáticos que trabajan en la detección y generación del contradicho. Para cerrar esta brecha, este documento ofrece una visión general detallada de la investigación sobre el contradicho en las ciencias sociales y la informática. Al combinar ideas de ambos campos, podemos identificar direcciones futuras prometedoras.
Dinámicas del Contradicho
El proceso del contradicho comienza cuando un individuo o grupo genera discurso de odio. Este contenido odioso puede ser visto por quienes son blanco, testigos, o ambos. A continuación, alguien que se involucra en el contradicho responde. Esta persona podría apuntar directamente al hablante de odio, ofrecer apoyo a las víctimas, o dirigir su mensaje a los testigos. Dependiendo de sus identidades, quienes hacen contradicho podrían pertenecer al mismo grupo que el hablante de odio o la víctima. Sus mensajes pueden alcanzar a una persona, a varias o a audiencias amplias.
El interés en el contradicho ha crecido significativamente. Mientras que mucha investigación analiza cómo el contradicho puede disminuir el odio, pocos estudios han combinado ideas de las ciencias sociales y la informática. Estudios previos han examinado contra-narrativas, que son similares pero se centran en desafiar ideologías extremistas. Los investigadores han categorizado varias técnicas para las contra-narrativas, incluyendo presentar hechos, apelar a emociones y exponer creencias falsas. Estas técnicas buscan reducir actitudes y comportamientos dañinos.
Algunos estudios recientes han categorizado diferentes formas de contradicho y los factores que influyen en las personas para intervenir en situaciones abusivas. Se centran en aspectos como las estrategias, la audiencia y cómo evaluar la efectividad. En el lado de la informática, investigadores han estado revisando cómo el procesamiento del lenguaje natural puede ayudar a entender el contradicho, incluyendo la recopilación de datos y el desarrollo de enfoques automatizados.
Metodología de Revisión
Esta revisión toma una visión amplia del contradicho a través de la última década, abarcando tanto las ciencias sociales como la informática. Buscamos en tres bases de datos principales usando varias palabras clave relacionadas con el contradicho. Nuestro objetivo era incluir todos los estudios relevantes centrados en analizar la efectividad del contradicho, las características de los usuarios de contradicho, y cualquier dato relacionado con la clasificación o generación del contradicho. Después de filtrar publicaciones, terminamos analizando 90 artículos que cumplían con nuestros criterios.
Definiendo el Contradicho
El contradicho se puede describir de varias maneras. Creamos un marco para caracterizarlo, centrándonos en quién envía el mensaje, qué tipo de mensajes se envían, quiénes son los destinatarios y el propósito de los mensajes. Varios estudios utilizan términos como "contradicho," "contra-narrativas," y "discurso de esperanza," todos los cuales se refieren a contenido que se opone al discurso de odio. Aunque son similares, estos términos pueden referirse a diferentes contextos o enfoques.
Los investigadores han identificado múltiples distinciones en el contradicho, como la identidad del que habla, las estrategias que utilizan, la audiencia a la que se dirigen y el objetivo final de su mensaje. La identidad de quien hace el contradicho juega un papel vital en cómo se recibe su mensaje y su efectividad. Factores como las afiliaciones grupales y el estatus social pueden impactar cuán persuasivo puede ser el contradicho.
Las estrategias utilizadas en el contradicho pueden adoptar muchas formas. Las estrategias comunes incluyen presentar información fáctica, resaltar contradicciones, advertir sobre consecuencias, construir conexiones emocionales, usar humor y elegir un tono apropiado. El impacto del contradicho depende mucho de a quién se esté dirigiendo, también. Puede apuntar al hablante de odio original, a testigos solidarios o a las víctimas del discurso de odio.
El propósito del contradicho puede variar. Puede tener como objetivo cambiar las actitudes y comportamientos de quienes propagan odio, influir en los testigos o proporcionar apoyo directo a las víctimas del discurso de odio. Cada uno de estos objetivos tiene distintas estrategias y resultados esperados, lo que resalta la complejidad de cómo puede funcionar el contradicho.
Impacto del Contradicho
Determinar el efecto del contradicho es una tarea compleja, con varios métodos utilizados para evaluar su efectividad. Los investigadores han empleado estudios observacionales para ver cómo el contradicho afecta el discurso de odio a lo largo del tiempo. Diseños experimentales buscan determinar los impactos específicos del contradicho en comparación con un grupo de control.
Se han examinado el contradicho en diferentes idiomas y países, enfocándose principalmente en idiomas indoeuropeos como inglés, alemán y urdu. La investigación ha mostrado que el contradicho se estudia comúnmente en plataformas como Twitter y Facebook, aunque no se ha abordado mucho en plataformas más nuevas como TikTok o Discord.
El contradicho puede dirigirse a diferentes formas de odio. Por ejemplo, el racismo, la islamofobia y el odio contra individuos LGBTQ+ son temas comunes de estudio. Se utilizan varias estrategias para identificar contenido odioso y determinar respuestas de contradicho apropiadas.
Diferentes métodos de entrega del contradicho pueden incluir formatos de texto y video. Los mensajes pueden ser elaborados por investigadores, recopilados de redes sociales o creados por trabajadores crowdsourced. Cada método tiene sus fortalezas y debilidades, impactando la efectividad del contradicho.
Evaluar el éxito del contradicho implica observar interacciones sociales, cambios en el comportamiento y cambios en las actitudes. Los investigadores a menudo utilizan métricas de impacto social para ver cómo responden las audiencias, como niveles de participación o el número de compartidos. Las medidas de cambio de comportamiento investigan si las acciones de las personas cambian después de estar expuestas al contradicho, mientras que las medidas de cambio de actitud evalúan si sus creencias subyacentes cambian.
A pesar de la promesa del contradicho, los hallazgos sobre su efectividad pueden variar. Algunos estudios demuestran que el contradicho puede reducir futuros actos de odio y empoderar a víctimas y testigos. Otros sugieren que el contradicho puede tener un efecto contraproducente, provocando respuestas aún más odiosas. Entender las condiciones bajo las cuales el contradicho funciona mejor es crucial.
Enfoques Computacionales para el Contradicho
Cambiando el enfoque al aspecto informático, varios estudios han explorado conjuntos de datos para el contradicho. Estos conjuntos de datos pueden contener comentarios recopilados de redes sociales o respuestas elaboradas para contrarrestar el discurso de odio. La mayoría de estos conjuntos de datos están en inglés y a menudo se centran en textos individuales en lugar de conversaciones.
El trabajo sobre la automatización de la detección del contradicho investiga si un comentario se clasifica como contradicho o no. Algunos investigadores se enfocan en los diferentes tipos de contradicho presentes. Esta área de estudio ha ido más allá de un idioma y está comenzando a explorar enfoques multilingües.
Generar contradicho puede involucrar varias metodologías, particularmente utilizando modelos de lenguaje grandes como GPT-2. Diferentes configuraciones pueden afectar la calidad del contradicho generado, y la evaluación de estos sistemas a menudo combina métricas automáticas con evaluación humana, centrándose en aspectos como la relevancia y la precisión gramatical.
Los desafíos persisten en la generación automatizada de contradicho. Por ejemplo, los modelos de lenguaje pueden producir declaraciones que parecen convincentes pero no son del todo fácticas. También existe el riesgo de que el contenido generado sea percibido como sesgado o pueda provocar involuntariamente más comportamiento odioso.
Perspectivas Futuras
A medida que se desarrollan muchas intervenciones para combatir el odio en línea, los investigadores deberían apuntar a enfoques escalables y confiables, teniendo en cuenta la necesidad de una evaluación efectiva. Una combinación de ciencias sociales e informática puede proporcionar información sobre cómo abordar mejor el odio en línea.
El acuerdo sobre métricas de evaluación clave es necesario para entender las mejores maneras de llevar a cabo el contradicho a gran escala. La necesidad de colaboración interdisciplinaria es crucial para abordar estos problemas de manera exhaustiva.
Mejores Prácticas
Al desarrollar herramientas de contradicho, es esencial considerar casos de uso prácticos. Una sola estrategia puede no ser suficiente para combatir el odio de manera efectiva. Es necesario explorar factores como las características de la audiencia, el tipo de contenido a utilizar y los canales de comunicación.
También es importante asegurar una comprensión clara de cómo se llevan a cabo las evaluaciones. La investigación debería enfatizar la transparencia en las metodologías para aumentar la confianza en los hallazgos y facilitar análisis comparativos entre estudios.
Finalmente, fomentar el trabajo interdisciplinario puede llevar a mejores resultados. Colaborar con expertos en varios campos puede ayudar a identificar soluciones a largo plazo para el complejo problema del odio en línea. Investigadores y practicantes deberían trabajar juntos para probar y refinar enfoques en entornos del mundo real, considerando las implicaciones sociales de sus intervenciones.
En conclusión, el contradicho es una herramienta esencial en la lucha contra el odio en línea. Al fomentar un diálogo positivo y abordar directamente el discurso dañino, puede cambiar actitudes y promover la comprensión. Sin embargo, se necesita una investigación cuidadosa, colaboración y evaluación para maximizar su impacto y asegurar que contribuya positivamente al discurso en línea.
Título: Understanding Counterspeech for Online Harm Mitigation
Resumen: Counterspeech offers direct rebuttals to hateful speech by challenging perpetrators of hate and showing support to targets of abuse. It provides a promising alternative to more contentious measures, such as content moderation and deplatforming, by contributing a greater amount of positive online speech rather than attempting to mitigate harmful content through removal. Advances in the development of large language models mean that the process of producing counterspeech could be made more efficient by automating its generation, which would enable large-scale online campaigns. However, we currently lack a systematic understanding of several important factors relating to the efficacy of counterspeech for hate mitigation, such as which types of counterspeech are most effective, what are the optimal conditions for implementation, and which specific effects of hate it can best ameliorate. This paper aims to fill this gap by systematically reviewing counterspeech research in the social sciences and comparing methodologies and findings with computer science efforts in automatic counterspeech generation. By taking this multi-disciplinary view, we identify promising future directions in both fields.
Autores: Yi-Ling Chung, Gavin Abercrombie, Florence Enock, Jonathan Bright, Verena Rieser
Última actualización: 2023-07-01 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2307.04761
Fuente PDF: https://arxiv.org/pdf/2307.04761
Licencia: https://creativecommons.org/licenses/by-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.