Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Maschinelles Lernen# Künstliche Intelligenz# Rechnen und Sprache# Soziale und Informationsnetzwerke

Neue Methode zur Erkennung von impliziter Hassrede

Ein neues System geht versteckten Hassreden in Online-Gesprächen an.

― 6 min Lesedauer


Versteckte HassredeVersteckte HassredeaufspürenHassbotschaften in Gesprächen.Ein Durchbruchssystem erkennt subtile
Inhaltsverzeichnis

Soziale Medien sind echt gewachsen, und damit auch die Probleme, die damit einhergehen. Ein grosses Problem ist Hassrede, also wenn Leute Sachen sagen, die andere verletzen oder beleidigen, basierend darauf, wer sie sind. Während viele Forscher daran gearbeitet haben, offensichtliche Hassrede zu erkennen, liegt nicht viel Fokus auf versteckter oder indirekter Hassrede. Diese versteckte Art kann tricky sein, weil sie nicht immer klare verletzende Wörter benutzt. Dieser Artikel spricht über einen neuen Ansatz, um diese Art von Sprache in Online-Gesprächen zu finden.

Das Problem mit der Erkennung von Hassrede

Hassrede ist mehr als nur gemeine Worte; sie kann in sarkastischen Kommentaren oder verschlüsselter Sprache versteckt sein, die schwer zu erkennen ist. Viele Leute denken, wenn jemand direkte Beleidigungen benutzt, ist das Hassrede. Aber manchmal wird Hass auf subtile Weise ausgedrückt, was es sowohl für Menschen als auch für Maschinen schwierig macht, das zu erkennen.

Diese weniger offensichtliche Art von Hassrede zu erkennen, ist wichtig, weil sie zu schädlichen Aktionen führen und Negativität in Gemeinschaften verbreiten kann. Viele Online-Plattformen wie Twitter und Facebook haben Probleme, Hassrede effektiv zu managen. Die Bemühungen, Hassrede zu bekämpfen, sind nicht nur auf Tech-Unternehmen beschränkt; Organisationen weltweit arbeiten ebenfalls daran, dieses Problem anzugehen.

Was ist Implizite Hassrede?

Explizite Hassrede ist leicht zu erkennen. Sie ist direkt und hart. Implizite Hassrede ist anders, weil sie nicht immer klare hasserfüllte Wörter benutzt. Stattdessen kann sie Sarkasmus, Witze oder indirekte Anspielungen verwenden, die auf den ersten Blick harmlos erscheinen können. Diese Art von Sprache kann gefährlich sein, weil sie Hass verbreiten kann, ohne dass jemand sofort etwas bemerkt.

Um dieses Problem zu lösen, brauchen wir ein System, das diese versteckten Bedeutungen in Gesprächen aufgreifen kann. Viele vorhandene Tools sind darauf ausgelegt, klare Hassrede zu finden, erkennen aber die subtileren Formen nicht. Daher besteht die Notwendigkeit für neue Wege, um implizite Hassrede zu verstehen und zu identifizieren.

Die Bedeutung des Kontexts

Eine grosse Herausforderung bei der Erkennung von impliziter Hassrede ist der Kontext, in dem sie erscheint. In Gesprächen kann sich das, was jemand sagt, je nach dem, was andere vorher gesagt haben, ändern. Das bedeutet, um wirklich zu verstehen, ob ein Kommentar hasserfüllt ist, musst du das gesamte Gespräch betrachten, nicht nur isolierte Aussagen.

Zum Beispiel könnte jemand etwas Sarkastisches als Antwort auf einen scheinbar harmlosen Kommentar sagen. Für sich allein genommen könnte diese sarkastische Bemerkung nicht beleidigend erscheinen, aber im Kontext der Diskussion könnte sie einen tieferen Hass oder Vorurteile anzeigen. Deshalb muss jedes System, das versucht, Hassrede zu erkennen, das Gespräch als Ganzes betrachten und nicht nur einzelne Aussagen.

Der neue Ansatz: CoSyn

Um das Problem der Erkennung von impliziter Hassrede anzugehen, wurde ein neues System namens CoSyn entwickelt. CoSyn zielt darauf ab, die Gespräche umfassender zu betrachten. Dieses System berücksichtigt sowohl den persönlichen Kontext – wie die Geschichte eines Nutzers in sozialen Medien – als auch den Kontext des Gesprächs selbst.

Persönlicher Kontext

CoSyn konzentriert sich zuerst auf die Geschichte der Interaktionen eines Nutzers. Jeder Nutzer hat frühere Beiträge, Kommentare und Kommunikationsweisen, die Einblicke in seine Persönlichkeit und mögliche Vorurteile geben können. Indem CoSyn betrachtet, was ein Nutzer in der Vergangenheit gesagt hat, kann es ein klareres Bild davon aufbauen, wie er typischerweise kommuniziert. Dieses vergangene Verhalten hilft dabei zu beurteilen, ob ein neuer Kommentar hasserfüllt sein könnte, besonders wenn er mit etablierten Sprachmustern übereinstimmt.

Gesprächskontext

Als nächstes betrachtet CoSyn das grössere Gespräch, in dem ein Kommentar gefunden wird. Es berücksichtigt den Dialogfluss, die Reaktionen auf vorherige Kommentare und wie Nutzer miteinander interagieren. Das bedeutet, dass CoSyn nicht nur Kommentare isoliert liest; es versteht, dass Gespräche aufeinander aufbauen und die Bedeutung sich ändern kann, wenn neue Kommentare hinzugefügt werden.

Indem es persönlichen und Gesprächskontext kombiniert, kann CoSyn effektiver implizite Hassrede identifizieren. Dieser zweigleisige Ansatz ermöglicht es, Verbindungen zu sehen, die eine einfache Keyword-Suche möglicherweise übersieht.

Wie CoSyn funktioniert

CoSyn verwendet fortschrittliche Methoden, um Daten zu verarbeiten und zu analysieren, um die komplexen sozialen Interaktionen auf Plattformen wie Twitter zu verstehen. Es setzt eine Mischung aus maschinellen Lerntechniken ein, die darauf ausgelegt sind, sowohl Text als auch die Beziehungen zwischen Nutzern zu verstehen.

Analyse historischer Engagements

CoSyn erstellt zuerst ein Profil des Nutzers, indem es dessen frühere Beiträge und Interaktionen analysiert. Dies hilft, Muster über die Zeit hinweg festzustellen, einschliesslich möglicher Tendenzen zur Hassrede. Zum Beispiel könnte ein Nutzer, der häufig negative Kommentare über eine bestimmte Gruppe teilt, in zukünftigen Interaktionen ein Warnsignal auslösen.

Soziale Verbindungen

Als nächstes betrachtet CoSyn, wie Nutzer miteinander verbunden sind. Es erstellt ein Netzwerk basierend darauf, wer wem folgt, wer auf wen antwortet und wie oft Nutzer miteinander interagieren. Indem es diese Beziehungen versteht, kann CoSyn den Einfluss eines Nutzers auf einen anderen messen, was in Gesprächen, in denen Meinungen und Vorurteile ansteckend sein können, entscheidend ist.

Kontextuelle Interaktion

Schliesslich kombiniert CoSyn sowohl persönliche als auch Gesprächskontexte, um neue Kommentare zu bewerten. Es analysiert, ob eine Aussage wahrscheinlich hasserfüllt ist, basierend darauf, wie sie in den Gesamtdialog und das frühere Verhalten des Nutzers passt. Dieses tiefere Verständnis hilft, falsch positive Ergebnisse zu reduzieren, bei denen ein neutraler Kommentar fälschlicherweise als Hassrede eingestuft wird.

Ergebnisse und Effektivität

CoSyn wurde an einem Datensatz von Gesprächen auf Twitter getestet, wo Nutzer oft sowohl explizite als auch implizite Hassrede verwenden. Die Ergebnisse zeigen, dass CoSyn deutlich besser abschneidet als frühere Modelle, die sich nur mit einfacher Hassrede beschäftigt haben. Es ist besonders effektiv darin, subtile Formen von Hass in Gesprächen zu erkennen, und schliesst somit eine kritische Lücke in den aktuellen Systemen.

Bedeutung der Nutzerhistorie

Ein wichtiges Ergebnis aus den CoSyn-Bewertungen ist, dass das Wissen um die Geschichte eines Nutzers von entscheidender Bedeutung ist. Diese Daten helfen dem System, zwischen harmlosen und potenziell schädlichen Kommentaren zu unterscheiden. Zum Beispiel, wenn ein Nutzer eine Geschichte hat, in der er hasserfüllte Kommentare gepostet hat, ist sein neuer Beitrag wahrscheinlicher als problematisch einzustufen.

Kontextuelles Bewusstsein

CoSyn zeigt auch die Bedeutung des Kontexts bei der Erkennung von Hassrede. Die Einsichten, die aus gesamten Gesprächen gewonnen werden, offenbaren Muster, die einzelne Kommentare nicht ausdrücken können. Dieses kontextuelle Bewusstsein ermöglicht es CoSyn, implizite Hassrede zu erfassen, die sonst möglicherweise unbemerkt bleibt.

Fazit

Die Herausforderung, implizite Hassrede in Online-Gesprächen zu erkennen, ist erheblich. Doch mit der Einführung von Systemen wie CoSyn gibt es Potenzial für Verbesserungen. Durch einen umfassenderen Ansatz, der sowohl persönliche Geschichte als auch Gesprächskontext einbezieht, zeigt CoSyn einen vielversprechenden Fortschritt im Kampf gegen Hassrede online.

Da soziale Medien weiterhin eine entscheidende Rolle in der Kommunikation spielen, ist es wichtiger denn je, versteckte Formen von Hassrede anzugehen. Künftige Arbeiten werden sich darauf konzentrieren, diese Systeme weiter zu verbessern und Wege zu finden, zusätzliche Wissensquellen zu integrieren, um noch besser darin zu werden, dieses kritische Problem zu identifizieren und anzugehen.

Originalquelle

Titel: CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a Context Synergized Hyperbolic Network

Zusammenfassung: The tremendous growth of social media users interacting in online conversations has led to significant growth in hate speech, affecting people from various demographics. Most of the prior works focus on detecting explicit hate speech, which is overt and leverages hateful phrases, with very little work focusing on detecting hate speech that is implicit or denotes hatred through indirect or coded language. In this paper, we present CoSyn, a context-synergized neural network that explicitly incorporates user- and conversational context for detecting implicit hate speech in online conversations. CoSyn introduces novel ways to encode these external contexts and employs a novel context interaction mechanism that clearly captures the interplay between them, making independent assessments of the amounts of information to be retrieved from these noisy contexts. Additionally, it carries out all these operations in the hyperbolic space to account for the scale-free dynamics of social media. We demonstrate the effectiveness of CoSyn on 6 hate speech datasets and show that CoSyn outperforms all our baselines in detecting implicit hate speech with absolute improvements in the range of 1.24% - 57.8%.

Autoren: Sreyan Ghosh, Manan Suri, Purva Chiniya, Utkarsh Tyagi, Sonal Kumar, Dinesh Manocha

Letzte Aktualisierung: 2023-10-24 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2303.03387

Quell-PDF: https://arxiv.org/pdf/2303.03387

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel