Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften # Rechnen und Sprache

Online-Feindseligkeit gegenüber UK-Politikern: Ein tiefer Einblick

Die steigende Feindseligkeit in sozialen Medien gegenüber britischen Abgeordneten analysieren.

Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard

― 7 min Lesedauer


Feindseligkeit im Feindseligkeit im politischen Diskurs in Grossbritannien Forschung. gegen britische Politiker durch Die Enttarnung von Online-Missbrauch
Inhaltsverzeichnis

In den letzten Jahren sind soziale Medien eine beliebte Plattform für Politiker in Grossbritannien geworden, um mit der Öffentlichkeit zu interagieren. Sie nutzen Seiten wie X (früher bekannt als Twitter), um mit ihren Wählern in Kontakt zu treten, Fragen zu beantworten und Feedback zu erhalten. Diese Offenheit kann jedoch auch unerwünschte Aufmerksamkeit mit sich bringen. Politiker sehen sich oft einer Welle von feindlichen Kommentaren gegenüber, die sowohl ihre beruflichen Rollen als auch ihre persönlichen Identitäten betreffen, was soziale Medien zu einem zweischneidigen Schwert macht.

Diese Feindseligkeit kann den Politikern und dem Vertrauen der Öffentlichkeit in die Regierung schaden. Einige Kommentare sind so heftig, dass sie sogar echte Gewalt im wirklichen Leben anheizen können. Daher ist es entscheidend, dieses Problem zu verstehen und anzugehen, um einen gesunden politischen Diskurs aufrechtzuerhalten.

Der Datensatz

Um das Problem der Feindseligkeit in Online-Kommentaren, die sich gegen Politiker richten, anzugehen, haben Forscher einen Datensatz mit 3.320 Tweets erstellt, die über einen Zeitraum von zwei Jahren gesammelt wurden. Diese Tweets wurden sorgfältig überprüft und nach ihrem Grad an Feindseligkeit gegenüber Abgeordneten des britischen Parlaments (MPs) gekennzeichnet. Ausserdem enthält der Datensatz Details zu den Identitätsmerkmalen der Ziele, wie Rasse, Geschlecht und Religion.

Dieser Datensatz ist nicht einfach eine Sammlung zufälliger Tweets. Er soll die besondere Sprache und die Themen hervorheben, die in politischen Diskussionen im Vereinigten Königreich auftauchen, die sich stark von denen in anderen Ländern unterscheiden können. Zum Beispiel sind bestimmte Themen wie der Brexit besonders relevant in Grossbritannien, und dieser Datensatz spiegelt das wider.

Warum ist das wichtig?

Der Bedarf an diesem Datensatz ergibt sich aus der spezifischen Sprache, die in der politischen Feindseligkeit verwendet wird. Bestehende Modelle zur Erkennung allgemeiner Feindseligkeit versagen oft, wenn sie auf politische Kontexte angewendet werden. Sie erfassen nicht die Nuancen der Sprache und der öffentlichen Stimmung zu politischen Themen, weshalb ein fokussierterer Ansatz notwendig ist.

Ohne diesen gezielten Ansatz könnte das Vertrauen der Öffentlichkeit in politische Institutionen weiter erodieren. Daher hilft die Erstellung und Analyse dieses Datensatzes nicht nur bei der Klassifizierung feindlicher Tweets, sondern öffnet auch Türen für zukünftige Forschungen, um Online-Missbrauch im politischen Kontext besser zu verstehen.

Vorherige Forschung

Bevor dieser Datensatz erstellt wurde, haben frühere Studien die Feindseligkeit gegenüber Politikern untersucht, jedoch oft eher allgemein. Viele dieser Studien konzentrierten sich auf spezifische Vorfälle oder Trends, anstatt eine umfassende Analyse der verwendeten Sprache und der Identitätsfragen zu liefern.

Forschungsergebnisse zeigten, dass weibliche Politiker und solche aus Minderheiten oft mehr Feindseligkeit erleben als ihre männlichen Kollegen. Instrumente wie die Sentiment-Analyse wurden genutzt, um negative Stimmungen online zu erfassen, waren jedoch im politischen Bereich nicht immer effektiv.

Bestehende Datensätze hatten oft keine Labels, um die spezifische Art der Feindseligkeit zu identifizieren. Einige Datensätze konzentrierten sich nur auf eine Art von Missbrauch, wie Islamophobie, während andere ein breiteres Spektrum an Hassrede abdeckten, aber keine Aufmerksamkeit auf Identitätsmerkmale legten.

Methodologie

Datensammlung

Die Forscher nutzen die Streaming-API von X, um über zwei Jahre hinweg Tweets zu Abgeordneten zu sammeln. Sie verfolgten sowohl die ursprünglichen Tweets der Abgeordneten als auch die nachfolgenden Antworten und Retweets. Dieser umfassende Ansatz führte zu über 30 Millionen Tweets. Da diese Zahl jedoch überwältigend war, mussten die Forscher eine kleinere, handhabbare Teilmenge für die detaillierte Analyse auswählen.

Sampling-Prozess

Um Vielfalt zu gewährleisten, wählten die Forscher Tweets von 18 Abgeordneten aus, die unterschiedliche Identitäten und politische Parteien repräsentieren. Sie balancierten die Stichprobe, um sowohl Minderheiten- als auch Mehrheitsidentitätsgruppen einzuschliessen. Das Sampling konzentrierte sich auch auf verschiedene Zeiträume, um unterschiedliche Kontexte und Ereignisse zu erfassen.

Insgesamt wurden 3.330 Tweets gesammelt, die manuell gekennzeichnet wurden. Die Tweets wurden nach Feindseligkeit kategorisiert, sodass die Forscher ein klareres Bild der Landschaft von Online-Missbrauch gegenüber Abgeordneten erstellen konnten.

Annotierungsprozess

Die Forscher formulierten Richtlinien, um den Annotatoren zu helfen, die Tweets effektiv zu klassifizieren. Eine Reihe von Schulungen stellte sicher, dass alle Beteiligten die Definitionen und Kriterien zum genauen Identifizieren von Feindseligkeit verstanden. Die Annotatoren arbeiteten in Teams und wurden ermutigt, externe Ressourcen zu konsultieren, wenn sie auf unbekannte Sprache stiessen.

Drei verschiedene Annotatoren kennzeichneten jeden Tweet, was dem Datensatz einen gewissen Grad an Zuverlässigkeit verlieh. Dieser Mehrfach-Annotationsprozess half, Fehler zu minimieren und sicherzustellen, dass die Labels so genau wie möglich waren.

Analyse der Tweets

Linguistische Muster

Um die Sprache, die in feindlichen Tweets verwendet wird, zu verstehen, führten die Forscher eine linguistische Analyse durch. Sie fanden heraus, dass feindliche Tweets oft negative Begriffe und Phrasen enthielten, die darauf abzielten, Politiker zu diskreditieren. Wörter wie "Lügner", "korrupt" und "böse" waren unter den feindlichen Kommentaren besonders häufig.

Im Gegensatz dazu neigten nicht-feindliche Tweets dazu, positive Phrasen zu verwenden. Anstatt Beleidigungen enthielten diese Tweets oft Dankbarkeit oder konstruktives Feedback und verwendeten eine Sprache, die sozialen Normen entsprach.

Themenanalyse

Die Forscher untersuchten auch die Themen, die mit feindlichen und nicht-feindlichen Tweets verbunden waren. Sie identifizierten, dass viele Tweets sich auf aktuelle politische Ereignisse bezogen, wie Brexit oder den Umgang mit der Gesundheitsversorgung während der Pandemie. Diese Verbindung zwischen aktuellen Ereignissen und Online-Feindseligkeit verdeutlicht, wie bestimmte Themen die öffentliche Wut auf Politiker anheizen können.

Feindseligkeitsidentifikation

Die Forscher nutzten den Datensatz, um Modelle zur Erkennung von Feindseligkeit in Tweets zu trainieren. Dies umfasste zwei Hauptaufgaben: Zuerst die Identifizierung, ob ein Tweet feindlich oder nicht feindlich war, und zweitens die Kategorisierung der Art der Feindseligkeit basierend auf Identitätsmerkmalen wie Rasse, Geschlecht oder Religion.

Mehrere Modelle wurden getestet, um zu sehen, welches am besten in der Identifizierung von binärer Feindseligkeit (feindlich vs. nicht feindlich) und von mehrklassigen Feindseligkeitsarten abschnitt.

Ergebnisse

Ergebnisse der Feindseligkeitserkennung

Bei der Analyse der Leistungsfähigkeit der Modelle fanden die Forscher heraus, dass bestimmte Modelle, wie RoBERTa-Hate, besonders gut bei der Erkennung von Feindseligkeit abschnitten und eine hohe makro F1-Bewertung erreichten. Es wurde klar, dass Modelle, die auf dem Datensatz trainiert wurden und Confidencescores verwendeten, bessere Ergebnisse lieferten als solche, die auf früheren Datensätzen trainiert worden waren.

Trends in der Feindseligkeit

Ein bemerkenswerter Trend, der in den Daten gefunden wurde, ist, dass Politiker aus bestimmten Identitätsgruppen, wie Frauen und solche aus Minderheitenrassen oder -religionen, oft ein höheres Mass an Feindseligkeit erhielten. Dies hebt die Schnittstelle verschiedener Identitäten hervor, bei der die Kombination aus Rasse, Geschlecht und Religion die Menge an Missbrauch, dem Politiker ausgesetzt sind, verstärken kann.

Bedeutung des Kontexts

Die Forschung zeigte ausserdem, dass der Kontext, in dem ein Tweet gesendet wurde, eine bedeutende Rolle bei der Bestimmung der verwendeten Sprache spielte. Feindseligkeit erreichte oft ihren Höhepunkt rund um bedeutende politische Ereignisse, was die enge Verbindung zwischen sozialem Kommentar und Politik offenbart.

Fazit

Die Erstellung dieses Datensatzes ist ein Schritt in Richtung besserem Verständnis und Identifikation von Online-Feindseligkeit, die sich gegen britische Politiker richtet. Er hebt den Bedarf an spezialisierten Werkzeugen hervor, um dieses Problem im politischen Kontext effektiv anzugehen.

Indem sie sich auf die Sprache und die Identitätsmerkmale konzentrieren, die in feindlichen Kommentaren involviert sind, können Forscher wichtige Erkenntnisse gewinnen, die den Weg für zukünftige Forschungen ebnen, die darauf abzielen, Online-Missbrauch zu reduzieren.

Während soziale Medien weiterhin im Wandel sind, müssen sich auch unsere Ansätze zur Interaktion mit der Öffentlichkeit und zur Behandlung der feindlichen Stimmungen, die daraus entstehen können, weiterentwickeln.

Wenn nur die Abgeordneten mit einer dicken Haut, einem Sinn für Humor und vielleicht einem digitalen Schild ausgestattet wären, könnten sie das Chaos der Online-Kommentare vielleicht überstehen!

Originalquelle

Titel: Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs

Zusammenfassung: Numerous politicians use social media platforms, particularly X, to engage with their constituents. This interaction allows constituents to pose questions and offer feedback but also exposes politicians to a barrage of hostile responses, especially given the anonymity afforded by social media. They are typically targeted in relation to their governmental role, but the comments also tend to attack their personal identity. This can discredit politicians and reduce public trust in the government. It can also incite anger and disrespect, leading to offline harm and violence. While numerous models exist for detecting hostility in general, they lack the specificity required for political contexts. Furthermore, addressing hostility towards politicians demands tailored approaches due to the distinct language and issues inherent to each country (e.g., Brexit for the UK). To bridge this gap, we construct a dataset of 3,320 English tweets spanning a two-year period manually annotated for hostility towards UK MPs. Our dataset also captures the targeted identity characteristics (race, gender, religion, none) in hostile tweets. We perform linguistic and topical analyses to delve into the unique content of the UK political data. Finally, we evaluate the performance of pre-trained language models and large language models on binary hostility detection and multi-class targeted identity type classification tasks. Our study offers valuable data and insights for future research on the prevalence and nature of politics-related hostility specific to the UK.

Autoren: Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard

Letzte Aktualisierung: Dec 5, 2024

Sprache: English

Quell-URL: https://arxiv.org/abs/2412.04046

Quell-PDF: https://arxiv.org/pdf/2412.04046

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel