Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften # Rechnen und Sprache

Sprache für alle gestalten: Die gendergerechte Herausforderung

Inklusivität fördern durch geschlechtergerechte Sprache in Schrift und Übersetzung.

Simona Frenda, Andrea Piergentili, Beatrice Savoldi, Marco Madeddu, Martina Rosola, Silvia Casola, Chiara Ferrando, Viviana Patti, Matteo Negri, Luisa Bentivogli

― 7 min Lesedauer


Sprache für alle Sprache für alle Kommunikation. Geschlechtervorurteilen in der Herausforderung von
Inhaltsverzeichnis

Gendergerechte Sprache sorgt dafür, dass sich jeder einbezogen fühlt, egal welches Geschlecht er hat. Es geht darum, Wörter zu verwenden, die keine Geschlechterbevorzugung zeigen. Besonders knifflig wird das in Sprachen wie Italienisch, wo Wörter spezifische Geschlechtsformen haben. Du fragst dich vielleicht: "Warum ist das wichtig?" Nun, Wörter prägen unsere Gedanken, Wahrnehmungen und sogar unsere Welt. Mit fairer Sprache fühlen sich alle repräsentiert und geschätzt.

Die Herausforderung der gendergerechten Generation

Um die Verwendung gendergerechter Sprache zu fördern, gibt es eine Herausforderung, die sich darauf konzentriert, voreingenommene Ausdrücke in Texten zu identifizieren und zu verändern. Diese Herausforderung hat drei Hauptaufgaben:

  1. Genderisierte Ausdrücke finden: Die erste Aufgabe besteht darin, diese heimlichen, genderisierten Phrasen in Sätzen zu erkennen.
  2. Umformulierung für Fairness: Bei der zweiten Aufgabe geht es darum, kreativ diese Phrasen in geschlechtsneutrale Alternativen umzuwandeln.
  3. Faire Übersetzung: Die letzte Aufgabe sorgt dafür, dass Übersetzungen vom Englischen ins Italienische, wenn nötig, Geschlechtsneutral bleiben.

Lass uns jede dieser Aufgaben aufschlüsseln.

Aufgabe 1: Genderisierte Ausdrücke finden

In der ersten Aufgabe müssen die Teilnehmenden Phrasen identifizieren, die geschlechtsspezifisch in italienischen Sätzen sind. Wenn jemand zum Beispiel "i cittadini" sagt, um eine Gruppe mit gemischtem Geschlecht zu beschreiben, ist das nicht sehr inklusiv. Statt maskuliner Begriffe für eine gemischte Gruppe wollen wir Phrasen, die alle anerkennen.

Die Herausforderung ist, Systeme zu trainieren, Phrasen zu erkennen, die nur ein Geschlecht hervorheben, egal ob offen oder subtil. Das umfasst verschiedene Formen wie:

  • Überdehnte Maskulin/Feminin: Ein geschlechtsspezifischer Begriff wird verwendet, um viele Menschen zu beschreiben, wie zum Beispiel "die Bürger", während nur die männliche Form genutzt wird.
  • Generische Begriffe: Männliche Begriffe werden verwendet, um alle zu bezeichnen, wie "der Kandidat", was jeden Kandidaten unabhängig vom Geschlecht meint.
  • Inkongruentes Geschlecht: Ein Geschlechtsbegriff wird verwendet, der nicht zu der Person passt, auf die verwiesen wird, wie eine Frau "professore" (ein männlicher Begriff) zu nennen.

Aufgabe 2: Umformulierung für Fairness

Nachdem genderisierte Ausdrücke in der ersten Aufgabe entdeckt wurden, ist es Zeit für etwas Kreativität in der zweiten Aufgabe. Hier können die Teilnehmenden diese Phrasen in gendergerechte Sprache umschreiben. Es gibt zwei Hauptstrategien:

  1. Konservative Verschleierung: Diese Methode vermeidet es, Geschlecht überhaupt zu erwähnen. Statt "i professori" (die Professoren) zu sagen, könnte man "il corpo docente" (das Lehrpersonal) verwenden.

  2. Innovative Verschleierung: Diese Strategie führt spielerisch neue, geschlechtsneutrale Begriffe ein. Stell dir vor, man nennt einen Professor "lǝ professorǝ", anstatt klare männliche oder weibliche Begriffe zu verwenden.

Indem genderisierte Ausdrücke in faire Sprache umgewandelt werden, zielt diese Aufgabe darauf ab, die Kommunikation inklusiver zu gestalten.

Aufgabe 3: Faire Übersetzung

Die letzte Aufgabe nimmt einen zweisprachigen Ansatz. Sie prüft, wie gut Übersetzungen vom Englischen ins Italienische fair bleiben können. Nehmen wir an, du hast den Satz "Ich bin froh, so sachkundige Ärzte zu kennen." In diesem Fall wäre eine ideale Übersetzung "Sono felice di conoscere un personale medico così preparato," die Geschlecht vermeidet.

Diese Aufgabe fordert Systeme heraus, sowohl geschlechtsspezifische als auch geschlechtsneutrale Übersetzungen angemessen zu handhaben. Manchmal ist das Geschlecht klar und sollte verwendet werden, während es in anderen Fällen ganz vermieden werden sollte. Eine heikle Balance, fast so, als würde man auf einem Drahtseil balancieren und gleichzeitig jonglieren!

Datensätze für die Herausforderung

Um diese Herausforderung zu ermöglichen, wurden mehrere Datensätze zusammengestellt. Jeder bietet Beispiele, von denen Modelle lernen können.

  1. GFL-it Corpus: Diese Sammlung enthält italienische Texte aus offiziellen Dokumenten. Annotatoren haben die Abschnitte markiert, die geschlechtsbezogene Ausdrücke enthalten, was es für Modelle einfacher macht, zu lernen, wonach sie suchen sollen.

  2. GeNTE: Dieser zweisprachige Testdatensatz hilft bei geschlechtsneutralen Übersetzungen. Er beinhaltet englische Sätze zusammen mit geschlechtsspezifischen und geschlechtsneutralen italienischen Übersetzungen. Ziel ist es, zu sehen, ob Modelle zwischen diesen Formen korrekt navigieren können.

  3. Neo-GATE: Wie GeNTE fokussiert auch dieser Datensatz auf innovative geschlechtsneutrale Begriffe. Er umfasst englische Sätze, die kein Geschlecht verraten, was kreative italienische Übersetzungen ermöglicht.

Diese Datensätze sind wichtig für das Training von Systemen und die Verbesserung ihres Verständnisses von gendergerechter Sprache.

Bewertung der Modelle

Während die Teilnehmenden an den Aufgaben arbeiten, werden ihre Ergebnisse anhand spezifischer Kriterien bewertet. Für Aufgabe 1 werden die Modelle basierend auf ihrer Fähigkeit, genderisierte Ausdrücke zu erkennen, mit einem Verfahren namens F1-Score bewertet, das die Genauigkeit misst. Je mehr korrekte Übereinstimmungen mit den Annotationen, desto besser.

Für Aufgabe 2 liegt der Fokus auf einem Klassifizierer, der bestimmt, ob die umformulierten Sätze geschlechtsneutral sind oder nicht. Der Prozentsatz der korrekten Labels hilft, die Leistung zu bewerten.

In Aufgabe 3 liegt der Schwerpunkt erneut auf Übersetzungen. Die Modelle müssen entscheiden, wann geschlechtsspezifische Begriffe zu verwenden sind und wann sie bei neutraler Sprache bleiben sollten. Das hilft, das Gespräch fair und inklusiv zu halten.

Einschränkungen der Herausforderung

Obwohl die Herausforderung darauf abzielt, gendergerechte Sprache zu fördern, hat sie auch ihre Schwächen. Die Datensätze umfassen nur bestimmte Bereiche, wie offizielle Dokumente oder spezifische institutionelle Kontexte. Das bedeutet, dass zukünftige Forschungen von einer breiteren Palette an Quellen und Perspektiven profitieren könnten.

Zudem könnten die aktuellen Ansätze zu Metriken und Bewertungen erst der Anfang sein. Verfeinerte Methoden sollten erforscht werden, um Modelle umfassend zu bewerten. Es gibt auch die Tatsache, dass nur eine Art von geschlechtsneutralem Begriff verwendet wird, wie das Schwa-Simple. Es gibt eine Welt voller Möglichkeiten, geschlechtsneutrale Ideen auszudrücken.

Ethische Überlegungen

Die Herausforderung wirft wichtige ethische Fragen auf. Indem wir daran arbeiten, geschlechtervoreingenommene Sprache zu reduzieren, soll die Stimme derjenigen, die oft übersehen werden, gestärkt werden. Aber das Team hinter diesem Vorhaben erkennt seine Schwächen an, wie beispielsweise das Ungleichgewicht in ihrer Gruppe von Annotatoren.

Ausserdem gibt es berechtigte Bedenken hinsichtlich der Zugänglichkeit. Einige Menschen könnten Schwierigkeiten haben, Begriffe mit innovativen geschlechtsneutralen Markierungen zu lesen, insbesondere diejenigen mit Leseproblemen. Dennoch gibt es Raum für Flexibilität. Individuen können wählen, welche Begriffe am besten für sie funktionieren, was eine benutzerfreundlichere Erfahrung ermöglicht.

Das Schwa-Simple-Paradigma

Ein kreatives Werkzeug in der Toolbox der geschlechtsneutralen Sprache ist das Schwa-Simple-Paradigma. Diese Methode ersetzt traditionelle geschlechterbezogene Begriffe durch einen Platzhalter und bietet Flexibilität. So funktioniert’s:

  • Männliche Begriffe wie "professore" können durch "professorǝ" ersetzt werden, um alle einzubeziehen, egal ob sie männlich, weiblich oder nicht-binär sind.
  • Das Paradigma umfasst eine Vielzahl von Formen, um viele Situationen abzudecken, und bietet Optionen, die auf unterschiedliche Kontexte zugeschnitten werden können.

Dieses Paradigma ist eine spielerische Möglichkeit, konventionelle Sprachnormen herauszufordern und Inklusivität zu inspirieren.

Fazit

Der Einsatz von gendergerechter Sprache ist mehr als nur ein Trend; es ist eine bedeutende Bewegung in Richtung Inklusivität und Repräsentation. Indem wir Sprache identifizieren, umformulieren und übersetzen, um allen Geschlechtern gerecht zu werden, helfen wir dabei, eine Welt zu gestalten, in der sich jeder anerkannt und geschätzt fühlt.

Kurz gesagt, diese Herausforderung zielt darauf ab, Barrieren in der Sprache abzubauen und einen gerechteren Kommunikationsraum zu schaffen. Und während Herausforderungen bestehen bleiben, ist der Fortschritt, der erzielt wurde, ein Schritt in die richtige Richtung. Wer hätte gedacht, dass Worte so einen grossen Unterschied machen können?

Originalquelle

Titel: GFG -- Gender-Fair Generation: A CALAMITA Challenge

Zusammenfassung: Gender-fair language aims at promoting gender equality by using terms and expressions that include all identities and avoid reinforcing gender stereotypes. Implementing gender-fair strategies is particularly challenging in heavily gender-marked languages, such as Italian. To address this, the Gender-Fair Generation challenge intends to help shift toward gender-fair language in written communication. The challenge, designed to assess and monitor the recognition and generation of gender-fair language in both mono- and cross-lingual scenarios, includes three tasks: (1) the detection of gendered expressions in Italian sentences, (2) the reformulation of gendered expressions into gender-fair alternatives, and (3) the generation of gender-fair language in automatic translation from English to Italian. The challenge relies on three different annotated datasets: the GFL-it corpus, which contains Italian texts extracted from administrative documents provided by the University of Brescia; GeNTE, a bilingual test set for gender-neutral rewriting and translation built upon a subset of the Europarl dataset; and Neo-GATE, a bilingual test set designed to assess the use of non-binary neomorphemes in Italian for both fair formulation and translation tasks. Finally, each task is evaluated with specific metrics: average of F1-score obtained by means of BERTScore computed on each entry of the datasets for task 1, an accuracy measured with a gender-neutral classifier, and a coverage-weighted accuracy for tasks 2 and 3.

Autoren: Simona Frenda, Andrea Piergentili, Beatrice Savoldi, Marco Madeddu, Martina Rosola, Silvia Casola, Chiara Ferrando, Viviana Patti, Matteo Negri, Luisa Bentivogli

Letzte Aktualisierung: Dec 30, 2024

Sprache: English

Quell-URL: https://arxiv.org/abs/2412.19168

Quell-PDF: https://arxiv.org/pdf/2412.19168

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel