Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica # Calcolo e linguaggio

Plasmare il linguaggio per tutti: La sfida di un linguaggio di genere equo

Promuovere l'inclusività attraverso un linguaggio equo di genere nella scrittura e nella traduzione.

Simona Frenda, Andrea Piergentili, Beatrice Savoldi, Marco Madeddu, Martina Rosola, Silvia Casola, Chiara Ferrando, Viviana Patti, Matteo Negri, Luisa Bentivogli

― 6 leggere min


Lingua per Tutti Lingua per Tutti comunicazione. Sfida ai pregiudizi di genere nella
Indice

Il Linguaggio di genere equo riguarda il far sì che tutti si sentano inclusi, indipendentemente dal loro genere. Si tratta di usare parole che non favoriscano un genere rispetto all'altro. Questo diventa particolarmente complicato in lingue come l'italiano, dove le parole hanno forme di genere specifiche. Potresti chiederti: "Perché è importante?" Beh, le parole plasmano i nostri pensieri, le percezioni e persino il nostro mondo. Usare un linguaggio equo aiuta tutti a sentirsi rappresentati e valorizzati.

La Sfida della Generazione di Linguaggio di Genere Equo

Per promuovere l'uso di un linguaggio di genere equo, c'è una sfida che si concentra sull'identificazione e la trasformazione di espressioni di parte nella scrittura. Questa sfida ha tre compiti principali:

  1. Trovare Espressioni di Genere: Il primo compito è individuare quelle frasi subdole, orientate al genere, che si nascondono nelle frasi.
  2. Riscrivere per l'Equità: Il secondo compito è cambiare con creatività quelle frasi in alternative neutre rispetto al genere.
  3. Traduzione Equa: L'ultimo compito è garantire che le traduzioni dall'inglese all'italiano mantengano la neutralità di genere quando necessario.

Vediamo nel dettaglio ciascuno di questi compiti.

Compito 1: Trovare Espressioni di Genere

Nel primo compito, i partecipanti devono identificare frasi che sono specifiche per genere nelle frasi italiane. Ad esempio, se qualcuno dice "i cittadini" per riferirsi a un gruppo di genere misto, non è molto inclusivo. Invece di usare termini maschili per un gruppo misto, vogliamo frasi che riconoscano tutti.

Quindi, la sfida è allenare i sistemi a individuare frasi che evidenziano solo un genere, sia in modo palese che sottile. Questo comporta l'analisi di varie forme come:

  • Maschile/Femminile Esteso: Usare un termine di genere per descrivere molte persone, come dire "i cittadini" utilizzando solo la forma maschile.
  • Termini Generici: Usare termini maschili per riferirsi a tutti, come "il candidato" per chiunque, indipendentemente dal genere.
  • Genere Incongruente: Usare un termine di genere che non corrisponde alla persona a cui si fa riferimento, come chiamare una donna "professore" (un termine maschile).

Compito 2: Riscrivere per l'Equità

Dopo aver individuato le espressioni di genere nel primo compito, è tempo di un po' di creatività nel secondo compito. Qui, i partecipanti possono riscrivere quelle frasi in un linguaggio equo. Ci sono due strategie principali:

  1. Obscurazione Conservativa: Questo approccio evita del tutto di menzionare il genere. Ad esempio, invece di dire "i professori", si potrebbe dire "il corpo docente."

  2. Obscurazione Innovativa: Questa strategia introduce nuovi termini giocosi che sono neutri rispetto al genere. Immagina di chiamare un professore "lǝ professorǝ" invece di usare termini chiaramente maschili o femminili.

Trasformando le espressioni di genere in un linguaggio equo, questo compito mira a rendere la comunicazione più inclusiva.

Compito 3: Traduzione Equa

L'ultimo compito adotta un approccio bilingue. Si tratta di vedere quanto bene le traduzioni dall'inglese all'italiano possono mantenere le cose eque. Diciamo che hai la frase "Sono felice di conoscere dottori così preparati." In questo caso, una traduzione ideale sarebbe "Sono felice di conoscere un personale medico così preparato," che evita di enfatizzare il genere.

Questo compito sfida i sistemi a gestire appropriatamente sia le traduzioni di genere che quelle neutre. A volte, il genere è chiaro e dovrebbe essere usato, mentre altre volte dovrebbe essere evitato del tutto. Un equilibrio delicato, proprio come cercare di camminare su una corda tesa mentre si jongla!

Set di Dati per la Sfida

Per far funzionare questa sfida, sono stati messi insieme diversi set di dati. Ognuno fornisce esempi da cui i modelli possono imparare.

  1. Corpus GFL-it: Questa collezione include testi italiani tratti da documenti ufficiali. Gli annotatori hanno contrassegnato le sezioni che contengono espressioni di genere, facilitando l'apprendimento dei modelli su cosa cercare.

  2. GeNTE: Questo set di test bilingue aiuta con le traduzioni neutre rispetto al genere. Include frasi in inglese insieme a traduzioni di genere e neutre in italiano. L'obiettivo è vedere se i modelli possono navigare correttamente tra queste forme.

  3. Neo-GATE: Come GeNTE, questo set si concentra su termini innovativi neutri rispetto al genere. Include frasi in inglese che non rivelano il genere, consentendo traduzioni creative in italiano.

Questi set di dati sono essenziali per addestrare i sistemi e migliorare la loro comprensione del linguaggio di genere equo.

Valutazione dei Modelli

Mentre i partecipanti si dedicano ai compiti, i loro risultati vengono valutati rispetto a criteri specifici. Per il compito 1, i modelli vengono valutati in base alla loro capacità di identificare espressioni di genere utilizzando un metodo chiamato F1-score, che misura l'accuratezza. Più corrispondenze corrette ci sono con le annotazioni, meglio è.

Per il compito 2, l'attenzione si sposta su un classificatore che determina se le frasi riformulate sono neutre rispetto al genere o meno. La percentuale di etichette corrette aiuta a valutare le prestazioni.

Nel compito 3, l'enfasi è di nuovo sulle traduzioni. I modelli devono decidere quando usare termini di genere e quando mantenere un linguaggio neutro. Questo aiuta a mantenere la conversazione equa e inclusiva.

Limiti della Sfida

Sebbene la sfida sia progettata per promuovere il linguaggio di genere equo, non è priva di difetti. I set di dati coprono solo aree specifiche, come documenti ufficiali o contesti istituzionali specifici. Questo significa che la ricerca futura potrebbe beneficiare di una gamma più ampia di fonti e prospettive.

Inoltre, gli approcci attuali a metriche e valutazioni potrebbero essere solo l'inizio. Dovrebbero essere esplorati metodi più raffinate per valutare i modelli in modo completo. C'è anche il fatto che viene utilizzato solo un tipo di termine neutro rispetto al genere, come lo schwa-simple. Esiste un mondo di possibilità per esprimere idee neutre rispetto al genere.

Considerazioni Etiche

La sfida solleva importanti questioni etiche. Lavorando per ridurre il linguaggio di parte rispetto al genere, l'obiettivo è elevare le voci di chi viene spesso trascurato. Ma il team dietro questo sforzo riconosce le proprie carenze, come l'aver avuto uno squilibrio nel loro gruppo di annotatori.

Inoltre, c'è una preoccupazione valida riguardo all'accessibilità. Alcune persone potrebbero trovare difficile leggere termini che utilizzano marcatori innovativi neutri rispetto al genere, soprattutto coloro che hanno difficoltà di lettura. Tuttavia, c'è spazio per la flessibilità. Gli individui possono scegliere quali termini funzionano meglio per loro, consentendo un'esperienza più user-friendly.

Il Paradigma Schwa-Simple

Uno strumento creativo nel toolbox del linguaggio neutro rispetto al genere è il paradigma schwa-simple. Questo metodo sostituisce i termini tradizionali di genere con un segnaposto, offrendo flessibilità. Ecco come funziona:

  • I termini maschili come "professore" possono essere sostituiti con "professorǝ" per includere tutti, che siano maschi, femmine o non binari.
  • Il paradigma include una varietà di forme per coprire molte situazioni, fornendo opzioni che possono essere adattate a diversi contesti.

Questo paradigma è un modo giocoso per sfidare le norme linguistiche convenzionali e ispirare inclusività.

Conclusione

La spinta verso un linguaggio di genere equo è più di un semplice argomento di tendenza; è un movimento significativo verso l'inclusione e la rappresentazione. Identificando, riscrivendo e traducendo il linguaggio per essere equo verso tutti i generi, stiamo aiutando a plasmare un mondo in cui tutti si sentano riconosciuti e valorizzati.

In poche parole, questa sfida mira a abbattere le barriere nel linguaggio e creare uno spazio di comunicazione più equo. E mentre le sfide rimangono, i progressi fatti sono un passo nella giusta direzione. Chi avrebbe mai pensato che le parole potessero fare una differenza così grande?

Fonte originale

Titolo: GFG -- Gender-Fair Generation: A CALAMITA Challenge

Estratto: Gender-fair language aims at promoting gender equality by using terms and expressions that include all identities and avoid reinforcing gender stereotypes. Implementing gender-fair strategies is particularly challenging in heavily gender-marked languages, such as Italian. To address this, the Gender-Fair Generation challenge intends to help shift toward gender-fair language in written communication. The challenge, designed to assess and monitor the recognition and generation of gender-fair language in both mono- and cross-lingual scenarios, includes three tasks: (1) the detection of gendered expressions in Italian sentences, (2) the reformulation of gendered expressions into gender-fair alternatives, and (3) the generation of gender-fair language in automatic translation from English to Italian. The challenge relies on three different annotated datasets: the GFL-it corpus, which contains Italian texts extracted from administrative documents provided by the University of Brescia; GeNTE, a bilingual test set for gender-neutral rewriting and translation built upon a subset of the Europarl dataset; and Neo-GATE, a bilingual test set designed to assess the use of non-binary neomorphemes in Italian for both fair formulation and translation tasks. Finally, each task is evaluated with specific metrics: average of F1-score obtained by means of BERTScore computed on each entry of the datasets for task 1, an accuracy measured with a gender-neutral classifier, and a coverage-weighted accuracy for tasks 2 and 3.

Autori: Simona Frenda, Andrea Piergentili, Beatrice Savoldi, Marco Madeddu, Martina Rosola, Silvia Casola, Chiara Ferrando, Viviana Patti, Matteo Negri, Luisa Bentivogli

Ultimo aggiornamento: Dec 30, 2024

Lingua: English

URL di origine: https://arxiv.org/abs/2412.19168

Fonte PDF: https://arxiv.org/pdf/2412.19168

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili