Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio

Affrontare il pregiudizio di genere nella traduzione automatica

Questo documento parla dei miglioramenti del linguaggio inclusivo di genere nei sistemi di traduzione automatica.

― 5 leggere min


Pregiudizio di genere neiPregiudizio di genere neisistemi di traduzionetraduzione per identità diverse.Esaminando come migliorare la
Indice

La traduzione automatica (MT) spesso mostra un bias di genere, soprattutto quando si traduce in lingue che hanno forme di genere specifiche, come l'italiano. Quando si traduce dall'inglese, che ha modi limitati per esprimere il genere, all'italiano, che segna il genere in modo più esteso, possono sorgere problemi. Ad esempio, se la frase inglese non specifica il genere, la traduzione potrebbe utilizzare automaticamente una forma maschile, il che può rappresentare male o ignorare le identità delle donne e delle persone non binarie.

Molte discussioni recenti si concentrano su come rendere il linguaggio più inclusivo, in particolare per le identità non binarie. Questo articolo esplora un nuovo approccio che coinvolge parole inclusive di genere, note come neomorfemi, come un modo per migliorare la MT. I neomorfemi sono forme linguistiche innovative che evitano etichette di genere binarie.

La sfida è che la maggior parte dei modelli di MT non utilizza in modo efficace il linguaggio inclusivo di genere. Questo studio esamina come i modelli linguistici di grandi dimensioni (LLMs) possono essere stimolati a tradurre dall'inglese all'italiano utilizzando queste nuove forme. L'area della MT inclusiva di genere è ancora relativamente nuova e non ci sono abbastanza strumenti o dataset disponibili per valutarla correttamente.

Il Problema del Bias di Genere

Il bias di genere nella MT significa che i sistemi spesso producono traduzioni che defaultano a parole maschili quando il testo originale non specifica il genere. Questo problema diventa particolarmente significativo quando si traduce in lingue con genere grammaticale, come l'italiano. Ad esempio, in inglese potresti dire: "I miei amici sono ricchi", ma in italiano devi specificare il genere degli amici. Puoi dire "I miei amici sono ricchi" per amici maschi o "Le mie amiche sono ricche" per amiche femmine.

Questa tendenza può portare a una scarsa rappresentanza o a una rappresentazione errata delle donne e delle persone non binarie nelle traduzioni. Dobbiamo trovare modi per rendere la MT più inclusiva e accurata.

Neomorfemi come Soluzione

In risposta al problema del bias di genere, stanno nascendo nuove parole e strutture per rendere il linguaggio più inclusivo. Questi includono neopronomi e neomorfemi. I neopronomi sono pronomi alternativi che sostituiscono le forme tradizionali he/she. I neomorfemi sono nuove desinenze o indicatori che consentono espressioni di genere neutro invece delle forme maschili o femminili tradizionali. Ad esempio, invece delle desinenze -o per il maschile e -a per il femminile, le persone potrebbero usare forme come -# o -e/-es.

Questo approccio proviene da comunità che cercano di creare un linguaggio più inclusivo. Anche se esistono forme diverse di neomorfemi, gli individui possono scegliere quali preferiscono in base alle loro identità. Tuttavia, l'uso di queste nuove forme nella MT è ancora un'area poco studiata.

La Necessità di Strumenti di Valutazione

Una delle sfide principali nella ricerca sul linguaggio inclusivo di genere nella MT è l'assenza di risorse per valutare i modelli di MT sul loro uso di neomorfemi. Attualmente, ci sono pochi dataset pubblici mirati a questo scopo. È stato difficile creare e testare sistemi che possano lavorare con queste forme innovative.

Data questa lacuna, gli autori hanno creato una nuova risorsa, chiamata Neo-GATE, progettata per valutare le traduzioni che utilizzano neomorfemi gender-inclusive.

Benchmark Neo-GATE

Il benchmark Neo-GATE si basa su valutazioni esistenti progettate per misurare il bias di genere nella MT. Ha un insieme di voci in cui il genere non è specificato in inglese, consentendo di analizzare come i modelli si comportano quando ricevono input neutrali.

Neo-GATE include voci con parole di genere specifico che possono essere sostituite con neomorfemi. Utilizzando tag di segnaposto, le nuove risorse possono essere adattate a qualsiasi forma di neomorfema. Questo consente ai ricercatori di valutare le prestazioni dei sistemi di MT nell'utilizzo di queste forme innovative.

Testare i Modelli Linguistici di Grandi Dimensioni

L'articolo esamina quanto bene diversi LLMs possano adattarsi a queste nuove forme di linguaggio inclusivo di genere. Gli autori hanno testato vari modelli, inclusi diversi LLM open-source e un modello commerciale, per vedere quanto efficacemente potessero tradurre utilizzando neomorfemi.

Durante i test, hanno osservato come diverse strategie di stimolo influenzano le traduzioni. Hanno creato stimoli che avrebbero istruito i modelli a utilizzare neomorfemi. Il test di questi modelli ha rivelato livelli variabili di successo nella generazione delle forme corrette.

Risultati degli Esperimenti

I risultati hanno indicato che alcuni modelli si sono comportati meglio di altri quando hanno ricevuto stimoli chiari sull'uso dei neomorfemi. Modelli come GPT-4 e Mixtral hanno mostrato risultati promettenti, soprattutto quando avevano più esempi da cui apprendere negli stimoli. Tuttavia, LLama 2 e Tower non si sono comportati bene nella generazione delle forme desiderate.

Una scoperta notevole è stata che l'uso di più esempi negli stimoli ha generalmente migliorato le traduzioni dei modelli. Tuttavia, è stato anche riscontrato che semplicemente aumentare il numero di esempi non garantiva maggiore accuratezza per tutti i modelli.

L'analisi ha evidenziato diversi aspetti di come i modelli generavano neomorfemi, inclusa la tendenza a generare forme errate. Alcuni modelli generavano forme di genere appropriate più frequentemente, mentre altri faticavano con l'accuratezza. I test hanno rivelato che i caratteri e le forme utilizzate nella traduzione possono influenzare notevolmente le prestazioni.

Conclusione

Lo studio suggerisce che c'è un grande potenziale per gli LLM di adattarsi al linguaggio neologistico inclusivo di genere nella MT. Tuttavia, raggiungere un'alta accuratezza rimane una sfida. Il benchmark Neo-GATE fornisce una base per ulteriori ricerche sulla MT inclusiva di genere, consentendo agli sviluppatori di testare e migliorare i modelli per meglio adeguarsi a identità di genere diverse.

In futuro, sarà cruciale continuare a esplorare come migliorare i sistemi MT per utilizzare un linguaggio che sia equo e rappresentativo di tutte le persone, indipendentemente dal genere. Le intuizioni di questa ricerca aiuteranno a guidare ulteriori sviluppi e comprensioni in quest'area importante della tecnologia linguistica.

Fonte originale

Titolo: Enhancing Gender-Inclusive Machine Translation with Neomorphemes and Large Language Models

Estratto: Machine translation (MT) models are known to suffer from gender bias, especially when translating into languages with extensive gendered morphology. Accordingly, they still fall short in using gender-inclusive language, also representative of non-binary identities. In this paper, we look at gender-inclusive neomorphemes, neologistic elements that avoid binary gender markings as an approach towards fairer MT. In this direction, we explore prompting techniques with large language models (LLMs) to translate from English into Italian using neomorphemes. So far, this area has been under-explored due to its novelty and the lack of publicly available evaluation resources. We fill this gap by releasing Neo-GATE, a resource designed to evaluate gender-inclusive en-it translation with neomorphemes. With Neo-GATE, we assess four LLMs of different families and sizes and different prompt formats, identifying strengths and weaknesses of each on this novel task for MT.

Autori: Andrea Piergentili, Beatrice Savoldi, Matteo Negri, Luisa Bentivogli

Ultimo aggiornamento: 2024-05-14 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2405.08477

Fonte PDF: https://arxiv.org/pdf/2405.08477

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili