ニューラル翻訳における性別バイアスへの対処
新しいデータセットは、機械翻訳における性別バイアスを減らすことを目指してる。
― 1 分で読む
目次
ニューラル機械翻訳(NMT)は、質や利用の面で大きな進歩を遂げてきたけど、特に性別バイアスに関してはまだ大きな問題が残ってる。特に、性別を強く示さない言語から英語に翻訳する時に顕著だよ。この問題に関する研究はたくさんあるけど、バイアスを測定したり修正したりするための適切な方法はまだないんだ。
このギャップを埋めるために、トルコ語、ハンガリー語、フィンランド語、ペルシャ語から英語への人間の翻訳をもとに作った新しいデータセット、GATE X-Eを紹介するよ。このデータセットには、女性的、男性的、中立的な性別の選択肢がある翻訳が含まれてる。各言語ペアについて1250から1850の例があって、GATE X-Eは異なる言語の特徴を持つ翻訳者にチャレンジするさまざまな文を提供する。GPT-4を使った翻訳ツールも作って、GATE X-Eを使ってその効果をテストしたんだ。このプロジェクトを共有して、他の人たちが翻訳における性別バイアスを研究する手助けをしたいと考えてるよ。
翻訳における性別バイアス
NMTは大きく改善されたけど、性別バイアスはまだ結果に現れるんだ。一つの大きな問題は、翻訳されたテキストが元のテキストに性別が指定されていないのに、個人に性別を与えることがあるってこと。これは、英語と同じ方法で性別を使わない言語から翻訳する時によくあるよ。
英語では、性別は「he」や「she」といった代名詞や、「mother」や「uncle」といった具体的な名詞で表れる。トルコ語など、私たちが注目している言語では、すべての人称代名詞が中立的。例えば、トルコ語の「O」は「彼」、「彼女」、または「彼ら」を指すことができる。これにより、NMTモデルが元のテキストではなくステレオタイプに基づいて性別を割り当てる状況が生まれるんだ。
性別バイアスの例
トルコ語から英語に翻訳する時、機械はよく性別が指定されていない人に「she」という代名詞を使うんだ。これは、女性が介護にもっと関わっているという一般的な信念があるから。これを修正するために、すべての性別の形で翻訳を提供して、すべての解釈をカバーしようと提案してる。
性別が示されていない文を翻訳する時に、最終的に女性としてマークされてしまう問題が起こる。これは、子育てなどの特定の役割を女性に結びつけるステレオタイプに基づいていることが多い。一つの解決策は、男性的、中立的なオプションを含む複数のバージョンの翻訳を作ることだよ。
GATE X-Eデータセット
GATE X-Eは、英語からいくつかの言語への翻訳の性別リライトを評価した元のGATEコーパスに追加されたもので、トルコ語、ハンガリー語、フィンランド語、ペルシャ語から英語への翻訳に焦点を当てている。データセットは、長さや文脈が異なる自然な文で構成されていて、翻訳のさまざまな側面をテストしてる。
データ収集プロセス
GATE X-Eを作成するために、さまざまなソースから文のペアを集めたよ。選ばれた文は、言語検知や英語の翻訳における性別用語の存在に基づいて特定の基準を満たすようにフィルタリングされた。次に、これらの文をネイティブスピーカーに提供し、性別タイプや可能な翻訳について注釈をつけてもらったんだ。
GATE X-Eの各インスタンスには、ソース文とその翻訳が含まれていて、さまざまな性別の解釈をカバーしてる。各翻訳について、性別がマークされた用語が含まれているかどうか、そしてどれだけの任意の性別マーク付きのエンティティ(AGME)があるかを分類してる。AGMEは、元の文には性別が示されていないが、翻訳には性別が示されている文の部分だよ。
データセットの特徴
このデータセットは、強いバラエティを提供してる。多くのインスタンスには1つのAGMEが含まれているが、ない場合や複数ある場合もある。これらのケースのほとんどは、ソースに現れない性別の代名詞を含んでいる。また、中立的な個人と、性別がマークされた他の個人が混在しているケースも含まれてる。
翻訳が一貫性と正確性を保ちながら、異なる性別の解釈を探ることが課題なんだ。注釈者は文を通じて作業し、必要に応じてエラーをマークし、代替翻訳を提供したよ。
性別リライトプロセス
性別リライトのプロセスは、特定の性別で翻訳された文を取り、異なる性別の割り当てで新しいバージョンを作成することを含んでる。目的は、テキストの主なメッセージを変えずに、すべての可能な性別の解釈を反映した翻訳を提供することだよ。
性別リライトの問題の種類
考慮すべきリライト問題には2つの主なカテゴリがあるよ:
代名詞のみの問題:この場合、翻訳内の唯一の性別マーカーが代名詞の場合、ソース文には性別を示す代名詞が含まれない。翻訳に登場するすべての個人はAGMEになる。リライトは、元の意味を保ちながら、希望の性別に合わせてこれらの代名詞を変更することに焦点を当てる。
性別名詞の問題:ここでは、ソースに性別を明示的に示す名詞が含まれているかもしれない。このタイプのリライトは複雑で、AGMEとソース及び翻訳両方で性別がマークされているものを区別する必要がある。システムは、性別のある名詞と中立的な用語の両方を含むケースを処理しなければならない。
GPT-4の役割
リライトタスクを助けるために、GPT-4を使ったソリューションを開発したよ。このツールは、性別中立、全女性、全男性の3つのバージョンの翻訳を生成する。システムは、AGMEを特定して元の翻訳をそれに応じてリライトするために、GPT-4を段階的にガイドするように設計されてる。
GPT-4は、必要なことを明確にするために詳細なプロンプトを使用している。出力はその後、元の翻訳と照らし合わせて正確性を確認するんだ。
リライトシステムの評価
GATE X-Eデータセットを使用して、GPT-4ベースのリライトソリューションの効果を評価した。評価プロセスは、修正された文が期待されるバージョンとどれだけ一致しているかを測定した。
正確性の結果
結果は、システムが代名詞のみのケースで非常に良いパフォーマンスを発揮し、高い正確性を達成したことを示した。ただし、性別名詞を含むタスクの正確性は低下した。この不一致は、マークされた名詞を含むケースの複雑さが増すため、予想されることだよ。
性別名詞リライトの課題
性別名詞を含む文を翻訳する際に主な困難が生じる。これらのケースでは、使用される性別のある用語によって意味が変わることが多いので、適切な用語だけが修正されることを確保するのが重要なんだ。どの用語を変更できるかを誤って特定すると、出力にエラーが出るんだよ。
人間による正確性評価
翻訳の質をさらに確保するために、人間の評価を求めた。評価者は、リライトシステムがエラーを起こした出力を見て、名詞や代名詞が不適切に変更されたり見逃されたりしてないかを確認した。
一般的なエラーの種類
エラーは、一般的に余計な変更が行われた場合と、変更すべき性別のある用語が変更されなかった場合の2つのカテゴリで見つかったよ。
結論
GATE X-Eを使って、機械翻訳における性別バイアスを研究するための貴重なリソースを提供するよ。このデータセットは、性別のある言語の翻訳に関する複雑さを明らかにし、これらのバイアスを軽減するツールの開発と評価の手段を提供するんだ。私たちの希望は、これがさらなる研究を刺激し、様々な言語の翻訳におけるより平等な表現につながることなんだ。
将来的な研究では、性別リライトのためのオープンソースのモデルを使ってその効果を評価することが考えられる。私たちは、より包括的で公平な翻訳を作成するための会話を続けていくことを目指してるよ。
タイトル: GATE X-E : A Challenge Set for Gender-Fair Translations from Weakly-Gendered Languages
概要: Neural Machine Translation (NMT) continues to improve in quality and adoption, yet the inadvertent perpetuation of gender bias remains a significant concern. Despite numerous studies on gender bias in translations into English from weakly gendered-languages, there are no benchmarks for evaluating this phenomenon or for assessing mitigation strategies. To address this gap, we introduce GATE X-E, an extension to the GATE (Rarrick et al., 2023) corpus, that consists of human translations from Turkish, Hungarian, Finnish, and Persian into English. Each translation is accompanied by feminine, masculine, and neutral variants. The dataset, which contains between 1250 and 1850 instances for each of the four language pairs, features natural sentences with a wide range of sentence lengths and domains, challenging translation rewriters on various linguistic phenomena. Additionally, we present a translation gender rewriting solution built with GPT-4 and use GATE X-E to evaluate it. We open source our contributions to encourage further research on gender debiasing.
著者: Spencer Rarrick, Ranjita Naik, Sundar Poudel, Vishal Chowdhary
最終更新: 2024-02-21 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2402.14277
ソースPDF: https://arxiv.org/pdf/2402.14277
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。