NLP研究における宗教的テキストの倫理
この記事は、自然言語処理における宗教的テキストの倫理的な使用について話してるよ。
― 1 分で読む
宗教文書を自然言語処理(NLP)で使うことは、倫理や文化的配慮に関する大事な問題を引き起こすんだ。これらの文書は深く根付いた信念や価値観を反映してるから、技術での利用は慎重に考えなきゃいけない。この文章では、NLPにおける宗教文書の使用が持つ影響について、倫理的な懸念や尊重すべき実践の重要性に焦点を当てて話すよ。
データとしての宗教文書
聖書やコーランなどの宗教文書は、NLPの研究でよく使われるよ。これらの文書は多言語で手に入るから、研究者にとって貴重なリソースなんだ。ただ、ただのデータとして扱うと、多くのコミュニティにとっての聖なる意味を見落としちゃうかもしれない。NLPモデルがトレーニングデータにあるバイアスや誤解を再生産するリスクがあって、これらの文書が表すコミュニティに影響を与えちゃうんだ。
コンテキストの重要性
NLPで宗教文書を使うには、その文化的コンテキストを理解することが必要。これらの文書はただのリソースじゃなくて、多くの人の信念にとって大切な意味や歴史を持ってる。研究者は、宗教文書がデータ以上の目的を持つことを認識しなきゃ、たとえばコミュニティや精神的な実践を促すようなことをね。
翻訳の問題
翻訳は、NLPで宗教文書を使う時に重要な役割を果たすよ。元の言語のデータが少ない時、研究者は翻訳に頼ることが多いけど、その翻訳が本来の用途から転用されて、倫理的な問題を引き起こすこともある。研究者は、翻訳がどのように作られたのか、テキストの意味や目的が変わる可能性を考慮しなきゃ。
バイアスと代表性
宗教文書を使う時の一大懸念はバイアスの可能性。NLPモデルが文書にあるステレオタイプや文化的誤解を意図せず強化することがあるんだ。NLPのアプリケーションの効果は、キリスト教やイスラム教のような大きな宗教からのテキストに過剰に依存することによって歪むことがあるから、小さな宗教コミュニティを無視しちゃうかもしれない。研究で宗教文書を使う時、バランスと代表性を保つのが大事だよ。
倫理の役割
倫理的な配慮は、宗教文書を含むNLPプロジェクトの中心に置くべき。研究者は、自分の仕事の影響、特に宗教コミュニティへの影響について考えなきゃいけない。力のダイナミクスを理解することも重要だよ。研究者は、自分の立場や文化的背景を振り返る必要があって、この自己認識が宗教文書を使う際の複雑さを乗り越える助けになるかもしれない。
対話の価値
その文書が使われるコミュニティとのオープンダイアログを促すのが大事。研究者は宗教リーダーやコミュニティのメンバーから意見を求めて、彼らの聖なる文書の使用に対する視点を理解するようにすべき。これらのコミュニティとの関係を築くことで、信頼が育まれて研究が尊重されるし、責任を持って行われることが確保されるよ。
研究の多様性
研究コミュニティは、その代表性の向上を目指さなきゃいけない。異なる宗教的背景や文化を持つ人々の声を、彼らの文書の使用に関する議論に含めるべきだよ。この多様性は、NLP研究においてより包括的で思慮深いアプローチを生むことができる。研究者と宗教コミュニティのギャップを埋めることで、これらの文書の重要性を尊重する倫理的な実践ができるようになるんだ。
権力と周縁化
宗教文書の使用における権力ダイナミクスを認識することが重要だよ。しばしば、研究者やNLP技術の背後にいる組織が、彼らが使用する文書のコミュニティに対して重要な権力を持っている。こうした不均衡は、搾取や誤解を招くことがあるから、周縁化されたコミュニティの声を高めて、彼らの視点が研究で評価されるようにしなきゃ。
先住民の懸念
先住民コミュニティは、彼らの聖なる文書をNLPで使う時に独特の課題に直面してる。多くの先住民の言語が危機に瀕していて、彼らの文化的実践は主流の研究フレームワークに合わないかもしれない。先住民の文書を使うことの影響は、コミュニティの主権、文化的誠実さ、伝統の保存などの観点から理解されるべきだよ。先住民の声を取り入れることで、研究者はこうした複雑さを乗り越えて、倫理的な実践を促進できるかもしれない。
人権の観点
宗教文書をNLPで使うことは、人権についての懸念を引き起こす。多くの宗教文書は文化的権利と絡んでいて、それらの文化的意義を考えずに使うと、個人やコミュニティの権利を侵害することになるかもしれない。研究者はこれらの権利を意識して、研究が文書で表されるコミュニティを傷つけないように努める必要がある。
倫理的実践の推奨事項
宗教文書をNLPで倫理的に使うために、研究者は以下のガイドラインに従うべきだよ:
倫理的な議論に参加する:研究者は、宗教文書を使うことの倫理的な影響についての会話を優先すべき。議論は表面的な考慮を超えて、代表性や尊重の深い問題に取り組むべきだよ。
複数の倫理的フレームワークを考慮する:研究者は一つの倫理的視点だけに頼るべきじゃない。様々な倫理理論に関わることで、自分の仕事の影響をより包括的に理解できるかもしれない。
研究を文脈化する:宗教文書の文化的コンテキストを理解することが重要。研究者は、自分の仕事が関わるコミュニティの信念や実践を考慮する必要があるよ。
包括性を促進する:研究者は、自分の仕事に多様な声を含めるように積極的に努めるべき。これには、周縁化されたコミュニティの視点を聞いて、その懸念に敬意を持って関わることが含まれるよ。
懸念事項を記録する:研究者は、宗教文書に関する作業の中で起こった倫理的懸念を記録に残すべき。このドキュメントは、今後の研究を情報提供し、倫理的問題に先んじて対処するのに役立つんだ。
結論
宗教文書をNLPで使うことは、研究の機会を提供するけど、同時に大きな倫理的課題もある。これらの文書の神聖さやそれが生まれた文化的コンテキストを認めることが重要だよ。感受性と敬意を持ってこの仕事に取り組むことで、研究者は分野にポジティブに貢献し、関わるコミュニティに悪影響を与えることを避けられるんだ。だから、継続的な対話、批判的な反省、包括的なアプローチが、宗教文書を含むNLP研究の倫理的な環境を向上させることになるんだ。
タイトル: Modeling the Sacred: Considerations when Using Religious Texts in Natural Language Processing
概要: This position paper concerns the use of religious texts in Natural Language Processing (NLP), which is of special interest to the Ethics of NLP. Religious texts are expressions of culturally important values, and machine learned models have a propensity to reproduce cultural values encoded in their training data. Furthermore, translations of religious texts are frequently used by NLP researchers when language data is scarce. This repurposes the translations from their original uses and motivations, which often involve attracting new followers. This paper argues that NLP's use of such texts raises considerations that go beyond model biases, including data provenance, cultural contexts, and their use in proselytism. We argue for more consideration of researcher positionality, and of the perspectives of marginalized linguistic and religious communities.
著者: Ben Hutchinson
最終更新: 2024-06-24 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2404.14740
ソースPDF: https://arxiv.org/pdf/2404.14740
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://researchers.anu.edu.au/publications/146668
- https://infojustice.org/archives/45258
- https://walledculture.org/a-blatant-no-from-a-copyright-holder-stops-vital-linguistic-research-work-in-africa/#:~:text=Masakhane%20used%20a%20dataset%20known,be%20a%20hugely%20rich%20resource
- https://www.aclweb.org/portal/content/acl-code-ethics
- https://fpcc.ca/wp-content/uploads/2023/02/CodeOfConduct_Web.pdf
- https://www.alt.nsw.gov.au/assets/Uploads/downloads/files/ACIP-Working-with-Aboriginal-Language-Custodians-Guidelines-for-ethical-and-respectful-collaborations.pdf
- https://naacl.org/naacl-hlt-2019/calls/papers/
- https://acl2020.org/calls/papers/
- https://2021.emnlp.org/call-for-papers
- https://2020.emnlp.org/call-for-papers
- https://2021.aclweb.org/ethics/Ethics-FAQ/
- https://2021.naacl.org/ethics/faq/
- https://www.2022.aclweb.org/callpapers
- https://www.elpublishing.org/docs/6/01/LLS-Chapter-32-Rademaker.pdf
- https://www.google.com.au/books/edition/Of_Revelation_and_Revolution_Volume_1/M_RaDwAAQBAJ?hl=en&gbpv=1&dq=Comaroff,+Jean,+and+John+Comaroff.+1991.+Of+revelation+and+revolution,+volume+1:+Christianity,+colonialism+and+consciousness+in+South+Africa.+Chicago:+University+of+Chicago+Press.&printsec=frontcover
- https://firstmonday.org/ojs/index.php/fm/article/view/11833/10528
- https://www.facebook.com/100064391694545/posts/pfbid0WSbMh2KYcgvrCmbJ2NNrPi2VFTKKXndTgz8VewDZvaC2XtN6SZ5NKDiNJ47dHopxl/?mibextid=CDWPTG
- https://drive.google.com/file/d/1b2hEXERB7bwNDZPzpn5NdfD3v53_GWKR/view?resourcekey=0-WKM1exupSeps2Np5NwJpUw
- https://www.aies-conference.com/2020/wp-content/papers/051.pdf
- https://compass.onlinelibrary.wiley.com/doi/pdfdirect/10.1111/lnc3.12432