Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 社会と情報ネットワーク

性別アイデンティティがオンラインでのやりとりに与える影響

この記事では、ノンバイナリーのユーザーがソーシャルメディアをどのように異なる視点で体験しているかを調べる。

― 1 分で読む


オンラインでのジェンダーアオンラインでのジェンダーアイデンティティの考察な課題に直面してるよ。ノンバイナリーのユーザーは、SNSで独特
目次

多くのノンバイナリーの人たちはソーシャルネットワークで活発に参加してるけど、ジェンダーがオンラインのやり取りにどう影響するかはまだ完全には理解されてないんだ。この不明瞭さが、大きな言語モデルによる不公平な扱いにつながることもある。この記事では、特にTwitterでの個人のアイデンティティがどのように表現されているか、代名詞の使い方を通じて見ていくよ。私たちの調査結果によると、ノンバイナリーのユーザーは「いいね」やフォロワーの点であまり注目されていないことが多いんだ。

さらに、ノンバイナリーのユーザーはバイナリーのユーザーよりも、より毒性のあるツイートを送ったり受け取ったりすることが多いことも分かった。この研究は、ジェンダーを二つのカテゴリーではなく、スペクトルとして見る必要があることを強調してるんだ。オンラインのやり取りや表現を理解するためにはこれが重要なんだよ。

アイデンティティは、人が自分を表現したり社会的に交流したりする際に大きな役割を果たしてる。年齢や人種、社会的地位などがアイデンティティを形作るよね。ソーシャルインタラクションがオンラインに移ってきたことで、これらの影響がSNSでより明らかになってきたんだ。

最近、ジェンダーの考え方は「男性」と「女性」の厳格なバイナリ分類から、スペクトルを認識する広い見方に変わってきた。これは、ハラスメントや差別、社会的孤立のリスクが高いLGBTQ+などのジェンダー少数派にとって特に重要だよ。多くのLGBTQ+の若者が今、オンラインコミュニティでより目立つようになってるけど、彼らの投稿がどのように受け取られているかはあまり詳しく研究されてないんだ。

オンラインでのジェンダーアイデンティティを理解するために、ユーザーがSNSプロフィールで選ぶ代名詞に注目するよ。これらの代名詞は、伝統的なバイナリーのもの(「彼」「彼女」)やノンバイナリーの選択肢(「彼ら」「彼女/ゼ」など)で構成されてる。私たちは、オンラインでのジェンダーアイデンティティの多様性を示すために、メンバーが最も多い8つの代名詞グループを分析するよ。

私たちの研究は、ジェンダーアイデンティティがオンラインでの表現ややり取りにどう影響するかを探るもので、投稿や返信の言語の毒性を評価するために高度なツールを使用してる。主に二つの質問に答えることを目指してる:

  1. どのような注目を異なるジェンダーグループは他者から受けているのか?
  2. ノンバイナリーのユーザーはバイナリーのユーザーよりもネガティブな返信を受けることが多いのか?

私たちの分析結果は、バイナリーとノンバイナリーのグループがオンラインでアクティブである一方で、受け取る注意の量やメッセージの毒性レベル、罵倒の頻度が異なることを示している。私たちは、ジェンダー表現をスペクトルとして扱う重要性を強調することで、オンラインスペースにおけるジェンダーの公平性を分析する改善方法に貢献したいと思ってる。

関連する概念

ジェンダーとアイデンティティ

アイデンティティは、社会科学者が個人が自分をどう見て、他者とどう交流するかを説明するために使う言葉で、ジェンダーはこのアイデンティティの重要な部分だよ。フェミニスト運動からインスパイアを受けて、人々は生物学的な性と文化によって形作られるジェンダーを区別し始めた。この区別は、伝統的なバイナリの視点とノンバイナリーの人々の実体験の間のギャップに対処するのに役立つんだ。

この違いが認識されるようになってきたにもかかわらず、まだ多くの機械学習システムはジェンダーをバイナリーとして扱っている。たとえば、あるシステムは名前や手書き、声で人のジェンダーを判断しようとするけど、これらのシステムはジェンダーアイデンティティの全範囲を考慮してないかも。Metaのような企業は、ユーザーが定義したジェンダーを生まれたときに割り当てられた性に戻す調整をしていて、ジェンダークィアのアイデンティティに対する無視のパターンが続いてる。

Twitterのプロフィールは、人々がどのようにアイデンティティや文化の変化を表現するかを追跡するために使われてる。以前の研究では、「Longitudinal Online Profile Sampling(LOPS)」という手法を使って、135万人のTwitterユーザーのプロフィールが5年間でどのように変わったかを見てみた。この方法では、「彼」「彼女」といった最も一般的な用語がプロフィールで使われていることが分かった。この手法は個人が自分のアイデンティティをどう表現するかを強調してる。

有害性の検出

有害な発言には、侮辱、脅迫、ハラスメント、特定のグループに対するヘイトスピーチが含まれ、こうした発言はオンラインコミュニティを毒すことがある。この問題に対処するために、研究者は有害性を検出するツールを作った。広く使われているツールの一つが「Perspective API」で、これは異なる種類の害にラベル付けされたソーシャルメディアの投稿に基づいてトレーニングされている。しかし、このAPIはバイアスを示し、特定の人種やジェンダーグループに対してより高い有害性スコアを記録しているんだ。

このバイアスを減らすために「Detoxify API」が開発され、有害な発言を特定のアイデンティティに向けられたものに焦点を当ててる。私たちは、このツールを使って異なるジェンダーアイデンティティグループの投稿や、彼らに向けられたコンテンツの有害性を評価するよ。

この研究のデータは、2020年1月21日から2021年11月5日まで収集されたCovid-19パンデミックに関連する20億以上のツイートから得たものだよ。この期間中、多くのTwitterユーザーがCovid-19についてツイートしたため、アクティブなユーザーの広範なサンプルが得られた。私たちのデータセットには、自分のプロフィールに代名詞を記載した200万人以上のユーザーのツイートが含まれてる。

ジェンダースペクトル

女性であることなどのジェンダーアイデンティティは、「彼女」や「彼ら」といった使用する代名詞とは異なる。この文脈では、ジェンダー表現をその人のジェンダーに関連するアイデンティティとして捉え、割り当てられたラベルではないと指してる。ノンバイナリーとは、男性または女性のカテゴリに当てはまらないすべての人を指すよ。

ジェンダーに基づく違いを理解するために、私たちはユーザーを使用する代名詞によって分類して、これらは概算的な測定値であることを認識する。代名詞を「彼女」「彼女の」「彼」「彼の」「彼ら」「彼らの」「ゼ」や「ゼム」にグループ分けしてる。この代名詞のためのコーディングシステムを作って、200万人のユーザーからデータを収集するよ。

私たちは、メンバーが1,000人以上のグループを分析し、各グループから最大600人をランダムに選ぶ。この結果、350人以上のメンバーを持つ8つの代名詞グループができる。

返信の収集

私たちは、各代名詞グループから100人のユーザーをサンプリングして、彼らのオリジナルツイートに対する最大10件の返信を収集する。この結果、29,537のユニークな会話から95,381件の返信が得られた。返信の数が限られているのは、Twitter APIアクセスの制約によるものだよ。

有害性の推論

有害性を評価するために、私たちは多様なデータセットで訓練された特定のDetoxifyモデルを用いる。このモデルは高い精度スコアを持ってる。

結果

ユーザーのアクティビティと注意

ユーザーのアクティビティは、Twitterでのエンゲージメント度を指し、オリジナルツイートの数、いいねの数、フォローしているアカウントの数が含まれるよ。全体として、バイナリーとノンバイナリーのユーザーのアクティビティレベルはかなり似ていて、わずかな違いしかない。

また、ユーザーが受ける注意についても調査し、平均いいね、リツイート、フォロワーで測定してる。私たちの結果は、表現が少ない代名詞グループがあまり注目を受けない傾向があることを示してる。

「彼」「彼女」といった大きなグループは、「彼ら」「ゼ」や「彼」「彼ら」「ゼ」などの小さなグループよりも、より多くの交流を受けることが多い。これは、さまざまなグループが受け取る平均のいいねやリツイート数を比較すると明らかだよ。

ツイートと返信の毒性

私たちは、ユーザーが送るツイートと彼らが受け取る返信の毒性を調べる。一般的に、すべてのグループが発信するツイートの中の少数が非常に有害だって分かった。興味深いことに、8つの代名詞グループのうち5つは、送信したツイートよりもより多くの毒性のある返信を受け取っている。「彼」と「彼/彼ら」グループは、特に高い毒性スコアを示してる。

ノンバイナリーのグループは、バイナリーのグループに比べてより毒性のあるツイートを投稿することが多いが、意外にも彼らはあまり罵倒を使わない傾向がある。これは、使用される毒性検出ツールには潜在的なバイアスがあることを示唆している。

全体的に、私たちの結果は、ノンバイナリーのツイートがより厳しく評価され、毒性としてフラグを立てられることが多いことを示している。罵倒の存在と与えられた毒性スコアとの間に直接の関連は見られないようだ。

結論

要するに、私たちの分析は、活動、注意、感情、毒性などの側面を見ながら、8つの代名詞グループのオンライン行動を明らかにしている。私たちは、Twitterでのプレゼンスが少ないノンバイナリーグループが、大きなグループよりも少ないエンゲージメントを受けることを見つけた。

彼らはバイナリーのグループと同じくらいアクティブであるにもかかわらず、ツイートにおける毒性の報告が高い。この研究は、ソーシャルメディアのツールがクィアコミュニティで使われる言語を誤解している可能性がある深い問題を示唆している。今後は、毒性検出器が異なるジェンダー表現とどう相互作用するかをより詳しく調査することが貴重な洞察を提供するかもしれない。

私たちは、この研究の限られた範囲、つまり特定の代名詞を持つTwitterユーザーだけに焦点を当て、単一のイベント(Covid-19)のデータを調べていることを認めている。将来の研究では、より広いデータ範囲を含め、ノンバイナリーの個人の行動をさらに調査することが期待されるよ。

著者たちからもっと読む

類似の記事