安全な市民対話のための声の匿名化
この研究は、匿名の声が市民の議論における共感と信頼にどんな影響を与えるかを調べてるよ。
Wonjune Kang, Margaret A. Hughes, Deb Roy
― 1 分で読む
目次
匿名性は、特に他人に判断されたり攻撃されたりすることを恐れずに自分を自由に表現できるコミュニティの議論において重要だよね。人々は、自分のアイデンティティが隠されているとき、思ったことを共有する方が安全だと感じることが多い。ただし、話し言葉の議論に関しては、声には個性があるから、誰かの声を匿名にするのは難しいんだ。
この研究は、人々が安心して自分のストーリーを共有できるように、会話の中で声を匿名化する方法を見つけることに焦点を当てているよ。市民対話を改善することが目標で、これはコミュニティの参加や民主的プロセスにとって重要なんだ。声のマスキングには、声の変換(VC)とテキスト読み上げ合成(TTS)の2つの主要な方法を調べたんだ。この研究では、これらの方法がリスナーの共感や信頼感にどのように影響するのか、また声が匿名化されたときにスピーカー自身が自分の声をどのように感じるのかを理解したかったんだ。
声の匿名化の重要性
市民の議論において声を持つことは重要だよ。私たちの声は感情や個人的な表現を伝えるから、コミュニケーションを大いに豊かにするんだ。人々がストーリーや体験を共有するとき、彼らの話し方が言葉以上のことを伝えることが多いんだ。ここで声の匿名化が関わってくる。これにより、個人は自分のアイデンティティを守りながら議論に参加できるから、敏感な話や個人的なストーリーを共有しやすくなるんだ。
匿名性は、異なる意見や支配的なナラティブに反する経験を持つ人々が発言しやすくすることがあるよ。自分のアイデンティティが守られていると知れば、物議を醸す話題についても安心して話せるようになるんだ。ただし、声の匿名性を保ちながら、スピーカーのメッセージの感情的な深さや個人的な感じを維持することが課題なんだ。
声の匿名化手法の探求
声の匿名化にはさまざまな方法があるけど、私たちは2つの具体的な技術に注目したよ。1つ目は声の変換(VC)で、これは元のメッセージを保持しつつ、他の人のように声を変えることだ。2つ目はテキスト読み上げ(TTS)で、これは話された言葉を合成音声に変換する方法だ。この方法では、完全にコンピューター生成の声が生まれ、元のスピーカーの声の特徴は残らないんだ。
私たちは、これらの匿名化手法がリスナーの認識にどのように影響するのか、特にストーリーテラーとのつながりを感じるか、そして彼らを信頼するかを理解したかったんだ。また、声が変えられた際にスピーカー自身が自分のストーリーをどのように感じるのかも調べたよ。
背景と文脈
最近、オンラインプラットフォームは市民の議論に参加するための人気のある方法になっているよ。これらのプラットフォームは、ユーザーが話し言葉を含むさまざまなメディアを通じて自分のストーリーを共有することを奨励しているんだ。多くのプラットフォームはユーザーが匿名のままでいることを許可するけど、スピーチには特定可能なマーカーが含まれていることがあるよ。
議論で匿名性を維持できることで、オープンさや誠実さを促進できるんだ。人々は物議を醸す意見を表明したり、個人的な経験を共有したりすることができるから、潜在的な影響を心配することはないよ。ただし、会話が強力なストーリーテリングを含む場合、誰かの声を聞くことで体験がテキストを読むよりも影響力を持つことが多いんだ。
匿名のままで人々に声を提供することで、私たちは市民対話のためのより包括的なプラットフォームを作りたいと思っているんだ。これにより、より多くのストーリーや経験が共有されることを奨励できるはずだよ。
研究デザイン
研究は2つの主要な研究に構成されていたよ。最初の研究では、私たちは市民対話ネットワークで共有されたストーリーを聴いたリスナーの視点に焦点を当てたんだ。目的は、匿名化がストーリーテラーへの共感や信頼感にどのように影響するのかを見てみることだったよ。リスナーの反応を、元の声、声変換された音声、そしてテキスト読み上げ音声の3つの異なる形式で提示されたストーリーで比較したんだ。
2つ目の研究では、ストーリーを共有したスピーカー自身の認識に焦点を当てたよ。市民対話でストーリーを共有した参加者は、自分の匿名化された声を聴いて、そのストーリーがどれだけ感情的な影響や意図されたメッセージの認識を持っていると思ったかを評価したんだ。
研究1:リスナーの視点
最初の研究では、匿名化された声からのストーリーをリスナーがどのように認識するのかを理解したかったんだ。さまざまなトピックにわたる様々なスピーカーが共有したストーリーのオーディオクリップを収集したよ。これらのストーリーは、声の変換とテキスト読み上げの方法を使って匿名化されたんだ。
参加者は、元の声、変換された声、または合成された声のストーリーのいずれかを聴いたんだ。そして、その音声が変更されたかどうかも伝えられたよ。これにより、声の変更の認識がストーリーテラーへの共感や信頼感にどのように影響するかを見られたんだ。
一連のアンケート質問を通じて、参加者はオーディオに対しての認識に基づいてストーリーテラーとのつながりを感じる程度を評価したよ。これには、伝えられた感情に対する共感やメッセージの信頼性も含まれていたんだ。
研究1の主要な発見
結果は、声の変換を使用したストーリーは元の声で語られたものとほぼ同様に認識されることを示したよ。リスナーは、声の変換を使用しているストーリーテラーに対して高い共感と信頼感を報告していた。一方、テキスト読み上げの声は、信頼感と共感の評価がかなり低かったんだ。
興味深いことに、リスナーが声が合成されたと知ったとき、彼らの認識は変わり、合成音声に対する評価が改善されることがよくあったんだ。これは、声を変更するために使われる技術に関する情報が、リスナーがストーリーそのものの内容にもっと焦点を当てることにつながるかもしれないことを示唆しているよ。
研究2:スピーカーの視点
2つ目の研究では、ストーリーを共有したスピーカーに焦点を当てたよ。参加者は自分の元のストーリーを聴いた後に、声の変換とテキスト読み上げの方法によって作成された匿名化されたバージョンを聴くように求められたんだ。彼らは自分のストーリーがどれだけオーセンティックで感情的な深さを持っているか、またアイデンティティがどれだけ隠されているかについての感情を評価したよ。
研究2の主要な発見
スピーカーからのフィードバックは、テキスト読み上げよりも声の変換を好む傾向が明確だったんだ。参加者は、声の変換の方が自分の感情がよりよく伝わると感じていて、自分のストーリーがオーセンティックだと認識されると信じていたんだ。どちらの匿名化方法も自分のアイデンティティを隠すことには成功したけど、スピーカーは声が変換された方が満足度が高かったんだ。
さらに、多くのスピーカーは、自分の声が匿名化されることで、より広い範囲の人々とストーリーを共有するのが楽になったと感じていたよ。匿名性は彼らに安全感を与え、普段避けていたかもしれない議論に参加することを促したんだ。
声の特性の役割
コミュニケーションにおいて、個人の声の品質は重要だよ。声は感情的なニュアンスを持っていて、テキストや合成音声では伝えられないものがあるからね。人間のスピーチにはトーン、リズム、イントネーションなどの要素が含まれていて、これらがメッセージの理解や感じ方に影響を与えるんだ。
プロソディー、つまり話し言葉のストレスやイントネーションのパターンは、感情がどのように伝えられるかに大きな役割を果たしているよ。声が変えられたり合成されたりすると、これらのプロソディーの特徴が失われることがあり、聴取経験があまり魅力的でなくなることがあるんだ。しかし、声の変換方法では、これらの特性を保つことができるから、リスナーがスピーカーの感情とより深くつながるのを助けることができるよ。
市民参加への影響
これらの研究からの発見は、市民参加やコミュニティの対話に貴重な意味を持っているんだ。効果的な声の匿名化手法を実装することで、個人が自分のストーリーを快適に共有できる、より包括的な空間を作ることができるんだ。
このアプローチは、アイデンティティ保護の課題に取り組みながら、話された物語の感情的な豊かさを保持することができるよ。コミュニティが市民参加を促進しようとする中で、自分の声を匿名で共有できるツールは、より深いつながりを育み、理解を促進し、意味のある議論を助けることができるんだ。
結論
要するに、私たちの研究は、市民対話ネットワークにおける声の匿名化の重要性を明らかにしているよ。声の変換技術を使うことで、ストーリーテリングの感情的なニュアンスを維持しつつ、スピーカーのアイデンティティを守ることができるんだ。これが、より多くの人々が自分の体験を共有し、公共の議論に参加し、民主的プロセスに貢献することを促すことになるんだ。
市民参加における匿名性は、単にアイデンティティを保護することだけじゃなく、個人が恐れずに自分を表現する自由を提供することでもあるよ。コミュニティの議論において豊かで声を持った参加を可能にすることで、民主的社会の基盤を強化し、より包括的な公共圏を作ることができるんだ。
今後、未来の研究では声の匿名化を強化し、市民の議論で使われる技術を改善する新しい方法を探求し続けることができるよ。コミュニケーションの風景が進化する中で、プライバシーを尊重しつつ革新を受け入れることが、市民参加の未来を形作るのに重要になるだろうね。
タイトル: Anonymization of Voices in Spaces for Civic Dialogue: Measuring Impact on Empathy, Trust, and Feeling Heard
概要: Anonymity is a powerful component of many participatory media platforms that can afford people greater freedom of expression and protection from external coercion and interference. However, it can be difficult to effectively implement on platforms that leverage spoken language due to distinct biomarkers present in the human voice. In this work, we explore the use of voice anonymization methods within the context of a technology-enhanced civic dialogue network based in the United States, whose purpose is to increase feelings of agency and being heard within civic processes. Specifically, we investigate the use of two different speech transformation and synthesis methods for anonymization: voice conversion (VC) and text-to-speech (TTS). Through a series of two studies, we examine the impact that each method has on 1) the empathy and trust that listeners feel towards a person sharing a personal story, and 2) a speaker's own perception of being heard, finding that voice conversion is an especially suitable method for our purposes. Our findings open up interesting potential research directions related to anonymous spoken discourse, as well as additional ways of engaging with voice-based civic technologies.
著者: Wonjune Kang, Margaret A. Hughes, Deb Roy
最終更新: 2024-08-25 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2408.13970
ソースPDF: https://arxiv.org/pdf/2408.13970
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。