盲目の視聴者向けのショートビデオへのアクセス改善
新しいシステムが視覚障害者が短い動画をもっと理解できるように手助けしてるよ。
― 1 分で読む
短い動画はTikTokやInstagram Reels、YouTube Shortsみたいなプラットフォームで、今の人が情報やエンタメを見つける大事な部分になってるよ。でも、これらの動画は視覚障害のある人に優しくないことが多いんだ。視覚が見えにくい人にとって、映像が急に変わったり、画面にテキストが出たり、映像に合わない流行りの音楽や音声が使われてることが多いから。7人の視覚障害者に聞いたところ、理解しにくい動画はスキップすることが多いって言ってたよ。
視覚障害者や視力が低い人を助けるために、短い動画に対して異なるレベルの説明をするシステムを作ったんだ。このシステムは、視聴者がどれくらいの詳細さを選べるようになってる。10人の視覚障害者を使ったテストでは、私たちのシステムを使った人たちは、普通の動画プラットフォームを使ったときよりも動画の内容を理解しやすいって報告してたよ。
短い動画の問題
短い動画はだいたい30~60秒くらいの長さなんだ。素早いカットやテキストオーバーレイ、トレンドの音楽で注意を引くことが多いけど、視覚障害のある人には置いてけぼりになることも多い。これらの視聴者の多くは、アクセスしにくいからコンテンツをスキップせざるを得ないって言ってた。
以前の研究では、映像をナレーションで説明する音声解説を追加することで、動画をもっとアクセスしやすくする方法を探ってた。でも、短い動画の素早い展開だと、音声解説を入れるのが難しくて、動画の流れが崩れちゃうんだ。
音声解説がまったくない動画もあって、説明を入れるために一時停止するのも観る体験を妨げることがある。教育用の動画には長めの説明を使うことが推奨されてるけど、これが短い動画の視聴体験を遅くしたり、混乱させたりすることもあるんだ。
視覚障害者や視力が低い人の体験に関する研究
私たちの初期調査では、視覚障害のある人に短い動画を観る体験を聞いたよ。ほとんどの視聴者は、音声と映像がうまく合ってない動画に出会うと、イライラするって言ってた。動画を見る前に、その動画が時間に見合うかどうかを知るためのより良い方法を求めてたんだ。
参加者たちは、動画がアクセスできなかったときはスキップしたり、友達に助けを求めたり、オンラインフォーラムで説明を探したりしてた。興味があっても、アクセスできないコンテンツはほとんどスキップする選択をしてたよ。
より良いアクセスのためのシステム導入
これらの問題に対処するために、短い動画に異なるレベルの説明を提供するシステムを開発したんだ。これは、視覚障害者や視力が低い人が動画を見る前に内容を理解しやすくするためのもの。
私たちのシステムはまず、動画をいくつかの部分に分けて、重要な視覚的詳細を選び出すために先進技術を使うんだ。音声のテキスト化や光学式文字認識を使って、関連情報を集める。これによって、3つの詳細レベル-短い、長い、そしてシーンごとの詳細説明を生成するよ。
短い説明は簡単な概要を提供して、視聴者が長い説明やシーンごとの詳細をもっと見たいかどうかを決める手助けをするんだ。
システムの効果をテスト
私たちのシステムを評価するために、10人の視覚障害者を対象にした研究を行ったよ。彼らは私たちのシステムと普通の動画インターフェースを比較した。私たちのシステムを使った参加者は、動画の内容を理解するスコアが良くて、提供された異なる説明レベルが気に入ってた。
尋ねられたとき、参加者たちは今後も私たちのシステムを使い続けるつもりだと答えて、動画の理解が向上したり、どの動画を見るか選びやすくなったことを挙げてたよ。
研究からの洞察
この研究で、すべての説明が異なる目的に役立ってることがわかった。短い説明は動画を見るかどうかをすぐに決めるのに特に役立ち、長い説明は詳細な概要を提供して、シーンごとの説明は何が起こっているかをより詳しく見せてくれるんだ。
参加者たちは、複数の種類の説明があることで、その時々に欲しい情報の量を選べるのが大事だと強調してた。一部の参加者は深い詳細が好きで、他の人は素早く要約されるのが好みだったよ。
結論と今後の方向性
私たちの活動は、短い動画のアクセス向上の必要性を強調してる。情報の提示方法を少し変えるだけで、視覚障害者や視力が低い人の体験が大きく改善されることがわかったんだ。
私たちのシステムは、長いコンテンツや異なるメディアフォーマットにも適用できるようにできる。SNSが進化する中で、みんなにもっと包括的な視聴体験を提供するためのツールがもっと開発されることを願ってるよ。
この研究がコンテンツクリエイターに、視覚障害者や視力が低い視聴者のことを考えさせて、動画のアクセシビリティをサポートするような方法を取り入れるきっかけになることを期待してる。これらの概念を拡張することで、みんなにとってより良い視聴体験を生み出すために技術を活用できる助けになると思う。
タイトル: Making Short-Form Videos Accessible with Hierarchical Video Summaries
概要: Short videos on platforms such as TikTok, Instagram Reels, and YouTube Shorts (i.e. short-form videos) have become a primary source of information and entertainment. Many short-form videos are inaccessible to blind and low vision (BLV) viewers due to their rapid visual changes, on-screen text, and music or meme-audio overlays. In our formative study, 7 BLV viewers who regularly watched short-form videos reported frequently skipping such inaccessible content. We present ShortScribe, a system that provides hierarchical visual summaries of short-form videos at three levels of detail to support BLV viewers in selecting and understanding short-form videos. ShortScribe allows BLV users to navigate between video descriptions based on their level of interest. To evaluate ShortScribe, we assessed description accuracy and conducted a user study with 10 BLV participants comparing ShortScribe to a baseline interface. When using ShortScribe, participants reported higher comprehension and provided more accurate summaries of video content.
著者: Tess Van Daele, Akhil Iyer, Yuning Zhang, Jalyn C. Derry, Mina Huh, Amy Pavel
最終更新: 2024-02-15 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2402.10382
ソースPDF: https://arxiv.org/pdf/2402.10382
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。