Zugang zu kurzen Videos für blinde Zuschauer verbessern
Ein neues System hilft blinden Zuschauern, kurze Videos besser zu verstehen.
― 5 min Lesedauer
Inhaltsverzeichnis
Kurze Videos auf Plattformen wie TikTok, Instagram Reels und YouTube Shorts sind heutzutage ein grosser Teil davon, wie Menschen Informationen und Unterhaltung finden. Allerdings sind viele dieser Videos nicht freundlich gegenüber Zuschauern, die blind oder sehbehindert sind. Das liegt daran, dass diese Videos oft schnell die visuellen Elemente wechseln, Text auf dem Bildschirm haben und populäre Musik oder Audio verwenden, die nicht zu den Bildern passt. In Interviews mit sieben blinden und sehbehinderten Zuschauern, die regelmässig kurze Videos schauen, sagten viele, dass sie oft Videos überspringen, die sie schwer zu verstehen finden.
Um blinden und sehbehinderten Zuschauern zu helfen, haben wir ein System entwickelt, das unterschiedliche Beschreibungslevels für kurze Videos anbietet. Dieses System erlaubt es den Zuschauern zu wählen, wie viele Details sie möchten. In unseren Tests mit zehn blinden und sehbehinderten Teilnehmern berichteten die Nutzer unseres Systems von einem besseren Verständnis des Videoinhalts im Vergleich zu einer Standard-Videoplattform.
Das Problem mit kurzen Videos
Kurze Videos sind normalerweise zwischen 30 und 60 Sekunden lang. Sie ziehen oft mit schnellen Schnitten, Texteinblendungen und trendiger Musik die Aufmerksamkeit auf sich. Während diese Videos unterhaltsam sein können, lassen sie blinde und sehbehinderte Zuschauer oft aussen vor. Viele dieser Zuschauer sagten, sie müssten oft Inhalte überspringen, weil sie unzugänglich waren.
In früheren Studien schauten sich Forscher an, wie man Videos zugänglicher machen kann, indem man Audio-Beschreibungen hinzufügt. Diese Beschreibungen erklären visuelle Elemente in den Videos durch Erzählungen. Allerdings macht die schnelle Natur von kurzen Videos es schwierig, diese Audio-Beschreibungen einzufügen, ohne den Fluss des Videos zu stören.
Einige Videos haben diese audiovisuellen Lücken überhaupt nicht, was es schwierig macht, zu pausieren und eine Beschreibung zu geben, ohne das Seherlebnis zu unterbrechen. Richtlinien schlagen vor, längere Beschreibungen in Bildungsvideos zu verwenden, aber das kann das Erlebnis für Zuschauer von kurzen Videos verlangsamen und verwirren.
Forschung zu den Erfahrungen blinder und sehbehinderter Zuschauer
Unsere formative Studie bestand darin, mit blinden und sehbehinderten Zuschauern zu sprechen. Sie teilten ihre Erfahrungen beim Anschauen von kurzen Videos. Die meisten Zuschauer berichteten, dass sie frustriert sind, wenn sie auf Videos mit schlechtem Audio-Visuellen-Matching stossen. Sie wollten bessere Möglichkeiten, um zu wissen, ob ein Video ihre Zeit wert ist, bevor sie es ansehen.
Die Teilnehmer erwähnten häufig, dass sie entweder ein Video überspringen, Freunde um Hilfe bitten oder nach Beschreibungen in Online-Foren suchen würden, wenn sie ein Video als unzugänglich empfinden. Selbst wenn sie interessiert waren, wählten sie meistens, unzugängliche Inhalte ganz zu überspringen.
Einführung unseres Systems für bessere Zugänglichkeit
Um diese Probleme zu lösen, entwickelten wir ein System, das unterschiedliche Beschreibungslevels für kurze Videos bereitstellt. Dies soll blinden und sehbehinderten Zuschauern helfen, besser zu verstehen, worum es in dem Video geht, bevor sie entscheiden, ob sie es ansehen möchten.
Unser System zerlegt das Video zuerst in verschiedene Teile und nutzt moderne Technologie, um wichtige visuelle Details herauszufiltern. Es verwendet Audio-Transkription und optische Zeichenerkennung, um alle relevanten Informationen zu sammeln. Danach generiert es Beschreibungen auf drei Detaillevels - kurz, lang und detaillierte Schritt-für-Schritt-Beschreibungen.
Die kurze Beschreibung gibt einen schnellen Überblick, sodass die Zuschauer entscheiden können, ob sie die verfügbaren weiteren Details in den längeren Beschreibungen oder Schritt-für-Schritt-Analysen erkunden möchten.
Testen der Wirksamkeit des Systems
Um unser System zu bewerten, führten wir eine Studie mit zehn blinden und sehbehinderten Teilnehmern durch. Sie verglichen die Nutzung unseres Systems mit einer Standard-Videospieloberfläche. Teilnehmer, die unser System nutzten, erzielten bessere Ergebnisse beim Verständnis des Videoinhalts und mochten die unterschiedlichen bereitgestellten Beschreibungslevels.
Als sie gefragt wurden, äusserten die Teilnehmer, dass sie unser System in Zukunft weiterhin nutzen würden, da sie von einer verbesserten Videokomprension und der Leichtigkeit, die Videos auszuwählen, profitierten.
Einblicke aus der Studie
Die Studie zeigte, dass alle Beschreibungen für unterschiedliche Zwecke hilfreich waren. Die kurze Beschreibung war besonders nützlich, um schnell zu entscheiden, ob man das Video anschauen möchte. Die längeren Beschreibungen boten einen detaillierten Überblick, während die Schritt-für-Schritt-Beschreibungen einen genaueren Einblick gaben, was passiert.
Die Teilnehmer betonten, wie wichtig es war, mehrere Arten von Beschreibungen zu haben, damit sie die Menge an Informationen wählen konnten, die sie zu einem bestimmten Zeitpunkt wollten. Einige Teilnehmer mochten tiefere Details, während andere schnelle Zusammenfassungen bevorzugten.
Fazit und zukünftige Richtungen
Unsere Arbeit hebt die Notwendigkeit einer besseren Zugänglichkeit in kurzen Videos hervor. Wir fanden heraus, dass einfache Änderungen in der Präsentation von Informationen das Erlebnis für blinde und sehbehinderte Zuschauer erheblich verbessern können.
Unser System kann auch für andere Arten von Videos, wie längere Inhalte oder verschiedene Medienformate, angepasst werden. Die Hoffnung ist, dass mit der Weiterentwicklung sozialer Medien mehr Werkzeuge entwickelt werden, um ein integrativeres Seherlebnis für alle zu schaffen.
Wir erwarten, dass diese Forschung Inhaltsersteller ermutigt, ihr blindes und sehbehindertes Publikum zu berücksichtigen und Praktiken zu übernehmen, die die Zugänglichkeit ihrer Videos unterstützen. Die Weiterentwicklung dieser Konzepte wird dazu beitragen, Technologie zu nutzen, um ein besseres Seherlebnis für alle zu schaffen.
Titel: Making Short-Form Videos Accessible with Hierarchical Video Summaries
Zusammenfassung: Short videos on platforms such as TikTok, Instagram Reels, and YouTube Shorts (i.e. short-form videos) have become a primary source of information and entertainment. Many short-form videos are inaccessible to blind and low vision (BLV) viewers due to their rapid visual changes, on-screen text, and music or meme-audio overlays. In our formative study, 7 BLV viewers who regularly watched short-form videos reported frequently skipping such inaccessible content. We present ShortScribe, a system that provides hierarchical visual summaries of short-form videos at three levels of detail to support BLV viewers in selecting and understanding short-form videos. ShortScribe allows BLV users to navigate between video descriptions based on their level of interest. To evaluate ShortScribe, we assessed description accuracy and conducted a user study with 10 BLV participants comparing ShortScribe to a baseline interface. When using ShortScribe, participants reported higher comprehension and provided more accurate summaries of video content.
Autoren: Tess Van Daele, Akhil Iyer, Yuning Zhang, Jalyn C. Derry, Mina Huh, Amy Pavel
Letzte Aktualisierung: 2024-02-15 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2402.10382
Quell-PDF: https://arxiv.org/pdf/2402.10382
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.