Migliorare l'accesso ai video brevi per gli spettatori non vedenti
Un nuovo sistema aiuta i telespettatori non vedenti a capire meglio i video brevi.
― 5 leggere min
Indice
I Video Brevi su piattaforme come TikTok, Instagram Reels e YouTube Shorts sono un grande modo in cui la gente trova info e intrattenimento oggi. Però, molti di questi video non sono friendly per chi è cieco o ha problemi di vista. Questo succede perché spesso cambiano le immagini velocemente, hanno testo sullo schermo e usano musica o audio popolari che non si abbinano alle immagini. In interviste con sette persone cieche e con bassa visione che guardano regolarmente video brevi, molti hanno detto che spesso saltano video che trovano difficili da capire.
Per aiutare chi è cieco e ha problemi di vista, abbiamo creato un sistema che fornisce diversi livelli di descrizione per i video brevi. Questo sistema permette agli spettatori di scegliere quanto dettaglio vogliono. Nei nostri test con dieci partecipanti ciechi e con bassa visione, quelli che usavano il nostro sistema hanno riportato una migliore comprensione del contenuto rispetto a una piattaforma video standard.
Il Problema dei Video Brevi
I video brevi sono solitamente lunghi tra i 30 e i 60 secondi. Spesso catturano l'attenzione con tagli rapidi, sovrapposizioni di testo e musica trendy. Anche se questi video possono essere divertenti, lasciano fuori chi è cieco e ha problemi di vista. Molti di questi spettatori hanno detto che spesso devono saltare contenuti perché sono inaccessibili.
In studi precedenti, i ricercatori hanno cercato modi per rendere i video più accessibili aggiungendo Descrizioni Audio. Queste descrizioni spiegano gli elementi visivi nei video tramite narrazione. Tuttavia, la natura veloce dei video brevi rende difficile inserire queste descrizioni audio senza interrompere il flusso del video.
Alcuni video mancano completamente di queste pause audio, rendendo difficile fermarsi per la descrizione senza interrompere l'esperienza di visione. Le linee guida suggeriscono di usare descrizioni più lunghe nei video educativi, ma questo può rallentare e confondere l'esperienza per gli spettatori di video brevi.
Ricerca sulle Esperienze di Spettatori Ciechi e con Bassa Visione
Il nostro studio formativo ha coinvolto conversazioni con spettatori ciechi e con bassa visione. Hanno condiviso le loro esperienze nel guardare video brevi. La maggior parte degli spettatori ha riportato che quando si imbattono in video con una scarsa corrispondenza audio-visiva, si sentono frustrati. Volevano modi migliori per sapere se un video sarebbe stato interessante prima di guardarlo.
I partecipanti hanno frequentemente menzionato che avrebbero saltato un video, chiesto aiuto agli amici o cercato descrizioni in forum online quando trovavano un video inaccessibile. Anche quando erano interessati, spesso sceglievano di saltare contenuti inaccessibili del tutto.
Presentazione del Nostro Sistema per una Maggiore Accessibilità
Per affrontare questi problemi, abbiamo sviluppato un sistema che fornisce diversi livelli di descrizioni per i video brevi. Questo è pensato per aiutare chi è cieco e ha problemi di vista a capire meglio di cosa parla il video prima di decidere se guardarlo.
Il nostro sistema prima scompone il video in parti distinte e usa tecnologia avanzata per evidenziare dettagli visivi importanti. Utilizza trascrizione audio e riconoscimento ottico dei caratteri per raccogliere tutte le informazioni rilevanti. Dopo, genera descrizioni a tre livelli di dettaglio: breve, lunga e descrizioni dettagliate scatto per scatto.
La descrizione breve offre una panoramica rapida, lasciando agli spettatori decidere se vogliono esplorare ulteriori dettagli disponibili nelle descrizioni più lunghe o nei breakdown scatto per scatto.
Test dell'Efficacia del Sistema
Per valutare il nostro sistema, abbiamo condotto uno studio con dieci partecipanti ciechi e con bassa visione. Hanno confrontato l'uso del nostro sistema con un'interfaccia video standard. I partecipanti che usavano il nostro sistema hanno riportato una migliore comprensione del Contenuto Video e hanno apprezzato i diversi livelli di descrizione forniti.
Quando gli è stato chiesto, i partecipanti hanno espresso che continuerebbero a usare il nostro sistema in futuro, citando una migliore comprensione dei video e la facilità di scegliere quali video guardare.
Risultati dello Studio
Lo studio ha rivelato che tutte le descrizioni erano utili per scopi diversi. La descrizione breve è stata particolarmente utile per decidere rapidamente se guardare il video. Le descrizioni più lunghe offrivano una panoramica dettagliata, mentre le descrizioni scatto per scatto davano uno sguardo più granulare a cosa stava succedendo.
I partecipanti hanno sottolineato come avere più tipi di descrizioni permettesse loro di scegliere la quantità di informazioni che volevano in un dato momento. Alcuni partecipanti hanno gradito avere dettagli approfonditi mentre altri preferivano riassunti rapidi.
Conclusioni e Direzioni Future
Il nostro lavoro evidenzia la necessità di una maggiore accessibilità nei video brevi. Abbiamo scoperto che semplici cambiamenti nel modo in cui le informazioni vengono presentate possono migliorare significativamente l'esperienza per chi è cieco e ha problemi di vista.
Il nostro sistema può essere adattato per altri tipi di video, come contenuti più lunghi o diversi formati multimediali. La speranza è che mentre i social media si evolvono, possano essere sviluppati più strumenti per creare un'esperienza di visione più inclusiva per tutti.
Ci aspettiamo che questa ricerca incoraggi i creatori di contenuti a considerare il loro pubblico cieco e con bassa visione e ad adottare pratiche che supportino l'accessibilità nei loro video. Espandere questi concetti aiuterà a sfruttare la tecnologia per creare un'esperienza di visione migliore per tutti.
Titolo: Making Short-Form Videos Accessible with Hierarchical Video Summaries
Estratto: Short videos on platforms such as TikTok, Instagram Reels, and YouTube Shorts (i.e. short-form videos) have become a primary source of information and entertainment. Many short-form videos are inaccessible to blind and low vision (BLV) viewers due to their rapid visual changes, on-screen text, and music or meme-audio overlays. In our formative study, 7 BLV viewers who regularly watched short-form videos reported frequently skipping such inaccessible content. We present ShortScribe, a system that provides hierarchical visual summaries of short-form videos at three levels of detail to support BLV viewers in selecting and understanding short-form videos. ShortScribe allows BLV users to navigate between video descriptions based on their level of interest. To evaluate ShortScribe, we assessed description accuracy and conducted a user study with 10 BLV participants comparing ShortScribe to a baseline interface. When using ShortScribe, participants reported higher comprehension and provided more accurate summaries of video content.
Autori: Tess Van Daele, Akhil Iyer, Yuning Zhang, Jalyn C. Derry, Mina Huh, Amy Pavel
Ultimo aggiornamento: 2024-02-15 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2402.10382
Fonte PDF: https://arxiv.org/pdf/2402.10382
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.