Valutare la qualità nei video stereoscopici
Esplorare le valutazioni di qualità per i video 3D influenzati da fattori ambientali.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya
― 5 leggere min
Indice
- Tipi di Valutazioni della Qualità
- Valutazione soggettiva
- Valutazione Oggettiva
- La Sfida dei Video Stereoscopici
- L'Importanza dei Modelli di Valutazione della Qualità
- Creare un Dataset di Video Stereoscopici
- Condurre uno Studio Soggettivo
- Tecniche di Valutazione della Qualità
- Generare Fotogrammi Cyclopei
- Analisi delle Statistiche delle Scene Naturali
- Utilizzare Modelli Statistici
- Risultati dello Studio
- Conclusione
- Fonte originale
Con il mondo che diventa sempre più affollato di auto e traffico, il numero di incidenti è in aumento. È una realtà dura che circa 1,3 milioni di persone perdono la vita in incidenti stradali ogni anno a causa di vari fattori. Tra questi, una causa principale è la scarsa visibilità dovuta a condizioni climatiche come nebbia, foschia, pioggia e neve. Questi sono problemi che non possiamo controllare.
Per affrontare questo problema, si stanno sviluppando tecnologie e sistemi noti come Sistemi Avanzati di Assistenza alla Guida (ADAS). Questi sistemi mirano a imitare come gli esseri umani vedono e reagiscono al mondo attraverso i nostri occhi. Fusiando la vista da sinistra e destra, possiamo ottenere una percezione di profondità, che porta a un'esperienza di visione migliore. Questo tipo di tecnologia può migliorare significativamente la sicurezza per i conducenti.
Tuttavia, creare video 3D di alta qualità può essere complicato. Abbiamo bisogno di telecamere ad alta risoluzione, ampio spazio di archiviazione e trasferimenti dati ad alta velocità. Sfortunatamente, errori nella cattura o nella visualizzazione possono ridurre l'esperienza complessiva di visione. Ecco perché è fondamentale sviluppare modelli di Valutazione della qualità per giudicare la qualità di questi video.
Tipi di Valutazioni della Qualità
I metodi di valutazione della qualità possono essere classificati in due categorie: soggettivi e oggettivi.
Valutazione soggettiva
Qui, persone reali guardano e valutano la qualità di un video. Anche se è preciso, questo metodo è piuttosto dispendioso in termini di tempo. È vitale perché, alla fine, creiamo video per gli spettatori e le loro opinioni sono punti di riferimento cruciali.
Valutazione Oggettiva
Questo metodo fornisce previsioni automatizzate sulla qualità di un video, di solito basate su algoritmi che imitano le valutazioni umane. Le valutazioni oggettive possono essere ulteriormente classificate in tre tipi:
- Full Reference (FR): Richiede il video originale per il confronto.
- Reduced Reference (RR): Ha bisogno di alcune informazioni dal video originale.
- No Reference (NR): Non ha bisogno di alcun riferimento originale per giudicare la qualità.
La Sfida dei Video Stereoscopici
I video stereoscopici (quelli che offrono un effetto 3D) presentano le proprie sfide. Fuse informazioni di profondità con immagini standard, portano a un'esperienza di qualità migliorata (QoE) per lo spettatore. Tuttavia, produrre questi video 3D richiede requisiti vitali, come attrezzature di alta qualità e condizioni di visione adeguate.
A volte, il processo di codifica o decodifica può portare a errori, influenzando successivamente l'esperienza di visione. Questo evidenzia la necessità di avere modelli di valutazione della qualità affidabili per i contenuti stereoscopici.
L'Importanza dei Modelli di Valutazione della Qualità
Mentre i modelli di valutazione della qualità 2D sono ampiamente disponibili, il campo della valutazione della qualità dei video 3D è ancora in fase di sviluppo. Molti ricercatori stanno lavorando per migliorare il modo in cui misuriamo la qualità video, ma c'è ancora spazio per la crescita, specialmente considerando fattori specifici ai contenuti stereoscopici.
Questo articolo mira a esaminare sia i metodi di valutazione della qualità soggettiva che oggettiva per i video stereoscopici, concentrandosi su come fattori ambientali come nebbia e foschia influenzano l'esperienza degli spettatori.
Creare un Dataset di Video Stereoscopici
Una parte chiave di questa ricerca è stata lo sviluppo di un dataset contenente vari livelli di distorsione da nebbia e foschia. Per ottenere ciò, abbiamo prodotto 12 video stereoscopici impeccabili e un incredibile numero di 360 versioni distorte. Questi video imitano problemi di visibilità del mondo reale per capire come influenzano la percezione degli spettatori.
Per costruire il nostro dataset, abbiamo selezionato alcuni video di alta qualità e li abbiamo sottoposti a diversi livelli di nebbia e foschia. Questo ci ha permesso di analizzare come queste distorsioni impattano la qualità dei video.
Condurre uno Studio Soggettivo
Successivamente, avevamo bisogno di valutare la qualità dei video che avevamo creato. Abbiamo condotto uno studio in cui 24 partecipanti hanno guardato i nostri video e li hanno valutati. Sono stati invitati a dare un punteggio ai video da 'Scarso' a 'Eccellente' in base alle loro percezioni.
Questa analisi soggettiva è importante perché ci fornisce intuizioni direttamente dagli spettatori, aiutandoci a capire cosa rende un'esperienza di visione di qualità.
Tecniche di Valutazione della Qualità
Per analizzare la qualità in modo più obiettivo, abbiamo proposto un modello che non ha bisogno di alcun video originale per il confronto. Questo modello elabora i dati raccolti utilizzando vari metodi per valutare la qualità dei contenuti stereoscopici.
Generare Fotogrammi Cyclopei
Una tecnica furba consiste nel creare quelli che si chiamano fotogrammi cyclopei. Questi fotogrammi combinano le viste di sinistra e destra in un'unica immagine. Valutando queste immagini combinate, possiamo ottenere informazioni sulla qualità dei video 3D.
Analisi delle Statistiche delle Scene Naturali
Successivamente, analizziamo le caratteristiche presenti nelle scene naturali di questi video. Esaminando varie caratteristiche del video su più scale, possiamo capire meglio come le distorsioni impattano la qualità percepita.
Utilizzare Modelli Statistici
Applichiamo modelli statistici per valutare la relazione tra i video impeccabili e quelli distorti. Questo ci aiuta a distinguere le differenze e a determinare quanto è cambiata la qualità.
Risultati dello Studio
Dopo aver eseguito le nostre valutazioni, abbiamo trovato risultati interessanti. Il modello proposto ha funzionato costantemente bene su vari dataset, anche rispetto ad altri metodi di valutazione della qualità consolidati. Questo suggerisce che il nostro approccio potrebbe fornire uno strumento prezioso per valutare la qualità dei video stereoscopici.
Conclusione
In conclusione, mentre la tecnologia video evolve, la necessità di una valutazione della qualità efficace diventa sempre più critica. La combinazione di metodi soggettivi e oggettivi migliora la nostra comprensione della qualità video, in particolare per i contenuti stereoscopici.
Creando un dataset che simula problemi di visibilità e sviluppando modelli di valutazione, speriamo di contribuire a migliorare la qualità delle esperienze di visione in futuro.
La vita non è solo vedere in due dimensioni. Facciamola diventare 3D!
Titolo: Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions
Estratto: We present two major contributions in this work: 1) we create a full HD resolution stereoscopic (S3D) video dataset comprised of 12 reference and 360 distorted videos. The test stimuli are produced by simulating the five levels of fog and haze ambiances on the pristine left and right video sequences. We perform subjective analysis on the created video dataset with 24 viewers and compute Difference Mean Opinion Scores (DMOS) as quality representative of the dataset, 2) an Opinion Unaware (OU) and Distortion Unaware (DU) video quality assessment model is developed for S3D videos. We construct cyclopean frames from the individual views of an S3D video and partition them into nonoverlapping blocks. We analyze the Natural Scene Statistics (NSS) of all patches of pristine and test videos, and empirically model the NSS features with Univariate Generalized Gaussian Distribution (UGGD). We compute UGGD model parameters ({\alpha}, \b{eta}) at multiple spatial scales and multiple orientations of spherical steerable pyramid decomposition and show that the UGGD parameters are distortion discriminable. Further, we perform Multivariate Gaussian (MVG) modeling on the pristine and distorted video feature sets and compute the corresponding mean vectors and covariance matrices of MVG fits. We compute the Bhattacharyya distance measure between mean vectors and covariance matrices to estimate the perceptual deviation of a test video from pristine video set. Finally, we pool both distance measures to estimate the overall quality score of an S3D video. The performance of the proposed objective algorithm is verified on the popular S3D video datasets such as IRCCYN, LFOVIAS3DPh1, LFOVIAS3DPh2 and the proposed VAD stereo dataset. The algorithm delivers consistent performance across all datasets and shows competitive performance against off-the-shelf 2D and 3D image and video quality assessment algorithms.
Autori: Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya
Ultimo aggiornamento: 2024-11-29 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2411.19522
Fonte PDF: https://arxiv.org/pdf/2411.19522
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.