Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften # Multimedia # Computer Vision und Mustererkennung

Qualität in stereoskopischen Videos bewerten

Untersuchung von Qualitätsbewertungen für 3D-Videos, die von Umwelteinflüssen betroffen sind.

Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

― 5 min Lesedauer


Qualitätsbewertung von Qualitätsbewertung von 3D-Videos verzerrtem stereoskopischen Inhalt. Bewertung des Zuschauererlebnisses bei
Inhaltsverzeichnis

Während die Welt immer voller wird mit Autos und Verkehr, steigen die Unfallzahlen. Es ist eine harte Realität, dass jedes Jahr etwa 1,3 Millionen Menschen bei Verkehrsunfällen ums Leben kommen, und das aus verschiedenen Gründen. Einer der Hauptgründe ist schlechte Sicht durch Wetterbedingungen wie Nebel, Dunst, Regen und Schnee. Das sind Probleme, die wir nicht kontrollieren können.

Um dieses Problem anzugehen, werden Technologien und Systeme entwickelt, die als Advanced Driver Assistance Systems (ADAS) bekannt sind. Diese Systeme sollen imitieren, wie Menschen die Welt durch unsere Augen sehen und reagieren. Indem wir die Sicht von links und rechts zusammenführen, können wir ein besseres Tiefenverständnis bekommen, was zu einem besseren Seherlebnis führt. Diese Art von Technologie kann die Sicherheit für Fahrer erheblich verbessern.

Allerdings ist es knifflig, qualitativ hochwertige 3D-Videos zu erstellen. Wir benötigen hochauflösende Kameras, ausreichend Speicherplatz und schnelle Datenübertragung. Leider können Fehler beim Erfassen oder Anzeigen das gesamte Seherlebnis beeinträchtigen. Deshalb ist es wichtig, Qualitätsbewertungsmodelle zu entwickeln, um die Qualität dieser Videos zu beurteilen.

Arten der Qualitätsbewertung

Qualitätsbewertungsmethoden können in zwei Kategorien unterteilt werden: subjektiv und objektiv.

Subjektive Bewertung

Hier schauen echte Leute und bewerten die Qualität eines Videos. Obwohl das genau ist, ist diese Methode auch ziemlich zeitaufwendig. Es ist wichtig, denn letztendlich erstellen wir Videos für die Zuschauer, und ihre Meinungen sind entscheidende Massstäbe.

Objektive Bewertung

Diese Methode bietet automatisierte Vorhersagen über die Qualität eines Videos, meist basierend auf Algorithmen, die menschliche Bewertungen nachahmen. Objektive Bewertungen können weiter in drei Typen unterteilt werden:

  1. Vollreferenz (FR): Benötigt das ursprüngliche Video zum Vergleich.
  2. Reduzierte Referenz (RR): Braucht einige Infos vom ursprünglichen Video.
  3. Keine Referenz (NR): Benötigt keine ursprüngliche Referenz zur Qualitätsbewertung.

Die Herausforderung stereoskopischer Videos

Stereoskopische Videos (die einen 3D-Effekt bieten) bringen ihre eigenen Herausforderungen mit sich. Sie kombinieren Tiefeninformationen mit Standardbildern, was zu einem verbesserten Qualitätserlebnis (QoE) für den Zuschauer führt. Allerdings erfordert die Produktion dieser 3D-Videos wichtige Anforderungen, wie hochwertige Ausrüstung und sorgfältige Betrachtungsbedingungen.

Manchmal kann der Prozess des Kodierens oder Decodierens zu Fehlern führen, die das Seherlebnis beeinträchtigen. Das hebt die Notwendigkeit hervor, zuverlässige Qualitätsbewertungsmodelle für stereoskopische Inhalte zu haben.

Die Bedeutung von Qualitätsbewertungsmodellen

Während 2D-Qualitätsbewertungsmodelle weit verbreitet sind, entwickelt sich das Feld der 3D-Videoqualitätsbewertung noch. Viele Forscher arbeiten daran, wie wir die Videoqualität messen, aber es gibt noch Raum für Wachstum, besonders in Bezug auf spezifische Faktoren für stereoskopische Inhalte.

Dieser Artikel zielt darauf ab, sowohl subjektive als auch objektive Qualitätsbewertungsmethoden für stereoskopische Videos zu untersuchen, mit dem Fokus darauf, wie Umweltfaktoren wie Nebel und Dunst das Zuschauererlebnis beeinflussen.

Erstellung eines stereoskopischen Videodatasets

Ein wichtiger Teil dieser Forschung war die Entwicklung eines Datasets mit verschiedenen Stufen von Nebel- und Dunstverzerrungen. Um dies zu erreichen, haben wir 12 makellose stereoskopische Videos und satte 360 verzerrte Versionen produziert. Diese Videos ahmen reale Sichtprobleme nach, um zu verstehen, wie sie die Wahrnehmung der Zuschauer beeinflussen.

Um unser Dataset aufzubauen, haben wir einige hochwertige makellose Videos ausgewählt und sie unterschiedlichen Stufen von Nebel und Dunst ausgesetzt. So konnten wir analysieren, wie diese Verzerrungen die Qualität der Videos beeinflussen.

Durchführung einer subjektiven Studie

Als Nächstes mussten wir die Qualität der Videos bewerten, die wir erstellt hatten. Wir führten eine Studie durch, bei der 24 Teilnehmer unsere Videos schauten und bewerteten. Sie sollten die Videos von 'Schlecht' bis 'Ausgezeichnet' basierend auf ihren Wahrnehmungen einstufen.

Diese subjektive Analyse ist wichtig, weil sie uns Einblicke direkt von den Zuschauern gibt und uns hilft zu verstehen, was ein qualitativ hochwertiges Seherlebnis ausmacht.

Techniken zur Qualitätsbewertung

Um die Qualität objektiver zu analysieren, haben wir ein Modell vorgeschlagen, das keine ursprünglichen Videos zum Vergleich benötigt. Dieses Modell verarbeitet die gesammelten Daten mit verschiedenen Methoden, um die Qualität der stereoskopischen Inhalte zu bewerten.

Generierung cyclopeanischer Frames

Eine clevere Technik besteht darin, sogenannte cyclopeanische Frames zu erstellen. Diese Frames kombinieren die linken und rechten Ansichten zu einem Bild. Durch die Bewertung dieser kombinierten Bilder können wir Einblicke in die Qualität der 3D-Videos gewinnen.

Analyse der natürlichen Szenenstatistik

Als Nächstes analysieren wir die Merkmale, die in natürlichen Szenen in diesen Videos vorhanden sind. Durch die Untersuchung verschiedener Merkmale des Videos auf mehreren Ebenen können wir besser verstehen, wie Verzerrungen die wahrgenommene Qualität beeinflussen.

Verwendung statistischer Modellierung

Wir wenden statistische Modelle an, um die Beziehung zwischen den makellosen und den verzerrten Videos zu bewerten. Das hilft uns, die Unterschiede zu erkennen und zu bestimmen, wie sehr sich die Qualität verändert hat.

Ergebnisse der Studie

Nachdem wir unsere Bewertungen durchgeführt hatten, fanden wir einige interessante Ergebnisse. Das vorgeschlagene Modell schnitt konsistent gut über verschiedene Datasets ab, sogar im Vergleich zu anderen etablierten Qualitätsbewertungsmethoden. Das deutet darauf hin, dass unser Ansatz ein nützliches Werkzeug zur Bewertung der Qualität von stereoskopischen Videos bieten könnte.

Fazit

Zusammenfassend wird mit der Weiterentwicklung der Videotechnologie der Bedarf an effektiven Qualitätsbewertungen immer wichtiger. Die Kombination aus subjektiven und objektiven Methoden verbessert unser Verständnis von Videoqualität, insbesondere für stereoskopische Inhalte.

Indem wir ein Dataset erstellen, das Sichtprobleme simuliert, und Bewertungsmodelle entwickeln, wollen wir dazu beitragen, die Qualität der Seherlebnisse in der Zukunft zu verbessern.

Das Leben besteht nicht nur darin, in zwei Dimensionen zu sehen. Lass es uns 3D machen!

Originalquelle

Titel: Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions

Zusammenfassung: We present two major contributions in this work: 1) we create a full HD resolution stereoscopic (S3D) video dataset comprised of 12 reference and 360 distorted videos. The test stimuli are produced by simulating the five levels of fog and haze ambiances on the pristine left and right video sequences. We perform subjective analysis on the created video dataset with 24 viewers and compute Difference Mean Opinion Scores (DMOS) as quality representative of the dataset, 2) an Opinion Unaware (OU) and Distortion Unaware (DU) video quality assessment model is developed for S3D videos. We construct cyclopean frames from the individual views of an S3D video and partition them into nonoverlapping blocks. We analyze the Natural Scene Statistics (NSS) of all patches of pristine and test videos, and empirically model the NSS features with Univariate Generalized Gaussian Distribution (UGGD). We compute UGGD model parameters ({\alpha}, \b{eta}) at multiple spatial scales and multiple orientations of spherical steerable pyramid decomposition and show that the UGGD parameters are distortion discriminable. Further, we perform Multivariate Gaussian (MVG) modeling on the pristine and distorted video feature sets and compute the corresponding mean vectors and covariance matrices of MVG fits. We compute the Bhattacharyya distance measure between mean vectors and covariance matrices to estimate the perceptual deviation of a test video from pristine video set. Finally, we pool both distance measures to estimate the overall quality score of an S3D video. The performance of the proposed objective algorithm is verified on the popular S3D video datasets such as IRCCYN, LFOVIAS3DPh1, LFOVIAS3DPh2 and the proposed VAD stereo dataset. The algorithm delivers consistent performance across all datasets and shows competitive performance against off-the-shelf 2D and 3D image and video quality assessment algorithms.

Autoren: Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

Letzte Aktualisierung: Nov 29, 2024

Sprache: English

Quell-URL: https://arxiv.org/abs/2411.19522

Quell-PDF: https://arxiv.org/pdf/2411.19522

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel