Simple Science

La science de pointe expliquée simplement

# Informatique # Multimédia # Vision par ordinateur et reconnaissance des formes

Évaluer la qualité des vidéos stéréoscopiques

Explorer les évaluations de qualité pour des vidéos 3D affectées par des facteurs environnementaux.

Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

― 7 min lire


Évaluation de la qualité Évaluation de la qualité dans les vidéos 3D du contenu stéréoscopique déformé. Évaluer l'expérience du spectateur dans
Table des matières

Avec le monde qui se remplit de voitures et de circulation, le nombre d'accidents augmente. C'est un fait triste qu'environ 1,3 million de personnes perdent la vie dans des accidents de la route chaque année à cause de divers facteurs. Parmi ces facteurs, une cause majeure est la mauvaise visibilité due à des conditions météo comme le brouillard, la brume, la pluie et la neige. Ce sont des problèmes qui échappent à notre contrôle.

Pour aider à résoudre ce problème, des technologies et des systèmes appelés Systèmes Avancés d'Aide à la Conduite (ADAS) sont en cours de développement. Ces systèmes visent à imiter la façon dont les humains voient et réagissent au monde à travers nos yeux. En fusionnant la vue de gauche et de droite, on peut obtenir une perception de la profondeur, ce qui améliore l'expérience de visionnage. Ce genre de technologie peut vraiment améliorer la sécurité pour les conducteurs.

Cependant, créer des vidéos 3D de haute qualité peut être compliqué. On a besoin de caméras haute résolution, d'un large espace de stockage et d'un transfert de données rapide. Malheureusement, des erreurs dans la capture ou l'affichage peuvent réduire l'expérience globale de visionnage. C'est pourquoi il est essentiel de développer des modèles d'évaluation de qualité pour juger de la qualité de ces vidéos.

Types d'évaluations de la qualité

Les méthodes d'Évaluation de la qualité peuvent être classées en deux catégories : subjective et objective.

Évaluation subjective

Ici, de vraies personnes regardent et notent la qualité d'une vidéo. Bien que précise, cette méthode prend aussi pas mal de temps. C’est important car, finalement, on crée des vidéos pour les spectateurs, et leurs avis sont des repères cruciaux.

Évaluation objective

Cette méthode fournit des prédictions automatiques sur la qualité d'une vidéo, généralement basées sur des algorithmes qui imitent les notations humaines. Les évaluations objectives peuvent être classées en trois types :

  1. Référence complète (FR) : Nécessite la vidéo originale pour comparaison.
  2. Référence réduite (RR) : A besoin de certaines infos de la vidéo originale.
  3. Sans référence (NR) : N’a pas besoin de référence originale pour juger de la qualité.

Le défi des vidéos stéréoscopiques

Les vidéos stéréoscopiques (celles qui offrent un effet 3D) présentent leurs propres défis. Elles mélangent des informations de profondeur avec des images standards, ce qui améliore la qualité de l'expérience (QoE) pour le spectateur. Cependant, produire ces vidéos en 3D demande des exigences vitales, comme du matériel de haute qualité et des conditions de visionnage soignées.

Parfois, le processus d'encodage ou de décodage peut entraîner des erreurs, impactant par la suite l'expérience de visionnage. Cela met en avant la nécessité d'avoir des modèles d'évaluation de qualité fiables pour le contenu stéréoscopique.

L'importance des modèles d'évaluation de la qualité

Alors que les modèles d'évaluation de la qualité 2D sont largement disponibles, le domaine de l'évaluation de la qualité des vidéos 3D est encore en développement. Beaucoup de chercheurs travaillent à améliorer notre façon de mesurer la qualité vidéo, mais il reste encore du chemin à faire, surtout en tenant compte des facteurs spécifiques au contenu stéréoscopique.

Cet article vise à examiner à la fois les méthodes d'évaluation de la qualité subjectives et objectives pour les vidéos stéréoscopiques, en se concentrant sur comment des facteurs environnementaux comme le brouillard et la brume affectent l'expérience du spectateur.

Création d'un jeu de données de vidéos stéréoscopiques

Une partie clé de cette recherche a été le développement d'un jeu de données contenant divers niveaux de distorsions dues au brouillard et à la brume. Pour cela, nous avons produit 12 vidéos stéréoscopiques impeccables et un énorme 360 versions déformées. Ces vidéos imitent des problèmes de visibilité dans le monde réel pour comprendre comment ils affectent la perception des spectateurs.

Pour construire notre jeu de données, nous avons choisi des vidéos impeccables de haute qualité et les avons soumises à différents niveaux de brouillard et de brume. Cela nous a permis d'analyser comment ces distorsions impactent la qualité des vidéos.

Réalisation d'une étude subjective

Ensuite, nous devions évaluer la qualité des vidéos que nous avions créées. Nous avons mené une étude où 24 participants ont regardé nos vidéos et les ont notées. Ils ont été invités à attribuer une note aux vidéos allant de « Mauvais » à « Excellent » selon leurs perceptions.

Cette analyse subjective est importante car elle nous donne des informations directement des spectateurs, nous aidant à comprendre ce qui constitue une expérience de visionnage de qualité.

Techniques d'évaluation de la qualité

Pour analyser la qualité de manière plus objective, nous avons proposé un modèle qui n'a pas besoin de vidéo originale pour comparaison. Ce modèle traite les données collectées en utilisant diverses méthodes pour évaluer la qualité du contenu stéréoscopique.

Génération de cadres cyclopéens

Une technique astucieuse consiste à créer ce qu'on appelle des cadres cyclopéens. Ces cadres combinent les vues gauche et droite en une seule image. En évaluant ces images combinées, on peut obtenir des aperçus sur la qualité des vidéos 3D.

Analyse des statistiques des scènes naturelles

Ensuite, nous analysons les caractéristiques présentes dans les scènes naturelles de ces vidéos. En examinant diverses caractéristiques de la vidéo à plusieurs échelles, nous pouvons mieux comprendre comment les distorsions impactent la qualité perçue.

Utilisation de modèles statistiques

Nous appliquons des modèles statistiques pour évaluer la relation entre les vidéos impeccables et déformées. Cela nous aide à distinguer les différences et à déterminer dans quelle mesure la qualité a changé.

Résultats de l'étude

Après avoir effectué nos évaluations, nous avons trouvé des résultats intéressants. Le modèle proposé a bien performé de manière constante à travers divers Jeux de données, même par rapport à d'autres méthodes d'évaluation de la qualité établies. Cela suggère que notre approche pourrait fournir un outil précieux pour évaluer la qualité des vidéos stéréoscopiques.

Conclusion

En conclusion, alors que la technologie vidéo évolue, le besoin d'évaluations de qualité efficaces devient de plus en plus critique. La combinaison de méthodes subjectives et objectives améliore notre compréhension de la qualité vidéo, particulièrement pour le contenu stéréoscopique.

En créant un jeu de données qui simule des problèmes de visibilité et en développant des modèles d'évaluation, nous visons à contribuer à l'amélioration de la qualité des expériences de visionnage à l'avenir.

La vie ne se résume pas à voir en deux dimensions. Faisons-en 3D !

Source originale

Titre: Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions

Résumé: We present two major contributions in this work: 1) we create a full HD resolution stereoscopic (S3D) video dataset comprised of 12 reference and 360 distorted videos. The test stimuli are produced by simulating the five levels of fog and haze ambiances on the pristine left and right video sequences. We perform subjective analysis on the created video dataset with 24 viewers and compute Difference Mean Opinion Scores (DMOS) as quality representative of the dataset, 2) an Opinion Unaware (OU) and Distortion Unaware (DU) video quality assessment model is developed for S3D videos. We construct cyclopean frames from the individual views of an S3D video and partition them into nonoverlapping blocks. We analyze the Natural Scene Statistics (NSS) of all patches of pristine and test videos, and empirically model the NSS features with Univariate Generalized Gaussian Distribution (UGGD). We compute UGGD model parameters ({\alpha}, \b{eta}) at multiple spatial scales and multiple orientations of spherical steerable pyramid decomposition and show that the UGGD parameters are distortion discriminable. Further, we perform Multivariate Gaussian (MVG) modeling on the pristine and distorted video feature sets and compute the corresponding mean vectors and covariance matrices of MVG fits. We compute the Bhattacharyya distance measure between mean vectors and covariance matrices to estimate the perceptual deviation of a test video from pristine video set. Finally, we pool both distance measures to estimate the overall quality score of an S3D video. The performance of the proposed objective algorithm is verified on the popular S3D video datasets such as IRCCYN, LFOVIAS3DPh1, LFOVIAS3DPh2 and the proposed VAD stereo dataset. The algorithm delivers consistent performance across all datasets and shows competitive performance against off-the-shelf 2D and 3D image and video quality assessment algorithms.

Auteurs: Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

Dernière mise à jour: Nov 29, 2024

Langue: English

Source URL: https://arxiv.org/abs/2411.19522

Source PDF: https://arxiv.org/pdf/2411.19522

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires