Avancées dans l'évaluation de la qualité visuelle
ColorVideoVDP améliore la façon dont on mesure la qualité des images et des vidéos.
― 10 min lire
Table des matières
- Objectif et Fonctionnalités
- Importance de l'Évaluation de la Qualité Visuelle
- Aperçu Technique
- Jeu de Données et Tests
- Défis dans le Développement du Métrique
- Travaux Connus dans les Métriques de Qualité
- Métriques de Qualité et Leurs Limites
- Le Modèle ColorVideoVDP
- Modèle d'Affichage
- Canaux de Couleurs Opposées
- Canaux Temporels
- Sensibilité au Contraste
- Masquage de Contraste
- Cartographie des Différences Visuelles
- Cartes Thermiques et Distogrammes
- Mise en Œuvre et Performance
- Temps de traitement
- Approche de Formation
- Applications Pratiques
- Conclusion
- Source originale
- Liens de référence
ColorVideoVDP est un outil conçu pour évaluer la qualité des images et des vidéos. Il aide à prédire à quel point les distorsions sont visibles quand on compare deux vidéos ou images affichées sur un écran donné. Les résultats incluent un score de qualité, une carte de distorsion et une représentation visuelle de la façon dont les distorsions changent au fil du temps.
Objectif et Fonctionnalités
Cet outil est super utile pour l'évaluation de la qualité des vidéos et des images. Il prend en compte comment nos yeux perçoivent la couleur et la lumière dans le temps. ColorVideoVDP utilise des modèles avancés de vision humaine pour analyser à la fois la luminosité et la couleur. Il considère le type d'écran utilisé et les différentes conditions de vision.
L'outil est conçu pour fonctionner avec des distorsions courantes comme la compression vidéo ou les erreurs de transmission, et il est aussi prêt à gérer de nouveaux types de distorsions qui peuvent apparaître dans les affichages en réalité augmentée et virtuelle. Pour rendre ça possible, un nouveau jeu de données appelé XR-DAVID a été créé, qui inclut plein de vidéos distordues pour les tests.
Les résultats des tests montrent que ColorVideoVDP fonctionne mieux que les outils d'évaluation de qualité existants. Cet outil peut ouvrir plein de nouvelles utilisations, comme améliorer la qualité du streaming vidéo, aider à la conception d'affichages et optimiser le contenu visuel.
Importance de l'Évaluation de la Qualité Visuelle
Évaluer à quel point un contenu est beau sur un écran est une tâche cruciale dans l'ingénierie graphique et d'affichage. Demander à des humains d'évaluer chaque vidéo est souvent trop lent et coûteux. Quand il faut examiner plein de variables rapidement, des outils automatisés comme ColorVideoVDP deviennent essentiels.
Beaucoup d'outils existants pour mesurer la qualité des images et des vidéos ne capturent pas complètement comment les gens perçoivent la couleur et le mouvement. Ça peut être dû aux manières compliquées dont notre vision fonctionne, ce qui rend difficile la création d'un modèle complet. En général, les modèles précis dépendent des données de perception humaine, qui peuvent être difficiles à rassembler, surtout quand il s'agit de la richesse des données de couleur.
Avoir les couleurs et les contrastes au top est vital pour la qualité. Certains métriques traditionnels se concentrent uniquement sur la luminosité et peuvent manquer des problèmes importants comme la perte de couleur. Les formules de différence de couleur ignorent souvent comment les choses changent dans le temps. C'est significatif quand on parle d'affichages modernes, notamment ceux qui affichent une large gamme de couleurs. ColorVideoVDP s'attaque à ces problèmes en prenant en compte à la fois la couleur et la luminosité.
Aperçu Technique
ColorVideoVDP analyse le contenu en décomposant les images et les vidéos en plusieurs parties. D'abord, il convertit les valeurs des pixels en un format qui peut représenter la lumière telle qu'elle est perçue par l'œil humain. Ensuite, il sépare le contenu en divers canaux de couleur et de temps pour une analyse plus approfondie.
L'aspect principal de ColorVideoVDP est son modèle de sensibilité au contraste, qui définit à quel point les gens peuvent voir les différences dans différents réglages. Il utilise des données provenant de nombreuses études sur la vision humaine pour calculer comment nos yeux réagissent à différents stimuli.
Le système prend en compte des facteurs comme la taille et la luminosité de l'écran, la distance par rapport à l'écran, et les conditions d'éclairage globales. Cela permet à ColorVideoVDP d'être le premier métrique à modéliser à la fois la perception des couleurs et la façon dont nous voyons les changements dans le temps.
Jeu de Données et Tests
Pour garantir la précision, un nouveau jeu de données nommé XR-DAVID a été créé spécifiquement pour évaluer la qualité visuelle dans les technologies d'affichage modernes. Ce jeu de données contient de nombreuses vidéos qui ont été distordues de différentes manières.
Les tests montrent que ColorVideoVDP prédit non seulement les différences visibles avec précision, mais le fait aussi à travers de nombreux types de distorsions. Le jeu de données a été comparé à divers métriques connus, et ColorVideoVDP a montré une performance nettement meilleure.
Grâce à des tests rigoureux, l'outil peut être utilisé dans de nombreuses nouvelles applications qui nécessitent des évaluations automatisées à la fois des changements de luminosité et de couleur.
Défis dans le Développement du Métrique
Créer un nouveau métrique comme ColorVideoVDP présente plusieurs défis. Un des problèmes majeurs est de s'assurer qu'il peut être validé avec précision. Une validation correcte implique de collecter des données qui représentent vraiment les types de distorsions que les utilisateurs rencontrent dans des situations réelles.
Créer un jeu de données suffisamment large est important, surtout puisque les artefacts traditionnels ont déjà été bien étudiés. Dans ce cas, les artefacts modernes liés aux nouvelles technologies d'affichage sont plus difficiles à évaluer en raison du manque de données existantes.
ColorVideoVDP doit également mesurer les effets de l'éblouissement, les mouvements des yeux, et comment nos yeux perçoivent les choses en 3D. Ces aspects n'ont pas encore été pleinement capturés par le métrique.
Travaux Connus dans les Métriques de Qualité
De nombreuses méthodes ont été développées pour évaluer la qualité visuelle dans les images et les vidéos. Ces méthodes varient dans leurs capacités. Certaines se concentrent uniquement sur la vision spatiale, tandis que d'autres tiennent compte de la vision temporelle ou des couleurs.
Certaines métriques sont basées sur des formules de différence de couleur, qui peuvent prédire les différences de couleur pour des patches simples mais peuvent avoir du mal avec des images plus complexes. D'autres, comme SSIM ou MS-SSIM, ne modélisent pas directement comment les gens voient la couleur et le mouvement, s'appuyant plutôt sur des mesures statistiques qui corrèlent avec la qualité perçue.
Les métriques de qualité vidéo combinent à la fois des caractéristiques spatiales et temporelles, mais peu modélisent la manière dont les humains perçoivent la couleur. ColorVideoVDP se distingue en offrant un modèle qui aborde toutes ces zones simultanément.
Métriques de Qualité et Leurs Limites
Formules de Différence de Couleur : Elles peuvent mesurer les différences de couleur perçues mais sont limitées pour des visuels dynamiques ou plus complexes.
Métriques de Qualité d'Image : Les métriques traditionnelles peuvent manquer des aspects importants de couleur et de réponse temporelle, conduisant à des inexactitudes.
Métriques de Qualité Vidéo : Ces métriques limitent souvent l'analyse temporelle à seulement deux images, échouant à capturer les changements continus qui se produisent dans le temps.
Le Modèle ColorVideoVDP
ColorVideoVDP décompose les images et les vidéos en différents canaux et fréquences, imitant la façon dont notre système visuel traite l'information.
Modèle d'Affichage
Le modèle d'affichage transforme les données des pixels en un format qui reflète comment la lumière est émise par un écran donné. Cela inclut la prise en compte de la luminosité de l'écran, de la gamme de couleurs et de l'éclairage environnemental.
Canaux de Couleurs Opposées
On comprend que le système visuel a trois mécanismes de couleur principaux : achromatique (luminosité) et deux chromatiques (rouge-vert et jaune-bleu). ColorVideoVDP utilise ce système pour représenter les différences visuelles avec précision.
Canaux Temporels
En plus des canaux de couleur, ColorVideoVDP inclut des canaux qui représentent comment nos yeux perçoivent le mouvement dans le temps. Cette approche aide à analyser les aspects temporels, garantissant que les changements rapides dans une vidéo sont pris en compte de manière appropriée.
Sensibilité au Contraste
Une grande partie du modèle se concentre sur à quel point les individus peuvent bien distinguer les contrastes entre les images de test et de référence. Cette sensibilité est influencée par de nombreux facteurs, y compris la fréquence spatiale et temporelle des stimuli visuels.
Masquage de Contraste
Ce mécanisme est essentiel pour comprendre comment les différences visibles sont réduites dans les zones texturées. Cela permet au modèle de reconnaître que certaines différences peuvent être difficiles à voir contre des arrière-plans complexes.
Cartographie des Différences Visuelles
En utilisant le modèle, ColorVideoVDP produit des cartes de différence visuelle qui montrent où les distorsions existent et comment elles varient dans le temps.
Cartes Thermiques et Distogrammes
ColorVideoVDP peut générer des visualisations détaillées, comme des cartes thermiques qui superposent les intensités de distorsion sur le contenu de l'image. Il offre également des distogrammes, qui présentent un résumé des distorsions à travers des canaux et des fréquences dans un seul diagramme.
Mise en Œuvre et Performance
ColorVideoVDP est mis en œuvre de manière rapide et efficace, et est optimisé pour fonctionner sur des GPU modernes. Cela permet un traitement rapide même avec de gros fichiers vidéo.
Temps de traitement
Des tests montrent que ColorVideoVDP traite les vidéos plus rapidement que de nombreux autres métriques existants tout en maintenant un haut niveau de précision.
Approche de Formation
La formation implique d'utiliser de grands jeux de données, ce qui permet au métrique d'adapter ses paramètres en fonction de la performance observée. Cette flexibilité est cruciale pour sa précision à travers différents types de contenu.
Applications Pratiques
ColorVideoVDP peut être utilisé dans plusieurs contextes réels, comme :
Streaming Vidéo : Assurer une qualité de streaming plus élevée en évaluant et en prédisant comment la compression affecte la qualité visuelle.
Conception d'Affichage : Aider les fabricants à créer de meilleurs affichages en fournissant des informations sur la façon dont les distorsions impactent l'expérience du spectateur.
Optimisation de la Qualité : Aider les créateurs de contenu à comprendre comment améliorer le contenu visuel pour leur public.
Conclusion
ColorVideoVDP représente une avancée significative dans le domaine de l'évaluation de la qualité visuelle. Avec sa capacité à modéliser à la fois les changements de couleur et temporels, il offre une compréhension plus profonde de la manière dont les images et vidéos sont perçues.
Cet outil ne se contente pas d'offrir des mesures précises de la qualité visuelle, mais ouvre également de nouvelles avenues pour améliorer l'expérience des spectateurs dans un large éventail d'applications. À mesure que la technologie progresse dans les méthodes d'affichage et de création de contenu, ColorVideoVDP sera probablement une ressource essentielle tant pour les professionnels que pour les chercheurs.
Titre: ColorVideoVDP: A visual difference predictor for image, video and display distortions
Résumé: ColorVideoVDP is a video and image quality metric that models spatial and temporal aspects of vision, for both luminance and color. The metric is built on novel psychophysical models of chromatic spatiotemporal contrast sensitivity and cross-channel contrast masking. It accounts for the viewing conditions, geometric, and photometric characteristics of the display. It was trained to predict common video streaming distortions (e.g. video compression, rescaling, and transmission errors), and also 8 new distortion types related to AR/VR displays (e.g. light source and waveguide non-uniformities). To address the latter application, we collected our novel XR-Display-Artifact-Video quality dataset (XR-DAVID), comprised of 336 distorted videos. Extensive testing on XR-DAVID, as well as several datasets from the literature, indicate a significant gain in prediction performance compared to existing metrics. ColorVideoVDP opens the doors to many novel applications which require the joint automated spatiotemporal assessment of luminance and color distortions, including video streaming, display specification and design, visual comparison of results, and perceptually-guided quality optimization.
Auteurs: Rafal K. Mantiuk, Param Hanji, Maliha Ashraf, Yuta Asano, Alexandre Chapiro
Dernière mise à jour: 2024-07-02 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2401.11485
Source PDF: https://arxiv.org/pdf/2401.11485
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://ctan.org/pkg/amssymb
- https://ctan.org/pkg/pifont
- https://dl.acm.org/ccs.cfm
- https://www.eizo.com/products/coloredge/cg3146/
- https://www.pexels.com/video/group-of-friends-having-pizza-and-beer-in-front-of-the-bonfire-7147814/
- https://www.pexels.com/video/a-woman-poses-by-leaning-on-a-ledge-inside-a-building-3044756/
- https://www.caminandes.com/
- https://www.pexels.com/video/city-restaurant-couple-love-5642589/
- https://www.pexels.com/video/woman-with-headphones-dancing-4316089/
- https://www.pexels.com/video/facebook-icon-like-green-background-7451172/
- https://www.pexels.com/video/the-forest-ground-covered-in-fall-leaves-5644241/
- https://www.pexels.com/video/woman-using-a-red-smartphone-3819368/
- https://www.pexels.com/video/people-rowing-boats-at-a-beautiful-lake-5594635/
- https://www.pexels.com/video/a-drone-shot-of-a-church-in-belalp-3818213/