Evaluando la calidad en videos estereoscópicos
Explorando evaluaciones de calidad para videos 3D afectados por factores ambientales.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya
― 6 minilectura
Tabla de contenidos
- Tipos de Evaluaciones de Calidad
- Evaluación subjetiva
- Evaluación Objetiva
- El Reto de los Videos Estereoscópicos
- La Importancia de los Modelos de Evaluación de Calidad
- Creando un Conjunto de Datos de Videos Estereoscópicos
- Realizando un Estudio Subjetivo
- Técnicas de Evaluación de Calidad
- Generando Marcos Ciclópeos
- Análisis de Estadísticas de Escenas Naturales
- Usando Modelado Estadístico
- Resultados del Estudio
- Conclusión
- Fuente original
A medida que el mundo se llena más de autos y tráfico, el número de accidentes va en aumento. Es una dura realidad que alrededor de 1.3 millones de personas pierden la vida en accidentes de tráfico cada año por varias razones. Entre esos factores, una de las principales causas es la mala visibilidad debido a condiciones climáticas como niebla, bruma, lluvia y nieve. Estos son problemas que están fuera de nuestro control.
Para ayudar a enfrentar este problema, se están desarrollando tecnologías y sistemas conocidos como Sistemas Avanzados de Asistencia al Conductor (ADAS). Estos sistemas buscan imitar cómo los humanos ven y reaccionan al mundo a través de nuestros ojos. Al fusionar la vista del lado izquierdo y derecho, podemos obtener percepción de profundidad, lo que lleva a una mejor experiencia visual. Este tipo de tecnología puede mejorar significativamente la seguridad para los conductores.
Sin embargo, crear videos en 3D de alta calidad puede ser complicado. Necesitamos cámaras de alta resolución, mucho espacio de almacenamiento y transferencia de datos a alta velocidad. Desafortunadamente, errores en la captura o visualización pueden reducir la experiencia visual general. Por eso, desarrollar modelos de Evaluación de Calidad para juzgar la calidad de estos videos es esencial.
Tipos de Evaluaciones de Calidad
Los métodos de evaluación de calidad se pueden clasificar en dos categorías: subjetiva y objetiva.
Evaluación subjetiva
Aquí, personas reales ven y califican la calidad de un video. Aunque es precisa, este método también consume bastante tiempo. Es fundamental porque, al final, creamos videos para los espectadores, y sus opiniones son puntos de referencia cruciales.
Evaluación Objetiva
Este método ofrece predicciones automatizadas sobre la calidad de un video, generalmente basadas en algoritmos que imitan las calificaciones humanas. Las evaluaciones objetivas se pueden clasificar en tres tipos:
- Referencia Completa (FR): Requiere el video original para comparación.
- Referencia Reducida (RR): Necesita algo de información del video original.
- Sin Referencia (NR): No necesita ninguna referencia original para juzgar la calidad.
El Reto de los Videos Estereoscópicos
Los videos estereoscópicos (los que proporcionan un efecto 3D) presentan sus propios desafíos. Mezclan información de profundidad con imágenes estándar, lo que lleva a una mejor calidad de experiencia (QoE) para el espectador. Sin embargo, producir estos videos en 3D presenta requisitos vitales, como equipo de alta calidad y condiciones de visualización cuidadosas.
A veces, el proceso de codificación o decodificación puede llevar a errores, lo que impacta en la experiencia visual. Esto resalta la necesidad de contar con modelos de evaluación de calidad confiables para contenido estereoscópico.
La Importancia de los Modelos de Evaluación de Calidad
Mientras que los modelos de evaluación de calidad en 2D están ampliamente disponibles, el campo de la evaluación de calidad de videos en 3D aún está en desarrollo. Muchos investigadores están trabajando para mejorar cómo medimos la calidad de los videos, pero aún hay margen de crecimiento, especialmente al considerar factores específicos del contenido estereoscópico.
Este artículo tiene como objetivo examinar tanto los métodos de evaluación de calidad subjetiva como objetiva para videos estereoscópicos, enfocándose en cómo factores ambientales como la niebla y la bruma afectan la experiencia del espectador.
Creando un Conjunto de Datos de Videos Estereoscópicos
Una parte clave de esta investigación fue el desarrollo de un conjunto de datos que contiene varios niveles de distorsiones por niebla y bruma. Para lograr esto, producimos 12 videos estereoscópicos prístinos y ¡un montón de 360 versiones distorsionadas! Estos videos simulan problemas de visibilidad en el mundo real para entender cómo afectan la percepción del espectador.
Para construir nuestro conjunto de datos, seleccionamos algunos videos prístinos de alta calidad y los sometimos a diferentes niveles de niebla y bruma. Esto nos permitió analizar cómo estas distorsiones impactan la calidad de los videos.
Realizando un Estudio Subjetivo
Luego, necesitábamos evaluar la calidad de los videos que habíamos creado. Realizamos un estudio donde 24 participantes vieron nuestros videos y les dieron calificaciones. Se les pidió que puntuaran los videos de 'Malo' a 'Excelente' según sus percepciones.
Este análisis subjetivo es importante porque nos ofrece ideas directamente de los espectadores, ayudándonos a entender qué hace una experiencia visual de calidad.
Técnicas de Evaluación de Calidad
Para analizar la calidad de manera más objetiva, propusimos un modelo que no necesita ningún video original para comparación. Este modelo procesa los datos recopilados utilizando varios métodos para evaluar la calidad del contenido estereoscópico.
Generando Marcos Ciclópeos
Una técnica ingeniosa implica crear lo que se llaman marcos ciclópeos. Estos marcos combinan las vistas izquierda y derecha en una sola imagen. Al evaluar estas imágenes combinadas, podemos obtener información sobre la calidad de los videos en 3D.
Análisis de Estadísticas de Escenas Naturales
Luego, analizamos las características presentes en escenas naturales en estos videos. Al examinar varias características del video en múltiples escalas, podemos entender mejor cómo las distorsiones impactan la calidad percibida.
Usando Modelado Estadístico
Aplicamos modelos estadísticos para evaluar la relación entre los videos prístinos y los distorsionados. Esto nos ayuda a distinguir las diferencias y determinar cuánto ha cambiado la calidad.
Resultados del Estudio
Después de realizar nuestras evaluaciones, encontramos algunos resultados interesantes. El modelo propuesto se desempeñó consistentemente bien en varios Conjuntos de datos, incluso contra otros métodos de evaluación de calidad establecidos. Esto sugiere que nuestro enfoque puede proporcionar una herramienta valiosa para evaluar la calidad de videos estereoscópicos.
Conclusión
En conclusión, a medida que la tecnología de video evoluciona, la necesidad de una evaluación de calidad efectiva se vuelve cada vez más crítica. La combinación de métodos subjetivos y objetivos mejora nuestra comprensión de la calidad del video, particularmente para contenido estereoscópico.
Al crear un conjunto de datos que simula problemas de visibilidad y desarrollar modelos de evaluación, esperamos contribuir a mejorar la calidad de las experiencias visuales en el futuro.
La vida no se trata solo de ver en dos dimensiones. ¡Hagámoslo en 3D!
Título: Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions
Resumen: We present two major contributions in this work: 1) we create a full HD resolution stereoscopic (S3D) video dataset comprised of 12 reference and 360 distorted videos. The test stimuli are produced by simulating the five levels of fog and haze ambiances on the pristine left and right video sequences. We perform subjective analysis on the created video dataset with 24 viewers and compute Difference Mean Opinion Scores (DMOS) as quality representative of the dataset, 2) an Opinion Unaware (OU) and Distortion Unaware (DU) video quality assessment model is developed for S3D videos. We construct cyclopean frames from the individual views of an S3D video and partition them into nonoverlapping blocks. We analyze the Natural Scene Statistics (NSS) of all patches of pristine and test videos, and empirically model the NSS features with Univariate Generalized Gaussian Distribution (UGGD). We compute UGGD model parameters ({\alpha}, \b{eta}) at multiple spatial scales and multiple orientations of spherical steerable pyramid decomposition and show that the UGGD parameters are distortion discriminable. Further, we perform Multivariate Gaussian (MVG) modeling on the pristine and distorted video feature sets and compute the corresponding mean vectors and covariance matrices of MVG fits. We compute the Bhattacharyya distance measure between mean vectors and covariance matrices to estimate the perceptual deviation of a test video from pristine video set. Finally, we pool both distance measures to estimate the overall quality score of an S3D video. The performance of the proposed objective algorithm is verified on the popular S3D video datasets such as IRCCYN, LFOVIAS3DPh1, LFOVIAS3DPh2 and the proposed VAD stereo dataset. The algorithm delivers consistent performance across all datasets and shows competitive performance against off-the-shelf 2D and 3D image and video quality assessment algorithms.
Autores: Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya
Última actualización: Nov 29, 2024
Idioma: English
Fuente URL: https://arxiv.org/abs/2411.19522
Fuente PDF: https://arxiv.org/pdf/2411.19522
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.