Simple Science

Ciência de ponta explicada de forma simples

# Informática # Multimédia # Visão computacional e reconhecimento de padrões

Avaliando a Qualidade em Vídeos Estereoscópicos

Explorando avaliações de qualidade para vídeos 3D afetados por fatores ambientais.

Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

― 6 min ler


Avaliação de Qualidade em Avaliação de Qualidade em Vídeos 3D conteúdo estereoscópico distorcido. Avaliar a experiência do espectador em
Índice

Com o mundo ficando cada vez mais cheio de carros e trânsito, o número de acidentes só tá aumentando. É a dura realidade que cerca de 1,3 milhão de pessoas perdem suas vidas em acidentes de trânsito todo ano por várias razões. Entre essas razões, uma das principais é a baixa visibilidade por causa de condições climáticas como névoa, fumaça, chuva e neve. Esses problemas estão além do nosso controle.

Pra ajudar a lidar com isso, tão sendo desenvolvidas tecnologias e sistemas conhecidos como Sistemas Avançados de Assistência ao Motorista (ADAS). Esses sistemas têm como objetivo imitar como os humanos veem e reagem ao mundo através dos nossos olhos. Ao juntar a visão da esquerda e da direita, conseguimos ter percepção de profundidade, o que melhora muito a experiência de visualização. Esse tipo de tecnologia pode aumentar bastante a segurança dos motoristas.

Porém, criar vídeos 3D de alta qualidade pode ser complicado. Precisamos de câmeras de alta resolução, bastante espaço de armazenamento e transferência de dados rápida. Infelizmente, erros na captura ou na exibição podem acabar com a experiência de visualização. Por isso, desenvolver modelos de Avaliação de Qualidade pra julgar esses vídeos é essencial.

Tipos de Avaliações de Qualidade

Os métodos de avaliação de qualidade podem ser classificados em duas categorias: subjetiva e objetiva.

Avaliação Subjetiva

Aqui, pessoas reais assistem e avaliam a qualidade de um vídeo. Embora seja preciso, esse método também é bem demorado. É vital porque, no final das contas, a gente cria vídeos pra quem assiste, e as opiniões deles são marcos cruciais.

Avaliação Objetiva

Esse método fornece previsões automatizadas sobre a qualidade de um vídeo, geralmente baseado em algoritmos que imitam as avaliações humanas. As avaliações objetivas podem ser divididas em três tipos:

  1. Full Reference (FR): Requer o vídeo original para comparação.
  2. Reduced Reference (RR): Precisa de algumas informações do vídeo original.
  3. No Reference (NR): Não precisa de nenhuma referência original pra julgar a qualidade.

O Desafio dos Vídeos Estereoscópicos

Vídeos estereoscópicos (que dão efeito 3D) trazem seus próprios desafios. Eles misturam informações de profundidade com imagens normais, levando a uma experiência de qualidade de visualização (QoE) melhor pro espectador. Porém, produzir esses vídeos 3D tem requisitos vitais, como equipamentos de alta qualidade e condições de visualização cuidadosas.

Às vezes, o processo de codificação ou decodificação pode causar erros, impactando depois a experiência de visualização. Isso mostra a necessidade de ter modelos de avaliação de qualidade confiáveis pra conteúdos estereoscópicos.

A Importância dos Modelos de Avaliação de Qualidade

Enquanto os modelos de avaliação de qualidade 2D estão amplamente disponíveis, a área de avaliação de qualidade de vídeos 3D ainda tá em desenvolvimento. Muitos pesquisadores tão trabalhando pra melhorar como medimos a qualidade dos vídeos, mas ainda tem espaço pra crescer, especialmente considerando fatores específicos de conteúdos estereoscópicos.

Esse artigo tem como objetivo examinar tanto métodos subjetivos quanto objetivos de avaliação de qualidade para vídeos estereoscópicos, focando em como fatores ambientais como névoa e fumaça afetam a experiência do espectador.

Criando um Conjunto de Dados de Vídeos Estereoscópicos

Uma parte chave dessa pesquisa foi o desenvolvimento de um conjunto de dados contendo vários níveis de distorções de névoa e fumaça. Pra isso, produzimos 12 vídeos estereoscópicos limpos e impressionantes 360 versões distorcidas. Esses vídeos imitam problemas reais de visibilidade pra entender como eles afetam a percepção do espectador.

Pra montar nosso conjunto de dados, escolhemos alguns vídeos limpos e de alta qualidade e os submetemos a diferentes níveis de névoa e fumaça. Isso nos permitiu analisar como essas distorções impactam a qualidade dos vídeos.

Realizando um Estudo Subjetivo

Em seguida, precisávamos avaliar a qualidade dos vídeos que criamos. Fizemos um estudo onde 24 participantes assistiram nossos vídeos e os avaliaram. Eles foram convidados a dar notas de 'Ruim' a 'Excelente' com base nas percepções deles.

Essa análise subjetiva é importante porque nos dá insights diretos dos espectadores, ajudando a entender o que faz uma experiência de visualização de qualidade.

Técnicas de Avaliação de Qualidade

Pra analisar a qualidade de maneira mais objetiva, propusemos um modelo que não precisa de nenhum vídeo original pra comparação. Esse modelo processa os dados coletados usando vários métodos pra avaliar a qualidade do conteúdo estereoscópico.

Gerando Quadros Ciclopeanos

Uma técnica inteligente envolve criar o que chamamos de quadros ciclopeanos. Esses quadros combinam as visões esquerda e direita em uma só imagem. Ao avaliar essas imagens combinadas, podemos obter insights sobre a qualidade dos vídeos 3D.

Análise de Estatísticas de Cenas Naturais

Em seguida, analisamos as características presentes em cenas naturais nesses vídeos. Ao examinar várias características do vídeo em múltiplas escalas, conseguimos entender melhor como as distorções impactam a qualidade percebida.

Usando Modelagem Estatística

Aplicamos modelos estatísticos pra avaliar a relação entre os vídeos limpos e os distorcidos. Isso nos ajuda a distinguir as diferenças e determinar o quanto a qualidade mudou.

Resultados do Estudo

Depois de realizar nossas avaliações, encontramos alguns resultados interessantes. O modelo proposto teve um desempenho consistente em vários Conjuntos de dados, até mesmo em comparação com outros métodos estabelecidos de avaliação de qualidade. Isso sugere que nossa abordagem pode ser uma ferramenta valiosa pra avaliar a qualidade de vídeos estereoscópicos.

Conclusão

Em conclusão, conforme a tecnologia de vídeo evolui, a necessidade de uma avaliação de qualidade eficaz se torna cada vez mais crítica. A combinação de métodos subjetivos e objetivos melhora nossa compreensão da qualidade dos vídeos, especialmente para conteúdos estereoscópicos.

Ao criar um conjunto de dados que simula problemas de visibilidade e desenvolver modelos de avaliação, pretendemos contribuir pra melhorar a qualidade das experiências de visualização no futuro.

A vida não é só sobre ver em duas dimensões. Vamos torná-la 3D!

Fonte original

Título: Subjective and Objective Quality Assessment Methods of Stereoscopic Videos with Visibility Affecting Distortions

Resumo: We present two major contributions in this work: 1) we create a full HD resolution stereoscopic (S3D) video dataset comprised of 12 reference and 360 distorted videos. The test stimuli are produced by simulating the five levels of fog and haze ambiances on the pristine left and right video sequences. We perform subjective analysis on the created video dataset with 24 viewers and compute Difference Mean Opinion Scores (DMOS) as quality representative of the dataset, 2) an Opinion Unaware (OU) and Distortion Unaware (DU) video quality assessment model is developed for S3D videos. We construct cyclopean frames from the individual views of an S3D video and partition them into nonoverlapping blocks. We analyze the Natural Scene Statistics (NSS) of all patches of pristine and test videos, and empirically model the NSS features with Univariate Generalized Gaussian Distribution (UGGD). We compute UGGD model parameters ({\alpha}, \b{eta}) at multiple spatial scales and multiple orientations of spherical steerable pyramid decomposition and show that the UGGD parameters are distortion discriminable. Further, we perform Multivariate Gaussian (MVG) modeling on the pristine and distorted video feature sets and compute the corresponding mean vectors and covariance matrices of MVG fits. We compute the Bhattacharyya distance measure between mean vectors and covariance matrices to estimate the perceptual deviation of a test video from pristine video set. Finally, we pool both distance measures to estimate the overall quality score of an S3D video. The performance of the proposed objective algorithm is verified on the popular S3D video datasets such as IRCCYN, LFOVIAS3DPh1, LFOVIAS3DPh2 and the proposed VAD stereo dataset. The algorithm delivers consistent performance across all datasets and shows competitive performance against off-the-shelf 2D and 3D image and video quality assessment algorithms.

Autores: Sria Biswas, Balasubramanyam Appina, Priyanka Kokil, Sumohana S Channappayya

Última atualização: 2024-11-29 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2411.19522

Fonte PDF: https://arxiv.org/pdf/2411.19522

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes