Avaliando a Qualidade em Imagens de Gráficos Computacionais
Um novo método e banco de dados melhoram a avaliação da qualidade de imagem em gráficos de computador.
― 8 min ler
Índice
- A Necessidade de Avaliação de Qualidade
- Criando um Novo Banco de Dados
- Uma Nova Abordagem para Avaliação de Qualidade
- O Impacto das Distorções e Estéticas
- Diferentes Tipos de Métodos de Avaliação
- Desafios na Avaliação de Qualidade
- Construindo o Banco de Dados CGIQA-6k
- O Componente Subjetivo
- Resultados do Experimento Subjetivo
- Medindo a Qualidade com Novas Técnicas
- Fluxo de Distorção vs. Fluxo Estético
- Desempenho do Novo Método
- Comparação com Modelos Existentes
- Validação em Diferentes Cenários
- A Importância de um Novo Banco de Dados
- Conclusão
- Fonte original
- Ligações de referência
Imagens de gráficos computacionais (CGIs) são fotos feitas por programas de computador e a gente vê muito em videogames, filmes e streaming online. Mas, a qualidade dessas imagens muitas vezes deixa a desejar por vários motivos. Às vezes, elas não ficam boas porque não foram renderizadas direitinho na produção. Outras vezes, elas podem ter problemas de compressão quando enviadas pela internet, ou simplesmente não são visualmente atraentes por causa de escolhas de design ruins. Apesar desses problemas, pouca pesquisa se concentrou em medir a qualidade das imagens de gráficos computacionais.
A Necessidade de Avaliação de Qualidade
A maioria das ferramentas usadas para medir a qualidade de imagens foi criada para fotos naturais tiradas por câmeras. Essas ferramentas geralmente se baseiam em outras imagens "boas" para comparação, o que não funciona bem para imagens geradas por computador. As diferenças na forma como as imagens naturais e os gráficos de computador são feitos significam que as mesmas ferramentas não podem ser usadas de forma eficaz. Isso destaca uma lacuna que precisa ser preenchida - há uma necessidade de ferramentas de avaliação de qualidade especificamente projetadas para imagens de gráficos computacionais.
Criando um Novo Banco de Dados
Para ajudar a resolver esse problema, foi criado um novo banco de dados em larga escala especificamente desenhado para avaliar imagens de gráficos computacionais. Este banco inclui 6.000 CGIs coletadas de várias fontes. O objetivo é preencher a lacuna nos métodos de avaliação de qualidade existentes, fornecendo um ponto de referência para avaliar a qualidade das imagens de gráficos computacionais.
Uma Nova Abordagem para Avaliação de Qualidade
O novo método proposto para avaliar a qualidade de imagens não precisa de uma imagem de referência para comparar. Em vez disso, ele analisa tanto as distorções quanto o apelo estético da imagem. Focando nesses dois aspectos, o método pode oferecer uma avaliação mais precisa da qualidade de uma imagem de gráficos computacionais.
O Impacto das Distorções e Estéticas
CGIs podem ter diferentes tipos de distorções, como borrões ou perda de detalhes por causa de uma renderização ruim ou problemas de compressão. Essas distorções podem afetar muito como um usuário percebe a imagem. Além disso, o gosto pessoal tem um grande papel na forma como as imagens são avaliadas. Uma imagem pode não ter sido renderizada bem, mas se ela provoca uma certa resposta emocional ou tem características estéticas que o espectador gosta, ele pode avaliá-la bem, independentemente de suas falhas técnicas.
Diferentes Tipos de Métodos de Avaliação
Os métodos de avaliação de qualidade podem ser divididos em três categorias com base em como usam imagens de referência:
- Métodos de referência completa comparam uma imagem distorcida com um original impecável.
- Métodos de referência reduzida usam algumas informações do original sem precisar da imagem inteira.
- Métodos sem referência não requerem nenhuma imagem original e, em vez disso, se baseiam na avaliação da própria imagem.
A maioria das avaliações de gráficos computacionais se encaixa na categoria sem referência, principalmente porque as imagens originais nem sempre estão disponíveis.
Desafios na Avaliação de Qualidade
Muitas ferramentas existentes se concentram em avaliar imagens naturais e não são adequadas para imagens de gráficos computacionais. Para começar, gráficos computacionais costumam ter formas simples e regulares e menos variedade de texturas em comparação com imagens naturais. Além disso, as medidas de qualidade usadas nas ferramentas existentes são baseadas em suposições que não se aplicam a CGIs.
Muitos esforços anteriores se concentraram em usar métodos de referência completa, que não funcionam bem com CGIs já que as imagens originais muitas vezes não estão acessíveis. Também há um número limitado de Bancos de dados especificamente para imagens de gráficos computacionais, o que atrapalha o desenvolvimento de novas ferramentas de avaliação de qualidade.
Construindo o Banco de Dados CGIQA-6k
Para resolver os problemas destacados, foi construído um banco de dados em larga escala chamado CGIQA contendo 6.000 CGIs. Esse banco inclui imagens de várias plataformas, como videogames e filmes, oferecendo uma variedade diversificada de conteúdos e resoluções. O processo envolveu reunir imagens de diferentes fontes, incluindo jogos locais e serviços de streaming, para garantir uma maior variedade de imagens e níveis de qualidade.
O Componente Subjetivo
Para garantir que as avaliações de qualidade fossem precisas, foi feito um experimento subjetivo. Isso envolveu testar como as pessoas avaliavam os CGIs. Em um ambiente controlado, os participantes foram mostrados as imagens e pediram para avaliá-las com base na qualidade. Isso permitiu coletar dados sobre como os espectadores médios percebem a qualidade dessas imagens CGI.
Resultados do Experimento Subjetivo
As classificações subjetivas dos participantes revelaram tendências em como certos tipos de CGIs eram percebidos. Por exemplo, os CGIs de filmes geralmente receberam avaliações mais altas em comparação com os CGIs de jogos. Essa diferença provavelmente se deve aos recursos maiores disponíveis para renderização de filmes em comparação com o que normalmente é encontrado em ambientes de videogame.
Medindo a Qualidade com Novas Técnicas
Ao desenvolver um novo método de avaliação, é possível avaliar a qualidade dos CGIs de forma eficaz e consistente. O método combina todas as informações coletadas no experimento subjetivo e as aplica para criar uma compreensão detalhada do que torna uma imagem atraente ou tecnicamente sólida.
Fluxo de Distorção vs. Fluxo Estético
O novo método consiste em duas camadas principais:
- Fluxo de Distorção: Isso foca em identificar e medir distorções nos CGIs. Ele leva em conta vários fatores que podem degradar a qualidade da imagem, como borrão ou pixelização.
- Fluxo Estético: Esta parte avalia as qualidades artísticas da imagem, incluindo composição e equilíbrio de cores. Este fluxo utiliza dados existentes sobre qualidade estética para aprimorar a avaliação.
Ambos os fluxos trabalham juntos para fornecer uma medida holística da qualidade CGI. Enquanto os aspectos de distorção parecem ter um impacto maior na percepção geral do espectador, as qualidades estéticas também têm um papel vital.
Desempenho do Novo Método
O novo método de avaliação foi testado em comparação com técnicas existentes. Os resultados mostraram que ele teve um desempenho melhor, especialmente no recém-criado banco de dados CGIQA-6k. Isso sugere que ele é capaz de oferecer uma compreensão mais clara da qualidade CGI em comparação com métodos mais antigos.
Comparação com Modelos Existentes
Testes comparativos no banco de dados CGIQA-6k e outros revelaram que métodos de avaliação de qualidade baseados em aprendizado profundo performaram significativamente melhor do que métodos tradicionais e artesanais. O novo método, que integra tanto avaliações estéticas quanto de distorção, alcançou as melhores pontuações de desempenho quando testado contra outros modelos de ponta.
Validação em Diferentes Cenários
A nova técnica de avaliação também foi validada contra outros bancos de dados existentes. Essa validação cruzada demonstrou que o novo método mantém sua eficácia mesmo quando aplicado a diferentes conjuntos de imagens de gráficos computacionais, reforçando sua robustez e adaptabilidade.
A Importância de um Novo Banco de Dados
Ao construir um grande banco de dados como o CGIQA-6k, os pesquisadores agora têm um recurso rico para trabalhar no campo da avaliação de qualidade de CGI. Isso vai abrir caminho para futuras ferramentas e pesquisas que podem melhorar a forma como avaliamos imagens de gráficos computacionais.
Conclusão
O desenvolvimento do banco de dados CGIQA-6k e do método de avaliação que o acompanha marca um avanço significativo no campo da avaliação de qualidade de imagens de gráficos computacionais. A combinação da avaliação de distorção e estética permite uma compreensão mais abrangente do que define uma imagem de alta qualidade. À medida que os métodos melhoram, assim também será a experiência do espectador em várias aplicações, desde jogos até filmes. Pesquisas futuras continuarão a construir sobre essa base, explorando novas maneiras de avaliar e aprimorar a qualidade das imagens de gráficos computacionais.
Título: Subjective and Objective Quality Assessment for in-the-Wild Computer Graphics Images
Resumo: Computer graphics images (CGIs) are artificially generated by means of computer programs and are widely perceived under various scenarios, such as games, streaming media, etc. In practice, the quality of CGIs consistently suffers from poor rendering during production, inevitable compression artifacts during the transmission of multimedia applications, and low aesthetic quality resulting from poor composition and design. However, few works have been dedicated to dealing with the challenge of computer graphics image quality assessment (CGIQA). Most image quality assessment (IQA) metrics are developed for natural scene images (NSIs) and validated on databases consisting of NSIs with synthetic distortions, which are not suitable for in-the-wild CGIs. To bridge the gap between evaluating the quality of NSIs and CGIs, we construct a large-scale in-the-wild CGIQA database consisting of 6,000 CGIs (CGIQA-6k) and carry out the subjective experiment in a well-controlled laboratory environment to obtain the accurate perceptual ratings of the CGIs. Then, we propose an effective deep learning-based no-reference (NR) IQA model by utilizing both distortion and aesthetic quality representation. Experimental results show that the proposed method outperforms all other state-of-the-art NR IQA methods on the constructed CGIQA-6k database and other CGIQA-related databases. The database is released at https://github.com/zzc-1998/CGIQA6K.
Autores: Zicheng Zhang, Wei Sun, Yingjie Zhou, Jun Jia, Zhichao Zhang, Jing Liu, Xiongkuo Min, Guangtao Zhai
Última atualização: 2023-11-01 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2303.08050
Fonte PDF: https://arxiv.org/pdf/2303.08050
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.