GLARE: Um Novo Método para Melhoria de Imagens em Baixa Luz
O GLARE melhora imagens em baixa luz usando uma abordagem única de código e controles do usuário.
― 6 min ler
Índice
- Método GLARE
- Por que os métodos atuais têm dificuldades
- Abordagem do Código
- Estágios do GLARE
- Etapa 1: Aprendendo o Código
- Etapa 2: Aprendendo Características de Baixa Luz
- Etapa 3: Melhorando com Características Adaptativas
- Desempenho do GLARE
- Desafios na Melhoria de Imagens em Baixa Luz
- Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
Imagens com pouca luz geralmente enfrentam vários problemas, como perda de detalhes, contraste reduzido e aumento de ruído. Essas questões dificultam tarefas como detecção e rastreamento de objetos. Por isso, a melhoria de imagens em baixa luminosidade (LLIE) virou um tópico popular de pesquisa. Muitos métodos existentes tentam melhorar essas imagens mapeando-as diretamente para imagens em luz normal ou usando informações extras, como mapas de brilho ou detalhes da cena. No entanto, esses métodos costumam ter dificuldades em situações de luz muito baixa.
Método GLARE
Para enfrentar esses desafios, um novo método chamado GLARE foi desenvolvido. Esse método usa um código especial feito a partir de imagens em luz normal que ajuda a guiar o processo de melhoria. A parte chave do GLARE é um modelo generativo que pode alinhar características de baixa luminosidade com representações de luz normal. Isso garante que as informações corretas sejam retiradas do código durante o processo de melhoria.
Outra característica importante do GLARE é o módulo de Transformação Adaptativa de Características (AFT). Esse módulo permite que os usuários ajustem como as características de baixa e alta luminosidade são misturadas, o que ajuda a melhorar a qualidade da imagem final. O GLARE não só melhora as imagens, mas também mantém os detalhes realistas, fazendo com que as imagens melhoradas pareçam naturais e atraentes.
Por que os métodos atuais têm dificuldades
Técnicas tradicionais dependem muito de regras fixas e restrições, o que limita a adaptabilidade delas em diferentes condições de iluminação. Embora o aprendizado profundo tenha aberto novas avenidas para esses métodos, muitas vezes eles falham em cenários do mundo real cheios de ruído e condições de luz variadas. Muitas abordagens recentes também usam orientação externa, como características semânticas ou mapas de iluminação, para lidar com a incerteza das imagens em baixa luminosidade. No entanto, ainda enfrentam dificuldades em obter características estáveis de entradas fortemente degradadas.
Usar apenas as informações de imagens em baixa luminosidade para criar uma transformação para imagens em luz normal muitas vezes resulta em resultados ruins quando testados em situações da vida real. Portanto, o GLARE visa superar essas limitações usando conhecimento prévio de imagens em luz normal.
Abordagem do Código
A abordagem única do GLARE é usar um código aprendido cheio de características de imagens de alta qualidade. Esse código ajuda a guiar o processo de melhoria. Ao projetar imagens em baixa luminosidade nesse código, confusão na transformação de imagens em baixa luminosidade para luz normal é reduzida, levando a melhorias de qualidade melhores.
Muitos métodos anteriores usaram estratégias como regras feitas à mão e características manuais para melhorar as imagens. Embora isso tenha sido eficaz até certo ponto, eles ainda lutavam com consistência em diferentes situações de iluminação. Com o GLARE, os pesquisadores criaram um código baseado em imagens em luz normal claras, que captura várias características de alta qualidade.
Estágios do GLARE
O GLARE opera em três etapas principais.
Etapa 1: Aprendendo o Código
Na primeira etapa, um código abrangente é construído usando um modelo especial chamado VQGAN. Esse modelo analisa muitas imagens em luz normal para criar um banco de dados de características que podem ser referenciadas mais tarde durante a melhoria.
Etapa 2: Aprendendo Características de Baixa Luz
Durante a segunda etapa, o modelo aprende a transformar características de imagens em baixa luz para combiná-las com as de imagens em luz normal. Isso é feito usando um Fluxo Normalizador Latente Invertível (I-LNF), que ajuda a mapear com precisão características de baixa luminosidade para os seus equivalentes em luz normal.
Etapa 3: Melhorando com Características Adaptativas
Na etapa final, o módulo AFT entra em cena. Esse módulo mistura as características de baixa e alta luminosidade de uma maneira que permite que os usuários controlem quanto de cada uma é usada. Isso ajuda a garantir que as imagens melhoradas não sejam apenas claras, mas também mantenham a textura e os detalhes corretos.
Desempenho do GLARE
O GLARE mostrou desempenho superior quando testado contra vários conjuntos de dados de referência e cenários do mundo real. Os resultados mostram que o GLARE produz imagens de alta qualidade em comparação com outros métodos. Ele foi validado como uma ferramenta valiosa para melhorar imagens tiradas em condições de pouca luz, tornando-o adequado para tarefas de alto nível, como detecção de objetos.
Desafios na Melhoria de Imagens em Baixa Luz
Melhorar imagens em baixa luminosidade é complexo devido a várias questões. As imagens podem faltar detalhes e as cores podem parecer distorcidas. Além disso, o ruído do sensor se torna mais pronunciado em situações de pouca luz, o que cria mais complicações para qualquer método de melhoria.
Muitas abordagens anteriores focaram em lidar com esses desafios separadamente, mas o GLARE combina várias estratégias para gerenciar efetivamente os diferentes elementos que afetam as imagens em baixa luz. Isso inclui não só melhorar a visibilidade, mas também preservar a precisão das cores e detalhes durante o processo de melhoria.
Direções Futuras
À medida que os pesquisadores continuam a melhorar as técnicas de melhoria de imagem, a abordagem do GLARE pode inspirar novas inovações. Métodos futuros podem explorar mais maneiras de usar códigos externos e técnicas generativas. Além disso, melhorar o controle do usuário dentro desses sistemas pode levar a resultados mais personalizados que atendem a necessidades específicas.
Com a pesquisa contínua e avanços, a qualidade das imagens em baixa luz pode ser significativamente melhorada, permitindo um melhor desempenho em várias aplicações, desde fotografia até sistemas avançados de detecção de objetos.
Conclusão
Em resumo, o GLARE se destaca no campo da melhoria de imagens em baixa luminosidade ao integrar um código abrangente de características em luz normal e usar técnicas generativas avançadas para alinhar imagens em baixa luz com seus equivalentes em luz normal. O módulo AFT permite flexibilidade ao usuário, resultando em melhorias que preservam detalhes realistas e melhoram a qualidade geral da imagem. Essa abordagem inovadora abre novas avenidas para futuras pesquisas e apresenta uma solução robusta para os desafios enfrentados na melhoria de imagens em baixa luz.
Título: GLARE: Low Light Image Enhancement via Generative Latent Feature based Codebook Retrieval
Resumo: Most existing Low-light Image Enhancement (LLIE) methods either directly map Low-Light (LL) to Normal-Light (NL) images or use semantic or illumination maps as guides. However, the ill-posed nature of LLIE and the difficulty of semantic retrieval from impaired inputs limit these methods, especially in extremely low-light conditions. To address this issue, we present a new LLIE network via Generative LAtent feature based codebook REtrieval (GLARE), in which the codebook prior is derived from undegraded NL images using a Vector Quantization (VQ) strategy. More importantly, we develop a generative Invertible Latent Normalizing Flow (I-LNF) module to align the LL feature distribution to NL latent representations, guaranteeing the correct code retrieval in the codebook. In addition, a novel Adaptive Feature Transformation (AFT) module, featuring an adjustable function for users and comprising an Adaptive Mix-up Block (AMB) along with a dual-decoder architecture, is devised to further enhance fidelity while preserving the realistic details provided by codebook prior. Extensive experiments confirm the superior performance of GLARE on various benchmark datasets and real-world data. Its effectiveness as a preprocessing tool in low-light object detection tasks further validates GLARE for high-level vision applications. Code is released at https://github.com/LowLevelAI/GLARE.
Autores: Han Zhou, Wei Dong, Xiaohong Liu, Shuaicheng Liu, Xiongkuo Min, Guangtao Zhai, Jun Chen
Última atualização: 2024-07-17 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.12431
Fonte PDF: https://arxiv.org/pdf/2407.12431
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.