Uma visão geral dos modelos generativos, destacando VAEs, GANs e Stable Diffusion.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma visão geral dos modelos generativos, destacando VAEs, GANs e Stable Diffusion.
― 6 min ler
Um olhar sobre o algoritmo de bloco reflexivo Kaczmarz e suas aplicações.
― 6 min ler
Estudo revela métodos eficazes para identificar alucinações em grandes modelos de linguagem-visual.
― 7 min ler
Um novo método melhora a resolução de imagem usando análise de auto-semelhança.
― 6 min ler
Um novo framework melhora a velocidade e a qualidade da geração de imagens em transformadores de difusão.
― 6 min ler
Novos métodos melhoram a velocidade e eficiência do NeRF para renderização de imagens de alta qualidade.
― 9 min ler
Um novo método usando GANs pra melhorar os testes de deep learning.
― 7 min ler
Um novo modelo para melhorar fotos em baixa luz de forma mais rápida e eficaz.
― 6 min ler
Um novo método reduz o tempo de computação em modelos de difusão sem perder a qualidade da saída.
― 7 min ler
Uma nova abordagem para reconstrução de formas usando a perspectiva dos muitos mundos.
― 6 min ler
A estimativa de profundidade melhorada a partir de imagens endoscópicas aumenta a precisão cirúrgica.
― 8 min ler
Um novo método melhora a eficiência na detecção de interações entre humanos e objetos em imagens.
― 7 min ler
Um novo método aprimora a PCA usando diagramas de Voronoi de grau mais alto pra lidar com outliers.
― 6 min ler
Explorando os riscos de privacidade na modelagem de imagens mascaradas e suas implicações.
― 6 min ler
Técnicas inovadoras melhoram a remoção de ruído de imagens usando operadores aprendidos.
― 6 min ler
O ML-CrAIST melhora a qualidade da imagem combinando informações espaciais e de frequência.
― 6 min ler
MAIR++ melhora a renderização inversa, aprimorando a estimativa de materiais e iluminação a partir de imagens.
― 8 min ler
Um novo modelo melhora a clareza e os detalhes em fotos e vídeos subaquáticos.
― 8 min ler
Uma nova abordagem para recorte de imagem melhora a flexibilidade e a eficiência.
― 7 min ler
Esse trabalho foca em identificar relações entre imagens de rostos quase duplicadas.
― 6 min ler
Um novo método melhora a análise de imagens através de características de segunda ordem.
― 7 min ler
Um novo método melhora o processamento de imagens usando tokens de superpixel adaptáveis.
― 7 min ler
Apresentando o MetaSeg pra melhorar a segmentação semântica em várias aplicações.
― 6 min ler
Uma olhada na importância e no comportamento estatístico dos cortes em grafos.
― 7 min ler
O AGPNet oferece uma maneira mais inteligente de detectar anomalias em imagens usando apenas imagens normais.
― 6 min ler
Novo modelo SDI-Net melhora a clareza em imagens com pouca luz usando duas vistas estereoscópicas.
― 6 min ler
Aprimore sua implementação de CNN usando tecnologia FPGA pra ter um desempenho melhor.
― 8 min ler
Novo método melhora a geração de imagens e vídeos usando técnicas de compressão padrão.
― 8 min ler
Uma nova abordagem liga técnicas de restauração de imagem com tarefas de visão computacional usando menos dados.
― 7 min ler
Uma nova abordagem melhora a reconstrução de cenas 3D a partir de uma única foto, focando nas interações.
― 5 min ler
Um novo método para edição 3D tranquila usando imagens de múltiplas vistas.
― 8 min ler
O MM-SAM melhora a segmentação de imagens juntando diferentes tipos de dados de sensores.
― 9 min ler
Combinando métodos pra ter uma melhor estimativa da pose da câmera a partir de imagens esparsas.
― 7 min ler
Um novo método ataca as fraquezas nos sistemas de imagem para texto para gerar resultados prejudiciais.
― 6 min ler
Um método pra integrar novos modelos sem precisar reprocessar as coleções de imagens que já existem.
― 7 min ler
QMambaBSR melhora a qualidade das imagens do smartphone com métodos inovadores.
― 5 min ler
Esse artigo apresenta uma abordagem única pra alinhar nuvens de pontos complexas.
― 4 min ler
Técnicas pra proteger fotos pessoais de uso indevido por modelos generativos.
― 7 min ler
Um novo método melhora a qualidade da imagem afetada por compressão dupla em JPEG.
― 6 min ler
Uma nova estrutura enfrenta os desafios do aprendizado multitarefa com imagens de 360 graus.
― 7 min ler