Uma nova abordagem melhora a consistência e a qualidade das imagens em tarefas de visualização de histórias.
― 8 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem melhora a consistência e a qualidade das imagens em tarefas de visualização de histórias.
― 8 min ler
Novos métodos melhoram a qualidade da imagem enquanto preservam a identidade individual.
― 7 min ler
Um novo método melhora a privacidade no aprendizado federado contra ataques de inversão de gradiente.
― 10 min ler
Novo método resolve problemas de brilho em modelos de difusão para gerar imagens melhores.
― 7 min ler
Um novo transformador leve de visão melhora a estimativa de profundidade para dispositivos de baixo consumo.
― 6 min ler
Um novo benchmark avalia o aprendizado contínuo em modelos de linguagem multimodal.
― 7 min ler
O DrFER oferece uma análise de expressão facial mais precisa, separando as características da identidade.
― 7 min ler
Explorando a conexão entre idempotência e qualidade perceptual na compressão de imagem.
― 6 min ler
Um novo framework simplifica a animação a partir de imagens usando cliques e comandos curtos.
― 9 min ler
Apresentando o REPAIR pra melhorar a precisão de pareamento de dados em ambientes barulhentos.
― 7 min ler
Um novo método melhora a descoberta de categorias combinando informações visuais e textuais.
― 8 min ler
A ProMark oferece um método pra atribuir as imagens geradas às suas fontes originais.
― 6 min ler
Os robôs aprendem a encontrar objetos em movimento em ambientes dinâmicos de forma eficaz.
― 9 min ler
HandFormer melhora o reconhecimento de ações usando poses de mão em 3D e imagens.
― 7 min ler
Mamba mostra um potencial forte na análise de vídeo em comparação com os transformers.
― 7 min ler
Um novo método melhora o alinhamento de modelos corporais 3D com imagens 2D.
― 6 min ler
Um novo codificador de texto enfrenta desafios na renderização de texto visual.
― 5 min ler
PosSAM melhora a segmentação de imagens com capacidades de vocabulário aberto e técnicas inovadoras.
― 7 min ler
Um novo método melhora a precisão dos nomes em conjuntos de dados de segmentação de imagens.
― 7 min ler
Um novo método melhora as funções de segurança em sistemas de IA multimodal sem precisar de muito treinamento.
― 7 min ler
SkateFormer melhora o reconhecimento de ações humanas com técnicas avançadas de análise conjunta e atenção.
― 8 min ler
Explorando como os traços em esboços influenciam a tomada de decisão da IA.
― 5 min ler
Um novo framework bayesiano melhora a qualidade da imagem e estima a incerteza.
― 7 min ler
Um método pra avaliar a transferibilidade de modelos pré-treinados pra detecção de objetos.
― 5 min ler
Um novo método separa elementos em movimento e estáticos em ambientes urbanos.
― 9 min ler
RAIN-GS melhora o desempenho do 3DGS com técnicas de inicialização e filtragem melhores.
― 8 min ler
AVIBench testa os LVLMs pra garantir que eles aguentam instruções visuais desafiadoras.
― 9 min ler
O SELECTOR usa dados diversos pra prever com precisão a sobrevivência de pacientes com câncer.
― 10 min ler
O Switch-DiT melhora a geração de imagens através de relações inovadoras de tarefas de desruído.
― 7 min ler
Esse artigo discute métodos pra melhorar a resistência do deep learning a exemplos adversariais.
― 7 min ler
Melhorando a robustez contra ataques adversariais em modelos de visão-linguagem.
― 5 min ler
Um novo método melhora a detecção de objetos lidando com mudanças de domínio usando mecanismos de atenção.
― 8 min ler
Uma abordagem nova melhora a representação de formas em dados 3D complexos.
― 7 min ler
Novas técnicas melhoram a qualidade e a velocidade das imagens de CBCT para resultados melhores pros pacientes.
― 8 min ler
Um novo método melhora a correspondência entre imagens de câmeras visíveis e infravermelhas.
― 7 min ler
Esse estudo melhora a detecção de AU facial usando dados sintéticos pra ter mais precisão e justiça.
― 6 min ler
Um novo método melhora imagens realistas de humanos focando na geração das mãos.
― 7 min ler
Novo método de marca d'água fortalece a proteção dos modelos de aprendizado de máquina contra roubo.
― 8 min ler
InterLUDE melhora o desempenho do modelo usando dados rotulados e não rotulados.
― 8 min ler
O PALM melhora a adaptabilidade dos modelos de visão computacional em ambientes que mudam.
― 9 min ler