RPP melhora o ajuste e a generalização em Modelos de Visão-Linguagem usando prompts refinados.
― 9 min ler
Ciência de ponta explicada de forma simples
RPP melhora o ajuste e a generalização em Modelos de Visão-Linguagem usando prompts refinados.
― 9 min ler
Explorando métodos pra melhorar a qualidade de imagem afetada pela turbulência atmosférica.
― 8 min ler
Combinar imagens RGB e dados de eventos melhora a clareza nas reconstruções em 3D.
― 8 min ler
DiffusionPen gera um texto manuscrito realista capturando estilos de escrita únicos.
― 7 min ler
Um novo método melhora a reconstrução 3D a partir de vídeos endoscópicos para aplicações cirúrgicas.
― 7 min ler
Esse método melhora os conjuntos de dados de treinamento pra um desempenho melhor na segmentação de imagens.
― 7 min ler
Um novo método pra melhorar a recriação de cenas 3D a partir de imagens com menos erro.
― 5 min ler
Um novo método melhora a eficiência do planejamento de movimento de robôs usando simulações e dados de especialistas.
― 8 min ler
Uma nova estrutura permite cenários de tráfego realistas para testar carros autônomos.
― 6 min ler
Estudo compara as habilidades humanas e de IA em reconhecer formas 3D a partir de diferentes ângulos.
― 6 min ler
Uma nova abordagem pra melhorar cenas 3D com física.
― 7 min ler
Analisando como modelos de visão computacional podem se alinhar com a compreensão visual humana.
― 6 min ler
Um novo método melhora a clareza no diálogo usando expressões de referência eficazes.
― 7 min ler
Novos métodos aumentam a precisão no reconhecimento de escrita à mão através da integração de Relaxation Labelling.
― 7 min ler
A CerviXpert quer melhorar a detecção do câncer de colo de útero usando menos recursos.
― 9 min ler
Novo método melhora o aprendizado contínuo em detecção de objetos.
― 8 min ler
Uma nova abordagem melhora o reconhecimento em iluminação desafiadora para sistemas de segurança.
― 6 min ler
Métodos avançados melhoram a precisão na estimativa de alturas de árvores pra uma gestão florestal melhor.
― 8 min ler
Um novo conjunto de dados tem como objetivo melhorar os métodos de detecção de morphing facial.
― 8 min ler
Pesquisadores melhoram a geração de dados através do estudo de Autoencoders Variacionais Hierárquicos Condicionais.
― 5 min ler
Essa pesquisa tem o objetivo de criar CAPTCHAs que confundem máquinas, mas são claros para os humanos.
― 6 min ler
Um olhar sobre as melhorias e desafios na navegação de máquinas usando visão e linguagem.
― 5 min ler
HESSO simplifica a compressão de modelos, deixando as redes neurais mais eficientes sem perder performance.
― 8 min ler
Usando imagens de satélite e aprendizado de máquina pra classificar terrenos com precisão.
― 6 min ler
Um novo framework melhora a detecção de objetos identificando instâncias fora da distribuição usando protótipos.
― 7 min ler
Um estudo sobre como melhorar a segurança dos pedestres usando modelos de previsão de comportamento.
― 6 min ler
Apresentando um novo método pra segmentar lesões de pele com precisão usando técnicas avançadas.
― 9 min ler
AstroMAE usa autoencoders mascarados pra melhorar as previsões de desvio vermelho na astronomia.
― 9 min ler
A KRONC oferece um jeito rápido de estimar as posições das câmeras usando pontos-chave nos veículos.
― 6 min ler
Um estudo sobre como o Mamba se sai contra os Transformers em tarefas de imagem-texto.
― 8 min ler
Uma nova abordagem melhora a segmentação com dados rotulados limitados.
― 6 min ler
Uma abordagem nova pra criar layouts de quartos 3D a partir de entrada 2D.
― 6 min ler
Uma nova abordagem melhora a dublagem visual ao aprimorar a sincronia labial e a singularidade dos falantes.
― 7 min ler
Um novo método melhora o diagnóstico de tumores cerebrais enquanto protege a privacidade dos pacientes.
― 6 min ler
A competição mostra as iniciativas pra modelos de direção mais seguros em condições adversas.
― 6 min ler
Uma nova ferramenta estima a pressão da artéria pulmonar usando vídeos de imagem do coração.
― 7 min ler
Apresentando o ERF-CondLaneNet pra melhorar a detecção de faixas em situações de estrada complicadas.
― 7 min ler
Esse estudo apresenta um modelo que aprende simulações a partir de vídeo.
― 6 min ler
Um novo conjunto de dados e competição estão avançando os métodos de detecção de deepfake pra segurança digital.
― 6 min ler
Descubra os benefícios da Compressão de Representação de Vídeo Neural para um manuseio de vídeo eficiente.
― 7 min ler