Este artigo analisa a robustez do CLIP em vários desafios.
― 6 min ler
Ciência de ponta explicada de forma simples
Este artigo analisa a robustez do CLIP em vários desafios.
― 6 min ler
Uma nova abordagem reduz o viés em modelos de aprendizado de máquina com desbalanceamento de classes.
― 6 min ler
Um estudo mostra como a dificuldade das tarefas afeta o treinamento em modelos de difusão.
― 10 min ler
A SCILLA oferece uma nova forma de criar modelos urbanos 3D detalhados a partir de imagens 2D.
― 8 min ler
HawkEye melhora modelos de vídeo-texto pra processar vídeos mais longos de forma eficaz.
― 6 min ler
Um novo método permite nomear objetos sem categorias pré-definidas durante o teste.
― 9 min ler
Explora como novos métodos estão transformando imagens paradas em vídeos em movimento.
― 8 min ler
Novos métodos usando movimento dos olhos podem ajudar a diagnosticar a Doença de Alzheimer mais cedo.
― 8 min ler
KP-RED melhora a modelagem 3D usando pontos chave pra ter mais precisão e eficiência.
― 7 min ler
A CrossGLG melhora o reconhecimento de ações usando dados de esqueleto 3D e descrições em texto.
― 6 min ler
O Uni-SMART melhora a compreensão da literatura científica analisando diferentes tipos de dados.
― 6 min ler
Analisando questões de memorização em imagens geradas por IA e suas implicações.
― 6 min ler
RG-LCD melhora a geração de imagens a partir de texto, se alinhando com as preferências humanas de forma eficaz.
― 8 min ler
N2F2 melhora a interpretação de imagens pela máquina com uma análise em múltiplos níveis e integração de linguagem.
― 7 min ler
Um novo método melhora a precisão da calibração para radares MIMO e sensores ópticos em distâncias curtas.
― 8 min ler
Novo framework melhora a previsão de intenção de pedestres para carros autônomos.
― 6 min ler
Este artigo analisa os pontos fortes e fracos do modelo VMamba.
― 6 min ler
Um novo método pra melhorar a qualidade da imagem durante os testes de IA.
― 7 min ler
Um novo método pra gerar visões a partir de menos imagens.
― 10 min ler
Um método pra reduzir redundância em representações de dados multi-visão.
― 7 min ler
O G-NoCL usa modelos generativos pra melhorar o aprendizado contínuo sem precisar de muita informação rotulada.
― 8 min ler
Um novo método melhora a robustez do modelo, mantendo o desempenho nas tarefas do mundo real.
― 7 min ler
Um novo método melhora a qualidade dos conjuntos de dados de segmentação semântica.
― 6 min ler
Aprenda como mapas de saliência melhoram a geração de imagens e vídeos.
― 6 min ler
Um novo método pra classificar imagens de sonar usando menos rótulos.
― 7 min ler
Aprenda como cabeçotes de projeção melhoram modelos de aprendizado de máquina.
― 7 min ler
Um novo método melhora a eficiência e a adaptabilidade do design de redes neurais em diferentes tarefas.
― 7 min ler
Um novo framework melhora a estimação de pose humana em 3D usando dois aumentadores de pose.
― 8 min ler
Apresentando o SQ-LLaVA, um método que melhora a pergunta e a compreensão de imagens.
― 8 min ler
O StyleSketch transforma fotos em esboços de alta qualidade usando poucos dados.
― 6 min ler
Uma olhada na Atenção Adaptativa Gaussiana para melhorar o desempenho da IA.
― 7 min ler
Um novo modelo melhora o realismo em animações que envolvem interações humanas com objetos.
― 12 min ler
Um novo modelo melhora a detecção de objetos em imagens de baixa qualidade em várias condições.
― 8 min ler
Um novo método pra avaliar a qualidade da imagem sem precisar de avaliações humanas tá mostrando resultados promissores.
― 9 min ler
O ColorVideoVDP melhora a forma como medimos a qualidade de imagem e vídeo.
― 9 min ler
Explorando o impacto dos Modelos de Difusão nas leis de direitos autorais para artistas.
― 7 min ler
Uma visão geral de estratégias para melhorar a precisão do matching denso.
― 5 min ler
Pesquisadores estão usando dados sintéticos pra melhorar a estimativa de pose humana.
― 7 min ler
Um novo método auto-supervisionado melhora a detecção de objetos comuns em várias imagens.
― 7 min ler
Explorando o novo método SPDInv pra melhorar a edição de imagens.
― 8 min ler