Um novo método melhora o desempenho dos Transformers de Visão em conjuntos de dados desbalanceados.
― 9 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora o desempenho dos Transformers de Visão em conjuntos de dados desbalanceados.
― 9 min ler
Pesquisas mostram maneiras de melhorar sistemas de texto para imagem de forma eficiente e econômica.
― 7 min ler
Este estudo analisa a eficácia de vários algoritmos para detectar aeronaves em imagens de satélite.
― 7 min ler
ProtoVerse melhora a interpretabilidade na classificação de fraturas vertebrais usando deep learning.
― 8 min ler
O dataset MuLAn melhora o controle na geração de imagens a partir de texto com anotações em camadas.
― 7 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler
Explorando o impacto da aproximação de matriz de baixa classificação na imagem médica.
― 7 min ler
Novo framework melhora a explicabilidade em sistemas de aprendizado profundo.
― 7 min ler
Novos métodos visam manter as imagens seguras contra manipulação e uso indevido.
― 7 min ler
O TSNet melhora a qualidade da imagem em condições de neblina usando uma abordagem de rede em duas etapas.
― 11 min ler
A VAR tá revolucionando a geração de imagens com qualidade e eficiência melhoradas.
― 7 min ler
Discute os riscos de privacidade no aprendizado auto-supervisionado e apresenta o PartCrop.
― 7 min ler
Esse artigo explora como os dados de treino afetam o desempenho do modelo em sistemas multimodais.
― 8 min ler
Um novo modelo melhora o diagnóstico automatizado de raios-X do peito através de aprendizado auto-supervisionado.
― 8 min ler
Um novo modelo melhora a detecção de linfonodos em tomografias para um diagnóstico de câncer mais preciso.
― 7 min ler
Um novo método melhora a previsão de movimento para veículos autônomos, focando na segurança e na incerteza.
― 8 min ler
Uma olhada nos métodos de segmentação de imagem e sua eficácia.
― 8 min ler
Um novo método pra identificar e descrever objetos em vídeos.
― 8 min ler
Esse trabalho foca em apagar conceitos indesejados dos modelos de texto para imagem.
― 9 min ler
Um novo método melhora os modelos de texto para imagem para uma representação de identidade melhor.
― 6 min ler
Novo framework melhora a qualidade e flexibilidade na geração de cenas 3D.
― 6 min ler
Este estudo analisa a eficácia de imagens sintéticas em sistemas de reconhecimento facial.
― 7 min ler
COMO ajuda os computadores a entenderem ambientes usando uma única câmera.
― 8 min ler
Esse artigo fala sobre um método automatizado pra gerar trailers de filmes de forma eficiente.
― 8 min ler
O framework SPOT melhora a eficácia de agrupamento em conjuntos de dados desequilibrados usando pseudo-rótulos.
― 8 min ler
Novos métodos melhoram a sumarização de vídeos usando grandes conjuntos de dados e modelos avançados.
― 8 min ler
Novos métodos de análise de imagem melhoram a detecção e avaliação de risco do câncer de fígado.
― 8 min ler
Novo método melhora a compreensão da pose humana usando imagens geradas.
― 9 min ler
NegPrompt melhora a classificação de imagens ao detectar de forma eficaz imagens fora da distribuição.
― 5 min ler
LeGrad melhora a compreensão das previsões dos Vision Transformers através de heatmaps eficazes.
― 7 min ler
Analisando métodos pra melhorar o reconhecimento facial em diferentes grupos.
― 8 min ler
Combinar imagens e texto melhora a precisão na estimativa de profundidade 3D.
― 8 min ler
DiffuseMix melhora o aprendizado profundo ao criar imagens de treinamento diversas e de alta qualidade.
― 7 min ler
Os Vision Transformers usam autoatenção pra melhorar o desempenho em tarefas de visão computacional.
― 8 min ler
Koala melhora como os computadores entendem vídeos longos usando quadros-chave.
― 6 min ler
Uma nova abordagem 3D melhora a precisão do rastreamento de movimento em vídeos.
― 6 min ler
Esse artigo fala sobre uma nova estrutura para geração de imagens multi-sujeito distintas.
― 6 min ler
Um método pra ajudar os computadores a identificar propriedades físicas a partir de imagens.
― 10 min ler
Um novo método melhora a segmentação de imagens usando descrições de texto e pares de imagens.
― 5 min ler
Um novo método melhora modelos faciais em 3D capturando expressões sutis.
― 6 min ler