Novo método melhora o aprendizado de novas classes com menos dados.
― 5 min ler
Ciência de ponta explicada de forma simples
Novo método melhora o aprendizado de novas classes com menos dados.
― 5 min ler
ProText melhora modelos de visão-linguagem usando dados só de texto pra lidar melhor com as tarefas.
― 7 min ler
Um olhar sobre o framework MacCap e seu impacto na legendagem de imagens.
― 6 min ler
SpLiCE ajuda a esclarecer os dados densos do CLIP pra facilitar a compreensão.
― 6 min ler
Aproveitar os componentes visuais e de texto do CLIP melhora os métodos de detecção de deepfake.
― 9 min ler
Um novo método ajuda os robôs a interpretar comandos humanos de forma mais eficaz.
― 6 min ler
PosSAM melhora a segmentação de imagens com capacidades de vocabulário aberto e técnicas inovadoras.
― 7 min ler
SNAP-PROTACs melhoram o estudo de proteínas e técnicas de degradação direcionada.
― 7 min ler
SaLIP combina SAM e CLIP para uma segmentação de imagens médicas eficiente.
― 5 min ler
Um método pra melhorar a geração de imagens usando Modelos de Linguagem Grandes.
― 9 min ler
Uma nova abordagem alinha modelos de linguagem com conteúdo de vídeo usando simulações textuais.
― 7 min ler
Uma estrutura pra conectar processamento de imagem e interpretação de texto em modelos de visão.
― 7 min ler
Um método pra melhorar a identificação de fake news usando interações nas redes sociais.
― 8 min ler
O WeCLIP melhora a segmentação fraca supervisionada usando o CLIP com o mínimo de esforço de rotulagem.
― 9 min ler
Uma nova abordagem para melhorar a performance de UDA usando CLIP e orientação de linguagem.
― 7 min ler
Novos métodos melhoram a velocidade e a qualidade da geração de imagens a partir de texto.
― 6 min ler
CLIP-CITE melhora os modelos CLIP para tarefas específicas, mantendo a flexibilidade.
― 7 min ler
O FALIP melhora a compreensão de imagem e texto do CLIP sem mudar os originais.
― 6 min ler
Nova tecnologia ajuda pacientes a expressar pensamentos através de sinais de EEG.
― 7 min ler
O NOVIC apresenta capacidades de vocabulário aberto para identificar objetos não vistos em imagens.
― 9 min ler
Um novo método melhora a detecção de anomalias ao lidar com agrupamento de texto em modelos.
― 6 min ler
Um novo método melhora a correspondência de livros para catálogos de bibliotecas usando técnicas avançadas.
― 7 min ler
Um novo sistema melhora a habilidade dos robôs de seguir comandos em linguagem de forma eficaz.
― 6 min ler
O framework MAFT+ melhora a segmentação de objetos usando otimização colaborativa de visão e texto.
― 6 min ler
Uma nova rede melhora a classificação de nuvens de pontos através da tradução de imagens.
― 8 min ler
A HOIGen apresenta um novo método para reconhecer interações humanas com objetos que ainda não foram vistas.
― 7 min ler
O CLIP-CID melhora a eficiência dos dados em modelos de visão-linguagem.
― 8 min ler
Um novo modelo melhora a análise de imagens médicas usando sintomas visuais e técnicas avançadas de prompt.
― 7 min ler
Este estudo avalia VLMs para congestionamento de tráfego, detecção de rachaduras e conformidade com capacetes.
― 5 min ler
Um novo método melhora a compreensão das exposições de museus usando a tecnologia CLIP.
― 8 min ler
Estudo compara as habilidades humanas e de IA em reconhecer formas 3D a partir de diferentes ângulos.
― 6 min ler
Esse artigo mostra como interpretar modelos semelhantes ao CLIP na IA.
― 7 min ler
Esse trampo melhora a precisão do CLIP resolvendo a sobreposição intra-modal com adaptadores leves.
― 6 min ler
Pesquisadores apresentam o Blind-VaLM, melhorando modelos de linguagem com conhecimento visual de forma eficiente.
― 7 min ler
Um novo método pra avaliar o desempenho de modelos T2I em diferentes solicitações de texto.
― 9 min ler
PiVOT melhora o rastreamento de objetos usando prompts visuais e CLIP pra uma precisão melhor.
― 6 min ler
O SuperClass facilita o reconhecimento de imagens e textos pra deixar a pesquisa mais de boa.
― 8 min ler
Uma visão geral das forças e fraquezas dos Modelos de Visão-Linguagem de hoje.
― 6 min ler
Esse artigo analisa técnicas de zero-shot para detectar anomalias em imagens médicas.
― 8 min ler
O Trident junta modelos pra melhorar a segmentação de imagem e o reconhecimento de detalhes.
― 6 min ler