Artigos mais recentes para CLIP

Visão computacional e reconhecimento de padrões Avanços em Aprendizado Incremental de Classe com Poucos Exemplos

Novo método melhora o aprendizado de novas classes com menos dados.

2025-09-19T01:52:24+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões ProText: Um Novo Método para Modelos de Visão-Linguagem

ProText melhora modelos de visão-linguagem usando dados só de texto pra lidar melhor com as tarefas.

2025-09-18T23:22:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Legenda de Imagens Zero-Shot

Um olhar sobre o framework MacCap e seu impacto na legendagem de imagens.

2025-09-18T23:06:30+00:00 ― 6 min ler

Aprendizagem de máquinas Simplificando Dados Complexos com SpLiCE

SpLiCE ajuda a esclarecer os dados densos do CLIP pra facilitar a compreensão.

2025-09-07T13:54:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Deepfake Usando CLIP

Aproveitar os componentes visuais e de texto do CLIP melhora os métodos de detecção de deepfake.

2025-09-05T22:47:42+00:00 ― 9 min ler

Inteligência Artificial Melhorando a Compreensão dos Robôs sobre Instruções Humanas

Um novo método ajuda os robôs a interpretar comandos humanos de forma mais eficaz.

2025-09-03T19:03:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões PosSAM: Um Passo à Frente na Segmentação de Imagens

PosSAM melhora a segmentação de imagens com capacidades de vocabulário aberto e técnicas inovadoras.

2025-08-29T12:15:18+00:00 ― 7 min ler

Biologia Celular Avanços em SNAP-PROTACs para Estudo de Proteínas

SNAP-PROTACs melhoram o estudo de proteínas e técnicas de degradação direcionada.

2025-08-23T06:39:38+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Estrutura Inovadora para Segmentação de Imagens Médicas

SaLIP combina SAM e CLIP para uma segmentação de imagens médicas eficiente.

2025-08-21T01:29:18+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Geração de Imagens a Partir de Texto com Modelos de Linguagem

Um método pra melhorar a geração de imagens usando Modelos de Linguagem Grandes.

2025-08-09T12:27:42+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Método Inovador para Entender Vídeos com Representação Textual

Uma nova abordagem alinha modelos de linguagem com conteúdo de vídeo usando simulações textuais.

2025-08-09T01:39:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Interpretando Vision Transformers com Insights Textuais

Uma estrutura pra conectar processamento de imagem e interpretação de texto em modelos de visão.

2025-08-03T05:02:42+00:00 ― 7 min ler

Multimédia Melhorando a Detecção de Fake News com Análise de Mídias Sociais

Um método pra melhorar a identificação de fake news usando interações nas redes sociais.

2025-07-28T17:38:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões WeCLIP: Novo Método para Segmentação Semântica

O WeCLIP melhora a segmentação fraca supervisionada usando o CLIP com o mínimo de esforço de rotulagem.

2025-07-28T09:44:30+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando a Adaptação de Domínio Não Supervisionada com CLIP-Div

Uma nova abordagem para melhorar a performance de UDA usando CLIP e orientação de linguagem.

2025-07-21T22:46:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Imagens com SiD e LSG

Novos métodos melhoram a velocidade e a qualidade da geração de imagens a partir de texto.

2025-07-20T16:56:16+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos CLIP com o Método CLIP-CITE

CLIP-CITE melhora os modelos CLIP para tarefas específicas, mantendo a flexibilidade.

2025-07-19T10:28:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões FALIP: Atenção Avançada para CLIP

O FALIP melhora a compreensão de imagem e texto do CLIP sem mudar os originais.

2025-07-18T02:20:24+00:00 ― 6 min ler

Neurónios e Cognição Ferramenta inovadora conecta comunicação para pacientes com lesão cerebral

Nova tecnologia ajuda pacientes a expressar pensamentos através de sinais de EEG.

2025-07-17T03:03:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões NOVIC: Uma Nova Abordagem para Classificação de Imagens

O NOVIC apresenta capacidades de vocabulário aberto para identificar objetos não vistos em imagens.

2025-07-13T12:47:36+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Endereçando a Agrupamento de Texto na Detecção de Anomalias

Um novo método melhora a detecção de anomalias ao lidar com agrupamento de texto em modelos.

2025-07-07T11:02:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Automatizando o Controle de Estoque de Livros com Reconhecimento de Imagens

Um novo método melhora a correspondência de livros para catálogos de bibliotecas usando técnicas avançadas.

2025-07-05T08:52:24+00:00 ― 7 min ler

Robótica Avanços no Processamento de Linguagem dos Robôs

Um novo sistema melhora a habilidade dos robôs de seguir comandos em linguagem de forma eficaz.

2025-07-05T05:27:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Segmentação de Vocabulário Aberto com MAFT+

O framework MAFT+ melhora a segmentação de objetos usando otimização colaborativa de visão e texto.

2025-07-03T21:35:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Classificação de Nuvens de Pontos com o PPCITNet

Uma nova rede melhora a classificação de nuvens de pontos através da tradução de imagens.

2025-06-30T19:03:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Interação Humano-Objeto Sem Treinamento Prévio

A HOIGen apresenta um novo método para reconhecer interações humanas com objetos que ainda não foram vistas.

2025-06-28T20:58:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando Modelos de Imagem e Texto com CLIP-CID

O CLIP-CID melhora a eficiência dos dados em modelos de visão-linguagem.

2025-06-26T06:57:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Análise de Imagens Médicas com o Framework ViP

Um novo modelo melhora a análise de imagens médicas usando sintomas visuais e técnicas avançadas de prompt.

2025-06-19T23:25:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos de Linguagem Visual em Tarefas de Engenharia de Transporte

Este estudo avalia VLMs para congestionamento de tráfego, detecção de rachaduras e conformidade com capacetes.

2025-06-18T00:24:42+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Compreensão de Exibições de Museu com MUZE

Um novo método melhora a compreensão das exposições de museus usando a tecnologia CLIP.

2025-06-17T15:27:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões IA vs. Humanos em Reconhecimento de Formas 3D

Estudo compara as habilidades humanas e de IA em reconhecer formas 3D a partir de diferentes ângulos.

2025-06-15T02:45:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Entendendo os Modelos CLIP: Uma Nova Abordagem

Esse artigo mostra como interpretar modelos semelhantes ao CLIP na IA.

2025-06-14T07:16:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando o Desempenho do CLIP com Adaptadores Leves

Esse trampo melhora a precisão do CLIP resolvendo a sobreposição intra-modal com adaptadores leves.

2025-06-10T17:41:24+00:00 ― 6 min ler

Computação e linguagem Uma Nova Maneira de Adicionar Conhecimento Visual aos Modelos de Linguagem

Pesquisadores apresentam o Blind-VaLM, melhorando modelos de linguagem com conhecimento visual de forma eficiente.

2025-06-10T13:52:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos de Texto para Imagem com VLEU

Um novo método pra avaliar o desempenho de modelos T2I em diferentes solicitações de texto.

2025-06-07T05:01:42+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanços no Rastreamento Visual de Objetos com o PiVOT

PiVOT melhora o rastreamento de objetos usando prompts visuais e CLIP pra uma precisão melhor.

2025-06-01T01:45:55+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões SuperClasse: Uma Nova Maneira de os Computadores Verem

O SuperClass facilita o reconhecimento de imagens e textos pra deixar a pesquisa mais de boa.

2025-05-30T14:43:48+00:00 ― 8 min ler

Aprendizagem de máquinas As peculiaridades e desafios dos modelos de visão-linguagem

Uma visão geral das forças e fraquezas dos Modelos de Visão-Linguagem de hoje.

2025-05-28T19:26:51+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Detecção de Anomalias Zero-Shot em Imagens Médicas

Esse artigo analisa técnicas de zero-shot para detectar anomalias em imagens médicas.

2025-05-23T06:07:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Segmentação de Imagens com Trident

O Trident junta modelos pra melhorar a segmentação de imagem e o reconhecimento de detalhes.

2025-05-23T03:43:39+00:00 ― 6 min ler