Artigos mais recentes para Modelos de visão-linguagem

Visão computacional e reconhecimento de padrões Um Novo Método para Avaliar a Segurança das Estradas

Sistema inovador usa modelos avançados para avaliações eficazes de segurança no trânsito.

2025-06-25T03:26:48+00:00 ― 6 min ler

Computação e linguagem Avanços em Modelos de Visão-Linguagem para Raciocínio Visual

Esse artigo analisa o progresso dos modelos de visão-linguagem e suas capacidades de raciocínio.

2025-06-21T17:48:48+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços em Ancoragem Temporal de Vídeo Sem Treinamento

Um novo método localiza eventos em vídeos usando grandes modelos pré-treinados sem treinamento específico.

2025-06-21T04:30:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Analisando o MAPWise: Um Novo Conjunto de Dados para Modelos de Visão-Linguagem

O dataset MAPWise desafia modelos com perguntas baseadas em mapas e avalia suas habilidades de raciocínio.

2025-06-19T21:42:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Aprimorando o Sensoriamento Remoto com RS-TransCLIP

Novo método melhora a precisão na classificação de cenas de sensoriamento remoto usando relações contextuais.

2025-06-18T21:44:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Classificação de Tecidos com Modelos de Visão-Linguagem

Um novo método melhora a classificação de tecidos cancerígenos usando modelos de visão-linguagem.

2025-06-17T18:29:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Segmentação de Vocabulário Aberto

Um novo método melhora a precisão da segmentação usando os modelos SAM e CLIP.

2025-06-16T13:23:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos de Visão-Linguagem na Classificação de Arte

Estudo investiga como VLMs classificam estilos de arte e atributos.

2025-06-16T13:15:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Modelos de Visão-Linguagem Através do RPP

RPP melhora o ajuste e a generalização em Modelos de Visão-Linguagem usando prompts refinados.

2025-06-15T05:47:18+00:00 ― 9 min ler

Robótica Avanços nas Técnicas de Agarrou Robótico

Novos métodos melhoram como os robôs pegam objetos planos.

2025-06-14T20:50:06+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Segmentação de Vocabulário Aberto com Modelos de Visão-Linguagem

Novos adaptadores aumentam as capacidades de segmentação de imagem dos modelos de visão-linguagem.

2025-06-13T09:01:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Visão-Linguagem com Alinhamento Composicional

Uma nova abordagem aprimora a conexão entre imagens e texto em VLMs.

2025-06-13T05:12:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanço nas Previsões de Resultados do Câncer com Modelos de Visão-Linguagem

Uma nova abordagem melhora a análise de sobrevivência na pesquisa do câncer usando dados visuais e de linguagem.

2025-06-12T00:45:48+00:00 ― 9 min ler

Robótica HiFi-CS: Avanço na Pegada de Objetos por Robôs com Linguagem

Um novo método melhora a habilidade de pegada dos robôs usando comandos em linguagem natural.

2025-06-11T09:29:24+00:00 ― 7 min ler

Sistemas e Controlo Avanços em Carros Autônomos com Modelos de Linguagem

Explorando como modelos de linguagem melhoram as tecnologias de direção autônoma.

2025-06-09T23:31:55+00:00 ― 9 min ler

Robótica Avanços na Navegação de Robôs com Modelos de Linguagem Visuais

Pesquisas mostram como os robôs conseguem navegar melhor usando plantas baixas e modelos de linguagem visual.

2025-06-09T10:13:18+00:00 ― 8 min ler

Robótica Avanços na Tecnologia de Aspiradores Inteligentes

Novos métodos melhoram a eficiência e as habilidades de aprendizado dos aspiradores inteligentes.

2025-06-08T09:12:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o SMART: Uma Nova Abordagem para Segmentação de Imagens

O SMART melhora a segmentação de vocabulário aberto ao aprimorar as técnicas de classificação de máscaras.

2025-06-06T22:26:42+00:00 ― 7 min ler

Aprendizagem de máquinas Melhorando Sistemas de Recompensa em Aprendizado por Reforço

Esse estudo apresenta o BiMI pra melhorar sistemas de recompensa em aprendizado por reforço.

2025-06-06T14:01:06+00:00 ― 7 min ler

Robótica Robotic-CLIP: Avançando Robôs com Aprendizado em Vídeo

Novo modelo permite que robôs aprendam ações a partir de vídeos, melhorando o desempenho nas tarefas.

2025-06-04T20:01:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Modelos de Visão-Linguagem

Uma nova estrutura melhora a conexão entre imagens e texto.

2025-06-03T20:03:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avançando a Segmentação Semântica com Imagens Não Rotuladas

Um novo método melhora o reconhecimento de objetos usando máscaras sem rótulos detalhados.

2025-06-03T14:39:18+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando Modelos de Visão-Linguagem com Rótulos Barulhentos

Um jeito de melhorar o desempenho do modelo, mesmo com rótulos de dados errados.

2025-06-03T11:06:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Misturando Criatividade e Precisão em Modelos de IA

Uma nova estratégia combina treinamento generativo e discriminativo em Modelos de Visão-Linguagem.

2025-06-02T08:06:30+00:00 ― 5 min ler

Inteligência Artificial Os Modelos de Linguagem Visual entendem gráficos como humanos?

A pesquisa examina como os VLMs interpretam e entendem gráficos em comparação com as habilidades humanas.

2025-06-02T06:55:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Linguagem Visual com Orientação Direcional

Uma nova abordagem pra melhorar os VLMs e dar uma mão pros usuários com deficiência visual.

2025-06-01T14:35:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Consertando Erros em Modelos de Visão-Linguagem

Aprenda como melhorar modelos de imagem-texto e reduzir erros comuns.

2025-05-29T14:09:09+00:00 ― 7 min ler

Robótica Uma Forma Mais Esperta dos Robôs Aprenderem

Agora os robôs conseguem aprender tarefas melhor através da rotulagem de recompensas automatizada.

2025-05-28T22:55:39+00:00 ― 8 min ler

Aprendizagem de máquinas As peculiaridades e desafios dos modelos de visão-linguagem

Uma visão geral das forças e fraquezas dos Modelos de Visão-Linguagem de hoje.

2025-05-28T19:26:51+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões LLaVA: Uma Abordagem Mais Esperta para Responder Perguntas Visuais

LLaVA melhora a Resposta a Perguntas Visuais misturando a potência local do dispositivo com o processamento em nuvem.

2025-05-27T21:02:42+00:00 ― 10 min ler

Robótica Simplificando a Navegação de Robôs com Modelos de Visão-Linguagem

Um olhar sobre como o VLM melhora as tarefas de navegação dos robôs.

2025-05-27T16:54:45+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanço no Diagnóstico de Pele com Novo Método de Duas Etapas

Um novo método melhora a precisão e transparência no diagnóstico de lesões de pele para os médicos.

2025-05-27T12:33:45+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Entendendo Modelos de Visão-Linguagem: Uma Imersão Profunda

Uma visão geral do treinamento de modelos de linguagem e visão e sua importância.

2025-05-26T17:51:27+00:00 ― 8 min ler

Inteligência Artificial O Futuro dos Carros Autônomos Personalizados

Carros autônomos estão se adaptando às suas preferências pra uma viagem mais segura.

2025-05-21T09:31:57+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Ancoragem de GUI com Prompting Visual

Um novo método melhora a compreensão dos elementos da tela pelos computadores.

2025-05-20T21:21:09+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Ensinando Máquinas a Encontrar Objetos em Imagens

As máquinas aprendem a localizar objetos em imagens usando técnicas inovadoras.

2025-05-16T08:04:00+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões FOCUS: Uma Nova Maneira de Identificar Objetos

A FOCUS simplifica o reconhecimento de objetos com técnicas de comunicação fáceis de usar.

2025-05-11T13:38:40+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Ensinando computadores a reconhecer com palavras

Um novo método ajuda os computadores a identificar objetos usando menos imagens e uma linguagem simples.

2025-05-07T18:26:40+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Entendendo o GEOBench-VLM: Um Benchmark para Modelos de Visão-Linguagem

O GEOBench-VLM avalia modelos para interpretar dados e imagens geoespaciais.

2025-05-02T20:38:40+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões COSMOS: Ligando Visão e Linguagem

O COSMOS melhora a capacidade da IA de entender imagens e texto juntos.

2025-04-25T14:46:45+00:00 ― 7 min ler