Ming Yan

Um novo método melhora a eficiência e o desempenho em tarefas de visão-linguagem.

2025-10-19T07:53:00+00:00 ― 7 min ler

Uma nova abordagem melhora a eficiência em tarefas de pré-treinamento de Visão-Linguagem.

2025-10-11T17:07:48+00:00 ― 7 min ler

Um novo método melhora a detecção de posição para modelos de linguagem menores usando conhecimento externo.

2025-10-02T00:28:30+00:00 ― 5 min ler

Um novo modelo melhora a recuperação de sinais esparsos em ambientes barulhentos.

2025-09-27T17:32:57+00:00 ― 8 min ler

O TRIPS melhora a eficiência em tarefas de visão-linguagem selecionando partes de imagem relevantes.

2025-09-17T20:38:36+00:00 ― 8 min ler

Uma nova abordagem usando sistemas multiagente pra melhorar modelos de linguagem menores.

2025-09-17T04:26:54+00:00 ― 7 min ler

Esse artigo fala sobre uma nova estrutura pra avaliar alucinações em LVLMs.

2025-09-04T12:02:06+00:00 ― 8 min ler

Um novo benchmark avalia como os agentes de RPG interagem socialmente.

2025-08-27T12:43:24+00:00 ― 8 min ler

Um novo framework melhora como os agentes de linguagem aprendem e realizam tarefas.

2025-08-27T05:28:54+00:00 ― 7 min ler

Uma nova estrutura melhora a eficiência e a precisão na resolução de problemas físicos complexos.

2025-08-01T22:06:12+00:00 ― 8 min ler

O MIBench testa o desempenho de modelos multimodais em várias imagens.

2025-07-09T14:23:18+00:00 ― 7 min ler

mPLUG-Owl3 melhora a compreensão de imagens e vídeos pra dar respostas melhores.

2025-06-30T17:13:12+00:00 ― 8 min ler

Um novo método pra combinar modelos de linguagem de forma mais eficiente.

2025-06-29T22:23:30+00:00 ― 7 min ler

MaVEn melhora a capacidade da IA de processar várias imagens pra dar um raciocínio melhor.

2025-06-23T15:38:00+00:00 ― 7 min ler