Shunian Chen

Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.

2025-09-07T05:12:36+00:00 ― 7 min ler

Novos benchmarks revelam desafios para MLLMs em tarefas do mundo real com contextos longos.

2025-08-15T10:16:00+00:00 ― 9 min ler

LongLLaVA melhora a compreensão de várias imagens para várias aplicações.

2025-06-17T07:57:12+00:00 ― 5 min ler

O método TRIM reduz os tokens de imagem em modelos de linguagem multimodal, mantendo o desempenho.

2025-06-10T11:06:24+00:00 ― 6 min ler

Um novo framework identifica quando modelos multimodais usam dados de treinamento inadequados.

2025-05-29T07:11:33+00:00 ― 6 min ler