Guiming Hardy Chen

Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.

2025-09-07T05:12:36+00:00 ― 7 min ler

Novos benchmarks revelam desafios para MLLMs em tarefas do mundo real com contextos longos.

2025-08-15T10:16:00+00:00 ― 9 min ler