Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.
― 7 min ler
Ciência de ponta explicada de forma simples
Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.
― 7 min ler
Novos benchmarks revelam desafios para MLLMs em tarefas do mundo real com contextos longos.
― 9 min ler