Avaliação de LLMs emAvaliação de LLMs emAmbientes de Jogoequipe.habilidades de LLM e trabalho emNovo referencial para avaliarComputação e linguagemAvaliação de Modelos de Linguagem Grandes em Ambientes Multi-AgenteNovo benchmark avalia as habilidades dos LLMs em interagir com múltiplos agentes.2025-09-04T00:58:30+00:00 ― 13 min ler