Comparando Modelos deComparando Modelos deLinguagemLLM em pesquisas.Novo padrão pra testar o desempenho deComputação e linguagemAvaliação de Modelos de Linguagem para Pesquisa CientíficaUm novo padrão pra avaliar grandes modelos de linguagem em testes de hipótese.2025-07-21T19:52:24+00:00 ― 8 min ler