O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.
― 6 min ler
Ciência de ponta explicada de forma simples
O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.
― 6 min ler