O que significa "QUEBRA-CABEÇA"?
Índice
BRAINTEASER é uma tarefa criada pra avaliar como os modelos de linguagem conseguem pensar de forma criativa. O foco são perguntas que pedem um raciocínio mais fora da caixa, em vez de lógica simples.
Estrutura da Tarefa
A tarefa tem dois tipos principais de perguntas:
- Quebra-cabeças de frases
- Quebra-cabeças de palavras
Essas perguntas são feitas pra desafiar o bom senso e fazer os modelos pensarem diferente.
Abordagem
Times diferentes encararam a tarefa de jeitos variados. Alguns ajustaram modelos de linguagem já existentes, como BERT e RoBERTa, pra melhorar o desempenho. Outros usaram uma técnica chamada few-shot prompting, que consiste em dar alguns exemplos pro modelo ajudar a responder as perguntas.
Desempenho
Vários grupos mandaram seus resultados, com alguns se destacando na classificação. Os melhores métodos conseguiram taxas de precisão impressionantes, mostrando que alguns modelos se saíram muito melhor que outros. A competição destacou a importância do pensamento criativo no processamento de linguagem.