Um novo conjunto de dados avalia como os LLMs raciocinam com várias imagens.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo conjunto de dados avalia como os LLMs raciocinam com várias imagens.
― 7 min ler
Modelos de linguagem causal mostram potencial em resolver Sudoku e quebra-cabeças Zebra.
― 5 min ler
Michelangelo avalia modelos de linguagem pela capacidade deles de raciocinar em contextos longos.
― 4 min ler