Um benchmark criado pra melhorar a compreensão de conteúdos em vídeo longos.
― 8 min ler
Ciência de ponta explicada de forma simples
Um benchmark criado pra melhorar a compreensão de conteúdos em vídeo longos.
― 8 min ler
Os modelos GLM-4 mostram melhorias nas capacidades de entender e gerar linguagem.
― 10 min ler
Um novo método pra avaliar quão bem os LLMs entendem e aplicam regras.
― 6 min ler
Uma nova abordagem pra melhorar o seguimento de instruções em modelos de linguagem.
― 7 min ler
As máquinas agora geram imagens e vídeos com base nas preferências humanas.
― 7 min ler