Um novo benchmark pra avaliar o conhecimento cultural em modelos de linguagem de diferentes culturas.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo benchmark pra avaliar o conhecimento cultural em modelos de linguagem de diferentes culturas.
― 7 min ler
Um jeito novo de testar a segurança de modelos de linguagem e as habilidades multilíngues.
― 9 min ler
A pesquisa foca em melhorar a confiabilidade em modelos de linguagem grandes usando quantificação de incerteza.
― 8 min ler