Apresentando o IrokoBench pra melhorar a avaliação de LLM em línguas africanas.
― 8 min ler
Ciência de ponta explicada de forma simples
Apresentando o IrokoBench pra melhorar a avaliação de LLM em línguas africanas.
― 8 min ler
Este artigo analisa métodos para avaliar a variância em benchmarks de avaliação de modelos de linguagem.
― 9 min ler
Essa pesquisa foca em melhorar métodos pra remover informações indesejadas de modelos de linguagem.
― 5 min ler
Esse artigo fala sobre os desafios de detectar alucinações na tradução automática em várias línguas.
― 7 min ler
Os testes de Linguini avaliam como os modelos raciocinam com diferentes idiomas.
― 7 min ler
As tarefas de NLI ainda são relevantes para testar modelos de linguagem grandes?
― 7 min ler