Pontus Stenetorp

Apresentando o IrokoBench pra melhorar a avaliação de LLM em línguas africanas.

2025-08-02T00:44:12+00:00 ― 8 min ler

Este artigo analisa métodos para avaliar a variância em benchmarks de avaliação de modelos de linguagem.

2025-07-28T23:26:06+00:00 ― 9 min ler

Essa pesquisa foca em melhorar métodos pra remover informações indesejadas de modelos de linguagem.

2025-07-24T23:42:48+00:00 ― 5 min ler

Esse artigo fala sobre os desafios de detectar alucinações na tradução automática em várias línguas.

2025-07-08T06:15:42+00:00 ― 7 min ler

Os testes de Linguini avaliam como os modelos raciocinam com diferentes idiomas.

2025-06-10T02:01:18+00:00 ― 7 min ler

As tarefas de NLI ainda são relevantes para testar modelos de linguagem grandes?

2025-05-14T07:05:20+00:00 ― 7 min ler