Xiang Yue

A AttributionBench quer melhorar a verificação automática de afirmações nos resultados de busca.

2025-09-05T07:23:24+00:00 ― 9 min ler

Este artigo analisa o desaprender de máquinas em grandes modelos de linguagem.

2025-09-04T16:07:00+00:00 ― 11 min ler

Um novo método melhora o aprendizado dos agentes LLM ao abraçar tanto os sucessos quanto os fracassos.

2025-09-01T21:13:48+00:00 ― 8 min ler

MuPT usa a notação ABC pra gerar música com IA de jeito eficaz.

2025-08-12T09:00:00+00:00 ― 6 min ler

MMLU-Pro desafia modelos de linguagem com perguntas mais difíceis e mais opções de respostas.

2025-08-03T04:54:48+00:00 ― 8 min ler

Avaliando as habilidades dos modelos de linguagem na criação de dados sintéticos usando o AgoraBench.

2025-04-17T19:33:09+00:00 ― 5 min ler