A AttributionBench quer melhorar a verificação automática de afirmações nos resultados de busca.
― 9 min ler
Ciência de ponta explicada de forma simples
A AttributionBench quer melhorar a verificação automática de afirmações nos resultados de busca.
― 9 min ler
Este artigo analisa o desaprender de máquinas em grandes modelos de linguagem.
― 11 min ler
Um novo método melhora o aprendizado dos agentes LLM ao abraçar tanto os sucessos quanto os fracassos.
― 8 min ler
MuPT usa a notação ABC pra gerar música com IA de jeito eficaz.
― 6 min ler
MMLU-Pro desafia modelos de linguagem com perguntas mais difíceis e mais opções de respostas.
― 8 min ler
Avaliando as habilidades dos modelos de linguagem na criação de dados sintéticos usando o AgoraBench.
― 5 min ler