Este estudo fala sobre os desafios de editar modelos de linguagem e de mitigar efeitos indesejados.
― 7 min ler
Ciência de ponta explicada de forma simples
Este estudo fala sobre os desafios de editar modelos de linguagem e de mitigar efeitos indesejados.
― 7 min ler
Essa abordagem melhora a extração de dados de páginas da web usando regras estruturadas.
― 6 min ler
Um novo teste de referência avalia as habilidades dos LLMs com formatos de dados estruturados.
― 7 min ler
O VCEval oferece uma maneira automatizada de avaliar a eficácia de cursos online.
― 6 min ler
O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.
― 6 min ler
Um método novo melhora a detecção e explicação de notícias falsas.
― 8 min ler