Este estudo fala sobre os desafios de editar modelos de linguagem e de mitigar efeitos indesejados.
― 7 min ler
Ciência de ponta explicada de forma simples
Este estudo fala sobre os desafios de editar modelos de linguagem e de mitigar efeitos indesejados.
― 7 min ler
O VCEval oferece uma maneira automatizada de avaliar a eficácia de cursos online.
― 6 min ler
O DetectBench avalia LLMs pela capacidade de detectar evidências ocultas em tarefas de raciocínio.
― 6 min ler