Um estudo destaca o impacto da contaminação de dados nas avaliações de modelos de código.
― 7 min ler
Ciência de ponta explicada de forma simples
Um estudo destaca o impacto da contaminação de dados nas avaliações de modelos de código.
― 7 min ler
Um novo teste pra avaliar LLMs em tarefas de programação em Java.
― 8 min ler
Uma nova abordagem melhora a confiabilidade dos testes para bibliotecas de deep learning.
― 7 min ler
Um benchmark de múltiplos domínios avalia as habilidades de geração de código dos LLMs em várias áreas.
― 8 min ler
Apresentando o ADIT: Uma nova abordagem pra melhorar a eficiência dos testes de software com transformação automática de entradas.
― 7 min ler
Aprenda como refatorar código reduz a contaminação de dados no desenvolvimento de software.
― 7 min ler