Jialun Cao

Um estudo destaca o impacto da contaminação de dados nas avaliações de modelos de código.

2025-08-25T23:27:42+00:00 ― 7 min ler

Um novo teste pra avaliar LLMs em tarefas de programação em Java.

2025-07-31T06:52:00+00:00 ― 8 min ler

Uma nova abordagem melhora a confiabilidade dos testes para bibliotecas de deep learning.

2025-07-29T16:48:54+00:00 ― 7 min ler

Um benchmark de múltiplos domínios avalia as habilidades de geração de código dos LLMs em várias áreas.

2025-06-23T06:56:36+00:00 ― 8 min ler

Apresentando o ADIT: Uma nova abordagem pra melhorar a eficiência dos testes de software com transformação automática de entradas.

2025-06-20T20:29:00+00:00 ― 7 min ler

Aprenda como refatorar código reduz a contaminação de dados no desenvolvimento de software.

2025-05-21T14:58:12+00:00 ― 7 min ler