Jialun Cao

A study highlights data contamination's impact on code model evaluations.

2025-08-25T23:27:42+00:00 ― 6 min read

A new benchmark to assess LLMs for Java programming tasks.

2025-07-31T06:52:00+00:00 ― 6 min read

A new approach enhances testing reliability for deep learning libraries.

2025-07-29T16:48:54+00:00 ― 6 min read

A multi-domain benchmark assesses LLMs' code generation abilities across various fields.

2025-06-23T06:56:36+00:00 ― 6 min read

Introducing ADIT: A new approach to enhance software testing efficiency through automated input transformation.

2025-06-20T20:29:00+00:00 ― 6 min read

Learn how code refactoring reduces data contamination in software development.

2025-05-21T14:58:12+00:00 ― 6 min read