Jialun Cao

Uno studio mette in evidenza l'impatto della contaminazione dei dati sulle valutazioni dei modelli di codice.

2025-08-25T23:27:42+00:00 ― 6 leggere min

Un nuovo benchmark per valutare i LLM per i compiti di programmazione in Java.

2025-07-31T06:52:00+00:00 ― 7 leggere min

Un nuovo approccio migliora l'affidabilità dei test per le librerie di deep learning.

2025-07-29T16:48:54+00:00 ― 6 leggere min

Un benchmark multidominio valuta le capacità di generazione di codice degli LLM in diversi ambiti.

2025-06-23T06:56:36+00:00 ― 7 leggere min

Introducing ADIT: Un nuovo modo per migliorare l'efficienza dei test software attraverso la trasformazione automatizzata degli input.

2025-06-20T20:29:00+00:00 ― 6 leggere min

Scopri come il refactoring del codice riduce la contaminazione dei dati nello sviluppo software.

2025-05-21T14:58:12+00:00 ― 6 leggere min