Nicolas Yax

Examinando cómo los LLM aprenden y toman decisiones basadas en recompensas.

2025-08-10T06:14:12+00:00 ― 6 minilectura

Un nuevo método ayuda a identificar la contaminación de datos de prueba en LLMs usando probabilidades de tokens.

2025-06-22T01:19:06+00:00 ― 10 minilectura