Sebastian Krause

Un nuevo método para generar datos de preferencia sintéticos mejora los modelos de recompensa en el aprendizaje por refuerzo.

2025-09-15T07:33:00+00:00 ― 6 minilectura

Gemma 2 ofrece un alto rendimiento en un tamaño compacto para tareas de lenguaje.

2025-07-04T12:59:30+00:00 ― 7 minilectura