Aliaksei Severyn

Un nuevo método para generar datos de preferencia sintéticos mejora los modelos de recompensa en el aprendizaje por refuerzo.

2025-09-15T07:33:00+00:00 ― 6 minilectura

Un nuevo método que mejora el rendimiento de los LLM mientras reduce el uso de recursos.

2025-07-10T11:58:54+00:00 ― 8 minilectura

Gemma 2 ofrece un alto rendimiento en un tamaño compacto para tareas de lenguaje.

2025-07-04T12:59:30+00:00 ― 7 minilectura