Jon Ander Campos

Adapt-LLM mejora el rendimiento de LLM al equilibrar el conocimiento interno y la información externa.

2025-08-15T05:07:54+00:00 ― 7 minilectura

Un nuevo método mejora los modelos de recompensa utilizando críticas sintéticas para un mejor alineamiento.

2025-08-03T23:12:54+00:00 ― 15 minilectura