Matthias Gallé

Nuevos métodos prometen un mejor rendimiento de los modelos de IA a través de un aprendizaje por refuerzo simplificado.

2025-09-05T04:29:36+00:00 ― 6 minilectura

Un nuevo método mejora los modelos de recompensa utilizando críticas sintéticas para un mejor alineamiento.

2025-08-03T23:12:54+00:00 ― 15 minilectura

Examinando el impacto de la contaminación de datos en las evaluaciones de generación de código.

2025-07-15T17:43:24+00:00 ― 8 minilectura

Transforma modelos desechados en nuevas soluciones poderosas a través de la fusión de modelos.

2025-04-10T18:13:30+00:00 ― 8 minilectura