Max Bartolo

Examinando la fiabilidad de la retroalimentación humana para evaluar los resultados de los modelos de lenguaje.

2025-09-20T21:35:12+00:00 ― 7 minilectura

Una iniciativa liderada por la comunidad para identificar indicaciones dañinas en modelos de T2I.

2025-09-08T09:31:06+00:00 ― 7 minilectura

Un nuevo método mejora los modelos de recompensa utilizando críticas sintéticas para un mejor alineamiento.

2025-08-03T23:12:54+00:00 ― 15 minilectura