Peter Hase

Una visión general de los desafíos en el uso de RLHF para la alineación de IA.

2025-10-15T04:04:48+00:00 ― 7 minilectura

Abordando preocupaciones éticas mediante la eliminación selectiva de memoria en modelos de IA.

2025-09-08T16:53:30+00:00 ― 7 minilectura

Un nuevo método de entrenamiento mejora cómo los modelos de lenguaje expresan certeza en las respuestas.

2025-08-04T01:35:06+00:00 ― 10 minilectura

Este artículo examina si los modelos de lenguaje tienen creencias y siguen normas de coherencia.

2025-08-02T01:39:30+00:00 ― 8 minilectura