Rishabh Joshi

La investigación tiene como objetivo hacer que los modelos de lenguaje sean más seguros y útiles para los usuarios.

2025-08-21T06:36:48+00:00 ― 7 minilectura

Un enfoque nuevo para entrenar modelos de recompensa mejora la alineación de la IA con las preferencias humanas.

2025-06-09T16:00:54+00:00 ― 7 minilectura

Este método ayuda a las IA a aprender creando y resolviendo desafíos.

2025-05-26T00:12:48+00:00 ― 8 minilectura