Zhihan Liu

Este estudio combina Modelos de Lenguaje Grandes con Búsqueda en Árbol Monte-Carlo para tomar mejores decisiones en juegos.

2025-08-31T06:47:00+00:00 ― 7 minilectura

Un nuevo método mejora los modelos de lenguaje buscando activamente respuestas diversas.

2025-08-05T06:41:00+00:00 ― 7 minilectura

Presentando un método para minimizar la sobreoptimización en modelos entrenados con retroalimentación humana.

2025-07-26T04:46:48+00:00 ― 6 minilectura

Un nuevo método combina la inferencia bayesiana y el aprendizaje automático para mejorar el análisis de datos.

2025-07-11T11:48:36+00:00 ― 7 minilectura

Un nuevo método mejora el entrenamiento de modelos de lenguaje usando retroalimentación generada por sí mismos.

2025-06-04T15:08:42+00:00 ― 7 minilectura

Un nuevo método mejora los modelos de codificación usando pruebas generadas por sí mismos.

2025-05-19T03:37:20+00:00 ― 7 minilectura

Aprende cómo los robots pueden mejorar al seguir comandos humanos y adaptarse a los errores.

2025-01-22T09:09:54+00:00 ― 8 minilectura