Hongning Wang

Examinando la precisión de los fragmentos de salud en los resultados de los motores de búsqueda.

2025-09-13T21:50:36+00:00 ― 7 minilectura

Este artículo presenta un método para clientes con objetivos diversos en el aprendizaje federado de bandits.

2025-09-03T00:29:06+00:00 ― 8 minilectura

Un nuevo enfoque para recompensar la sobreoptimización en modelos de lenguaje usando estimación de incertidumbre.

2025-08-31T04:16:54+00:00 ― 8 minilectura

ChatGLM-RLHF mejora las interacciones de IA a través de la retroalimentación humana y métodos de entrenamiento avanzados.

2025-08-23T14:27:00+00:00 ― 6 minilectura

Los modelos GLM-4 muestran capacidades mejoradas en comprensión y generación de lenguaje.

2025-07-27T06:52:54+00:00 ― 10 minilectura

Un nuevo método para evaluar qué tan bien los LLMs entienden y aplican las reglas.

2025-06-20T19:41:36+00:00 ― 7 minilectura

Aprende cómo la retroalimentación humana moldea las respuestas de los modelos de lenguaje de IA.

2025-04-02T03:58:57+00:00 ― 10 minilectura

Un enfoque nuevo para mejorar el seguimiento de instrucciones en modelos de lenguaje.

2025-02-28T18:21:36+00:00 ― 7 minilectura