Baolin Peng

Examining the impact of reward model consistency on language model performance.

2025-09-20T10:07:54+00:00 ― 5 min read

A method to enhance accuracy in large language models while ensuring varied responses.

2025-09-03T19:26:42+00:00 ― 6 min read

A framework combining self-assessment and search methods to enhance language model performance.

2025-08-18T10:56:48+00:00 ― 6 min read

A new method improves performance of LLMs in complex math tasks.

2025-07-22T09:10:18+00:00 ― 5 min read

Researchers improve large language models using self-improvement with code-based methods.

2025-06-20T15:36:42+00:00 ― 7 min read