Sainbayar Sukhbaatar

New data source enhances machine learning models in reasoning tasks.

2025-09-26T20:50:24+00:00 ― 7 min read

Exploring methods to boost reasoning abilities in language models through reinforcement learning.

2025-08-31T12:58:18+00:00 ― 5 min read

This study focuses on enhancing model responses by targeting specific length requirements.

2025-07-24T13:10:48+00:00 ― 5 min read