Chris Cremer

New methods promise better AI model performance through simplified reinforcement learning.

2025-09-05T04:29:36+00:00 ― 5 min read

Contrastive Policy Gradient offers a more efficient way to enhance language models.

2025-07-23T09:16:00+00:00 ― 7 min read