Sebastian Krause

A new method for generating synthetic preference data enhances reward models in reinforcement learning.

2025-09-15T07:33:00+00:00 ― 5 min read

Gemma 2 offers high performance in a compact size for language tasks.

2025-07-04T12:59:30+00:00 ― 6 min read