Simple Science

Cutting edge science explained simply

Cutting edge science explained simply

Anush Kini

Machine Learning Improving Language Models with Robust DPO

A new method to enhance language models despite noisy human feedback.

2025-09-02T08:49:00+00:00 ― 6 min read