Simple Science

Cutting edge science explained simply

Cutting edge science explained simply

Lily H. Zhang

Machine Learning Challenges in Preference Learning for Language Models

Analyzing the flaws in preference learning algorithms and their impact on language models.

2025-08-05T08:07:54+00:00 ― 7 min read

Computation and Language Improving Language Models with Targeted Negative Training

A method to refine language models by reducing unwanted outputs during training.

2025-07-26T17:27:06+00:00 ― 6 min read