Matthieu Geist

New model improves music creation using user feedback.

2025-08-25T21:41:55+00:00 ― 7 min read

A new method enhances strategy learning for agents in multi-agent systems.

2025-08-19T20:45:30+00:00 ― 5 min read

Introducing ExpectRL to tackle overestimation in Reinforcement Learning through expectiles.

2025-08-01T08:48:18+00:00 ― 7 min read

A new benchmark for testing robust reinforcement learning methods in various environments.

2025-07-29T22:12:48+00:00 ― 6 min read

Researchers enhance reinforcement learning with a new framework for uncertain environments.

2025-07-29T22:04:54+00:00 ― 5 min read

Contrastive Policy Gradient offers a more efficient way to enhance language models.

2025-07-23T09:16:00+00:00 ― 7 min read

A look into how IRL enhances language model performance and diversity.

2025-06-11T05:00:32+00:00 ― 8 min read