Archit Sharma

Introducing SERL: A new framework for efficient robot learning tasks.

2025-09-13T13:48:42+00:00 ― 6 min read

This article discusses a method to improve LLMs using verbal feedback without overgeneralization.

2025-09-07T11:16:00+00:00 ― 10 min read

A study on the effectiveness of RLAIF versus supervised fine-tuning for language models.

2025-09-06T15:07:18+00:00 ― 8 min read

Robots are learning to adapt and perform tasks across various fields.

2025-08-27T22:43:48+00:00 ― 7 min read

Robots learn to adapt and improve by receiving real-time human feedback.

2025-08-27T22:28:00+00:00 ― 7 min read

A new framework helps language models learn from mistakes in problem-solving.

2025-08-23T19:58:48+00:00 ― 7 min read

This study evaluates methods to enhance large language models using user preference data.

2025-08-17T07:09:54+00:00 ― 5 min read

This article examines key factors in preference dataset quality for better reward model training.

2025-06-12T06:17:36+00:00 ― 6 min read

Discover how Policy Agnostic Reinforcement Learning changes machine decision-making.

2025-03-29T14:06:54+00:00 ― 7 min read