Nirjhar Das

A new method enhances data gathering for better language model alignment.

2025-09-07T04:41:00+00:00 ― 6 min read

This paper discusses algorithms to improve decision-making in contextual bandit scenarios.

2025-08-20T15:21:00+00:00 ― 6 min read

This study explores hybrid rewards in linear contextual bandits for better decision-making.

2025-07-28T21:27:36+00:00 ― 5 min read