Sujay Sanghavi

Using approximate losses and early exiting to optimize training time for models.

2025-09-02T06:29:48+00:00 ― 5 min read

Explore how Adam improves deep learning model training and outperforms gradient descent.

2025-09-01T22:59:12+00:00 ― 6 min read

Research unveils a method for creating smaller language models using fewer resources.

2025-08-20T05:36:24+00:00 ― 5 min read

This article discusses retraining methods using model predictions for improved accuracy.

2025-07-13T14:42:40+00:00 ― 9 min read

This study investigates how contrastive learning enhances data grouping through GMMs.

2025-05-30T18:12:36+00:00 ― 6 min read