Gabriele Oliaro

Introducing a new method to reduce memory use when finetuning large models.

2025-09-17T08:00:12+00:00 ― 5 min read

A dual method for training and using language models efficiently.

2025-09-03T10:05:48+00:00 ― 6 min read

A new optimizer enhances efficiency in running deep neural networks on GPUs.

2025-07-29T12:36:06+00:00 ― 5 min read

A look at SuffixDecoding and its impact on language model efficiency.

2025-05-28T14:13:39+00:00 ― 5 min read