Xiang Yue

AttributionBench aims to improve automatic verification of claims in search results.

2025-09-05T07:23:24+00:00 ― 7 min read

This article examines machine unlearning in large language models.

2025-09-04T16:07:00+00:00 ― 9 min read

A new method enhances LLM agents' learning by embracing both successes and failures.

2025-09-01T21:13:48+00:00 ― 6 min read

MuPT utilizes ABC notation for effective music generation with AI.

2025-08-12T09:00:00+00:00 ― 5 min read

MMLU-Pro challenges language models with harder questions and more answer options.

2025-08-03T04:54:48+00:00 ― 7 min read

Evaluating language models' abilities in synthetic data creation using AgoraBench.

2025-04-17T19:33:09+00:00 ― 5 min read