Hwaran Lee

APRICOT enhances trust in language models by measuring answer confidence accurately.

2025-08-31T00:04:06+00:00 ― 7 min read

AdvisorQA evaluates language models' ability to provide personal advice effectively.

2025-08-18T23:27:18+00:00 ― 6 min read

A new benchmark to assess cultural knowledge in language models across diverse cultures.

2025-07-28T18:25:54+00:00 ― 6 min read

A fresh method for testing language model safety and multilingual skills.

2025-07-28T02:37:54+00:00 ― 7 min read

Research focuses on enhancing reliability in large language models using uncertainty quantification.

2025-06-28T11:22:06+00:00 ― 7 min read