Hwaran Lee

APRICOT erhöht das Vertrauen in Sprachmodelle, indem es die Antwortsicherheit genau misst.

2025-08-31T00:04:06+00:00 ― 7 min Lesedauer

AdvisorQA bewertet die Fähigkeit von Sprachmodellen, persönliche Ratschläge effektiv zu geben.

2025-08-18T23:27:18+00:00 ― 7 min Lesedauer

Ein neuer Massstab, um das kulturelle Wissen in Sprachmodellen über verschiedene Kulturen zu bewerten.

2025-07-28T18:25:54+00:00 ― 6 min Lesedauer

Eine frische Methode zum Testen der Sicherheit von Sprachmodellen und ihrer mehrsprachigen Fähigkeiten.

2025-07-28T02:37:54+00:00 ― 8 min Lesedauer

Die Forschung konzentriert sich darauf, die Zuverlässigkeit in grossen Sprachmodellen durch Unsicherheitsquantifizierung zu verbessern.

2025-06-28T11:22:06+00:00 ― 7 min Lesedauer