Zhuoyan Xu

Eine neue Methode verbessert die Aufmerksamkeitsmechanismen in Sprachmodellen für eine bessere Leistung.

2025-08-12T17:05:30+00:00 ― 6 min Lesedauer

Untersuchen, warum grössere Modelle beim In-Context-Lernen im Vergleich zu kleineren Schwierigkeiten haben.

2025-08-05T08:55:18+00:00 ― 6 min Lesedauer

Untersuchen, wie LLMs bei zusammengesetzten Aufgaben abschneiden, die einfachere Aufgaben kombinieren.

2025-07-09T00:25:54+00:00 ― 8 min Lesedauer