Philippe Laban

Eine Studie, die die Kreativität in Texten von Sprachmodellen und menschlichen Autoren vergleicht.

2025-09-22T08:20:48+00:00 ― 6 min Lesedauer

Ein neuer Benchmark testet KI-Agenten in realistischen CRM-Aufgaben.

2025-05-31T13:19:00+00:00 ― 7 min Lesedauer

Forscher bringen eine Methode raus, um faktische Fehler in Textzusammenfassungen zu finden.

2025-02-26T17:24:27+00:00 ― 4 min Lesedauer