Longbo Huang

Wir stellen RS-DisRL vor, um bessere Entscheidungen in unsicheren Umgebungen zu treffen.

2025-09-03T04:41:54+00:00 ― 6 min Lesedauer

Eine Übersicht über POMDPs und ihre Rolle bei der Entscheidungsfindung mit unvollständigen Informationen.

2025-08-25T11:34:52+00:00 ― 5 min Lesedauer

Neue Methode bekämpft hohe Kosten für das Training grosser Sprachmodelle.

2025-06-24T11:54:36+00:00 ― 6 min Lesedauer

MAST verbessert die Effizienz beim Training mehrerer KI-Agenten durch spärliche Methoden.

2025-06-03T19:15:48+00:00 ― 7 min Lesedauer