Shangtong Zhang

Dieses Papier untersucht die Verwendung von TD-Lernen in Transformern für In-Context-Lernen.

2025-08-09T00:44:36+00:00 ― 8 min Lesedauer

Neue Erkenntnisse zur Konvergenz im linearen TD-Lernen ohne strikte Merkmalsunabhängigkeit.

2025-06-10T02:17:06+00:00 ― 6 min Lesedauer

Neue Erkenntnisse zur durchschnittlichen Belohnung im TD-Learning helfen, zuverlässige Entscheidungen zu treffen.

2025-05-27T10:38:38+00:00 ― 7 min Lesedauer

Ein neues Framework soll die Sicherheit in autonomen Fahrzeugen durch gezielte Simulationen verbessern.

2025-05-09T17:44:00+00:00 ― 8 min Lesedauer