Jiafei Lyu

SEABO generiert Belohnungen aus Experten-Daten und vereinfacht das Offline-Imitationslernen.

2025-09-10T14:58:30+00:00 ― 6 min Lesedauer

In diesem Papier werden die Herausforderungen und Lösungen zur Leistungsfähigkeit des visuellen Verstärkungslernens besprochen.

2025-09-05T23:46:56+00:00 ― 8 min Lesedauer

Neue Methode verbessert die Anpassungsfähigkeit von KI in verschiedenen Umgebungen.

2025-08-07T12:55:48+00:00 ― 7 min Lesedauer

DLLM kombiniert Reinforcement Learning mit Sprachmodellen für bessere Aufgabenleistung.

2025-07-30T11:46:30+00:00 ― 6 min Lesedauer

SUMO verbessert die Entscheidungsfindung im Offline-Verstärkungslernen, indem es die Unsicherheitsabschätzung optimiert.

2025-06-23T02:28:00+00:00 ― 7 min Lesedauer