Mudit Verma

Ein strukturierter Ansatz, um LLMs in Planungstasks mit externer Anleitung zu integrieren.

2025-09-11T23:53:30+00:00 ― 8 min Lesedauer

Eine neue Methode verbessert, wie Maschinen aus menschlichem Feedback lernen.

2025-08-20T06:47:30+00:00 ― 8 min Lesedauer

Diese Studie hinterfragt die Wirksamkeit von ReAct bei der Verbesserung der LLM-Leistung.

2025-08-09T03:06:48+00:00 ― 6 min Lesedauer