Rishabh Agarwal

Forschung darüber, wie Transformer die Verallgemeinerung für längere Sequenzen in Additionsaufgaben verbessern.

2025-09-08T05:49:54+00:00 ― 7 min Lesedauer

Dieser Artikel behandelt die Verwendung von Klassifikation für Wertfunktionen im Deep Reinforcement Learning.

2025-08-23T12:51:08+00:00 ― 6 min Lesedauer

Dieses Papier beleuchtet die Vorteile des Many-Shot-Lernens in Sprachmodellen.

2025-08-19T08:00:48+00:00 ― 6 min Lesedauer

SiT verbessert die Fähigkeit von Agenten, im Reinforcement Learning durch Symmetrie und Aufmerksamkeit zu verallgemeinern.

2025-07-25T16:49:48+00:00 ― 6 min Lesedauer

Forschung zeigt, wie MBR-Dekodierung die Übersetzungsqualität in kleineren Modellen verbessert.

2025-07-13T00:09:12+00:00 ― 5 min Lesedauer

Gemma 2 bietet hohe Leistung in kompakter Grösse für Sprachaufgaben.

2025-07-04T12:59:30+00:00 ― 6 min Lesedauer

Eine Studie zeigt, dass billigere Modelle bessere Trainingsdaten für Denkaufgaben erzeugen könnten.

2025-06-20T08:30:06+00:00 ― 6 min Lesedauer

Diese Methode hilft AIs, durch das Erstellen und Lösen von Herausforderungen zu lernen.

2025-05-26T00:12:48+00:00 ― 7 min Lesedauer