Ruoyu Sun

AceGPT verbessert die arabische Sprachverarbeitung, die auf lokale Kultur und Werte zugeschnitten ist.

2025-09-23T18:42:42+00:00 ― 5 min Lesedauer

Dieser Artikel untersucht die Optimierungsherausforderungen bei Transformern und die Effektivität von Adam im Vergleich zu SGD.

2025-09-03T21:48:54+00:00 ― 6 min Lesedauer

Adam-mini reduziert den Speicherverbrauch beim Training grosser Sprachmodelle, ohne die Leistung zu beeinträchtigen.

2025-07-24T23:19:06+00:00 ― 6 min Lesedauer

Ein neuer Ansatz, um grosse lineare Programmierungsprobleme effizient zu lösen.

2025-07-20T19:42:52+00:00 ― 5 min Lesedauer

MoFO hilft grossen Sprachmodellen, Wissen während des Fine-Tunings zu behalten, ohne an Leistung zu verlieren.

2025-07-05T01:30:00+00:00 ― 5 min Lesedauer

Ein neuer Ansatz verbessert die Antworten von Sprachmodellen und verringert das Overfitting.

2025-06-20T07:19:00+00:00 ― 7 min Lesedauer

Erfahre, wie PDQP-Net das Lösen von konvexen quadratischen Programmen beschleunigt.

2025-04-15T23:07:10+00:00 ― 6 min Lesedauer