Sungyoon Kim

In diesem Artikel werden Methoden besprochen, um zweischichtige ReLU-Neuronale Netzwerke effizient zu trainieren.

2025-08-24T17:20:13+00:00 ― 6 min Lesedauer

Wir stellen MoEfier vor, für die effiziente Transformation von Sprachmodellen mit minimalem Training.

2025-06-30T06:41:12+00:00 ― 6 min Lesedauer

Erkunde die Verlustlandschaft und die Rolle von Regularisierung in neuronalen Netzwerken.

2025-05-24T22:21:27+00:00 ― 5 min Lesedauer