Sam Toyer

Versuche, Verwirrung im AI-Lernen aus menschlichem Feedback zu reduzieren.

2025-07-09T05:26:06+00:00 ― 5 min Lesedauer

Deliberative Alignment hat das Ziel, KI-Sprachmodelle sicherer und zuverlässiger zu machen.

2025-02-09T22:33:09+00:00 ― 6 min Lesedauer