Bewertung der Fähigkeit von LLMs, schädliche Anweisungen in Benutzeraufforderungen zu erkennen.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Bewertung der Fähigkeit von LLMs, schädliche Anweisungen in Benutzeraufforderungen zu erkennen.
― 6 min Lesedauer
Neue Methoden verbessern die Ausrichtung von Sprachmodellen an menschlichen Werten.
― 6 min Lesedauer
Untersuchung des Einflusses der Konsistenz von Belohnungsmodellen auf die Leistung von Sprachmodellen.
― 6 min Lesedauer
Eine Methode, um die Genauigkeit in grossen Sprachmodellen zu verbessern und gleichzeitig abwechslungsreiche Antworten zu gewährleisten.
― 7 min Lesedauer
Ein Framework, das Selbstbewertung und Suchmethoden kombiniert, um die Leistung von Sprachmodellen zu verbessern.
― 7 min Lesedauer
Eine neue Methode verbessert die Leistung von LLMs bei komplexen Mathematikaufgaben.
― 5 min Lesedauer
Forscher verbessern grosse Sprachmodelle durch Selbstverbesserung mit codebasierten Methoden.
― 8 min Lesedauer