Neuste Artikel für Menschliches Feedback

Eine neue Methode integriert menschliches Feedback, um das OOD-Lernen für Machine-Learning-Modelle zu verbessern.

2025-06-18T23:05:24+00:00 ― 7 min Lesedauer

Die Nutzung schwächerer Sprachmodelle kann die KI-Ausrichtung effizient verbessern.

2025-06-12T10:46:12+00:00 ― 6 min Lesedauer

Ein neuer Ansatz zur Schulung von Belohnungsmodellen verbessert die Ausrichtung von KI auf menschliche Vorlieben.

2025-06-09T16:00:54+00:00 ― 7 min Lesedauer

Eine neue Auktionsmethode verbessert die Effizienz bei der Sammlung von Präferenzdaten für KI-Modelle.

2025-06-06T16:19:36+00:00 ― 6 min Lesedauer

GRACE hilft Robotern, sozial zu handeln, während sie Aufgaben in Haushalten und am Arbeitsplatz erledigen.

2025-06-05T18:55:36+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert das Training von Sprachmodellen mit selbstgeneriertem Feedback.

2025-06-04T15:08:42+00:00 ― 6 min Lesedauer

Lerne, wie Machine-Learning-Modelle besser werden können, wenn sie mit neuen und unbekannten Daten konfrontiert werden.

2025-06-03T19:07:54+00:00 ― 7 min Lesedauer

Natürliche Sprach-Einheitstests bieten eine klarere Methode zur Bewertung von Sprachmodellen.

2025-02-25T02:53:15+00:00 ― 8 min Lesedauer

Optimiere deine Prompts mit iPrOp für bessere KI-Antworten.

2025-02-22T13:53:51+00:00 ― 8 min Lesedauer

Eine Methode, die Sprachmodelle durch effektive Kalibrierung mit menschlichen Vorlieben in Einklang bringt.

2025-02-21T13:01:12+00:00 ― 8 min Lesedauer