Évaluer des techniques pour que les modèles de langage refusent de manière responsable les requêtes nuisibles.
Kinshuk Vasisht, Navreet Kaur, Danish Pruthi
― 7 min lire
New Science Research Articles Everyday
Évaluer des techniques pour que les modèles de langage refusent de manière responsable les requêtes nuisibles.
Kinshuk Vasisht, Navreet Kaur, Danish Pruthi
― 7 min lire