Cette étude aborde les défis liés à l'édition des modèles linguistiques et à la diminution des effets indésirables.
― 7 min lire
La science de pointe expliquée simplement
Cette étude aborde les défis liés à l'édition des modèles linguistiques et à la diminution des effets indésirables.
― 7 min lire
VCEval propose un moyen automatisé d'évaluer l'efficacité des cours en ligne.
― 6 min lire
DetectBench évalue les LLMs sur leur capacité à détecter des preuves cachées dans des tâches de raisonnement.
― 7 min lire