Michael Shieh

L'échantillonnage par sonde améliore l'efficacité des tests de sécurité des modèles de langage.

2025-09-02T04:52:00+00:00 ― 8 min lire

Une nouvelle méthode améliore le raisonnement dans les modèles de langage grâce à un apprentissage des préférences efficace.

2025-08-14T17:01:06+00:00 ― 8 min lire

Cette approche utilise l'auto-évaluation pour se protéger contre les résultats nuisibles dans les modèles de langue.

2025-07-20T09:06:48+00:00 ― 2 min lire

Des recherches montrent que des changements simples dans les entrées peuvent entraîner des résultats nuisibles dans les LLMs.

2025-07-20T08:58:54+00:00 ― 8 min lire

Les fautes de frappe peuvent vraiment embrouiller les modèles de langage avancés et influencer leurs réponses.

2025-05-27T05:49:12+00:00 ― 8 min lire