Lei Sha

Este estudo apresenta um sistema para melhorar a precisão do modelo de linguagem usando desafios adversariais.

2025-08-05T10:14:18+00:00 ― 8 min ler

Explorando como o aprendizado de preferências melhora o alinhamento do modelo de linguagem com as expectativas humanas.

2025-06-17T05:58:42+00:00 ― 9 min ler