Peiyi Wang

O PCA-Bench testa modelos de linguagem grandes em cenários complexos de tomada de decisão.

2025-09-05T18:58:36+00:00 ― 8 min ler

Um novo conjunto de dados tem como objetivo melhorar a compreensão da IA sobre imagens científicas e raciocínio.

2025-09-02T17:06:42+00:00 ― 6 min ler

Explorando como o aprendizado de preferências melhora o alinhamento do modelo de linguagem com as expectativas humanas.

2025-06-17T05:58:42+00:00 ― 9 min ler