Pengcheng He

Avaliar a capacidade dos LLMs de detectar instruções prejudiciais em comandos dos usuários.

2025-10-07T17:56:06+00:00 ― 7 min ler

HERON simplifica o design de recompensas, aumentando a eficiência e a flexibilidade do aprendizado por reforço.

2025-09-30T13:50:48+00:00 ― 7 min ler

Um novo método melhora a eficiência dos modelos de linguagem sem perder a qualidade.

2025-08-13T02:02:42+00:00 ― 6 min ler