Shenao Zhang

Um novo método melhora os modelos de linguagem buscando ativamente respostas diversas.

2025-08-05T06:41:00+00:00 ― 7 min ler

Apresentando um método para minimizar a superotimização em modelos treinados com feedback humano.

2025-07-26T04:46:48+00:00 ― 6 min ler

Um novo método melhora modelos de codificação usando testes gerados por eles mesmos.

2025-05-19T03:37:20+00:00 ― 7 min ler

Aprenda como os robôs podem melhorar seguindo comandos humanos e se adaptando a erros.

2025-01-22T09:09:54+00:00 ― 8 min ler