Alekh Agarwal

Um novo método melhora o aprendizado usando feedback humano por meio de auto-jogo.

2025-09-18T06:54:48+00:00 ― 7 min ler

Um novo método melhora a compilação de programas, gerando arquivos menores usando dados passados.

2025-08-24T15:51:42+00:00 ― 8 min ler

Um novo método melhora os modelos de linguagem ao focar nas preferências dos usuários.

2025-08-05T06:25:12+00:00 ― 7 min ler

Apresentando um framework pra ajustar modelos de linguagem e equilibrar vários objetivos.

2025-07-09T01:44:54+00:00 ― 6 min ler

Ensinar máquinas a aprender sem revelar segredos de especialistas é essencial pra privacidade.

2025-05-20T22:00:18+00:00 ― 6 min ler