Jon Ander Campos

O Adapt-LLM melhora o desempenho do LLM equilibrando o conhecimento interno e as informações externas.

2025-08-15T05:07:54+00:00 ― 7 min ler

Um novo método melhora os modelos de recompensa usando críticas sintéticas pra um alinhamento melhor.

2025-08-03T23:12:54+00:00 ― 14 min ler