Max Bartolo

Analisando a confiabilidade do feedback humano para avaliar saídas de modelos de linguagem.

2025-09-20T21:35:12+00:00 ― 7 min ler

Uma iniciativa liderada pela comunidade pra identificar prompts nocivos em modelos T2I.

2025-09-08T09:31:06+00:00 ― 7 min ler

Um novo método melhora os modelos de recompensa usando críticas sintéticas pra um alinhamento melhor.

2025-08-03T23:12:54+00:00 ― 14 min ler