Matthias Gallé

Novos métodos prometem melhorar o desempenho dos modelos de IA através de um aprendizado por reforço mais simples.

2025-09-05T04:29:36+00:00 ― 6 min ler

Um novo método melhora os modelos de recompensa usando críticas sintéticas pra um alinhamento melhor.

2025-08-03T23:12:54+00:00 ― 14 min ler

Analisando o impacto da contaminação de dados nas avaliações de geração de código.

2025-07-15T17:43:24+00:00 ― 7 min ler

Transforme modelos descartados em novas soluções poderosas através da fusão de modelos.

2025-04-10T18:13:30+00:00 ― 8 min ler