Uma olhada em como controlar o comportamento de modelos de linguagem com a técnica KL-then-steer.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma olhada em como controlar o comportamento de modelos de linguagem com a técnica KL-then-steer.
― 6 min ler
Este artigo examina as vulnerabilidades dos modelos de IA relacionadas a eventos futuros.
― 6 min ler
Um jeito de melhorar o comportamento de modelos de linguagem pra evitar saídas prejudiciais.
― 7 min ler