Asa Cooper Stickland

Uma olhada em como controlar o comportamento de modelos de linguagem com a técnica KL-then-steer.

2025-07-26T13:30:06+00:00 ― 6 min ler

Este artigo examina as vulnerabilidades dos modelos de IA relacionadas a eventos futuros.

2025-07-19T13:53:24+00:00 ― 6 min ler

Um jeito de melhorar o comportamento de modelos de linguagem pra evitar saídas prejudiciais.

2025-07-08T20:36:48+00:00 ― 7 min ler