Alex Beutel

Esse artigo fala sobre melhorar sistemas de recomendação usando o feedback negativo dos usuários.

2025-10-05T06:56:54+00:00 ― 6 min ler

Um novo método melhora o treinamento de IA para segurança e utilidade.

2025-06-02T01:47:18+00:00 ― 5 min ler

O Alinhamento Deliberativo tem como objetivo tornar os modelos de linguagem de IA mais seguros e confiáveis.

2025-02-09T22:33:09+00:00 ― 6 min ler

Descubra como o red teaming automatizado melhora a segurança de IA através de desafios criativos.

2025-01-28T13:37:39+00:00 ― 6 min ler