Wenkai Yang

Esse artigo analisa a ameaça de ataques por backdoor em agentes de modelos de linguagem.

2025-09-07T01:39:18+00:00 ― 6 min ler

Pesquisa revela riscos de segurança significativos em modelos de chat por causa de ataques de backdoor.

2025-08-23T12:52:12+00:00 ― 8 min ler

Explora os desafios de supervisionar modelos de IA avançados com contrapartes mais fracas.

2025-07-27T15:26:24+00:00 ― 7 min ler