Yule Liu

Examine vários ataques de jailbreak em modelos de linguagem e suas defesas.

2025-07-18T11:09:42+00:00 ― 8 min ler

A pesquisa destaca métodos para detectar ataques de backdoor em ajustes de modelos de linguagem.

2025-05-06T10:46:40+00:00 ― 10 min ler

Métodos inovadores buscam melhorar os modelos de linguagem de IA, garantindo segurança e eficiência.

2025-04-30T12:54:40+00:00 ― 6 min ler