Tianshuo Cong

Um estudo revela vulnerabilidades em modelos de linguagem atualizados contra ataques adversariais.

2025-10-08T14:20:36+00:00 ― 6 min ler

Métodos de adaptação em tempo de teste enfrentam vulnerabilidades por ataques de envenenamento, o que desafiou a eficácia deles.

2025-10-08T01:02:42+00:00 ― 8 min ler

Este estudo analisa métodos de marca d'água para texto gerado por máquinas e a eficácia deles contra ataques de remoção.

2025-07-18T19:03:42+00:00 ― 11 min ler

Examine vários ataques de jailbreak em modelos de linguagem e suas defesas.

2025-07-18T11:09:42+00:00 ― 8 min ler

A pesquisa destaca métodos para detectar ataques de backdoor em ajustes de modelos de linguagem.

2025-05-06T10:46:40+00:00 ― 10 min ler

Descubra como ataques de backdoor colocam em risco a segurança dos modelos de linguagem movidos por IA.

2025-01-26T11:04:12+00:00 ― 7 min ler