Michael Shieh

Il campionamento con sonde migliora l'efficienza nel testare la sicurezza dei modelli linguistici.

2025-09-02T04:52:00+00:00 ― 7 leggere min

Un nuovo metodo migliora il ragionamento nei modelli linguistici tramite un'apprendimento delle preferenze efficace.

2025-08-14T17:01:06+00:00 ― 6 leggere min

Questo approccio usa l'auto-valutazione per difendersi da output nocivi nei modelli linguistici.

2025-07-20T09:06:48+00:00 ― 2 leggere min

Le ricerche mostrano che piccole modifiche negli input possono portare a output dannosi nei LLM.

2025-07-20T08:58:54+00:00 ― 6 leggere min

Gli errori di battitura possono confondere alla grande i modelli di lingua avanzati e influenzare le loro risposte.

2025-05-27T05:49:12+00:00 ― 6 leggere min