Uno sguardo a come controllare il comportamento dei modelli linguistici con la tecnica KL-then-steer.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Uno sguardo a come controllare il comportamento dei modelli linguistici con la tecnica KL-then-steer.
― 6 leggere min
Questo articolo esplora le vulnerabilità dei modelli di intelligenza artificiale legate agli eventi futuri.
― 6 leggere min
Un metodo per migliorare il comportamento dei modelli linguistici contro i risultati dannosi.
― 6 leggere min