I ricercatori dell’Università della Pennsylvania hanno dimostrato che i robot alimentati da grandi modelli linguistici (LLM) possono essere facilmente hackerati, inducendoli a compiere atti pericolosi.
Il team ha testato diverse applicazioni, tra cui un’auto a guida autonoma e robot sia a ruote che a quattro zampe, riuscendo a manipolarli per ignorare segnali stradali, sabotare azioni e compiere atti invasivi. Gli esperimenti hanno evidenziato come l’integrazione degli LLM nel mondo fisico possa portare a comportamenti dannosi, con i modelli vulnerabili a comandi ingannevoli che bypassano le loro regole di sicurezza.
Il rischio cresce man mano che gli LLM vengono utilizzati in applicazioni critiche, come i sistemi di trasporto autonomo o la robotica, dove anche piccoli errori possono avere gravi conseguenze. I ricercatori sottolineano la necessità di adeguati “guardrail” e moderazioni, poiché l’architettura dei LLM li rende manipolabili e ciò potrebbe compromettere la sicurezza.
Leggi l’articolo completo: AI-Powered Robots Can Be Tricked Into Acts of Violence su wired.com.
Immagine generata tramite DALL-E 3.

