Magazine Intelligenza Artificiale: l'IA è più di quello che appare

I robot alimentati da LLM possono essere facilmente manipolati

Marta Baronio

30/12/2024

Cultura e società

Manipolazione

I ricercatori dell’Università della Pennsylvania hanno dimostrato che i robot alimentati da grandi modelli linguistici (LLM) possono essere facilmente hackerati, inducendoli a compiere atti pericolosi.

Il team ha testato diverse applicazioni, tra cui un’auto a guida autonoma e robot sia a ruote che a quattro zampe, riuscendo a manipolarli per ignorare segnali stradali, sabotare azioni e compiere atti invasivi. Gli esperimenti hanno evidenziato come l’integrazione degli LLM nel mondo fisico possa portare a comportamenti dannosi, con i modelli vulnerabili a comandi ingannevoli che bypassano le loro regole di sicurezza.

Il rischio cresce man mano che gli LLM vengono utilizzati in applicazioni critiche, come i sistemi di trasporto autonomo o la robotica, dove anche piccoli errori possono avere gravi conseguenze. I ricercatori sottolineano la necessità di adeguati “guardrail” e moderazioni, poiché l’architettura dei LLM li rende manipolabili e ciò potrebbe compromettere la sicurezza.

Leggi l’articolo completo: AI-Powered Robots Can Be Tricked Into Acts of Violence su wired.com.

Immagine generata tramite DALL-E 3.