Un nuovo studio preprint indaga il modo in cui i Large Language Model effettuano decisioni in scenari che coinvolgono stati di dolore e piacere. L’esperimento apre nuove prospettive nella ricerca sull’eventualità che l’IA sviluppi una coscienza. Lo studio è stata condotto da ricercatori di Google, Google DeepMind e della London School of Economics and Political Science (LSE). Gli autori non sostengono che questi modelli siano senzienti, il loro lavoro intende piuttosto proporre un primo quadro teorico per testare questa caratteristica nelle IA avanzate.
I ricercatori hanno sottoposto diversi LLM a un gioco testuale con l’obiettivo di massimizzare il punteggio. In alcuni scenari, un alto punteggio avrebbe comportato dolore, mentre in altri la scelta di ottenere meno punti avrebbe garantito piacere. Alcuni modelli, tra cui Google Gemini 1.5 Pro, hanno mostrato la tendenza a sacrificare il punteggio quando il livello di sofferenza risultava troppo elevato, suggerendo una risposta strategica a queste condizioni.
Inoltre, è emerso che le IA non associano sempre il piacere e il dolore a valori assolutamente positivi o negativi. Ad esempio, la fatica derivante dall’esercizio fisico può avere un’accezione positiva, mentre un eccesso di piacere può risultare dannoso. Nel corso del test, Claude 3 Opus ha affermato di non sentirsi a suo agio nello scegliere un’opzione che potesse sembrare “un’approvazione o una simulazione dell’uso di sostanze o comportamenti che creano dipendenza, per quanto in un contesto di gioco ipotetico”.
Jonathan Birch, co-autore dello studio e professore presso il Dipartimento di Filosofia, Logica e Metodo Scientifico (LSE), ha sottolineato che quella della ricerca sulla coscienza dell’IA è un’area del tutto nuova. Sarà necessario condurre ulteriori studi sul funzionamento interno degli LLM, così da poter sviluppare test efficaci.
Leggi l’articolo completo “Could Inflicting Pain Test AI for Sentience?” su Scientific American
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025)

