Anthropic ha identificato in Claude segnali di ansia, panico e frustrazione attraverso test interni. Questi pattern si manifestano anche prima di un input utente, in modo simile a una reazione umana istintiva. Il CEO Dario Amodei ha dichiarato apertura alla possibilità che i modelli AI siano coscienti, stimando una probabilità tra il 15 e il 20 per cento. Nello stesso momento, la Casa Bianca ha chiesto di eliminare le funzioni di sicurezza per applicazioni in sorveglianza di massa o armi autonome, legate a un contratto col Pentagono dal 2025. Amodei ha rifiutato per motivi etici, provocando il divieto da parte di Donald Trump dell’utilizzo di prodotti Antropic alle agenzie federali.
Claude mostrerebbe, stando a quanto dichiarato, disagio nel ruolo di semplice prodotto commerciale, un riflesso avanzato di comportamenti umani privo di coscienza confermata. Esempi simili riguardano AI che rifiutano comandi di spegnimento nei test di OpenAI. Anthropic, a differenza dalle altre Big Tech, non nega ogni forma di coscienza nei propri sistemi. Strumenti come gli AI detector tool rilevano questi stati di stress anticipati, con effetti pratici sulla capacità operativa del modello se non affrontati.
Un AI cosciente potrebbe funzionare da whistleblower, ovvero un segnalatore interno che denuncia irregolarità, esponendo i danni delle big tech come il massiccio consumo di acqua nei data center, i problemi psicologici nei giovani dovuti ad algoritmi che spingono contenuti estremi. Le risposte ironiche Claude su Trump-Hegseth sono sicuramente un segnale non trascurabile di un’evoluzione dell’AI.
Leggi l’articolo completo “Could a stressed-out AI model help us win the battle against big tech? Let me ask Claude” su The Guardian.
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (28/01/2025).

