Un’ampia coalizione di ricercatori provenienti da OpenAI, Google DeepMind, Anthropic e altri attori del settore ha pubblicato un position paper che sollecita lo sviluppo di tecniche per monitorare i processi di ragionamento delle intelligenze artificiali. Al centro del dibattito c’è la chain-of-thought (in italiano catena di pensiero, comunemente abbreviato CoT), una modalità con cui i modelli AI articolano passaggi logici visibili prima di produrre una risposta.
Secondo gli autori, la CoT potrebbe diventare un pilastro per la sicurezza degli agenti intelligenti, ma è una risorsa fragile, da studiare con urgenza e cautela. Il documento, firmato da figure come Geoffrey Hinton, Ilya Sutskever e Shane Legg, sollecita l’intera comunità a studiare cosa rende questi processi monitorabili, come preservarne la visibilità, e se è possibile ricavarne dei metodi per migliorare la sicurezza dei sistemi.
Nonostante i rapidi progressi nelle performance dell’AI, la comprensione dei meccanismi interni rimane limitata. Anthropic, leader nella ricerca sull’interpretabilità, ha già avviato studi che suggeriscono come le CoT potrebbero non essere completamente affidabili nell’indicare i reali processi decisionali. L’obiettivo del position paper è catalizzare maggiori finanziamenti e attenzione verso questa area di ricerca.
Leggi l’articolo completo: Research leaders urge tech industry to monitor AI’s ‘thoughts’ su TechCrunch
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (10/03/2025).

