Recenti studi tentano di chiarire i meccanismi che stanno alla base della cosiddetta “creatività” dei modelli di intelligenza artificiale generativa. Sembrerebbe che i generatori di immagini come DALL·E, Imagen e Stable Diffusion producano opere originali anche se sono progettati per imitare i dati di addestramento. La chiave, secondo uno di questi studi recentemente presentato alla Conferenza Internazionale sul Machine Learning 2025, risiederebbe nelle caratteristiche tecniche intrinseche di questi sistemi, che sono località ed equivarianza traslazionale.
La ricerca di Mason Kamb e Surya Ganguli ha dimostrato che la creatività dei modelli di diffusione deriva da meccanismi tecnici di località ed equivarianza, che guidano la generazione di immagini blocco di pixel per blocco di pixel, senza un contesto globale. La loro macchina matematica ELS (“macchina a punteggio locale equivariante”, un modello matematico che simula esclusivamente questi meccanismi) ha riprodotto con il 90% di precisione i risultati dei modelli addestrati, confermando che la creatività emerge automaticamente dal processo di denoising. Questo processo consiste nella trasformazione di un’immagine in rumore digitale per poi ricostruirla. Il fenomeno di dettagli insoliti, come dita extra nelle prime immagini generate dall’IA, sono dunque un sottoprodotto diretto della generazione locale uno di questi blocchi di pixel, senza contesto globale.
Tuttavia, rimane ancora aperta la questione di come altri sistemi di IA (come gli LLM) manifestino originalità senza sfruttare località ed equivarianza. L’analogia con la creatività umana suggerisce che entrambi i fenomeni possano derivare da un processo di assemblaggio di elementi noti per colmare lacune nella conoscenza, producendo occasionalmente risultati nuovi e significativi.
Leggi l’articolo completo: The Hidden Ingredients Behind AI’s Creativity su wired.com.
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (25/08/2025).

