• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Interpretabilità e IA, Amodei (Anthropic) vuole aprire la scatola nera

una lente d'ingrandimento che rappresenta la ricerca e una rete neurale sullo sfondo

In un saggio intitolato “The Urgency of Interpretability”, Il CEO di Anthropic Dario Amodei ha sottolineato come l’industria tecnologica continui ad avere una comprensione molto limitata del funzionamento interno dei modelli IA, nonostante i progressi nelle prestazioni. Considerando la centralità e il grado di autonomia che questi sistemi assumeranno in diversi aspetti centrali della società, come economia e sicurezza, Amodei ritiene “inaccettabile che l’umanità ignori totalmente il loro funzionamento”. In questo senso, ha fissato per Anthropic un obiettivo ambizioso: rilevare in modo affidabile la maggior parte dei problemi dell’IA entro il 2027.

Anthropic si colloca tra le aziende pioniere nel campo dell’interpretabilità meccanicistica. Questa disciplina si propone di svelare i meccanismi interni dei modelli e chiarire le ragioni alla base delle loro decisioni, al fine di affrontare il problema della scatola nera dell’IA. L’azienda sostiene di aver già raggiunto alcuni progressi, riuscendo a individuare specifici “circuiti” logici in grado, ad esempio, di associare correttamente città e stati negli USA. L’obiettivo a lungo termine è sviluppare l’equivalente di “scansioni cerebrali” o “risonanze magnetiche” dei modelli, che consentirebbero di identificare una vasta gamma di problemi e debolezze. Secondo il CEO, questo traguardo potrebbe richiedere da cinque a dieci anni.

Amodei ha esortato anche OpenAI e Google DeepMind ad aumentare i loro sforzi di ricerca nel campo dell’interpretabilità. Inoltre, ha suggerito regolamentazioni “leggere” per incoraggiare questi studi, come l’obbligo per le aziende di divulgare le loro pratiche di sicurezza e controlli sull’export di chip verso la Cina, per evitare una corsa globale incontrollata all’IA.

Leggi gli articoli completi:

Immagine generata tramite DALL-E. Tutti i diritti sono riservati. Università di Torino (2025).

Esplora altri articoli su questi temi