Nel commento pubblicato sul Guardian, Gary Marcus ha accolto lo studio di Apple come una conferma delle critiche che solleva dal 1998 sull’intelligenza artificiale basata su reti neurali. Lo studio “ha preso d’assalto il mondo tech”, dimostrando in modo sistematico che i modelli linguistici appaiono intelligenti, ma falliscono di fronte a problemi complessi o che esulano dalla distribuzione dei dati di riferimento, anche quando si tratta di compiti che un bambino saprebbe affrontare.
Gary Marcus sottolinea che questi sistemi non mostrano vere e proprie capacità di ragionamento: sono ottimi nel riconoscere pattern nei dati su cui sono stati addestrati, ma crollano davanti alla novità. Proprio in questo senso, il paper di Apple smentisce definitivamente la speranza che basti “scalare” (cioè ingrandire) i LLM per ottenere capacità di ragionamento generalizzato.
Il nodo centrale è che, al di là dell’hype, i LLM non sono affidabili per risolvere problemi complessi in modo autonomo. Possono affiancare l’essere umano in attività come scrittura o programmazione, ma restano strumenti probabilistici, non pensanti. Alcuni algoritmi classici, come quelli usati da Herbert Simon nel 1957, risultano ben più efficaci in compiti strutturati rispetto ai moderni LLM, per quanto potenti e scalabili. L’esperto ribadisce di non essere contrario all’AI in sé, ma scettico sull’affidabilità e sulle pretese degli attuali LLM in quanto tappe verso l’intelligenza artificiale generale (AGI).
Leggi l’articolo completo When billion-dollar AIs break down over puzzles a child can do, it’s time to rethink the hype su The Guardian
Immagine generata tramite DALL-E. Tutti i diritti sono riservati. Università di Torino (2025).

