L’entusiasmo verso l’IA, alimentato da investimenti record per 131,5 miliardi di dollari nel 2024, si sta concentrando sugli Agenti AI, software progettati per svolgere compiti complessi in autonomia. Presentati come destinati a rivoluzionare il lavoro cognitivo, questi strumenti sono al centro di una narrativa tecnologica carica di aspettative.
La realtà, però, sembra essere meno brillante. Uno studio di Carnegie Mellon ha mostrato che Gemini 2.5 Pro, il migliore tra gli agenti testati, fallisce nel 70% delle attività d’ufficio. La performance scende solo al 61,7% considerando i compiti parzialmente completati. I concorrenti fanno anche peggio: GPT-4o fallisce nel 91,4% dei casi, Llama 3.1 nel 92,6%, Amazon Nova addirittura nel 98,3%.
Secondo Gartner, oltre il 40% dei progetti con agenti AI sarà cancellato entro il 2027 a causa dei costi e rischi elevati. La società di consulenza documenta un fenomeno di “agent washing”, prodotti esistenti riconfezionati come agenti AI per sfruttare l’hype. Su migliaia di agenti dichiarati, solo 130 lo sarebbero davvero. E mentre il mercato assorbe miliardi, cresce il timore che l’AI stia diventando una bolla con conseguenze sistemiche e a lungo termine.
Leggi l’articolo completo: The Percentage of Tasks AI Agents Are Currently Failing At May Spell Trouble for the Industry su Futurism
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025).

