Lo scorso martedì 17 febbraio Anthropic ha aggiornato il modello Sonnet con la versione 4.6, in linea con il ciclo di aggiornamento quadrimestrale. Il comunicato di Anthropic promette miglioramenti significativi nell’ambito di programmazione, comprensione delle istruzioni e uso del computer. Sonnet 4.6 diventerà il modello di default per i piani Free e Pro, con una finestra di contesto in beta da 1 milione di token (il doppio rispetto alla versione precedente) sufficiente, secondo l’azienda, “elaborare interi codebase, contratti estesi o decine di paper scientifici in un’unica richiesta”.
Il lancio segue di sole due settimane Opus 4.6 e anticipa un prossimo aggiornamento di Haiku, il modello più leggero della famiglia Claude. Sui benchmark dichiarati nel comunicato, il modello stabilisce nuovi record su OS World, che valuta la capacità di operare autonomamente su un computer, e su SWE-Bench, test per la risoluzione di problemi reali di ingegneria del software. Su ARC-AGI-2, che intende misurare ragionamento astratto e adattabilità, capacità tradizionalmente associate all’intelligenza umana, Sonnet 4.6 raggiunge il 60,4%, collocandosi davanti a molti modelli concorrenti di fascia analoga, ma rimane dietro a Opus 4.6, Gemini 3 Deep Think e una versione ottimizzata di GPT 5.2.
Leggi l’articolo completo e il comunicato stampa:
Immagine generata tramite DALL-E. Tutti i diritti sono riservati. Università di Torino (28/01/2025).

