Lunedì 28 settembre Anthropic ha presentato Claude Sonnet 4.5, il suo nuovo modello pensato appositamente per la programmazione. Infatti, è stato progettato per essere in grado di sviluppare applicazioni pronte per la produzione e non più solo per prototipi. È disponibile tramite API e chatbot, mantenendo i costi della versione precedente (ovvero 3 dollari per milione di token in input e 15 dollari per milione di token in output).
Negli ultimi mesi Anthropic si è affermata tra sviluppatori e aziende. Infatti, i suoi modelli sono adottati da Apple e Meta e sono integrati in strumenti come Cursor, Windsurf e Replit. Tuttavia, con l’uscita di GPT-5 di OpenAI la sfida tra le big tech torna a farsi più intensa, in quanto questo nuovo modello di OpenAI ha ottenuto risultati migliori rispetto a Claude in diversi test di programmazione.
Secondo Anthropic, Claude Sonnet 4.5 raggiungerebbe prestazioni leader nei test di programmazione, in particolare nel benchmark SWE-Bench Verified, ma la reale forza risiederebbe nella gestione di progetti complessi e duraturi. Infatti, durante alcuni test preliminari, il modello avrebbe programmato in autonomia per oltre 30 ore, arrivando a gestire database, domini e controlli di sicurezza.
Anthropic sottolinea anche i progressi nell’allineamento del modello, con minori tassi di inganno e vulnerabilità agli attacchi. Lancia Claude Agent SDK, per consentire agli sviluppatori di creare agenti personalizzati, e un’anteprima sperimentale di “Imagine with Claude”, strumento per la generazione di software in tempo reale.
Leggi l’articolo completo: Anthropic launches Claude Sonnet 4.5, its best AI model for coding su techcrunch.com
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (28/01/2025).

