Codex OpenAI punta alla codifica autonoma, ma resta complessa

Marta Baronio

21/05/2025

OpenAI ha annunciato il lancio di Codex, un nuovo sistema progettato per svolgere compiti di programmazione complessi partendo da semplici comandi in linguaggio naturale. Codex si inserisce in un filone emergente di strumenti di codifica agentica, che punta a superare i limiti degli attuali assistenti come GitHub Copilot, ancora vincolati al completamento automatico all’interno degli ambienti di sviluppo tradizionali.

A differenza degli strumenti precedenti, le nuove soluzioni agentiche, come Devin, SWE-Agent, OpenHands e ora Codex, puntano a operare in modo autonomo, senza che l’utente debba intervenire direttamente sul codice. L’obiettivo sarebbe quello di gestire l’intero processo, dall’assegnazione del compito alla sua risoluzione, attraverso interfacce come Slack o Asana, emulando la logica di un team di sviluppatori coordinato da un project manager.

Tuttavia, i risultati concreti sembrano essere ancora contrastanti. Ad esempio Devin, reso pubblico nel 2024, ha ricevuto forti critiche per l’alta incidenza di errori, mettendo in discussione la possibilità di un’effettiva riduzione del carico di lavoro per gli sviluppatori. Anche gli stessi sostenitori della codifica agentica, come Robert Brennan di All Hands AI, mettono in guardia contro l’uso non supervisionato di questi strumenti, segnalando problemi ricorrenti come le allucinazioni.

I benchmark, come la classifica SWE-Bench, offrono indicazioni parzialmente incoraggianti: OpenHands ha raggiunto un tasso di risoluzione del 65,8%, mentre OpenAI afferma che il modello Codex-1 avrebbe ottenuto il 72,1%, sebbene il dato non sia stato verificato in modo indipendente.

Il traguardo di una programmazione davvero autonoma rimane ancora lontano. Sembrerebbe piuttosto che la sfida principale consista nel ridurre l’affidamento alla supervisione umana e garantire maggiore affidabilità nella gestione dei task, soprattutto in contesti complessi.

Leggi l’articolo completo: OpenAI’s Codex is part of a new cohort of agentic coding tools su techcrunch.com.

Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025).