OpenAI alza il sipario su una rivoluzionaria evoluzione del suo assistente di programmazione, Codex. Nasce GPT-5-Codex, un modello di intelligenza artificiale progettato per “pensare” in modo più profondo e flessibile. A differenza dei suoi predecessori, questa nuova versione adatta dinamicamente il suo tempo di elaborazione, potendo dedicare da una manciata di secondi fino a sette ore per risolvere un singolo problema di codice. Il risultato? Prestazioni che ridefiniscono gli standard nei benchmark di settore.

L’aggiornamento è già in distribuzione per gli abbonati ai piani ChatGPT Plus, Pro, Business, Edu ed Enterprise, che possono sfruttarne le potenzialità attraverso gli strumenti Codex integrati in terminale, IDE, GitHub e ChatGPT. OpenAI ha inoltre confermato l’intenzione di estendere l’accesso al nuovo modello anche agli sviluppatori tramite API in un prossimo futuro.

Questa mossa strategica di OpenAI si inserisce in un mercato sempre più agguerrito, dove la supremazia nel campo degli assistenti di programmazione AI è contesa da giganti come GitHub Copilot di Microsoft e stelle nascenti come Claude Code e Cursor. La domanda per questi strumenti è esplosa nell’ultimo anno, trasformando il settore in un vero e proprio campo di battaglia tecnologico, con storie di successo fulminee e acquisizioni strategiche che ne delineano il futuro.

I dati parlano chiaro: secondo OpenAI, GPT-5-Codex non si limita a migliorare le performance del suo predecessore, ma le surclassa nettamente. Il nuovo modello ha dimostrato una superiorità schiacciante su benchmark di riferimento come SWE-bench Verified, che valuta le capacità di problem-solving autonomo, e in test specifici dedicati al refactoring di codice complesso all’interno di repository di grandi dimensioni.

Grafico che mostra le prestazioni di GPT-5-Codex
Crediti immagine:OpenAI

Ma le capacità di GPT-5-Codex non si fermano alla scrittura di codice. Il modello è stato addestrato specificamente per effettuare revisioni di codice, un compito delicato e cruciale. Ingegneri software esperti, chiamati a valutare i suoi feedback, hanno confermato la sua efficacia: i commenti generati sono risultati non solo più precisi e con meno errori, ma anche di maggiore impatto strategico per il miglioramento del software.

Il segreto di questa potenza risiede in quella che Alexander Embiricos, responsabile del prodotto Codex in OpenAI, definisce una “capacità di riflessione” dinamica. A differenza del classico router di GPT-5, che valuta una richiesta e decide a priori quanta potenza di calcolo allocare, GPT-5-Codex adotta un approccio più simile a quello umano. Inizia a lavorare su un problema e, se si accorge della sua complessità, è in grado di decidere in tempo reale di dedicargli più tempo e risorse. Questo significa che può passare da un’analisi di pochi minuti a un’immersione profonda che, in alcuni casi osservati, ha superato le sette ore consecutive, garantendo una soluzione più robusta e ponderata.

Categorized in:

Breaking AI,

Last Update: Settembre 19, 2025