Programmare non è più una questione di digitare codice riga per riga con occhi incollati al terminale. L’Intelligenza Artificiale ha ormai messo le mani sul cuore pulsante dello sviluppo software, trasformando compiti ripetitivi e noiosi in operazioni automatiche affidate a sciami di agenti e sub-agenti. Claude Code e Cowork hanno mostrato la via: sistemi agentici che lavorano autonomamente su task complessi, mentre gli sviluppatori si occupano di orchestrazione e supervisione. Anche se, a dirla tutta, la confusione tra interfacce, workflow e nuove forme di collaborazione umano-AI ha reso difficile anche ai laboratori più avanzati tenere il passo.
OpenAI non è rimasta a guardare. Dopo aver testato Codex prima come tool da riga di comando e poi su web, l’azienda ha lanciato un’applicazione macOS dedicata, capace di gestire più agenti in parallelo, integrare skill specifiche e orchestrare flussi di lavoro moderni che fino a ieri sembravano fantascienza. L’uscita segue di poco il debutto di GPT-5.2-Codex, modello che OpenAI considera il più potente mai creato per la scrittura automatica di codice. Sam Altman non si nasconde dietro un dito: “Se vuoi lavorare su qualcosa di complesso, 5.2 è senza dubbio il modello più forte. Il problema era renderlo usabile. Ora l’interfaccia flessibile cambia tutto.”
Benchmark come TerminalBench danno a GPT-5.2 la palma del leader, almeno per compiti da linea di comando, ma la realtà è più sfumata. Agenti di Gemini 3 e Claude Opus non sono troppo distanti, con punteggi che rientrano nel margine d’errore. SWE-bench, che misura la capacità di correggere bug reali, conferma che il divario tra i modelli è minimo. L’aspetto più intrigante non è tanto la velocità del modello quanto l’esperienza d’uso: gli scenari agentici sono difficili da misurare, e la differenza reale spesso emerge solo quando il codice incontra problemi complessi nel mondo reale.
La nuova app Codex introduce caratteristiche pensate per spingere l’esperienza oltre quella delle controparti Claude. Automazioni programmate in background, risultati messi in coda per la revisione, possibilità di selezionare personalità diverse per gli agenti, dal pragmatico all’empatico, in base allo stile di lavoro. Non è un dettaglio di stile: la psicologia dell’interazione umano-AI sta diventando un fattore competitivo concreto. Alcuni sviluppatori più ironici parlano di “assistenti con personalità multiple”, come se stessero scegliendo tra colleghi virtuali con cui uscire a pranzo.
La vera rivoluzione, secondo Altman, non è la precisione ma la velocità: partire da un foglio bianco e arrivare a software sofisticato in poche ore. La frase suona quasi come una minaccia velata a chi considera lo sviluppo software un mestiere lento e metodico: “La velocità con cui posso digitare nuove idee è il limite di ciò che può essere costruito.” Non sorprende che le startup più aggressive stiano già integrando flussi agentici nei loro processi di sviluppo, riducendo cicli di produzione che una volta richiedevano settimane.
Dietro questa accelerazione c’è una sottile provocazione culturale: l’AI non solo fa il lavoro pesante, ma plasma il modo in cui pensiamo il software. Non più semplici tool, ma collaboratori agentici che suggeriscono, correggono, ottimizzano, e persino dialogano con noi. La linea tra sviluppatore e supervisore si assottiglia, e chi non si adatta rischia di restare intrappolato in paradigmi vecchi di decenni.
Curioso notare come la competizione tra piattaforme stia diventando una gara non tanto di codice, ma di orchestrazione degli agenti: chi riesce a far lavorare insieme più agenti, con personalità diverse e automazioni intelligenti, conquista il vantaggio strategico. Gli utenti più esperti già sperimentano flussi in cui un agente scrive codice, un altro lo testa, un terzo corregge bug minori, il tutto mentre l’umano supervisiona e introduce nuovi stimoli. Un po’ come dirigere un’orchestra senza mai toccare uno strumento, con il rischio che un violino stonato possa passare inosservato se l’agente non è sufficientemente sofisticato.
Il passo successivo è prevedibile: interfacce più naturali, agenti multimodali che leggono documentazione, guardano screenshot, interpretano log, e suggeriscono soluzioni. Il confine tra programmazione e orchestrazione diventa labile. OpenAI punta a questo con Codex macOS, sperando di catturare gli utenti Claude che cercano maggiore flessibilità senza rinunciare alla potenza del modello 5.2. La posta in gioco non è solo vincere benchmark, ma ridefinire l’esperienza stessa del coding.
In definitiva, la programmazione sta entrando in una nuova era. Non più solo tastiere e IDE, ma ecosistemi agentici, personalizzabili e autonomi, dove la velocità e la capacità di orchestrazione diventano più importanti della pura conoscenza del linguaggio. L’ironia? Tutti parlano di efficienza, ma la vera sfida sarà gestire il caos controllato di un gruppo di agenti con opinioni proprie, prima che diventino loro stessi i protagonisti della prossima rivoluzione del software.
Se vuoi davvero capire dove sta andando la scrittura del software, guarda a Codex e agli agenti che popolano la nuova frontiera della programmazione: non più assistenti, ma co-autori intelligenti capaci di far sembrare un’idea brillante solo un input da tastiera, mentre dietro le quinte la vera magia accade senza che nessuno debba sporcarsi le mani di codice.
Blog OOpenAI: https://openai.com/index/introducing-gpt-5-2-codex/