La promessa era allettante: intelligenze artificiali come Cursor e GitHub Copilot avrebbero dovuto trasformare radicalmente i flussi di lavoro degli sviluppatori, scrivendo codice, correggendo bug e testando modifiche con la rapidità di un clic. Sostenute dai modelli di punta di OpenAI, Google DeepMind, Anthropic e xAI, queste soluzioni si sono fatte largo negli ambienti di sviluppo come l’ultima rivoluzione digitale, un turbo per la produttività che avrebbe eliminato le noiose routine. E invece? Una ricerca fresca di stampa del gruppo no-profit METR getta acqua gelida su questo ottimismo, svelando un effetto controintuitivo: l’uso di AI nei compiti reali, per sviluppatori esperti, ha rallentato i tempi di completamento del 19%.

Il campione era ristretto ma significativo: sedici sviluppatori open source con anni di esperienza, chiamati a svolgere 246 task reali su grandi repository. La metà dei task “AI-allowed”, l’altra metà vietata all’uso di strumenti intelligenti come Cursor Pro. Prima di iniziare, i professionisti stimavano un risparmio del 24% nei tempi, aspettandosi un’accelerazione sostanziosa. Il risultato, dicono i ricercatori, è stato sorprendente: “consentire l’uso dell’AI ha effettivamente aumentato i tempi di completamento.” Una doccia fredda per chi considera i vibe coders l’ennesimo upgrade indispensabile.

L’analisi scava nei motivi di questo paradosso. Gli sviluppatori spendono molto più tempo a “parlare” con l’AI, formulando prompt, correggendo risposte e aspettando output, rispetto al codice scritto in autonomia. La complessità dei grandi codebase, con i loro intrecci intricati di dipendenze e logiche, mette in difficoltà le IA attuali, rendendo i suggerimenti meno immediatamente utili o addirittura fuorvianti. Una specie di filtro che, invece di accelerare, rallenta il flusso creativo e operativo.

Va detto che solo il 56% degli sviluppatori aveva familiarità con Cursor prima dello studio, mentre il 94% aveva comunque esperienza con modelli linguistici applicati al coding, e che la curva di apprendimento sul tool è stata parte dell’esperimento. I ricercatori sottolineano inoltre che i risultati non devono essere intesi come una bocciatura totale degli AI coding tool: studi su scala più ampia hanno già dimostrato miglioramenti nella produttività, e il progresso tecnologico è rapido — potrebbero bastare pochi mesi per cambiare nuovamente lo scenario.

Questo studio rappresenta però un monito per chi vende l’AI come un boost universale e immediato, soprattutto ai professionisti navigati. Non basta integrare un assistente digitale per aumentare la velocità: serve che l’AI capisca il contesto, l’architettura del software e i vincoli, e che riduca al minimo l’interazione “extra” necessaria per ottenere risposte affidabili. Senza questo, il rischio è un sovraccarico cognitivo, che paradossalmente ostacola l’efficienza.

Un ulteriore punto di cautela è il tema della qualità del codice generato. Altri studi hanno evidenziato come i suggerimenti AI possano introdurre bug o addirittura vulnerabilità di sicurezza, complicando ancor di più il compito dello sviluppatore e spostando il carico di controllo su chi scrive, anziché alleggerirlo.

La tecnologia IA nel coding è indubbiamente un’area di progresso vertiginoso, ma questo studio mette in chiaro che il suo impatto non è né uniforme né scontato. Le aziende e i team di sviluppo devono mantenere un approccio critico e pragmatico, valutando caso per caso l’effettivo valore aggiunto, senza cedere al mito di una rivoluzione automatica e immediata.

Il futuro del software engineering sarà probabilmente ibrido, dove umani e AI collaborano, ma con regole chiare e aspettative realistiche. Per ora, gli sviluppatori non devono aspettarsi che i vibe coders siano una scorciatoia magica, ma piuttosto uno strumento da padroneggiare con pazienza e consapevolezza.

Così, mentre le IA promettono di scrivere codice più veloce, spesso rischiano di farci riflettere su quanto la velocità sia anche una questione di flusso cognitivo, esperienza e adattamento più che di pura automazione.