Ogni attore ha il suo momento di gloria, il suo rilascio “rivoluzionario”, la sua conferenza patinata da annunciare tra un keynote e una demo pompata a razzo. Ma oggi, finalmente, Google sembra aver smesso di rincorrere gli altri per tornare a fare scuola. Con il rilascio della versione aggiornata in anteprima di Gemini 2.5 Pro, siglata 06-05, Mountain View alza l’asticella in modo tangibile. E sì, stavolta i benchmark non mentono: stavolta è roba seria.
Partiamo da dove il dolore si sentiva di più: fuori dal mondo del coding, le release precedenti della famiglia Gemini 2.5 sembravano avvolte da una nebbia di mediocrità. Accuse non troppo velate su Reddit, sussurri negli ambienti dev più esigenti: “03-25 era più brillante”, “le nuove release hanno perso smalto”, “troppa ottimizzazione, poca anima”. Bene: con 06-05, Google prova a rimediare. E lo fa con un’operazione chirurgica sul linguaggio, sulla formattazione delle risposte e udite udite su una creatività finalmente leggibile, non più solo impressa nei prompt di marketing.
La keyword qui è: reasoning, con i due satelliti semantici codice e prestazioni creative. Perché se è vero che Gemini 2.5 Pro oggi scala le vette di AIDER Polyglot (un benchmark per sviluppatori poliglotti, letteralmente), è altrettanto vero che la vera sfida si gioca su piani più alti. Stiamo parlando di GPQA un benchmark che mette alla frusta la conoscenza enciclopedica e di quel piccolo incubo accademico chiamato Humanity’s Last Exam, una creatura sadica costruita per stressare i modelli sulle materie dure: matematica, scienze e ragionamento logico.
Nel frattempo, l’Elo Score la metrica mutuata dal mondo degli scacchi per misurare l’efficacia dei modelli AI nel confronto diretto segna un +24 su LMArena e un +35 su WebDevArena. Tradotto: Gemini 2.5 Pro è attualmente il leader assoluto nel contesto del coding web, un terreno dove anche ChatGPT-4.5 ha avuto momenti di esitazione. E se il nome WebDevArena non ti dice nulla, è il momento di aggiornarti: è il nuovo termometro delle capacità pratiche delle AI sullo sviluppo frontend e backend. Insomma, non è solo teoria: è prodotto.
Ma c’è di più, perché stavolta Google gioca anche la carta del controllo del costo computazionale con i cosiddetti thinking budgets, introdotti con la versione 2.5 Flash. È una trovata elegante, quasi crudele: ti do un’AI iperpotente, ma ti lascio scegliere quanto deve “pensare”, modulando il consumo. Più budget = risposte più riflessive. Meno budget = reattività e leggerezza. È l’AI a gettoni del 2025, baby.
E qui arriva il colpo di scena. Perché, mentre Meta pubblica paper pieni di promesse e OpenAI continua a cullare il mito del suo prossimo “agente AI autonomo”, Google si fa concreta, quasi umile. Rilascia questa 06-05 in anteprima, disponibile fin da subito su Gemini API, Google AI Studio, Vertex AI e – attenzione – direttamente nella Gemini app. In altre parole: questa nuova versione è già tra noi, in rollout silenzioso ma deciso. E, ironia della sorte, arriva proprio mentre molti utenti stavano iniziando a disinstallare Gemini per tornare a ChatGPT.
C’è un’aria di rivincita, quasi da nerd vendicatore. Perché Gemini 2.5 Pro versione 06-05 non è solo una patch, non è un aggiornamento cosmetico. È la risposta a chi accusava Google di aver perso la mano, di essere sempre “una release indietro”.
È anche un’operazione simbolica, quasi culturale: la conferma che l’era degli LLM sta entrando in fase 2, dove non vince solo chi ha più parametri o più GPU, ma chi riesce a restituire risposte che non sembrano scritte da un’enciclopedia lobotomizzata.
Il dettaglio curioso? Nessun comunicato stampa da standing ovation, nessuna conferenza con Sundar Pichai in camicia bianca. Solo una release silenziosa, fatta per i dev, per i CTO stanchi di model update che sembrano sempre beta travestite da stable.
Forse è anche questo il segnale che stavamo aspettando. Dopo il rumore, il codice. Dopo la promessa, il benchmark. Dopo la hype, la sostanza.
Gemini 2.5 Pro 06-05 non è perfetta. Ma è, finalmente, coerente.
Ed è un modello che – come direbbe Von Neumann, se fosse tra noi – pensa meglio.


