Il ranking dei modelli di intelligenza artificiale più recenti ha fatto saltare più di qualche certezza. Non è un caso se la classifica “intelligenza per euro” riserva sorprese, e qualche delusione, per chi si aspettava che il più caro fosse il migliore in tutto. La chiave per capire questo nuovo panorama è smettere di guardare solo il “peso del cervello” (cioè il punteggio IQ) e iniziare a considerare seriamente il rapporto costo-intelligenza, una metrica che il mercato sta finalmente facendo propria. Se pensavi che GPT-5 High fosse l’ultima parola, beh, preparati a rivedere i tuoi giudizi.

La top-left quadrant è dove si nasconde il miglior “bang for the buck”. GPT-5 Mini, con un punteggio di intelligenza di 63, si piazza come il modello più efficiente a circa 50 dollari, seguito dal suo fratellone low-cost, che mantiene lo stesso IQ ma a circa 120 dollari. Qui il mantra è semplice: un’intelligenza decente senza dover svuotare il portafoglio. Qualcuno lo chiamerebbe “smart spending”, altri “ottimizzazione del costo”, ma tutti dovrebbero chiamarlo strategia vincente. Per un CEO che deve bilanciare investimenti tecnologici e ROI, questa fascia è la più interessante.

Spostando lo sguardo in alto a destra, la sezione dei cervelloni con il conto salato: GPT-5 High. Qui si parla di IQ altissimi, tra 72 e 74, con un prezzo che sfiora o supera i mille dollari. Nella stessa arena giocano anche nomi pesanti come Gemini 2.5 Pro, Claude 4 Opus e Qwen3 235B (Reasoning), tutti modelli che promettono ragionamenti raffinati e capacità cognitive elevate. Inutile negarlo, è la zona dei “superdotati” dove il costo sembra essere un limite necessario, quasi una barriera all’ingresso per i non addetti ai lavori. Non a caso, queste soluzioni sono spesso riservate a settori specialistici o usi enterprise di alta fascia, dove la qualità paga più del prezzo.

Il segmento “mid-tier” bilanciato è un animale a parte: DeepSeek R1, GLM-4.5 e Gemini 2.5 Flash (Reasoning) si assestano su un IQ tra 55 e 60, con costi più abbordabili tra 200 e 300 dollari. Un compromesso che molti sottovalutano, ma che può rivelarsi la scelta più pragmatica in ambienti dove non serve il massimo ma serve affidabilità e un buon livello cognitivo. La fascia media, infatti, è spesso la più ricca di valore nascosto, perché unisce stabilità, versatilità e un costo che permette di sperimentare senza rischiare fallimenti catastrofici.

Non può mancare la categoria “budget-friendly” che però paga in termini di intelligenza. GPT-5 Nano e Solar Pro 2 (Reasoning) sono i re del low cost, oscillando tra 20 e 30 dollari con IQ tra 40 e 52. Se si considera il prezzo, sono un buon compromesso per chi vuole iniziare a testare l’intelligenza artificiale senza investimenti ingenti, ma il loro potenziale è limitato. Kimi K2 e GPT-4 si piazzano qui per IQ simile, ma costano di più, il che li rende decisamente meno competitivi in termini di valore. In pratica, paghi il marchio più che la sostanza.

OpenAI si conferma come il “giocatore universale”, presente in tutti i quadranti, offrendo un portafoglio completo per ogni tasca e necessità. Anthropic invece si posiziona come brand premium, non per tutte le tasche, Google punta sulle prestazioni alte con costi medio-alti, mentre DeepSeek e GLM conquistano il sweet spot della fascia media, dove il compromesso tra prezzo e performance fa davvero la differenza.

Qualcuno potrebbe pensare che questo gioco di posizionamenti sia una semplice guerra di marketing, ma la verità è più complessa e affascinante. Dietro ogni punteggio IQ e ogni prezzo c’è un ecosistema di tecnologie, infrastrutture e strategie di business che trasformano il dato numerico in valore tangibile. Chi non comprende questa dinamica rischia di buttare soldi in modelli che, pur brillanti, non generano ritorno economico. Come spesso succede nel mondo tech, il costo non è un indicatore lineare di qualità, ma una variabile da gestire con intelligenza.

I numeri non mentono, ma spesso ingannano. La corsa al modello con IQ più alto è un mito da sfatare, soprattutto se manca una valutazione pragmatica del costo e dell’effettivo utilizzo. Un po’ come comprare un’auto di lusso per fare solo la spesa: serve poco, costa tanto, e in fondo ti fa solo sentire importante. La vera sfida oggi è saper leggere il valore reale, che si nasconde nella capacità di integrare l’intelligenza artificiale in un modello di business scalabile e sostenibile, non solo nello stupire con dati di laboratorio.

Vale la pena riflettere su come questa classificazione influenzerà la strategia delle aziende che adottano AI. In un mercato che si affolla di opzioni, scegliere il modello giusto al prezzo giusto non è più un esercizio accademico, ma un fattore critico di successo. Chi sa cogliere questa nuova dinamica potrà non solo migliorare l’efficienza operativa, ma anche scatenare nuove ondate di innovazione, con intelligenze artificiali calibrate su misura per ogni contesto e budget.

Chiudere gli occhi sul valore vero di un modello AI significa perdersi nel rumore dei dati e delle mode tecnologiche. La domanda non è più “qual è il modello più intelligente?” ma “qual è il modello che offre il miglior equilibrio tra intelligenza e costo?”. Il futuro della AI non è in una sola “super mente” ma in un ecosistema di modelli diversificati, che dialogano tra loro con intelligenza, efficienza e soprattutto buon senso economico. A ben vedere, non c’è nulla di più umano in tutto questo.

Grok 4 ha ottenuto il punteggio di intelligenza più alto nei test recenti, con 73, superando i modelli di OpenAI. Ha dominato benchmark come GPQA Diamond e AIME. Gemini 2.5 Pro è apprezzato per la sua versatilità, gestendo testo, visione e codifica con prestazioni costanti. DeepSeek R1 si avvicina nei punteggi di ragionamento, offrendo uno dei costi per token più bassi.

Questi dati sono importanti, ma i benchmark sono test di laboratorio. Non sempre riflettono cosa accade in contesti reali, con dati non affidabili o problemi organizzativi.

Il problema principale con GPT-5 è che, senza pagare per il modello avanzato o usare GPT-5 Thinking o Pro, chiedendo “GPT-5” si ottiene a volte l’intelligenza artificiale più performante e altre volte versioni meno efficaci, senza modo di riconoscerle. Inoltre, la qualità può variare anche nella stessa conversazione.(OpenAI promette di risolvere questo problema, ma questa è l’esperienza attuale per tutti gli utenti)