Una curiosa fusione di hype e dati reali: i modelli AI stanno scalando la curva dell’intelligenza artificiale come rockstar in tournée mondiale. Più che un meme, c’è un fondamento concreto in report indipendenti. TrackingAI.org ha svolto test approfonditi – compreso il celebre test di Mensa Norvegia rilevando punteggi IQ che superano di gran lunga la media umana di 100, spesso oscillando tra 120 e addirittura 136 .

Tra i casi più eclatanti: OpenAI o3 si piazza tra i 135 e i 136 IQ, al vertice della classifica tra 24 modelli testati, superando soglie da Mensa (soglia 98º percentile ≈ 130). Fatto non banale, o3 ottiene 136 sulla versione pubblica del test e un sorprendente 116 su domande fuori dal suo training, suggerendo che non si tratta solo di ripetere, ma di ragionare davveroo almeno provarci con stile.

Altri modelli linguistici di vertice: Claude-4 Sonnet (127), Gemini 2.0 Flash Thinking (126), Gemini 2.5 Pro (124), OpenAI o4-mini (122). La tendenza: solo i modelli testuali raggiungono vette mentali, mentre quelli multimodali (vision) sprofondano sotto la media umana GPT-4o Vision (63), Grok-3 Think Vision (60).

Fonti: Digital Information WorldVisual CapitalistCryptoSlateDeepNewz+1