
Un nuovo studio attribuito al ricercatore Kosta Jordanov di Lenz Research introduce una frattura interessante nella narrativa lineare sulla crescita dell’intelligenza artificiale: cinque tra i modelli linguistici più avanzati del momento, sottoposti agli stessi 1.000 claim di fact-checking reale, non solo sbagliano, ma soprattutto non concordano tra loro. Il dato più destabilizzante per l’industria non è la presenza di errori, ormai metabolizzata come “hallucination rate”, quanto la sistematica divergenza interpretativa su ciò che dovrebbe essere una classificazione binaria o quasi binaria della realtà informativa.
La ricerca ha coinvolto sistemi come GPT-5.4, Claude Opus 4.7, Gemini 3 Pro e varianti con ricerca integrata, insieme a Sonar Pro, imponendo una tassonomia rigida composta da quattro etichette: vero, per lo più vero, fuorviante e falso. L’aspettativa implicita era quella di una convergenza crescente, coerente con la retorica delle big tech secondo cui l’aumento di parametri e contesto dovrebbe produrre maggiore stabilità epistemica. Il risultato osservato va nella direzione opposta, con 672 casi su 1.000 in cui almeno un modello si discosta dalla maggioranza e una quota significativa, pari al 34%, in cui le divergenze sono radicali, cioè con un modello che definisce “vero” ciò che un altro giudica “falso”.
La lettura tecnica di questo fenomeno richiama un problema più profondo della semplice accuratezza: la non equivalenza tra consenso statistico e verità. Il valore di Krippendorff, pari a 0,639, colloca il sistema in una zona che gli stessi autori definiscono di accordo limitato, strutturato ma non affidabile. In termini industriali, significa che i modelli condividono una grammatica della valutazione, ma non una ontologia della realtà. Tradotto nel linguaggio meno gentile dei CTO, questi sistemi parlano la stessa lingua ma non stanno discutendo lo stesso mondo.
Un elemento particolarmente rivelatore emerge nei casi di piena convergenza, che avvengono solo in 328 su 1.000 osservazioni. Anche qui la distribuzione non è neutra: quasi mai i modelli convergono sul territorio intermedio della prudenza epistemica, cioè “per lo più vero” o “fuorviante”. Il consenso si polarizza sugli estremi, come se l’incertezza fosse un regime instabile che i modelli tendono a evitare o comprimere. Questa dinamica suggerisce un bias strutturale verso la semplificazione decisionale, un tratto che ricorda più i sistemi di classificazione automatica del rischio che un processo di analisi critica.
La parte più delicata del lavoro riguarda la natura dei dati utilizzati, estratti da una piattaforma di fact-checking con claim reali sottoposti da utenti, quindi privi di ground truth pubblica e facilmente verificabile. Questo dettaglio, apparentemente tecnico, è in realtà centrale perché elimina la possibilità per i modelli di ancorarsi a pattern già presenti nei dataset di training. Il risultato è un ambiente epistemico non normalizzato, dove la performance non misura memoria statistica ma capacità di interpretazione contestuale. È proprio qui che emerge la divergenza sistemica tra modelli, che non è più attribuibile a errori casuali ma a differenti prior di valutazione della verosimiglianza.
Alcuni esempi riportati nello studio evidenziano la frizione interna al sistema. Una stessa affermazione su dati finanziari del World Bank portfolio in Nigeria genera simultaneamente giudizi di verità, falsità e mediazione interpretativa. Analogamente, dichiarazioni politiche relative a eventi geopolitici mostrano oscillazioni ancora più marcate, con modelli che attribuiscono etichette opposte allo stesso contenuto. In questo scenario, il problema non è la capacità di “sapere”, ma la mancanza di una funzione condivisa di giudizio.
Sul piano strategico, la questione è tutt’altro che accademica. L’adozione crescente di sistemi AI come strumenti di fact-checking implicito nei workflow editoriali, nei motori di ricerca e nelle interfacce conversazionali introduce un rischio strutturale: la sostituzione dell’autorità epistemica con una media non verificata di autorità artificiali. Se la maggioranza dei modelli non garantisce verità, e il dissenso non è sistematicamente interpretabile come errore, allora il concetto stesso di “risposta AI” si trasforma da output informativo a distribuzione di probabilità interpretative.
Il punto critico che emerge dal lavoro di Lenz Research è che la traiettoria dell’intelligenza artificiale non sta convergendo verso un oracolo digitale, ma verso una pluralità di micro-giudici incoerenti tra loro, ciascuno ottimizzato per criteri diversi di plausibilità. In questo contesto, la promessa implicita di un’AI come arbitro neutrale della verità si rivela più fragile di quanto l’industria sia disposta ad ammettere. La vera domanda non riguarda quanto siano accurati questi sistemi presi singolarmente, ma quanto sia sostenibile affidare la definizione della realtà a un insieme di modelli che, quando interrogati sugli stessi fatti, non riescono nemmeno a concordare su cosa significhi “vero”.