L’illusione più pericolosa del nostro tempo è forse questa: affidare decisioni mediche complesse a modelli di intelligenza artificiale generativa che, per quanto sofisticati, rimangono fondamentalmente dei cantastorie ben addestrati, non medici. Google ha di recente offerto un caso emblematico, quasi grottesco, con il suo Med-Gemini, un modello AI presentato come avanguardia nella diagnostica radiologica. L’errore emerso, identificare un “infarto del ganglio basilar sinistro”, un’entità anatomica inesistente, racconta molto più di un semplice refuso: rivela le fragilità strutturali e cognitive di questi sistemi. Il “basilar ganglia” è una fantomatica creazione che confonde il “ganglio basale” area cerebrale reale con l’“arteria basilare” vaso sanguigno anch’esso reale ma ben distinto. Si potrebbe liquidare la questione come un errore di battitura, eppure l’assenza di revisione del paper scientifico – a dispetto della correzione nel blog aziendale – sottolinea quanto la superficialità sia diventata il prezzo del marketing tecnologico.

In ambito clinico, però, queste leggerezze non sono semplici fastidi da ignorare. Nel migliore dei casi generano confusione, nel peggiore possono compromettere vite umane. Il problema è che queste AI non sono dotate di coscienza critica o capacità di autocorrezione. Judy Gichoya di Emory University mette a fuoco il cuore del disastro: queste intelligenze “inventano” risposte e raramente ammettono di non sapere. Quando si parla di salute, la disonestà intellettuale, seppur non voluta, diventa una bomba a orologeria. La convinzione che “bigger is better”, ossia aumentare a dismisura i dati di training o la complessità del modello, porti automaticamente a una maggiore affidabilità, è ormai una favola per investitori e appassionati di hype. La realtà è che nessuna quantità di prompt engineering o fine-tuning trasformerà un modello basato su pattern linguistici in un medico affidabile.

Dietro questa crisi si cela una verità scomoda: i grandi modelli linguistici (LLM) non “capiscono” nulla, non possono farlo perché non sono progettati per comprendere la realtà, ma solo per mimare la superficie del linguaggio umano. Non esiste un vero “grounding” nei dati, nessuna ancoratura solida alla realtà. Non è un problema tecnico di scala o di risorse computazionali, è una limitazione architetturale. La mancanza di un meccanismo interno di verifica e autocorrezione trasforma questi sistemi in cantori perfetti di inesattezze vestite di eloquenza. In un contesto come la medicina, dove il minimo errore può avere conseguenze irreparabili, questo è inaccettabile.

Il fenomeno è emblematico di un malessere più ampio nel campo dell’AI. Le presentazioni pubbliche di nuovi modelli diventano veri e propri spettacoli teatrali di performance, in cui si celebra l’avanzamento tecnologico senza interrogarsi sulle fondamenta. Le aziende si concentrano su metriche superficiali, sull’effetto wow, lasciando sul campo i dubbi cruciali su sicurezza, affidabilità e responsabilità. Il risultato è una narrativa autoavvolgente, un coro di hype che si autoalimenta mentre sotto la superficie la sostanza rimane fragile.

Google stessa, con MedGemma, non è riuscita a risolvere i problemi. Risposte diverse a seconda di come vengono poste le domande indicano un sistema instabile, incline a variazioni non deterministiche che non si addicono a un contesto in cui l’accuratezza è un imperativo categorico. La scienza della radiologia e della diagnostica medica non possono tollerare ambiguità o approssimazioni. Il prezzo da pagare sarebbe troppo alto.

Questa situazione dovrebbe farci riflettere su quale sia davvero il valore dell’AI in medicina e, più in generale, in ambiti critici. Il futuro non può essere affidato a simulacri di intelligenza che ripetono ciò che leggono senza mai interrogarsi sulla veridicità di quanto propongono. I sistemi ideali devono imparare, comprendere e sapere quando non sanno. Questa è la vera intelligenza, non una mera capacità di produrre testo plausibile. Solo così potremo evitare che la tecnologia diventi una trappola pericolosa mascherata da progresso.

È ironico come la sfida più grande dell’AI non sia tanto la complessità computazionale, ma la sua incapacità di essere umana nella misura giusta: autocritica, consapevolezza dei limiti, umiltà cognitiva. Si può costruire un sistema più intelligente, non uno più grande. Un sistema che non recita la parte di esperto ma che davvero lo diventa, fondando le sue decisioni su dati solidi, modelli causali, verifica continua. Una rivoluzione cognitiva più che tecnologica. L’illusione dell’AI onnipotente va smascherata per quello che è: un teatro di performance mascherato da progresso, una trappola per chi crede che il futuro sia solo questione di dimensioni e velocità.

Non servono modelli che “improvvisano” ma sistemi che si ancorano alla realtà, che apprendono davvero, che sanno ammettere i propri limiti e chiedere aiuto quando necessario. Perché, alla fine, la medicina è un’arte complessa, fatta di scienza ma anche di prudenza e responsabilità. Chi affida alla AI il compito di prendersi cura della vita umana deve pretendere molto di più di una voce persuasiva e ben strutturata: deve pretendere intelligenza vera, fondata su basi solide, non una recita ben costruita.

La sfida oggi è chiara: costruire un’AI cognitiva, non una semplice imitazione verbale. Solo così potremo sbloccare la vera intelligenza artificiale e liberare il potenziale della tecnologia senza mettere in pericolo ciò che più conta. Chi continua a chiamare progresso ciò che è solo performance teatrale dovrà presto fare i conti con la realtà, e quella medicina non può aspettare.