Nel dibattito sull’intelligenza artificiale applicata alla sanità si è spesso giocato con metafore rassicuranti, quasi infantili, come se i modelli fossero stagisti brillanti ma ancora inesperti, strumenti di supporto più che attori decisionali. Poi arriva uno studio pubblicato su Science e la narrativa cambia improvvisamente tono, quasi senza chiedere autorizzazione al sistema sanitario o alle sue liturgie burocratiche. Quando un modello come o1 di OpenAI supera medici in carne e ossa in un contesto ad alta pressione come il pronto soccorso, il problema non è più tecnologico. È politico, economico e, soprattutto, culturale.
L’intelligenza artificiale ha raggiunto un’accuratezza diagnostica del 67% utilizzando le stesse informazioni iniziali disponibili ai medici, che si fermano tra il 50 e il 55%. In altre parole, con meno contesto e meno esperienza vissuta, il modello ha fatto meglio. Non di poco. Abbastanza da rendere irrilevante qualsiasi tentativo di minimizzare il risultato come una curiosità accademica.
Il contesto dello studio è altrettanto rilevante quanto i numeri. Settantasei pazienti reali, un pronto soccorso di Boston, cartelle cliniche elettroniche standard, parametri vitali, dati demografici e poche informazioni di triage. Nessuna magia, nessun accesso privilegiato a dati nascosti. Solo ciò che un medico vede nei primi minuti, quando il tempo è scarso e l’errore è costoso. È proprio in questo spazio, dove la medicina è meno romantica e più probabilistica, che il modello dimostra il suo valore.
Il dettaglio che molti preferiranno ignorare è che, quando le informazioni aumentano, la differenza si riduce ma non scompare. L’o1 raggiunge l’82% nei casi più complessi con dati aggiuntivi, mentre i medici oscillano tra il 70 e il 79%. Qui la significatività statistica si fa più sfumata, ma il messaggio resta. L’intelligenza artificiale non è solo un buon primo filtro; è competitiva anche nelle fasi successive del ragionamento clinico.
Questa dinamica ricorda in modo inquietante ciò che è accaduto in altri settori ad alta competenza. Nel trading algoritmico, per esempio, gli esseri umani non sono stati sostituiti da un giorno all’altro. Sono stati prima affiancati, poi marginalizzati, infine relegati a ruoli di supervisione. La medicina, che ama pensarsi immune a queste logiche, sembra avviarsi lungo lo stesso percorso, con una differenza sostanziale: qui la posta in gioco non è il capitale finanziario, ma quello biologico.
Il secondo esperimento dello studio spinge ancora più avanti la riflessione. Quarantasei medici confrontati con il modello su cinque casi clinici complessi, inclusi piani terapeutici a lungo termine e decisioni di fine vita. L’intelligenza artificiale ha ottenuto risultati migliori del gruppo di controllo. Non si tratta più di diagnosi rapide, ma di scelte che implicano etica, esperienza e capacità di bilanciare variabili incerte. Il fatto che un modello addestrato su dati possa competere in questo ambito è, francamente, destabilizzante.
Gli autori dello studio parlano apertamente di “superamento della maggior parte dei parametri di riferimento del ragionamento clinico”. I revisori indipendenti utilizzano un linguaggio ancora più diretto: “un vero e proprio passo avanti”. Tradotto in termini meno accademici, significa che siamo entrati in una fase in cui ignorare questi sistemi non è più una posizione difendibile, nemmeno per inerzia istituzionale.
La questione centrale, tuttavia, non è se l’intelligenza artificiale funzioni. Funziona. Il problema è chi si assume la responsabilità quando funziona meglio degli esseri umani. La medicina moderna è costruita su un equilibrio fragile tra competenza individuale e responsabilità legale. Inserire un modello che prende decisioni migliori ma non può essere citato in giudizio introduce una tensione sistemica che nessun regolatore ha ancora risolto in modo convincente.
Si potrebbe sostenere che il modello non “decide”, ma “suggerisce”. È una distinzione semantica che rassicura più i giuristi che i pazienti. Se un medico ignora un suggerimento corretto dell’AI e commette un errore, la responsabilità è sua. Se segue un suggerimento errato, la responsabilità resta sua. In entrambi i casi, il modello è una presenza invisibile ma determinante, un consigliere che non paga mai il conto.
Nel frattempo, i sistemi ospedalieri si trovano di fronte a una scelta che non è realmente una scelta. Sperimentare o meno questi modelli non è più il punto. La pressione competitiva, economica e reputazionale renderà inevitabile la loro adozione. Un ospedale che dimostra tassi diagnostici migliori grazie all’AI diventa immediatamente più attrattivo per pazienti, assicurazioni e investitori. La medicina, che si presenta come un servizio pubblico, è in realtà anche un mercato.
La formazione del personale rappresenta un altro nodo critico. Non si tratta solo di insegnare ai medici a usare un nuovo strumento, ma di ridefinire il loro ruolo. Interpretare le raccomandazioni di un modello richiede competenze diverse rispetto alla diagnosi tradizionale. Significa comprendere probabilità, bias dei dati, limiti del sistema. In breve, significa trasformare il medico in un gestore di incertezza algoritmica.
Più l’intelligenza artificiale diventa competente, più aumenta il valore della competenza umana nel comprenderla. Non è la fine del medico, ma la fine di un certo tipo di medico. Quello che si affida esclusivamente all’intuizione, all’esperienza personale e a una memoria biologica inevitabilmente limitata, rischia di diventare obsoleto. Quello che sa collaborare con sistemi complessi, invece, acquista un vantaggio competitivo.
La Silicon Valley, naturalmente, celebra questi risultati con il consueto entusiasmo messianico. Ogni progresso viene presentato come inevitabile e intrinsecamente positivo, una narrativa che ignora deliberatamente le frizioni reali dell’implementazione. La storia recente della tecnologia è piena di soluzioni brillanti che si sono scontrate con sistemi sociali e istituzionali meno flessibili del previsto. La sanità non farà eccezione.
Per anni si è discusso se i modelli linguistici possano davvero ragionare o se si limitino a simulare il ragionamento. Nel contesto di un pronto soccorso, la distinzione diventa sorprendentemente irrilevante. Se il risultato è corretto più spesso, il dibattito filosofico perde gran parte del suo fascino. La medicina, dopotutto, è una disciplina pragmatica.
Il vero rischio, come spesso accade, non è tecnologico ma organizzativo. Implementare un sistema di questo tipo richiede integrazione con infrastrutture esistenti, gestione dei dati, aggiornamenti continui e, soprattutto, governance. Senza una strategia chiara, l’intelligenza artificiale rischia di diventare un altro layer di complessità, invece che una soluzione. Le aziende tecnologiche vendono modelli; gli ospedali devono costruire sistemi.
Dal punto di vista economico, il tema è ancora più interessante. Se un modello può migliorare l’accuratezza diagnostica, ridurre errori e ottimizzare risorse, il ritorno sull’investimento è potenzialmente enorme. Tuttavia, i costi di implementazione, formazione e manutenzione non sono trascurabili. La promessa di efficienza deve essere bilanciata con una realtà operativa che spesso è meno elegante delle slide di presentazione.
L’intelligenza artificiale non sostituirà i medici nel breve termine, ma cambierà radicalmente il modo in cui lavorano. Chi saprà adattarsi prospererà. Chi resisterà per principio rischia di trovarsi dalla parte sbagliata della storia. Non è una questione di ideologia, ma di performance.
Il sistema sanitario globale si trova quindi a un bivio che non può essere ignorato. Continuare a operare come se nulla fosse cambiato significa accettare un livello di inefficienza che diventa sempre meno giustificabile. Abbracciare l’intelligenza artificiale, invece, implica affrontare una serie di questioni complesse che vanno ben oltre la tecnologia. Responsabilità, etica, formazione, governance. Parole che suonano familiari, ma che assumono un significato nuovo quando le decisioni sono condivise con una macchina.
L’intelligenza artificiale non sta entrando nella medicina. È già dentro. Il dibattito su se e quando adottarla è già superato dai fatti. Resta solo da capire come farlo senza perdere il controllo di un sistema che, nonostante tutte le sue inefficienze, ha ancora un elemento che nessun algoritmo può replicare completamente: la responsabilità umana.
https://www.science.org/doi/10.1126/science.adz4433
https://www.theguardian.com/technology/2026/apr/30/ai-outperforms-doctors-in-harvard-trial-of-emergency-triage-diagnoses