
Baidu è tornata. Non con un tweet roboante, non con una demo teatrale in stile Silicon Valley, ma con una dichiarazione asciutta su X che ha il sapore della rivincita tecnica più che della vittoria mediatica. ERNIE 5.0 è ufficialmente uscito dalla fase di preview e il messaggio implicito è chiaro. Il gruppo che molti analisti occidentali avevano già archiviato come un ex gigante incapace di reggere la nuova corsa ai large language model è ancora seduto al tavolo, con una strategia che segue una logica cinese molto precisa. Efficienza prima della potenza bruta. Architettura prima del marketing. Infrastruttura prima dell’ego.
ERNIE 5.0 non è un modello che impressiona per un singolo numero da slide per investitori. È un modello che va letto come manifesto industriale. Circa due trilioni di parametri in una architettura Mixture of Experts, ma con solo il tre per cento degli esperti attivati a ogni inferenza. Chi lavora davvero con i modelli sa cosa significa. Meno calcolo per query, meno costi marginali, più complessità ingegneristica, più debito tecnico a monte, ma anche una strada più sostenibile nel lungo periodo. È l’opposto della filosofia muscolare che ha dominato la prima fase della corsa ai foundation model in Occidente, dove ogni release sembrava una gara a chi aveva più GPU e più miliardi da bruciare.
Il dato interessante non è solo la dimensione o la sparsità. È la scelta di addestrare ERNIE 5.0 nativamente come modello omni-modale. Testo, immagini, audio e video non come moduli aggiunti in un secondo momento, ma come parti integrate fin dall’inizio. Questa differenza, che a molti utenti finali sembra una sottigliezza accademica, è in realtà un cambio di paradigma architetturale. Significa che la rappresentazione latente del mondo non nasce testuale per poi essere adattata. Nasce già ibrida, con tutte le implicazioni del caso su ragionamento, allineamento cross-modale e capacità di generalizzazione. Non è un caso che Baidu insista sul termine omni-modal. È una parola che suona come branding, ma nasconde una scelta tecnica profonda.
Sul piano delle performance, Baidu rivendica risultati competitivi nella scrittura creativa, nel seguire istruzioni e nel coding. ERNIE 5.0 si posiziona nella top 10 in diverse categorie occupazionali, dalla scienza al business e finanza fino alla sanità. Qui è necessario un minimo di scetticismo da veterani del settore. I benchmark sono strumenti politici prima che scientifici. Tuttavia il rimbalzo è reale. A novembre la preview di ERNIE 5.0 era scivolata al ventiquattresimo posto su LMArena, un dato che aveva alimentato la narrativa del declino. Oggi il modello è tornato nella conversazione che conta, anche se più per recupero che per sorpasso.
Il contesto rende questo ritorno ancora più interessante. Il mercato domestico cinese dell’intelligenza artificiale è diventato una giungla ipercompetitiva. ByteDance con Doubao ha superato i cento milioni di utenti attivi mensili. DeepSeek ha innescato una guerra dei prezzi con modelli estremamente efficienti che hanno costretto Baidu a una scelta dolorosa ma razionale. Abbandonare completamente il modello di abbonamento a pagamento per il consumer. Un segnale che molti in Occidente avrebbero letto come resa. In realtà è stata una riallocazione strategica delle risorse.
Mentre il fronte consumer diventava una battaglia di margini sempre più sottili e di attenzione sempre più volatile, Baidu ha rafforzato la sua posizione nel B2B. ERNIE oggi alimenta i centri di comando delle smart city in tutta la Cina, serve tutte le banche cinesi considerate sistemicamente rilevanti e gestisce circa sedici miliardi e mezzo di chiamate API al giorno. Questo numero da solo racconta più di qualsiasi demo. Significa carichi reali, SLA stringenti, integrazioni profonde con sistemi legacy e una pressione operativa che nessun benchmark pubblico può simulare. È questo flusso di cassa enterprise che ha finanziato lo sviluppo continuo del modello mentre altri si inseguivano sui social.
C’è poi un aspetto spesso sottovalutato dagli analisti tecnici puri. L’interfaccia. Il chatbot ERNIE non è solo un endpoint di un LLM, ma un prodotto pensato per ridurre la frizione cognitiva dell’utente. Scrittura, lettura, editing di immagini e uso generale sono separati in sezioni dedicate. Sotto il cofano è sempre lo stesso modello, ma con prompt di sistema e regolazioni differenti. È una scelta apparentemente banale che in realtà dice molto sulla maturità del team di prodotto. Non costringere l’utente a diventare prompt engineer per ottenere valore. In un mercato dove molti confondono flessibilità con complessità, è una posizione quasi controculturale.
Curioso, e per certi versi controintuitivo, il fatto che l’ultima versione di ERNIE 5.0 non abbia la ricerca web attiva. È un modello offline, puro. Chi vuole informazioni aggiornate deve tornare a ERNIE 4.5. Questa scelta ha fatto storcere il naso a diversi utenti, ma è coerente con una filosofia di controllo e affidabilità. Separare il ragionamento dalla retrieval esterna riduce superfici di rischio, costi e dipendenze. È una scelta che parla più agli ingegneri che ai marketer.
Le reazioni della comunità sono state miste. C’è chi applaude il ritorno tecnico di Baidu e chi aspetta benchmark più dettagliati, promessi ma non ancora pubblicati in forma completa. Vale la pena ricordare un dettaglio che spesso viene omesso nei titoli. Anche ammesso che ERNIE 5.0 eguagli GPT-5 e Gemini 2.5 su specifiche metriche, molti laboratori occidentali stanno già lavorando su GPT-5.2 o Gemini 3. Il che rende questo rilascio più un allineamento che una rottura dello status quo. Ma nel mondo reale dell’AI industriale, il catch-up tempestivo è spesso più importante del salto in avanti.
C’è una citazione attribuita a Deng Xiaoping che torna spesso quando si parla di strategia tecnologica cinese. Non importa se il gatto è bianco o nero, l’importante è che prenda i topi. ERNIE 5.0 sembra incarnare perfettamente questa filosofia. Non è il modello più rumoroso. Non è quello che promette l’AGI su un palco. È un sistema progettato per funzionare, scalare e generare valore in contesti complessi e regolamentati. In un’epoca in cui molti confondono l’intelligenza artificiale con una demo virale, questa sobrietà è quasi sovversiva.
Chi vuole provarlo può farlo gratuitamente su ernie.baidu.com. Il vero test però non è l’esperienza del singolo utente curioso. È capire se questa combinazione di architettura sparsa, approccio omni-modale e dominio enterprise riuscirà a sostenere Baidu nel prossimo ciclo competitivo. Perché la prossima fase dell’AI non sarà vinta da chi urla più forte, ma da chi riesce a far funzionare modelli complessi sotto carichi reali, con costi sostenibili e responsabilità operative. Su questo terreno, Baidu non è affatto fuori gioco. Anzi, sembra aver appena rimesso gli scarponi da lavoro.