La solita danza cinese dell’intelligenza artificiale: un passo avanti, due passi indietro, e tutti a chiedersi se il pubblico sia stato preso in giro o se semplicemente non riusciamo a leggere tra le righe. DeepSeek, la start-up di AI fondata dall’ex quant Liang Wenfeng, ha appena lanciato il suo V3.1 con un annuncio che più minimalista non si può: un messaggino su un gruppo WeChat. Nessun post su X, nessuna fanfara, zero storytelling. Per un’azienda che fino a sei mesi fa dominava l’open source cinese con oltre il 99 per cento delle installazioni su PPIO, è un dettaglio che puzza di resa o di strategia difensiva.
La novità più tecnica è l’espansione della context window a 128k, l’equivalente di un tomo da trecento pagine. Bello sulla carta, peccato che dietro si intraveda più fumo che arrosto. Perché mentre gli altri colossi, da Alibaba con la sua famiglia Qwen a MoonShot AI con Kimi-K2-Instruct, spingono sul multimodale e sul coding avanzato, DeepSeek rimane ostinatamente confinata al testo. Nel 2024, offrire solo un modello text-based è come presentarsi a un summit tecnologico con un fax: puoi avere anche il rullo più lungo del mondo, ma rimani fuori dal gioco.
La parte più intrigante, però, è la rimozione silenziosa delle referenze al modello R1 dalla funzione di deep thinking del chatbot. Niente più menzione, niente roadmap, nessuna traccia concreta del tanto atteso R2. I beninformati parlano di problemi seri con i chip Ascend di Huawei, che dovevano essere la spina dorsale della nuova generazione. La conseguenza è che DeepSeek si ritrova a metà strada: il V3.1, ibrido e poco convincente, e l’R2 che si fa attendere come un treno in perenne ritardo sulla ferrovia ad alta velocità cinese.
Alcuni test indipendenti su Hugging Face hanno premiato il V3.1 come il migliore modello cinese per coding, eppure il confronto con Claude Opus 4 è impietoso. Siamo al solito dualismo: primeggiare a livello locale per poi scoprire che fuori dai confini la partita è un’altra. E gli utenti, anche quelli patriottici, iniziano a storcere il naso. V3.1 non offre alcun salto in termini di ragionamento rispetto all’R1-0528. Anzi, sembra più un compromesso che un progresso e nei forum di Hugging Face c’è chi parla di peggioramento netto della qualità testuale.
Il punto è che DeepSeek sembra intrappolata in un cortocircuito strategico. Non ha la potenza finanziaria né l’infrastruttura cloud dei giganti come Alibaba o Baidu, ma nemmeno la capacità di differenziarsi radicalmente. Dopo il clamore iniziale, la curva di adozione sta calando: dall’egemonia assoluta su PPIO al calo all’80 per cento in giugno, fino al sorpasso di Qwen a maggio. Il che ci porta a una domanda quasi banale: DeepSeek è stata sopravvalutata oppure ha scelto deliberatamente di ridimensionarsi per sopravvivere?
La narrativa dell’underdog che rivoluziona l’AI open source è romantica, ma la realtà è che senza multimodalità e senza un salto di ragionamento vero, i modelli diventano commodity e in Cina, dove l’AI è ormai un campo di battaglia geopolitico e commerciale, essere una commodity significa sparire. Non è un caso che l’azienda non abbia nemmeno voglia di comunicare in pubblico. Un silenzio che sa di consapevolezza.
Se la tua USP è “abbiamo una finestra di contesto enorme”, il rischio è che gli utenti, dopo l’effetto wow iniziale, si accorgano che non basta. Perché alla fine conta la qualità della risposta, non la lunghezza della memoria. Lo capiscono bene Alibaba e MoonShot, che spingono modelli capaci di integrare testo, immagini, codice, e in prospettiva anche audio e video. DeepSeek, invece, sembra fissata a un passato recente, come se fosse rimasta ancorata all’idea che l’AI sia solo generazione testuale.
La verità è che la partita non si gioca più sul numero di token o sulla finestra di contesto, ma sulla capacità di fare reasoning avanzato, di sostenere task complessi e di offrire multimodalità fluida. Se DeepSeek non riesce a rimettere in carreggiata l’R2, il V3.1 rischia di passare alla storia come un aggiornamento cosmetico. Un po’ come quei software aziendali che sbandierano “nuova release” e poi hanno solo cambiato il colore del pulsante “salva”.
La provocazione è semplice: forse non ci prendono per i fondelli. Forse siamo noi che continuiamo a credere che ogni annuncio da Shenzhen o Hangzhou sia l’alba di una nuova rivoluzione. In realtà, come dimostra il caso DeepSeek, anche le start-up cinesi possono inciampare nella stessa trappola di ogni player occidentale: hype sproporzionato, problemi hardware, mancanza di direzione chiara. L’intelligenza artificiale non perdona, soprattutto se ti limiti a giocare con il contatore dei token.