Il mito fondativo dell’intelligenza artificiale contemporanea è stato venduto con una semplicità quasi infantile: più dati, più modelli, più intelligenza. Una narrazione lineare, rassicurante, quasi newtoniana nella sua prevedibilità. Poi arriva il conto e il conto, come spesso accade nella tecnologia, non è cognitivo ma fisico, non è algoritmico ma energetico, non è teorico ma brutalmente economico. La vicenda recente di Anthropic e del suo Claude Opus 4.7 non è un’anomalia, è una finestra aperta su una verità che molti nel settore conoscono ma pochi dichiarano apertamente: l’AI non è limitata dall’intelligenza, è limitata dal compute, il compute, a differenza del marketing, non scala con le slide.

Il paradosso è affascinante. Anthropic costruisce uno dei modelli più desiderati sul mercato, diventa improvvisamente il rifugio etico per una parte significativa dell’utenza professionale americana, e nel giro di poche settimane si trova intrappolata nel successo. Una crescita da 9 a 30 miliardi di ARR in un trimestre non è un trionfo lineare, è una distorsione strutturale. Ogni nuovo utente non è solo un cliente, è una richiesta computazionale. Ogni prompt è una micro-fattura energetica. Ogni sessione è una tensione sulla supply chain invisibile dei data center.

Il punto che molti sottovalutano è che l’inferenza non è elegante, non beneficia delle ottimizzazioni intellettuali che rendono sexy il training, non ha nulla di teoricamente affascinante è una macchina industriale, ripetitiva, costosa, lineare nella sua brutalità, più utenti arrivano, più il sistema si piega, non importa quanto il modello sia brillante; importa quante GPU o TPU stanno girando sotto il cofano, e soprattutto quanta energia si è disposti a bruciare per sostenere quella brillantezza.

La risposta di Anthropic, letta con occhio cinico, è un manuale di sopravvivenza economica travestito da evoluzione di prodotto, “Adaptive thinking” suona come una feature intelligente, quasi un passo verso l’autonomia cognitiva del modello. In realtà è una leva di controllo dei costi. Il modello decide quando pensare, quanto pensare e, soprattutto, quando non farlo. Il cliente perde visibilità, l’azienda guadagna margine. Una mossa elegante, ma non neutrale. Il potere si sposta silenziosamente dal developer al provider.

Il dettaglio più interessante è la riduzione della verbosità Claude diventa più diretto, meno espansivo, meno “empatico”. Tradotto dal linguaggio marketing: meno token, meno costo. La retorica dell’efficienza maschera una realtà più semplice: parlare meno costa meno. In un’epoca in cui abbiamo celebrato modelli sempre più loquaci, scopriamo improvvisamente che il silenzio è una strategia finanziaria.

Il vero nodo, tuttavia, non è software ma hardware. Jensen Huang, con la sincerità accidentale che ogni tanto sfugge anche ai migliori CEO, ha detto la cosa più importante senza forse rendersene conto: il mercato non-Nvidia esiste grazie ad Anthropic. Una frase che, letta tra le righe, significa che Anthropic non ha scelto l’eterogeneità per visione, ma per necessità. Quando non puoi permetterti di dipendere da un solo fornitore, costruisci un’architettura distribuita. Non è innovazione, è sopravvivenza.

Tre stack hardware per lo stesso modello non sono un capriccio ingegneristico, sono una dichiarazione implicita di fragilità. Significa che nessuna singola infrastruttura è sufficiente. Significa che il sistema è ottimizzato per la resilienza, non per la scala. E nel mondo dell’AI, resilienza senza scala è una vittoria tattica ma una sconfitta strategica.

Il confronto con OpenAI, inevitabile, è quasi crudele. Da una parte un’azienda con circa 70 miliardi di capacità computazionale operativa, dall’altra un ecosistema che supera i 250 miliardi già attivi e punta a oltre 700 miliardi annunciati. Non è una differenza incrementale, è un ordine di grandezza. È la differenza tra gestire la domanda e dominarla.

Si potrebbe obiettare che Anthropic è più efficiente. E in effetti lo è. Genera più ricavi per unità di compute rispetto ai concorrenti. Ma l’efficienza, in questo contesto, è una trappola sofisticata. Significa che ogni unità di capacità è sfruttata al massimo, che non esiste buffer, che ogni picco di domanda diventa un problema operativo. L’efficienza estrema elimina lo spreco, ma elimina anche la flessibilità. È il classico errore di ottimizzazione locale che ignora la complessità globale.

La questione dei prezzi aggiunge un ulteriore livello di ironia. I modelli in abbonamento, apparentemente semplici e prevedibili, nascondono una dinamica perversa. Gli utenti più intensivi, quelli che creano valore e dipendenza, sono anche quelli che costano di più. In altre parole, i migliori clienti sono i meno profittevoli. Un problema che ricorda da vicino le prime fasi del cloud computing, quando AWS e Azure imparavano a proprie spese che non tutti i workload sono uguali.

La restrizione delle sessioni, i limiti settimanali, la riduzione della qualità percepita non sono incidenti. Sono strumenti di gestione della domanda. Sono il ritorno, quasi nostalgico, a un’era in cui la tecnologia veniva razionata. Un concetto che sembrava superato nell’abbondanza digitale e che invece torna prepotentemente quando l’abbondanza si rivela un’illusione contabile.

Sul fondo rimane una domanda più ampia, quasi filosofica: che tipo di prodotto è l’AI? Per anni abbiamo venduto l’idea che il miglior modello avrebbe vinto. Che l’allineamento, la sicurezza, la qualità sarebbero stati i fattori decisivi. Tutto vero, ma incompleto. Perché il miglior modello che non può essere servito su larga scala è, in termini economici, irrilevante. La qualità senza distribuzione è un esercizio accademico.

Il caso Mythos è emblematico. Più potente, più avanzato, più costoso. E quindi limitato. Non per motivi etici o di sicurezza, almeno non esclusivamente, ma per una ragione molto più banale: non ci sono abbastanza chip per farlo girare su larga scala. È la versione contemporanea del problema industriale classico: avere il prodotto giusto nel momento sbagliato.

La traiettoria del settore, come suggerito da Amodei, punta a una crescita esponenziale del compute globale. Da poche decine di gigawatt a centinaia in pochi anni. Numeri che ricordano più l’industria energetica che quella software. Non è una coincidenza. L’AI sta diventando un business infrastrutturale, non più puramente digitale. Chi controlla l’energia, controlla l’intelligenza.

La narrativa della Silicon Valley, come sempre, si adatterà. Parleremo di efficienza, di modelli più intelligenti, di architetture rivoluzionarie. Ma sotto la superficie resterà una verità semplice e scomoda: l’AI è una funzione del capitale. Non del capitale umano, non del capitale intellettuale, ma del capitale fisico. Data center, chip, energia. Il resto è storytelling.

In questo contesto, Anthropic rappresenta un caso di studio affascinante. Un’azienda che ha vinto la battaglia dell’immagine, che ha conquistato la fiducia di un segmento critico di mercato, ma che si trova a fare i conti con i limiti strutturali della propria infrastruttura. Una lezione che molti nel settore dovrebbero osservare con attenzione. Perché la prossima crisi non sarà sull’intelligenza dei modelli, ma sulla loro disponibilità.

La vera rivoluzione dell’AI, quindi, non è nei modelli che pensano meglio, ma nei sistemi che riescono a farli pensare abbastanza, abbastanza spesso e per abbastanza persone. Tutto il resto è rumore di fondo. E come ogni CEO con qualche decennio di cicatrici sa bene, il rumore è ciò che precede sempre il momento in cui arrivano i numeri reali.