Per anni il mercato dell’intelligenza artificiale ha funzionato con una logica semplice: pochi fornitori chiusi, grandi modelli proprietari, API comode, pricing opaco e una promessa quasi religiosa di progresso infinito. Molte aziende hanno accettato il patto. Era rapido, elegante, apparentemente efficiente. Poi è arrivata la realtà operativa. La realtà ha sempre pessime maniere.
Sempre più team stanno maturando una diffidenza concreta verso i closed providers. Non per ideologia open source, che spesso è solo una posa estetica da conferenza tech, ma per motivi molto più banali e quindi più seri: controllo dei dati, prezzi imprevedibili, dipendenza strategica, policy cambiate unilateralmente durante la notte. Il capitalismo digitale ama chiamarlo “ecosistema”. I CFO lo chiamano rischio.
Quando un’impresa invia prompt sensibili, codice sorgente, documentazione interna, roadmap prodotto o dati clienti verso una black box statunitense, non sta semplicemente usando un servizio AI. Sta esternalizzando una parte della propria memoria operativa. È una differenza sostanziale. In un’epoca in cui il dato vale più del software, regalare contesto può costare più di una licenza.
Per questo gli open-weight models stanno guadagnando terreno. Consentono self-hosting, deployment su cloud europei, auditabilità dei pesi, chiarezza di licenza e soprattutto portabilità. Se domani un provider aumenta i prezzi del 400%, cambia termini d’uso o decide che il vostro settore è “risky”, con un modello aperto si migra. Con uno chiuso si prega.
Il tema europeo aggiunge una dimensione quasi geopolitica. GDPR, AI Act, data residency, documentazione, accountability. Tutte parole che in Silicon Valley vengono spesso pronunciate con lo stesso entusiasmo con cui si compila una dichiarazione dei redditi. Per startup e imprese UE, invece, sono vincoli reali. Non accessori legali.
Ecco perché cresce l’interesse per operatori come Regolo.ai, che offrono inferenza ospitata in Europa, zero data retention e sovranità del dato. Il concetto è semplice: usare modelli avanzati senza spedire informazioni sensibili fuori dal perimetro normativo europeo. Nulla di rivoluzionario, in teoria. In pratica, una rara forma di buon senso.
Il mercato sta entrando in una nuova fase. Non più “qual è il modello più brillante in benchmark da laboratorio?”, ma “quale stack posso usare senza compromettere margini, compliance e libertà di scelta?”. Finalmente una domanda adulta.
Tra i protagonisti di questa stagione emergono Alibaba con Qwen 3.5, Zhipu AI con GLM-5.1 e Google DeepMind con Gemma 4. Tre famiglie diverse, tre filosofie differenti, un messaggio comune: il vantaggio competitivo dei closed models non è più garantito.
Qwen 3.5 si distingue per ampiezza di gamma e pragmatismo industriale. Varianti piccole per edge deployment, modelli grandi per server inference, forte supporto multilingua, capacità vision-language unificate e contesti lunghi fino a circa 262K token in alcune versioni. È la classica strategia asiatica ben eseguita: coprire tutto il mercato, dal laptop allo scale-up cluster. Nessun romanticismo, molta esecuzione.
GLM-5.1 appare invece costruito per l’era degli agenti autonomi. Architettura MoE, focus su reasoning prolungato, coding, tool use iterativo e sessioni estese. Nei benchmark realmente interessanti, quelli che simulano lavoro e non quiz da università, mostra risultati molto competitivi. SWE-Bench Pro, Terminal-Bench, BrowseComp, CyberGym. Tradotto: meno showmanship, più capacità di fare cose utili.
Gemma 4, targata Google, rappresenta il paradosso più divertente del settore. Un colosso del closed computing che spinge modelli efficienti open-weight con licenza Apache 2.0. Quando perfino gli incumbent aprono parte dell’arsenale, significa che il mercato sta cambiando davvero. La versione 31B dense è particolarmente interessante per rapporto performance-parametro e deployment realistico.
Qui conviene essere brutali. Il parametro conta meno di quanto il marketing suggerisca. Un modello da 30 miliardi ben ottimizzato può generare più valore di un mostro da centinaia di miliardi ingestibile nei costi e nelle latenze. È la stessa ragione per cui molte aziende comprano utilitarie e non yacht.
GLM-5.1 sembra oggi il candidato naturale per agenti software complessi e workflow autonomi di lunga durata. Se si devono orchestrare tool multipli, navigare repository, eseguire terminal task, ragionare su centinaia di passaggi, la robustezza operativa conta più della brillantezza in demo. Il futuro degli agenti non sarà deciso da chi scrive il tweet migliore, ma da chi sbaglia meno alle tre del mattino.
Gemma-4-31B, al contrario, è eccellente dove servono velocità, tool calling pulito, deployment locale, costi sotto controllo e multimodalità efficiente. Molte aziende non hanno bisogno di un “oracolo digitale”; hanno bisogno di qualcosa che risponda bene, in fretta, senza incendiare il budget GPU.
Qwen 3.5 occupa il terreno centrale con notevole intelligenza strategica. Buon multilingua, ampiezza di taglie, contesto lungo, ecosistema in crescita. Per molte imprese internazionali è il compromesso pragmatico tra potenza, costo e flessibilità.
Il vero punto, tuttavia, non è quale modello vinca la settimana. Il vero punto è l’infrastruttura. Gestire GPU cluster internamente non è romantico come sembra nei thread su X. Richiede competenze rare, osservabilità, failover, scaling, security, procurement energetico, tuning continuo. In breve: richiede adulti.
Per questo il modello “managed open inference” sta diventando attraente. Provider europei che offrono API pronte su modelli open-weight, con SLA chiari, zero retention, data center UE e compliance by design. È la terra di mezzo tra self-hosting totale e dipendenza da hyperscaler extraeuropei. E spesso la terra di mezzo è dove si fanno i soldi.
Una startup italiana che integra AI nel customer service, ad esempio, può usare modelli aperti su infrastruttura europea, contenere costi, semplificare la documentazione GDPR e mantenere facoltà di migrazione futura. Questo dettaglio, apparentemente tecnico, è in realtà strategico. Lock-in evitato oggi significa potere negoziale domani.
Molti chiedono se questi modelli siano davvero competitivi rispetto ai closed leaders. La risposta onesta è: dipende dal task, ma sempre meno dalla narrativa dominante. Nel coding, nel reasoning tecnico, nella tool orchestration e in vari benchmark del 2026, gli open models sono spesso comparabili o superiori. Il vantaggio proprietario si sta assottigliando. Non sparisce, ma costa molto di più.
Sul fronte licenze, MIT e Apache 2.0 restano strumenti potenti perché riducono attrito legale e commerciale. La chiarezza giuridica conta enormemente quando si passa dal prototipo alla produzione. Nessun board serio approva un rollout enterprise basato su termini fumosi scritti come poesia tossica.
Resta poi il modello ibrido, probabilmente il più realistico. Open models per l’80% dei workload, closed APIs solo per casi specialistici ad alto valore aggiunto. Routing intelligente, governance interna, fallback selettivi. In altre parole: usare i provider chiusi come eccezione, non come religione.
Chi continua a pensare che il mercato AI sarà dominato per sempre da tre API californiane confonde il presente con il destino. È un errore classico. Successe nel cloud, nei database, nei sistemi operativi. Succederà anche qui. La tecnologia tende a chiudersi all’inizio per monetizzare, poi ad aprirsi quando la competizione la costringe.
Il motivo per cui le aziende vogliono “scappare” dai closed providers non è emotivo. È economico. È normativo. È strategico. È perfino culturale. Nessun CEO ama dipendere da un listino che non controlla, da policy che non negozia e da infrastrutture che non vede.
L’AI enterprise sta smettendo di essere magia e tornando a essere procurement. Ed è spesso in quel momento, poco glamour e altamente contabile, che si decide chi vincerà davvero.
Original Post:
https://regolo.ai/open-source-llms-and-local-decentralized-alternatives-in-2026/