C’è un rumore nuovo nei corridoi digitali di Bruxelles, e per una volta non è il suono metallico di una nuova regolamentazione in arrivo. Si chiama TildeOpen LLM, ed è il secondo grande modello linguistico open source sviluppato in Europa, un colosso da 30 miliardi di parametri addestrato sul supercomputer EuroHPC LUMI grazie a 2 milioni di ore GPU generosamente finanziate dalla “AI Grand Challenge”. Niente Silicon Valley, niente cloud americano, niente GPU disperse in data center con indirizzi esotici. Tutto europeo, tutto dichiaratamente conforme all’AI Act, tutto, in teoria, trasparente. Il che, in Europa, vale più di qualsiasi record di performance.
Il comunicato ufficiale parla chiaro. State-of-the-art performance in tutte e ventiquattro le lingue ufficiali dell’Unione Europea, più ucraino, norvegese e alcune varianti balcaniche. Ottimizzazione estrema, footprint ridotto, rapidità ed efficienza migliori dei modelli globali. Tutti gli ingredienti per la narrativa perfetta: David europeo contro Golia statunitense. L’unica differenza è che qui il David è finanziato da fondi pubblici e supervisionato da Bruxelles, il che rende la metafora meno eroica e più burocraticamente interessante.
Chi lavora da anni nel settore sa che la storia non è mai così lineare. Ogni grande annuncio europeo in campo tecnologico ha un’anima ambigua: la retorica dell’innovazione si mescola alla prudenza, la visione futuristica all’ansia regolatoria. L’AI Act è il grande esempio di questo bipolarismo. Mentre gli Stati Uniti corrono a colpi di API e miliardi di capitali privati, l’Europa si ferma a compilare moduli di conformità, a disegnare check-list di rischio, a misurare i bias con la lente di un audit indipendente. Una scelta ideologica più che tecnica, che riflette un continente innamorato della regolazione e diffidente della velocità.
Eppure, TildeOpen è un segnale forte. Non tanto per il modello in sé, quanto per ciò che rappresenta. È la dichiarazione implicita che l’Europa vuole giocare la propria partita con le proprie regole, e soprattutto con le proprie lingue. Il multilinguismo, per un Large Language Model, non è un vezzo estetico. È una forma di identità culturale codificata in parametri numerici. L’inglese domina l’addestramento dei modelli globali, e con esso domina anche la visione del mondo incorporata nei sistemi di intelligenza artificiale. Creare un modello che “pensa” in lituano o in sloveno significa, in qualche modo, decostruire la supremazia culturale dei modelli made in California.
Tilde, l’azienda lettone dietro il progetto, non è nuova a questo tipo di battaglie. Da anni sviluppa strumenti di traduzione automatica e NLP per istituzioni europee, ed è tra i pochi player continentali con un’infrastruttura di ricerca competitiva nel linguaggio naturale. Ma 30 miliardi di parametri non sono uno scherzo. È una scala che richiede architetture sofisticate, ottimizzazione distribuita, dataset curati e soprattutto coerenza ingegneristica. In questo, la collaborazione con il supercomputer LUMI è fondamentale: un’infrastruttura HPC tra le più potenti al mondo, finanziata e gestita in chiave pan-europea. Non solo un acceleratore di calcolo, ma un simbolo politico di autonomia digitale.
Il punto, però, non è solo tecnico. È economico, culturale e geopolitico. Dopo la doccia fredda del Draghi Report — che ha descritto l’Europa come lenta, frammentata e tecnologicamente inefficiente — Bruxelles aveva bisogno di un segnale di riscatto. E non poteva venire da una legge o da un dibattito, ma da un prodotto. Un Large Language Model europeo, open source, conforme all’AI Act e addestrato con fondi comunitari è la migliore risposta possibile. È un atto di orgoglio travestito da annuncio scientifico. È anche, volendo essere cinici, una perfetta operazione di branding istituzionale.
La domanda che molti si pongono è se la parola “compliance” possa davvero convivere con la parola “innovazione”. Perché l’AI Act, nella sua forma attuale, è un capolavoro di ambizione regolatoria, ma un labirinto operativo. Definisce criteri di trasparenza, tracciabilità, auditabilità, robustezza, mitigazione dei bias e gestione dei rischi che nemmeno i colossi americani riescono a rispettare integralmente. Eppure, TildeOpen afferma di essere “fully compliant”. Forse lo è nel senso più politico del termine, quello che indica allineamento con la filosofia europea più che con la checklist legale. Il che non è necessariamente un difetto, ma è bene non confondere le due dimensioni.
In parallelo, la Svizzera ha già mostrato con Apertus che la trasparenza radicale è possibile. Il modello open-source sviluppato da ETH Zurigo, EPFL e CSCS ha pubblicato tutto: pesi, dati, ricette, pipeline. Due versioni, da 8 e 70 miliardi di parametri, con oltre il 40 per cento dei dati in lingue non inglesi. È la prima volta che un modello di questa scala viene rilasciato in Europa con un’apertura così estrema. In confronto, TildeOpen appare più istituzionale, più “da Bruxelles”. Dove Apertus celebra la libertà accademica, TildeOpen incarna la sovranità digitale. Sono due anime della stessa Europa che finalmente si muovono in direzioni convergenti.
Il vero problema è che mentre l’Europa celebra i propri modelli, il resto del mondo continua a iterare alla velocità di un rilascio settimanale. OpenAI, Anthropic e Google hanno ormai imposto standard di efficienza e adattabilità che rendono difficile, se non impossibile, colmare il gap in termini di scala e adozione industriale. L’Europa gioca su un altro terreno: fiducia, sicurezza, legalità, trasparenza. Ma nel mercato globale, questi valori non sempre si traducono in vantaggio competitivo. Le imprese scelgono ciò che funziona, non ciò che è conforme.
Ciò non toglie che TildeOpen rappresenti un passo importante verso un’architettura di fiducia europea. Se il codice rimarrà open, se i pesi saranno pubblici e se gli audit indipendenti confermeranno le prestazioni dichiarate, l’impatto potrà essere significativo. La disponibilità di un modello multilingue europeo può sbloccare un ecosistema di applicazioni locali: dalla PA digitale ai media regionali, fino ai servizi linguistici specializzati. Non è poco, in un continente dove il 70 per cento delle PMI dichiara di non avere accesso a modelli linguistici in lingua madre.
Ciò che colpisce è la narrativa di autosufficienza. “Trained and hosted within the EU”. È un claim che pesa come una bandiera. In un’epoca in cui la sovranità dei dati è diventata un argomento geopolitico, l’idea di un modello completamente europeo ha un valore simbolico altissimo. Il problema è che l’autonomia tecnologica non si misura solo dalla posizione dei server, ma dalla capacità di innovare in modo sostenibile e competitivo. Se TildeOpen sarà un progetto vivo, alimentato da contributi open e supportato da istituzioni e industria, potrà diventare un punto di riferimento. Se invece rimarrà un esperimento dimostrativo, finirà archiviato accanto a tante altre promesse europee di “rinascita digitale”.
Per ora, la curiosità domina lo scetticismo. Gli esperti vogliono vedere benchmark indipendenti, analisi sui bias linguistici, verifiche di robustezza e prove di scalabilità. Vogliono capire se il modello è in grado di sostenere una conversazione fluida in maltese o in croato, se riconosce le sfumature culturali nei contesti di training, se mantiene la precisione semantica tipica delle lingue a morfologia complessa. È qui che si gioca la vera partita. Perché costruire un Large Language Model che parla ventiquattro lingue è un’impresa ingegneristica; farlo parlare bene, con coerenza culturale e rispetto del contesto, è un atto di sofisticazione cognitiva.
Nel frattempo, l’Europa osserva se stessa. Dopo anni di autocritica e lentezze, qualcosa si muove davvero. TildeOpen e Apertus non sono miracoli tecnologici, ma segnali concreti che l’innovazione può nascere anche dentro le regole, non solo ai margini. Forse l’Europa non sta rincorrendo, ma sta riscrivendo le regole del gioco. Una rivoluzione silenziosa, più burocratica che spettacolare, ma che potrebbe, nel lungo periodo, rivelarsi la strategia più resiliente. Perché chi controlla le regole, alla fine, controlla anche il mercato.
- Tilde – annuncio sul sito ufficiale “Tilde releases TildeOpen LLM” Tilde
Apertus
- “Apertus: Democratizing Open and Compliant LLMs for Global Language Environments” — paper tecnico recente su arXiv che descrive il modello Apertus, gli obiettivi di compliance, dati e struttura arXiv