L’incipit è di quelli che ti fanno dire «wow», soprattutto se sei abituato alle comparsate pompose dei giganti LLM che dominano pagine e conferenze. Microsoft ha introdotto Mu, un piccolo modello di linguaggio o SLM, small language model integrato direttamente in Windows Settings, capace di girare on‑device senza appoggiarsi al cloud. Il risultato? Impostazioni intelligenti, istantanee, che non aspettano la latenza della rete.

Ci sono un paio di cose che vanno chiarite. Primo: la definizione «piccolo» non significa «bugiardo» o «incapace». Mu è un erede nobile della famiglia Phi di Microsoft, di cui fanno parte Phi‑2, Phi‑3‑mini (3,8 mld parametri) fino al notevole Phi‑4, con i suoi 14 miliardi. Stiamo parlando di modelli tagliati su misura per compiti specifici, con dati selezionati di alta qualità e compressi tramite pruning, quantizzazione e distillazione per restare snelli ma reattivi . L’altro chiarimento: non si è semplicemente «mosso il cervello» già nel cloud per farlo girare su PC. No, Mu è progettato per funzionare localmente, riducendo latenza, costi, e – ciliegina sulla torta – proteggendo meglio la privacy degli utenti .