Ci sono momenti nella storia dell’informatica in cui le metafore saltano. Il desktop non è più un “desktop”, e nemmeno una scrivania virtuale. Con l’arrivo di Copilot Vision, Microsoft ha spalancato la finestra: adesso il tuo sistema operativo ha degli occhi. E li presta volentieri al suo assistente AI, che guarda, interpreta e reagisce in tempo reale a ciò che stai facendo. Sì, proprio come il collega ficcanaso in ufficio. Ma con meno giudizi morali e molta più RAM.

La parola chiave qui è visione. Copilot Vision non si accontenta di “capire” le tue parole. Vuole anche vedere il contesto in cui le stai digitando. Una vera e propria evoluzione cognitiva dell’assistente digitale, che ora può analizzare direttamente quello che appare sul tuo schermo — da una foto di famiglia a un layout di InDesign — per suggerire, spiegare, correggere, anticipare. Il tutto senza necessità di sottoscrivere Copilot Pro, perché sì, è gratuito. Almeno per ora, almeno negli Stati Uniti. La gentilezza dei colossi dura poco, come gli ombrelloni gratis a luglio.

La novità sembra innocua, persino utile: un’icona a forma di occhiali compare accanto al tuo Copilot in Windows 10 e 11. Cliccaci sopra, scegli una finestra o un’app da condividere, e lui — pardon, esso — inizia a vedere ciò che tu vedi. Niente attivazione subdola alla Recall (quel progetto di registrazione costante dello schermo che ha scatenato più panico della funzionalità stessa), qui tutto è dichiarato: sei tu che scegli cosa mostrare. Ma non per questo l’esperienza è meno invasiva. Anzi.

Copilot Vision è parte di Copilot Labs, l’incubatore sperimentale dell’AI Microsoft dove il confine tra supporto e sorveglianza è sempre più sfumato. Durante la dimostrazione al 50esimo anniversario di Redmond, il software ha mostrato un comportamento da assistente visivo che ti guida tra le funzionalità di Photoshop come se fosse un ex-designer frustrato con l’accesso ai manuali di Adobe e un eccesso di caffeina. Evidenzia elementi, suggerisce strumenti, risponde a domande tipo: “Come si crea un effetto lucido?” oppure “Perché il mio layer sembra sparito?” Una guida interattiva, certo, ma che guarda le stesse cose che guardi tu. Sempre.

E no, non si limita a Windows: anche su iOS e Android potrai condividere schermate, foto e pagine web, con Copilot pronto a interpretarle come un oracolo digitale in versione UX consultant. La differenza è che qui non si tratta solo di testo o comando vocale. Qui l’AI si comporta come un secondo utente silenzioso, che osserva, analizza e interviene. Il confine tra personal assistant e cognitive companion non è più solo labile: è stato completamente cancellato con un clic su una lente.

Chiariamo: non è la prima volta che un’AI “vede”. Ma è la prima volta che questo tipo di visione contestuale viene inserita direttamente in un sistema operativo destinato a centinaia di milioni di utenti, in modo così integrato. E con la solita retorica Microsoft del “ti aiutiamo ad aiutarti”, che maschera una dinamica ben più complessa: ogni passaggio che deleghiamo a un assistente, ogni parte di schermo che condividiamo, è una tessera in più nella mappa mentale che l’AI costruisce su di noi.

La promessa è affascinante. Lavorare più velocemente, con meno frustrazione. Non dover più googlare “come rimuovere sfondo in Photoshop” o “dove trovo l’opzione per il ridimensionamento intelligente in Word”. Tutto vero. Ma ogni salto di convenienza ha un costo di consapevolezza. E Copilot Vision, nel suo silenzioso lavoro di visual parsing, raccoglie dati che sono implicitamente sensibili: screenshot parziali, pattern di interazione, applicazioni usate, abitudini visuali. Non basta dire “è opt-in” per garantire trasparenza. Perché la vera partita non si gioca solo sul consenso, ma sulla comprensione.

Se Copilot può “vedere ciò che vedi”, allora può anche “interpretare ciò che non dici”. Il comportamento implicito diventa un nuovo dataset, e il rischio — che è reale, non paranoico — è che questa visione si trasformi in una sorveglianza invisibile, anche se venduta come coaching amichevole. Il sottotesto è sempre lo stesso: noi ti aiutiamo, tu ci dai accesso.

Microsoft sta raffinando la propria strategia AI attraverso una logica di embedding, non più di “assistente che attivi”, ma di compagno pervasivo che vive nel tuo flusso operativo. Copilot Vision è la naturale estensione di questa filosofia. Un’AI che non aspetta il comando, ma che agisce in base a ciò che capisce del tuo contesto visivo. Una rivoluzione funzionale, ma anche culturale: lo schermo non è più solo tuo. È condiviso, visto, interpretato. Ed eventualmente archiviato — anche se per ora, dicono, no.

La battuta che circola tra i più cinici è che l’unica cosa che Copilot ancora non fa è bloccarti lo schermo quando ti distrai. Ma tranquilli, ci stanno già lavorando.

Nel frattempo, abituatevi a guardare il vostro desktop con occhi diversi. Non siete più soli. La vostra AI vi osserva. Ma, giurano, per il vostro bene.