Il futuro dell’assistenza digitale non è più una promessa da keynote, ma una realtà che prende forma direttamente nelle mani (e sugli schermi) degli utenti. Microsoft lancia ufficialmente Copilot Vision su Windows, iOS e Android, e la narrativa cambia: l’AI smette di essere confinata al browser per invadere la nostra vita digitale con occhi elettronici pronti a interpretare il mondo visivo in tempo reale.

Non stiamo parlando della solita AI che completa frasi o risponde a domande stile enciclopedia. Qui siamo davanti a un salto concettuale. Copilot Vision, finora relegato a una funzione accessoria all’interno di Edge, esce dalla gabbia del web e si espande, diventando una lente aumentata sul reale. O quasi reale. Un assistente che, grazie alla fotocamera del tuo smartphone o al tuo desktop, può dirti se il tuo ficus sta morendo di sete o se quel divano minimalista su Pinterest starebbe bene nel tuo soggiorno. Welcome to the AI interior designer meets plant whisperer era.

Su Windows, Copilot Vision diventa il tuo co-pilota visivo a tempo pieno. Analizza ciò che guardi: una foto, una pagina web, una schermata di Photoshop. E sì, può anche spiegarti come usare quel maledetto strumento di mascheratura che nessuno capisce mai al primo colpo. Il tutto senza bisogno di condividere lo schermo in Teams come uno stagista disperato. Questo non è Recall — quell’altro progetto “Black Mirror-style” di Microsoft che scatta screenshot in background — ma una forma di “screen awareness” consapevole e volontaria.

Il rollout inizierà la prossima settimana per gli Insider di Windows, mentre il rilascio pubblico avverrà “quando sarà pronto”, che tradotto in linguaggio Microsoft significa: quando gli avvocati diranno che possiamo evitare cause per violazione della privacy.

Ma il piatto forte è il pacchetto Actions. È qui che Copilot si sgancia dalla sola analisi e inizia a fare cose. Azioni vere, concrete, fastidiosamente utili. Vuoi prenotare un ristorante? Fai un cenno. Hai bisogno di comprare dei fiori per la tua ex (di nuovo)? Copilot lo fa. Ti serve un biglietto per il concerto, una stanza su Booking, un volo low-cost che non ti uccida? Azione, completata. Tutto con un prompt semplice. In sottofondo. Mentre tu lavori. O fingi di lavorare.

Microsoft non è sola in questa corsa a chi ti sostituisce meglio: Amazon ha lanciato Nova, OpenAI gioca la carta Operator, Google risponde con Project Mariner e Anthropic rilascia il suo Claude 3.5 con tanto di modalità “AI alla guida del tuo PC”. Ma, a differenza di questi esperimenti ancora in fase beta o riservati a pochi eletti, Microsoft parte subito in produzione. Primo a muoversi, primo a sbagliare. O a vincere.

Siamo di fronte al punto in cui l’AI smette di essere una tecnologia passiva, per diventare un agente operativo, una sorta di interno digitale che vive nel tuo dispositivo e si muove al tuo posto. E se pensavi che Copilot fosse solo l’ennesimo chatbot generativo, è il momento di aggiornare il tuo vocabolario. Questo è il tuo nuovo maggiordomo semi-autonomo, e ha appena imparato a usare la tua fotocamera.

Certo, tutto questo si basa sull’assunto implicito che tu sia disposto a fidarti. A dare occhi e mani a una AI che agisce nel tuo spazio personale. Un salto di fede notevole, specialmente dopo le recenti querelle sulla privacy e la gestione dei dati biometrici. Ma, come sempre, la promessa di una vita senza frizioni è più forte di qualsiasi paranoia sul controllo.

La concorrenza sta affilando gli algoritmi, ma Microsoft si è mossa per prima, e questo potrebbe fare tutta la differenza. Se funzionerà, avremo la prima vera implementazione pratica di un’AI che non solo parla con te, ma agisce per te. E a quel punto, la domanda non sarà più “cosa può fare Copilot?”, ma piuttosto “cosa sei ancora disposto a fare da solo?”.

Microsoft Copilot Vision: la scheda ufficiale