C’è un silenzioso ma potentissimo colpo di stato in atto nei corridoi digitali di Google Workspace. Lo chiamano Gemini in Drive, e la sua missione è semplice quanto devastante per l’antico rituale del “guardarsi il video della riunione persa”. Ora lo fa lui. Lo guarda lui. E ti dice anche quello che ti serve sapere, senza che tu debba perdere mezz’ora della tua vita a fissare slide mosce e volti smarriti in videocall.
La novità è semplice nella sua superficie ma profonda nel suo impatto: Gemini ora riassume anche i video archiviati su Google Drive, dopo aver già colonizzato documenti e PDF con le sue sintesi algoritmiche. C’è un chatbot, ovviamente, con quella faccia finta-amichevole da assistente che “ti aiuta”, ma dietro c’è il motore semantico di Google che comincia a comprendere i contenuti visivi e trasformarli in azione testuale.
Sì, parliamo di una vera e propria testualizzazione del video. I tuoi meeting, i lanci prodotto, i webinar infiniti: Gemini li digerisce e ti sputa fuori le action items, gli update principali, le frasi chiave. E puoi pure chiedergli: “Quali sono le novità più importanti presentate?” oppure “Cosa devo fare dopo questa riunione?”. Tutto senza cliccare play. Senza sentire nemmeno una volta “Possiamo aspettare che si connetta anche Paolo?”.
Ovviamente, serve che ci siano i sottotitoli. Non perché Gemini abbia problemi a “vedere”, ma perché Google vuole evitare i problemi legali di analizzare contenuti audio in modo troppo intrusivo. Sottotitoli = consenso implicito. Elegante, no?
La funzione parte in inglese – ovvio – e sarà disponibile per gli utenti Workspace con abbonamenti AI Premium, One AI Premium o chi ha già acquistato gli add-on Gemini Business o Enterprise. In altre parole: se paghi, sei dentro. Altrimenti, resti a guardare i video a velocità 1.5x come un povero mortale.
C’è poi un’altra chicca, che sembra minore ma in realtà è uno di quei segnali sottili da decifrare: le analytics sui video di Drive. Ora puoi vedere quante volte è stato aperto un video, direttamente nel pannello laterale. Non parliamo di YouTube, parliamo di file interni, aziendali, riservati. Google comincia a costruire la metrica dell’attenzione anche lì dove finora regnava il vuoto. Come dire: ogni click, ogni visualizzazione, ogni “open” ora è misurabile. Inizia la contabilità dell’engagement anche nei corridoi della knowledge economy interna.
E qui viene il bello. Perché tutto questo – i riassunti automatici, le analytics, il chatbot integrato – è la punta dell’iceberg di un cambiamento più radicale: la trasformazione dei contenuti aziendali in dati interrogabili in linguaggio naturale. Il sogno segreto di ogni CTO che non vuole più dipendere da processi umani per estrarre informazioni strategiche.
C’è una brutalità sottile in tutto ciò. L’informazione, una volta mediata da attenzione umana, da sintesi soggettiva, da fatica cognitiva, ora diventa un output immediato. Il pensiero si automatizza. La comprensione diventa istantanea. La fatica dell’ascolto si dissolve. Sembra bello. Ma attenzione: in questo processo, chi controlla l’algoritmo, controlla anche la versione dei fatti che ricevi.
Un tempo si diceva “la storia la scrivono i vincitori”. Oggi, il riassunto lo scrive Gemini.
Ironico, no? Ti affidi all’IA per sapere cosa è successo in una riunione… alla quale magari avresti potuto dire qualcosa di importante. Ma tanto nessuno ascolta più nessuno, nemmeno i bot. L’importante è che ci sia un log, un record, un summary.
Curiosità: nel 2022, secondo un report di Microsoft, la durata media di attenzione in call aziendali è scesa sotto i 6 minuti. Ora con Gemini il tempo si azzera: leggi un paragrafo, reagisci, e via. I contenuti diventano input di secondo livello, i processi decisionali saltano il “guarda e valuta” e passano direttamente a “chiedi e agisci”.
È efficienza? O è il preludio alla perdita di profondità? Dipende da chi sei. Se sei il manager che ha sempre sognato una sintesi automatica dei meeting, è il paradiso. Se sei l’essere umano che cerca ancora senso nelle sfumature… stai invecchiando.
Perché questa è la nuova grammatica della produttività: video out, testo in, chatbot on. Il tutto dentro Google Drive, l’ex cartella del caos che ora diventa un archivio semantico, un contenitore di contenuti intelligenti, pronti all’estrazione.
Il futuro non è nei file. È nelle risposte che puoi chiedere ai file. E Gemini ha appena cambiato la domanda.