Se Andrej Karpathy, uno dei più lucidi architetti dell’intelligenza artificiale moderna, si dice «molto impressionato» da Veo 3 e dai contenuti emergenti su r/aivideo, significa che qualcosa di epocale sta realmente accadendo. Nel mare magnum dei video online, spesso ripetitivi e talvolta fastidiosi, la vera svolta non è tanto la quantità, quanto la qualità qualitativamente superiore che emerge quando all’immagine si aggiunge l’audio generato e ottimizzato da reti neurali sofisticate. Ma ciò che Karpathy sottolinea va ben oltre un semplice upgrade tecnologico: il video come medium sta attraversando una metamorfosi che nessuno aveva previsto.
Chiunque abbia mai provato a studiare un argomento complesso davanti a un testo infarcito di parole sa quanto sia faticoso. Il video, al contrario, è l’input a più alta larghezza di banda per il nostro cervello. Non si tratta solo di intrattenimento, ma di lavoro, apprendimento, scienza. Diagrammi, animazioni, grafici in movimento sono il futuro della conoscenza. E la cosa più sorprendente è che il limite alla creazione di questi contenuti sta rapidamente tendendo a zero. Oggi chiunque può generare video di qualità, senza più essere schiavo di costose produzioni umane.
Ecco la vera bomba: il video non è più soltanto un prodotto finito da indicizzare, catalogare, servire a un pubblico stanco e distratto. È diventato qualcosa di ottimizzabile, cioè perfettamente adattabile e migliorabile in tempo reale tramite algoritmi di apprendimento automatico. Fino a ieri, piattaforme come TikTok vivevano della fatica creativa umana e della complessa danza degli algoritmi di ranking per mantenere alta l’attenzione degli utenti. È un sistema che funziona, certo, ma è un pessimo ottimizzatore o per dirla con Karpathy, «molto, molto lontano da quello che è possibile in principio».
Ora le reti neurali possono generare video in modo differenziabile, cioè passibile di ottimizzazione tramite metodi di discesa del gradiente, proprio come si fa con i parametri di un modello di intelligenza artificiale. Questo apre orizzonti che fino a ieri sembravano fantascienza: possiamo prendere metriche come l’engagement, la dilatazione della pupilla (un indicatore fisiologico di attenzione), il tasso di conversione di una pubblicità e ottimizzare la creazione video direttamente su quei parametri. La mossa è geniale e potenzialmente dirompente: perché limitarsi a indicizzare un catalogo finito quando si può creare un numero infinito di video perfettamente calibrati sul pubblico?
Immaginate il paradosso: il video, un medium storicamente associato a un consumo passivo, diventa ora uno strumento attivo di comunicazione AI-umano, un’interfaccia potentissima che supera la barriera della lettura e apre a una comprensione istantanea grazie a immagini animate e suoni. La potenza creativa che si sprigiona è immensa, ma — come dice Karpathy con una punta di scetticismo «non sono sicuro che ci piacerà ciò che significa ‘ottimale’». Perché l’ottimizzazione estrema rischia di farci sprofondare in un incubo di stimoli iper-calibrati, più manipolatori che educativi, un palcoscenico perfetto per l’ipnotismo digitale.
Chi ha un occhio tecnologico e uno spirito da CEO capisce bene il valore nascosto di questa trasformazione. Il vero gioco non è solo nell’innovazione tecnica, ma nella ridefinizione totale di come la comunicazione visiva e audiovisiva si intreccia con l’IA. Se oggi la barriera per fare video è prossima allo zero, domani potremmo trovarci di fronte a un mondo dove ogni messaggio, ogni insegnamento, ogni pubblicità è costruito al millisecondo per massimizzare l’effetto desiderato. Il rischio? Perdere il controllo, diventare semplici prede di un algoritmo che sa più di noi stessi cosa vogliamo, o almeno ciò che ci fa restare incollati allo schermo.
La riflessione che nasce da questa rivoluzione è quasi filosofica: la tecnologia non cambia solo ciò che facciamo, ma come percepiamo e apprendiamo il mondo. Se il video è la massima espressione di questa tendenza, allora il futuro del lavoro, dell’informazione, persino della cultura potrebbe trasformarsi radicalmente. Non è solo una questione di potenza computazionale, ma di come questa potenza viene impiegata per costruire realtà alternative, filtri cognitivi e persino forme di dipendenza che sfuggono alla nostra consapevolezza.
Karpathy lo mette in chiaro: siamo solo all’inizio di un viaggio che potrebbe rivelarsi esaltante o inquietante. Una cosa è certa: l’era del video non più statico ma dinamicamente generato e perfezionato dall’intelligenza artificiale è alle porte. Se avete paura della noia o della monotonia, è ora di prepararvi a un futuro dove ogni pixel, ogni suono e ogni immagine sono il risultato di un’ottimizzazione senza precedenti. E chi sarà al comando di questo processo avrà in mano un potere che supera ogni immaginazione.
In fondo, come disse qualcuno che di tecnologia se ne intendeva, «il futuro non è scritto, è generato». E questo è solo il primo capitolo.