Meta Platforms ha appena sganciato una bomba, anche se lo stile è quello da laboratorio silenzioso e patinato. Il nome è V-JEPA 2. Sembra il titolo di un software di terz’ordine, ma è molto di più: è il nuovo modello di intelligenza artificiale lanciato da Menlo Park per spingere la sua visione dell’Advanced Machine Intelligence (AMI), un concetto tanto vago quanto ambizioso che promette — o minaccia — di trasformare ogni interazione uomo-macchina in una danza algoritmica tra causa ed effetto.
Sì, avete capito bene. Non parliamo più di AI che completano frasi o generano gattini digitali a comando. V-JEPA 2 vuole comprendere il mondo fisico, prevedere cosa succede quando un oggetto cade, quando un liquido si versa, quando una porta si apre. Sta provando, senza chiederlo a nessuno, a dotare le macchine della nostra intuizione. La common sense reasoning diventa computabile, quindi controllabile.
E il dettaglio curioso, se non disturbante? Il progetto si basa sul lavoro teorico del premio Nobel Yann LeCun, Chief AI Scientist di Meta, che da anni predica un’idea tanto semplice quanto radicale: l’AI non ha bisogno di etichette umane, ma di osservazione non supervisionata. Un’AI che impara da sola, guardando il mondo, come un bambino che rompe giocattoli per capire come funzionano. Tranne che questa volta il giocattolo siamo noi.
La parola chiave è: causalità.
Non basta più riconoscere che un bicchiere è mezzo pieno. V-JEPA 2 cerca di intuire perché lo sia, cosa lo riempirà, cosa succederà se lo spingiamo dal tavolo. È il tipo di intelligenza che ci ha separati dai primati per milioni di anni. E ora Meta vuole insegnarla alle sue macchine con reti neurali gigantesche, codici auto-supervisionati e miliardi di parametri addestrati su ambienti simulati e mondi sintetici.
La parola d’ordine? World modeling. In altre epoche si chiamava cosmologia, poi filosofia. Ora è un cluster di GPU.
E mentre l’AI generativa si affanna ancora a imitare Shakespeare o fare PowerPoint per manager distratti, Meta gioca un altro gioco: vuole che le sue AI capiscano la fisica senza che nessuno gliela spieghi. V-JEPA 2 è un passo nella costruzione di una macchina che pensa come un essere umano, ma senza limiti biologici.
Un dettaglio tecnico, sfuggito ai più, ma che merita attenzione: V-JEPA 2 si basa su una architettura di prediction-based self-supervised learning, dove l’agente non viene ricompensato per avere la risposta giusta, ma per avere una rappresentazione interna coerente del mondo. Un po’ come dire: non ti do un premio se indovini che pioverà domani, ma se riesci a costruire un modello mentale del clima. È una rivoluzione epistemologica.
Ora, il mercato ha annusato il sangue. Nonostante l’annuncio sia tecnico, non sexy come gli avatar di Zuckerberg o i reel di Instagram, il titolo META ha registrato movimenti sottili ma coerenti. Gli hedge fund non leggono i blog, ma le previsioni a lungo termine. E V-JEPA 2, pur se non ha ancora una killer app, suggerisce un orizzonte molto chiaro: agentic AI, intelligenze che agiscono, ragionano e apprendono in ambienti complessi.
La narrativa pubblica continuerà a ruotare attorno a chatbot, avatar e occhiali AR. Ma la vera partita si gioca sotto il cofano, nel cuore della competizione per la generalizzazione del pensiero artificiale.
E chiariamoci: AMI non è AGI. Non ancora. È un nuovo tipo di ambizione. Dove l’obiettivo non è emulare la mente umana in tutta la sua complessità, ma costruire una macchina con senso comune, in grado di navigare un mondo che cambia, dedurre leggi implicite, riconoscere anomalie. Un’intelligenza operativa, non necessariamente cosciente, ma diabolicamente efficace.
Gli ingegneri di Meta lo dicono a mezza voce: V-JEPA 2 è un mattone nella costruzione di AI agents autonomi, capaci di manipolare oggetti nel mondo fisico, giocare partite complesse, e — perché no — pilotare droni, leggere radiografie, o insegnare a programmare ad altri AI.
E qui il pensiero corre a un vecchio aneddoto. Quando Alan Turing, nel 1950, pubblicò il suo articolo seminale sull’intelligenza artificiale, non parlò di reti neurali o codici Python. Parlò di bambini. “Invece di cercare di costruire un adulto, creiamo un bambino e poi lasciamo che impari.” Meta sta facendo esattamente questo, ma con la forza bruta del deep learning e le tasche profonde di un impero pubblicitario.
Si può parlare di V-JEPA 2 come di una scommessa. Ma sarebbe riduttivo. È un frammento di futuro, incastrato nel presente. Una tecnologia che sta imparando a vedere il mondo come noi, ma a pensarci sopra senza di noi.
Nel frattempo, in borsa, si balla. Gli investitori più svegli iniziano a capire che mentre tutti parlano di prompt, plugin e chatbot logorroici, il vero game-changer è la simulazione della causalità.
Una AI che capisce perché qualcosa succede, è una AI che può agire prima che succeda.
E questo, nel business, nella guerra, nella finanza, fa la differenza tra il primo e il secondo posto.