Nel mondo dell’Intelligenza Artificiale, ci sono le rockstar e ci sono gli outsider. Da una parte, abbiamo i Large Language Models (LLM), le celebrità del momento, i modelli linguistici che monopolizzano l’attenzione dei media, delle aziende e degli investitori. ChatGPT, Gemini, Claude: tutti ne parlano, tutti vogliono un pezzo della torta. Ma poi c’è una branca dell’AI che viene trattata come il parente imbarazzante alle cene di famiglia: l’Intelligenza Spaziale, ovvero la capacità di un’AI di comprendere e simulare il mondo fisico in tre dimensioni, nel tempo e nello spazio.
Chiamatela Spatial Intelligence, Physical Intelligence, Geospatial AI o World Models. Non sapete quale nome usare? Bene, ecco il primo problema.
Una tecnologia senza nome è una tecnologia invisibile
Il motivo principale per cui questa branca dell’AI è sottovalutata è che manca un termine chiaro e riconoscibile per identificarla. I Large Language Models (LLM) hanno un nome accattivante e immediatamente riconoscibile, che ne facilita la diffusione e la comprensione da parte del pubblico e degli investitori. Ma quando si tratta di AI che comprende la realtà fisica, ci si perde tra definizioni vaghe e nomi poco incisivi.
Eppure, i grandi player della tecnologia stanno già lavorando su questi modelli, senza fare troppo rumore. Google, OpenAI, Meta, Amazon, Niantic e startup meno conosciute come Archetype AI e 1X stanno investendo in questa direzione. Il problema è che non avendo un’etichetta chiara e di tendenza, il settore non riceve l’attenzione che merita. Quando non si riesce nemmeno a dare un nome univoco a qualcosa, si rischia di non vederlo proprio.
Nessuna rivoluzione? Nessun interesse
Un altro ostacolo è l’assenza di quei “momenti wow” che rendono una tecnologia improvvisamente irresistibile per il pubblico e per gli investitori. Quando ChatGPT è stato rilasciato, ha dimostrato immediatamente di poter rispondere a domande complesse, scrivere codice e creare contenuti. Un impatto immediato, visibile, tangibile.
Nel caso dei modelli spaziali, invece, siamo ancora nella fase della sperimentazione. La ricerca è attiva, ma non ci sono ancora applicazioni che possano cambiare il mercato da un giorno all’altro. E senza uno show mediatico fatto di annunci spettacolari e dimostrazioni eclatanti, il rischio è che tutto venga percepito come un “progetto futuro” e non come una tecnologia che potrebbe trasformare settori interi nei prossimi anni.
Eppure, l’assenza di clamore non significa assenza di potenziale. Questi modelli potrebbero essere fondamentali per la robotica avanzata, la simulazione industriale, la realtà aumentata e virtuale, il miglioramento dell’AI nei veicoli autonomi e persino nella gestione di infrastrutture e città intelligenti. Ma finché non vedremo una killer application capace di accendere l’entusiasmo, il settore rimarrà nell’ombra.
E’ solo un gioco” (sì, proprio come lo erano gli scacchi per Deep Blue)
Il terzo pregiudizio è forse il più ironico: le prime applicazioni concrete di questi modelli stanno emergendo nel gaming e nei settori creativi. Ed è proprio questa associazione con il mondo del divertimento che porta molti a sottovalutare il loro potenziale.
Pensiamo a quanto già accaduto in passato: gli scettici ridevano quando DeepMind ha iniziato ad allenare AI con i videogiochi Atari, ma poi AlphaGo ha sconfitto il campione mondiale di Go, dimostrando capacità di apprendimento mai viste prima. IBM Deep Blue ha fatto lo stesso con Kasparov, e Watson ha umiliato i più grandi campioni di Jeopardy.
Ora, il gaming sta facendo lo stesso per l’intelligenza spaziale. Giochi come Minecraft e GTA V sono diventati vere e proprie palestre per l’addestramento di AI che devono navigare in ambienti tridimensionali complessi, imparare a interagire con il mondo e prendere decisioni in tempo reale. Il motivo è semplice: i videogiochi sono il miglior banco di prova per testare l’intelligenza in ambienti dinamici e controllabili.
E proprio come i bambini imparano giocando, anche le AI possono sfruttare il gaming per apprendere in un contesto a basso rischio e alta sperimentazione. Ignorare questo fenomeno significa ignorare il modo in cui l’intelligenza si sviluppa, sia essa biologica o artificiale.
Il futuro si costruisce (anche) fuori dai riflettori
L’intelligenza spaziale non avrà ancora il suo momento di gloria, ma questo non significa che non sia destinata a rivoluzionare interi settori. La robotica, la guida autonoma, la logistica, l’urbanistica e persino la medicina potrebbero beneficiare enormemente di modelli capaci di comprendere e prevedere il comportamento del mondo fisico.
La storia dell’AI dimostra che le tecnologie più impattanti nascono spesso nell’ombra, lontano dall’hype mediatico, fino a quando non diventano improvvisamente indispensabili. L’Intelligenza Spaziale è una di queste. E quando finalmente avrà il suo nome definitivo e la sua applicazione di punta, tutti si accorgeranno che era lì da sempre.
L’intelligenza artificiale che comprende il mondo fisico: l’ambizioso progetto di World Labs
Nel panorama in continua evoluzione della tecnologia, la startup World Labs sta emergendo come un protagonista destinato a ridefinire i confini dell’intelligenza artificiale (IA). Con una raccolta di 230 milioni di dollari in finanziamenti, la missione di World Labs è audace: sviluppare una tecnologia di IA in grado di non solo comprendere il mondo fisico tridimensionale, ma anche di interagire e operare in esso in modo completamente innovativo. Questa impresa ambiziosa si fonde perfettamente con l’esperienza e la visione di Fei-Fei Li, una delle figure più influenti nel campo dell’IA, il cui nome è indissolubilmente legato al successo di ImageNet e alle sue pietre miliari nell’ambito della visione artificiale.
Fei-Fei Li, spesso celebrata come la “madrina dell’intelligenza artificiale”, ha a lungo spinto l’innovazione nel campo dell’apprendimento profondo e dell’intelligenza artificiale. Ora, con World Labs, Li sta cercando di trascendere i limiti dei modelli 2D, come quelli che alimentano i moderni Large Language Models (LLM), per creare “Large World Models” (LWM) che permettano all’IA di operare e comprendere mondi tridimensionali complessi. Questi modelli, si prevede, non solo percepiranno e genereranno mondi virtuali, ma interagiranno anche con l’ambiente fisico, dotandosi di una comprensione spaziale che si avvicina alla nostra.
La base della tecnologia LWM risiede nella capacità di comprendere lo spazio come lo facciamo noi umani: vedendo e interagendo con esso. La visione spaziale, quindi, diventa il cuore pulsante di questa innovazione, che potrebbe radicalmente cambiare il modo in cui le macchine interagiscono con l’ambiente e, potenzialmente, con gli esseri umani. La prospettiva di modelli che possiedono una “intelligenza spaziale” potrebbe portare, nel lungo periodo, a robot autonomi alimentati da IA in grado di operare in scenari fisici, come ambienti industriali complessi o situazioni quotidiane, dove la comprensione della spazialità è fondamentale.
Le applicazioni a breve termine di questa tecnologia si concentrano principalmente su aree come il gaming e la realtà aumentata/virtuale (AR/VR), ambiti in cui la simulazione di mondi tridimensionali realistici e interattivi è già una necessità. I mondi generati dai modelli LWM potrebbero, infatti, migliorare l’esperienza utente, offrendo ambienti ancora più immersivi e realistici. Tuttavia, l’impatto maggiore di questa tecnologia si avrà probabilmente a lungo termine, quando LWM troveranno applicazione in ambiti come la robotica, dove la capacità di un robot di “vedere” e interagire in tempo reale con il mondo fisico rappresenterà un salto evolutivo fondamentale.
I fondatori di World Labs, tra cui Fei-Fei Li e Justin Johnson, hanno dichiarato che la combinazione di LWM con i Big Data potrebbe rivoluzionare l’IA come la conosciamo. La capacità di alimentare modelli di intelligenza artificiale con enormi quantità di dati spaziali e contestuali, non solo visivi, potrebbe far evolvere ulteriormente l’apprendimento automatico, portando l’IA a nuovi livelli di comprensione e autonomia.
In un recente episodio del podcast di Andreessen Horowitz, Fei-Fei Li ha discusso del potenziale dei Large World Models e di come la visione spaziale possa essere il prossimo grande passo nell’evoluzione dell’intelligenza artificiale. Secondo gli investitori di Andreessen Horowitz, come Martin Casado e Sarah Wang, i modelli LLM, che hanno già avuto un impatto straordinario nel campo del linguaggio, sono solo una parte della complessa realtà in cui viviamo. L’evoluzione dell’intelligenza artificiale non si ferma al linguaggio, ma si espande per includere anche la dimensione spaziale, una sfera che rimane ancora largamente inesplorata. Con questo obiettivo, World Labs sta cercando di rompere con la tradizione dell’IA centrata esclusivamente sui dati 2D, portando un’intera nuova dimensione di interazione e comprensione.
La startup ha dimostrato un notevole potenziale, non solo per quanto riguarda la tecnologia che sta sviluppando, ma anche per la sua capacità di attrarre investimenti significativi. Il co-finanziamento da parte di Andreessen Horowitz, uno dei principali attori nel panorama degli investimenti tecnologici, evidenzia la fiducia che l’industria ripone in questo progetto. Questo investimento contribuirà a spingere ulteriormente il lavoro di World Labs, supportando la ricerca e lo sviluppo di modelli sempre più avanzati che potrebbero essere utilizzati in un numero crescente di settori, dalla robotica all’automazione industriale.
Questa tecnologia potrebbe rappresentare una nuova frontiera per l’intelligenza artificiale, consentendo alle macchine di comprendere e operare nel mondo come mai prima d’ora. Se la visione di Fei-Fei Li si realizzerà, l’intelligenza artificiale potrebbe finalmente diventare una presenza autentica nel nostro mondo tridimensionale, con applicazioni che spaziano dalla simulazione virtuale alla robotica autonoma, trasformando radicalmente il modo in cui interagiamo con la tecnologia.
Per ulteriori dettagli su World Labs e la sua missione, è possibile seguire i loro aggiornamenti e sviluppi sul sito ufficiale World Labs.