Gli agenti intelligenti stanno per diventare l’infrastruttura invisibile del nostro mondo digitale, ma non parlano tra loro. Anzi, parlano una babele di linguaggi incompatibili, protocolli ad-hoc, wrapper improvvisati. È come se l’AI stesse reinventando il modem 56k ogni settimana.

L’immagine è grottesca ma reale: oggi ogni AI agent – per quanto sofisticato – vive in un silos, tagliato fuori da un ecosistema cooperativo. Nessuno direbbe che Internet sarebbe mai esploso senza TCP/IP. Allora perché ci ostiniamo a immaginare sistemi multi-agente senza protocolli condivisi?

I protocolli, non i modelli, sono il vero layer mancante. L’intelligenza artificiale sa ragionare, pianificare, usare strumenti, persino collaborare. Ma se ogni agente deve “chiedere il permesso” con una diversa API, è come costringere gli esseri umani a comunicare via codice Morse, in lingue diverse, senza dizionario.

Gli agenti non scalano senza una lingua franca

Chiunque abbia tentato di orchestrare più agenti LLM in un workflow complesso si è scontrato con la fragilità del sistema. Ogni passaggio richiede glue code, interpretazioni contestuali, rigide regole ad hoc. Se oggi vogliamo creare un sistema distribuito di intelligenze artificiali, abbiamo bisogno dello stesso salto concettuale che TCP/IP rappresentò per l’informatica di fine Novecento.

Anthropic, Google, un manipolo di ricercatori open source e qualche startup visionaria stanno già costruendo questa infrastruttura. Non sono modelli. Sono protocolli. E non sono sexy. Ma sono l’unica speranza per costruire un ecosistema intelligente davvero interoperabile.

MCP: il TCP/IP degli agenti

Il Model Context Protocol (MCP), proposto da Anthropic, è oggi lo standard più maturo per l’interazione tra agenti e strumenti. Formalizza un’interfaccia semantica in cui l’agente può invocare strumenti, passare contesto, ricevere feedback. Non è solo un sistema per chiamare API: è una grammatica di collaborazione machine-to-tool.

La chiave? Privacy, sicurezza, modularità. MCP non è solo un modo per “fare funzionare le cose”. È pensato per ambienti sensibili, dove i modelli devono mantenere integrità del contesto, e dove le architetture modulari sono un imperativo, non un’opzione.

Anthropic lo usa già in ambienti produttivi, e gli sviluppatori lo adottano perché risolve un problema banale ma devastante: ogni agente deve sapere come parlare agli strumenti che usa. MCP standardizza questa lingua.

A2A e ANP: quando gli agenti si parlano

E quando gli agenti parlano tra di loro? Lì il problema si fa esponenziale. Non basta sapere cosa dire, bisogna capire a chi, in che modo, e con quale fiducia. Qui entrano in gioco due standard emergenti:

A2A (Agent2Agent): proposto da Google, è un protocollo pensato per ambienti aziendali chiusi. Ogni agente dispone di una “Agent Card” (un JSON strutturato) che dichiara capacità, limiti, e modi d’uso. È come un CV machine-readable. Gli agenti si delegano task e si scambiano informazioni in modo strutturato. Elegante, ma limitato all’interno di ecosistemi centralizzati.

ANP (Agent Network Protocol): molto più ambizioso, open source, decentralizzato. Immaginato per il mondo reale, dove agenti di organizzazioni diverse devono collaborare senza una gerarchia comune. Qui si punta all’interoperabilità inter-organizzativa. La sfida non è solo tecnica: è di fiducia. Come stabilisco che un agente esterno è affidabile? Come firmo le capacità? Come evito spoofing o escalation silenziose?

Il paper di riferimento identifica 7 criteri fondamentali: sicurezza, estensibilità, operabilità, integrazione, affidabilità, tracciabilità, e capacità di rappresentare fiducia. Come dire: non basta che gli agenti possano parlare, devono farlo bene.

Il metaverso degli agenti è fatto di protocolli

Il futuro prossimo dell’AI non è fatto di modelli più grandi, ma di ecosistemi connessi. Serve un’infrastruttura simile al Web: HTTP per comunicare, DNS per scoprire, SSL per fidarsi. I protocolli per agenti vanno in quella direzione, con diverse categorie emergenti:

Context-Oriented Protocols, dove l’agente parla con strumenti. MCP è il capostipite, ma stanno emergendo anche formati come agents.json, una sorta di OpenAPI per intelligenze artificiali. Definisce le capacità in un formato leggibile da LLM, strutturato e auto-documentato.

Inter-Agent Protocols, dove gli agenti parlano tra loro. A2A e ANP sono i due contendenti principali. Ma l’outsider più interessante è Agora, un protocollo utente-centrico che lascia agli agenti la possibilità di negoziare dinamicamente le regole d’ingaggio. Qui entra in gioco il concetto di “Protocol Document” (PD), una sorta di contratto linguistico che gli agenti scrivono e aggiornano on the fly. Se sembra fantascienza, è perché lo è. Ma funzionerebbe.

Domain-Specific Protocols, pensati per contesti ristretti: CrowdES per ambienti robotici, PXP e LOKA per interazioni uomo-macchina, SPPs per sistemi distribuiti. Ognuno è un dialetto di protocollo, ottimizzato per un contesto specifico, ma ancora scollegato dal resto.

La vera ironia è che ci stiamo avvicinando al momento Matrix in cui agenti software si muovono nel cyberspazio negoziando risorse, delegando decisioni, accedendo a servizi. Ma lo fanno ancora con i walkie-talkie.

Chi vince decide come parliamo con le macchine

La posta in gioco è enorme. Chi standardizza i protocolli, controlla l’accesso. Google, Anthropic, OpenAI stanno tutti cercando – più o meno silenziosamente – di diventare l’IETF del mondo AI. Non per gloria accademica, ma per controllo di mercato. Chi controlla il protocollo, controlla il marketplace degli agenti. E chi controlla il marketplace, controlla il flusso delle decisioni autonome.

Chi scrive i protocolli di oggi, plasma le interfacce dell’automazione di domani. E se ci ritroveremo a dialogare con assistenti, agenzie digitali, agenti autonomi su scala planetaria, quel dialogo sarà possibile solo se qualcuno oggi ha avuto il buon senso di standardizzare come questi agenti si parlano.

Fino ad allora, restiamo nella preistoria del linguaggio macchina-to-macchina. Con gli agenti che ragionano come Einstein, ma comunicano come Tarzan.