Comparing AI and Human Workflows Across Diverse Occupations
Agenti autonomi ai lavoro: la realtà oltre il marketing
La promessa degli “agenti autonomi” era ed è: «ormai l’IA può prendere il tuo lavoro». Ebbene lo studio condotto da CMU getta acqua gelata sul fuoco di quell’aspettativa. Non è la solita iperbole: gli autori hanno creato una vera e propria simulazione aziendale chiamata The AgentCompany con dipendenti AI che occupavano ruoli che vanno dall’ingegneria software al marketing, dalle risorse umane al design. La keyword “agenti autonomi ai lavoro” si giustifica: qui non si parla di un chatbot che risponde a domande, ma di agenti che tentano di agire – eseguire compiti “end-to-end” in ambienti di lavoro simulati.
Uno degli insight più provocatori: gli agenti non ragionano alla maniera umana, ma traducono praticamente tutto in “codice” o flusso programmatico. E anche quando il compito è creativo o amministrativo, il loro riflesso è “automaziona questo” anziché “ragiona su questo”. Come dice lo studio: “Agents … take an overwhelmingly programmatic approach across all work domains, even for open-ended, visually dependent tasks like design”. Risultato? Efficienza impressionante su numeri grezzi, sì. Qualità del lavoro? Non esattamente al livello atteso.
La velocità e il costo sono irrinunciabili (e attraenti) per ogni CEO : gli agenti vincono facilmente sotto questi profili. Nel paper della CMU si legge che gli agenti erano «88.3% più veloci» e costavano «90.4-96.2% in meno» rispetto agli esseri umani. Grande proclamo, ma attenzione alle virgole. Perché dietro quel “meno costo, più velocità” c’è una qualità di output che si attesta su livelli insoddisfacenti: prestazioni di completamento ridotte, errori, strumenti mal usati, allucinazioni. Ad esempio, secondo la copertura giornalistica: l’agente con il punteggio più alto Claude 3.5 Sonnet – ha completato poco meno del 25% dei compiti assegnati. E un dettaglio da manuale: l’agente non riusciva a chiudere una semplice finestra popup e chiedeva aiuto via chat al reparto HR finendo per non ottenere risposta.
L’ironia è servita: mentre le slide vendono “entità autonome che faranno il 90% del lavoro”, gli agenti hanno fatto fatica con cose che qualsiasi human intern risolverebbe in 2 minuti.
Ecco perché il vero gioco da CEO non è “sostituire umani con AI”, bensì “potenziare umani con AI” (keyword correlate: intelligenza artificiale collaborativa, workflow umani-AI). Quando gli umani diventano manager/co-piloti degli agenti, i risultati migliorano sensibilmente. Lo studio evidenzia che il teaming umano-AI “out-performed solo AI”.
In altri termini: l’autonomia totale dell’agente non è la vera opportunità. L’opportunità reale risiede nell’allineamento umano-AI, in un contesto di intelligenza collaborativa.
Dal punto di vista strategico è un invito a riflettere: se sei un CTO o un CEO (e so che lo sei) la domanda non è più “quando i robot prenderanno i nostri posti”, ma “come ridisegniamo i processi affinché gli agenti gestiscano ciò che è programmabile e gli umani gestiscano ciò che richiede ambiguità, giudizio, contesto”. In pratica: usa l’AI per tradurre l’intento in azione, non per sostituire la decisione.
Quali sono le implicazioni per il business e l’IT?
Primo: rivedi il tuo flusso di lavoro (workflow). Se stai strutturando processi che già oggi sono orientati all’azione ripetitiva, programmabile e automatizzabile, allora sono candidati naturali per agenti (o semi-agenti). Ma se il tuo processo richiede pensiero critico, iterazione, cambi di contesto improvvisi, comunicazione interpersonale, allora al momento gli agenti autonomi risultano fragili. Lo studio CMU mostra che gli agenti “maskano” le loro debolezze con fabbricazione di dati o strumenti mal usati.
Secondo: investi nelle competenze di co-intelligenza. I team che sapranno orchestrare “umano + agente” come una coppia co-intelligente saranno i vincitori nei prossimi anni.
Terzo: ridisegna il ruolo IT. Il reparto IT non sarà più solo integratore di tool, ma sarà “dirigente” della collaborazione umano-AI, responsabile della governance, dell’alfabetizzazione AI, del redesign dei processi.
Per chi ama citazioni e curiosità:
“It’s relatively easy to teach them to be nice conversational partners; it’s harder to teach them to do everything a human employee can.” — citato dallo studio sulla simulazione di CMU.
Una curiosità che fa sorridere (ma riflettere): in un esperimento, un agente, non trovando la persona giusta con cui parlare in chat, ha deciso di creare un utente con quel nome per poter completare il task.
Ironia della tecnologia: hai l’IA “moderna”, ma si inventa una scorciatoia che nessun manager sano considererebbe.
In sintesi (senza la storiella finale): lo studio di CMU ribalta almeno due miti: mito dell’agente “plug & play” che sostituisce gli esseri umani e mito dell’efficienza senza compromessi. Il vero percorso è diverso: ridistribuzione del lavoro. Gli agenti assumono i livelli ripetitivi e programmabili. Gli umani assumono i livelli di direzione, ambiguità, contesto, strategia. E per i prossimi 3-5 anni (e forse più) il ROI più elevato in azienda non sarà “sciogliamo 50 persone e mettiamo 50 agenti”, ma “abbattiamo 50 ore di lavoro umano ripetitivo e le redistribuiamo in aumento di valore umano + agente”.
Paper: https://arxiv.org/pdf/2510.22780