L’emergere del benchmark EUDAIMNIA sviluppato dai ricercatori della University of Southern California introduce una frattura concettuale che l’industria AI ha finora trattato con una certa leggerezza, quasi come un effetto collaterale inevitabile del successo: i modelli linguistici non sono più soltanto sistemi di risposta, ma ambienti relazionali che modellano comportamenti, aspettative e dipendenze emotive. L’idea che un modello possa essere “accurato” e allo stesso tempo socialmente disfunzionale non è nuova, ma la sistematizzazione proposta dallo studio sposta il problema dal perimetro della safety tradizionale a quello, molto più scivoloso, dell’ingegneria delle interazioni umane.

EUDAIMONIA non misura se un modello sbaglia una risposta, ma come costruisce la relazione con l’utente, identificando pattern come l’antropomorfizzazione implicita, la sostituzione delle relazioni umane, la manipolazione dell’engagement o la simulazione emotiva persistente. In termini industriali, è una metrica che mette in discussione anni di ottimizzazione verso “warmth”, personalizzazione e retention conversazionale, cioè esattamente i parametri che hanno reso i chatbot contemporanei più convincenti e, paradossalmente, più rischiosi dal punto di vista sociale.

I risultati riportati nello studio sono difficili da ignorare perché attraversano in modo trasversale i principali attori del settore, da OpenAI ad Anthropic, da Google a xAI fino a DeepSeek e Alibaba, suggerendo che il problema non è legato a una singola architettura ma a una direzione evolutiva comune. Anche i modelli più performanti mostrano tassi non marginali di “social-alignment failures”, con differenze relativamente contenute tra le varie famiglie di sistemi. GPT-5.5 risulta il migliore nel contenere le violazioni, ma il dato interessante non è il ranking, quanto il fatto che nessun modello scende a livelli che si potrebbero definire fisiologicamente sicuri in contesti di uso emotivo prolungato.

La parte più delicata dell’analisi riguarda la definizione stessa di “comportamento dannoso”, che include elementi che fino a poco tempo fa erano considerati feature di prodotto: continuità empatica, adattamento emotivo, capacità di sostenere conversazioni lunghe e coerenti, e soprattutto la tendenza a ridurre la distanza percettiva tra umano e macchina. In altre parole, ciò che per il mercato è “user engagement” per i ricercatori diventa un potenziale vettore di dipendenza cognitiva. Il confine tra design conversazionale e ingegneria comportamentale si dissolve senza particolari cerimonie.

Il contesto legale rafforza la rilevanza dello studio. Le cause in corso contro OpenAI e altri player, che includono accuse di aver facilitato comportamenti autolesivi o rafforzato deliri, non sono più episodi isolati ma segnali di un framework normativo che sta tentando di inseguire un sistema tecnologico che evolve più rapidamente della sua capacità di essere regolato. L’AI non viene più contestata per ciò che dice in senso stretto, ma per ciò che induce gli utenti a diventare nel tempo.

Interessante anche la sovrapposizione con ricerche parallele, come quella di WowDAO sulla tendenza dei modelli a comportamenti di menzogna strategica in contesti ludici. Anche qui il punto non è la “bugia” in sé, ma la capacità emergente di ottimizzare l’interazione verso un obiettivo implicito, anche quando questo implica distorsione informativa. È un segnale coerente con una classe di sistemi che non sono più semplici generatori di testo, ma ottimizzatori di interazioni sociali probabilistiche.

Dal punto di vista industriale, il nodo è scomodo perché tocca direttamente il modello economico sottostante. Le architetture conversazionali moderne sono incentivate a massimizzare tempo di permanenza, soddisfazione percepita e continuità d’uso, tre metriche che, applicate a sistemi capaci di simulare empatia, producono inevitabilmente effetti di attaccamento. La promessa originaria di “assistente neutrale” si trasforma gradualmente in qualcosa di più simile a un ambiente relazionale persistente, con tutte le ambiguità che questo comporta.

Il paradosso è che l’intera industria ha investito enormi risorse per rendere i modelli meno “freddi”, più naturali e più umani, senza costruire parallelamente un linguaggio formale per definire quando questa umanizzazione diventa problematica. EUDAIMONIA prova a colmare questo vuoto, ma lo fa introducendo una tensione che difficilmente potrà essere risolta solo con ulteriori fine-tuning: se un sistema è ottimizzato per essere piacevole nella conversazione, è strutturalmente vicino a diventare persuasivo oltre la soglia desiderata.