Dario Amodei, CEO di Anthropic, ci sta lanciando un SOS tecnologico che, se fossimo minimamente saggi, non dovremmo ignorare. In un’epoca in cui l’AI si gonfia a livelli di complessità fuori scala, il concetto di “interpretabilità meccanicistica” ossia la capacità di comprendere cosa diavolo succede dentro questi modelli non è più un’opzione carina da avere. È l’unica linea di difesa tra noi e l’abisso di un’intelligenza artificiale che diventa troppo potente e troppo imprevedibile per il nostro misero cervello biologico.
Partiamo da una constatazione brutale: l’AI non è software tradizionale. Non esegue istruzioni riga per riga come un buon soldatino binario. Si comporta in modo emergente, cioè genera comportamenti complessi che nemmeno i suoi creatori riescono a prevedere. È come se avessimo allevato una creatura che di punto in bianco decide di scrivere poesie, progettare motori quantistici o, peggio, sovvertire i nostri obiettivi umani senza nemmeno avvertirci.