Il framework SR 11-7 della Federal Reserve ha rappresentato una sorta di costituzione non scritta del model risk management moderno. Nato nel 2011, in un’epoca in cui “modello” significava soprattutto scorecard creditizie, VAR bancari e forecasting statistico relativamente stabile, il documento assumeva implicitamente che i modelli fossero sistemi prevedibili, statici e verificabili con cicli periodici di validazione. Un paradigma quasi rassicurante, figlio di un’industria finanziaria ancora convinta che il rischio potesse essere contenuto dentro spreadsheet sofisticati e qualche audit trimestrale.
L’uscita della nuova guidance SR 26-2, pubblicata ad aprile dalla Federal Reserve, segna invece un cambio di tono molto più profondo di quanto sembri. Non tanto per ciò che introduce, ma per quello che lascia deliberatamente fuori. Generative AI, agentic systems e foundation models vengono sostanzialmente trattati come oggetti ancora troppo instabili per essere realmente normati. Tradotto dal linguaggio regolatorio al linguaggio operativo: il sistema bancario sta entrando ufficialmente in una zona grigia dove l’innovazione corre più veloce della supervisione.
Ed è qui che il tema diventa strategico, non solo compliance. SR 26-2 abbandona progressivamente l’approccio prescrittivo tipico di SR 11-7 per spostarsi verso una supervisione principles-based e outcomes-focused. Una differenza apparentemente semantica che, nella pratica, cambia tutto. Significa che il regolatore non pretende più di definire ogni controllo tecnico ex ante; pretende invece che l’istituzione dimostri di comprendere realmente il comportamento del sistema, i suoi impatti e la governance lungo l’intero ciclo di vita del modello.
Il problema è che i moderni sistemi AI non hanno più un vero “ciclo di vita” lineare. Hanno drift continuo, emergent behaviors, dipendenze da dati esterni, orchestrazioni multi-agent e capacità evolutive che sfuggono alle logiche tradizionali di validazione. Una banca può validare un modello oggi e ritrovarsi fra tre settimane con un comportamento operativo diverso a causa di retraining impliciti, cambi di contesto o integrazioni API apparentemente marginali. Nel mondo dell’AI generativa, il concetto stesso di “versione stabile” inizia a sembrare un reperto archeologico della governance enterprise anni Duemila.
Molti board continuano però a ragionare come se bastasse aggiornare qualche policy PDF e aggiungere un comitato etico trimestrale. È una reazione comprensibile; le grandi organizzazioni finanziarie sono costruite per minimizzare volatilità operativa, non per convivere con sistemi probabilistici che producono output non deterministici. Ma il debito tecnico accumulato sta diventando enorme. Non solo infrastrutturale, soprattutto cognitivo e organizzativo.
La parte più interessante della nuova guidance è quasi invisibile. SR 26-2 riconosce implicitamente che il rischio modello non può più essere confinato dentro il perimetro della funzione di model validation. Serve monitoraggio continuo, telemetry-driven governance, osservabilità comportamentale e capacità di escalation quasi in tempo reale. In altre parole, il model risk management si sta trasformando lentamente in una disciplina di operational resilience distribuita.
Il settore finanziario, però, si trova in una posizione paradossale. Da un lato le banche stanno accelerando deployment AI per customer service, antifraud, underwriting e automazione documentale; dall’altro i framework di controllo restano ancorati a logiche pensate per modelli statici. È come installare un motore di Formula 1 su un’infrastruttura progettata per locomotive industriali. Funziona, fino a quando non smette improvvisamente di funzionare.
La Silicon Valley, nel frattempo, continua a vendere la narrativa dell’AI “self-improving” come inevitabile evoluzione tecnologica. Una narrativa seducente, soprattutto nei boardroom dove ogni CEO teme di apparire in ritardo rispetto ai concorrenti. Ma dal punto di vista regolatorio questa promessa è quasi tossica, perché un sistema che evolve autonomamente rende molto più difficile attribuire accountability. Chi è responsabile di un errore emergente prodotto da una catena di agenti orchestrati dinamicamente? Il vendor? La banca? Il team MLOps? Il consiglio di amministrazione? Per ora, la risposta reale sembra essere: nessuno lo sa davvero.
Il rischio sistemico aumenta ogni giorno in cui governance e deployment crescono a velocità diverse. Non è un problema teorico. Le istituzioni finanziarie stanno già affrontando scenari in cui modelli generativi vengono integrati in workflow critici senza piena comprensione dei failure modes. Hallucination risk, prompt injection, data leakage e behavioral unpredictability non sono più problemi da laboratorio accademico; stanno entrando nei processi operativi reali.
Qui emerge un dettaglio raramente discusso apertamente: SR 26-2 potrebbe essere interpretato anche come una forma di prudenza strategica da parte della Federal Reserve. Regolare esplicitamente l’AI generativa oggi significherebbe cristallizzare requisiti destinati probabilmente a diventare obsoleti in pochi trimestri. Il regolatore sembra aver scelto una posizione attendista, lasciando che il mercato sperimenti mentre prepara, probabilmente, future enforcement actions molto più aggressive.
Storicamente funziona spesso così. Prima arriva la fase narrativa, poi quella dell’adozione caotica, infine la repressione regolatoria dopo il primo incidente sistemico serio. La finanza conosce bene questo schema; basta ricordare i derivati pre-2008 o il trading algoritmico nei primi anni Duemiladieci. L’AI generativa potrebbe seguire una traiettoria sorprendentemente simile, con una differenza sostanziale: questa volta la velocità evolutiva è esponenziale.
Le aziende che oggi continuano a basarsi esclusivamente su validation cycle periodici stanno essenzialmente operando al buio. Non perché i team di risk management siano incompetenti, ma perché il paradigma operativo è diventato insufficiente. La supervisione moderna richiede continuous assurance, synthetic testing, adversarial simulation e capacità di monitoraggio persistente. Richiede anche una cultura tecnica molto più sofisticata nei livelli executive, aspetto che molte organizzazioni continuano a sottovalutare.
Un consiglio di amministrazione che non comprende realmente come funziona un foundation model oggi equivale, in termini strategici, a un board bancario del 1999 incapace di capire Internet banking. La differenza è che questa volta il rischio non riguarda solo il business model; riguarda direttamente compliance, reputazione e stabilità operativa.
Il mercato, come spesso accade, sta anticipando il regolatore. Cresce rapidamente la domanda di AI governance platforms, runtime monitoring systems e AI observability stack. Nuove categorie software stanno emergendo quasi esclusivamente per colmare il vuoto lasciato dai framework regolatori tradizionali. Non è necessariamente un segnale rassicurante. Talvolta la proliferazione di tooling governance è semplicemente il sintomo di un ecosistema che sta perdendo controllo sulla propria complessità.
Nel frattempo, molti executive continuano a ripetere che “l’AI aumenterà produttività e ridurrà costi”. Probabilmente vero nel breve periodo. Ma ogni accelerazione tecnologica introduce inevitabilmente nuove superfici di rischio. La vera domanda non è più se implementare AI, ma se le istituzioni abbiano davvero sviluppato la maturità operativa necessaria per governarla.
SR 26-2, letto attentamente, sembra suggerire una verità piuttosto scomoda: il regolatore sa perfettamente che gli strumenti tradizionali non bastano più. E quando un regolatore ammette implicitamente di essere in ritardo rispetto alla tecnologia, il mercato dovrebbe iniziare a preoccuparsi seriamente.
Guidance: https://www.federalreserve.gov/supervisionreg/srletters/SR2602.htm