Attribuire una pagina medievale a uno specifico copista è uno di quei problemi che sembrano banali soltanto a chi non li ha mai affrontati davvero. Dall’esterno, l’idea appare quasi romantica: osservare lettere antiche, confrontare tratti grafici, riconoscere la “mano” di uno scriba come si riconoscerebbe la firma di un artista. La realtà è molto meno cinematografica e molto più brutale. I copisti medievali lavoravano dentro sistemi calligrafici rigidissimi; la standardizzazione non era un difetto, era il requisito del mestiere. Uniformità, disciplina, ripetizione. In molti scriptoria europei, distinguere due mani diverse equivale quasi a cercare differenze microscopiche tra due processi industriali apparentemente identici.
È qui che l’Intelligenza Artificiale smette di essere marketing da conferenza fintech e torna finalmente a fare ciò che dovrebbe fare: estrarre segnali deboli da dataset complessi. La ricerca “Towards High-level Explanations of Medieval Handwriting Identification Systems”, sviluppata grazie alla collaborazione tra il gruppo di ricerca di Basi di Dati e Big Data dell’Università Roma Tre e Seeweb, rappresenta uno dei casi più interessanti di convergenza tra AI, infrastrutture cloud e patrimonio culturale europeo. Non perché l’algoritmo “sostituisca” il paleografo, slogan ormai stanco quanto i keynote sulla “rivoluzione AI”, ma perché modifica radicalmente il rapporto tra analisi umanistica e sistemi computazionali.
Il punto centrale del progetto non è nemmeno l’accuratezza, che pure supera stabilmente l’80% nei test condotti su manoscritti conservati presso la Biblioteca Apostolica Vaticana. Il vero nodo è epistemologico: possiamo fidarci di un modello che prende decisioni corrette senza sapere come ci arriva? La Silicon Valley, negli ultimi cinque anni, ha sostanzialmente risposto “sì”, spesso con l’entusiasmo tipico di chi considera la trasparenza un dettaglio burocratico. Le discipline storiche, fortunatamente, hanno standard culturali leggermente più severi.
Dal punto di vista tecnico, il problema viene formulato come una classica attività di classificazione. Le immagini delle pagine vengono suddivise in crop sovrapposti; ogni porzione viene analizzata singolarmente e la classificazione finale emerge tramite majority vote. La ricerca utilizza due architetture molto differenti tra loro: ResNet-18, basata su reti convoluzionali e pre-addestramento self-supervised, e Swin Transformer Tiny, erede diretto della trasformazione culturale introdotta dai Transformer nella computer vision. In altre parole, modelli nati per analizzare immagini contemporanee vengono riadattati per leggere tracce grafiche di otto secoli fa. Se qualcuno avesse raccontato questo scenario a un archivista del Novecento, probabilmente avrebbe ottenuto uno sguardo di compatimento o una richiesta urgente di ridurre il vino durante i convegni.
La difficoltà reale emerge però nei dettagli materiali del manoscritto. Pergamene deteriorate, inchiostri sbiaditi, compressioni digitali non uniformi, fotografie storiche di qualità mediocre. Tutto ciò introduce rumore visivo in quantità enorme. A differenza delle immagini patinate usate nei benchmark accademici, i documenti medievali non sono dataset puliti progettati per piacere ai paper di computer vision. Sono oggetti storici sopravvissuti a incendi, umidità, restauri e secoli di manipolazione fisica. Il fatto che modelli contemporanei riescano comunque a estrarre pattern utili è tecnicamente notevole.
La parte più interessante dello studio riguarda però l’Explainable AI, la cosiddetta XAI. Negli ultimi anni questa espressione è stata usata spesso come accessorio retorico per rassicurare investitori e regolatori; qui invece assume un significato operativo reale. Il modello non deve limitarsi a dire “questo scriba è il numero 4”. Deve spiegare perché. Deve mostrare quali aree della pagina considera decisive, quali curvature delle lettere, quali legature, quali spaziature. Deve produrre mappe visive interpretabili anche dagli studiosi umanisti.
È un cambio culturale enorme. Per decenni l’informatica ha chiesto agli esperti di dominio di adattarsi alle macchine. Ora, almeno in alcuni progetti maturi, sta accadendo il contrario: il sistema AI viene costretto a rendere conto delle proprie decisioni in un linguaggio leggibile dagli umani. Una differenza apparentemente sottile, ma strategicamente gigantesca.
La verifica della fedeltà delle spiegazioni rappresenta forse l’elemento più sofisticato dell’intera ricerca. I ricercatori rimuovono progressivamente le aree considerate rilevanti dal modello e osservano il calo delle performance. Quando l’accuratezza precipita, emerge un dato fondamentale: le spiegazioni non sono decorazioni grafiche create per impressionare nei PDF accademici; riflettono davvero il processo decisionale interno del sistema. Nel mondo AI contemporaneo, dove molte visualizzazioni interpretative hanno lo stesso rigore scientifico di un oroscopo motivazionale su LinkedIn, questa distinzione conta enormemente.
Dietro il progetto esiste poi un altro tema che il settore tecnologico tende sistematicamente a sottovalutare: l’infrastruttura. Addestrare modelli di Deep Learning su dataset storici complessi richiede potenza computazionale, storage, pipeline di elaborazione e stabilità operativa. La collaborazione con Università Roma Tre e Seeweb dimostra qualcosa che molte aziende europee stanno finalmente comprendendo: senza cloud ad alte prestazioni, l’AI resta spesso una demo elegante destinata a morire dentro un laboratorio universitario.
L’aspetto più interessante, osservato da una prospettiva industriale, è che questi sistemi stanno trasformando anche la natura delle humanities digitali. Per anni il settore è stato percepito come un territorio marginale, quasi decorativo rispetto alle “vere” applicazioni AI dedicate a finanza, advertising o automazione industriale. Oggi invece le collezioni storiche diventano ambienti computazionali ad alta complessità. I manoscritti medievali si trasformano in dataset. Le biblioteche diventano infrastrutture informative. I paleografi iniziano a dialogare con modelli neurali e metriche di explainability.
Paradossalmente, proprio i documenti più antichi stanno imponendo all’Intelligenza Artificiale una lezione di trasparenza che molte piattaforme contemporanee continuano a evitare. Quando un algoritmo analizza un manoscritto del XIII secolo conservato in Vaticano, non basta che abbia ragione. Deve dimostrare di averla. Ed è probabilmente una delle richieste più intelligenti che la cultura umanistica abbia rivolto finora al mondo dell’AI.