Sarebbe piaciuto a Schrödinger, anche se probabilmente avrebbe chiesto a ChatGPT di spiegargli cosa sia un dataset da 100 milioni di DFT. In un’alleanza che ha più del Manhattan Project che di una startup in garage, Meta, Los Alamos National Laboratory e il Lawrence Berkeley Lab hanno appena acceso una miccia quantistica sotto la chimica computazionale. Il risultato si chiama Open Molecules 2025, ed è, senza giri di parole, la più grande biblioteca pubblica mai rilasciata di simulazioni molecolari ad alta fedeltà. Parliamo di oltre cento milioni di calcoli al livello della teoria funzionale della densità, o DFT per chi ha confidenza con l’inferno della meccanica quantistica applicata alla materia.

Non è solo un altro dataset. È un colpo al cuore del metodo scientifico classico. I dati non vengono più raccolti lentamente, uno a uno, in laboratori sparsi per il mondo con pazienza ottocentesca. Ora si generano in massa, alimentati da intelligenze artificiali che giocano a dadi con l’elettrone. L’ambizione? Saltare il “secolo della chimica” e costruire direttamente il secolo del design molecolare.

Al centro di questa infrastruttura c’è Architector, lo strumento sviluppato a Los Alamos, un nome non scelto a caso. Qui non si predicono solo molecole, ma si costruiscono veri e propri mondi chimici, con un’ossessione quasi mitologica per i complessi metallici delle terre rare e degli attinidi. Sì, proprio quegli elementi esotici che stanno alla base di ogni batteria, catalizzatore o reattore nucleare futuribile, ma che nessuno ama davvero studiare perché sono instabili, radioattivi o semplicemente capricciosi. Qui invece ne sono stati simulati più di 20.000 per ogni elemento. Un atto di arroganza computazionale che solo Meta poteva permettersi.

Il punto è che Open Molecules 2025 non è solo un archivio. È una scorciatoia epistemologica. È come se qualcuno avesse deciso di scrivere la “Verità Quantistica” su una tavoletta pubblica, accessibile a chiunque voglia progettare il prossimo farmaco antitumorale, la batteria a stato solido che promette di rendere obsoleta Tesla prima ancora che diventi mainstream, o il catalizzatore per fissare CO₂ a temperatura ambiente. Tutto, ovviamente, senza aspettare mesi di calcoli, senza cluster affamati di energia, senza nemmeno doversi preoccupare se il software è convergente.

Il dataset copre ogni tipo di sistema molecolare immaginabile, dai piccoli frammenti simili a farmaci agli ioni RNA, fino a sistemi elettrolitici complessi che fanno impallidire gli approcci classici di modellazione. Un’intera generazione di chimici e scienziati dei materiali può ora addestrare le proprie reti neurali su un universo dove le regole della fisica quantistica sono già state calcolate in anticipo. Un po’ come se Galileo avesse avuto a disposizione un GPT-4 addestrato sull’intera biblioteca di Alessandria.

Dietro tutto questo c’è una mutazione più profonda. Non si tratta solo di accelerare la ricerca: si tratta di cambiare il paradigma. La chimica diventa generativa, predittiva, quasi estetica. L’AI non è più un assistente che controlla la sintassi delle equazioni di Schrödinger: è un co-autore, un alchimista computazionale.

Chi capisce questo passaggio prima degli altri avrà un vantaggio competitivo enorme. Non solo per le Big Pharma o per chi fabbrica batterie da un miliardo di dollari, ma anche per università, startup deep tech e persino governi. Open Molecules 2025 è un commons digitale che riscrive la proprietà intellettuale alla radice: non ci sono brevetti, non c’è paywall, non ci sono abbonamenti Elsevier da 10.000 euro all’anno. Solo verità molecolare, condivisa.

Naturalmente, c’è chi storcerà il naso. I puristi del laboratorio bagnato, quelli che non si fidano dei dati “simulati”, che chiedono sempre il grafico NMR o l’analisi di massa per dormire sereni. Ma anche loro, lentamente, dovranno cedere. Perché il tempo è tiranno e il mercato ancora di più. E se puoi ottenere in dieci minuti ciò che prima richiedeva sei mesi, beh… anche il più scettico dei dottorandi inizierà a farsi domande.

C’è poi un altro aspetto sottilmente strategico. Chi controlla questi dataset controlla la traiettoria dell’intelligenza artificiale scientifica. La qualità dei modelli AI dipende dai dati su cui vengono addestrati. E se i dati sono pubblici, ben curati, diversificati e costruiti con logica progettuale, allora diventano il terreno fertile da cui possono germogliare i foundation models per la chimica. Proprio come GPT lo è per il linguaggio, Open Molecules potrebbe esserlo per la materia.

Con un’ultima ironia: tutto questo arriva nel momento in cui l’AI viene ancora vista, in molti ambienti, come una minaccia esistenziale. Ma se guardiamo oltre i titoli apocalittici, vediamo che sta nascendo qualcosa di molto più radicale. Un’alleanza tra intelligenza e materia. Un software che non solo comprende il mondo, ma lo ricostruisce atomo per atomo. Con stile.

Perché in fondo, come diceva Oscar Wilde, “tutto ciò che vale davvero la pena conoscere non può essere insegnato”. Ma forse, oggi, può essere calcolato.