C’è qualcosa di profondamente ironico nel fatto che mentre la Silicon Valley affonda miliardi in GPU e compute come se fossero patatine da sgranocchiare a un board meeting, il vero game-changer oggi non è l’hardware, ma il dataset. Non il modello, non il prompt engineering, non la nuova architettura fancy a 87 miliardi di parametri. No, il protagonista silenzioso della nuova corsa all’intelligenza artificiale si chiama FineWeb2. E se non ne hai ancora sentito parlare, o peggio lo hai ignorato pensando sia l’ennesimo corpus estratto da Common Crawl, allora sei già in ritardo.