Il prossimo passo avanti per l’intelligenza artificiale? Non viene da qualche costoso laboratorio di Silicon Valley, ma da uno dei pochi angoli ancora decenti di internet: Wikipedia. O meglio, dalla sua sorella minore e iper-organizzata, Wikidata.
Mentre voi umani continuate a leggere le voci di Wikipedia, un esercito di volontari ha passato gli ultimi anni a strutturare meticolosamente 19 milioni di voci, da Douglas Adams all’ultimo fungo sconosciuto, in un formato che i computer possono digerire. Peccato che i computer, si sa, siano un po’ tardi: per capire le cose hanno bisogno che gli si spieghi tutto in “vettori”, una sorta di mappa concettuale per macchine.
E così i buontemponi di Wikimedia Deutschland hanno pensato: “Perché non fare loro il lavoro?” Hanno preso tutta Wikidata e l’hanno trasformata in questo database di vettori. Il risultato?
Per gli umani: Nulla. Wikipedia non si trasformerà in un chatbot. Potrete continuare a leggere placidamente, ignari della magia che succede dietro le quinte.
Per l’AI: Un banchetto gratis. Ora, se uno sviluppatore squattrinato vuole costruire un chatbot che sappia finalmente distinguere tra Douglas Adams e un pesce rosso, può attingere a questo database senza dover vendere l’anima a OpenAI per avere i fondi necessari a farsi il proprio.
L’obiettivo dichiarato è “livellare il campo di gioco”. In pratica, dare una chance alla “Piccola Tech” contro i colossi che hanno già tutti i dati e i soldi. Una cosa commovente, quasi.
Il lato potenzialmente utile? Invece di addestrare l’AI sulle idiozie che girano in internet, forse potremo avere sistemi che conoscono anche argomenti di nicchia che non trendano sui social. Immaginate: un ChatGPT che non vi parla solo delle ultime celebrity, ma che sa anche cosa sia il “Trillian”, e non perché è un personaggio di Guida Galattica, ma perché è un software per la radioastronomia.
Progetto Ufficiale | Wikimedia Deutschland | Link | Pagina ufficiale del progetto “Wikipedia Embeddings”. |
Piattaforma | Wikidata | Link | Il database di conoscenza libera al centro del progetto. |
Risorsa Tecnica | Wikidata Query Service | Link | Strumento per interrogare i dati strutturati (SPARQL). |
Fornitore AI | Jina AI | Link | L’azienda che ha fornito il modello per creare gli embedding vettoriali. |
Infrastruttura | DataStax | Link | Fornisce l’infrastruttura gratuita per il database vettoriale. |
Caso d’Uso | Govdirectory | Link | Esempio pratico di un servizio che utilizza i dati di Wikidata. |
Esempio Pratico | Voce Douglas Adams | Link | Esempio concreto di una scheda dati su Wikidata. |
Approfondimento | Embedding Vettoriale | Link | Spiega il concetto tecnico alla base del progetto. |