3653 Letture

Wikidata, tutti i dati del mondo in un unico archivio

Creare un database di conoscenze che possa essere usato, vale a dire letto e modificato, sia dagli umani sia dalle macchine: è questo, in sintesi estrema, l'ambizioso obiettivo che si cela dietro il progetto Wikidata.

Iniziativa nata in seno a Wikimedia Foundation, fondazione senza scopo di lucro ideata dal creatore dell'enciclopedia collaborativa Wikipedia, le fondamenta di Wikidata sono state poste lo scorso febbraio in occasione della Semantic Tech & Business Conference di Berlino. L'elaborazione del progetto, stando a quanto si legge sul sito ufficiale, è poi iniziata nel mese di aprile con la presentazione di una proposta tecnica.
Oggetto di sviluppo è un database semantico, leggibile anche dalle macchine, che dovrebbe consentire, tra l'altro, di creare una sorta di allineamento tra tutte le versioni localizzate di Wikipedia, rendendo disponibili per ciascuna (si parla di 280 lingue supportate) le stesse informazioni di base, riducendo nettamente le differenze oggi esistenti tra le versioni inglese, tedesca, francese e olandese e le altre.


Stando alle definizioni di partenza, Wikidata sarà libero (i dati saranno utilizzabili in scenari differenti), collaborativo, grazie al contributo degli editor che si occuperanno dell'inserimento dei dati e della maintenance, multilingue. Conterrà non solo i dati ma anche le loro fonti, a supporto del criterio di verificabilità. I dati saranno raccolti in forma strutturata, cosa che ne faciliterà il riuso e la comprensione da anche da parte dei computer.
Consentirà peraltro agli utenti, di formulare domande specifiche (ad esempio quale tra le capitali d’Europa ha l’università più antica), andando ben oltre l’offerta attuale di Wikipedia, che si basa su liste create dagli stessi utenti.

Il progetto Wikidata è guidato dal capitolo tedesco di Wikimedia, mentre lo sviluppo è supportato da una donazione dell’Allen Institute for Artificial Intelligence, dalla Gordon and Betty Moore Foundation e da Google.


Quanto alla tabella di marcia, queste settimane sono quelle di primo ingaggio della comunità dei contributor per lo sviluppo del progetto, mentre le modalità di inserimento e consultazione dei dati disponibili per le infobox dovrebbero essere rese pubbliche entro la fine dell’anno, con l’obiettivo di chiudere la prima parte dello sviluppo del progetto entro il mese di marzo del prossimo anno.
Più pragmaticamente, il progetto si articola in tre fasi.
La prima, attualmente in corso, punta alla creazione di una pagina Wikidata per ciascuna voce di Wikipedia, in tutte le 280 lingue supportate. Questo significa che ogni pagina viene tradotta in dati strutturati utilizzabili in tutti gli articoli, a prescindere dalla lingua nella quale sono redatti. Questa prima fase si chiuderà in agosto.
La seconda fase abiliterà gli editor ad aggiungere e utilizzare i dati e si chiuderà a dicembre, mentre la terza fase consentirà la creazione automatica di liste e chart che andranno a popolare Wikipedia.
I dati verranno presentati in box informativi, le infobox, collocate a destra sulla pagina di Wikipedia.

Wikidata, tutti i dati del mondo in un unico archivio - IlSoftware.it