![]() | |
![]() | |
URL | http://dbpedia.org/ |
---|---|
Tipus | Web semàntica |
Comerç ? | No |
Llengua | 111 idiomes |
Llicència | CC-BY-SA 3.0 iGFDL |
Llenguatge de programació | Java iScala![]() |
Part de | web semàntic![]() |
Propietari | Universitat de Leipzig iUniversitat de Mannheim![]() |
Creador | Universitat de Leipzig,Universitat de Mannheim iHasso Plattner Institute(en)![]() ![]() |
Llançament | 10 gener 2007![]() |
Rànquing Alexa | 102.111 (29 novembre 2017) 53.988 (13 desembre 2021) ![]() |
![]() ![]() ![]() ![]() |
DBpedia és un projecte, l'objectiu del qual és l'extracció automàtica de dades i contingut a partir de la informació creada des del projecteViquipèdia. Aquesta informació estructurada s'entrellaça amb altres bases de coneixement i es fa disponible a laWorld Wide Web.[1][2]
Aquest projecte va ser iniciat per investigadors de laUniversitat Lliure de Berlín i laUniversitat de Leipzig, en col·laboració ambOpenLink Software.[3]DBpedia permet als usuaris efectuar consultes semàntiques amb relacions i propietats associades als recursos enViquipèdia, incloent-hi enllaços a altres bases de dades relacionades.[4] El primer conjunt de dades a disposició del públic va ser publicat el2007. Està disponible mitjançant llicències lliures, permetent a altres poder tornar a utilitzar el conjunt de dades.DBpedia s'actualitza aproximadament un cop a l'any.[3]
DBpedia es crea a partir de la informació extreta de forma automàtica estructurada-continguda enViquipèdia. I aquesta, al seu torn, es troba interconnectada a altres conjunts de dades com, per exemple,Freebase,OpenCyc,UMBEL,GeoNames,Musicbrainz,CIA World Factbook,DBLP,Projecte Gutenberg,Dbtune Jamendo,Eurostat,UniProt, iBio2RDF.20.DBpedia s'utilitza àmpliament en la comunitat d'investigació deweb semàntica, però també és utilitzada en entorns comercials. Així, empreses com laBBC i elNew York Times l'utilitzen per a organitzar el seu contingut.[3][5] La possibilitat d'interconnexió de DBpedia amb altres conjunts de dades obertes a la web podria servir com a nucli per a una web de dades oberta emergent.[4]
Viquipèdia s'ha convertit en una de les fonts de coneixement centrals de la humanitat, mantinguda per milers de col·laboradors. El projecteDBpedia aprofita aquesta gegantina font de coneixement mitjançant l'extracció d'informació estructurada de Viquipèdia fent-la accessible a la web. Els articles de Viquipèdia consisteixen sobretot en text lliure, però, també inclouen informació estructurada incrustada en els articles, com ara "infotaules", informació decategorització,imatges,coordenades geogràfiques ienllaços a pàgines web externes. Aquesta informació estructurada s'extreu i es col·loca en un conjunt de dades uniforme que es pot consultar.[2]
El contingut de la base de dades està disponible sota llicènciaCC-BY-SA 3.0 iGFDL, doncs, es basa en informació extreta deViquipèdia. Aquesta extracció de coneixement estructurat deViquipèdia, lliurement disponible a la web utilitzant tecnologies de Linked Data Web Semàntica, ésmultilingüe, amb 111 edicions diferents de Viquipèdia, tot i que la base més gran de coneixement s'extreu de l'edició de la versió anglesa.[6]
El juny de 2010 els investigadors delGrup de Sistemes basats en Web a laUniversitat Lliure de Berlín van iniciar un projecte anomenatDBpedia Spotlight, per anotar les mencions dels recursosDBpedia en el text. Això proporciona una solució per vincular les fonts d'informació no estructurada al núvol amb dades obertes enllaçades a travésDBpedia.DBpedia Spotlight realitza una extracció d'entitats, incloent-hi la detecció i resolució de noms importants (desambiguació). També es pot utilitzar per a reconeixement d'entitats, entre altres tasques d'extracció d'informació.[7]