OWikidata é um projeto daFundação Wikimedia que visa fornecer umabase de dados editada colaborativamente para oferecer suporte para projetos tais como aWikipédia. O Wikidata foi lançado em 30 de outubro de 2012.[2][3] O projeto foi iniciado pela Wikimedia Deutschland e pretender fornecer uma origem comum de certos tipos de dados, como por exemplo, datas de nascimento, uma classe de dados validados, que possa ser utilizada pelos projetos da Wikimedia operando de forma similar ao funcionamento doWikimedia Commons para imagens e outros tipos de mídia.[2][4] Este foi o primeiro novo projeto daWikimedia Foundation desde 2006.[5]
Em dezembro de 2015, de acordo com as estatísticas da Wikimedia, metade das informações no Wikidata não tinha fontes. Outros 30% são marcados como provenientes da Wikipedia.[8]
↑«Data Revolution for Wikipedia». Wikimedia Deutschland. 30 de março de 2012. Consultado em 11 de setembro de 2012. Arquivado dooriginal em 11 de setembro de 2012
Este diagrama mostra os termos mais importantes usados no Wikidata.
O Wikidata é umbanco de dados orientado a documentos, com foco emitens que representam qualquer tipo de tópico, conceito ou objeto. Cada item recebe umidentificador persistente único chamado de seuQID, um número inteiro positivo prefixado com a letra maiúscula "Q"[a]. Com isso, é possível fazer traduções das informações básicas que descrevem o tópico que cada item abrange, sem privilegiar nenhum idioma específico.
Os rótulos dos itens não precisam ser exclusivos. Por exemplo, existem dois itens chamados "Elvis Presley":Elvis Presley(Q303), que representao cantor e ator americano, eElvis Presley(Q610926), que representa seuálbum homônimo. No entanto, a combinação de um rótulo e suadescrição deve ser exclusiva. Para evitar ambiguidade, o QID de um item é vinculado a essa combinação.
Declarações são como qualquer informação conhecida sobre um item é registrada no Wikidata. Formalmente, elas consistem em pares chave-valor, que correspondem a umapropriedade (como "autor" ou "data de publicação") com um ou maisvalores de entidade (como "Sir Arthur Conan Doyle " ou "1902"). Por exemplo, a declaração informal em inglês "milk is white" (leite é branco, em tradução livre) seria codificada por uma declaração que emparelha a propriedadecor(P462) com o valorbranco(Q23444) sob o itemleite(Q8495).
As declarações podem mapear uma propriedade para mais de um valor. Por exemplo, a propriedade "ocupação" deMarie Curie poderia ser vinculada aos valores "física" e "química", para refletir o fato de que ela se dedicava a ambas as ocupações.[2]
Os valores podem assumir vários tipos, incluindo outros itens do Wikidata, strings, números ou arquivos de mídia. As propriedades prescrevem com quais tipos de valores eles podem ser pareados. Por exemplo, a propriedadesítio oficial(P856) só pode ser pareada com valores do tipo "URL".[3]
De forma opcional,qualificadores podem ser usados para refinar o significado de uma declaração, fornecendo informações adicionais. A título de ilustração, uma declaração "população" pode ser modificada com um qualificador como "ponto no tempo (P585): 2011" (como seu próprio par chave-valor). Os valores nas declarações também podem ser anotados comreferências, apontando para uma fonte que respalde o conteúdo da declaração.[4] Assim como nas declarações, todos os qualificadores e referências são pares propriedade-valor.
Exemplo de uma declaração simples que consiste em um par propriedade-valor
Cada propriedade possui um identificador numérico prefixado com P maiúsculo e uma página no Wikidata com rótulo, descrição, aliases e instruções opcionais. Assim, existem propriedades com o único propósito de descrever outras propriedades, comosubpropriedade de(P1647).
Propriedades também podem definir regras mais complexas sobre seu uso pretendido, denominadasrestrições. Por exemplo, a propriedadecapital(P36) inclui uma "restrição de valor único", refletindo a realidade de que (tipicamente) territórios possuem apenas uma capital. Restrições são tratadas como alertas e dicas de teste, em vez de regras invioláveis.[5]
Para uma a criação de uma nova propriedade, é necessário um processo de discussão entre a comunidade.[6][7]
Das atuais propriedades, a mais usada écita(P2860), que é usada em mais de 290.000.000 de páginas de itens Desde novembro de 2023 (2023 -11)[update].[8]
Emlinguística, umlexema é uma unidade de significado lexical que representa um grupo de palavras que compartilham o mesmo significado central e características gramaticais.[9][10] Da mesma forma,os lexemas do Wikidata são itens com uma estrutura que os torna mais adequados para armazenar dadoslexicográficos. Desde 2016, o Wikidata oferece suporte a entradas lexicográficas na forma de lexemas.[11]
No Wikidata, as entradas lexicográficas têm um identificador diferente das entradas de itens regulares. Essas entradas são prefixadas com a letra L, como nas entradas de exemplo paralivro evaca. As entradas lexicográficas no Wikidata podem conter declarações, sentidos e formas.[12] O uso de entradas lexicográficas no Wikidata permite a documentação do uso de palavras, a conexão entre palavras e itens no Wikidata, traduções de palavras e ativa dados lexicográficos legíveis por máquina.
Em 2020, as entradas lexicográficas no Wikidata ultrapassaram 250.000. O idioma com mais entradas lexicográficas foi orusso, com 101.137 lexemas, seguido peloinglês, com 38.122 lexemas. Existem mais de 668 idiomas com entradas lexicográficas no Wikidata.[13]
Janeiro de 2019 marcou o início do desenvolvimento de uma nova extensão para o MediaWiki, para permitir o armazenamento de ShEx em um namespace separado.[17][18] Os esquemas de entidade são armazenados com identificadores diferentes daqueles usados para itens, propriedades e lexemas. Os esquemas de entidade são armazenados com um identificador "E", comoE10 para o esquema de entidade de instâncias de dados humanos eE270 para o esquema de entidade de instâncias de dados de construção. Esta extensão foi instalada no Wikidata[19] e permite que os contribuidores usem ShEx para validar e descrever dados do Resource Description Framework em itens e lexemas. Qualquer item ou lexema no Wikidata pode ser validado em relação a um esquema de entidade, e isso o torna uma ferramenta importante para garantia de qualidade.
↑«Help:Statements – Wikidata».www.wikidata.org. Consultado em20 February 2019. Arquivado dooriginal em 25 March 2019Verifique data em:|acessodata=, |arquivodata= (ajuda)
↑«Help:Data type – Wikidata».www.wikidata.org. Consultado em20 February 2019. Arquivado dooriginal em 23 March 2019Verifique data em:|acessodata=, |arquivodata= (ajuda)
↑«Help:Sources – Wikidata».www.wikidata.org. Consultado em20 February 2019. Arquivado dooriginal em 17 April 2019Verifique data em:|acessodata=, |arquivodata= (ajuda)
↑Nielsen, Finn (May 2020). Ionov, Maxim; McCrae, John P.; Chiarcos, Christian; Declerck, Thierry; Bosque-Gil; Gracia, Jorge, eds.«Lexemes in Wikidata: 2020 status». Marseille, France: European Language Resources Association.Proceedings of the 7th Workshop on Linked Data in Linguistics (LDL-2020) (em inglês): 82–86.ISBN979-10-95546-36-8Verifique data em:|data= (ajuda)
↑«Initial empty repository».Gerrit. 15 January 2019. Consultado em12 June 2022. Arquivado dooriginal em 19 March 2022Verifique data em:|acessodata=, |arquivodata=, |data= (ajuda)
↑«Version – Wikidata».Wikidata.org. Consultado em10 September 2021. Arquivado dooriginal em 19 October 2021Verifique data em:|acessodata=, |arquivodata= (ajuda)
Erro de citação: Existem etiquetas<ref> para um grupo chamado "lower-alpha", mas não foi encontrada nenhuma etiqueta<references group="lower-alpha"/> correspondente