BabelNet | |
---|---|
Versão estável | BabelNet 2.5(Maio 2014) |
Sistema operacional | Virtuoso Universal Server |
Gênero(s) | |
Página oficial | babelnet |
BabelNet é umarede semântica e umaontologia lexicalizada emultilíngua.[1][2] A BabelNet foi criada automaticamente através da vinculação da maior enciclopédia multilíngua do mundo, aWikipédia, e a mais popular rede lexical em língua inglesa, aWordNet. Esta integração foi feita através do mapeamento e do preenchimento automáticos das entradas lexicalizadas inexistentes, em línguas que não possuem recursos computacionais disponíveis, com a ajuda de métodos de tradução automática estatística. O resultado é um "dicionário enciclopédico" que provê conceitos eentidades mencionadas lexicalizadas em várias línguas e conectadas com grandes quantidades de relações semânticas. Analogamente àWordNet, a BabelNet agrupa palavras de diferentes línguas em conjuntos desinônimos, chamadosBabel synsets. Para cadaBabel synset, a BabelNet prevê definições curtas ouglosas, em várias línguas diferentes, obtidas através do processamento automático daWordNet e daWikipédia.
Até outubro de 2013, a BabelNet (versão 2.0) está disponível em 50 línguas, incluindo todas as línguas europeias, a maioria das línguas asiáticas e também o Latim. BabelNet 2.0 contém mais de 9 milhões deBabel synsets e cerca de 50 milhões de significados de palavras, incluindo todas as línguas. CadaBabel synset possui em média 5,5 sinônimos (i.e. significados). Arede semântica inclui todas as relações léxico-semânticas da WordNet (hiperonímia e hiponímia,holonímia e meronímia,sinonímia eantonímia, etc.), totalizando cerca de 364,000 relações, assim como relações de proximidade subespecificadas da Wikipédia, totalizando cerca de 262 milhões de relações.[1] A versão 2.0 associa ainda 7,7 milhões de imagens aosBabel synsets e provê codificação no formatoLemon RDF.
A BabelNet tem sido usada de forma a integrar aplicações multilíngua deProcessamento de Linguagem Natural. Oconhecimento lexicalizado disponível na BabelNet tem permitido a obtenção de resultados deestado da arte nas áreas deparentesco semântico[3] edesambiguação multilíngua.[4]