SKOS ouSimple Knowledge Organization System (« système simple d'organisation des connaissances ») est une recommandation duW3C publiée le pour représenter desthésaurus documentaire,classifications ou d'autres types de vocabulaires contrôlés ou delangages documentaires. S'appuyant sur le modèle de donnéesRDF, son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre duWeb sémantique.
Le développement de SKOS a impliqué des acteurs à la fois de la communauté RDF et des experts enScience de l'information. SKOS cherche à être le plus compatible possible avec lesstandards tels ceux des thésaurus, monolingues ou multilingues[1].
Les représentations conceptuelles réalisées à l'aide de SKOS peuvent être utilisées par dessystèmes d'information fermés, mais aussi, dans la perspective du Web sémantique, être publiés sur le Web et alignées avec d'autres systèmes d'organisation de connaissances, de façon à rendre ces différents langages plus interopérables.
SKOS a d'abord été un produit du projet SWAD-Europe[2], un projet financé par laCommunauté européenne, dans le cadre du programmeTechnologies de la Société de l'Information[3]. Le projet avait pour but de soutenir l'activitéWeb sémantique duW3C. Les premières publications de « SKOS core » et « SKOS mapping » datent de2003, parmi d'autres livrables concernant par exemple l'encodageRDF desthésaurusmultilingues[4] et les correspondances entrethésaurus[5].
À la fin du projet SWAD-Europe, le travail sur SKOS a été relayé par l'activitéweb sémantique duW3C[6] dans le cadre d'un groupe de travail sur lesbonnes pratiques et le déploiement des standardsRDF[7]. Pendant cette période, l'effort a porté sur la consolidation du noyau de SKOS, et le développement de conseils pratiques pour la migration et la publication de vocabulaires existants dans ce format.
Différents documents de travail ont été publiés pendant cette période dont on peut retrouver trace sur le site officiel de SKOS à la rubrique Historique des travaux du groupe de travail W3C SKOS[8]. Le mandat du groupe de travail a été étendu de mai2006 à avril2008 avec comme objectif d'atteindre le statut de Recommandation W3C[9].
Différentes versions de travail du document de référence ont été publiées entre 2005 et 2008 pour aboutir en, au document ayant statut de recommandation W3C[10]. Un document de travailSKOS Primer[11], est proposé en accompagnement du document de référence.
SKOS définit les classes et propriétés suffisantes à la représentation des thésaurus standards, c'est-à-dire des listes de termes d'un domaine centré sur la présentation des relations linguistiques entre les différents termes de ce domaine. Conformément au point de vue « concept-centrique » du vocabulaire caractéristique de RDF, les objets primitifs ne sont pas destermes linguistiques, mais des concepts abstraits. Les termes les dénotant dans les différents langages deviennent dans ce formalisme des propriétés de ces concepts.
Un « concept SKOS » est ainsi défini comme uneressource RDF, donc identifiée par uneURI.
À chaque concept peuvent être attachés des propriétés RDF :
Les concepts peuvent être regroupés dans des « schémas de concepts » (ou « agrégations de concepts »), qui représentent un thésaurus ou une nomenclature entière. Par ailleurs les schémas de concepts peuvent contenir, outre des concepts, des objets de type « Collection », permettant de regrouper un sous-ensemble de concepts. Les Collections SKOS répondent à deux cas d'usage : la séparation d'un thésaurus en sous-parties (micro-thésaurus), ou la gestion des « facettes » dans un thésaurus.
Les propriétés d'alignement proposées dans SKOS[12] permettent d'exprimer des correspondances (exactes ou approximatives) entre concepts provenant de systèmes d'organisation de connaissances différents.
Les applications gérant des structures de concepts peuvent comparer les concepts et déclarer unerelation d'équivalence entre deux concepts. Le schéma distingue une identité exacteskos:exactMatch (ex. : ex1:personne skos:exactMatch ex2:être humain) ou procheskos:closeMatch. Si la correspondance et la relation sont plus complexes, celles-ci sont exprimables par l'emploi des autres relationsskos:broadMatch,skos:narrowMatch,skos:relatedMatch.
SKOS-XL est un appendice de la recommandation SKOS permettant de décrire les termes comme des ressources à part entière. Là où SKOS seul permet d'exprimer des propriétés et des relations au niveau de concepts abstraits, SKOS-XL permet d'exprimer des assertions et des relations entre termes, du type <FAO> <est l'acronyme de> <Food and Agriculture Organization>. L'utilisation de SKOS-XL reste facultative.
Élémentairement, SKOS est conçu pour décrire une ressource conceptuelle en énumérant les caractéristiques de chacun desconcepts qu'elle comporte : leconcept[13] prend rang de sujet du triplet RDF et est déclaré comme concept par la valeur donnée àrdf:type :skos:Concept, comme dans l'exemple : <http://www.example.com/encyclopédie> rdf:type skos:Concept.
Le concept, une fois caractérisé comme tel, est associé à au moins une chaîne de caractèrelexicale[14] le désignant dans le contexte d'utilisation ; des termes alternatifs (synonymes,cacographie) complètent cette description linguistique (attributs :skos:prefLabel, skos:altLabel et skos:hiddenLabel).
Une fois un concept décrit par ces premiers attributs, il est explicité par ses relations à d'autres concepts à l'aide de la propriétéskos:semanticRelation[15] et ses propriétés dérivées. De la même manière qu'au niveau des attributs précisant les termes, ces propriétés sont particulièrement prévues pour représenter les relations sémantiques au cœur desthésaurus (hiérarchiques avecskos:broader etskos:narrower, et non-hiérarchiques avecskos:related).
Ensuite, la propriétéskos:note[16] et ses dérivées autorisent les compléments d'information rencontrés dans les thésaurus (note d'application, définition, note historique ou éditoriale, etc.).
Deux autres propriétés permettent au besoin comme dans le cas des thésaurus, de décrire et d'organiser l'ensemble des concepts décrits en unestructure de conceptsskos:ConceptScheme[17] caractérisant la ressource comme une structure dont les concepts majeurs seront repérés à l'aide deskos:hasTopConcept.
Descollections de concepts[18] permettent de regrouper des concepts, d'établir des listes (skos:memberList) composés de membres (skos:member), voire de les ordonner (skos:OrderedCollections).
Les vocabulaires SKOS sont conçus pour être intégrés dans des environnements sémantiques utilisant d'autres vocabulaires RDF, comme lelangage d'ontologieOWL. Ce dernier est conçu pour exprimer des structures conceptuelles complexes et riches (ontologies) supportant des fonctions logiques de contrôle de cohérence ou d'inférence. Toutefois, construire des ontologies utiles est un effort coûteux nécessitant un niveau d'expertise élevé. Dans beaucoup de cas où un tel effort est impossible ou inadapté, SKOS propose une voie économique et moins difficile de transition vers les technologies sémantiques. L'extensibilité inhérente à RDF rend possible une extension ultérieure ou une intégration des vocabulaires SKOS à des vocabulaires plus complexes, y compris des ontologies OWL.
Le documentSKOS Reference[19] définit la classe skos:Concept comme une classeOWL (skos:Concept rdf:type owl:Class). OWL apparait donc comme le méta-modèle dans lequel sont définies les classes et propriétés du langage SKOS, et une instance de skos:Concept est, au sens de OWL, un « Individual ». C'est une distinction essentielle entre une structure de concepts et uneontologie. La structure est destinée avant tout à faciliter une circulation cohérente dans un domaine et ses dimensions, alors que l'ontologie inventorie les types d'éléments (classes) qui peuvent y être rencontrés en fournissant de surcroît des informations sur les éléments individuels possibles (instances). Aussi, compte tenu de la proximité des moyens mis en œuvre (triplets RDF ; termes identiques ; hiérarchies homologues ; graphes ; etc.) dans les deux cas, il est important de limiter la confusion entre les deux modèles de données, chacun pouvant être légitimement exploité pour ses caractéristiques propres au sein d'une application mixte.
Des vocabulaires de référence ont été migrés au format SKOS et sont disponibles au public.
Avec SKOS, il est possible d'intégrer un thésaurus à unsystème d'information, au point de le rendre invisible aux utilisateurs. L'utilisateur bénéficie ainsi d'une assistance sémantique à la recherche syntaxique dans la base documentaire par une interface entre le vocabulaire utilisateur et le vocabulaire spécialisé (vocabulaire métier). Une mise en œuvre possible consiste à proposer de façon itérative les concepts clés du thésaurus SKOS en réponse aux mots clés choisis par l'utilisateur, éventuellement dans d'autres langues que la sienne ; une liste de mots clés affinée est ensuite soumise au système de recherche syntaxique[28].
| Contexte | |||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Semantic Web Stack |
| ||||||||||||||||||
| Autres ontologies | |||||||||||||||||||
| Articles liés | |||||||||||||||||||