You are on page 1of 16

Sveuilite u Zagrebu Fakultet organizacije i informatike Varadin

SKOS Simple Knowledge Organization System

Ivan Rubil 38866/09-R

U Varadinu, 28.11.2010.

SADRAJ

Uvod ........................................................................................................................................... 1 Pregled SKOS-a ......................................................................................................................... 2 SKOS, RDF i OWL.................................................................................................................... 2 Konzistentnost i integritet .......................................................................................................... 3 Zakljuivanje, ovisnosti i pretpostavka otvorenog svijeta ......................................................... 4 SKOS imeniki prostor i rjenik ................................................................................................ 5 SKOS osnove ............................................................................................................................. 6 Koncepti ................................................................................................................................. 6 Oznake.................................................................................................................................... 6 Semantike veze ..................................................................................................................... 7 Dokumentacijske biljeke ...................................................................................................... 8 Konceptne sheme ................................................................................................................... 9 Mapiranje konceptnih shema ............................................................................................... 10 Ponovno koritenje i proirivanje......................................................................................... 11 Zakljuak .................................................................................................................................. 13 Literatura .................................................................................................................................. 14

Uvod
SKOS1 je podatkovni model iji je cilj omoguiti dijeljenje i povezivanje informacija izmeu razliitih sustava za organizaciju znanja. Danas postoje razliiti naini da se znanje sistematski organizira radi lakog pretraivanja kao to su tezaurusi, taksonomije, kontrolirani rjenici i klasifikacijske sheme. Zbog toga je osmiljen SKOS kako bi omoguio povezivanje takvih sustava preko Weba. SKOS omoguuje standardan nain za prebacivanje KOS2-a na Semantiki Web. Takoer sadri jednostavan i intuitivan jezik za razvijanje i objavljivanje novih sustava koji se moe koristiti u kombinaciji sa formalnim jezikom za prezentaciju znanja kao to je OWL3. SKOS je nastao kako rezultat LIMBER4 projekta pokrenutog od strane Europske zajednice 1999-2001 godine. Nastavio se razvijati tijekom SWAD-Europe5 projekta takoer pokrenutog od strane Europske zajednice 2002-2004 godine. Projekt je dizajniran da podrava W3C6 Semantic Web Activity. Godinama nakon toga SKOS je nastavio sa razvojem po W3C standardima te je sad podran od strane W3C-a kao standard za povezivanje i premoivanje razlika izmeu KOS.

Kroz ovaj rad glavni izvor informacija o SKOS-u mi je slubena dokumentacija na stranicama W3C-a o SKOS standardu. Ovo e mi biti najvei izvor informacija u ovom radu te u koristiti jo poneke radove koji e mi sluiti za bolje upoznavanje sa SKOS-om.

1 2

Simple Knowledge Organization System Knowledge Organization Systems (sustavi za organizaciju znanja) 3 Web Ontology Language 4 Language Independent Metadata Browsing of European Resources 5 Semantic Web Advanced Development for Europe 6 World Wide Web Consortium

Pregled SKOS-a
Kao to je ve spomenuto u uvodu SKOS je zajedniki podatkovni model za razliite KOS. Koristei SKOS takvi sustavi se mogu prikazati kao podaci itljivi raunalima to je kljuno za upotrebu u okvirima Semantikog Weba. SKOS se definira formalno kao OWL Full ontologija. SKOS podaci se predstavljaju preko RDF-a7.

SKOS podatkovni model vidi KOS kao konceptna shemu koja sadri koncepte. Ove sheme i koncepti imaju svaki svoj URI8 tako da se bilo tko moe referencirati na njih te tako postaju dio World Wide Weba. Svaki koncept moe biti oznaen sa tekstom/znakovima na bilo kojem jezikom te moe sadravati preferiranu oznaku i niz alternativnih. Takoer uz URI-je mogu koristiti notacije za jedinstveno identificiranje koje koriste razliiti sustavi. Koncepti se mogu dokumentirati. SKOS prua osnove za dokumentiranje kroz razna svojstva koja se lako mogu proiriti po potrebi. Koncepti se mogu povezivati meusobno preko semantikih relacijskih svojstava. SKOS podrava u osnovi hijerarhijsko i asocijativno povezivanje, ali se i ovaj aspekt moe lako proiriti. Mogu se grupirati u kolekcije koje mogu biti oznaene i sortirane. Mogu se i mapirati na druge koncepte u razliitim konceptnim shemama. SKOS podrava etiri vrste veza: hijerarhijske, asocijativne, priblino ekvivalentne i potpuno ekvivalentne.

SKOS, RDF i OWL


SKOS koristi OWL u nekim aplikacijama da bi izrazio i izmjenjivao podatke o nekoj domeni. Razliiti KOS slue vie manje kao indeksi znanja ija je svrha lako pronalaenje i pretraivanje tih podataka. Oni su opisani i koriste vie manje prirodni jezik te zbog toga ne mogu biti efikasno procesuirani od strane raunala te ih se ne moe koristiti u okviru Semantikog Weba koji zahtjeva formalno definirane i prikazane podatke. Poto je SKOS tu da prikazuje znanje iz razliitih sustava na standardizirani i formalan nain to znanje se mora izvui iz takvih sustava te pretvoriti u eksplicitno unutar formalne ontologije izraeno setom aksioma i injenica. To znai da netko mora uzeti neki tezaurus ili recimo rjenik te ga pretvoriti u formalnu ontologiju. OWL je vrlo moan jezik za modeliranje podataka tako da ga moemo koristiti da takve sustave prikaemo as-is. Koncepti tezaurusa ili drugih sustava se modeliraju kao individue te se opisi i veze izmeu koncepata se modeliraju kao injenice.
7 8

Resuorce Description Framework Uniform Resource Identifier

Nakon toga SKOS podaci se izraavaju pomou RDF trojki (subjekt, predikat i objekt) kao u primjeru dolje.

<A> rdf:type skos:Concept ; skos:prefLabel "love"@en ; skos:altLabel "adoration"@en ; skos:broader <B> ; skos:inScheme <S> .

<B> rdf:type skos:Concept ; skos:prefLabel "emotion"@en ; skos:altLabel "feeling"@en ; skos:topConceptOf <S> .

<S> rdf:type skos:ConceptScheme ; dct:title "My First Thesaurus" ; skos:hasTopConcept <B> .

Konzistentnost i integritet
RDF moe biti istinit ili neistinit ovisno o tome da li je konzistentan ili ne to se tumai prema tome da li ima kontradikcija. Kada se koristi samo RDF rjenik teko je napraviti kontradiktorne izjave, ali kada koristimo i OWL rjenik takve izjave se mogu pojaviti kao u slijedeem primjeru.

<Dog> rdf:type owl:Class . <Cat> rdf:type owl:Class . <Dog> owl:disjointWith <Cat> . <dogcat> rdf:type <Dog> , <Cat> .

Kao to je prikazano imao dvije klase, <Dog> i <Cat>, koje su disjunktivne tj. nemaju zajednikih lanova. Tome proturjei slijedea izjava da <dogcat> ima tip <Dog> i <Cat>. Ovo nije konzistentan RDF graf. Pitanje nije da li su podaci zbilja istiniti i pravom svijetu ve se iskljuivo gleda da li podaci odgovaraju podatkovnom modelu. Ovo se isto moe izraziti kroz integritet. Uvjeti integriteta su izjave unutar formalne definicije podatkovnog modela koje se koriste da bi se provjeravalo jesu li izjave konzistentne u odnosu na dani model. Tako da se izjava da su <Dog> i <Cat> disjunktivne moe gledati kao uvjet integriteta unutar tog

modela. Ovakve izjave su obino odvojene od ostalih jer je njihova svrha odvojena od ostataka modela.

Zakljuivanje, ovisnosti i pretpostavka otvorenog svijeta


SKOS podatkovni model je definiran kao OWL Full ontologija to znai da ima djelominu kompatibilnost sa RDF Shemom te neke druge karakteristike. Ovakav tip ontologija se koristi za sustave u kojima se podaci mogu distribuirati kao npr. na Webu. Kako sustavi postaju sve vei postaje problem znati gdje se svi podaci nalaze unutar sustava. Zbog toga se ne moe pretpostaviti da su dohvaeni podaci potpuni. Ako neki podaci nedostaju treba pretpostaviti da podaci moda postoje negdje u sustavu. Ova pretpostavaka je poznata kao pretpostavka otvorenog svijeta. Smisao je da se neke izjave mogu napisati a da prolaze provjeru integriteta iako moda sve stvari nisu navede tj. ostatak koji nedostaje se moe zakljuiti. To moemo vidjeti iz slijedeih primjera.

<A> skos:semanticRelation <B>.

Gornja izjava pretpostavlja slijedee izjave

<A> rdf:type skos:Concept . <B> rdf:type skos:Concept .

Iz prve izjave znamo da <A> i <B> jer to nalae definicija skos:semanticRelation. Odnosno zakljuivanjem emo doi do druge dvije izjave.

KOS kao to su tezaurusi i klasifikacijske sheme se primjenjuju na iroki spektar situacija te se mogu koristiti u razliitim informacijskim sustavima. Definirajui SKOS kao OWL Full ontologiju Semantiki Web se moe koristiti kao medij za objavljivanje razmjenu, dijeljenje i povezivanje podataka. Pretpostavka otvorenog svijeta je zbog toga kljuna SKOS model podataka.

SKOS imeniki prostor i rjenik


Imeniki prostor SKOS-s moe se pronai URI-ja: http://www.w3.org/2004/02/skos/core#. SKOS rjenik9 je set URI-ja. U nastavku je prikazan i definiran taj rjenik. S lijeve je set URIja kojima je dodijeljena oznaka.

Preuzeto sa: http://www.w3.org/TR/2009/REC-skos-reference-20090818/#vocab

SKOS osnove
U ovom poglavlju emo ui u sintaksu SKOS-a odnosno koristi emo neke stavke iz rjenika na nekoliko primjera u kojima e biti objanjene. Kao to je ve spomenuto koncepti imaju svoje URI-je, a mogu im biti dodane leksike oznake i dokumentacija ili pridruene semantike relacije.

Koncepti
Koncepti su temelj SKOS rjenika. Moemo ih zamisliti kao jedinice misli odnosno ideje, znaenja, objekti ili dogaaji koji su temelj veine KOS. Koncepti su apstraktni entiteti u naim umovima. SKOS klasa skos:Concept omoguava da se definira neki resurs kao koncept. To se obavlja u dva koraka:

1. kreira se (ili koristi postojei) URI za jedinstveno identificiranje koncepta 2. izjavljuje se u RDF-u, koristei svojstvo rdf:type, da je resurs pod tim URI-jem tipa
skos:Concept

kao to je prikazano u slijedeem primjeru10:

ex:animals rdf:type skos:Concept

Koristei SKOS za objavljivanje konceptnih shemi olakava se referenciranje unutar Semantikog Weba. Potie se koritenje HTTP URI-ja kako bi ih mogli obraditi standardni web alati (kao to je web preglednik).

Oznake
Koncepte moemo karakterizirati dodjeljujui im razumljive tekstualne oznake na nekom jeziku. SKOS prua tri svojstva za ovu svrhu: skos:prefLabel, skos:altLabel i
skos:hiddenLabel.

Greka je ako koristimo isti tekst za bilo koja dva od ovih svojstava. Na

slijedeem primjeru moemo vidjeti primjer koritenja ovih svojstava:

10

Koristi se Turtle notacija

ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:altLabel "creatures"@en; skos:prefLabel "animaux"@fr; skos:altLabel "cratures"@fr; skos:altLabel "btes"@fr; skos:hiddenLabel "betes"@fr.

skos:prefLabel

koristimo za glavnu oznaku te za skos:altLabel alternativne, dok koristimo kada recimo elimo da ta oznaka bude tu za recimo alat koji

skos:hiddenLabel

vri recimo indeksiranje prolazei kroz tekst, ali da se inae na vidi. Oznaka je @en tu da bi se odredio jezik oznake.

Semantike veze
Semantike veze su klju KOS. Znaenje koncepata se ne definira samo oznakom teksta ve je klju definicije odnos sa drugim konceptima. Postoje tri standardna svojstva:

skos:broader skos:related

and skos:narrower omoguavaju predstavljanje hijerarhijskih veza omoguava predstavljanje asocijativnih veza

Prva dva svojstva se koriste u definiranju hijerarhije gdje prva oznaava pojmove koji su ireg znaenja odnosno ueg znaenja za drugo svojstvo. Na primjeru ispod je prikazana upotreba.

ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals. ex:mammals rdf:type skos:Concept; skos:prefLabel "mammals"@en; skos:broader ex:animals.

Koncept moe biti pridruen sa vie irih pojmova kao npr. Koncept ex:dog moe imati
ex:mammals

i ex:domesticatedAnimals kao ire pojmove. Tranzitivnost nije definirana

standardom tako da u hijerarhiji animals->mammals->dog nije definirano da je automatski


dog

ui pojam od animals iako se to lako moe ostvariti kroz druga svojstva. To je

napravljeno zbog toga to dosta KOS nisu tako formalno definirani.

Tree svojstvo se koristi kod asocijativnih veza kao to vidimo u slijedeem primjeru.

ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology. ex:ornithology rdf:type skos:Concept; skos:prefLabel "ornithology"@en.

Dva pojma ne mogu imati asocijativnu i hijerarhijsku vezu.

Dokumentacijske biljeke
Semantike veze su kljune za definiranje koncepata, ali esto uz to je potrebna dokumentacija kako bi korisnik mogao shvatiti o emu je rije. Postoji nekoliko svojstava ba za tu svrhu. SKOS prua skos:note kao osnovno svojstvo za opisivanje te nekoliko specijaliziranih
skos:historyNote. skos:scopeNote, skos:definition, skos:example,

skos:scopeNote

se koristi za pridruivanje inforamcija o znaenju i koritenju.

ex:microwaveFrequencies skos:scopeNote "Used for frequencies between 1GHz to 300Ghz"@en.

skos:definition

objanjava znaenje i objanjenje.

ex:documentation skos:definition "the process of storing and retrieving information in all fields of knowledge"@en.

skos:example

za pokazivanje primjera.

ex:organizationsOfScienceAndCulture skos:example "academies of science, general museums, world fairs"@en.

skos:historyNote

objanjava znaajne promjene u znaenju u formi koncepta.

ex:childAbuse skos:historyNote "estab. 1975; heading was: Cruelty to children [1952-1975]"@en.

Osim ovih SKOS prua jo dva specijalizirana svojstva koja mogu biti korisna.

skos:editorialNote

informacije koje pomau prilikom administracije i odravanja


complete"@en.

ex:doubleclick skos:editorialNote "Review this term after company merger

ex:folksonomy skos:editorialNote "Check spelling with Thomas Vander Wal"@en.

skos:changeNote

dokumentira sitne promjene radi lake administracije

ex:tomato skos:changeNote "Moved from under 'fruits' to under 'vegetables' by Horace Gray"@en.

Uz navedene primjere se mogu koristiti i oznake za jezik kako bi imali dokumentaciju u vie jezika. Uz postojea svojstva mogu se dodavati i druga koja nisu naznaena standardom.

Konceptne sheme
Koncepti se najee grupiraju u rjenike kao to su tezaurusi ili klasifikacijske sheme. SKOS nam omoguuje prikazivanje takvih KOS sa skos:ConceptScheme klasom. U slijedeem primjeru vidimo kako definirati resurs konceptna shema i opisati ga koristei svojstva za opisivanje iz Dublin Core11.

x:animalThesaurus rdf:type skos:ConceptScheme; dct:title "Simple animal thesaurus"; dct:creator ex:antoineIsaac.

Jednom kad smo definirali shemu moemo je povezati sa konceptima koristei


skos:inScheme

svojstvo.

ex:mammals rdf:type skos:Concept; skos:inScheme ex:animalThesaurus. ex:cows rdf:type skos:Concept; skos:broader ex:mammals; skos:inScheme ex:animalThesaurus. ex:fish rdf:type skos:Concept; skos:inScheme ex:animalThesaurus.

11

http://dublincore.org/documents/dcmi-terms/

SKOS definira i svojstvo koje prua ulazne toke za ue/ire koncepte hijerarhije. Ovo svojstvo omoguava povezivanje konceptne sheme sa najgeneralnijim konceptima koje sadri, kao to je vidljivo u primjeru.

ex:animalThesaurus rdf:type skos:ConceptScheme; skos:hasTopConcept ex:mammals; skos:hasTopConcept ex:fish.

Konceptne sheme su oigledno tu kako bi omoguile laku pretvorbu klasinih KOS rjenika u SKOS uz naravno neke male razlike.

Mapiranje konceptnih shema


Predstavljanje KOS u SKOS-u nam moe posluiti kao publikacijski mehanizam, ali takoer moe posluiti za povezivanje sa drugim konceptnim shemama. Ovakav tip povezanih podataka svoju pravu vrijednost pokazuje unutar Semantikog Weba tvorei globalnu konceptualnu shemu. Klju je takoer da se poveu kreirani koncepti sa ve postojeima koji imaju slino znaenje. Na taj nain definiramo da dva koncepta iz dvije razliite sheme koji imaju neto zajedniko te omoguava da se takvi KOS koriste unutar Semantikog Weba.

SKOS prua nekoliko svojstava u ovu svrhu. Moemo rei da dva koncepta imaju slino znaenje pomou exactMatch i closeMatch svojstava. Moemo povezati i dva koncepta iz razliitih shemi pomou broadMatch, narrowMatch i relatedMatch. U slijedeem primjeru vidimo dvije sheme koje na razliit nain opisuju pogled na ivotinje.
ex1:referenceAnimalScheme rdf:type skos:ConceptScheme; dct:title "Extensive list of animals"@en. ex1:animal rdf:type skos:Concept; skos:prefLabel "animal"@en; skos:inScheme ex1:referenceAnimalScheme. ex1:platypus rdf:type skos:Concept; skos:prefLabel "platypus"@en; skos:inScheme ex1:referenceAnimalScheme.

ex2:eggSellerScheme rdf:type skos:ConceptScheme; dct:title "Obsessed egg-seller's vocabulary"@en. ex2:eggLayingAnimals rdf:type skos:Concept;

10

skos:prefLabel "animals that lay eggs"@en; skos:inScheme ex2:eggSellerScheme. ex2:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:inScheme ex2:eggSellerScheme. ex2:eggs rdf:type skos:Concept; skos:prefLabel "eggs"@en; skos:inScheme ex2:eggSellerScheme.

Moemo mapirati koncepte iz ove dvije sheme na slijedei nain.

ex1:platypus skos:broadMatch ex2:eggLayingAnimals. ex1:platypus skos:relatedMatch ex2:eggs. ex1:animal skos:exactMatch ex2:animals.

closeMatch

znai da su dva koncepta poprilino slina te aplikacija moe koristiti bilo koja

oda ta dva koncepta, ali to svojstvo nije tranzitivno tj. ako a slian b, a b slian c onda a nije slian c. Ovo bi vrijedilo kada bi koristili svojstvo exactMatch.

Ponovno koritenje i proirivanje


Kada imamo svoje sheme objavljene na Semantikom Webu one su vidljive svima pa je za oekivati da e se neki dijelovi ponovno koristiti ili proirivati sa dijelovima iz drugih shema. U slijedeem primjeru vidimo takvu situaciju gdje u prvoj konceptnoj shemi netko kreira shemu za ivotinje koja sadri koncept za maku.

ex1:referenceAnimalScheme rdf:type skos:ConceptScheme; dct:title "Reference list of animals"@en. ex1:cats rdf:type skos:Concept; skos:prefLabel "cats"@en; skos:inScheme ex1:referenceAnimalScheme

11

kreator druge sheme posveenoj makama moe referencirati koncept make iz prve

ex2:catScheme rdf:type skos:ConceptScheme; dct:title "The Complete Cat Thesaurus"@en.

ex1:cats skos:inScheme ex2:catScheme.

ex2:abyssinian rdf:type skos:Concept; skos:prefLabel "Abyssinian Cats"@en; skos:broader ex1:cats; skos:inScheme ex2:catScheme.

ex2:siamese rdf:type skos:Concept; skos:prefLabel "Siamese Cats"@en; skos:broader ex1:cats; skos:inScheme ex2:catScheme.

12

Zakljuak
SKOS je oigledno veliki korak naprijed za razvoj KOS jer omoguava da sustavi i sheme koje su bile zatvorene i teko dostupne budu lako objavljenje po standardu te koritene u sklopu Semantikog Weba. Cilj je da se podaci otvore javnosti a to je mogue ukoliko je nain na koji su podaci definirani standardan. Na taj nain raunalna obrada nad skupom podataka je uvelike olakana te se mogu izvui nove informacije i znanja.

SKOS je upravo nastao iz takve potrebe kada je Europska zajednica trebala nain da skupi veliku koliinu podataka te nad njom vri analizu. Tijekom duge povijesti SKOS je sazrio kao standard koji nije rigidan ve otvoren i fleksibilan. Sada je priznat kao standard od strane W3C-a to mu daje veliki znaaj i promovira ga kao rjeenje za objavljivanje i povezivanje podataka.

13

Literatura
SKOS Simple Knowledge Organization System Reference http://www.w3.org/TR/2009/REC-skos-reference-20090818/ SKOS Simple Knowledge Organization System Primer http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/ SKOS Simple Knowledge Organization System Namespace Document http://www.w3.org/TR/skos-reference/skos.html

14

You might also like