Semantički Web

Semantički web
Ključne riječi: semantički web, ontologija, XML, XML Schema, RDF, RDF Schema, OWL
Sažetak
Semantički web je splet tehnologija, koji će imati ključnu ulogu u razvoju informatike u budućnosti. Na sličan način kako je
klasični web učinio dokumente i multimedijski sadržaj dostupan čovjeku, tako bi semantički web trebao podatke učiniti
dostupnima računalima, kako bi se otklonili neki nedostaci i proširilo polje upotrebe Web-a. Razvojem koncepta semantičkog
weba nastali su mnogi jezici i podatkovni modeli, kojima je moguće opisati odnose između pojmova na način razumljiv
računalu. Primjenom tih jezika, primjerice RDF (Resource Description Framework), RDFS (Resource Description Framework
Schema) i OWL (Web Ontology Language) stvaraju se konceptualni prostori, ontologije, koje opisuju pojmove iz neke
domena. Takav zapis podataka može bitno unaprijediti proces traženja i dobave resursa na mreži, a pretraživanje po ključnim
riječima moguće je zamijeniti standardiziranim upitima. Značajan doprinos upotrebe semantičkog weba očekuje se u području
upravljanja znanjem.
1 Semantički web
World Wide Web (WWW) kakav danas poznajemo najvećim dijelom je utemeljen na jeziku HyperText Markup
Language (HTML). Osnovna karakteristika današnjeg Web-a je sadržaj vizualno prilagođen krajnjem korisniku.
Korisnici Web-a mogu lako pristupiti sadržaju specificirajući URI adresu, te pretraživanjem i slijeđenjem linkova
pristupati ostalim povezanim resursima. Negativna je strana što se lako izgubiti ili otkrivati nevažne i nepovezane
informacije. Time se naše pretraživanje svodi na dug i mukotrpan posao, jer ne trošimo vrijeme samo tražeći
informacije koje nas zanimaju već “gubimo” vrijeme selektirajući korisne informacije od nepovezanih i nevažnih.
Semantički web predstavlja potencijalno rješenje ovog problema uvođenjem novih tehnologija i jezika koji
omogućuju računalu obradu velike količine informacija i znanja u skladu s njihovim značenjem. Semantički web je
nadogradnja običnog Web-a tehnikama i mehanizmima učinkovitog otkrivanja, povezivanja i integriranja različitih
Webom dostupnih podataka i usluga. Naziv “semantički” proizlazi iz načina na koji se te tehnike i mehanizmi
ostvaruju. Naime, osnovna ideja semantičkog Weba je označiti podatke i usluge metapodacima. Metapodaci
određuju značenje, osnovne karakteristike, te među-veze podataka i usluga. Na osnovu metapodataka, korištenjem
mehanizama zaključivanja, pronalaze se napredne veze i karakteristike veza među podacima i uslugama. Za
ostvarivanje semantičkog Weba vrlo su važne ontologije, jer omogućuju izražavanje znanja nužnog za ispravno
provođenje zaključivanja. Područje u kojem se očekuje značajan doprinos korištenjem semantičkog Weba je
upravljanje znanjem.
1.1 Upravljanje znanjem

Upravljanje znanjem odnosi se na prikupljanje, pristupanje i održavanje znanja unutar neke organizacije [1].
Upravljanje znanjem pokušava iskoristiti dostupna intelektualna dobra neke organizacije s ciljem postizanja veće
produktivnosti, stvaranja novih vrijednosti i povečanju konkurentnosti [2]. Upravljanje znanjem je posebno važno
za internacionalne organizacije sa geografski rasutim odijelima.
Večina informacija je trenutno dostupno u slabo struktuiranoj formi, na primjer, tekst, audio, video. Iz kuta
upravljanja znanjem, trenutna tehnologija pati od ograničenja u slijedećim područjima:
• Pretraživanje informacija – pretraživanje uglavnom temeljeno na ključnoj riječi.
• Vađenje informacija – potrebno uložiti dodatan napor kako bi se pretražili dokumenti dobiveni nakon
pretrage, radi pronalaska korisnih informacija.
• Upravljanje informacijama – trenutno postoje problemi kao što su neusklađenost u terminologiji i
neuspiješnost uklanjanja zastarijelih informacija.
1
• Otkrivanje informacija – novo znanje koje podrazumijevano postoji u općim bazama je izvađeno kopanjem
podataka. Ipak, ovaj zadatak je i dalje težak za distribuirane i slabo struktuirane kolekcije podataka.
Cilj Semantičkog weba je poboljšanje mehanizama pretraživanja, počišćivanja i održavanja podataka određene
organizacije. Cilj Semantičkog weba je uvođenje naprednih sustava za upravljanje znanjem:
• Znanje organizirano u pojmovne prostore na osnovu njegovog značenja.
• Automatske alate održavanja provjeravanjem usklađenosti i izvlačenja novih znanja.
• Pretraživanje zasnovano na klučnim riječima zamijenjeno upitima: traženo znanje bit će vračeno, izvađeno
i prezentirano na način pogodan čovjeku.
• Omogučavanje upita na više dokumenata.
2 Ontologije
Filozofska definicija ontologije je učenje o općim, fundamentalnim i konstitutivnim određenjima bitka [3]. U
računalnoj znanosti i teoriji informacije, ontologija je formalan zapis skupa pojmova u određenoj domeni i odnos
između tih pojmova. Ontologija se koristi u umjetnoj inteligenciji, semantičkom webu, software inžinjeringu i
informacijskoj arhitekturi kao oblik reprezentacije znanja o svijetu odnosno nekom njegovom dijelu. Komponente
ontologije uključuju slijedeće:
• Jedinke: instance ili objekti,
• Klase: zbirke ili tipove objekata,
• Atributi: pripadajuća svojstva, pojave, karakteristike ili parameter koje objekt može imati ili distribuirati,
• Odnosi: način na koji se odnose objekti jedni prema drugima,
• Aksiomi: tvrdnje u logičkom obliku koje zajedno čine ukupnu teoriju koju ontologija opisuje u domeni
primjene,
• Događaji: promjene atributa i odnosa.
Unutar ontologije razlikuju se dvije vrste znanja: opće ili terminološko znanje (engl. Terminology Box, TBox), te
utvrđeno znanje (engl. Assertion Box, ABox). TBox znanje opisuje koncepte i njihove međusobne odnose, dok se
ABox odnosi na opisivanje pripadnosti individua određenim konceptima, kao i dodjeljivanjem uloga individuama.
Trenutno najvažniji ontološki jezici na Webu su:
• XML - eXtensible Markup Language,
• XML Schema,
• RDF - Resource Description Framework,
• RDF Schema,
• OWL – Web Ontology Language.
2.1 XML
XML (eXtensible Markup Language) je jezik oznaka (engl. markup language) razvijen s ciljem opisivanja
podataka [4]. Definira se kao proširivi jezik (engl. extensible) zbog mogučnosti da korisnici definiraju vlastite
oznake (engl. tag). Ideja je bila stvoriti jedan jezik koji će biti jednostavno čitljiv i ljudima i računalnim
programima. XML dokument je skup podataka iz neke domene zapisanih na standardan i struktuiran način u
tekstualnom formatu. Struktura XML dokumenta je strogo hijerarhijska i sastoji se od elementa koji su hijerarhijski
ugniježdeni. Svaki element ugnježđuje sve elemente koji su hijerarhijski podređeni i/ili tekst koji predstavlja
podatak vezan uz taj dokument. Temeljni element u kojem se nalaze svi ostali zove se korijenski element. U takvoj
strukturi XML elementi se često zovu i čvorovi (engl. nodes), a njihov međusobni odnos izražava se pojmovima iz
obiteljskog stabla: roditelj (engl. parent), dijete (engl. children), unuci (engl. grandchildren) i sl. ili se koriste
pojmovi prethodnika (engl. ancestor) ili sljedbenika (engl. descendant).
<knjiga>
<naslov> Uvod u XML </naslov>
<izdavač> FSB Zagreb </izdavač> 2
<cijena> 102.45 </cijena>
</knjiga>
Slika 1 Primjer XML dokumenta
XML dokument osim elemenata sadrži i atribute. Atributi su ime-vrijednosti parovi smješteni unutar oznake
početka elementa. Na primjer element,
<cijena tečaj="kn"> 102.45 </cijena>
sadrži atribut “tečaj” i njegovu vrijednost. Atributi služe za dodatan opis informacija elementa.
Budući da se više XML dokumenata može međusobno povezati u jedinstveni XML dokument, XML uvodi koncept
prostora imena (engl. namespace) radi izbjegavanja konflikata pri imenovanju elemenata i atributa [5]. Unutar
jednog XML dokumenta moguće je koristiti elemente i atribute iz više različitih XML vokabulara. Nejasnoće
između jednako imenovanih elemenata iz različitih vokabulara se izbjegavaju uvođenjem prostora imena unutar
kojih svi nazivi moraju biti jedinstveni. Korištenjem prostora imena lokalnom imenu unutar dokumenta se dodaje
prefiks, koji se od naziva elementa odvaja dvotočkom. Prefiks u tom slučaju označava kontekst unutar kojeg se
nalazi ime elementa ili atributa.
Svaki XML dokument sadrži dva svojstva valjanosti: svojstvo dobre oblikovanosti te svojstvo ispravnosti. XML
dokument je dobro oblikovan (engl. well-formed) ako slijedi određena pravila koja definira XML jezik. Svojstvo
ispravnosti (engl. validity) XML dokumenta zadovoljava dodatne propise koje definira semantika nekog jezika
(npr. valjan XHTML dokument). Dodatni zahtjevi vezani uz vokabular se mogu definirati jezicima Document Type
Definition (DTD) ili XML Schema (XMLS).
2.2 XML Schema

XML Schema je jezik za definiranje strukture XML dokumenta [6]. Pomoću XML Scheme moguće je definirati
shemu XML dokumenta, odnosno moguće je propisati podatke koje pojedini XML dokument može sadržavati.
Definiranje strukture XML dokumenta obuhvaća: definiranje elemenata i atributa koji se pojavljuju u dokumentu,
definiranje redoslijeda elemenata, definiranje podelemenata pojedinih elemenata – hijerarhije elementa te
definiranje broja pojavljivanja pojedinog podelementa.
Važno svojstvo XML Schema je mogućnost definiranja tipova podataka koje pojedini element ili atribut sadrži. U
sklopu ovog svojstva moguće je: definirati da li je pojedini element ili atribut prazan ili sadrži tekst, odrediti tip
podataka koji tekst sadrži , definirati podrazumijevanu vrijednost, definirati konstantnu vrijednost elementa ili
atributa te odrediti skup vrijednosti koje neki element ili atribut može sadržavati. Naposlijetku XML Schema
omogućuje nasljeđivanje tipova podataka. Nasljeđivanje omogućuje gradnju novih tipova podataka nadgradnjom
starih tipova podatak, ili ogranićenjem na vrijednosti starih tipova podataka.
Pomoću XML Scheme mogu se graditi jednostavne ontologije koje propisuju imena određenim pojmovima te im
pridružuju određena svojstva. Međutim, pomoću XML Scheme moguće je izraziti samo hijerarhijske veze među
objektima u svijetu, odnosno nije moguće opisati složenije veze među različitim objektima i tipovima podataka.
XML schemu je izvorno načinio Microsoft, ali je od 2001. godine to W3C preporuka.
2.3 RDF i RDF Schema

RDF (Resource Description Framework) je jezika za predstavljanje informacija o resursima dostupnim Internetom
[7]. Izvorno je namijenjen predstavljanju metapodataka o Web resursima, poput naslova, autora i datuma izmjene
Web stranice. Međutim, poopćenjem koncepta “Web resursa”, RDF se može primjeniti za predstavljanje bilo kakve
informacije o različitim stvarima, pojavama i bičima. RDF je namijenjen situacijama kada je informacije potrebno
obraditi aplikacijom – računalnim agentom, a ne izravno predstaviti ljudima. RDF pruža format za izražavanje
informacija koji je neovisan o platformi, te se kao takav može izmjenjivati između različitih aplikacija.
RDF je sagrađen na konceptu izjava, formi trojki; riječ, tema, objekt (predicate, subject, object). Primjer izjave je:
http://zrno.fsb.hr autor “Mario Stanković”.
3
Ova izjava izražava informaciju da je autor resursa Web stranice “http://zrno.fsb.hr” resurs “Mario Stanković”.
“Subject” ove izjave je Web stranica “http://zrno.fsb.hr”, “predicate” je autor, a “object” “Mario Stanković”.
Interpretacija trojke je da “subject” ima svojstvo “predicate” čija je vrijednot “object”. U RDF-u “subject” je uvijek
resurs definiran sa URI-om. “predicate” je vlasnišvo resursa, a “object” je vrijednost vlasnoštva resursa.
RDF je temelj za procesiranje meta podataka (podaci o podacima) te pruža interoperabilnost između aplikacija koje
izmjenjuju informacije razumljive strojevima na Internetu. RDF se može iskoristiti u raznim područjima aplikacija
npr. otkrivanje resursa da bi postigli bolje pretraživačke sposobnosti, inteligentni softverski agenti koji omogućuju
dijeljenje i izmjenjivanje podataka i znanja. RDF model za opisivanje resursa je jedna od osnovnih komponenti
koje čine današnji semantički web. Često se zapisuje koristeći XML sintaksu što se označava kao RDF/XML, ali
postoje i drugi formati zapisa.
RDF ne definira sintaksu nego samo model za predstavljanje metapodataka. RDF nam pruža mogućnost slaganja
izjava koje opisuju resurse i relacije među njima. RDF schema (RDFS) podiže stvari na još višu razinu
omogućavanjem definiranja klasa (engl. classes) i svojstava (engl. properties), pristupom koji je jako sličan
objektnom programiranju. Na taj način resursi mogu postati instance pojedine klase, a klase mogu postati podklase
neke druge klase. Osim navedenog, RDFS pruža i mogućnost definiranja hijerarhije svojstava, definiranja domene
svojstava (koji resursi smiju imati dano svojstvo), te definiranja ranga svojstava (kakva svojstva resurs smije imati).
2.4 OWL
OWL (Web Ontology Language) pripada skupini jezika za reprezentaciju znanja kojima se stvaraju ontologije [8].
OWL je specifičan po tome što ga preporučuje WWW konzorcij (W3C), što ga predstavlja kao standard za izradu
ontologija na Webu. Zbog te podrške, OWL se smatra fundamentalnom tehnologijom nadolazećeg semantičkog
Weba. Sintaksno gledano, OWL je dodatni rječnik koji se koristi u RDF izjavama. OWL, slično kao i RDF
Schema, omogućava definiranje resursa, njihovih svojstava i veza. Ontologije izrađene OWL-om mogu se miješati
i nadopunjavati s ontologijama izraženim RDF Schema jezikom, jer su oba jezika zasnovana na RDF-u i XML-u. U
odnosu na RDF Schemu, OWL dodatno omogućuje: definiranje karakteristika svojstva, ograničavanje vrijednosti
svojstva putem tipova resursa, ograničavanje broja pojavljivanja svojstva, izražavanje jednadnakosti svojstava,
definiranje novih tipova resursa, istovjetnošću te razlikom tipova resursa.
S obzirom na potrebe, definiraju se tri varijante OWL-a s različitim mogućnostima i izražajnosti:
• OWL Lite je najjednostavnija varijanta namijenjena korisnicima koji primarno traže klasifikaciju,
hijerarhijsku organizaciju i jednostavna ograničenja;
• OWL DL daje podršku onim korisnicima koji žele maksimalnu izražajnost kod koje se zadržava računsku
potpunost i zaključivanje. Ime dolazi od opisne logike (engl. description logics);
• OWL Full je namijenjen za korisnike koji žele maksimalnu izražajnost i slobodnu sintaksu, ali bez
garancije za dobivanje zaključka prilikom računanja.
XML definira sintaksu zapisa dokumenta, a RDF uvodi pojam trojki koje služe za pohranu semantičkih podataka.
RDFS nadograđuje RDF uvođenjem pojmova klasa, podklasa i domena, dok OWL uvodi dodatnu izražajnost koja
omogućava veliku slobodu pri stvaranju ontologija. Hijerarhija semantičkih jezika unutar složaja semantičkog
weba prikazana je na Sl. 2.
Slika 2 Hijerarhija semantičkog jezika.
4
Unutar semantičkog weba preuzima se pretpostavka otvorenog svijeta (engl. Open-World Model, OWM) u kojem
nemogućnost pronalaska izjave ne implicira da ona ne postoji.
2.5 Preostali jezici semantičkog weba

Spisak jezika semantičkog weba ovim nije ni približno iscrpljen. Trebalo bi još spomenuti tri jezika koji igraju
veliku ulogu u ovom području [9]:
• SPARQL upitni jezik za RDF. SPARQL omogućava da na jedinstven način postavljamo upit na različite
RDF podatke i ujedno definiramo oblik rezultata ovih upita. Poseban značaj SPARQL je u tome što
dozvoljava da se podaci, koji nisu u obliku RDF-a, uključe u semantički web. Implementacijom posebne
softverske komponente, adaptera, SPARQL upiti mogu se izvršavati u proizvoljnom izvoru podataka. U
ovom slučaju, adapter je odgovoran i za prevođenje dobijenih rezultata u propisani oblik. To znači da se
različite baze podataka mogu uključiti u semantički web, a da pri tom nije potrebno konvertirati njihove
podatke.
• Mehanizmi logičkog zaključivanja. Pored ontologije, za neke primjene, mogu se definirati i složenija
pravila zaključivanja koja omogućavaju da se iz neposredno datih podataka na semantičkom webu izvedu
nove informacije. Za ovo se koriste različite metode koje su razvijene u umjetnoj inteligenciji, kao što su
ekspertski sustavi i logičko programiranje.
• Mehanizmi osiguranja povjerenja. Svi smo svjesni složenosti problema koji se tiču zaštite podataka na
postojećem webu. Ti su problemi na semantičkom webu još složeniji, jer ne mora postojati korisnik
(čovjek) koji će, zahvaljujući svom iskustvu, odrediti da li i koliko se može imati poverenja u neki izvor
informacija ili servis. Kritičari semantičkog weba posebno ističu problem mogućeg narušavanja
privatnosti, i to upravo zbog njegove sposobnosti integriranja podatka iz različitih izvora.
3 Zaključak
Semantički Web je nadogradnja postojeće Web infrastrukture mehanizmima semantičkog povezivanja podataka i
usluga, te mehanizmima donošenja zaključaka vezanih uz te podatke i usluge. Korisnik semantičkog Weba ima
pristup mnogim “inteligentnim” agentima koji mu olakšavaju i pospješuju pretraživanje Weba, preoblikovanje i
gradnju složenih elektroničkih dokumenata i korištenja usluga i donošenja odluka.
Kakva je zapravo budučnost semantičkog Weba, neznamo. Velik broj kompanija i institucija ulažu velik napor u
osiguravanje softverske infrastrukture potrebne za razvoj i funkcioniranje aplikacija i servisa zasnovanih na
semantičkom Webu. Međutim, za uspjeh semantičkog Weba presudni utjecaj imaju korisnici. Pitanje je kad će
semantički Web dostići broj korisnika koji će motivirati nove korisnike na njegovu upotrebu. Prema nekim
prognozama semantički Web će za 5 do 7 godina izaći iz eksperimentalne faze i početi se praktično primjenjivati.
Budućnost će pokazati kakav će utjecaj imati semantički Web na društvo i dali će se ostvariti san zagovornika ove
ideje.
4 Reference
[1] Vesna Bosilj Vukšić Što je upravljanje znanjem?, Hroug konferencija, Rovinj, 2007
[2] Ristić Milutin, Uvod u semantički web, Elektronski fakultet u Nišu, 2008.
[3] http://hr.wikipedia.org/wiki/Ontologija_(informacijske_znanosti)
[4] http://hr.wikipedia.org/wiki/XML
[5] http://zrno.fsb.hr/katedra/download/materijali/801.pdf
[6] http://hr.wikipedia.org/wiki/XML_Schema
[7] Gospodnetić Luka, Semantički web, Fakultet elektrotehnike i računalstva, Zagreb, 2008
[8] http://en.wikipedia.org/wiki/Web_Ontology_Language
[9] Marin Prcela, Predstavljanje ontologije na Web-u, Institut Ruđer Bošković, 2009

Semantički Web

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Semantički Web

Uploaded by

Copyright:

Available Formats

Semantički web

1.1 Upravljanje znanjem

2.2 XML Schema

2.3 RDF i RDF Schema

Slika 2 Hijerarhija semantičkog jezika.

2.5 Preostali jezici semantičkog weba

You might also like