You are on page 1of 85

UNIVERZA V LJUBLJANI

FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO


Tržaška 25, 1000 Ljubljana

Načrt “Clickstream” podatkovnega skladišča


za spremljanje interesnih področij spletnih
obiskovalcev na slovenski UDK digitalni
knjižnici
Seminarska naloga pri predmetu “Razvoj informacijskih
sistemov”

Podiplomski magistrski študij: Informacijski sistemi in odločanje

Predmet: Razvoj informacijskih sistemov

Predavatelj in mentor: prof. dr. Viljan Mahnič

Avtor: podiplomski študent Karl Petrič

Žalec, 30.05.2004

Datum oddaje: 01.06.2004


[1]
Kazalo
Povzetek 3

1 Uvod 4

1.2 Namen seminarske naloge 10

1.3 Opredelitev oziroma osvetlitev problema 12

2 Vzpostavitev projekta 14

3 Načrtovanje projekta 26

3.2 Opredelitev zahtev 32

3.3 Opredelitev organizacijskih zahtev 32

3.4 Opredelitev poslovnih zahtev 36

3.7 Določitev virov podatkov 43

3.8 Ocena kakovosti podatkov 46

4 Dimenzijsko modeliranje 62

5 Zaključek 78

6 Viri 79

6.1 Priporočena literatura 79

6.2 Viri z medmrežja 79

6.3 Uporabljena programska orodja za modeliranje 81

7 Slovar kratic in izrazov 82

I. Seminarska naloga vsebuje 12 preglednic in 27 slikovnih prikazov

[2]
Povzetek
V tej seminarski nalogi sem obravnaval načrt “Clickstream” podatkovnega skladišča za
spremljanje področnih zanimanj spletnih obiskovalcev na možni različici UDK digitalne
knjižnice zavoda šolski center SSK. V uvodnem poglavju sem na kratko predstavil prototipno
spletno UDK digitalno knjižnico (izvirno ime: UDK leksikon), ki sem jo izdelal v letih od
2002 – 2004. Izpostavil sem še zlasti naslednje pozitivne lastnosti UDK-ja (univerzalna
decimalna klasifikacija) glede možnosti sistematičnega urejevanja podatkov / informacij, tako
na makroskopskem kot tudi mikroskopskem nivoju in glede možnosti zajemanja podatkov /
informacij s skorajda vseh področij človekovega znanja (npr. znanosti, umetnosti, aplikacije,
šport, materiali, osebe, izdelki, trgovine itd.) in dejavnosti (npr. raziskovanje, igranje,
prodajanje, posredovanje, svetovanje itd.). V uvodnem poglavju sem tudi obrazložil pojem
“Clickstream” podatkovnega skladišča (CPS), s katerim bi bilo možno beležiti, shranjevati in
analizirati podatke v zvezi z obnašanjem spletnih obiskovalcev na UDK digitalni knjižnici.
Tovrstni pridobljeni podatki bi lahko bili zelo koristni tako za poslovanje kot tudi za
organizacijo knjižnic, založb, šol, državne uprave, ministrstev, podjetij (npr. računalniška
podjetja, tovarne ipd.) V tem uvodnem poglavju sem se tako tudi dotaknil problema
identifikacije in zasebnosti spletnih obiskovalcev.

V nadaljevanju tega pisanja sem načrt za “Clickstream” podatkovno skladišče razdelil na


naslednje faze:

 vzpostavitev projekta (pri tem sem razvil zamisel o organizacijskih zahtevah)


 načrtovanje projekta
 opredelitev zahtev (organizacijske zahteve, poslovne zahteve – zbiranje podatkov)
 določitev virov podatkov
 ocena kakovosti podatkov
 dimenzijski podatkovni model predlaganega “Clickstream” podatkovnega skladišča

Seminarsko nalogo sem zaključil z mislijo, da bi lahko tovrstno podatkovno skladišče


delovalo pod okriljem standardiziranih / urejenih UDK digitalnih slovenskih knjižnic (ki jih
zaenkrat ni prav mnogo), ki bi bile financirane s strani ministrstev, IZUM-a / COBISS,
podjetij, tujih vlagateljev, TELEKOM-a itd. Tovrstne knjižnice se ne bi toliko ukvarjale s
klasičnimi knjižničnimi opravili, ampak bi lahko nudile tudi storitve v smeri poslovnih
odločitev, analiz, iskanja ustreznih informacij glede npr. interesnih področij spletnih
obiskovalcev za gradbene materiale ipd.

[3]
1 Uvod
Na kakšen način spremljati zanimanja spletnih obiskovalcev in pri tem uresničiti več različnih
koristnih namenov npr. doseganje učinkovitejše prodaje, izdelava boljšega nabavnega načrta,
izboljšanje kakovosti in učinkovitosti vzgojnoizobraževalnega procesa itd.? Na to izredno
zanimivo in zahtevno vprašanje sem že deloma odgovoril v preteklih seminarskih nalogah na
tem podiplomskem študiju (gl. spletna dela: http://www.beepworld.de/members48/udkinfosis,
http://www.beepworld.de/members54/umlmodel, in http://www.beepworld.de/members56/udkmmis.), vendar
ne z vidika podatkovnih skladišč (v nadaljevanju PS). Osnovna zamisel pričujoče seminarske
naloge je še zlasti glede uporabe sodobne informacijske tehnologije (IT) nekakšna nadgradnja
prejšnjih in se osredotoča na področje spremljanja zanimanj spletnih obiskovalcev na digitalni
univerzalni decimalni klasifikacijski (v nadaljevanju UDK) knjižnici s pomočjo
“CLICKSTREAM” (v slovenskem prevodu približno bi to pomenilo: sledenje toku klikov
oziroma sledenje spletnih obiskovalcev) PS, v katerega naj bi se shranjevale sledi spletnih
obiskovalcev, ki jih le-ti puščajo za sabo ob pritiskanju na spletne povezave na UDK digitalni
knjižnici. Z obzirom na to, da je zaradi pojma UDK-ja (univerzalna decimalna klasifikacija)
tema seminarske naloge za marsikaterega bralca s področja informatike postala manj
oprijemljiva, se mi zdi prav, da posvetim nekaj uvodnih besed temu UDK-ju (sicer si lahko
bralci tega dela ogledajo natančnejšo razlago v zvezi z UDK –jem prav na poprej navedenih
spletnih straneh, še zlasti zadnjega vira pod poglavjem UDK - v izhodiščni preglednici). Čisto
na kratko povedano je UDK klasifikacijski sistem, ki razvršča “vso” človekovo znanje,
dejavnosti in materiale itd.” s pomočjo številk (pravilneje UDK vrstilcev), črk, drugih znakov
t.j. matematičnih (npr. +,  , ipd.) in interpunkcijskih znamenj (npr. :, ., ;, itd.). Prav ta prijetna
lastnost UDK-ja omogoča, da lahko zajamemo zelo široko različne podatke / informacije z
različnih področij človekovega življenja, ki se raztezajo od naravoslovja, tehnike /
aplikakativnih ved, družboslovja, humanistike, umetnosti, športa pa tja do čisto vsakdanjih
opravkov (npr. nakupovanje v delikatesni trgovini, igranje šaha, gledanje televizije, delo z
računalnikom, branje knjige itd.). Ta UDK pa je zapisan v tablicah, ki se členijo na glavne in
pomožne, ter v katerih so zapisani UDK vrstilci kot tudi pravila. Kaj potem pomeni izraz
UDK digitalna knjižnica? To je knjižnica v digitalni obliki (ožje gledano: na spletu), ki kot
ogrodje za razvrščanje podatkov / informacij (besedne, zvočne, vizualne), ki so (na spletu) v
različnih oblikah / formatih (HTML, PDF, DOC, AUD, GIF, JPEG, PNG, MPEG, AVI itd.)
uporablja UDK tablice. V tem pisanju bom še zlasti izpostavil spletne povezave, ki so urejene
po UDK-ju oziroma vsebujejo UDK vrstilec, kajti ob pritiskih (klikih) spletnih obiskovalcev
na te UDK spletne povezave (npr. 007 Informatika), si lahko s pomočjo “Clickstream” PS
pridobimo dragocene informacije ne samo o IP naslovih, registracijah, začetkih / koncih sej, o
pogostosti obiska na določeno področje zanimanja, o dolžini ogleda določene spletne strani,
temveč tudi o tem, kako tematsko podrobno ali globalno si je spletni obiskovalec ogledal
ponudbo UDK digitalne knjižnice (v tem primeru ponudbo UDK LEKSIKONA). Naj za lažje
razumevanje snovi služi naslednji slikovni prikaz.

[4]
1.1 Slikovni prikaz 1: Poizvedovanje in črpanje podatkov / informacij spletnega
obiskovalca na UDK LEKSIKONU (UDK digitalni knjižnici)

Slikovni prikaz 1 prikazuje eno od številnih možnih različic dejavnosti spletnega obiskovalca
od začetka (znak: črn zapolnjen krog), kjer v procesu iskanja podatkov / informacij npr. na
različnih zunanjih iskalnikih (znak za proces: konkavni šesterokotnik) porabi 20 minut (znak:
merilna skala v minutah – čas tega procesa bi lahko bil tudi npr. 5 sekund), da najde UDK
LEKSIKON. Na glavni strani si spletni obiskovalec izbere UDK področje 007 (znak: merilna
skala v sekundah) in za ta izbor porabi 20 sekund (s), ko nenazadnje s pritiskom (klik) na
spletno povezavo “007 informatika” vstopi na UDK področje 0, natančneje na UDK 007.
Spletni obiskovalec si izbere spletno povezavo 007:004.738.52:02:811.112.2 Virtualna
knjižnica, kar potrdi s pritiskom miške (znak: merilna skala v sekundah – 60 s). Odpre se
nova spletna stran za virtualno knjižnico (v Sloveniji so slovenski knjižničarji sprejeli termin
“digitalna knjižnica”) oddelka za germanistiko. Spletni dokument je zelo obsežen in po času

[5]
ene ure in 30 minutah (znak: merilna skala v urah – h) ogledovanja strani, se spletni
obiskovalec odloči, da se povrne (klik) na glavno stran UDK LEKSIKONA. Spletni
obiskovalec se po 15 s odloči, da si bo ogledal področje UDK 389 (metrologija), nakar si le-ta
s tleskom (klikom) na UDK 389:053.081 Pretvarjanje merskih enot dejansko izbere to
spletno stran (tega v sliki nisem prikazal). Po eni uri (h) in 52 s spletni obiskovalec zaključi
spletno sejo oziroma spletno/-e dejavnost/-i (znak: večji beli krog, znotraj katerega se nahaja
črn krog). …

Na tem oprijemljivem primeru, bi lahko precej natančno spremljali izobraževalna nagnjenja


spletnega obiskovalca. Prav tako bi lahko zelo natančno spremljali potrošniška nagnjenja
spletnega obiskovalca na UDK LEKSIKONA, če bi ta npr. pregledoval strani spletnih
delikatesnih trgovin itd. Vse te podatke obiskovalčevih aktivnosti lahko shranimo in celo
analiziramo (npr. statistični kazalci trendi, korelacije, standardni odkloni, frekvenčne
porazdelitve, HI- kvadrat testi itd.). To nam lahko omogoča sodobna informacijska
tehnologija (v nadaljevanju IT) kot je “Clickstream” PS in spletno orodje za PS t.j. Online
Analitical Processing (v nadaljevanju OLAP, Data Mining je prav tako programsko orodje PS
in ga lahko opredelimo kot podatkovno rudarjenje ali celo odkrivanje znanja v podatkih).
Doslej zapisano nam lahko daje slutiti, da je možno s pomočjo spletne UDK knjižnice
spremljati širok obseg dejanj spletnih obiskovalcev z različnih predmetnih področij zanimanj.
Prav s te (trdne) predpostavke, bi si lahko predstavljal, da bi bilo možno pridobiti različna
podjetja (tovarne, trgovine,obrtnike itd.) ter zavode (fakultete, šole itd.), ki bi bili morda
denarno pripravljeni podpreti projekt izgradnje “Clickstream” PS (v nadaljevanju CPS). Na
podlagi izgrajenega CPS, bi si lahko financerji / sovlagatelji (sponzorji) pridobili širok in
podroben vpogled v različna nagnjenja ljudi (tudi potrošniških) od makroskopskega pa tja do
mikroskopskega nivoja. Tudi v tem tiči zelo pozitivna lastnost UDK-ja, da je možno podatke /
informacije v obliki spletnih povezav razvrščati na zelo globalne kot tudi zelo ozke vidike in
povrhu tega UDK omogoča multidisciplinarne in celo (zaenkrat v nekoliko okrnjeni obliki)
interdisciplinarne povezave med različnimi področji človekovih zanimanj oziroma znanj.

Spletne UDK knjižnice si ne zamišljam kot osamljen otok sredi morja, ampak kot zbir
porazdeljenih, vendar standardiziranih / urejenih večjih in manjših enot, ki so financirane s
strani države kot tudi drugih, ki sem jih že omenil in nenazadnje morebitnih tujih vlagateljev.
Na prizorišče bi tako dejansko stopili novi knjižničarji / informatiki, ki jih je na Danskem, v
Nemčiji, Angliji, ZDA itd. že precejšnjo število, a pri nas v Sloveniji marsikdo s področja
knjižničarstva informacijske smeri (oseba, ki je zaključila študij samostojne študijske smeri
bibliotekarstva v Ljubljani s poudarkom tudi na informatiko) ne more dobiti zaposlitve v
klasični knjižnici, ker so delovna mesta dobesedno zasedana. To stanje se po mojem mnenju
tudi v prihodnosti ne bo bistveno spremenilo in zato menim, da bi lahko v spletnih UDK
knjižnicah našli zaposlitev sodobni knjižničarji / informatiki kot tudi drugi (npr. programerji
ipd.).V tem vpogledu bi seveda sodobni informacijski knjižničarji ne bili nasprotniki
klasičnih, ampak bi lahko z njimi tudi sodelovali, še zlasti v šolskih in visokošolskih
knjižnicah npr. v vzgojnoizobraževalnem procesu. Knjižničarji / informatiki “brez zidov” bi
lahko celo popestrili svoje storitve prav v smeri statističnih analiz obnašanja spletnih
obiskovalcev (tudi potencialnih kupcev) za različna podjetja, ministrstva itd.

Za uresničitev doslej zapisanega potrebujemo močen kolektivni efekt naklonjenosti te zamisli,


kajti brez njega ni možno v družbi ničesar uresničiti!

Zdaj, ko sem obrazložil pomen UDK-ja se mi zdi smiselno še nekoliko dodatnih besed
posvetiti principu delovanja CPS-a. Preden bi bilo smotrno to izvesti, se mi zdi najprej

[6]
neobhodno potrebno na kratko obrazložiti pomen Clickstream analiz. Namen “Clickstream
(C)” analiz podatkov je v tem, da lahko preučujemo (s pomočjo klikov) pretok poizvedb
oziroma dejavnosti spletnih obiskovalcev po posameznih spletnih straneh na medmrežju, kar
nam lahko daje različne koristne podatke / informacije o naslednjih stvareh: ugotavljanje
obiskovalčevih zanimanj, kako dolgo so si ogledali določene spletne strani, od kod so prispeli
na določeno spletno stran itd. Cilji “C “ – analiz so v tem, da želi ponudnik proizvodov ali
storitev boljše razumeti obiskovalčevo obnašanje, permanentne lastnosti spletnih
obiskovalcev itd., da bi lahko na podlagi teh dragocenih podatkov ponudniki ustvarjali
odgovarjajoče spletne strani za spletne obiskovalce, kjer se tudi nahajajo potrebni podatki /
informacije, ki zelo dobro zadovoljijo njihove informacijske potrebe. Kot že nekajkrat
omenjeno spletni obiskovalci pri pregledovanju spletnih strani puščajo za sabo sledi, ki se
popisujejo v dnevniku (Log Files) spletnega strežnika in to v obliki IP naslovov, vstopnih
(login) ID, piškotkov, če so na voljo (cookies) ipd. Na podlagi teh sledi pa je možno delno
prepoznati oziroma vsaj razlikovati določene spletne obiskovalce. Naj še kot zanimivost
prikažem poenostavljen preglednični prikaz tovrstnega zapisa:

1.2 Preglednica 1: Poenostavljen zgled dnevnika spletnega strežnika za obisk na UDK


leksikonu (http://www.beepworld.de/members29/udkleksikon)

ID Datum IP Ukaz Oper. Sist. Spletni naslov / sklic


in ura naslovi /
brskalnik
1 02.05.2 195.13 "GET / Windows www.najdi.si/search.jsp?q=udk+leksikon&ct=Trident
004 0.43.42 robots.txt" 95 / MSIE &st=simple&fh=1&area=si&x=37&y=10
15:00:0 4
0
2 02.05.2 217.72. "GET/ Windows cobiss3.izum.si/scripts/cobiss?ukaz=DISP&id=10294
004 91.220 main.html" XP / 70864662451&rec=118&sid=1
15:01:1 MSIE 6
0
3 02.05.2 212.72. "GET Windows www.matkurja.com/slo/search?keys=znanosti+tehnik
004 98.162 /index.html XP / e+&x=24&y=5
15.01:3 " MSIE 6
5
4 02.05.2 193.32. "GET Windows www.beepworld.de/members29/udkleksikon/podrocj
004 3.x /news.html 2000 / e6.htm
15:02:0 " MSIE 5
1
5 02.05.2 62.77.2 "GET / Windows www.google.com/search?hl=sl&ie=UTF-
004 18.54 logo.gif" 98 / Opera 8&oe=UTF-8&q=udk+leksikon&btnG=Iskanje&lr=
15:02:0
2

S preglednice 1 lahko razberemo naslednje: vrstni red vstopa spletnega obiskovalca na stran
UDK LEKSIKONA (Login ID), datum in čas vstopa na stran, IP naslov obiskovalca,
izhajajoči zahtevek odjemalčevega brskalnika (browser), vrsto operacijskega sistema (npr.
Windows XP) in vrsto različice spletnega brskalnika (npr. MSIE 6 – Microsoft Internet
Explorer 6) ter nenazadnje spletne strani, s katere je prišel spletni obiskovalec na UDK
LEKSIKON. Tako pridobljeni podatki še niso povsem primerni za učinkovito analizo spletnih
obiskovalcev, kajti manjkajo še zelo koristni podatki npr. o ogledih posameznih spletnih
straneh, začetek in konec ogledov oziroma sej itd. Da si o spletnih obiskovalcih pridobimo še
druge pomembne podatke / informacije nujno potrebujemo kakovostno programsko orodje za
analizo prometa na določenih spletnih straneh kot npr. IBM Tivoli Web Site Analyzer, s

[7]
katerim je možno odložiti podatke v npr. Tivoli Enterprise PS (v njem je možno shraniti tudi
zgodovinske podatke npr. o nagibih kupcev za nakupe cenejših izdelkov itd.).

Naj si kot zaključek in kot zanimivost tega uvodnega poglavja še čisto na kratko oglejmo
arhitekturo spletnega CPS-a, ki pomeni nova oblika PS za učinkovitejšo (hitrejši dostop do
podatkov) in kakovostnejšo podporo elektronskemu poslovanju. Spletno CPS je identično
klasičnemu, vendar pa prinaša s sabo dodatne zahteve t.j. zajemanje “Clickstream-a” (naj bi
zajel sledi spletnih obiskovalcev) kot tudi celovito delovanje na spletu.

1.3 Slikovni prikaz 2: Arhitektura spletnega CPS in proces zajema ter


obdelave podatkov v PS za analize

Na slikovnem prikazu 2 lahko vidimo, da uporabnik s pomočjo oskrbovalca internetnih


storitev (ISP – Internet Service Provider) dostopa na medmrežje (Internet). Prav to je z vidika
analiz sej spletnih obiskovalcev npr. v tem primeru UDK LEKSIKONA (ima status privzete
strani) najbolj zaželen scenarij. Strežniki spletnega CPS podpirajo tako sprotno (online)
transakcijsko kot tudi sprotno analitično procesiranje podatkov. Za varnost usmerjenih
podatkov poskrbijo požarne pregrade (gl. sliko med aplikativnim in transakcijskim strežnikom
ter med strežniki spletnega CPS-a ). Orodje ETL (Extraction, Transformation and Loading
tool) podatke iz IBM podatkovnih baz (DB2 – ti podatki izhajajo z analiz s pomočjo
programske aplikacije IBM Tivoli WEB SITE Analyzer) očisti, jih spreminja, nakar jih odloži /

[8]
naloži v PS. Tako spremenjeni podatki so potem pripravljeni za različne uporabniške analize.
IBM Tivoli Web Site Analyzer vsebuje tudi “Clickstream” podsistem (ETL procesi),
transformacijski podsistem (npr. omogoča organizacijo Web Mart shem, kategorizacijo in
integracijo podatkov). Prav ta programska aplikacija omogoča tudi odlaganje prečiščenih in
spremenjenih podatkov v PS, ki so potem pripravljeni za potrebne in koristne uporabniške
analize (v tem primeru za spremljanje zanimanj spletnih obiskovalcev na UDK leksikonu).

V tem glavnem uvodnem poglavju sem sicer zelo ambiciozno razmišljal (Think big),
vendar se bom v nadaljevanju tega pisanja ravnal po načelu “Načrtuj po majhnih
korakih”!

Glavno uvodno poglavje, ki je bilo bolj kot ne teoretičnega, (ustvarjalno) miselnega in


osvetljevalnega značaja sem s tem zaključil.

[9]
1.4 Namen seminarske naloge

V tej seminarski nalogi kanim prikazati (okrnjen) načrt izgradnje CPS za spremljanje
interesnih področij spletnih obiskovalcev na slovenski UDK digitalni knjižnici, ki vključuje
naslednje stopnje:

 vzpostavitev projekta
 načrtovanje projekta
 opredelitev zahtev
 določitev virov podatkov
 ocena kakovosti podatkov
 dimenzijski podatkovni model predlaganega CPS-a

Naj si kot vodilo za nadaljevanje tega pisnega izdelka, tako zase kot tudi za bralce, narišem
diagram poslovnega dimenzijskega življenjskega kroga za načrt (prevod iz angl.: The
Business Dimensional Lifecycle diagram) PS-a.

1.4 Slikovni prikaz 3: Poslovni dimenzijski življenjski krog načrta PS

Slika 3 prikazuje vse stopnje v življenjskemu krogu načrta PS: (vodenje) in načrtovanje
projekta, opredelitev poslovnih zahtev, ki vključuje načrt tehnične arhitekture, izbor
proizvodov in vgraditev, specifikacijo in razvoj aplikacije končnih uporabnikov, nakar se
nadaljuje pri stopnji dimenzijskega modeliranja, potem fizični načrt, načrt priprave podatkov
in razvoja, njihova razporeditev (za uporabo) in nenazadnje stopnja vzdrževanja in rasti (npr.
podpora in izobraževanje poslovnih uporabnikov ipd.).

[10]
V tej seminarski nalogi bom obravnaval naslednje stopnje pri načrtu za CPS (gl. simbol
žarnice): vzpostavitev in načrtovanje projekta, opredelitev (poslovnih) zahtev in dimenzijsko
modeliranje.

[11]
1.5 Opredelitev oziroma osvetlitev problema

Ena od glavnih zadreg poleg velikih stroškov za izgradnjo CPS tiči v tem, da ni možno prav
vseh spletnih obiskovalcev prepoznati in povrhu tega je tudi zelo pereč problem predmet
neokrnjenosti človekove osebnosti, kajti ljudje smo v svoji notranji biti zavezani intimnosti in
se zlahka počutimo ogroženi, ko ta zasebnost utegne dobiti majave temelje. Glede navedenega
bi lahko ponudil zelo enostavne rešitve, ki pa izhajajo z določenih prepostavk:

 predpostavka 1: znano je, da je možno lažje prepoznati tiste spletne obiskovalce, ki bi


v svojem osebnem računalniku pod medmrežne opcije (Internet options) določile
spletni naslov spletne UDK knjižnice kot privzeto stran.

Možna rešitev: Če bi npr. mnogo posameznikov in morda vse knjižnice v Sloveniji določile
spletni naslov spletne UDK knjižnice kot privzeto stran, bi tako lažje prepoznali spletne
obiskovalce (npr. z IP naslovi, uporabljeni operacijski sistemi itd.).

 predpostavka 2: to pomeni, da bi morala biti spletna UDK knjižnica vsebinsko zelo


bogata in gibljiva, da bi ugodila okusu različnih profilov spletnih obiskovalcev. Prav ti
naj bi to (določitev spletni naslov spletne UDK knjižnice kot privzeto stran) sprejemali
kot nekaj samoumevnega.

Možna rešitev: v tem vpogledu ne kaže zanemariti raziskav, ki se dotikajo obnašanja oziroma
lastnostim (zahtev / potreb / želja / sposobnosti / možnosti itd.) spletnih obiskovalcev (npr.
kognitivni slogi poizvedovanja, informacijska pismenost, uporaba zunanjih in notranjih
iskalnikov ipd.). Prav zaradi pomembnosti tega vidika je po mojem mnenju ključnega
pomena, da bi pred izgradnjo prave spletne UDK knjižnice najprej učinkovali s prototipom
npr. UDK LEKSIKONOM, ki bi odigral tudi vlogo prikritega spletnega “vprašalnika”, kar bi
lahko storili z nekoliko brezplačnimi spletnimi statističnimi programi za spremljanje obiskov
(Nedstad, Extreme Tracking itd.) in z uporabo kakovostnih tudi nekoliko brezplačnih
notranjih indeksnih iskalnikov (npr. zelo dober za te namene je PicoSearch ipd.). S tovrstnim
pristopom bi sicer izgradnja spletne UDK knjižnice trajala nekoliko dalj časa, vendar bi bilo
možno prihraniti veliko denarnih sredstev kot tudi delovnih vložkov npr. za programiranje teh
programskih orodij in povrhu tega je vgradnja teh “brezplačnih” programskih orodij na
spletno stran zelo enostavna! Prihranimo denar, kjer se da, vendar moramo paziti tudi na
kakovost teh brezplačnih spletnih storitev, kar bi pa lahko bila tema posebne seminarske
naloge.

 predpostavka 3: spletne obiskovalce bi bilo potrebno spodbuditi k registraciji na


spletno UDK knjižnico ne samo s koristnimi podatki / informacijami. Možna rešitev:
Ob registraciji spletnih obiskovalcev na spletno UDK knjižnico (tako dobimo še vrsta
drugih koristnih podatkov o spletnem obiskovalcu npr. ime, priimek, mesto bivanja,
starost itd.) bi le-te lahko spodbudili z dodatnimi uporabnimi (celo brezplačnimi)
storitvami kot tudi s koristnimi nagradami (ne samo denarne) s strani npr. sponzorjev.
Ob tem naj kot primer navedem 21 letnega miljonarja Davida Finkenstädta, ki je
približno pred štirimi leti ustanovil virtualni kolektiv Beepworld.de, ki ponuja tudi
brezplačne spletne storitve za izdelavo spletnih strani. Pridobil si je že takrat močne
sponzorje od nemške enote E-Baya, do telekomunikacijskih podjetij O 2, nemška
Telecom itd. Koristniki teh spletnih storitev so tudi spodbujeni z lepimi nagradami od
mobilnih telefonov, oblačil, potovanj itd.

[12]
 Nenazadnje bi še želel opozoriti na problem, ki v bistvu z vidika IT kot je PS ni pravi
problem. Že pri izgradnji prototipa UDK leksikona oziroma v kasnejši stopnji spletne
UDK digitalne knjižnice bi lahko vse spletne dokumente (kot vir za zaželene /
potrebne podatke / informacije) pripravili v enotnem formatu (npr. predlog v HTML),
kar bi sicer povečevalo delovne vložke, vendar bi pa morda tovrsten pristop
zmanjševal zmedo (standardizirano – podobno kot kataložni zapisi v sistemu
COBBIS/COBIB)? Naj zadnje navedeno velja zgolj kot zamisel, o kateri bi se
izplačalo še razpravljati!

[13]
Vzpostavitev projekta
Posebna opomba: Spletni UDK LEKSIKON je hibridne narave kar pomeni naslednje:

 je v vlogi spletnega leksikona - znotraj posameznih področij (ožje gledano)


 je v vlogi spletne enciklopedije – pokriva različna področja (širši pogled)
 je v vlogi spletne knjižnice, saj vsebuje različne spletne publikacije od člankov, knjig,
diplomskih del in je urejen po UDK, je glede urejenosti gradiva nekakšna preslikava
klasične knjižnice s prostim pristopom, ki je urejeno po UDK – ju
 Lahko odigra tudi vlogo informacijskega sistema

[14]
2 Vzpostavitev projekta
Priporočljivo je najprej pripraviti projekt t.j še zlasti priporočljivo za tiste pobudnike
projektov ali določene posameznike, ki v delovnih organizacijah ne zasedajo ključne položaje
oziroma niso v delovnem razmerju, namreč pobudnik nekega projekta si mora najprej
pridobiti ustrezno odobritev za vzpostavitev projekta. Posameznik se mora najprej prepričati o
tem, če sploh obstaja interes za obstoječo zamisel, kajti če je stališče do ponujenega nevtralno
ali celo odklonilno, je v tem primeru boljše, da si posameznik poišče ali druge potencialne
zainteresirance ali pa da popolnoma opusti zamisel za projekt. Še posebej PS-a so denarno
gledano precej zahteven projekt in če pri tem ni močnih sponzorjev je velika verjetnost, da ni
velikih izgledov za uspeh. Dosedanje izkušnje v zvezi s PS kažejo na to, da se tovrstno stanje
tudi pozneje bistveno ne spremeni.

Ena od možnih različic za pripravo projekta je lahko takšna kot jo kaže slika 4 (gl. naslednjo
stran). Posameznik oziroma pobudnik projekta najprej sproži dogodek, pošlje dopise na
naslove potencialnih interesentov (sponzorji, delovne organizacije, uporabniki in informatiki /
strokovnjaki). Ko sprejeto akterji pregledajo in pozitivno ovrednotijo, podpis pogodbe z
zunanjim izvajalcem ni več vprašanje. Predstopnja priprave projekta je zaključena takrat, ko
je odobrena stopnja vzpostavitve projekta (gl. spodnjo sliko 4).

Preden se bom lahko lotil stopnje vzpostavitve projekta, bi bilo najprej potrebno določiti
ključne nosilce projekta in njihove vloge, ki so:

a. Naročnik (sponzor, zavod ipd.) – vplivna oseba, ki v večini primerov projekt financira.
b. Uporabnik – je oseba, ki je ključnega pomena pri določanju izdelkov projekta, kajti na
uporabnike bodo izdelki projekta najbolj vplivali.
c. Izvajalec – je oseba, ki izvaja dela na projektu in uresničuje naročnikove in
uporabnikove zahteve.

[15]
2.1 slikovni prikaz 4: Priprava projekta

V nadaljevanju tega pisanja bom izhajal z že navedene pozitivne predpostavke, ki pomeni


zeleno luč za vzpostavitev projekta.

[16]
2.2 Slikovni prikaz 5: Grob prikaz stopnje vzpostavitve projekta

Slika 5 v grobem prikazuje (slika 5 bo služila kot okvirno orientacijsko sredstvo) aktivnosti
vzpostavitve projekta, ki si ga predstavljam kot večplastno razmišljanje (gl. prikaz plasti na
levem zgornjem robu slike), kar je lahko koristno z vidika analitičnega mišljenja, ko pri
zaključku vzpostavitve projekta izvedemo pregled za nazaj. Prikazane so naslednje poglavitne
dejavnosti, ki so oštevilčene od 1 – 5.

1. Spodnja plast vzpostavitve projekta oziroma prva aktivnost (z vidika retroanalize) je


določitev organizacijske strukture projekta. V tej stopnji se iščejo ustrezno strokovno
usposobljene osebe, ki naj bi bile sposobne opravljati določene delovne naloge na
projektu. Tako se izberejo člani za projektni svet, določa se predstojnik projekta,
izbere se, kdo bo delal v projektni skupini, kdo bo vodja projekta in nenazadnje kdo bo
vodja kakovosti ter katere osebe bodo ocenjevalci kakovosti.

[17]
2. Druga plast prikazuje dejavnost izdelave načrtov. Za načrtovanje projekta je potrebno
v soodvisnosti z aktivnostmi določati izdelke in izdelati načrte (npr. gantogram,
strukturni diagram itd.).
3. Vodja projekta izdela vzpostavitveni dokument projekta (VDP), ki ga pozneje na
vzpostavitvenem sestanku projekta tudi potrdijo.
4. Četrta plast prikazuje dejavnost izdelave in podpisovanja adhezijskih pogodb ali
aneksov (dodatkov). Ko so te formalnosti urejene sledi naslednja stopnja dejavnosti.
5. Peta plast prikazuje dejavnost izvedbe vzpostavitvenega sestanka projekta, kjer se
sprejme formalna odobritev projekta npr. cilji, obseg itd. - skliče ga predstojnik
projekta.

Že zaradi prostorskih razlogov kanim v tem pisanju zgolj okvirno prikazati konkretni potek
vzpostavitve projekta.

Začetek

a. Uvodni sestanek (2004-05-08, 10:00 – 17:00) – na tej točki smo določili (pobudnik /
izvajalec, vodja in predstojnik projekta) naziv projekta, namen, cilje in ostale vloge na
projektu (podrobnejši opis sledi v nadaljevanju). Povrhu tega smo tudi predstavili
naročnika (Šolski center SSK / knjižnica SSK), sponzorje (Pivovarna Laško,
Mercator, Ministrstvo za znanost šolstvo in šport, IZUM Maribor), izvajalec (Karl
Petrič) in vodjo projekta (ravnatelj SSK XY).

 Naziv projekta – UDKEUKLIK 1/2004


 Namen projekta – spremljati področna zanimanja spletnih obiskovalcev na UDK
leksikonu s pomočjo CPS. Dolgoročni pomen glede teh prizadevanj je v tem, da bolje
spoznamo želje / potrebe spletnih obiskovalcev, kar lahko vodi do bolj kakovostnega
uresničevanja glavnega cilja (družbena blaginja) in morda tudi do dobička v denarni
vrednosti.
 Cilj – glavni cilj projekta UDKEUKLIK 1/2004 je v tem, da bi izboljšali kakovost in
učinkovitost vzgojnoizobraževalnega procesa v srednjih šolah. S tega glavnega cilja je
možno tudi izpeljati podcilje, ki pa so lahko tudi zanimivi za sponzorje, ki se ne
ukvarjajo s šolstvom t.j. npr. Trgovinski center Mercator, ki želi dobiti podatke /
informacije v zvezi s širokim spektrom zanimanj spletnih obiskovalcev, kajti
potencialne stranke se mnogokrat ne odločajo za nakup določenega izdelka zgolj z
vidika njegove cene ipd., ampak mnogokrat razmišljajo širše oziroma bolj sestavljeno
kot npr.: spletni obiskovalec si ogleda strani v zvezi s hišami, pohištvom in orodji. Ko
pa si ta obiskovalec še ogleda povezave, ki vodijo na spletne trgovine, je to lahko že
kupec določenih izdelkov, kjer pa potem odločajo še drugi dejavniki kot so npr. cena,
kakovost, kupna moč itd.

a. določitev organizacijske strukture projekta

[18]
2.3 Slikovni prikaz 6: Okvirna organizacijska struktura projekta

Slika 6 prikazuje okvirno organizacijsko strukturo projekta, kjer ravnatelj SSK poimenuje
predstojnika projekta (namestnik ravnatelja Pivovarne Laško), ki naj bi bil sposoben
zagotoviti potrebna denarna sredstva in naj bi podpisal tudi pogodbe z zunanjimi izvajalci, ki
so tudi poleg tehničnih svetovalcev in uporabnikov / informatikov člani projektnega sveta.
Vodja projekta naj bi zelo dobro poznal delovno organizacijo, ključne uporabnike in v zavodu
obstoječo informacijsko tehnologijo. Na podlagi tega smo na uvodnem sestanku izbrali vodjo
informatike v šolskem centru SSK. Vodja projekta vodi projektno skupino, ki je sestavljena iz
informatikov / organizatorjev, računalnikarjev izvedencev za programsko in strojno opremo in
računalnikarjev programerjev. Projektna skupina šteje vključno z vodjem projekta 11 ljudi.

[19]
Na sestanku smo določili tudi vodjo kakovosti, zaposlen v šolskem centru SSK, ki sicer v tem
zavodu skrbi za kakovost računalniškega opismenjevanja. Glede presojevalcev kakovosti smo
bili mnenja, da bo kakovost ocenjeval projektni svet, kajti morebitni dodatni zunanji izvajalci
(npr. izvedenci za IT) bi zahtevali dodatna denarna sredstva, kar bi lahko ogrozilo ves projekt.

c.) Okvirni načrt za načrtovanje odvisnosti med izdelki in aktivnostmi na projektu


(2004-05-08, 10:00 – 17:00)

Točka 2.4 slika 7 na naslednji strani prikazuje odvisnosti med izdelki in aktivnostmi na
projektu. Po daljši razpravi smo se odločili, da bomo uporabili ta model. Odločili smo se za
naslednje:

 analiza obstoječega stanja – določitev strateških prvin, izdelava povezovalnih matrik


in pregled obstoječega stanja CPS v šolskem centru SSK.
 opredelitev potrebnega stanja, ki se členi na opredelitev organizacijskih zahtev
(decentralizirana matrična oblika organizacije), opredelitev poslovnih zahtev
(denarna sredstva) in opredelitev tehnoloških zahtev (potrebna strojna oprema,
programska oprema).
 načrtovanje CPS naj bi vsebovalo seznam aplikacij s prioritetami, področne planske
dejavnosti, načrt sredstev – vključno s potrebami po kadrih in nenazadnje načrt
postopkov oziroma operativni plan.
 slovar izrazov s poprej navedenih aktivnosti in izdelkov naj bi bil izdelek zadnje
aktivnosti izdelave dokumentacije.

Ta načrt je seveda okviren in bo po vsej verjetnosti v nadaljevanju naših prizadevanj


spremenjen. Gre v bistvu za okvirno smernico našega nadaljnjega delovanja.

[20]
2.4 Slikovni prikaz 7: Okvirni načrt za načrtovanje odvisnosti med izdelki in
aktivnostmi na projektu UDKEUKLIK 1/2004

Gornji slikovni prikaz 7 je kot že prej omenjeno zgolj okviren in ocenjujem, da v poznejši fazi
delovanja morda kakšen od navedenih izdelkov ne bo potreben. V nadaljevanju bo potrebno
izdelati strukturni diagram izdelkov projekta za načrt CPS.

d.) strukturni diagram izdelkov projekta za načrt CPS (2004-05-09, 09:00 – 17:00)

Odločili smo se, da si zaradi nazornejše predstave za načrt projekta CPS izdelamo še
strukturni diagram izdelkov projekta za načrt CPS. Izdelki so bili že na sliki 7 okvirno
prikazani, vendar smo potrebovali natančnejši in čistejši vpogled v zgradbo izdelkov, kajti v
strukturnem diagramu so izdelki natančneje razčlenjeni na točke od 1 do 8 (npr. natančen
prikaz strateških prvin itd.).

[21]
2.5 Slikovni prikaz 8: Strukturni diagram izdelkov projekta za načrt CPS

Vsi izdelki, ki jih prikazuje strukturni diagram so razvrščeni v skupine od 1 – 8 in so


naslednji:

Točka 1 / uvod – je v tem pomenu pisni izdelek, v katerem so navedeni prvi koraki za načrt
CPS (gl. na strani 18). Odločili smo se, da izdelamo strukturni diagram (slika 8) kot ga
priporoča EMRIS (enotna metodologija za razvoj IS) za strateško načrtovanje IS in ga v
poznejši stopnji prilagodimo svojim potrebam.

Točka 2 / strateške prvine se členi na 11 podenot, ki so naslednje:

[22]
Točka 2.1 / poslanstvo in vizija DO (ali organizacijskega sistema), točka 2.2 cilji DO, točka
2.3 usmeritve DO, točka 2.4 cilji CPS, točka 2.5 usmeritve CPS, točka 2.6 problemi DO,
točka 2.7 problemi CPS, točka 2.8 povezovalna matrika glede problemov ciljev, točka 2.9
kritični dejavniki uspeha (KDU) DO, točka 2.10 KDU CPS in točka 2.11 povezovalna matrika
glede primerjave ciljev nasproti poslovnimi pravili in problemov v odnosu do poslovnih
pravil.

Točka 3 / pregledni model DO se nadalje členi na 12 enot:

Točka 3.1 organizacijska slika DO, točka 3.2 povezovalni matriki glede organizacijske enote
in lokacije ter organizacijske enote in poslovna pravila, točka 3.3 globalni funkcionalni
model, točka 3.4 povezovalne matrike glede na funkcije v razmerju do lokacije,
organizacijske enote, odgovorne osebe in poslovnih pravil, točka 3.5 globalni model
podatkovnih tokov, točka 3.6 globalni model delovnih procesov (DP), točka 3.7 povezovalne
matrike DP glede na funkcije, entitete in poslovna pravila, točka 3.8 globalni podatkovni
model, točka 3.9 povezovalne matrike entitet glede na funkcije, lokacije in organizacijske
enote, točka 3.10 model uporabe mobilnih komunikacij, točka 3.11 model povezovanja in
točka 3.12 povezovalna matrika entiteta / CPS.

Točka 4 / pregled obstoječega stanja CPS (POSCPS) se členi na šest enot:

Točka 4.1 Pregled strojne opreme, točka 4.2 pregled komunikacijske opreme, točka 4.3
pregled programske opreme, točka 4.4 povezovalna matrika funkcij nasproti aplikacijam,
točka 4.5 pregled informacij na internetu in točka 4.6 pregled kadrov.

Točka 5 / vpliv IT se nadalje deli na dve enoti:

Točka 5.1 opis tehnoloških možnosti in točka 5.2 povezovalna matrika glede tehnoloških
sprememb v primerjavi z zadanimi cilji.

Točka 6 / načrt IT se deli na pet enot:

Točka 6.1 načrt za strojno opremo, točka 6.2 načrt komunikacijske opreme, točka 6.3 načrt
programske opreme, točka 6.4 načrt informacij na internetu in točka 6.5 načrt kadrov.

Točka 7 / Načrt ali plan CPS se členi na štiri enote:

Točka 7.1 Seznam aplikacij s prioritetami, točka 7.2 področne planske aktivnosti, točka 7.3
načrt sredstev in potreb po kadrih ter točka 7.4 operativni načrt.

Točka 8 / dodatek – točka 8.1 slovar izrazov najpomembnejših pojmov v projektu.

e.) Terminski plan ali časovni načrt (2004-05-09)

Gre za predstavitev dejavnosti v odnosu do izdelkov projekta s pomočjo gantograma. Načrt se


predstavi z gantogramom aktivnosti, s katerim lahko prikažemo predviden časovni potek
projekta in nastajanje izdelkov.

[23]
2.6
Slikovni prikaz 9: Terminski plan za CPS v okrnjeni obliki

Slika 9 prikazuje okrnjen terminski plan za CPS, kjer so ponazorjene zgolj glavne aktivnosti
in izdelki. Vse dejavnosti in izdelke obravnavamo s časovnega vidika.

V nadaljevanju smo še prikazali naslednje načrte kot npr. plan virov, finančni načrt in načrt
kakovosti. Zaradi prostorskih razlogov naj v tej seminarski nalogi prikažem zgolj celokupne
ocene.

 Načrt virov – vložen čas v urah je 425 ur.


 Finančni načrt – celokupni stroški za zunanje izvajalce 7.000.000,00 SIT
 Načrt kakovosti – potekajo še razprave

O VDP naj bo povedano le v toliko, da izpostavim pomen tega dokumenta, za katerega je


odgovoren vodja projekta. VDP v podrobnostih določa ves projekt in na vzpostavitvenem
sestanku ga potrdi projektni svet. VDP pomeni tudi formalni začetek dejanske izvedbe
projekta in je sestavljen iz naslednjih točk:

 uvod – v uvodu se predstavi vsebina, ozadje projekta in najpomembnejše dogodke, ki


so vplivali na vzpostavitev projekta.
 specifikacija ali opredelitev projekta – opis obsega
 Raziskovanje upravičenosti – prikažejo se stroški v odvisnosti s koristmi
 organizacijska zgradba – prikazane so vloge nosilcev, vključno z njihovimi
zadolžitvami in pravicami na projektu
 načrt projekta – predstavitev izdelkov (npr. strukturni diagram, terminski plan itd.)
 načrt kakovosti – način zagotavljanja kakovosti na projektu, še zlasti aktivnosti
 nadzor projekta – opredelitev nadzornih točk kot npr. vzpostavitveni sestanek itd. in
opredeljen je način poročanja

[24]
 postopek pri odstopanju pri načrtih – npr. vodja projekta mora ukrepati, če projekt
preseže tolerančne meje
 tveganja – npr. ocenijo se dejavniki, ocenjuje se projekt ipd.
 dokumentacija projekta – npr. opredelila se bo dokumentacija, ki se bo uporabila na
projektu itd.

Ko so vse te zadeve urejene lahko pride do vzpostavitvenega sestanka projekta, ki pomeni


formalna odobritev za izvedbo projekta. V fazi izvajanja projekta mora vodja projekta
nenehno spremljati dogajanja na projektu in povrhu tega mora poskrbeti, da se izvajajo
aktivnosti po načrtu iz VDP.

Zdaj ko sem okvirno predstavil pripravo in vzpostavitev projekta lahko v nadaljevanju


seminarske naloge konkretneje prikažem prvo glavno stopnjo v življenjskemu krogu izgradnje
CPS t.j. načrtovanje projekta (in vodenje). Ta daljši prikaz je okvirno predstavil potrebne
postopke, prvine, dejavnosti, izdelke, ocene itd. in služi kot orientacijsko sredstvo oziroma kot
neke vrste zemljevid za nadaljnja prizadevanja. Načrtovanje projekta (analiza obstoječega
stanja, opredelitev poslovnih zahtev, opredelitev tehnoloških zahtev, načrtovanje CPS itd.)
smo pa že na splošno spoznali znotraj vzpostavitve projekta. Čisto na koncu tega pisanja bom
tudi izdelal oziroma predlagal dimenzijski podatkovni model CPS-a.

[25]
Načrtovanje projekta

[26]
3 Načrtovanje in vodenje projekta
Opredelitev projekta - Naziv projekta – UDKEUKLIK 1/2004 spada v kategorijo srednje
kompleksne projekte. Najprej načrt za izgradnjo enega področnega CPS in v primeru uspeha
se dajo izgraditi še druga področna CPS. Najbolj primerna in preverjena je glede tega primera
distribuirana arhitektura CPS.

Namen projekta – spremljati področna zanimanja spletnih obiskovalcev na UDK leksikonu s


pomočjo CPS. Dolgoročni pomen glede teh prizadevanj je v tem, da bolje spoznamo želje /
potrebe spletnih obiskovalcev, kar lahko vodi do bolj kakovostnega uresničevanja glavnega
cilja (družbena blaginja) in morda tudi do dobička v denarni vrednosti.

Cilj – glavni cilj projekta UDKEUKLIK 1/2004 je v tem, da bi izboljšali kakovost in


učinkovitost vzgojnoizobraževalnega procesa v srednjih šolah ter povrhu tega bi lahko
knjižnice, knjigarne kot tudi drugi zavodi in podjetja (npr. veliki trgovski centri) tovrstne
pridobljene dragocene podatke / informacije uporabili v smeri učinkovitejšega poslovanja
(npr. nabavni načrti, E – poslovanje, ekonomska propaganda itd.).

Ocena pripravljenosti za izvedbo

Obstaja ustrezna poslovna motivacija, obstaja ustrezna socialna mreža med službo za
informatiko in uporabniki, zavod se lahko pohvali z zavidljivim obsegom analiz s področja
organizacije in informatike dela, v zavodu je že vzpostavljena dokaj visoka stopnja tehnične
infrastrukture, kar je ugodno za tehnično izvedljivost projekta, povrhu tega je podpora
vodstva za projekt visoka, prisotni so trije zelo močni sponzorji (IZUM, MZŠŠ in Pivovarna
Laško, medtem ko so ostali sponzorji sporočili, da ne želijo več pri tem projektu sodelovati),
ki imajo vizijo in vanjo verjamejo, vendar ostajajo na realnih tleh, so diskretni in verodostojni
in v družbi uživajo visok ugled. Zavod Šolski center SSK izpolnjuje vse pogoje.

Obseg – služba za informatiko SSK in uporabniki

a. Osnove

Odločili smo se za realizacijo prvega področnega CPS in že po šestih mesecih


pričakujemo konkretne izide.

Spremljali bomo zanimanja spletnih obiskovalcev na straneh UDK leksikona.


Tovrstna prizadevanja bodo dajala izide o bolj ali manj širokem spektru zanimanj
različnih ljudi, še zlasti dijakov in srednješolskih profesorjev kot tudi o drugih ljudeh.
Obetamo si, da bodo pridobljeni izidi prikazali resnično dejanskost področnih
zanimanj, kar bo v precejšnji meri olajšalo izdelavo nabavnega načrta za šolsko
knjižnico SSK in bo neposredno pripomoglo k učinkovitejšemu elektronskemu
poslovanju med knjigarnami in Šolskem centru SSK in posredno / neposredno lahko
tudi na ostale šole oziroma šolske knjižnice, kajti izidi bodo na voljo tudi drugim.

b. Obseg glede števila izvornih sistemov bo tako eden, a število uporabnikov bo 11 (od
tega šest zaposlencev SSK) ter obseg zgodovinskih podatkov v zvezi z interesnimi
področji spletnih obiskovalcev za dve leti.

[27]
c. Tehnična arhitektura za prvo področno CPS bo sestavljena na podlagi naslednjih
zahtev:

Strojna oprema

Dodatni sistemski spomin za trdi disk bo po vsej verjetnosti potreben, kar je odvisno
od velikosti spletnih dnevnikov (log file)

Windows operacijski sistem: Intel® Pentium® 233MHz ali podobno

• Podpira komunikacijski adapter

• 1GB RAM-a

• Windows 2000 strežnik

• 90MB prostora na trdem disku

• CD-ROM gonilnik

• SVGA kartica

• optična miška in tipkovnica

Programska oprema

• Windows NT Server 4.0

Spletni brskalniki

• Netscape Navigator 4.07

• Internet Explorer, 6.0

Podatkovna baza

• DB2 Universal Database 7.1.2

• IBM ETL orodje, Visual Warehouse 3.1

• IBM Tivoli Data warehouse

Programsko orodje za analize

• IBM Tivoli Web Site Analyzer

Log formati za analize

• Sestavljeni log format za HTTP strežnik

[28]
• W3C razširjen log format

• NCSA common log format

• W3C extended log format 4.0 in 5.0

• NCSA navadni log format

d. obseg podatkov v CPS

V CPS-u bodo shranjeni naslednji podatki: datumi in ure obiskanih strani, obiskovalec
(še zlasti registrirani), objekti na strani, poizvedbe na notranjem iskalniku, vrsta in
številka seje, zunanji iskalniki, ki so obiskovalca usmerili na UDK leksikon, proizvodi
/ storitve – v tem primeru so to podatki / informacije, a tudi programska orodja za
nalaganje (download) oziroma hipertekstni kazalci na slike, ki spletnega obiskovalca
napotijo na te spletne strani.

e. Komu so podatki namenjeni?

Podatki naj bi bili namenjeni tako šolskemu kadru, posameznim poslovnežem,


knjigarnarjem in lahko tudi drugim kot npr. tovarnarjem, vodjem trgovskih centrov, za
inštitute družbenih raziskav, skratka podatki so namenjeni vsem tistim, ki jih
preučevanje interesnih področij ljudi zanima in katerim ti podatki lahko tudi v
pozitivnem smislu koristijo tako, da to korist pretvorijo v vsesplošno družbeno korist
tudi v obliki denarnih sredstev.

f. Izključevanje

Glede zajema podatkov bi želeli izključiti naslednje: t.j. ogled reklam, oglede t.i. rumenih
strani, oglede X-strani kot tudi vse tiste strani, katerih vsebina je sporna (npr. nasilje itd.).

g.) Zaključek projekta

Projekt naj bi bil zaključen kot že pri gantogramu omenjeno približno 18. avgusta 2004.

h. Merila uspešnosti – določamo že na začetku, ko določamo obseg

- število razpoložljivih podatkov v GB

- število prijav ali poizvedb v sistem

- čas uporabe

- merjenje kakovosti storitev - razpoložljivost podatkov, kakovost podatkov, pravočasnost


podatkov, odzivni čas za poizvedbo, merjenje vliva na poslovanje.

i.) Ocena upravičenosti

Stroške glede izgradnje CPS so izračunali informatiki in so po njihovih ocenah znašali okoli
100.000,00 Euro. Pri tem so upoštevali naslednje prvine:

[29]
o stroški v zvezi s strojno programsko opremo
o stroški vzdrževanja strojne in programske opreme
o stroški razvojne skupine (notranji)
o stroški zunanjih izvajalcev
o stroški v zvezi z uporabniki

- Končni uporabniki so ocenili veliko korist v obliki družbene blaginje t.j. kakovostnejši
vzgojno-izobraževalni proces (pedagoški kader bolje razume potrebe dijakov), nekateri so
celo ocenili, da se bodo pretekla prizadevanja v prihodnosti bogato nagradila tudi na
denarnem področju npr. pritok denarnih sredstev sponzorjev, pritok denarnih sredstev za
posebne storitve kot npr. statistitične analize na naročila bogatih podjetij ipd.

Oblikovanje projektne skupine

 Projektna skupina šteje vključno z vodjem projekta 11 ljudi.


 Vodja projekta (zaposlen v zavodu SSK kot vodja službe za informatiko), zunanji
izvajalec Karl Petrič (ugotavljanje virov in kakovosti podatkov, podatkovni arhitekt –
logični načrt), programer – zunanji sodelavec IZUM (MDX, ETL proces, DB 2, SQL),
zaposlenec 2 v Šolskem centru SSK (sistemski analitik), zaposlenec 3 v Šolskem
centru SSK (administrator CPS, načrtovalec sistema za pripravo podatkov),
zaposlenec 4 v Šolskem centru SSK (razvijalec aplikacij za končne uporabnike),
zaposlenec 5 v Šolskem centru SSK (organizator izobraževanja), predstavnik
uporabnikov in uporabniki iz MZŠŠ.

Na naslednji strani bom posredoval fragmentaren preglednični prikaz glede sestave projektne
skupine in njihovih nalog / vlog. Pri tem prikazu bom še zlasti izpostavil naloge, ki jih naj bi
opravljal podatkovni arhitekt (Karl Petrič). Ta podatkovni arhitekt je tudi zelo dejaven na
drugih področjih, kar sicer ni najbolj običajno, kar si pa je možno obrazložiti spričo dejstva,
da je ta oseba bila tudi pobudnik tega projekta, zato je na nek način razumljivo, da si le-ta še
dodatno prizadeva, da bi projekt uspešno potekal. V bledo rumenem okviru v zgornjem levem
kotu so opredeljene različne vrste odgovornosti glede opravljanja nalog.

[30]
3.1 Preglednica 2: Projektna skupina in vloge

V preglednici 2 sem še zlasti izpostavil naloge podatkovnega arhitekta, ki jih bo v tem


projektu opravljal, kar je še zlasti razvidno v tretjem predelu preglednice, kjer so podane
naloge kot so analiza podatkov, določitev virov in ocena kakovosti podatkov, izdelava
dimenzijskega podatkovnega modela za CPS, podatkovne zgradbe, tehnike modeliranja
podatkov in razvoj podatkovne arhitekture. Izdelava dimenzijskega podatkovnega modela
(t.j. logični načrt) predlaganega CPS pomeni tudi osrednje zanimanje te seminarske
naloge, tako da se v nadaljevanju tega pisanja ne bom (podrobneje) ukvarjal z drugim
dvema vzporednima vejama, ki potekata sočasno.

[31]
3.2 Opredelitev zahtev
V tej stopnji bom obravnaval naslednji podstopnji:

 opredelitev organizacijskih zahtev (za razmislek)


 opredelitev poslovnih zahtev

3.3 Opredelitev organizacijskih zahtev

V slikovnem prikazu 7, točka 2.4, na strani 21 sem poleg poslovnih in tehnoloških zahtev
navedel tudi organizacijske zahteve. Kot izhodišče za opravljanje nalog pri projektu, smo se
na podlagi izidov z intervjujev s člani projektne skupine in predstojnikom projekta odločili za
projektno organizacijsko obliko na principu načela ločenosti, ki ima to prednost, da temelji na
načelu sodelovalnega sloga delovanja oziroma vodenja, da so dejavnosti na projektu
usmerjene z enega mesta, kar omogoča lažje usklajevanje dejavnosti, boljšo in hitrejšo
izgradnjo CPS, skratka izpeljavo projekta. Pomanjkljivost te organizacijske oblike kot je
pretirana neodvisnost določenih členov v tej sestavi, je možno odpraviti tako, da vodja in (v
tem primeru) pobudnik projekta ves potek nadebudno spremljata. V šolskem centru SSK ta
čas ne potekajo različni projekti, sicer bi se morda prej odločili za matrično organizacijsko
obliko dela. V bližnji prihodnosti se sicer obeta nek manjši projekt v zvezi z razvijanjem
osebnosti pedagoškega kadra, vendar bodo pri tem manjšem projektu glavni nosilci nalog
psihologi, pedagogi in sociologi. V primeru, da bi se prihodnji projekt vsebinsko in tehnično
bolj navezoval na projekt izgradnje CPS, bi se se po vsej verjetnosti odločili za kombinacijo
projektne organizacijske oblike po načelu vgrajenosti in matrične organizacijske oblike dela.
Osnovna zamisel o organizacijskih zahtevah ima svoje ozadje prav v analogiji z nogometnim
moštvom, kjer je še kako pomembna pravilna organizacija igralcev kot tudi drugih kadrov, ki
sodelujejo. Če lahko trdimo, da dobro organizirano nogometno moštvo večinoma premaga
slabše organizirano, potem bi lahko v prenesenem pomenu trdili, da dobro organizirana
projektna skupina lahko premaga manj kakovostno obstoječe stanje, kajti nenazadnje lahko
pomeni opredelitev zahtev že nekakšna tekmovalna napoved obstoječemu stanju ali celo
“tekma” proti obstoječemu stanju!

[32]
3.3.1 Slikovni prikaz 10: Možna različica projektne organizacijske oblike dela,
ki temelji na načelu ločenosti (od morebitnih drugih projektov v SSK)

Na sliki 10 vidimo prikaz DO Šolskega centra SSK z razčlenjeno organizacijsko strukturo


SSK od enolične nadrejenosti uprave nad vrhovnim ravnateljem (na sliki prikazano z znakom
kompozicije – črn romb s črto) pa tja do nadrejenosti vrhovnega ravnatelja (na sliki prikazano
z znakom agregacije – bel romb s črto) nasproti različnimi oddelki (kadrovski, nabavni itd.).
Začasni oddelek “Projekt CPS”, ki sem ga označil z rožnatim pravokotnikom deluje v tem
kontekstu dokaj neodvisno od takrat naprej, ko vrhovni ravnatelj Šolskega centra SSK
poimenuje predstojnika projekta CPS, s katerim se projekt uresničuje (na sliki prikazano z
znakom realizacije – bel trikotnik s prekinjeno črto). Predstojnik, projektni svet in vodja
projekta v medsebojni odvisnosti med sabo sodelujejo (na sliki prikazano z obojesmernimi
puščicami odvisnosti in prekinjenimi črtami). Vodja projekta je nadrejen projektni skupini (na
sliki prikazano z znakom agregacije, kajti projektno skupino sestavlja 10 ljudi). Vodja
kakovosti je iz vrst projektnega sveta (na sliki prikazano z znakom realizacije, saj v tej
različici projektni svet s pomočjo svojega člana vodi kakovost), kateremu so ocenjevalci
kakovosti podrejeni (lahko so tudi člani projektnega sveta). Vodja kakovosti je v
enakovrednem odnosu s projektno skupino (na sliki sem to prikazal z asociativno povezavo –
ravna črta).

V tem primeru tovrstna organizacijska oblika delovanja ne samo, da pospešuje različna dela
na projektu, ampak omogoča tudi večjo mero samostojnosti članov na projektu, kar po mojem
mnenju lahko dviguje samozavest vseh sodelujočih in s tem posledično lahko daje tudi tisti
pozitivni učinek maksimalnega poistovetenja z delom, ki ga opravljajo. Visoka stopnja

[33]
poistovetenja pri delu pa lahko preoblikuje povsem povprečne ljudi v nadpovprečne in s tem
se lahko dosežejo odlični izidi!

Preden bom opredelil poslovne zahteve naj še kot prehod na to podpoglavje izpeljem
določeno spoznanje s področja organizacijskih zahtev. Ustrezna ali neustrezna socialna klima
med sodelujočimi, še zlasti v projektni skupini po moji oceni lahko zelo vpliva na uspešnost
ali neuspešnost projektnega poslanstva in s tem je ustvarjena pozitivna ali pa negativna kal za
nadaljnjo uspešno poslovanje. Organizacijske zahteve so zelo tesno povezane s poslovnimi
zahtevami, morda celo tako tesno, da bi ju lahko združili v eno, kar pa seveda ne gre, če
izhajamo ali s teorije organizacije ali pa teorije poslovanja.

Znotraj organizacijskih zahtev se tudi še srečujemo s posameznimi psihološkimi profili, ki so


bolj ali pa tudi manj primerni za delo npr. v projektni skupini. Ugotavljanje primernih
profilov osebnosti za delo v skupinah (tudi vodenje projekta) oziroma za projektna dela je pa
že v domeni psihologije dela, tako da bi lahko dodali še psihološke zahteve, vendar je ob tem
potrebno poudariti, da lahko to področje tudi uvrstimo v teorijo organizacijskega vedenja
(mikro nivo), ker je pač poudarek našega zanimanja v tem primeru organizacijsko usmerjeno.

Naj še kot zanimivost in kot prehod na naslednje podpoglavje predstavim sociogram socialne
bližine projektne skupine vključno z vodjem projekta, ki nekoliko spominja na R. Kimballov
lakmusov preizkus pripravljenosti ljudi za izgradnjo PS. Socialno bližino med posameznimi
člani projektne skupine, vključujoče vodje, bom ovrednotil z vrednostmi od 0 (0 – 6,5 pomeni
od preveč prijateljskih odnosov do zmernih, 7,5 –14 od zmerno hladnih do nasprotovalnih in
celo sovražnih odnosov) do 14.

Pri ugotavljanju kakovosti in narave odnosov med ljudmi bo potrebno uporabiti različne
tehnike npr. pogovori z vsemi vpletenimi, Belbinov preizkus osebnosti (je zelo učinkovito
orodje), metodo opazovanja, morda kakšni krajši intervjuji o tem, kako si posamezni člani
projektne skupine predstavljajo svoje sodelavce ipd.

[34]
3.3.2 Slikovni prikaz 11: Sociogram socialne bližine članov v projektni skupini
in moč povezav med njimi

[35]
Sociogram socialne bližine članov v projektni skupini na sliki 11 prikazuje poleg odnosov
naklonjenosti / nenaklonjenosti tudi stopnje moči odnosov med njimi t.j. od 0 – 14. Na
podlagi dobljenih izidov bi lahko sklepali, da bo tovrstna delovna skupina težje izpeljala
zadano nalogo, kajti obstaja nekaj zelo negativnih odnosov, ki kažejo na poleg pretirane
subjektivnosti tudi na nezdrav tekmovalni odnos morda celo na sovražnost npr. med vodjem
projekta (3/12) in sistemskim analitikom (3/12). Oba sta pa sicer pri drugih članih projektne
skupine dokaj upoštevana in priljubljena (9 1), kar kaže na neko enakomerno porazdeljeno
moč med njima (vplivnost). Težko je oceniti (premalo je bilo še meritev v zvezi s tem), katere
vrednosti so najbolj ugodne za ustvarjalno in učinkovito delo v projektni skupini, vsekakor
smo pa lahko prepričani o tem, da ali skrajni in intenzivni prijateljski ali nasprotovalni /
sovražni odnosi niso ugodni za delo nasploh (ustrezna stopnja ekvivalentnosti med člani).

3.4 Opredelitev poslovnih zahtev

Po R. Kimballu idr. je opredelitev poslovnih zahtev za izgradnjo (C)PS zelo pomembno, saj
se neposredno ali vsaj posredno dotika naslednjih področij:

3.4.1 Slikovni prikaz 12: Poslovne zahteve kot osrednji vidik CPS

Na sliki 12 vidimo, da ustrezno postavljene poslovne zahteve in v naslednji fazi tudi


uresničenje, lahko pozitivno vplivajo na načrt in vodenje projekta, na dimenzijsko
modeliranje podatkov, na načrt tehnične arhitekture, na fizični načrt itd. Moja naloga v tem
pisanju je (tudi v tem načrtu projekta za CPS) opredeliti ustrezne poslovne zahteve, določiti
vire podatkov (sicer ta točka spada pod oceno obstoječega stanja), nakar določiti merila za
oceno kakovosti podatkov. V naslednjem poglavju bom prikazal izdelavo dimenzijskega
podatkovnega modela predlaganega CPS (v življenjskem krogu izgradnje CPS je to stopnja
dimenzijskega modeliranja). Pod opredelitvijo poslovnih zahtev razumemo zajem le-teh z
vidika (poslovnih) uporabnikov / strank in z vidika kakovosti podatkov, ki lahko v precejšnji

[36]
meri vplivajo na ugoden ali neugoden izid delovanja oziroma ožje gledano, poslovanja. Z
različnimi tehnikami (pogovori s poslovnimi uporabniki, intervjuji, z opazovanjem ipd.) bo
potrebno proučevati poslovne zahteve z vidika uporabnika kot tudi z vidika po kakovosti
podatkov. Kot prvo naj prikažem preglednični načrt nalog za zbiranje podatkov o poslovnih
zahtevah z vidika uporabnikov in kakovosti podatkov.

3.5 Preglednica 3: Zbiranje uporabnikovih zahtev v projektni skupini

V preglednici 3 vidimo sestavo projektne skupine oziroma poslovne uporabnike in različne


vloge njihovih članov pri zbiranju podatkov v zvezi s poslovnimi zahtevami. Pri tem je zopet
v nekoliko nenavadni luči zelo dejavni podatkovni arhitekt, ki je bil tudi pobudnik tega
projekta in že zaradi visoke stopnje poistovetenja s tem projektom vlaga dodatne napore, kajti
prevzema tudi primarne vloge pri zbiranju zahtev, ki sicer niso v njegovi domeni (npr.
določitev in priprava skupinskih intervjujev, izbor intervjujev itd.).

[37]
3.5.1 Preglednica 4: Zbiranje zahtev ostalih uporabnikov s pomočjo
elektronske pošte (E- pošta)

Za dodatno elektronsko zajemanje zahtev drugih uporabnikov s pomočjo seznama E-


naslovov smo se odločili na podlagi ocene, da je ta projekt za izgradnjo CPS v marsikaterem
pogledu nekaj posebnega. Kot glavno in bistveno posebnost tega projekta bi izpostavil
dejstvo, da bo glavni namen tega CPS manj (vsaj spočetka) v poslovnem znamenju, ampak
naj bi imelo visoko raziskovalno in vzgojnoizobraževalno vrednost, t.j. raziskovanje zanimanj
širokega spektra spletnih obiskovalcev, še zlasti šolarjev, srednješolskih profesorjev ipd., da
bi dobljena spoznanja lahko uporabili v smeri načrtovanja (in pozneje izvajanja)
kakovostnejšega in učinkovitejšega vzgojnoizobraževalnega procesa. Sedanje stanje v mnogih
srednjih šolah je takšno, da se mnogi dijaki /-inje ne čutijo upoštevani, so demotivirani za
sodelovanje pri učnem procesu, najbolj nemarljivi dijaki pa povzročajo šolskim zavodom
nemalo stroškov v obliki visokih denarnih vrednosti (npr. razbijanje šolskega inventarja,
prekomeren potrošen odnos do sanitarnih dobrin, potraten odnos do hrane, slab odnos do
zelenic itd.) Po drugi strani so lahko spričo takšnega vzdušja demotivirani (za bolj kakovostno
delo) tudi srednješolski profesorji, ki pa se dijakom/-injam le s težavo približajo in ne poznajo

[38]
njihovih težav pri učenju. Problem, ki sem ga izpostavil je zelo hibridne narave, je sociološki,
organizacijski, komunikacijski in se dotika tudi poslovne sfere. Ta izpostavljen problem bi
lahko poimenovali kot kulturni problem z najširšega vidika in ki povzroča zavodom na daljši
rok gledano velike stroške. Potrebno se je vpletenim v vzgojnoizobraževalnem procesu bolj
približati oziroma jih bolje spoznati in potem jih v nadaljnji stopnji motivirati tudi z
ustreznimi vzgojnimi ukrepi in ne samo v obliki kazni. Znano je, da slaba poslovna oziroma
kultura ljudi nasploh zvišuje sleherni DO in tudi državi transakcijske stroške. Prav zaradi tega
smo pomislili, da bi bilo smotrno zajeti mnenja čim širše populacije ljudi, kajti
vzgojnoizobraževalni proces je pomemben in se ne tiče zgolj peščice uporabnikov. To
dodatno prizadevanje sicer zahteva nekaj več napora in časa, vendar pa poteka zajemanje
mnenj s pomočjo elektronske pošte dokaj hitro. S strani teh uporabnikov pa je sodelovanje pri
E – intervjuju povsem neobvezno, vendar z naše strani je njihovo sodelovanje zelo zaželeno.
Ob tem pa je potrebno pripomniti, da morajo biti tovrstni t.i. E- intervjuji oblikovno nazorni
in vsebinsko prilagojeni temu krogu ljudi!

3.6 Tehnike pridobivanja podatkov

 vizualno zajemanje poslovnih zahtev uporabnikov v projektni skupini – ta tehnika


temelji

na načelu, da naj bi si vsak član projektne skupine izdelal vizualni zemljevid (v obliki shem
ipd.), kako si predstavlja DO, izboljšave v njej, pomanjkljivosti v DO, merila uspešnosti in
pogostost meritev, način reševanja problemov in glede boljšega pretoka informacij v DO,
odprava ozkih grl, promocija storitev, spletni obiskovalci. Pri tem preizkusu bi sodelovali vsi

člani projektne skupine.

 Intervju in pogovor z vodjem poslovanja, ki je hkrati tudi sistemski analitik – zajeli bi


poglede v povezavi o/z/s: delovanjem oziroma poslovanjem oddelkov, metodami za
doseganje pozitivnih poslovnih izidov v obliki storitev, o ključnih poslovnih
vrednotah, opisom storitev, zunanjih uporabnikih / strankah, merjenje oziroma merila
uspešnosti, ovire pri doseganju večje kakovosti in učinkovitosti storitev, ozka grla pri
pridobivanju podatkov, pregled ključnih sistemskih virov, obstoječim procesom za
diseminacijo informacij, orodij za dostop in analizo informacij, vrste analiz,
potrebnimi količinami zgodovinskih podatkov, obstoječimi možnostmi za boljše
poslovanje na podlagi boljšega dostopa do informacij (kratek opis pomena te
izboljšave) itd. Z vodjem poslovanja bi se seveda tudi pogovorili o stvareh, ki se bolj
ali manj posredno dotikajo poslovanja t.j že poprej omenjeni problem slabe poslovne
kulture oziroma kulture v najširšem pogledu.
 E- intervjuji (že prikazano) z ostalimi uporabniki. Snov zajema tako opredelitev
poslovnih zahtev kot tudi zahteve po kakovosti podatkov in kulturni vidik, vendar v
prilagojeni obliki.
 Specializirani intervjuji in pogovori v povezavi s podatki, pri čemer izberemo ključne
poslovne uporabnike za CPS, ki so poznavalci oziroma strokovnjaki za podatke (npr.
programer, administrator podatkovnih baz, podatkovni arhitekt ipd. O tem kasneje po
podpoglavju določitve virov podatkov).

Naj si še ves postopek glede tehnik zbiranja poslovnih zahtev ogledamo z vidika časovnega
zaporedja aktivnosti in udeležencev, ki so sodelovali. Slikovni prikaz 13 (točka 3.6.1) je UML
sekvenčni diagram (ali diagram zaporedja), ki na levem robu prikazuje aktivnosti pri

[39]
pridobivanju podatkov (to so: obvestila za intervjuje s člani projektne skupine / potrditev
prejetja oziroma povratna informacija, obvestila za intervjuje z ostalimi uporabniki /
potrditev sprejetja, obvestila za intervjuje s poznavalci podatkov za CPS / potrditev sprejema,
povratne informacije v obliki shem s strani članov projektne skupine / pri tem sodelujeta tudi
vodja projekta in podatkovni arhitekt, povratne informacije ostalih uporabnikov glede E-
intervjujev, analiza spoznanj, dokumentacija in pregled, objava izidov in zahtev, prednosti /
popravki pri obsegu projekta in odobritev s strani uporabnikov, pregled projekta skupaj s
poslovnimi uporabniki in končno samorefleksija ter potrditev o zaključku intervjujev v zvezi s
poslovnimi zahtevami) na vrhu slike so udeleženci (to so eksploratorji oziroma vodje
intervjujev / spraševalci, člani projektne skupine – teh je 9, kajti vodja projekta in podatkovni
arhitekt sta izvajalca intervjujev / eksploratorja). Na strani 42 po prikazu diagrama zaporedja
sledi še opis uporabljenih simbolov.

[40]
3.6.1 Slika 13: UML sekvenčni diagram aktivnosti in udeleženci pri zajemu zahtev

[41]
K slikovnem prikazu 13 bi pripomnil zgolj pomen asinhronih povratnih sporočil ostalih
uporabnikov. To pomeni, da njihove povratne informacije kot celokupek ne bodo časovno
usklajene, namreč nekateri bodo pošiljali prej, nekateri pozneje, medtem ko nekateri sploh ne
bodo pošiljali povratne informacije v zvezi z E- intervjuji.

Če se še spomnimo slikovnega prikaza na strani 20 in strukturnega diagrama na strani 22


lahko iz tega sklepamo, da je potrebno za opredelitev poslovnih zahtev vedno izhajati iz ocene
ali analize obstoječega stanja, t.j. pregled stanja CPS - v tem primeru tega ni, zato ni obvezen
element, strateške prvine (poslanstvo in vizija, cilji DO, Usmeritve DO itd.) in šele potem
upoštevamo oziroma izpeljemo potrebe / želje / obveznosti za prihodnje poslovanje, ki naj bi
dosegalo boljše izide. V našem konkretnem primeru t.j. šolski zavod, postanejo zadeve
nekoliko bolj zapletene, kajti soočamo se s kategorijami, ki jih le s težavo izmerimo (npr.
kakovost izobraževalne kulture, kakovost pomoči pri iskanju informacij, medsebojno
spoštovanje ipd.) oziroma jim pripišemo neko denarno vrednost, vendar so pa dolgoročno
gledano tako pomembni dejavniki, da je njihov vpliv tudi na poslovne procese neprecenljiv,
kajti slaba kultura v najširšem pogledu lahko pokopa državne sisteme ipd. V našem primeru
se poslovne zahteve ne dotikajo zgolj zmanjševanju stroškov, pridobivanja denarnih sredstev,
smiselni nabavi knjižničnega gradiva itd., ampak gredo poslovna prizadevanja tudi v
heterogene vode, kot npr. vzgoja kakovostnega pedagoškega kadra, ki lahko pozitivno vpliva
na dijake, ki npr. ne bodo uničevali šolskega inventarja, objestno tratili sanitarne dobrine,
uničevali zelenice itd.

Da pa lahko nekoga vzgajamo, moramo najprej temeljiteje spoznati njegove osebnosti (to še
ni dovolj), njegova zanimanja, kar opazujemo tudi na dolgi rok, njegove strahove, njegove
šibkosti, njegove sposobnosti ipd. Po mojem mnenju je tudi v tem smisel uporabe visoko

[42]
razvite informacijske tehnologije kot je npr. CPS, ki bi lahko pripomogel k razrešitvi izredno
kompleksnih organizacijskih oziroma družbenih težav. Če se v družbenih sistemih porajajo
nepravilnosti, hude napake, nasilje itd. je to na nek način alarmno sporočilo, da je veliko
stvari v naših družbah bolj ali manj neurejenih. To pomeni, da je potrebno zadeve urediti, tudi
z meritvami izredno kompliciranih družbenih pojavov, vendar da lahko izmerimo tovrstne
kompleksne družbene pojave pa potrebujemo celo kopico zgodovinskih podatkov (bolj kot je
npr. družbeni pojav kompleksen, več (različnih) podatkov o njemu bomo potrebovali). Toliko
o opredelitvi poslovnih zahtev v šolskem centru SSK. Zdaj pa kot obljubljeno preidemo na
naslednje podpoglavje.

3.7 Določitev virov podatkov

V podatkovno bazo IBM DB2 bodo pritekali zelo heterogeni zunanji (spletni) podatki, ki
bodo po eni strani prišli z različnih strežnikov, z različnih zunanjih in notranjih iskalnikov,
virtualnih vodičev, informacijskih portalov, osebnih strani, s podstrani UDK leksikona, a po
drugi strani bodo tovrstni podatki tudi v različnih formatih. Določitev virov podatkov je
ključnega pomena za ETL proces in za kakovost podatkov. Zajemanje “Clickstream” (sledi)
podatkov o spletnih obiskovalcih je za našo CPS osrednjega pomena. Te podatke o sledeh
spletnih obiskovalcev bom okvirno razvrščal na naslednji način:

 izvor podatkov – Sicer so vsi pridobljeni “clickstream” podatki z medmrežja eksterne


narave, vendar bomo v tem primeru obravnavali vire podatkov z domačega strežnika
in UDK leksikona kot interne podatkovne vire npr. domači strežnik, clickstream
podatki s podstrani UDK leksikona in notranjega iskalnika, UDK diskusijskega
foruma ali eksterni npr. tuj strežnik, clickstream podatki z zunanjih iskalnikov, tujih
spletnih strani tudi osebnih, ki referirajo na UDK leksikon, razni informacijski portali,
ki vsebujejo spletno povezavo do UDK leksikona, z virtualnih vodičev, s spletnih
strani drugih zavodov, podjetij itd.
 razvrščanje virov podatkov z vidika časa – “clickstream” podatki so aktualni
 uporabniški nivo – npr. primarni podatki
 vsebina – številke, drugi simboli, slikovni prikazi, reference, dokumenti
 predstavljenost – v obliki številk, v obliki alfanumeričnih znakov
 Jezik in znakovni nabor – npr. slovenski jezik, osrednji evropejski znakovni nabor ipd.
 stopnja zaupnosti do podatkov – npr. “C” podatki so vedno z verodostojnega vira

Od podatkovnih virov pričakujemo da so:

 konsistentni (da si podatki med seboj niso v nasprotju - teh težav s “C” podatki
nimamo)
 pravilni (da se skladajo z resničnostjo – “C” podatki so pravilni)
 popolni (da ne manjkajo pomembne vrednosti ali pa pomembni atributi)
 natančni (npr. še zlasti pri številčnih (denarnih) vrednostih, da ne manjkajo ustrezna
ločila npr. pika ali vejica) in zrnati (npr. dnevno natančni podatki) – so natančni
 zanesljivi – “C” podatki so zanesljivi
 razumljivi
 uporabni in relevantni

Cilj je ustrezne podatke, ki so jih ustvarili spletni obiskovalci (v obliki sledi) pripraviti tako,
da so uporabni za analizo interesnih področij spletnih obiskovalcev.

[43]
a. že omenjeni dnevnik spletnega strežnika (angl. Web Server Log), ki lahko posreduje
naslednje podatke o spletnih obiskovalcih:

 podatke o IP naslovih
 identifikacijsko obliko odjemalca ali “Ident”, če je aktiviran, sicer ne
 uporabniški ID, v primeru, da določen segment v UDK leksikonu npr. UDK
diskusijski forum zahteva geslo uporabnika za vstop na to stran
 čas poizvedbe oziroma povpraševanja
 prvo vrstico poizvedbe npr. “GET…”
 status – trovrstična koda, ki se vrne k odjemalcu
 bytes – število oziroma količina poslanih bytov
 Referenca – s katere spletne strani ali iskalnika je spletni obiskovalec prispel na UDK
leskikon
 Uporabniški agent – ugotovi naziv in verzijo brskalnika
 piškotki (angl.: Cookies, če je na voljo)

a. zbiralec podatkov (angl.: Data Collector)

 zajame npr. podatke o uporabi STOP gumba pri brskalniku


 zajame podatke o uporabi pošiljanja npr. spletnih naslovov

a. spletni špijoni (angl. Web bugs – bomo uporabili zgolj v namen poizvedovanja
zaslonskih rešitev spletnih obiskovalcev in npr. če vsebuje obiskovalčev brskalnik tudi
multimedijski- Plugin)
b. programi za nadzor spletnega prometa npr. v našem primeru IBM Tivoli Web Site
Analyzer

Na naslednji strani si bomo ogledali globalni model podatkovnih virov (slikovni prikaz 14), ki
prikazuje udeležence in njihove aktivnosti na UDK leksikonu, s katerimi ti spletni obiskovalci
(tudi poslovni uporabniki) ustvarjajo sledi oziroma že kar podatke, ki pomenijo za naše CPS
(t.j spremljanje zanimanj spletnih obiskovalcev in shranjevanje teh podatkov) podatkovne
vire. Ti podatkovni viri s spleta so v naslednjih oblikah:

 Podatki z LOG File-ov – dnevnik spletnega strežnika


 Podatki s spletnih statističnih programov za spremljanje prometa obiska na UDK
leksikonu
 Piškotki (Cookies)
 Podatki z analiz storitev – npr. izpolnjeni spletni obrazci za naročila ipd.
 Podatki s spletnih obrazcev za komunikacijo (npr. diskusijski forum) ipd.

Tovrstne pridobljene podatkovne vire je smotrno shranjevati v podatkovno bazo (npr. IBM
DB2), kajti že samo LOG file-i zavzemajo veliko prostora (govori se o več GB v enem dnevu),
zato je potrebno vse te podatkovne vire s pomočjo ETL orodja očistiti in transformirati. Šele
po tem postopku lahko naložimo ustrezno organizirane podatke v CPS.

“Clickstream” podatki se po postopku čiščenja in transformacije ponavadi odstranijo, saj so to


nekakšni surovi podatkovni viri. Za naše zanimanje niso vsi podatkovni viri relevantni, zato je
pomembno, da tovrstnih podatkov ne shranjujemo. O določitvi oziroma oceni kakovosti
podatkov bom pisal v naslednjem podpoglavju 3.8.

[44]
3.7.1 Slika 14: Globalni model podatkovnih virov in tokov od nastanka do zajema

Globalni model podatkovnih virov (gl. točko 3.7.1 slika 14) prikazuje tok spletnih dogodkov
od nastanka pa do zajema podatkovnih virov. Začetno stanje je na sliki prikazano kot rumen

[45]
krog z zelenimi obrobami. Podatkovne vire ustvarjajo spletni obiskovalci (gl. sliko 14: to so
spletni obiskovalec in poslovni uporabnik prikazana z znakom kvadrata). Najprej ti dostopajo
na internet oziroma ožje gledano na spletni UDK leksikon (znak za zunanjega interaktorja je
pravokotnik). Spletni obiskovalec izvaja različne dejavnosti, ki so npr. poizvedovanje,
brskanje po spletnih straneh, ustvarjanje predlogov ter komuniciranje (gl. sliko 14: dejavnosti
so prikazane kot elipse). Vse te dejavnosti se začasno shranjujejo (na sliki je to prikazano kot
dve debeli črti, med katerima se nahaja rdeč napis). Poslovni uporabnik (gl. sivi pravokotnik)
prav tako izvaja različne spletne dejavnosti, le da so zelo specializirane v smeri poslovnih
prizadevanj. Tako denimo stopi v poslovno interakcijo z dobaviteljem, vendar ta isti poslovni
uporabnik lahko tudi stopi v vlogo nekakšnega dobavitelja (npr. šolski knjižničar posreduje
ravnatelju neke založbe informacije v zvezi z bralnimi navadami srednješolskih profesorjev in
dijakov ipd.). Vse te dejavnosti na spletu ustvarjajo sledi (gl. sliko 14: prikazano kot rumeni
oblaki). Zaključeni izidi teh spletnih dogodkov (na sliki prikazano kot rdeč krog z debelo črno
obrobo) so z vidika spremljanja zanimanj spletnih obiskovalcev pridobljeni podatkovni viri
(na sliki 14 so prikazani kot raznobarvni oblaki). O teh podatkovnih virih sem pisal že na
strani 45, vendar bi k temu dodal še naslednje spoznanje. Podatkovni viri pridobljeni z
dnevnikom spletnega strežnika in spletnimi statističnimi programi so implicitni oziroma
izpeljani podatkovni viri, medtem ko so pridobljeni viri s pomočjo spletnih obrazcev
eksplicitni podatkovni viri, saj celo poznamo ime, priimek itd. spletnega obiskovalca.

Smer nadzornih tokov sem na sliki 14 označil s črno zapolnjenimi puščicami, smer aktivnosti
sem prikazal z zaobljeno črto, ki se zaključi s črno zapolnjeno puščico in povezavo do
spletnih sledi (tudi pridobljenih podatkovnih virov) sem na sliki prikazal s črto.

Torej intervjuji v zvezi s podatkovnimi viri naj bi vsebovali naslednje prvine:

 ključni spletni viri


 dostopnost do zgodovinskih podatkov
 sodobnost podatkov
 proces za diseminacijo informacij uporabnikom
 orodja za dostop in analizo informacij ter izidi pri Ad – Hoc poizvedbah
 lokacije ozkih informacijskih grl
 kakovost podatkov itd.

V nadaljevanju sledi podpoglavje 3.8, ki bo poročalo o kakovosti podatkov.

3.8 Ocena kakovosti podatkov


Kakovost podatkov zelo vpliva na poslovanje kot tudi na učinkovitost, izgradnjo in v
poznejšem obdobju tudi na delovanje (C)PS. Kakovost je sicer brezplačna, vendar pa če ni
ustrezne kakovosti pri zadovoljevanju določenih poslovnih potreb, lahko ta primanjkljaj
ustrezne kakovosti povzroča velike stroške. Kakovost podatkov je sestavljena iz treh
komponent:

 kakovosti opredelitev – kakovost podatkovnih standardov, kakovost podatkovnih imen


in kakovost poslovnih pravil
 kakovosti načrta
 kakovost podatkov

[46]
Ocenjevanje kakovosti podatkov je sestavni del metodologije celovitega obvladanja kakovosti
podatkov (angl.: TQdM – Total Quality data Management), ki se sestoji iz šestih procesov.

3.8.1 Slikovni prikaz 15: Šest procesov TQdM

Slika 15 prikazuje teh šest procesov, od katerih je najpomembnejši in najbolj sestavljeni


proces 6, t.j. vzpostavitev okolja za kakovost podatkov / informacij. Pravijo mu tudi krovni ali
bolj slikovito “dežnikarski proces” (angl.: umbrella process). Bistvo tega prikaza je v tem, da
vzpostavimo ustrezno okolje za kakovost podatkov / informacij, ocenjujemo kakovost,
merimo stroške nastalih zaradi nekakovostnih podatkov, podatke reorganiziramo in očistimo,
nakar si v petem procesu prizadevamo k izboljšanju kakovosti podatkov. Če pa je kakovost
podatkov res boljša, to preverimo tako (kot kaže kontrolni tok v obliki puščiče), da ponovno
zaženemo proces 1, proces 2 in proces 3 itd.

V tem pisanju se bom ukvarjal s procesoma ena (okvirno) in dva (bolj podrobno), vendar z
nekoliko drugačnega vidika. Ocenil bom kakovost podatkov obstoječega spletnega
aplikacijskega sistema UDK leksikona, ki pomeni izhodišče za vse nastale podatkovne vire (v
obliki “clickstream” podatkov) v zvezi s spremljanjem zanimanj spletnih obiskovalcev.
Tovrstne podatke, ki so jih aplikacijska programska orodja zajela / zaznala npr. dnevnik
spletnega strežnika ipd. in posredovala v podatkovno bazo, pa so osrednjega pomena za
izgradnjo CPS.

Proces 1: Ocena kakovosti podatkovnih opredelitev – vsi podatki se opredelijo tako, da jih
lahko poslovni uporabniki pri poslovnem komuniciranju enotno uporabljajo. Tovrstni podatki
se shranjujejo v posebnem seznamu, ki je za vse poslovne uporabnike dostopen. Kakovostne
podatkovne opredelitve naj bi na splošno izgledale tako:

Izraz = nadrejeni razred + razlika / konkretni primer na sliki 16:

[47]
3.8.2 Slikovni prikaz 16: Globalni podatkovni model “Akter”

a. Akter je uporabnik UDK leksikona, ki s pomočjo komunikacije kot zaposlenec v


zavodu prevzema in izvaja različne naloge, da zadovolji zahteve / potrebe / želje
spletnih obiskovalcev v obliki kakovostne /-nih storitve /-tev.

b.) Akter je uporabnik UDK leksikona, ki s pomočjo komunikacije v vlogi spletnega


obiskovalca sprejema / koristi storitve zavoda in se lahko razvršča kot oseba, ki se členi
naprej na posameznika in podjetnika ali kot predstavnik DO, ki se členi na skupino in
poslovno organizacijo.

Toliko o tem.

Proces 2: ocena kakovosti podatkov – preden grem na načrt ocene podatkov v UDK
leksikonu in oceno potrebnih podatkov za spremljanje spletnega prometa oziroma zanimanja
spletnih obiskovalcev, bi najprej kot uvod v problematiko prikazal sliko arhitekture
zamišljenega CPS, da si lahko lažje predstavljamo pomembnost procesa 2, t.j. ocenjevanje
kakovosti podatkov, čeprav ocenjevanje kakovosti podatkovnih virov mnogi načrtovalci
(C)PS zanemarjajo.

[48]
3.8.3 Slikovni prikaz 17: Pritok “clickstream” podatkov z Interneta

“Clickstream” podatki torej prihajajo z medmrežja (konkretneje v našem primeru z UDK


leksikona) v podatkovno bazo. Preden gredo podatki v postopek čiščenja, transformacije in
nalaganja v (področno podatkovno) skladišče (v našem primeru CPS) s pomočjo ETL (angl.:
Extraction, Transformation and Loading) orodja je potrebno oceniti kakovost podatkov v
UDK leksikonu (npr. nedelujoče spletne povezave, nepreglednost vsebin, redundantni podatki
itd.). Povrhu tega moramo oceniti “clickstream” podatke glede tega, ali so ti podatki dovolj
izčrpni za učinkovito analizo dejavnosti spletnih obiskovalcev (na UDK leksikonu). Prav vse
to pa je potrebno storiti zaradi tega, da npr. popravimo (podatkovne) nedoslednosti v UDK
leksikonu, kajti nedoslednosti kot so npr. nedelujoče spletne povezave ali nepreglednost lahko
v najboljšem primeru odvrnejo spletnega obiskovalca za ponovni obisk UDK leksikona, v
slabšem primeru pa se lahko slab sloves UDK leksikona širi še naprej. Če ni spletnih
obiskovalcev, potem tudi ne dobimo zaželene ter dragocene “clickstream” podatke in če ni
teh, potem lahko kar zaključimo s preučevanjem področnih zanimanj spletnih obiskovalcev
(težje ocenjujemo zanimanja in vedenjske vzorce spletnih obiskovalcev). Ostali potek, ki ga
prikazuje slika 17 (polnjenje podatkov v področno podatkovno skladišče – PPS, gradnja novih
PPS in nalaganje podatkov v PS ter sprotni analitični proces -OLAP za obdelavo podatkov in
multidimenzionalna kocka) ni osrednje zanimanje tega pisanja.

Z obzirom na okoliščino, da Šolski center SSK nima svojega CPS, bo pogled na ocenjevanje
kakovosti podatkov (kot že omenjeno) nekoliko drugačen. Izhajati bo potrebno z virov
podatkov, ki so izid sledov, katere so (s kliki) pustili za sabo spletni obiskovalci, medtem ko
so iskali / našli ustrezne podatke / informacije na UDK leksikonu.

V nadaljevanju bom prikazal celokupno zvezdnato preglednično shemo za ocenjevanje


kakovosti podatkovnih virov, nakar jih bom predstavil še posamično.

[49]
Ta model se lahko še naprej razvije tako, da bi dobili kot izid 25 preglednic oziroma pet
zvezdnatih pregledničnih shem. Prva bi se imenovala POGOJI, s katere bi se razvijala druga z
nazivom UKREPI, tretja bi se imenovala MERITVE, četrta bi se imenovala IZRAČUNI in
nenazadnje bi dobili zvezdnato preglednično shemo z nazivom SINTEZA KAKOVOSTI (vse
glavne ocene bi bile združene v tej zadnji shemi). V tej seminarski nalogi bom prikazal zgolj
prvo zvezdnato preglednično shemo z nazivom POGOJI (četrta prvina te sheme je UKREP, ki
ima drugo vsebinsko utež za ovrednotenje – o tem v nadaljevanju podrobneje).

Po teh predstavitvah, se bom še dotaknil prvin, ki jih ta pristop v zvezi z ocenjevanjem


kakovosti podatkov ni zajel, ampak bi lahko bile predmet obravnave drugih zvezdnatih
pregledničnih shem ali pa so takšne narave, da si zaslužijo posamično obravnavo (npr.
problem zlomljenih povezav oziroma v angl.: Blank povezave itd.).

[50]
3.8.4 Slikovni prikaz 17: Celokupen pregled nad oceno kakovosti podatkov

[51]
Slika 17 prikazuje celokupen pregled (za srednje kompleksen načrt) na oceno kakovosti
podatkov glede “clickstreama” in podatkov v obstoječem UDK leksikonu. Zgradba tovrstne
ocenitve kakovosti podatkov je naslednja:

 središčna preglednica zaželenih “clickstream” podatkov in spletnih strani UDK


leksikona, ki vsebuje ocene od –1,0,+1 (gl. sliko v levem zgornjem kotu sleherne
preglednice se nahaja legenda oziroma pomen vrednosti) -
 dimenzijska preglednica 1 (levo zgoraj) zaželenih “clickstream” podatkov in vrsto
možnih podatkovnih virov, ki vsebuje ocene od –1,0,+1
 dimenzijska preglednica 2 (desno zgoraj) z lastnostmi posameznih spletnih strani
UDK leksikona, ki vsebuje ocene od –1,0,+1
 dimenzijska preglednica 3 (desno spodaj) prikazuje lastnosti podatkov spletnih strani
UDK leksikona, ki vsebuje ocene od –1,0,+1
 dimenzijska preglednica 4 (levo spodaj) prikazuje negativne lastnosti in morebitne
ukrepe glede na moč negativnih lastnosti, ki vsebuje ocene od –1,0,+1

Debele črte med središčno preglednico in dimenzijskimi preglednicami pomenijo povezave


med njimi, vendar je središčna preglednica tista, s katere izhajamo. Oštevilčene (npr. 1:)
puščice na sliki pa pomenijo nadzorni tok in vrstni red postopka ocenjevanja kakovosti
podatkov, ki izhaja s središčne preglednice in se potem pomika v smeri urinega kazalca od
prve dimenzijske pa do četrte dimenzijske preglednice.

V nadaljevanju bom prikazal sleherno preglednico posebej, obrazložil izide oziroma ocene,
nakar bom izvedel sintezo spoznanj. Na podlagi spoznanj bo možno tudi odkrivati morebitne
pomembne prvine, ki sem jih v tem (delnem) procesu ocenjevanja kakovosti podatkov ali
spregledal ali pa da so takšne narave, da si zaslužijo posamično obravnavo.

[52]
3.8.5 Preglednica 5: Središčna preglednica – izhodišče

Središčna preglednica prikazuje podatke, ki bi jih želeli s pomočjo “clickstreama” zajeti


(navpični ali vertikalni del preglednice – gl. datum obiskane strani, čas obiska, obiskovalec,
stran / objekt, vrsta zahteve, vrsta seje, ID seje, stran sklica in storitev) in sedanje stanje
spletnih strani UDK leksikona, vključno s področnimi podstranmi (vodoravni ali horizontalni
del preglednice – gl. UDK 0, UDK 1, UDK 2, UDK 3, UDK 5, UDK 6, UDK 7, UDK 8, in
UDK 9). V levem zgornjem kotu preglednice 4 (gl. rumeni pravokotnik) se nahaja legenda v
zvezi z vrednostmi –1, 0 in +1, s katerimi ocenjujemo obstoječo stanje UDK leksikona
nasproti zaželenim stanjem. Vrednost –1 pri tem pomeni, da obstoječo stanje spletnih strani
UDK leksikona ne izpolnjuje zahteve oziroma želje po podatkih, ki bi jih želeli zajeti, kajti
dosedaj uporabljeni spletni analitični orodji za spremljanje obiska (Nedstat in Extremme
Tracking) izpolnjujeta le nekatere zahteve. V svetlo sivi vrstici je možno videti rdečo oznako
SUM, ki pomeni vsota izpolnjenih zahtev po vseh obravnavanih oziroma navedenih spletnih
strani UDK leksikona. Pri tem je glavna UDK stran dosegla 3 točke od devetih možnih, ostale
strani pa so dosegle po –2 točki (ne izpolnjujejo želje), a spletni strani UDK 7 in UDK 9 sta
dosegli –1 točko. Vrednosti smo dobili z vertikalnem seštevanjem (in odštevanjem)
posamičnih ocen. Ko pa seštejemo vrednosti v horizontalni ali vodoravni smeri dobimo
naslednje končne ocene za posamične zahteve:

 UDK glavna stran = +1 … pomeni, da obstoječo stanje spletnega UDK leksikona


izpolnjuje pogoj glede beleženja datuma ali dneva obiskane strani. Kot vidimo s

[53]
seštevkov izpolnjujejo tudi podstrani spletnega UDK leksikona ta pogoj (željo /
zahtevo), zato tudi najvišja možna ocena +10.
 Isto velja za zahtevo / željo po beleženju časa obiska na eno izmed teh strani, kajti tudi
v tem primeru je seštevek ocen +10.
 Glede prepoznavanja identitete spletnega obiskovalca pa je pogoj na vseh straneh
zgolj delno izpolnjen, zato tudi vrednost 0 (nič).
 Za ugotavljanje obiskanosti (stran / objekt) posameznih spletnih povezav (stran /
objekt) znotraj strani UDK leksikona in podstrani pogoji niso izpolnjeni, zato tudi
vrednost –10.
 V zvezi z vrsto zahteve le glavna stran deloma izpolnjuje pogoje (zato vrednost 0),
medtem ko ostale strani ne izpolnjujejo pogoja in skupni seštevek (ali odštevek) ocen
je –9.
 Glede zaželenega podatka za vrsto seje (začetek / konec) vse strani ne izpolnjujejo
pogoj ali željo / zahtevo, zato tudi skupna vrednost ocen –10.
 Pri ID seje pa vse obravnavane strani UDK leksikona izpolnjujejo pogoj, zato tudi
vrednost +10.
 V zvezi s sklicem (referer) na eno izmed strani v spletnem UDK leksikonu izpolnjuje
le glavna stran pogoj, UDK 7 in 9 le delno, medtem ko druge strani ne izpolnjujejo
pogoj in skupna vrednost ocen je tako –7.
 V zvezi z beleženjem storitev le glavna stran izpolnjuje pogoj, medtem ko druge ne
izpolnjujejo pogoj, zato tudi končna vrednost ocen –9.

a. Skupni izid ocen pri vertikalnem seštevanju je tako znašal –13 od  90.

b.) Skupni izid ocen pri horizontalnem seštevanju je bil -15 od  100.

Izida kažeta na to, da je potrebno obstoječo stanje popraviti npr. s tem, da si s pomočjo
ustreznih programskih orodij npr. za spremljanje spletnih obiskovalcev na spletu pridobimo
zaželene podatke (npr. programsko orodje IBM Tivoli Web Analyzer ipd.). Po drugi strani pa
oba končna izida ocen spet nista tako porazna (vrednosti bi lahko bile precej nižje npr. –50 ali
pa celo –90), da ne bi imeli v vidu še kakšno drugo rešitev.

[54]
3.8.6 Preglednica 6: Dimenzijska preglednica – levo zgoraj

Preglednica 6 prikazuje podatke, ki bi jih želeli zajeti (se navezuje na poprejšnjo središčno
preglednico) in štiri spletne aplikacije za spremljanje aktivnosti obiskovalcev na spletu, ki so
v preglednici podane kot vrsta podatkovnih virov. V rumenem pravokotniku je legenda o
vrednostih ocen in vse spletne aplikacije so ovrednotene s temi ocenami glede na podatke, ki
bi jih želeli o spletnih obiskovalcih zajeti.Velja isti princip analitičnega pristopa kot pri
središčni preglednici, zato je po mojem mnenju odveč ponoviti podroben opis ocen s prejšnjih
strani, zato bom navedel zgolj končne ocene.

 Log File (dnevnik spletnega strežnika) – izpolnjuje pogoje glede datuma obiskane
strani, časom obiska, ID seje in strani sklica (referer), glede prepoznavanja identitete
spletnih obiskovalcev le delno preko IP naslovov izpolnjuje zahteve / pogoje, glede
vrste zahteve tudi delno, medtem ko pa glede ostalih želj / zahtev ne izpolnjuje pogoje
(stran / objekt, vrsta seje, storitev). Končna vrednost ocen (vertikalno gledano) je tako
+1.
 Piškotki (cookies) – končna vrednost ocen je –7.
 Brezplačna spletna orodja za analizo spletnega prometa (Web Analyzers) – vrednost
ocen je 0.
 Komunikacijski spletni obrazci kot npr. diskusijski forumi, deloma notranji iskalniki,
spletne ankete itd. so dosegle skupno vrednost ocen +6.

[55]
Skupni izid obeh seštevkov je tako vrednost 0. Tudi tovrstni izidi kažejo na to, da bi bilo
dobro izvesti določene ukrepe.

3.8.7 Preglednica 7: Dimenzijska preglednica – desno zgoraj

Preglednica 7 prikazuje meritve lastnosti


spletnih strani UDK leksikona glede na hitrost nalaganja posameznih strani pri uporabi
modema s hitrostjo prenosa podatkov 128 Kb/s, obseg posameznih strani v KB, število
spletnih povezav, število nedelujočih spletnih povezav in število neaktualnih ali celo
neustreznih spletnih povezav. Poleg meritev so navedene tudi končne ocene z že znanimi
vrednostmi –1, 0 in +1.

Vodoravni vpogled:

 Hitrost nalaganja strani – skupna ocena (vodoravno gledano) je +1, kar kaže na neki
povprečni izid.
 Obseg posameznih strani v KB – skupna ocena (vodoravno gledano) je 0.
 Število spletnih povezav – ocena je –1.
 Nedelujoče spletne povezave – skupna ocena je –1
 Neaktualne in neustrezne spletne povezave – ocena je –1.

Navpični vpogled (glede na oceno izmerjenih lastnosti posameznih strani):

 UDK glavna stran - skupna ocena za glavno UDK stranje –3, kar kaže na nekoliko
podpovprečni izid.
 UDK 0 - a za UDK 0 je (navpično gledano) –2.
 UDK 1 – ocena je –2.
 UDK 2 - je ocena –2.
 UDK 3 – ocena je –3
 UDK 5 - ocena je –3
 UDK 6 – ocena je –3
 UDK 7 – ocena je –2
 UDK 8 –ocena je –3

[56]
 UDK 9 – ocena je –3

Končna ocena (vodoravno) je –2 od  5, a končna ocena (navpično) je –26 od  50. Obe oceni
kažeta na podpovprečen izid, kar daje vedeti, da bi bilo potrebno izvesti popravke glede
trenutnega stanja UDK leksikona, kar bi vključilo naslednje:

 komprimiranje (stisnjenje) slik na spletnih straneh, kar bi pripomoglo k temu, da bi se


spletne strani hitreje naložile. Še zlasti glavna spletna stran UDK leksikona je s tega
vidika potrebna popravkov. Mnogi spletni obiskovalci imajo manj kakovostne
modeme (npr. hitrost prenosa podatkov je zgolj 56 Kb/s) in če se spletne strani počasi
naložijo, se lahko zgodi, da bodo le-ti opustili nadaljnje aktivnosti na UDK leksikonu.
Prav tega si pa ne bi želeli.
 Bolj smotrna organizacija besedil na spletnih straneh, tako da sleherna spletna stran ne
presega več kot 100 KB. V tem vpogledu so kritične spletne strani s področij UDK 3,
UDK 5, UDK 6, UDK 8 in UDK 9, kajti tudi tovrstne t.i. dolge strani se dalj časa
nalagajo, kar prav tako lahko odvrne spletnega obiskovalca od ponovnega
(nadaljnjega) obiska na te strani.
 Število spletnih povezav – potrebno je dodati nekaj zanimivih in sodobnih spletnih
povezav na različna področja človekovega zanimanja oziroma znanja (npr. to še zlasti
velja za področja UDK 1, UDK 2 in UDK 7)
 Nedelujoče spletne povezave – je potrebno nemudoma odpraviti in jih zamenjati z
delujočimi in za obiskovalce zanimivimi. Prav nedelujoče povezave najbolj odbijajo
spletne obiskovalce. Teh nedelujočih spletnih povezav je vsega skupaj 103 (npr. pri
UDK 0 jih je 25, pri UDK 3 jih je 20 itd.)
 Nesodobne ali neustrezne spletne povezave – je prav tako nemudoma potrebno
zamenjati s sodobnimi, kajti spletni obiskovalec pričakuje podatke / informacije, ki so
še vedno veljavni. Teh je bilo 19.

3.8.8 Preglednica 8: Dimenzijska preglednica – desno spodaj

Preglednica 8 prikazuje ocene o izpolnjenosti pogojev z vrednostmi –1, 0 in +1 glede lastnosti


podatkov na obravnavanih spletnih straneh UDK leksikona.
[57]
Celokupni oziroma vodoravni pogled glede na izide ocen lastnosti podatkov na spletnih
straneh UDK leksikona

 Konsistenca in razumljivost podatkov – skupna ocena je bila + 4 od  10 možne.


 Pravilnost in popolnost podatkov – skupna ocena + 3 od  10.
 Natančnost podatkov – skupna ocena + 10 od  10.
 Dostopnost podatkov – skupna ocena +3 od  10.
 Uporabnost podatkov – skupna ocena +10 od  10.

Posamični oziroma navpični pogled na ocene glede na lastnosti podatkov na spletnih


straneh UDK leksikona

 UDK glavna stran, UDK 1 in UDK 2 – ocena je + 5 od  5 možne  Vsi pogoji so


izpolnjeni.
 UDK 0, UDK 3, UDK 5 in UDK 6 – ocena je + 2 od  5 možne ocene  Pogoji so
izpolnjeni le deloma pri konsistenci in razumljivosti, pri pravilnosti in popolnosti ter
dostopnosti podatkov (pri teh primerih velja ocena 0).
 UDK 7 – ocena je + 3 od  5 možne  Pogoji so izpolnjeni le deloma pri pravilnosti
in popolnosti ter dostopnosti podatkov (pri teh primerih velja ocena 0).
 UDK 8 – ocena je + 3 od  5 možne  Pogoji so izpolnjeni le deloma pri konsistenci
in razumljivosti ter pri pravilnosti in popolnosti (velja ocena 0).
 UDK 9 – ocena je + 1 od  5 možne  glede dostopnosti podatkov pogoj ni izpolnjen,
zato tudi ocena –1. Pogoj je zgolj deloma izpolnjen pri konsistenci in razumljivosti ter
pri pravilnosti in popolnosti podatkov (velja ocena 0).

Tudi na podlagi teh izidov je možno sklepati, da bi bilo smotrno izvesti določene popravke na
spletnih straneh UDK leksikona. Skupni seštevek obeh pogledov je bil dvakrat +30 od  50.

3.8.9 Preglednica 9: Dimenzijska preglednica – levo spodaj

Preglednica 9 prikazuje ocene z vrednostmi –1,0 in +1 za morebitne ukrepe z obzirom na


negativne lastnosti podatkov na spletnih straneh UDK leksikona. Pri tem pomeni ocena –1, da
ukrep ni potreben, vrednost 0 pomeni, da je ukrep potreben, medtem ko pomeni vrednost +1,

[58]
da je ukrep nujno potreben. V ožji izbor ocenjevanja sem uvrstil naslednje negativne lastnosti:
napake, nedostopnost, neaktualnost vsebine in nakopičenost vsebine (podatkov). V ožji izbor
morebitnih ukrepov sem uvrstil naslednje: posodabljanje vsebine, presnemavanje vsebine
(tuje spletne strani, ki so zanimive in pogosto ogledane shranimo na lasten strežnik ali pa vsaj
na CD-ROM-e ipd., ob tem je potrebno seveda navesti naslove teh virov), odprava virusov
(nekatere spletne strani so sicer zanimive, vendar pa vsebujejo virus, zato jih je potrebno ali
odstraniti ali pa sanirati), odprava letečih oken ali POP – UP –ov (leteča okna so z vidika
spletnega obiskovalca prav neprijetna izkušnja, še zlasti takrat, če jih je mnogo, zato je
potrebno takšno stanje popraviti), merila za merjenje kakovosti spletnih povezav (kot primer
bi podal spletne strani z dolgimi spletnimi naslovi, ki mnogokrat niso obstojne in izginejo
sorazmerno hitro s spleta ipd.), pogostejše meritve kakovosti tako podatkov kot tudi spletnih
strani in nenazadnje ukrep/-i glede oblikovne sprostitve vsebin spletnih strani UDK leksikona
(morda tudi drugih spletnih strani npr. da jih presnamemo na CD-ROM, bolj nazorno
uredimo podatke, nakar popravljeno stanje objavimo na spletu kot spletno povezavo znotraj
spletnih strani UDK leksikona ipd.).

Celostni ali vodoravni pogled:

 ukrepi glede napak na in znotraj spletnih straneh UDK leksikona – ocena je bila + 3
 ukrepi glede nedostopnosti do spletnih strani – ocena je + 2
 ukrepi glede neaktualnosti vsebin – ocena je – 1
 ukrepi glede nakopičenosti / nepreglednosti podatkov na in znotraj spletnih strani
UDK leksikona – ocena je 2

Posamični ali navpični pogled

 nujnost ukrepov glede posodabljanja vsebin – ocena je + 2


 nujnost ukrepov glede presnemavanja vsebin – ocena je – 2
 nujnost ukrepov glede preveritve vsebin – ocena je + 4
 nujnost ukrepov glede odprave virusov – ocena je – 4
 nujnost ukrepov glede odprave letečih oken – ocena je – 2
 nujnost ukrepov glede vzpostavljanja meril kakovosti za spletne povezave – ocena je
+1
 nujnost ukrepov glede pogostejših meritev kakovosti podatkov – ocena je + 4
 nujnost ukrepov glede oblikovne sprostitve vsebin – ocena je + 1

Skupna ocena vodoravnega pogleda je bila 4 od  32 možne in ista je bila skupna ocena za
navpični pogled, t.j. 4 od  32 možne.

Četrta dimenzijska preglednica se razlikuje od ostalih treh v precejšnji meri, saj so sicer v
uporabi iste vrednosti za ocenjevanje, vendar se naziv uteži razlikuje. Četrta dimenzijska
preglednica se lahko v naslednji zvezdnati shemi za ocenjevanje kakovosti podatkov prelevi v
središčno oziroma izhodiščno preglednico, vendar tega v tej seminarski nalogi, kot že
omenjeno ne bom prikazal. Ta četrta dimenzijska preglednica zato pomeni nekakšen mehak
prehod med procesom 2 in procesom 3 (gl. str. 48 slikovni prikaz 15). Na podlagi vseh ocen je
možno izpeljati naslednje sklepe:

1. Za pridobivanje kakovostnih in popolnih “clickstream” podatkovnih virov s spleta, bi


bilo smotrno nabaviti programsko orodje IBM Tivoli Website Analyzer.

[59]
2. Več kot smiselna bi bila tudi izvedba popravkov glede podatkovnih virov s spletnih
strani UDK leksikona.
3. Logična posledica drugega sklepa je v tem, da se natančno opredelijo področja
popravkov.
4. Potrebno je narediti konkretni načrt za ustrezne ukrepe v zvezi s spletnimi stranmi
UDK leksikona (velja tudi za posamezne spletne povezave in besedila znotraj teh
spletnih strani).

Prav v tem vpogledu bi ocenil, da bi bilo smotrno najprej urediti zadeve v zvezi z nabavo in
vgradnjo programskega orodja IBM Tivoli Website Analyzer ter hkrati izboljšati obstoječo
stanje na spletnih straneh UDK leksikona. Z ustrezno organizacijo različnih kadrov v
projektni skupini, bi to bilo možno urediti v dobrem koledarskem mesecu. Ocena kakovosti
podatkovnih virov, tako “clickstreama” kot tudi s spletnih straneh UDK leksikona je bila v
tem primeru več kot nujna.

Čisto na koncu bi se še dotaknil dveh tem v zvezi z oceno kakovosti podatkov. Prva tema je v
tem, da bi se dalo razpravljati v zvezi z zlomljenimi ali blank povezavami. Zlomljene
povezave so sicer lahko za uporabnika oziroma spletnega obiskovalca koristna in prijazna, saj
si lahko ogleduje in primerja med sabo različne spletne vsebine, vendar so zlomljene
povezave z vidika merjenja začetkov in koncev sej precej nevšečna. Kot zgled bi podal
spletnega obiskovalca, ki si odpre 10 različnih spletnih oken. Po dveh urah ogledovanja
različnih spletnih strani, si je spletni obiskovalec podrobneje ogledal deseto spletno stran t.j.
30 minut, medtem ko si je za druge spletne strani efektivno gledano vzel manj časa t.j. npr. po
pet do deset minut, vendar pa teh devet oken ni zaprl. Ko bo spletni obiskovalec zaključil s
spletno sejo, bomo dobili kot izid, da se je le-ta zadržal na prvih devetih spletnih straneh dalj
časa kot pa na zadnji, kateri pa je dejansko posvetil največ časa. Zdaj z vidika spremljanja
področnih zanimanj spletnih obiskovalcev, je tovrsten pojav precej nevšečen, saj v nekaterih
primerih ne moremo točno dognati, katere vsebine so pri spletnih obiskovalcih najbolj
priljubljene. 98 % vseh spletnih povezav v UDK leksikonu pa so v obliki zlomljenih (angl.:
blank) povezav. Odločitev za navadne ali zlomljene spletne povezave bi v tem primeru bilo
smotrno prepustititi spletnim obiskovalcem, kar bi bilo možno ugotoviti z ustrezno
zastavljeno spletno anketo in s pogovori. Ob pogovorih z nekaterimi spletnimi obiskovalci
UDK leksikona sem spoznaval, da si pravzaprav želijo zlomljenih spletnih povezav.

Druga dodatna tema pa je v povezavi s prepoznavnostjo UDK leksikona na spletu.


Prepoznavnost določene spletne strani v različnih zunanjih iskalnikih (npr. Google, Vivisimo,
Najdi.si itd.), virtualnih vodičih (npr. Matkurja ipd.) in informacijskih portalih itd. je več kot
ključna za pridobivanje spletnih obiskovalcev in s tem več relevantnih podatkovnih virov v
zvezi s področnimi zanimanji spletnih obiskovalcev. Trenutne analize kažejo na to, da spletni
obiskovalci, ki iščejo podatke / informacije po različnih iskalnikih ipd. večinoma prej najdejo
področne spletne strani UDK leksikona in ne pa glavno stran. To je pa že problem, o katerem
bi se izplačalo premisliti in iskati ustrezne rešitve. Ena od zagotovo številnih možnih rešitev
bi bila v tem, da bi se oblikovala čim bolj kakovostna meta označba (angl.: meta tag – se
vgradi v obliki ključnih besed na vrh spletne strani – obiskovalci ta zapis ne vidijo) glavne
spletne strani, kajti še zlasti svetovni iskalniki lahko na podlagi tovrstnih označb lažje najdejo
določeno stran. S podpoglavjem o oceni kakovosti podatkov, kjer sem uporabil motiv zvezdne
sheme, je zgrajena nekakšna odskočna deska za dimenzijsko modeliranje podatkov v obliki
zvezdnih shem. Preden bomo prešli na četrto poglavje in s tem na modeliranje podatkov za
predlagan dimenzijski model CPS, bo potrebno še izvesti pregled za nazaj s pomočjo matrike

[60]
o že opravljenih nalogah. S tem hitrim pregledom za nazaj bo možno spoznati, katere zadeve
so že urejene in katere še niso.

3.9 Preglednica 10: Pregled izvedenih nalog

S preglednice 10 je
razvidno, da so vse naloge v zvezi z načrtom projekta CPS uresničene, razen dimenzijsko
modeliranje podatkov.

[61]
Dimenzijsko modeliranje
podatkov

[62]
4 Dimenzijski podatkovni model
predlaganega CPS
Dimenzijsko modeliranje je tehnika logičnega načrta, ki se uporablja za (C)PS. Modeliranje
podatkov bom uresničil s pomočjo naslednjih korakov:

 Konceptualno modeliranje podatkov, kar vključuje razumevanje bistva nastajajočega


CPS, t.j. shranjevati “clickstream” podatke / informacije v CPS, ki poročajo o
področnih zanimanjih spletnih obiskovalcev na UDK leksikonu. Ne zanima me toliko,
kdo so konkretno ti spletni obiskovalci, temveč gre moje osrednje zanimanje v smeri
podatkov / informacij, po katerih le-ti posegajo; npr. katera področja človekovega
znanja, kako intenzivno, dolgo in kdaj? Prav s tega osrednjega zanimanja je možno
izpeljati težnje po odkrivanju vedenjskih vzorcev spletnih obiskovalcev, morebitno
pridobivanje dodatnih premožnih vlagateljev itd. Skratka s temi globalnimi modeli si
bom približal bistvo, hkrati pa mi bo tovrsten pristop pomagal pri izboru zrna,
dimenzij in dejstev.
 Izdelava matrike
 Izbor zrna
 Izbor dimenzij
 Izbor dejstev
 Izdelava dimenzijskih tabel
 Izdelava tabel dejstev, izdelava zvezdnih shem in dimenzijski podatkovni model za
CPS.

4.1 Konceptualno modeliranje podatkov

Preden bom prikazal globalne podatkovne modele, bom najprej načel temo, katero sem že
opisal v uvodnem poglavju (gl. str. 4 – 5). To je želja po ugotavljanju verižnih spletnih
dejavnosti obiskovalcev na UDK leksikonu. Kako področno široko ali ožje dojemajo le-ti
svet? Kakšen je dejavnik interdisciplinarnosti in specializiranosti spletnih obiskovalcev? S
pomočjo UML diagrama aktivnosti bom poskušal na naslednji strani prikazati dolgo
“clickstream” verigo interdisciplinarnega spletnega obiskovalca na UDK leksikonu, ki
pomeni po moji oceni skrajni primer. Ta spletni obiskovalec si dokaj natančno ogleda glavno
stran in vse področne UDK strani. Na glavni spletni strani tako uporablja notranji iskalnik, s
tem izvede tudi poizvedbo, pošlje prispevek v UDK diskusijski forum in si nato ogleda
spletne dokumente po vseh UDK področjih. Pojavi se sedaj ključno vprašanje v zvezi s
prepoznavnostjo spletnega obiskovalca. Po mojem prepričanju je tovrsten spletni obiskovalec
zelo prepoznaven, vendar pa je veliko vprašanje v tem, če je tudi dober potrošnik?

[63]
4.1.1 Slikovni prikaz 18: UML diagram aktivnosti (verižni “clickstream”)

[64]
Slikovni prikaz 18 ponazarja celovit sklop dejavnosti spletnega obiskovalca na UDK
leksikonu. Stopnje (S) aktivnosti so naslednje:

S1: Spletni obiskovalec uporablja notranji iskalnik in naredi poizvedbo. Kakšno sekundo
kasneje z miško pritisne na spletno povezavo UDK 0. Odpre se novo področje UDK 0 (kar je
možno zaradi zlomljenih / blank spletnih povezav). Okno področja UDK 0 zmanjša, tako da
dobi spet na vpogled glavno stran. Tudi proces iskanja je že zaključen, kar spozna, ko poveča
okno, kjer zagleda zadetke, ki so posledica poizvedbe. Po ogledu zadetkov ugotovi, da ne
ustrezajo njegovi informacijski potrebi, zato se odloči, da to okno zapre in s tem zaključi
dejavnost. Z miško nato pritisne na spletno povezavo za diskusijski forum, kamor uvrsti svojo
pripombo, nakar to okno zapre.

S2: V nadaljevanju si ogleda spletno stran na področju UDK 0 itd.

S3 – S9 …

Ni zdaj namen tega pisanja opisati vse postopke in vsa dejanja, ki jih je ta spletni obiskovalec
izvedel, ampak sta glavna namena tega prikaza bila v tem, da ponovno izpostavim ključno
zanimanje prihodnjega modeliranja in da zaslutimo koristnost tovrstnih razmišljanj tudi za
poslovno sfero. V ta namen lahko ponovno povzamem vprašanje: “Ali so tovrstni obiskovalci
tudi dobri kupci ali potrošniki?” Po vsej verjetnosti niso! Iz tega vprašanja lahko razvijemo še
druga, ki so tudi pomembna za globalno modeliranje podatkov kot npr. “Ali je tovrstnih
spletnih obiskovalcev veliko?” Po vsej verjetnosti jih ni prav mnogo. “Ali je ta vedenjski
vzorec pri tem spletnem obiskovalcu zelo pogost”? V primeru, da ta vedenjski vzorec ni zelo
pogost, bi lahko s tega sklepali, da je imel ta spletni obiskovalec ta dan mnogo časa. Koliko je
ozko specializiranih spletnih obiskovalcev in s katerega področja jih je največ?

Preden bom izdelal model vodnega toka ali slapa (nem.: Wasserfallmodell) si bom najprej
zastavil naslednja vprašanja:

 Katera področja človekovega znanja so najbolj obiskana?


 Katera področja človekovega znanja so najdalje ogledana?
 Kako pogosto je uporabljen notranji iskalnik?
 Kateri podatki z določenega področja človekovega znanja se s pomočjo notranjega
iskalnika najpogosteje iščejo?
 Kateri spletni dokumenti so najpogosteje shranjeni oziroma naloženi (angl.:
download) na disk(-e) osebnih računalnikov spletnih obiskovalcev?
 Katere informacijske storitve so najpogostejše in s katerega področja?
 Kako pogosto se uporabljajo komunikacijski spletni obrazci kot npr. diskusijski
forum, E- pošta, spletne ankete ipd.?
 Kje se v določenem trenutku nahajajo spletni obiskovalci (na UDK leksikonu)?
 Od kod in kdaj prihajajo?
 Ob katerih letnih časih je največ spletnih obiskovalcev?
 Ob katerih dnevih je največ spletnih obiskovalcev?
 Ob katerih urah je največ spletnih obiskovalcev? Kdo so spletni obiskovalci?
 Ali so anonimni, delno prepoznavni ali pa prepoznavni?

[65]
4.1.2 Slikovni prikaz 19: Konceptualni model vodnega toka (slapa) za dimenzije

Slika 19 prikazuje globalni model vodnega toka, s katerim sem si ponazoril lasten miselni tok
kot pripomoček pri izboru dimenzij in za izdelavo Bus (angl.:BUS – izraz je prevzet s
področja elektrotehnike) arhitekturne matrike za CPS. Na vrhu slikovnega prikaza lahko
vidimo, da sem izhajal z miselnega izhodišča “področno zanimanje”, s katerega sem izpeljal
možne dimenzije za dimenzijsko modeliranje CPS. Te možne dimenzije bi lahko bile:

 informacijske storitve – svetovanje in razreševanje informacijskih problemov spletnih


obiskovalcev, komuniciranje s pomočjo E- pošte, diskusijskega foruma in različnih
spletnih obrazcev (npr. ankete, predlogi, pošiljanje izobraževalnih obvestil na
naročila spletnih obiskovalcev ipd.)
 Stran (objekt) – sledenje spletnih obiskovalcev glede njihovih obiskov po posameznih
spletnih naslovih, kar vključuje podatke o imenu strani in delu te strani itd.
 Seja in podseja – sledenje glede tega, koliko “klikov” so izvedli spletni obiskovalci od
začetka pa do konca seje in koliko je bilo podsej.
 Spletni obiskovalci – prepoznavanje identitete spletnih obiskovalcev npr. dijaki,
zaposlenci ter drugi.
 Datum – določajo se obdobja kot so leto, meseci, tedni, dnevi, delavniki, prazniki itd.
 Čas – bolj podrobno se določajo časovni intervali obiskov npr. ura, minuta, sekunda in
prehod na naslednji dan v merski enoti sekunde.

[66]
Če izhajam s predpostavke, da brez spletnih obiskovalcev s pomočjo pritiskov miške na
spletne povezave, ni možno spremljati njihove spletne dejavnosti na UDK leksikonu, bi si
dovolil izpeljati logičen sklep, da lahko tovrstne akcije štejemo kot izhodišče za sleherno
spremljanje nasploh. Tovrstna dejstva bom poimenoval kot “Klik” dejstva. S tega temeljnega
dejstva je možno izpeljati še dejstvo seje, kajti s pomočjo sej ugotavljamo IP spletnega
obiskovalca, njegov vstop v spletni sistem, začetek in konec njegovih dejavnosti, datum in
čas. Prav to spoznanje je pomembno za osrednje zanimanje t.j. področna zanimanja spletnih
obiskovalcev. Zdaj lahko na tej podlagi izpeljemo še nekakšen privesek dejstva seje t.j.
podseja, ki še natančneje poda obiskovalčeve aktivnosti, t.j. da beležimo sleherni pritisk z
miško na spletne povezave, ki se nahajajo znotraj določene spletne strani. To je pa že precej
blizu tistemu, česar si želimo in kar sem z UML diagramom aktivnosti poskušal prikazati.
Torej v tej predstopnji dimenzijskega modeliranja sem določil šest dimenzij in dve dejstvi, kar
bi pomenilo, da bo glavna zvezdna shema sestavljena iz ene tabele dejstev in šestih
dimenzijskih tabel. Druga tabela dejstev “seja” bo vsebovala tri dimenzijske tabele.

4.1.3 Slikovni prikaz 20: Konceptualni model vodnega toka (slapa) za dejstva

Slika 20 prikazuje z lastnega miselnega izhodišča “Področna zanimanja” dve izpeljani dejstvi.
To sta “Klik dejstvo” in “Seja dejstvo” (kot priloga h klik dejstvu), ki se še nadalje členi na
dejstvo “Podseja”.

[67]
4.2 Preglednica 11: CPS Bus arhitekturna matrika

Preglednica 11 prikazuje Bus arhitekturno matriko za CPS, ki ponazarja sledenje oziroma


odnose med možnimi področij CPS (reševanje informacijskih problemov za spletne
obiskovalce, svetovanje za obiskovalce, spremljanje zanimanj obiskovalcev, analiziranje
področnih zanimanj spletnih obiskovalcev in spletno komuniciranje) in dimenzijami (datum,
čas, spletni obiskovalec, storitev, stran / objekt – URL in seja / podseja). Ta matrika v tej
seminarski nalogi služi kot dodaten pripomoček pri izboru zrna, za natančnejši izbor dimenzij
in dejstev.

4.3 Izbor zrna (zrnatost)

Izhajajoč z osrednjega zanimanja, t.j. spremljanje področnih zanimanj spletnih obiskovalcev


in akcij, ki jih le-ti izvedejo s pomočjo “klikov” na različne spletne povezave, sem se odločil,
da bom določil zelo podrobno zrno t.j. posamezen zadetek oziroma posamični klik (na
sekundo), ki ga je izvedel spletni obiskovalec. S pomočjo tako podrobnega zrna bo možno
tudi natančno spremljati podseje, ki so jih izvedli spletni obiskovalci.

4.4 Izbor dimenzij – dokončna odločitev

Dimenzije, ki sem jih izbral so naslednje: datum, čas, spletni obiskovalec, informacijska
storitev, stran (objekt), seja (podseja).

1.) Dimenzija datum – dimenziji datum in čas morata biti obvezno ločeni!

KLJUČ: Datum_ključ

ATRIBUTI: Dan_v_mesecu, Mesec, Četrtletje, leto, Dan_v_tednu, Delavnik, nedelavnik,


praznik

2.) Dimenzija čas

[68]
KLJUČ: Čas_ključ

ATRIBUTI: ura, minuta, sekunda, sekunda_od_polnoči, časovni_razpon

3.) Dimenzija spletni obiskovalec – če se spletni obiskovalec registrira, postane


prepoznaven, v primeru, da se ne registrira, je le preko IP naslova delno prepoznaven ali pa
celo anonimen. Ta dimenzija je zelo koristna tudi za sledenje obiskovalčevih področnih
zanimanj.

Ključ: SpletniObiskovalec_ključ

Atributi: IP_ naslov, vstop

4.) Dimenzija informacijska storitev – je koristna za ugotavljanje vrste področne storitve in


za ugotavljanje pogostosti posega spletnih obiskovalcev po tovrstnih storitvah.

Ključ: InformacijskaStoritev_ključ

Atributi: področje_storitev, število_storitev, številka_ storitve

5.) Dimenzija stran (objekt) – je koristna za ugotavljanje, na kateri strani se nahaja spletni
obiskovalec.

Ključ: Stran_ključ

Atributi: stran_ime, stran_URL, Stran_opis, stran_vrsta

6.) Dimenzija seja (podseja) – se uporablja za prepoznavanje vsebinske povezave ogledov


strani

Ključ: Seja_ključ

Atributi: IP, vstop, začetna_stran, zaključna_stran, Kliki_v_seji

a.) Dopolnilna dimenzija podseja – priloga k seji (želim zajeti vse možne klike z miško znotraj
sleherne seje)

Ključ: Podseja_ključ

Atributi: seja, stran_url, čas, datum

4.5 Izbor dejstev – dokončna odločitev

1.) Glavno dejstvo je “Klik” dejstvo (modeliramo posamične klike), ki mu je dodano “Seja”
dejstvo (modeliramo celotno zbirko klikov”) kot priloga in “Podseja” dejstvo kot priloga seji.

Ključi: Stran_ključ, Datum_ključ, Seja_ključ, Čas_ključ, SpletniObiskovalec_ključ,


InformacijskaStoritev_ključ

Atributi: število _v_seji, klik_sekunde

[69]
Šest dimenzij (vse sem že malo poprej navedel)

a.) Seja

Ključi: Čas_ključ, Datum_ključ, SpletniObiskovalec_ključ

Atributi: začetna_stran, končna_stran

Tri dimenzije: datum, čas, spletni obiskovalec

a1.) Podseja

Ključi: URL_zaporedni_ključ, Seja_ključ, Čas_ključ, Datum_ključ

Atributi: podseja_sekunde

Štiri dimenzije: zaporedni URL, čas, datum, seja

4.6 Izdelava dimenzijskih tabel

Na podlagi izbora dimenzij in opredelitve njihovih prvin, lahko zdaj v nadaljevanju izdelam
dimenzijske tabele, ki bodo pozneje služile kot dober pripomoček za izdelavo zvezdnih shem.
V predhodnem podpoglavju sem vse dimenzije zgolj besedno opisal, tako da bo sedanji
pristop slikovitejši, kajti vse do doslej opisanih ključev in atributov bom umestil v posebne
dimenzijske preglednice ali tabele. Držal se bom pri tem istega vrstnega reda kot pri
besednem opisu vseh šestih dimenzij. Najprej bom prikazal dimenzijsko preglednico datum,
nato čas, spletni obiskovalec, informacijska storitev (v dimenzijski preglednici bom to
dimenzijo imenoval kot storitev), stran (objekt) in nazadnje še seja (podseja). Vse te dimenzije
sestavljajo temeljno dejstvo, ki je “Klik” dejstvo. V nadaljevanju bom še prikazal dimenzijske
tabele za suplementno dejstvo “Seja” (in “Podseja”).

[70]
4.6.1 Slikovni prikaz 21: Šest dimenzijskih tabel in dopolnilna

Na slikovnem prikazu 21 vidimo šest dimenzijskih preglednic, vključno s preglednico


dopolnilne dimenzije “Podseja”, na katero kaže črtkana puščica z dimenzije “Seja”, kar
pomeni, da se ta dopolnilna dimenzija ne bo pojavila v izhodiščni zvezdni shemi. O tem
nekoliko kasneje.

4.7 Izdelava tabel dejstev

Velja podoben princip kot pri podpoglavju točka 4.6. Na podlagi izbora dejstev in opredelitve
njihovih prvin, lahko zdaj v nadaljevanju izdelam tabele dejstev, ki bodo prav tako pozneje
služile kot dober pripomoček za izdelavo zvezdnih shem. Temeljna tabela dejstev bo “Klik”
dejstvo, suplementna tabela dejstev bo “Seja” dejstvo in znotraj nje še tabela dejstvo
“Podseja”. V poznejšem podpoglavju bom podrobneje opisal, zakaj sem se odločil za ta
pristop. Za zdaj naj navedem zgolj okvirno obrazložitev, da ne želim zgolj zajeti posamične
“klike”, ampak tudi skupine tovrstnih akcij in znotraj teh želim natančno zajeti kot že
omenjeno, vse možne klike znotraj seje. Prav to željo oziroma zahtevo pa modela “Klik” in
“Seja” dejstvo ne moreta zadovoljiti ter je zato potrebno uvesti model “Podseja” dejstev.

4.7.1 Slikovni prikaz 22: Tabele dejstev

[71]
Na sliki 22 vidimo tri tabele dejstev; temeljna je tabela “Klik” dejstvo, suplementna je tabela
“Seja” dejstvo in znotraj nje še tabela dejstev “Podseja”, ki se ob posamičnih “klikih” in
enoštevilčnih sejah ne uporablja, kar sem na sliki prikazal s črtkano puščico. Ta tabela dejstev
pride do izraza, če znotraj ene seje prihaja vsaj še do dodatne seje itd. Naj to ponazorim z
naslednjim slikovnim prikazom.

4.7.2 Slikovni prikaz 23: Razpon podsej

Slika 23 prikazuje takšno sejo s štirimi “kliki”, ki se potem razdeli na šest podsej. Povrhu tega
slika 23 pokaže tudi dolžino oziroma trajanje (v sekundah) posameznih podsej, česar seveda
seja ne zmore prikazati.

4.8 Izdelava zvezdnih shem

Izdelal bom tri zvezdne sheme, ki so naslednje:

1. Zvezdna shema “Klik” s šestimi dimenzijami.


2. Zvezdna shema “Seja” s tremi dimenzijami.
3. Zvezdna shema “Podseja” s štirimi dimenzijami.

Zvezdne sheme bom izdelal na podlagi izdelanih dimenzijskih tabel in na podlagi izdelanih
tabel dejstev.

[72]
4.8.1 Slikovni prikaz 24: Zvezdna shema “Klik” dejstvo

Slika 24 prikazuje temeljno zvezdno shemo “Klik” dejstvo s povezavami do vseh šestih
dimenzij. V sredini se nahaja tabela dejstev, ki povezuje šest dimenzijskih tabel.

4.8.2 Slikovni prikaz 25: Zvezdna shema “Seja” dejstvo

[73]
Na sliki 25 zagledamo zvezdno shemo “Seja” dejstvo. Tabela dejstev v sredini “Seja” dejstvo
se povezuje s tremi dimenzijskimi tabelami (datum, čas in spletni obiskovalec).

4.8.3 Slikovni prikaz 26: Zvezdna shema “Podseja” dejstvo

Slika 26 prikazuje zvezdno shemo “Podseja” dejstvo. Preglednica v sredini “Podseja” dejstvo
se povezuje s štirimi dimenzijskimi tabelami, pri čemer velja poudariti, da gre pri dimenzijski
tabeli “URLZaporedje” za izpeljano dimenzijo, ki je nastala na podlagi predhodnih
shem111(oz. konkretneje: je posredno izpeljana s tabele “Klik” dejstev in s tabele “Seja”
dejstev.)

Na naslednji strani bom še slikovno prikazal združene zvezdne sheme, ki bi veljale še zlasti
tedaj, kadar bi spletni obiskovalec izvedel številne in zelo podrobne aktivnosti na spletnih
straneh UDK leksikona (npr. gl. na strani 66 sliko 18 UML diagram aktivnosti). Po tem
celovitem slikovnem prikazu, bom še podal računsko oceno potrebne velikosti zamišljenega
CPS-a za sleherno zvezdno shemo posebej in celokupno. Največji problem pri tem modelu
“Podseja” dejstvo je prav v tem, da se še dodatno povečuje pritok podatkov v CPS, za kar pa
do sedaj še niso iznašli učinkovitega “zdravila”. Prav ta problem pa presega, kljub njegovi
izredni pomembnosti, osrednje zanimanje te seminarske naloge. Reševanje tovrstnega
problema bi si pa lahko predstavljal kot izjemen znanstveni vložek, ki bi po moji oceni
zahteval tako različne preizkuse kot tudi natančne meritve.

[74]
4.8.4 Slikovni prikaz 27: Celotna zvezdna shema kot predlog za CPS

[75]
Na sliki 27 vidimo celokupno zvezdno shemo, ki jo predlagam za CPS. V tem modelu so
združene vse prej obravnavane zvezdne sheme in s tem vsa dejstva ter dimenzije. Temeljna
zvezdna shema “Klik” dejstvo je ogrodje tega modela in obravnava posamične klike na
spletne povezave, ki jih izvedejo spletni obiskovalci po bolj ali manj različnih področjih
človekovega znanja (odvisno od spletnega obiskovalca), t.j. na spletnem UDK leksikonu.
Druga zvezdna shema “Seja” dejstvo nam daje vpogled glede začetka in konca aktivnosti, ki
jih izvedejo spletni obiskovalci. Zabeležijo se skupinski kliki na posamezne spletne povezave
znotraj različnih področij. Nenazadnje tretja zvezdna shema “Podseja” dejstvo nam daje
podrobnejši vpogled v posamezne seje spletnih obiskovalcev, kar vključuje tudi trajanje
posameznih podsej znotraj vseh sej.

4.8.5 Ocena potrebne velikosti CPS za npr. tri leta

Pri oceni potrebne velikosti CPS bom izhajal z dveh predpostavk:

a. da je na dan okoli 100000 spletnih obiskovalcev (ocena je za naše slovenske razmere


zelo velika, nekoliko nerealna, vendar menim, da bomo dobili zanimive izide)
b. sleherni spletni obiskovalec izvede povprečno po 10 “klikov” na dan
c. Zmnožek 10 . 100000 (daje) = 1000000 klikov oziroma zapisov na dan … N kd
d. Končne izide bom podal v Tera Bytih (TB)

1.) Za zvezdno shemo “Klik” dejstvo

Število ključev (Nkz) = 6

Število merljivih dejstev (Nmz) = 1

Skupaj (Na)= 7

Število bytov, ki ga zaseda en zadetek (“en klik” - Nk) = 200 B

VCPS … velikost CPS

Izračun za en dan:

VCPS = Na . Nkd . Nk = 7 . 1000000 . 200 B = 1.400.000,00 B  1,4 GB za en dan

Za tri leta:

VCPS = 1095 dni . 1,4 GB = 1.533,00 GB  1,533 TB za tri leta

2.) Za zvezdno shemo “Seja” dejstvo (predpostavki sta isti)

Število ključev (Nks) = 3

Število merljivih dejstev (Nms) = 0

Skupaj (Na)= 3

[76]
Število bytov, ki ga zaseda en zadetek (“en klik” - Nk) = 200 B

Izračun za en dan:

VCPS = Na . Nks . Nk = 3 . 1000000 . 200 B = 600.000,00 B  0,6 GB za en dan

Za tri leta:

VCPS = 1095 dni . 0,6 GB = 657 GB  0,657 TB za tri leta

3.) Za zvezdno shemo “Podseja” dejstvo (predpostavki sta isti)

Število ključev (Nkp) = 4

Število merljivih dejstev (Nmp) = 1

Skupaj (Na)= 5

Število bytov, ki ga zaseda en zadetek (“en klik” - Nk) = 200 B

Izračun za en dan:

VCPS = Na . Nkp . Nk = 5 . 1000000 . 200 B = 1.000.000.000,00 B  1,0 GB za en


dan

Za tri leta:

VCPS = 1095 dni . 1,0 GB = 1.095,00 GB  1,095 TB za tri leta

4.) Celokupno

 VCPS  1,533 TB + 0,657 TB + 1,095 TB  3,285 TB podatkov za obdobje treh let.


Ocena je potrdila mojo predpostavko s strani 76, kajti zares se soočamo z veliko količino
podatkov in to že v obsegu TB.

4.9 Preglednica 12: Pregled opravljenih nalog

S preglednice 12 vidimo, da so vse naloge glede zastavljenega načrta projekta CPS (v okviru

[77]
seminarske naloge) uresničene, kar je prikazano s črnimi krogci. To vključuje uvod, pripravo
projekta, vzpostavitev projekta, načrtovanje projekta / vodenje, opredelitev zahtev
(organizacijske zahteve, poslovne zahteve, določitev virov podatkov in ocena kakovosti
podatkov), pregled za nazaj in dimenzijsko modeliranje podatkov.

5 Zaključek
Izgradnja (C)PS pomeni zelo draga naložba, ki lahko stane od 100000 do 10000000 Eurov,
kar je seveda odvisno od velikosti zamišljenega (C)PS. V tej seminarski nalogi sem razmišljal
o CPS, s katerim bi bilo možno shranjevati veliko količino podatkov v zvezi s sledovi, ki so
jih za sabo pustili spletni obiskovalci na UDK digitalni knjižnici oziroma UDK leksikonu. Ob
tem se seveda takoj porodi vprašanje, če bi se tovrstna investicija obrestovala tudi po denarni
strani, kajti pravega 100 odstotnega jamstva za popolni denarni uspeh pri PS ne obstaja in to
niti za PS, katerih tematska zasnova gre v smeri dobičkonosnega poslovanja. Kljub poprej
zapisanemu, bi si dovolil oceno, da bi lahko tudi tako tematsko zastavljeno CPS, ki je bilo
predmet te seminarske naloge, v obdobju npr. dveh let lahko pripomoglo k družbeni blaginji
tudi v obliki denarne vrednosti. Ta ocena bi še zlasti veljala tedaj, če je v družbi prisoten nek
ugoden poslovni in organizacijski kolektivni duh, kajti če je ta ugoden, lahko na trgu uspevajo
celo takšni izdelki (ali zamisli), ki po izrazitih poslovnih pogledih niso obetali veliko
donosnost.

Zamišljeno CPS, ki je bilo predmet obravnave te seminarske naloge, bi lahko delovalo pod
okriljem standardiziranih / urejenih slovenskih UDK digitalnih knjižnic (teh zaenkrat ni prav
mnogo), ki bi bile financirane s strani ministrstev, IZUM-a / COBISS, podjetij, tujih
vlagateljev, TELEKOM-a itd. Te sodobne knjižnice se ne bi toliko ukvarjale s sicer
značilnimi knjižničnimi opravili, ampak bi lahko nudile tudi storitve v smeri poslovnih
odločitev, analiz, iskanja ustreznih informacij glede npr. interesnih področij spletnih
obiskovalcev za gradbene materiale ipd. Ustrezne in pravočasne informacije, ki jih prejme
ustrezni naslovnik, pa že pomenijo blaginjo, ki lahko tudi pozitivno vplivajo na poslovanje.
Več kot je takšnih pozitivnih in uspešnih informacijskih - poslovnih dogodkov, tembolj se
lahko tudi krepi globalna kakovost in učinkovitost poslovanja v Sloveniji, kajti poslovanje ni
zgolj v domeni dveh ali treh posameznikov, ampak je to krog, v katerem tiči ves civilizirani
svet.

[78]
6 Viri in uporabljena programska orodja
1. Kimball, R. … [et al.].(1998). The Data warehouse lifecycle toolkit : expert
methods for designing, developing and deploying data warehouses. New
York: John Wiley & Sons, 771 str.
2. Kimball, R. & Ross, M.(2002). 2nd. ed. The data warehouse toolkit : the
complete guide to dimensional modeling. New York : John Wiley & Sons,
436 str.
3. English, L.P.(1999). Improving business information quality : methods for
reducing costs and increasing profits. New York [etc.]: John Wiley &Sons,
518 str.
4. Silič, M., Colnar, M., Krisper, M. [etal …].(2000) EMRIS - Enotna
metodologija razvoja informacijskih sistemov. #Zv. #2, Objektni razvoj.
Ljubljana : Vlada Republike Slovenije, Center za informatiko, 412 str.

6.1 Priporočena literatura:


1. Kimball, R. & Merz, R.(2000). The data webhouse toolkit : building the
web-enabled data warehouse. New York [etc.]: John Wiley & Sons, 401 str.

6.2 Medmrežni viri (slovenske, nemške in angleške vire s


področja CPS, Clickstream analiz, virov / kakovosti
podatkov, arhitekture PS itd. sem zbiral od 25.03.2004 –
1.05.2004)
1. http://www.src.si/ponudba/dw.asp

2.) ecom.fov.uni-
mb.si/seminarji.nsf/0/93cb1c225297db73c1256aef002b3cc4/$FILE/Podatkovno%
20skladisce%20in%20E-poslovanje.ppt

2. http://dbtlab.uni-mb.si/pb2/casestudy.pdf
3. http://www.drustvo-
informatika.si/dogodki/arhiv/dsi2001/sekcija_a/golob_welzer.doc.
4. http://www.merkur.si/slo/e-
valilnica/pic/ppt/2003/Analiza_obiska_v_spletni_trgovini.pdf.

5.) http://www.clickstreamconsulting.com
6.) http://www.nyoug.org/clickstream01.pdf

7.)http://searchdatabase.techtarget.com/bestWebLinks/0,289521,sid13_tax288296,
00.html

8.) http://www.rkimball.com/html/articlesArchitecture/articlesIndustryApp.html

[79]
9.) http://www.weg.ee.usyd.edu.au/projects/ni.ca/movie7.htm

10.) http://www.syncsort.com/pdf/sswp5.pdf

11.) http://www.cis.drexel.edu/faculty/thu/My%20Publication/Journal-
papers/JofIS/jis_tonynick.pdf

12.) http://www.teradatalibrary.com/pdf/eb1196.pdf

13.) http://www.nasi.com/pdfs/tivoliwebsiteanalyzer.pdf

14.)http://www.cis.drexel.edu/faculty/song/dolap00/paper/Andersen_107.pdf

15.) http://media.wiley.com/product_data/excerpt/09/04713768/0471376809.pdf

16.) http://www.chrispeiris.com/articles/data_WebHousing.html

17.)http://verdi.unisg.ch/org/iwi/iwi_pub.nsf/wwwPublRecentEng/173010B2C
D2D63E9C1256D090050B55F/$file/dw2002.pdf

18.) http://www.archive.org

19.) http://greg.abstrakt.ch/docs/data_webhouse_paper.pdf

20.)http://verdi.unisg.ch/org/iwi/iwi_pub.nsf/wwwPublRecentEng/A63E2D038
6E8370EC1256D4D0053E671/$file/CS_Datenqualitaet.pdf

21.) http://www.ec3.at/dox/ergebinisbericht2002.PDF

22.) http://www.gerstbach.at/2002/DataQualityManagement/dqm.pdf

23.) http://docserver.bis.uni-
oldenburg.de/publikationen/dissertation/2002/hindat02/inhalt.html

24.) http://www.decus.de/slides/sy2000/Vortraege_2903/2L04.PDF

25.)http://www.ifi.unizh.ch/ifiadmin/staff/rofrei/DA/DA_Arbeiten_2000/Scherz_R
enate.PDF

26.) http://www.wi.uni-muenster.de/inst/arbber/ab51.pdf

27.) http://wwwiti.cs.uni-magdeburg.de/~sattler/hal/dw02.pdf

28.) http://www4.in.tum.de/~schaetz/Projektmanagement03/4-3-
Qualitaetsmanagement.pdf

[80]
29.) http://www.imise.uni-leipzig.de/lehre/medinf/KIS/KIS-2S/KIS-II-
Seminar_WS01_02/KIS-II-Seminar_WS01_02_V7/v7_folien.pdf

30.) http://www.beepworld.de/members29/udkleksikon

31.) http://www.ub.uni-bielefeld.de/biblio/search/smkurs.htm

32.) http://www.clearinghouse.net/

33.) http://www.andre.maurer.name/_documents/zf_DW_DM.pdf ODL.drev.

6.3 Uporabljena programska orodja (za modeliranje)


Pri izdelavi seminarske naloge sem si pomagal z naslednjimi programskimi
orodji:
Rational Suite (znotraj tega sem si izbral Rational Rose Enterprise
Edition)
Microsoft Viso Professional 2003
HyperSnap-DX
Timing Expert 1.01
Concept Draw
Soziogramm 1.0
Diagram Studio
Map Maker
Terrain

[81]
6.4 Slovar kratic in izrazov
Slovar kratic in izrazov je izdelek, ki se izdeluje sproti ter na dolgi rok. Po EMRIS-u II. del
(strateško načrtovanje) je to točka 8.

Akter je oseba / uporabnik, ki je nosilec ene ali več vlog v okviru organizacijskega sistema
(delovne organizacije) in s tem tudi informacijskega sistema (IS)

Aplikacija je programska rešitev, ki kot sestavni del IS podpira neko logično celoto delovanja
organizacijskega sistema

Aplikativni sistem je pojem, ki se ponavadi uporablja za bolj sestavljene rešitve, medtem ko


se pojem aplikacija uporablja za manj sestavljene

Bit per second (bps ali b/s) so biti na sekundo. Merilo za modemovo hitrost prenosa
podatkov.

Brskalnik (Browser) je program z grafičnim interaktivnim vmesnikom za iskanje,


ogledovanje in upravljanje informacij v omrežju

Cilj je zapis prihodnjih izidov ali stanja, ki ga želi organizacija doseči. Mora biti natančno
opredeljen tako po času kot tudi po obsegu, kajti cilj mora biti merljiv

Clickstream (“C”) potek povezav - To je zapis podatkov o povezavah, ki jih je uporabnik


sprožil s pritiskom miške (kliknil) med obiskom na spletni strani

Clickstream podatkovno skladišče (CPS) – ali spletno podatkovno skladišče (angl. data
webhouse) – To je podatkovno skladišče, ki se uporablja za črpanje podatkov z medmrežja.
Sicer je identično klasičnemu podatkovnemu skladišču (PS), ki je enotna zbirka podatkov, ki
nastanejo kot izid delovanja posameznih funkcij. Zajema najpomembnejše podatkovne
entitete celotnega organizacijskega sistema (ali delovne organizacije – organizacijski vidik) in
predstavlja osnovo sistemov za podporo odločanju

Član projektne skupine je tisti, ki ima določene naloge in zadolžitve v zvezi s projektom, na
katerem sodeluje. Ti člani so lahko notranji ali pa zunanji

Datoteka z dnevnikom (angl. log file) ali dnevnik spletnega strežnika je datoteka, v katero
ponavadi različni programi zapisujejo dogodke, stanja itd. (pogosto vključno s časom in
opisom dogodka, stanja itd.)

EMRIS – Enotna Metodologija Razvoja Informacijskih Sistemov

Entity Relationship Diagram (ERD) pomeni entitetno relacijski diagram

E-poslovanje oziroma “elektronsko poslovanje”, izpeljano iz besed kot sta “e-pošta” in “e-
trgovanje” pomeni za združbo poslovanje ob uporabi spleta ter drugih informacijskih

tehnologij (IT)

[82]
GIF (Graphics Interchange Format) je oblika zapisa za izmenjavo grafičnih podatkov. GIF
je standardna oblika zapisa za datoteke s slikami v WWW. Oblika zapisa GIF je priljubljena
zato, ker s stiskanjem zmanjša velikost datotek.

Hipertekst (hypertext) - predstavlja vrsto funkcionalnosti interaktivnega sprotnega


krmarjenja. Povezave (URL-ji), vdelane v besede oz. besedne zveze, omogočajo, da si
uporabniki z izbiro besedila (npr. s klikom miške) takoj prikažejo ustrezne informacije oz.
večpredstavnostni (multimedijski) material.

Hiperpovezava (hyperlink) je povezava med posameznimi kosi informacij

HTML (Hyper Text Markup Language) je označevalni jezik, s katerim so oblikovane


spletne strani in ki omogoča distribucijo informacij na spletu. To je standarden jezik za razvoj
spletnih strani. Prvi je, ki je takšno HTML kodo napisal je bil Tim Berners Lee leta 1990.
HyperText je besedilo, ki je med seboj povezano, Markup pa je angleška beseda za
označevanje. Z jezikom HTMLtorej označujemo in določamo lastnosti besedila

Hyper Text Transfer Protocol (HTTP) je protokol, ki se uporablja na svetovnem spletu za


prenos hiperteksta

Informacijski Sistem (IS) je sistem, ki omogoča zbiranje, obdelavo, shranjevanje,


distribucijo ter uporabo podatkov in informacij, še zlasti za odločanje v delovnih procesih

Informacijska tehnologija – označuje programsko, strojno in komunikacijsko opremo, ki se


uporablja za podporo delovanja IS

Internet je: 1. svetovno omrežje omrežij, ki uporablja protokole in storitve odprtih


standardov, predvsem sklada protokolov TCP/IP. sin. medmrežje

2. globalni informacijski sistem

Internet Service Provider (ISP) oziroma ponudnik internetnih storitev je ponudnik


komercialnega dostopa do interneta in internetnih storitev

Intervju je ena od metod za zajem zahtev in pomeni neposredna komunikacija z ljudmi.

IP (Internet Protocol) je tisti, ki opredeli enote informacij za izmenjavo med sistemi, kar
zagotavlja storitve osnovne paketne dostave

IP naslov (IP address) pomeni 32-bitni naslov Internetovega protokola, dodeljen gostitelju.
IP naslov ima del, ki se nanaša na gostitelja, in del, ki se nanaša na omrežje

JPEG (Joint Photographic Experts Group) je priljubljena metoda za stiskanje fotografij.


JPEG je standardna oblika zapisa datotek za ogledovanje s številnimi spletnimi brskalniki.

Modem (MODulator-DEModulator) je vmesnik, nameščen pri končnem uporabniku, ki


omogoča prenos digitalnih podatkov po analognih prenosnih poteh (npr. po telefonskih
vodih).

[83]
MPEG (Moving Pictures Expert Group) je standardni način za stiskanje polno gibljivega
videa

Piškotek (angl. cookie) je digitalni paket, prilepljen na elektronske dokumente, za pošiljanje


po internetu

Podatkovna baza (angl. database) je računalniško podprta, večuporabniška, formalno


definirana in centralno nadzorovana zbirka podatkov sin. baza podatkov

Prenos navzdol ali nalaganje na disk (download) pomeni prenos programov ali podatkov iz
računalnika v priključeno napravo, najpogosteje iz strežnika v osebni računalnik

Presojevalci ali ocenjevalci so lahko osebe z ustreznimi izkušnjami na strani naročnika ali pa
tudi osebe neodvisnih zunanjih svetovalnih ustanovah z izkušnjami na področjih IT in
strateškega načrtovanja

Projektna skupina je sestavljena iz izbranih oseb, ki dobro poznajo delovanje svojega


področja in imajo hkrati dovolj širok vpogled nad delovanjem celotne delovne organizacije
(ali organizacijskega sistema – sistemski vidik)

Projektni svet je telo, v katerem so predstojnik projekta in ostali člani (npr. tehnični
svetovalec, predstavnik uporabnikov)

Structured Query Language (SQL) je strukturni poizvedovalni jezik, ki se uporablja za

komuniciranje s podatkovno bazo

Stran (page) je hipermedijski dokument v Webu (omrežju)

Strežniki (server) so gostiteljske podatkovne postaje v omrežju, ki ponujajo storitve drugim


postajam.

UML – Unified Modeling Language – enotni slikovni jezik za objektno modeliranje

Univerzalni lokator virov (URL - Uniform Resource Locator) je oblika naslova mesta, ki
razkriva ime strežnika, v katerem so shranjene datoteke mesta, pot do datoteke in ime
datoteke

Uporabnik rezultata projekta je tista oseba, na katero bodo izdelki projekta najbolj vplivali.
Prav zaradi tega je uporabnik projekta ključnega pomena pri določanju izdelkov projekta

Vodja projekta je oseba, ki dobro pozna tako delovanje delovne organizacije kot tudi njegov
IS in njegove ključne uporabnike

Web Browser je brskalnik za svetovni splet

[84]
1 Prototip
UDK leksikona sem izdelal v letih 2002 – 2004, po obsegu vsebuje
vključno z različnimi lastnimi prispevki približno 1000 strani formata A4 in je
dostopen na naslednjem spletnem naslovu:
http://www.beepworld.de/members29/udkleksikon .
2 Slikovniprikaz 2 sem za svoje potrebe dopolnil in sestavljal na podlagi spletnega
vira: ecom.fov.uni-
mb.si/seminarji.nsf/0/93cb1c225297db73c1256aef002b3cc4/$FILE/Podatkovno%2
0skladisce%20in%20E-poslovanje.ppt (2004-04-27)
3
Pri izdelavi tega slikovnega prikaza sem se naslonil na naslednji vir: Kimball, R.
[et … al.].(1998). The data warehouse lifecycle toolkit …, na strani 33.
4
Kot že omenjeno sem izdelal prototip UDK Leksikona s pomočjo nekoliko
brezplačne spletne storitve Beepworld in izvajam tudi že dve leti raziskave v zvezi
s spremljanjem zanimanj spletnih obiskovalcev prav s pomočjo teh nekoliko
brezplačnih spletnih storitev.
5
Pri vzpostavitvi projekta in tudi za ostale stopnje sem se vzgledoval - vira: Silič,
M., Colnar, M., Krisper, M. [etal …].(2000) EMRIS na str. 298 in
http://searchdatabase.techtarget.com (2004-04-27)

6 Kimball, R.(1998). The data warehouse lifecycle …, slikovni prikaz na strani 96.

7 Gl. knjigo English, L.P.(1999). Improving business information quality … na


strani 70.
8
Meritve sem izvedel s pomočjo treh spletnih storitev: Webmasterplan, WCA Link
Checker in Broken Links Checker.
9
Slovar sem sestavil na podlagi naslednjih spletnih virov: http://www.ef.uni-
lj.si/terminoloskislovar/index.asp , http://lg.msn.com/intl/sl/tutorial/glossary.htm in
http://infolab.fri.uni-lj.si/News_images/22LabInf.pdf

CIP zapis o publikaciji

Clickstream podatkovno skladišče - načrt

[85]

You might also like