Professional Documents
Culture Documents
Žalec, 30.05.2004
1 Uvod 4
2 Vzpostavitev projekta 14
3 Načrtovanje projekta 26
4 Dimenzijsko modeliranje 62
5 Zaključek 78
6 Viri 79
[2]
Povzetek
V tej seminarski nalogi sem obravnaval načrt “Clickstream” podatkovnega skladišča za
spremljanje področnih zanimanj spletnih obiskovalcev na možni različici UDK digitalne
knjižnice zavoda šolski center SSK. V uvodnem poglavju sem na kratko predstavil prototipno
spletno UDK digitalno knjižnico (izvirno ime: UDK leksikon), ki sem jo izdelal v letih od
2002 – 2004. Izpostavil sem še zlasti naslednje pozitivne lastnosti UDK-ja (univerzalna
decimalna klasifikacija) glede možnosti sistematičnega urejevanja podatkov / informacij, tako
na makroskopskem kot tudi mikroskopskem nivoju in glede možnosti zajemanja podatkov /
informacij s skorajda vseh področij človekovega znanja (npr. znanosti, umetnosti, aplikacije,
šport, materiali, osebe, izdelki, trgovine itd.) in dejavnosti (npr. raziskovanje, igranje,
prodajanje, posredovanje, svetovanje itd.). V uvodnem poglavju sem tudi obrazložil pojem
“Clickstream” podatkovnega skladišča (CPS), s katerim bi bilo možno beležiti, shranjevati in
analizirati podatke v zvezi z obnašanjem spletnih obiskovalcev na UDK digitalni knjižnici.
Tovrstni pridobljeni podatki bi lahko bili zelo koristni tako za poslovanje kot tudi za
organizacijo knjižnic, založb, šol, državne uprave, ministrstev, podjetij (npr. računalniška
podjetja, tovarne ipd.) V tem uvodnem poglavju sem se tako tudi dotaknil problema
identifikacije in zasebnosti spletnih obiskovalcev.
[3]
1 Uvod
Na kakšen način spremljati zanimanja spletnih obiskovalcev in pri tem uresničiti več različnih
koristnih namenov npr. doseganje učinkovitejše prodaje, izdelava boljšega nabavnega načrta,
izboljšanje kakovosti in učinkovitosti vzgojnoizobraževalnega procesa itd.? Na to izredno
zanimivo in zahtevno vprašanje sem že deloma odgovoril v preteklih seminarskih nalogah na
tem podiplomskem študiju (gl. spletna dela: http://www.beepworld.de/members48/udkinfosis,
http://www.beepworld.de/members54/umlmodel, in http://www.beepworld.de/members56/udkmmis.), vendar
ne z vidika podatkovnih skladišč (v nadaljevanju PS). Osnovna zamisel pričujoče seminarske
naloge je še zlasti glede uporabe sodobne informacijske tehnologije (IT) nekakšna nadgradnja
prejšnjih in se osredotoča na področje spremljanja zanimanj spletnih obiskovalcev na digitalni
univerzalni decimalni klasifikacijski (v nadaljevanju UDK) knjižnici s pomočjo
“CLICKSTREAM” (v slovenskem prevodu približno bi to pomenilo: sledenje toku klikov
oziroma sledenje spletnih obiskovalcev) PS, v katerega naj bi se shranjevale sledi spletnih
obiskovalcev, ki jih le-ti puščajo za sabo ob pritiskanju na spletne povezave na UDK digitalni
knjižnici. Z obzirom na to, da je zaradi pojma UDK-ja (univerzalna decimalna klasifikacija)
tema seminarske naloge za marsikaterega bralca s področja informatike postala manj
oprijemljiva, se mi zdi prav, da posvetim nekaj uvodnih besed temu UDK-ju (sicer si lahko
bralci tega dela ogledajo natančnejšo razlago v zvezi z UDK –jem prav na poprej navedenih
spletnih straneh, še zlasti zadnjega vira pod poglavjem UDK - v izhodiščni preglednici). Čisto
na kratko povedano je UDK klasifikacijski sistem, ki razvršča “vso” človekovo znanje,
dejavnosti in materiale itd.” s pomočjo številk (pravilneje UDK vrstilcev), črk, drugih znakov
t.j. matematičnih (npr. +, , ipd.) in interpunkcijskih znamenj (npr. :, ., ;, itd.). Prav ta prijetna
lastnost UDK-ja omogoča, da lahko zajamemo zelo široko različne podatke / informacije z
različnih področij človekovega življenja, ki se raztezajo od naravoslovja, tehnike /
aplikakativnih ved, družboslovja, humanistike, umetnosti, športa pa tja do čisto vsakdanjih
opravkov (npr. nakupovanje v delikatesni trgovini, igranje šaha, gledanje televizije, delo z
računalnikom, branje knjige itd.). Ta UDK pa je zapisan v tablicah, ki se členijo na glavne in
pomožne, ter v katerih so zapisani UDK vrstilci kot tudi pravila. Kaj potem pomeni izraz
UDK digitalna knjižnica? To je knjižnica v digitalni obliki (ožje gledano: na spletu), ki kot
ogrodje za razvrščanje podatkov / informacij (besedne, zvočne, vizualne), ki so (na spletu) v
različnih oblikah / formatih (HTML, PDF, DOC, AUD, GIF, JPEG, PNG, MPEG, AVI itd.)
uporablja UDK tablice. V tem pisanju bom še zlasti izpostavil spletne povezave, ki so urejene
po UDK-ju oziroma vsebujejo UDK vrstilec, kajti ob pritiskih (klikih) spletnih obiskovalcev
na te UDK spletne povezave (npr. 007 Informatika), si lahko s pomočjo “Clickstream” PS
pridobimo dragocene informacije ne samo o IP naslovih, registracijah, začetkih / koncih sej, o
pogostosti obiska na določeno področje zanimanja, o dolžini ogleda določene spletne strani,
temveč tudi o tem, kako tematsko podrobno ali globalno si je spletni obiskovalec ogledal
ponudbo UDK digitalne knjižnice (v tem primeru ponudbo UDK LEKSIKONA). Naj za lažje
razumevanje snovi služi naslednji slikovni prikaz.
[4]
1.1 Slikovni prikaz 1: Poizvedovanje in črpanje podatkov / informacij spletnega
obiskovalca na UDK LEKSIKONU (UDK digitalni knjižnici)
Slikovni prikaz 1 prikazuje eno od številnih možnih različic dejavnosti spletnega obiskovalca
od začetka (znak: črn zapolnjen krog), kjer v procesu iskanja podatkov / informacij npr. na
različnih zunanjih iskalnikih (znak za proces: konkavni šesterokotnik) porabi 20 minut (znak:
merilna skala v minutah – čas tega procesa bi lahko bil tudi npr. 5 sekund), da najde UDK
LEKSIKON. Na glavni strani si spletni obiskovalec izbere UDK področje 007 (znak: merilna
skala v sekundah) in za ta izbor porabi 20 sekund (s), ko nenazadnje s pritiskom (klik) na
spletno povezavo “007 informatika” vstopi na UDK področje 0, natančneje na UDK 007.
Spletni obiskovalec si izbere spletno povezavo 007:004.738.52:02:811.112.2 Virtualna
knjižnica, kar potrdi s pritiskom miške (znak: merilna skala v sekundah – 60 s). Odpre se
nova spletna stran za virtualno knjižnico (v Sloveniji so slovenski knjižničarji sprejeli termin
“digitalna knjižnica”) oddelka za germanistiko. Spletni dokument je zelo obsežen in po času
[5]
ene ure in 30 minutah (znak: merilna skala v urah – h) ogledovanja strani, se spletni
obiskovalec odloči, da se povrne (klik) na glavno stran UDK LEKSIKONA. Spletni
obiskovalec se po 15 s odloči, da si bo ogledal področje UDK 389 (metrologija), nakar si le-ta
s tleskom (klikom) na UDK 389:053.081 Pretvarjanje merskih enot dejansko izbere to
spletno stran (tega v sliki nisem prikazal). Po eni uri (h) in 52 s spletni obiskovalec zaključi
spletno sejo oziroma spletno/-e dejavnost/-i (znak: večji beli krog, znotraj katerega se nahaja
črn krog). …
Spletne UDK knjižnice si ne zamišljam kot osamljen otok sredi morja, ampak kot zbir
porazdeljenih, vendar standardiziranih / urejenih večjih in manjših enot, ki so financirane s
strani države kot tudi drugih, ki sem jih že omenil in nenazadnje morebitnih tujih vlagateljev.
Na prizorišče bi tako dejansko stopili novi knjižničarji / informatiki, ki jih je na Danskem, v
Nemčiji, Angliji, ZDA itd. že precejšnjo število, a pri nas v Sloveniji marsikdo s področja
knjižničarstva informacijske smeri (oseba, ki je zaključila študij samostojne študijske smeri
bibliotekarstva v Ljubljani s poudarkom tudi na informatiko) ne more dobiti zaposlitve v
klasični knjižnici, ker so delovna mesta dobesedno zasedana. To stanje se po mojem mnenju
tudi v prihodnosti ne bo bistveno spremenilo in zato menim, da bi lahko v spletnih UDK
knjižnicah našli zaposlitev sodobni knjižničarji / informatiki kot tudi drugi (npr. programerji
ipd.).V tem vpogledu bi seveda sodobni informacijski knjižničarji ne bili nasprotniki
klasičnih, ampak bi lahko z njimi tudi sodelovali, še zlasti v šolskih in visokošolskih
knjižnicah npr. v vzgojnoizobraževalnem procesu. Knjižničarji / informatiki “brez zidov” bi
lahko celo popestrili svoje storitve prav v smeri statističnih analiz obnašanja spletnih
obiskovalcev (tudi potencialnih kupcev) za različna podjetja, ministrstva itd.
Zdaj, ko sem obrazložil pomen UDK-ja se mi zdi smiselno še nekoliko dodatnih besed
posvetiti principu delovanja CPS-a. Preden bi bilo smotrno to izvesti, se mi zdi najprej
[6]
neobhodno potrebno na kratko obrazložiti pomen Clickstream analiz. Namen “Clickstream
(C)” analiz podatkov je v tem, da lahko preučujemo (s pomočjo klikov) pretok poizvedb
oziroma dejavnosti spletnih obiskovalcev po posameznih spletnih straneh na medmrežju, kar
nam lahko daje različne koristne podatke / informacije o naslednjih stvareh: ugotavljanje
obiskovalčevih zanimanj, kako dolgo so si ogledali določene spletne strani, od kod so prispeli
na določeno spletno stran itd. Cilji “C “ – analiz so v tem, da želi ponudnik proizvodov ali
storitev boljše razumeti obiskovalčevo obnašanje, permanentne lastnosti spletnih
obiskovalcev itd., da bi lahko na podlagi teh dragocenih podatkov ponudniki ustvarjali
odgovarjajoče spletne strani za spletne obiskovalce, kjer se tudi nahajajo potrebni podatki /
informacije, ki zelo dobro zadovoljijo njihove informacijske potrebe. Kot že nekajkrat
omenjeno spletni obiskovalci pri pregledovanju spletnih strani puščajo za sabo sledi, ki se
popisujejo v dnevniku (Log Files) spletnega strežnika in to v obliki IP naslovov, vstopnih
(login) ID, piškotkov, če so na voljo (cookies) ipd. Na podlagi teh sledi pa je možno delno
prepoznati oziroma vsaj razlikovati določene spletne obiskovalce. Naj še kot zanimivost
prikažem poenostavljen preglednični prikaz tovrstnega zapisa:
S preglednice 1 lahko razberemo naslednje: vrstni red vstopa spletnega obiskovalca na stran
UDK LEKSIKONA (Login ID), datum in čas vstopa na stran, IP naslov obiskovalca,
izhajajoči zahtevek odjemalčevega brskalnika (browser), vrsto operacijskega sistema (npr.
Windows XP) in vrsto različice spletnega brskalnika (npr. MSIE 6 – Microsoft Internet
Explorer 6) ter nenazadnje spletne strani, s katere je prišel spletni obiskovalec na UDK
LEKSIKON. Tako pridobljeni podatki še niso povsem primerni za učinkovito analizo spletnih
obiskovalcev, kajti manjkajo še zelo koristni podatki npr. o ogledih posameznih spletnih
straneh, začetek in konec ogledov oziroma sej itd. Da si o spletnih obiskovalcih pridobimo še
druge pomembne podatke / informacije nujno potrebujemo kakovostno programsko orodje za
analizo prometa na določenih spletnih straneh kot npr. IBM Tivoli Web Site Analyzer, s
[7]
katerim je možno odložiti podatke v npr. Tivoli Enterprise PS (v njem je možno shraniti tudi
zgodovinske podatke npr. o nagibih kupcev za nakupe cenejših izdelkov itd.).
Naj si kot zaključek in kot zanimivost tega uvodnega poglavja še čisto na kratko oglejmo
arhitekturo spletnega CPS-a, ki pomeni nova oblika PS za učinkovitejšo (hitrejši dostop do
podatkov) in kakovostnejšo podporo elektronskemu poslovanju. Spletno CPS je identično
klasičnemu, vendar pa prinaša s sabo dodatne zahteve t.j. zajemanje “Clickstream-a” (naj bi
zajel sledi spletnih obiskovalcev) kot tudi celovito delovanje na spletu.
[8]
naloži v PS. Tako spremenjeni podatki so potem pripravljeni za različne uporabniške analize.
IBM Tivoli Web Site Analyzer vsebuje tudi “Clickstream” podsistem (ETL procesi),
transformacijski podsistem (npr. omogoča organizacijo Web Mart shem, kategorizacijo in
integracijo podatkov). Prav ta programska aplikacija omogoča tudi odlaganje prečiščenih in
spremenjenih podatkov v PS, ki so potem pripravljeni za potrebne in koristne uporabniške
analize (v tem primeru za spremljanje zanimanj spletnih obiskovalcev na UDK leksikonu).
V tem glavnem uvodnem poglavju sem sicer zelo ambiciozno razmišljal (Think big),
vendar se bom v nadaljevanju tega pisanja ravnal po načelu “Načrtuj po majhnih
korakih”!
[9]
1.4 Namen seminarske naloge
V tej seminarski nalogi kanim prikazati (okrnjen) načrt izgradnje CPS za spremljanje
interesnih področij spletnih obiskovalcev na slovenski UDK digitalni knjižnici, ki vključuje
naslednje stopnje:
vzpostavitev projekta
načrtovanje projekta
opredelitev zahtev
določitev virov podatkov
ocena kakovosti podatkov
dimenzijski podatkovni model predlaganega CPS-a
Naj si kot vodilo za nadaljevanje tega pisnega izdelka, tako zase kot tudi za bralce, narišem
diagram poslovnega dimenzijskega življenjskega kroga za načrt (prevod iz angl.: The
Business Dimensional Lifecycle diagram) PS-a.
Slika 3 prikazuje vse stopnje v življenjskemu krogu načrta PS: (vodenje) in načrtovanje
projekta, opredelitev poslovnih zahtev, ki vključuje načrt tehnične arhitekture, izbor
proizvodov in vgraditev, specifikacijo in razvoj aplikacije končnih uporabnikov, nakar se
nadaljuje pri stopnji dimenzijskega modeliranja, potem fizični načrt, načrt priprave podatkov
in razvoja, njihova razporeditev (za uporabo) in nenazadnje stopnja vzdrževanja in rasti (npr.
podpora in izobraževanje poslovnih uporabnikov ipd.).
[10]
V tej seminarski nalogi bom obravnaval naslednje stopnje pri načrtu za CPS (gl. simbol
žarnice): vzpostavitev in načrtovanje projekta, opredelitev (poslovnih) zahtev in dimenzijsko
modeliranje.
[11]
1.5 Opredelitev oziroma osvetlitev problema
Ena od glavnih zadreg poleg velikih stroškov za izgradnjo CPS tiči v tem, da ni možno prav
vseh spletnih obiskovalcev prepoznati in povrhu tega je tudi zelo pereč problem predmet
neokrnjenosti človekove osebnosti, kajti ljudje smo v svoji notranji biti zavezani intimnosti in
se zlahka počutimo ogroženi, ko ta zasebnost utegne dobiti majave temelje. Glede navedenega
bi lahko ponudil zelo enostavne rešitve, ki pa izhajajo z določenih prepostavk:
Možna rešitev: Če bi npr. mnogo posameznikov in morda vse knjižnice v Sloveniji določile
spletni naslov spletne UDK knjižnice kot privzeto stran, bi tako lažje prepoznali spletne
obiskovalce (npr. z IP naslovi, uporabljeni operacijski sistemi itd.).
Možna rešitev: v tem vpogledu ne kaže zanemariti raziskav, ki se dotikajo obnašanja oziroma
lastnostim (zahtev / potreb / želja / sposobnosti / možnosti itd.) spletnih obiskovalcev (npr.
kognitivni slogi poizvedovanja, informacijska pismenost, uporaba zunanjih in notranjih
iskalnikov ipd.). Prav zaradi pomembnosti tega vidika je po mojem mnenju ključnega
pomena, da bi pred izgradnjo prave spletne UDK knjižnice najprej učinkovali s prototipom
npr. UDK LEKSIKONOM, ki bi odigral tudi vlogo prikritega spletnega “vprašalnika”, kar bi
lahko storili z nekoliko brezplačnimi spletnimi statističnimi programi za spremljanje obiskov
(Nedstad, Extreme Tracking itd.) in z uporabo kakovostnih tudi nekoliko brezplačnih
notranjih indeksnih iskalnikov (npr. zelo dober za te namene je PicoSearch ipd.). S tovrstnim
pristopom bi sicer izgradnja spletne UDK knjižnice trajala nekoliko dalj časa, vendar bi bilo
možno prihraniti veliko denarnih sredstev kot tudi delovnih vložkov npr. za programiranje teh
programskih orodij in povrhu tega je vgradnja teh “brezplačnih” programskih orodij na
spletno stran zelo enostavna! Prihranimo denar, kjer se da, vendar moramo paziti tudi na
kakovost teh brezplačnih spletnih storitev, kar bi pa lahko bila tema posebne seminarske
naloge.
[12]
Nenazadnje bi še želel opozoriti na problem, ki v bistvu z vidika IT kot je PS ni pravi
problem. Že pri izgradnji prototipa UDK leksikona oziroma v kasnejši stopnji spletne
UDK digitalne knjižnice bi lahko vse spletne dokumente (kot vir za zaželene /
potrebne podatke / informacije) pripravili v enotnem formatu (npr. predlog v HTML),
kar bi sicer povečevalo delovne vložke, vendar bi pa morda tovrsten pristop
zmanjševal zmedo (standardizirano – podobno kot kataložni zapisi v sistemu
COBBIS/COBIB)? Naj zadnje navedeno velja zgolj kot zamisel, o kateri bi se
izplačalo še razpravljati!
[13]
Vzpostavitev projekta
Posebna opomba: Spletni UDK LEKSIKON je hibridne narave kar pomeni naslednje:
[14]
2 Vzpostavitev projekta
Priporočljivo je najprej pripraviti projekt t.j še zlasti priporočljivo za tiste pobudnike
projektov ali določene posameznike, ki v delovnih organizacijah ne zasedajo ključne položaje
oziroma niso v delovnem razmerju, namreč pobudnik nekega projekta si mora najprej
pridobiti ustrezno odobritev za vzpostavitev projekta. Posameznik se mora najprej prepričati o
tem, če sploh obstaja interes za obstoječo zamisel, kajti če je stališče do ponujenega nevtralno
ali celo odklonilno, je v tem primeru boljše, da si posameznik poišče ali druge potencialne
zainteresirance ali pa da popolnoma opusti zamisel za projekt. Še posebej PS-a so denarno
gledano precej zahteven projekt in če pri tem ni močnih sponzorjev je velika verjetnost, da ni
velikih izgledov za uspeh. Dosedanje izkušnje v zvezi s PS kažejo na to, da se tovrstno stanje
tudi pozneje bistveno ne spremeni.
Ena od možnih različic za pripravo projekta je lahko takšna kot jo kaže slika 4 (gl. naslednjo
stran). Posameznik oziroma pobudnik projekta najprej sproži dogodek, pošlje dopise na
naslove potencialnih interesentov (sponzorji, delovne organizacije, uporabniki in informatiki /
strokovnjaki). Ko sprejeto akterji pregledajo in pozitivno ovrednotijo, podpis pogodbe z
zunanjim izvajalcem ni več vprašanje. Predstopnja priprave projekta je zaključena takrat, ko
je odobrena stopnja vzpostavitve projekta (gl. spodnjo sliko 4).
Preden se bom lahko lotil stopnje vzpostavitve projekta, bi bilo najprej potrebno določiti
ključne nosilce projekta in njihove vloge, ki so:
a. Naročnik (sponzor, zavod ipd.) – vplivna oseba, ki v večini primerov projekt financira.
b. Uporabnik – je oseba, ki je ključnega pomena pri določanju izdelkov projekta, kajti na
uporabnike bodo izdelki projekta najbolj vplivali.
c. Izvajalec – je oseba, ki izvaja dela na projektu in uresničuje naročnikove in
uporabnikove zahteve.
[15]
2.1 slikovni prikaz 4: Priprava projekta
[16]
2.2 Slikovni prikaz 5: Grob prikaz stopnje vzpostavitve projekta
Slika 5 v grobem prikazuje (slika 5 bo služila kot okvirno orientacijsko sredstvo) aktivnosti
vzpostavitve projekta, ki si ga predstavljam kot večplastno razmišljanje (gl. prikaz plasti na
levem zgornjem robu slike), kar je lahko koristno z vidika analitičnega mišljenja, ko pri
zaključku vzpostavitve projekta izvedemo pregled za nazaj. Prikazane so naslednje poglavitne
dejavnosti, ki so oštevilčene od 1 – 5.
[17]
2. Druga plast prikazuje dejavnost izdelave načrtov. Za načrtovanje projekta je potrebno
v soodvisnosti z aktivnostmi določati izdelke in izdelati načrte (npr. gantogram,
strukturni diagram itd.).
3. Vodja projekta izdela vzpostavitveni dokument projekta (VDP), ki ga pozneje na
vzpostavitvenem sestanku projekta tudi potrdijo.
4. Četrta plast prikazuje dejavnost izdelave in podpisovanja adhezijskih pogodb ali
aneksov (dodatkov). Ko so te formalnosti urejene sledi naslednja stopnja dejavnosti.
5. Peta plast prikazuje dejavnost izvedbe vzpostavitvenega sestanka projekta, kjer se
sprejme formalna odobritev projekta npr. cilji, obseg itd. - skliče ga predstojnik
projekta.
Že zaradi prostorskih razlogov kanim v tem pisanju zgolj okvirno prikazati konkretni potek
vzpostavitve projekta.
Začetek
a. Uvodni sestanek (2004-05-08, 10:00 – 17:00) – na tej točki smo določili (pobudnik /
izvajalec, vodja in predstojnik projekta) naziv projekta, namen, cilje in ostale vloge na
projektu (podrobnejši opis sledi v nadaljevanju). Povrhu tega smo tudi predstavili
naročnika (Šolski center SSK / knjižnica SSK), sponzorje (Pivovarna Laško,
Mercator, Ministrstvo za znanost šolstvo in šport, IZUM Maribor), izvajalec (Karl
Petrič) in vodjo projekta (ravnatelj SSK XY).
[18]
2.3 Slikovni prikaz 6: Okvirna organizacijska struktura projekta
Slika 6 prikazuje okvirno organizacijsko strukturo projekta, kjer ravnatelj SSK poimenuje
predstojnika projekta (namestnik ravnatelja Pivovarne Laško), ki naj bi bil sposoben
zagotoviti potrebna denarna sredstva in naj bi podpisal tudi pogodbe z zunanjimi izvajalci, ki
so tudi poleg tehničnih svetovalcev in uporabnikov / informatikov člani projektnega sveta.
Vodja projekta naj bi zelo dobro poznal delovno organizacijo, ključne uporabnike in v zavodu
obstoječo informacijsko tehnologijo. Na podlagi tega smo na uvodnem sestanku izbrali vodjo
informatike v šolskem centru SSK. Vodja projekta vodi projektno skupino, ki je sestavljena iz
informatikov / organizatorjev, računalnikarjev izvedencev za programsko in strojno opremo in
računalnikarjev programerjev. Projektna skupina šteje vključno z vodjem projekta 11 ljudi.
[19]
Na sestanku smo določili tudi vodjo kakovosti, zaposlen v šolskem centru SSK, ki sicer v tem
zavodu skrbi za kakovost računalniškega opismenjevanja. Glede presojevalcev kakovosti smo
bili mnenja, da bo kakovost ocenjeval projektni svet, kajti morebitni dodatni zunanji izvajalci
(npr. izvedenci za IT) bi zahtevali dodatna denarna sredstva, kar bi lahko ogrozilo ves projekt.
Točka 2.4 slika 7 na naslednji strani prikazuje odvisnosti med izdelki in aktivnostmi na
projektu. Po daljši razpravi smo se odločili, da bomo uporabili ta model. Odločili smo se za
naslednje:
[20]
2.4 Slikovni prikaz 7: Okvirni načrt za načrtovanje odvisnosti med izdelki in
aktivnostmi na projektu UDKEUKLIK 1/2004
Gornji slikovni prikaz 7 je kot že prej omenjeno zgolj okviren in ocenjujem, da v poznejši fazi
delovanja morda kakšen od navedenih izdelkov ne bo potreben. V nadaljevanju bo potrebno
izdelati strukturni diagram izdelkov projekta za načrt CPS.
d.) strukturni diagram izdelkov projekta za načrt CPS (2004-05-09, 09:00 – 17:00)
Odločili smo se, da si zaradi nazornejše predstave za načrt projekta CPS izdelamo še
strukturni diagram izdelkov projekta za načrt CPS. Izdelki so bili že na sliki 7 okvirno
prikazani, vendar smo potrebovali natančnejši in čistejši vpogled v zgradbo izdelkov, kajti v
strukturnem diagramu so izdelki natančneje razčlenjeni na točke od 1 do 8 (npr. natančen
prikaz strateških prvin itd.).
[21]
2.5 Slikovni prikaz 8: Strukturni diagram izdelkov projekta za načrt CPS
Točka 1 / uvod – je v tem pomenu pisni izdelek, v katerem so navedeni prvi koraki za načrt
CPS (gl. na strani 18). Odločili smo se, da izdelamo strukturni diagram (slika 8) kot ga
priporoča EMRIS (enotna metodologija za razvoj IS) za strateško načrtovanje IS in ga v
poznejši stopnji prilagodimo svojim potrebam.
[22]
Točka 2.1 / poslanstvo in vizija DO (ali organizacijskega sistema), točka 2.2 cilji DO, točka
2.3 usmeritve DO, točka 2.4 cilji CPS, točka 2.5 usmeritve CPS, točka 2.6 problemi DO,
točka 2.7 problemi CPS, točka 2.8 povezovalna matrika glede problemov ciljev, točka 2.9
kritični dejavniki uspeha (KDU) DO, točka 2.10 KDU CPS in točka 2.11 povezovalna matrika
glede primerjave ciljev nasproti poslovnimi pravili in problemov v odnosu do poslovnih
pravil.
Točka 3.1 organizacijska slika DO, točka 3.2 povezovalni matriki glede organizacijske enote
in lokacije ter organizacijske enote in poslovna pravila, točka 3.3 globalni funkcionalni
model, točka 3.4 povezovalne matrike glede na funkcije v razmerju do lokacije,
organizacijske enote, odgovorne osebe in poslovnih pravil, točka 3.5 globalni model
podatkovnih tokov, točka 3.6 globalni model delovnih procesov (DP), točka 3.7 povezovalne
matrike DP glede na funkcije, entitete in poslovna pravila, točka 3.8 globalni podatkovni
model, točka 3.9 povezovalne matrike entitet glede na funkcije, lokacije in organizacijske
enote, točka 3.10 model uporabe mobilnih komunikacij, točka 3.11 model povezovanja in
točka 3.12 povezovalna matrika entiteta / CPS.
Točka 4.1 Pregled strojne opreme, točka 4.2 pregled komunikacijske opreme, točka 4.3
pregled programske opreme, točka 4.4 povezovalna matrika funkcij nasproti aplikacijam,
točka 4.5 pregled informacij na internetu in točka 4.6 pregled kadrov.
Točka 5.1 opis tehnoloških možnosti in točka 5.2 povezovalna matrika glede tehnoloških
sprememb v primerjavi z zadanimi cilji.
Točka 6.1 načrt za strojno opremo, točka 6.2 načrt komunikacijske opreme, točka 6.3 načrt
programske opreme, točka 6.4 načrt informacij na internetu in točka 6.5 načrt kadrov.
Točka 7.1 Seznam aplikacij s prioritetami, točka 7.2 področne planske aktivnosti, točka 7.3
načrt sredstev in potreb po kadrih ter točka 7.4 operativni načrt.
[23]
2.6
Slikovni prikaz 9: Terminski plan za CPS v okrnjeni obliki
Slika 9 prikazuje okrnjen terminski plan za CPS, kjer so ponazorjene zgolj glavne aktivnosti
in izdelki. Vse dejavnosti in izdelke obravnavamo s časovnega vidika.
V nadaljevanju smo še prikazali naslednje načrte kot npr. plan virov, finančni načrt in načrt
kakovosti. Zaradi prostorskih razlogov naj v tej seminarski nalogi prikažem zgolj celokupne
ocene.
[24]
postopek pri odstopanju pri načrtih – npr. vodja projekta mora ukrepati, če projekt
preseže tolerančne meje
tveganja – npr. ocenijo se dejavniki, ocenjuje se projekt ipd.
dokumentacija projekta – npr. opredelila se bo dokumentacija, ki se bo uporabila na
projektu itd.
[25]
Načrtovanje projekta
[26]
3 Načrtovanje in vodenje projekta
Opredelitev projekta - Naziv projekta – UDKEUKLIK 1/2004 spada v kategorijo srednje
kompleksne projekte. Najprej načrt za izgradnjo enega področnega CPS in v primeru uspeha
se dajo izgraditi še druga področna CPS. Najbolj primerna in preverjena je glede tega primera
distribuirana arhitektura CPS.
Obstaja ustrezna poslovna motivacija, obstaja ustrezna socialna mreža med službo za
informatiko in uporabniki, zavod se lahko pohvali z zavidljivim obsegom analiz s področja
organizacije in informatike dela, v zavodu je že vzpostavljena dokaj visoka stopnja tehnične
infrastrukture, kar je ugodno za tehnično izvedljivost projekta, povrhu tega je podpora
vodstva za projekt visoka, prisotni so trije zelo močni sponzorji (IZUM, MZŠŠ in Pivovarna
Laško, medtem ko so ostali sponzorji sporočili, da ne želijo več pri tem projektu sodelovati),
ki imajo vizijo in vanjo verjamejo, vendar ostajajo na realnih tleh, so diskretni in verodostojni
in v družbi uživajo visok ugled. Zavod Šolski center SSK izpolnjuje vse pogoje.
a. Osnove
b. Obseg glede števila izvornih sistemov bo tako eden, a število uporabnikov bo 11 (od
tega šest zaposlencev SSK) ter obseg zgodovinskih podatkov v zvezi z interesnimi
področji spletnih obiskovalcev za dve leti.
[27]
c. Tehnična arhitektura za prvo področno CPS bo sestavljena na podlagi naslednjih
zahtev:
Strojna oprema
Dodatni sistemski spomin za trdi disk bo po vsej verjetnosti potreben, kar je odvisno
od velikosti spletnih dnevnikov (log file)
• 1GB RAM-a
• CD-ROM gonilnik
• SVGA kartica
Programska oprema
Spletni brskalniki
Podatkovna baza
[28]
• W3C razširjen log format
V CPS-u bodo shranjeni naslednji podatki: datumi in ure obiskanih strani, obiskovalec
(še zlasti registrirani), objekti na strani, poizvedbe na notranjem iskalniku, vrsta in
številka seje, zunanji iskalniki, ki so obiskovalca usmerili na UDK leksikon, proizvodi
/ storitve – v tem primeru so to podatki / informacije, a tudi programska orodja za
nalaganje (download) oziroma hipertekstni kazalci na slike, ki spletnega obiskovalca
napotijo na te spletne strani.
f. Izključevanje
Glede zajema podatkov bi želeli izključiti naslednje: t.j. ogled reklam, oglede t.i. rumenih
strani, oglede X-strani kot tudi vse tiste strani, katerih vsebina je sporna (npr. nasilje itd.).
Projekt naj bi bil zaključen kot že pri gantogramu omenjeno približno 18. avgusta 2004.
- čas uporabe
Stroške glede izgradnje CPS so izračunali informatiki in so po njihovih ocenah znašali okoli
100.000,00 Euro. Pri tem so upoštevali naslednje prvine:
[29]
o stroški v zvezi s strojno programsko opremo
o stroški vzdrževanja strojne in programske opreme
o stroški razvojne skupine (notranji)
o stroški zunanjih izvajalcev
o stroški v zvezi z uporabniki
- Končni uporabniki so ocenili veliko korist v obliki družbene blaginje t.j. kakovostnejši
vzgojno-izobraževalni proces (pedagoški kader bolje razume potrebe dijakov), nekateri so
celo ocenili, da se bodo pretekla prizadevanja v prihodnosti bogato nagradila tudi na
denarnem področju npr. pritok denarnih sredstev sponzorjev, pritok denarnih sredstev za
posebne storitve kot npr. statistitične analize na naročila bogatih podjetij ipd.
Na naslednji strani bom posredoval fragmentaren preglednični prikaz glede sestave projektne
skupine in njihovih nalog / vlog. Pri tem prikazu bom še zlasti izpostavil naloge, ki jih naj bi
opravljal podatkovni arhitekt (Karl Petrič). Ta podatkovni arhitekt je tudi zelo dejaven na
drugih področjih, kar sicer ni najbolj običajno, kar si pa je možno obrazložiti spričo dejstva,
da je ta oseba bila tudi pobudnik tega projekta, zato je na nek način razumljivo, da si le-ta še
dodatno prizadeva, da bi projekt uspešno potekal. V bledo rumenem okviru v zgornjem levem
kotu so opredeljene različne vrste odgovornosti glede opravljanja nalog.
[30]
3.1 Preglednica 2: Projektna skupina in vloge
[31]
3.2 Opredelitev zahtev
V tej stopnji bom obravnaval naslednji podstopnji:
V slikovnem prikazu 7, točka 2.4, na strani 21 sem poleg poslovnih in tehnoloških zahtev
navedel tudi organizacijske zahteve. Kot izhodišče za opravljanje nalog pri projektu, smo se
na podlagi izidov z intervjujev s člani projektne skupine in predstojnikom projekta odločili za
projektno organizacijsko obliko na principu načela ločenosti, ki ima to prednost, da temelji na
načelu sodelovalnega sloga delovanja oziroma vodenja, da so dejavnosti na projektu
usmerjene z enega mesta, kar omogoča lažje usklajevanje dejavnosti, boljšo in hitrejšo
izgradnjo CPS, skratka izpeljavo projekta. Pomanjkljivost te organizacijske oblike kot je
pretirana neodvisnost določenih členov v tej sestavi, je možno odpraviti tako, da vodja in (v
tem primeru) pobudnik projekta ves potek nadebudno spremljata. V šolskem centru SSK ta
čas ne potekajo različni projekti, sicer bi se morda prej odločili za matrično organizacijsko
obliko dela. V bližnji prihodnosti se sicer obeta nek manjši projekt v zvezi z razvijanjem
osebnosti pedagoškega kadra, vendar bodo pri tem manjšem projektu glavni nosilci nalog
psihologi, pedagogi in sociologi. V primeru, da bi se prihodnji projekt vsebinsko in tehnično
bolj navezoval na projekt izgradnje CPS, bi se se po vsej verjetnosti odločili za kombinacijo
projektne organizacijske oblike po načelu vgrajenosti in matrične organizacijske oblike dela.
Osnovna zamisel o organizacijskih zahtevah ima svoje ozadje prav v analogiji z nogometnim
moštvom, kjer je še kako pomembna pravilna organizacija igralcev kot tudi drugih kadrov, ki
sodelujejo. Če lahko trdimo, da dobro organizirano nogometno moštvo večinoma premaga
slabše organizirano, potem bi lahko v prenesenem pomenu trdili, da dobro organizirana
projektna skupina lahko premaga manj kakovostno obstoječe stanje, kajti nenazadnje lahko
pomeni opredelitev zahtev že nekakšna tekmovalna napoved obstoječemu stanju ali celo
“tekma” proti obstoječemu stanju!
[32]
3.3.1 Slikovni prikaz 10: Možna različica projektne organizacijske oblike dela,
ki temelji na načelu ločenosti (od morebitnih drugih projektov v SSK)
V tem primeru tovrstna organizacijska oblika delovanja ne samo, da pospešuje različna dela
na projektu, ampak omogoča tudi večjo mero samostojnosti članov na projektu, kar po mojem
mnenju lahko dviguje samozavest vseh sodelujočih in s tem posledično lahko daje tudi tisti
pozitivni učinek maksimalnega poistovetenja z delom, ki ga opravljajo. Visoka stopnja
[33]
poistovetenja pri delu pa lahko preoblikuje povsem povprečne ljudi v nadpovprečne in s tem
se lahko dosežejo odlični izidi!
Preden bom opredelil poslovne zahteve naj še kot prehod na to podpoglavje izpeljem
določeno spoznanje s področja organizacijskih zahtev. Ustrezna ali neustrezna socialna klima
med sodelujočimi, še zlasti v projektni skupini po moji oceni lahko zelo vpliva na uspešnost
ali neuspešnost projektnega poslanstva in s tem je ustvarjena pozitivna ali pa negativna kal za
nadaljnjo uspešno poslovanje. Organizacijske zahteve so zelo tesno povezane s poslovnimi
zahtevami, morda celo tako tesno, da bi ju lahko združili v eno, kar pa seveda ne gre, če
izhajamo ali s teorije organizacije ali pa teorije poslovanja.
Naj še kot zanimivost in kot prehod na naslednje podpoglavje predstavim sociogram socialne
bližine projektne skupine vključno z vodjem projekta, ki nekoliko spominja na R. Kimballov
lakmusov preizkus pripravljenosti ljudi za izgradnjo PS. Socialno bližino med posameznimi
člani projektne skupine, vključujoče vodje, bom ovrednotil z vrednostmi od 0 (0 – 6,5 pomeni
od preveč prijateljskih odnosov do zmernih, 7,5 –14 od zmerno hladnih do nasprotovalnih in
celo sovražnih odnosov) do 14.
Pri ugotavljanju kakovosti in narave odnosov med ljudmi bo potrebno uporabiti različne
tehnike npr. pogovori z vsemi vpletenimi, Belbinov preizkus osebnosti (je zelo učinkovito
orodje), metodo opazovanja, morda kakšni krajši intervjuji o tem, kako si posamezni člani
projektne skupine predstavljajo svoje sodelavce ipd.
[34]
3.3.2 Slikovni prikaz 11: Sociogram socialne bližine članov v projektni skupini
in moč povezav med njimi
[35]
Sociogram socialne bližine članov v projektni skupini na sliki 11 prikazuje poleg odnosov
naklonjenosti / nenaklonjenosti tudi stopnje moči odnosov med njimi t.j. od 0 – 14. Na
podlagi dobljenih izidov bi lahko sklepali, da bo tovrstna delovna skupina težje izpeljala
zadano nalogo, kajti obstaja nekaj zelo negativnih odnosov, ki kažejo na poleg pretirane
subjektivnosti tudi na nezdrav tekmovalni odnos morda celo na sovražnost npr. med vodjem
projekta (3/12) in sistemskim analitikom (3/12). Oba sta pa sicer pri drugih članih projektne
skupine dokaj upoštevana in priljubljena (9 1), kar kaže na neko enakomerno porazdeljeno
moč med njima (vplivnost). Težko je oceniti (premalo je bilo še meritev v zvezi s tem), katere
vrednosti so najbolj ugodne za ustvarjalno in učinkovito delo v projektni skupini, vsekakor
smo pa lahko prepričani o tem, da ali skrajni in intenzivni prijateljski ali nasprotovalni /
sovražni odnosi niso ugodni za delo nasploh (ustrezna stopnja ekvivalentnosti med člani).
Po R. Kimballu idr. je opredelitev poslovnih zahtev za izgradnjo (C)PS zelo pomembno, saj
se neposredno ali vsaj posredno dotika naslednjih področij:
3.4.1 Slikovni prikaz 12: Poslovne zahteve kot osrednji vidik CPS
[36]
meri vplivajo na ugoden ali neugoden izid delovanja oziroma ožje gledano, poslovanja. Z
različnimi tehnikami (pogovori s poslovnimi uporabniki, intervjuji, z opazovanjem ipd.) bo
potrebno proučevati poslovne zahteve z vidika uporabnika kot tudi z vidika po kakovosti
podatkov. Kot prvo naj prikažem preglednični načrt nalog za zbiranje podatkov o poslovnih
zahtevah z vidika uporabnikov in kakovosti podatkov.
[37]
3.5.1 Preglednica 4: Zbiranje zahtev ostalih uporabnikov s pomočjo
elektronske pošte (E- pošta)
[38]
njihovih težav pri učenju. Problem, ki sem ga izpostavil je zelo hibridne narave, je sociološki,
organizacijski, komunikacijski in se dotika tudi poslovne sfere. Ta izpostavljen problem bi
lahko poimenovali kot kulturni problem z najširšega vidika in ki povzroča zavodom na daljši
rok gledano velike stroške. Potrebno se je vpletenim v vzgojnoizobraževalnem procesu bolj
približati oziroma jih bolje spoznati in potem jih v nadaljnji stopnji motivirati tudi z
ustreznimi vzgojnimi ukrepi in ne samo v obliki kazni. Znano je, da slaba poslovna oziroma
kultura ljudi nasploh zvišuje sleherni DO in tudi državi transakcijske stroške. Prav zaradi tega
smo pomislili, da bi bilo smotrno zajeti mnenja čim širše populacije ljudi, kajti
vzgojnoizobraževalni proces je pomemben in se ne tiče zgolj peščice uporabnikov. To
dodatno prizadevanje sicer zahteva nekaj več napora in časa, vendar pa poteka zajemanje
mnenj s pomočjo elektronske pošte dokaj hitro. S strani teh uporabnikov pa je sodelovanje pri
E – intervjuju povsem neobvezno, vendar z naše strani je njihovo sodelovanje zelo zaželeno.
Ob tem pa je potrebno pripomniti, da morajo biti tovrstni t.i. E- intervjuji oblikovno nazorni
in vsebinsko prilagojeni temu krogu ljudi!
na načelu, da naj bi si vsak član projektne skupine izdelal vizualni zemljevid (v obliki shem
ipd.), kako si predstavlja DO, izboljšave v njej, pomanjkljivosti v DO, merila uspešnosti in
pogostost meritev, način reševanja problemov in glede boljšega pretoka informacij v DO,
odprava ozkih grl, promocija storitev, spletni obiskovalci. Pri tem preizkusu bi sodelovali vsi
Naj si še ves postopek glede tehnik zbiranja poslovnih zahtev ogledamo z vidika časovnega
zaporedja aktivnosti in udeležencev, ki so sodelovali. Slikovni prikaz 13 (točka 3.6.1) je UML
sekvenčni diagram (ali diagram zaporedja), ki na levem robu prikazuje aktivnosti pri
[39]
pridobivanju podatkov (to so: obvestila za intervjuje s člani projektne skupine / potrditev
prejetja oziroma povratna informacija, obvestila za intervjuje z ostalimi uporabniki /
potrditev sprejetja, obvestila za intervjuje s poznavalci podatkov za CPS / potrditev sprejema,
povratne informacije v obliki shem s strani članov projektne skupine / pri tem sodelujeta tudi
vodja projekta in podatkovni arhitekt, povratne informacije ostalih uporabnikov glede E-
intervjujev, analiza spoznanj, dokumentacija in pregled, objava izidov in zahtev, prednosti /
popravki pri obsegu projekta in odobritev s strani uporabnikov, pregled projekta skupaj s
poslovnimi uporabniki in končno samorefleksija ter potrditev o zaključku intervjujev v zvezi s
poslovnimi zahtevami) na vrhu slike so udeleženci (to so eksploratorji oziroma vodje
intervjujev / spraševalci, člani projektne skupine – teh je 9, kajti vodja projekta in podatkovni
arhitekt sta izvajalca intervjujev / eksploratorja). Na strani 42 po prikazu diagrama zaporedja
sledi še opis uporabljenih simbolov.
[40]
3.6.1 Slika 13: UML sekvenčni diagram aktivnosti in udeleženci pri zajemu zahtev
[41]
K slikovnem prikazu 13 bi pripomnil zgolj pomen asinhronih povratnih sporočil ostalih
uporabnikov. To pomeni, da njihove povratne informacije kot celokupek ne bodo časovno
usklajene, namreč nekateri bodo pošiljali prej, nekateri pozneje, medtem ko nekateri sploh ne
bodo pošiljali povratne informacije v zvezi z E- intervjuji.
Da pa lahko nekoga vzgajamo, moramo najprej temeljiteje spoznati njegove osebnosti (to še
ni dovolj), njegova zanimanja, kar opazujemo tudi na dolgi rok, njegove strahove, njegove
šibkosti, njegove sposobnosti ipd. Po mojem mnenju je tudi v tem smisel uporabe visoko
[42]
razvite informacijske tehnologije kot je npr. CPS, ki bi lahko pripomogel k razrešitvi izredno
kompleksnih organizacijskih oziroma družbenih težav. Če se v družbenih sistemih porajajo
nepravilnosti, hude napake, nasilje itd. je to na nek način alarmno sporočilo, da je veliko
stvari v naših družbah bolj ali manj neurejenih. To pomeni, da je potrebno zadeve urediti, tudi
z meritvami izredno kompliciranih družbenih pojavov, vendar da lahko izmerimo tovrstne
kompleksne družbene pojave pa potrebujemo celo kopico zgodovinskih podatkov (bolj kot je
npr. družbeni pojav kompleksen, več (različnih) podatkov o njemu bomo potrebovali). Toliko
o opredelitvi poslovnih zahtev v šolskem centru SSK. Zdaj pa kot obljubljeno preidemo na
naslednje podpoglavje.
V podatkovno bazo IBM DB2 bodo pritekali zelo heterogeni zunanji (spletni) podatki, ki
bodo po eni strani prišli z različnih strežnikov, z različnih zunanjih in notranjih iskalnikov,
virtualnih vodičev, informacijskih portalov, osebnih strani, s podstrani UDK leksikona, a po
drugi strani bodo tovrstni podatki tudi v različnih formatih. Določitev virov podatkov je
ključnega pomena za ETL proces in za kakovost podatkov. Zajemanje “Clickstream” (sledi)
podatkov o spletnih obiskovalcih je za našo CPS osrednjega pomena. Te podatke o sledeh
spletnih obiskovalcev bom okvirno razvrščal na naslednji način:
konsistentni (da si podatki med seboj niso v nasprotju - teh težav s “C” podatki
nimamo)
pravilni (da se skladajo z resničnostjo – “C” podatki so pravilni)
popolni (da ne manjkajo pomembne vrednosti ali pa pomembni atributi)
natančni (npr. še zlasti pri številčnih (denarnih) vrednostih, da ne manjkajo ustrezna
ločila npr. pika ali vejica) in zrnati (npr. dnevno natančni podatki) – so natančni
zanesljivi – “C” podatki so zanesljivi
razumljivi
uporabni in relevantni
Cilj je ustrezne podatke, ki so jih ustvarili spletni obiskovalci (v obliki sledi) pripraviti tako,
da so uporabni za analizo interesnih področij spletnih obiskovalcev.
[43]
a. že omenjeni dnevnik spletnega strežnika (angl. Web Server Log), ki lahko posreduje
naslednje podatke o spletnih obiskovalcih:
podatke o IP naslovih
identifikacijsko obliko odjemalca ali “Ident”, če je aktiviran, sicer ne
uporabniški ID, v primeru, da določen segment v UDK leksikonu npr. UDK
diskusijski forum zahteva geslo uporabnika za vstop na to stran
čas poizvedbe oziroma povpraševanja
prvo vrstico poizvedbe npr. “GET…”
status – trovrstična koda, ki se vrne k odjemalcu
bytes – število oziroma količina poslanih bytov
Referenca – s katere spletne strani ali iskalnika je spletni obiskovalec prispel na UDK
leskikon
Uporabniški agent – ugotovi naziv in verzijo brskalnika
piškotki (angl.: Cookies, če je na voljo)
a. spletni špijoni (angl. Web bugs – bomo uporabili zgolj v namen poizvedovanja
zaslonskih rešitev spletnih obiskovalcev in npr. če vsebuje obiskovalčev brskalnik tudi
multimedijski- Plugin)
b. programi za nadzor spletnega prometa npr. v našem primeru IBM Tivoli Web Site
Analyzer
Na naslednji strani si bomo ogledali globalni model podatkovnih virov (slikovni prikaz 14), ki
prikazuje udeležence in njihove aktivnosti na UDK leksikonu, s katerimi ti spletni obiskovalci
(tudi poslovni uporabniki) ustvarjajo sledi oziroma že kar podatke, ki pomenijo za naše CPS
(t.j spremljanje zanimanj spletnih obiskovalcev in shranjevanje teh podatkov) podatkovne
vire. Ti podatkovni viri s spleta so v naslednjih oblikah:
Tovrstne pridobljene podatkovne vire je smotrno shranjevati v podatkovno bazo (npr. IBM
DB2), kajti že samo LOG file-i zavzemajo veliko prostora (govori se o več GB v enem dnevu),
zato je potrebno vse te podatkovne vire s pomočjo ETL orodja očistiti in transformirati. Šele
po tem postopku lahko naložimo ustrezno organizirane podatke v CPS.
[44]
3.7.1 Slika 14: Globalni model podatkovnih virov in tokov od nastanka do zajema
Globalni model podatkovnih virov (gl. točko 3.7.1 slika 14) prikazuje tok spletnih dogodkov
od nastanka pa do zajema podatkovnih virov. Začetno stanje je na sliki prikazano kot rumen
[45]
krog z zelenimi obrobami. Podatkovne vire ustvarjajo spletni obiskovalci (gl. sliko 14: to so
spletni obiskovalec in poslovni uporabnik prikazana z znakom kvadrata). Najprej ti dostopajo
na internet oziroma ožje gledano na spletni UDK leksikon (znak za zunanjega interaktorja je
pravokotnik). Spletni obiskovalec izvaja različne dejavnosti, ki so npr. poizvedovanje,
brskanje po spletnih straneh, ustvarjanje predlogov ter komuniciranje (gl. sliko 14: dejavnosti
so prikazane kot elipse). Vse te dejavnosti se začasno shranjujejo (na sliki je to prikazano kot
dve debeli črti, med katerima se nahaja rdeč napis). Poslovni uporabnik (gl. sivi pravokotnik)
prav tako izvaja različne spletne dejavnosti, le da so zelo specializirane v smeri poslovnih
prizadevanj. Tako denimo stopi v poslovno interakcijo z dobaviteljem, vendar ta isti poslovni
uporabnik lahko tudi stopi v vlogo nekakšnega dobavitelja (npr. šolski knjižničar posreduje
ravnatelju neke založbe informacije v zvezi z bralnimi navadami srednješolskih profesorjev in
dijakov ipd.). Vse te dejavnosti na spletu ustvarjajo sledi (gl. sliko 14: prikazano kot rumeni
oblaki). Zaključeni izidi teh spletnih dogodkov (na sliki prikazano kot rdeč krog z debelo črno
obrobo) so z vidika spremljanja zanimanj spletnih obiskovalcev pridobljeni podatkovni viri
(na sliki 14 so prikazani kot raznobarvni oblaki). O teh podatkovnih virih sem pisal že na
strani 45, vendar bi k temu dodal še naslednje spoznanje. Podatkovni viri pridobljeni z
dnevnikom spletnega strežnika in spletnimi statističnimi programi so implicitni oziroma
izpeljani podatkovni viri, medtem ko so pridobljeni viri s pomočjo spletnih obrazcev
eksplicitni podatkovni viri, saj celo poznamo ime, priimek itd. spletnega obiskovalca.
Smer nadzornih tokov sem na sliki 14 označil s črno zapolnjenimi puščicami, smer aktivnosti
sem prikazal z zaobljeno črto, ki se zaključi s črno zapolnjeno puščico in povezavo do
spletnih sledi (tudi pridobljenih podatkovnih virov) sem na sliki prikazal s črto.
[46]
Ocenjevanje kakovosti podatkov je sestavni del metodologije celovitega obvladanja kakovosti
podatkov (angl.: TQdM – Total Quality data Management), ki se sestoji iz šestih procesov.
V tem pisanju se bom ukvarjal s procesoma ena (okvirno) in dva (bolj podrobno), vendar z
nekoliko drugačnega vidika. Ocenil bom kakovost podatkov obstoječega spletnega
aplikacijskega sistema UDK leksikona, ki pomeni izhodišče za vse nastale podatkovne vire (v
obliki “clickstream” podatkov) v zvezi s spremljanjem zanimanj spletnih obiskovalcev.
Tovrstne podatke, ki so jih aplikacijska programska orodja zajela / zaznala npr. dnevnik
spletnega strežnika ipd. in posredovala v podatkovno bazo, pa so osrednjega pomena za
izgradnjo CPS.
Proces 1: Ocena kakovosti podatkovnih opredelitev – vsi podatki se opredelijo tako, da jih
lahko poslovni uporabniki pri poslovnem komuniciranju enotno uporabljajo. Tovrstni podatki
se shranjujejo v posebnem seznamu, ki je za vse poslovne uporabnike dostopen. Kakovostne
podatkovne opredelitve naj bi na splošno izgledale tako:
[47]
3.8.2 Slikovni prikaz 16: Globalni podatkovni model “Akter”
Toliko o tem.
Proces 2: ocena kakovosti podatkov – preden grem na načrt ocene podatkov v UDK
leksikonu in oceno potrebnih podatkov za spremljanje spletnega prometa oziroma zanimanja
spletnih obiskovalcev, bi najprej kot uvod v problematiko prikazal sliko arhitekture
zamišljenega CPS, da si lahko lažje predstavljamo pomembnost procesa 2, t.j. ocenjevanje
kakovosti podatkov, čeprav ocenjevanje kakovosti podatkovnih virov mnogi načrtovalci
(C)PS zanemarjajo.
[48]
3.8.3 Slikovni prikaz 17: Pritok “clickstream” podatkov z Interneta
Z obzirom na okoliščino, da Šolski center SSK nima svojega CPS, bo pogled na ocenjevanje
kakovosti podatkov (kot že omenjeno) nekoliko drugačen. Izhajati bo potrebno z virov
podatkov, ki so izid sledov, katere so (s kliki) pustili za sabo spletni obiskovalci, medtem ko
so iskali / našli ustrezne podatke / informacije na UDK leksikonu.
[49]
Ta model se lahko še naprej razvije tako, da bi dobili kot izid 25 preglednic oziroma pet
zvezdnatih pregledničnih shem. Prva bi se imenovala POGOJI, s katere bi se razvijala druga z
nazivom UKREPI, tretja bi se imenovala MERITVE, četrta bi se imenovala IZRAČUNI in
nenazadnje bi dobili zvezdnato preglednično shemo z nazivom SINTEZA KAKOVOSTI (vse
glavne ocene bi bile združene v tej zadnji shemi). V tej seminarski nalogi bom prikazal zgolj
prvo zvezdnato preglednično shemo z nazivom POGOJI (četrta prvina te sheme je UKREP, ki
ima drugo vsebinsko utež za ovrednotenje – o tem v nadaljevanju podrobneje).
[50]
3.8.4 Slikovni prikaz 17: Celokupen pregled nad oceno kakovosti podatkov
[51]
Slika 17 prikazuje celokupen pregled (za srednje kompleksen načrt) na oceno kakovosti
podatkov glede “clickstreama” in podatkov v obstoječem UDK leksikonu. Zgradba tovrstne
ocenitve kakovosti podatkov je naslednja:
V nadaljevanju bom prikazal sleherno preglednico posebej, obrazložil izide oziroma ocene,
nakar bom izvedel sintezo spoznanj. Na podlagi spoznanj bo možno tudi odkrivati morebitne
pomembne prvine, ki sem jih v tem (delnem) procesu ocenjevanja kakovosti podatkov ali
spregledal ali pa da so takšne narave, da si zaslužijo posamično obravnavo.
[52]
3.8.5 Preglednica 5: Središčna preglednica – izhodišče
[53]
seštevkov izpolnjujejo tudi podstrani spletnega UDK leksikona ta pogoj (željo /
zahtevo), zato tudi najvišja možna ocena +10.
Isto velja za zahtevo / željo po beleženju časa obiska na eno izmed teh strani, kajti tudi
v tem primeru je seštevek ocen +10.
Glede prepoznavanja identitete spletnega obiskovalca pa je pogoj na vseh straneh
zgolj delno izpolnjen, zato tudi vrednost 0 (nič).
Za ugotavljanje obiskanosti (stran / objekt) posameznih spletnih povezav (stran /
objekt) znotraj strani UDK leksikona in podstrani pogoji niso izpolnjeni, zato tudi
vrednost –10.
V zvezi z vrsto zahteve le glavna stran deloma izpolnjuje pogoje (zato vrednost 0),
medtem ko ostale strani ne izpolnjujejo pogoja in skupni seštevek (ali odštevek) ocen
je –9.
Glede zaželenega podatka za vrsto seje (začetek / konec) vse strani ne izpolnjujejo
pogoj ali željo / zahtevo, zato tudi skupna vrednost ocen –10.
Pri ID seje pa vse obravnavane strani UDK leksikona izpolnjujejo pogoj, zato tudi
vrednost +10.
V zvezi s sklicem (referer) na eno izmed strani v spletnem UDK leksikonu izpolnjuje
le glavna stran pogoj, UDK 7 in 9 le delno, medtem ko druge strani ne izpolnjujejo
pogoj in skupna vrednost ocen je tako –7.
V zvezi z beleženjem storitev le glavna stran izpolnjuje pogoj, medtem ko druge ne
izpolnjujejo pogoj, zato tudi končna vrednost ocen –9.
a. Skupni izid ocen pri vertikalnem seštevanju je tako znašal –13 od 90.
b.) Skupni izid ocen pri horizontalnem seštevanju je bil -15 od 100.
Izida kažeta na to, da je potrebno obstoječo stanje popraviti npr. s tem, da si s pomočjo
ustreznih programskih orodij npr. za spremljanje spletnih obiskovalcev na spletu pridobimo
zaželene podatke (npr. programsko orodje IBM Tivoli Web Analyzer ipd.). Po drugi strani pa
oba končna izida ocen spet nista tako porazna (vrednosti bi lahko bile precej nižje npr. –50 ali
pa celo –90), da ne bi imeli v vidu še kakšno drugo rešitev.
[54]
3.8.6 Preglednica 6: Dimenzijska preglednica – levo zgoraj
Preglednica 6 prikazuje podatke, ki bi jih želeli zajeti (se navezuje na poprejšnjo središčno
preglednico) in štiri spletne aplikacije za spremljanje aktivnosti obiskovalcev na spletu, ki so
v preglednici podane kot vrsta podatkovnih virov. V rumenem pravokotniku je legenda o
vrednostih ocen in vse spletne aplikacije so ovrednotene s temi ocenami glede na podatke, ki
bi jih želeli o spletnih obiskovalcih zajeti.Velja isti princip analitičnega pristopa kot pri
središčni preglednici, zato je po mojem mnenju odveč ponoviti podroben opis ocen s prejšnjih
strani, zato bom navedel zgolj končne ocene.
Log File (dnevnik spletnega strežnika) – izpolnjuje pogoje glede datuma obiskane
strani, časom obiska, ID seje in strani sklica (referer), glede prepoznavanja identitete
spletnih obiskovalcev le delno preko IP naslovov izpolnjuje zahteve / pogoje, glede
vrste zahteve tudi delno, medtem ko pa glede ostalih želj / zahtev ne izpolnjuje pogoje
(stran / objekt, vrsta seje, storitev). Končna vrednost ocen (vertikalno gledano) je tako
+1.
Piškotki (cookies) – končna vrednost ocen je –7.
Brezplačna spletna orodja za analizo spletnega prometa (Web Analyzers) – vrednost
ocen je 0.
Komunikacijski spletni obrazci kot npr. diskusijski forumi, deloma notranji iskalniki,
spletne ankete itd. so dosegle skupno vrednost ocen +6.
[55]
Skupni izid obeh seštevkov je tako vrednost 0. Tudi tovrstni izidi kažejo na to, da bi bilo
dobro izvesti določene ukrepe.
Vodoravni vpogled:
Hitrost nalaganja strani – skupna ocena (vodoravno gledano) je +1, kar kaže na neki
povprečni izid.
Obseg posameznih strani v KB – skupna ocena (vodoravno gledano) je 0.
Število spletnih povezav – ocena je –1.
Nedelujoče spletne povezave – skupna ocena je –1
Neaktualne in neustrezne spletne povezave – ocena je –1.
UDK glavna stran - skupna ocena za glavno UDK stranje –3, kar kaže na nekoliko
podpovprečni izid.
UDK 0 - a za UDK 0 je (navpično gledano) –2.
UDK 1 – ocena je –2.
UDK 2 - je ocena –2.
UDK 3 – ocena je –3
UDK 5 - ocena je –3
UDK 6 – ocena je –3
UDK 7 – ocena je –2
UDK 8 –ocena je –3
[56]
UDK 9 – ocena je –3
Končna ocena (vodoravno) je –2 od 5, a končna ocena (navpično) je –26 od 50. Obe oceni
kažeta na podpovprečen izid, kar daje vedeti, da bi bilo potrebno izvesti popravke glede
trenutnega stanja UDK leksikona, kar bi vključilo naslednje:
Tudi na podlagi teh izidov je možno sklepati, da bi bilo smotrno izvesti določene popravke na
spletnih straneh UDK leksikona. Skupni seštevek obeh pogledov je bil dvakrat +30 od 50.
[58]
da je ukrep nujno potreben. V ožji izbor ocenjevanja sem uvrstil naslednje negativne lastnosti:
napake, nedostopnost, neaktualnost vsebine in nakopičenost vsebine (podatkov). V ožji izbor
morebitnih ukrepov sem uvrstil naslednje: posodabljanje vsebine, presnemavanje vsebine
(tuje spletne strani, ki so zanimive in pogosto ogledane shranimo na lasten strežnik ali pa vsaj
na CD-ROM-e ipd., ob tem je potrebno seveda navesti naslove teh virov), odprava virusov
(nekatere spletne strani so sicer zanimive, vendar pa vsebujejo virus, zato jih je potrebno ali
odstraniti ali pa sanirati), odprava letečih oken ali POP – UP –ov (leteča okna so z vidika
spletnega obiskovalca prav neprijetna izkušnja, še zlasti takrat, če jih je mnogo, zato je
potrebno takšno stanje popraviti), merila za merjenje kakovosti spletnih povezav (kot primer
bi podal spletne strani z dolgimi spletnimi naslovi, ki mnogokrat niso obstojne in izginejo
sorazmerno hitro s spleta ipd.), pogostejše meritve kakovosti tako podatkov kot tudi spletnih
strani in nenazadnje ukrep/-i glede oblikovne sprostitve vsebin spletnih strani UDK leksikona
(morda tudi drugih spletnih strani npr. da jih presnamemo na CD-ROM, bolj nazorno
uredimo podatke, nakar popravljeno stanje objavimo na spletu kot spletno povezavo znotraj
spletnih strani UDK leksikona ipd.).
ukrepi glede napak na in znotraj spletnih straneh UDK leksikona – ocena je bila + 3
ukrepi glede nedostopnosti do spletnih strani – ocena je + 2
ukrepi glede neaktualnosti vsebin – ocena je – 1
ukrepi glede nakopičenosti / nepreglednosti podatkov na in znotraj spletnih strani
UDK leksikona – ocena je 2
Skupna ocena vodoravnega pogleda je bila 4 od 32 možne in ista je bila skupna ocena za
navpični pogled, t.j. 4 od 32 možne.
Četrta dimenzijska preglednica se razlikuje od ostalih treh v precejšnji meri, saj so sicer v
uporabi iste vrednosti za ocenjevanje, vendar se naziv uteži razlikuje. Četrta dimenzijska
preglednica se lahko v naslednji zvezdnati shemi za ocenjevanje kakovosti podatkov prelevi v
središčno oziroma izhodiščno preglednico, vendar tega v tej seminarski nalogi, kot že
omenjeno ne bom prikazal. Ta četrta dimenzijska preglednica zato pomeni nekakšen mehak
prehod med procesom 2 in procesom 3 (gl. str. 48 slikovni prikaz 15). Na podlagi vseh ocen je
možno izpeljati naslednje sklepe:
[59]
2. Več kot smiselna bi bila tudi izvedba popravkov glede podatkovnih virov s spletnih
strani UDK leksikona.
3. Logična posledica drugega sklepa je v tem, da se natančno opredelijo področja
popravkov.
4. Potrebno je narediti konkretni načrt za ustrezne ukrepe v zvezi s spletnimi stranmi
UDK leksikona (velja tudi za posamezne spletne povezave in besedila znotraj teh
spletnih strani).
Prav v tem vpogledu bi ocenil, da bi bilo smotrno najprej urediti zadeve v zvezi z nabavo in
vgradnjo programskega orodja IBM Tivoli Website Analyzer ter hkrati izboljšati obstoječo
stanje na spletnih straneh UDK leksikona. Z ustrezno organizacijo različnih kadrov v
projektni skupini, bi to bilo možno urediti v dobrem koledarskem mesecu. Ocena kakovosti
podatkovnih virov, tako “clickstreama” kot tudi s spletnih straneh UDK leksikona je bila v
tem primeru več kot nujna.
Čisto na koncu bi se še dotaknil dveh tem v zvezi z oceno kakovosti podatkov. Prva tema je v
tem, da bi se dalo razpravljati v zvezi z zlomljenimi ali blank povezavami. Zlomljene
povezave so sicer lahko za uporabnika oziroma spletnega obiskovalca koristna in prijazna, saj
si lahko ogleduje in primerja med sabo različne spletne vsebine, vendar so zlomljene
povezave z vidika merjenja začetkov in koncev sej precej nevšečna. Kot zgled bi podal
spletnega obiskovalca, ki si odpre 10 različnih spletnih oken. Po dveh urah ogledovanja
različnih spletnih strani, si je spletni obiskovalec podrobneje ogledal deseto spletno stran t.j.
30 minut, medtem ko si je za druge spletne strani efektivno gledano vzel manj časa t.j. npr. po
pet do deset minut, vendar pa teh devet oken ni zaprl. Ko bo spletni obiskovalec zaključil s
spletno sejo, bomo dobili kot izid, da se je le-ta zadržal na prvih devetih spletnih straneh dalj
časa kot pa na zadnji, kateri pa je dejansko posvetil največ časa. Zdaj z vidika spremljanja
področnih zanimanj spletnih obiskovalcev, je tovrsten pojav precej nevšečen, saj v nekaterih
primerih ne moremo točno dognati, katere vsebine so pri spletnih obiskovalcih najbolj
priljubljene. 98 % vseh spletnih povezav v UDK leksikonu pa so v obliki zlomljenih (angl.:
blank) povezav. Odločitev za navadne ali zlomljene spletne povezave bi v tem primeru bilo
smotrno prepustititi spletnim obiskovalcem, kar bi bilo možno ugotoviti z ustrezno
zastavljeno spletno anketo in s pogovori. Ob pogovorih z nekaterimi spletnimi obiskovalci
UDK leksikona sem spoznaval, da si pravzaprav želijo zlomljenih spletnih povezav.
[60]
o že opravljenih nalogah. S tem hitrim pregledom za nazaj bo možno spoznati, katere zadeve
so že urejene in katere še niso.
S preglednice 10 je
razvidno, da so vse naloge v zvezi z načrtom projekta CPS uresničene, razen dimenzijsko
modeliranje podatkov.
[61]
Dimenzijsko modeliranje
podatkov
[62]
4 Dimenzijski podatkovni model
predlaganega CPS
Dimenzijsko modeliranje je tehnika logičnega načrta, ki se uporablja za (C)PS. Modeliranje
podatkov bom uresničil s pomočjo naslednjih korakov:
Preden bom prikazal globalne podatkovne modele, bom najprej načel temo, katero sem že
opisal v uvodnem poglavju (gl. str. 4 – 5). To je želja po ugotavljanju verižnih spletnih
dejavnosti obiskovalcev na UDK leksikonu. Kako področno široko ali ožje dojemajo le-ti
svet? Kakšen je dejavnik interdisciplinarnosti in specializiranosti spletnih obiskovalcev? S
pomočjo UML diagrama aktivnosti bom poskušal na naslednji strani prikazati dolgo
“clickstream” verigo interdisciplinarnega spletnega obiskovalca na UDK leksikonu, ki
pomeni po moji oceni skrajni primer. Ta spletni obiskovalec si dokaj natančno ogleda glavno
stran in vse področne UDK strani. Na glavni spletni strani tako uporablja notranji iskalnik, s
tem izvede tudi poizvedbo, pošlje prispevek v UDK diskusijski forum in si nato ogleda
spletne dokumente po vseh UDK področjih. Pojavi se sedaj ključno vprašanje v zvezi s
prepoznavnostjo spletnega obiskovalca. Po mojem prepričanju je tovrsten spletni obiskovalec
zelo prepoznaven, vendar pa je veliko vprašanje v tem, če je tudi dober potrošnik?
[63]
4.1.1 Slikovni prikaz 18: UML diagram aktivnosti (verižni “clickstream”)
[64]
Slikovni prikaz 18 ponazarja celovit sklop dejavnosti spletnega obiskovalca na UDK
leksikonu. Stopnje (S) aktivnosti so naslednje:
S1: Spletni obiskovalec uporablja notranji iskalnik in naredi poizvedbo. Kakšno sekundo
kasneje z miško pritisne na spletno povezavo UDK 0. Odpre se novo področje UDK 0 (kar je
možno zaradi zlomljenih / blank spletnih povezav). Okno področja UDK 0 zmanjša, tako da
dobi spet na vpogled glavno stran. Tudi proces iskanja je že zaključen, kar spozna, ko poveča
okno, kjer zagleda zadetke, ki so posledica poizvedbe. Po ogledu zadetkov ugotovi, da ne
ustrezajo njegovi informacijski potrebi, zato se odloči, da to okno zapre in s tem zaključi
dejavnost. Z miško nato pritisne na spletno povezavo za diskusijski forum, kamor uvrsti svojo
pripombo, nakar to okno zapre.
S3 – S9 …
Ni zdaj namen tega pisanja opisati vse postopke in vsa dejanja, ki jih je ta spletni obiskovalec
izvedel, ampak sta glavna namena tega prikaza bila v tem, da ponovno izpostavim ključno
zanimanje prihodnjega modeliranja in da zaslutimo koristnost tovrstnih razmišljanj tudi za
poslovno sfero. V ta namen lahko ponovno povzamem vprašanje: “Ali so tovrstni obiskovalci
tudi dobri kupci ali potrošniki?” Po vsej verjetnosti niso! Iz tega vprašanja lahko razvijemo še
druga, ki so tudi pomembna za globalno modeliranje podatkov kot npr. “Ali je tovrstnih
spletnih obiskovalcev veliko?” Po vsej verjetnosti jih ni prav mnogo. “Ali je ta vedenjski
vzorec pri tem spletnem obiskovalcu zelo pogost”? V primeru, da ta vedenjski vzorec ni zelo
pogost, bi lahko s tega sklepali, da je imel ta spletni obiskovalec ta dan mnogo časa. Koliko je
ozko specializiranih spletnih obiskovalcev in s katerega področja jih je največ?
Preden bom izdelal model vodnega toka ali slapa (nem.: Wasserfallmodell) si bom najprej
zastavil naslednja vprašanja:
[65]
4.1.2 Slikovni prikaz 19: Konceptualni model vodnega toka (slapa) za dimenzije
Slika 19 prikazuje globalni model vodnega toka, s katerim sem si ponazoril lasten miselni tok
kot pripomoček pri izboru dimenzij in za izdelavo Bus (angl.:BUS – izraz je prevzet s
področja elektrotehnike) arhitekturne matrike za CPS. Na vrhu slikovnega prikaza lahko
vidimo, da sem izhajal z miselnega izhodišča “področno zanimanje”, s katerega sem izpeljal
možne dimenzije za dimenzijsko modeliranje CPS. Te možne dimenzije bi lahko bile:
[66]
Če izhajam s predpostavke, da brez spletnih obiskovalcev s pomočjo pritiskov miške na
spletne povezave, ni možno spremljati njihove spletne dejavnosti na UDK leksikonu, bi si
dovolil izpeljati logičen sklep, da lahko tovrstne akcije štejemo kot izhodišče za sleherno
spremljanje nasploh. Tovrstna dejstva bom poimenoval kot “Klik” dejstva. S tega temeljnega
dejstva je možno izpeljati še dejstvo seje, kajti s pomočjo sej ugotavljamo IP spletnega
obiskovalca, njegov vstop v spletni sistem, začetek in konec njegovih dejavnosti, datum in
čas. Prav to spoznanje je pomembno za osrednje zanimanje t.j. področna zanimanja spletnih
obiskovalcev. Zdaj lahko na tej podlagi izpeljemo še nekakšen privesek dejstva seje t.j.
podseja, ki še natančneje poda obiskovalčeve aktivnosti, t.j. da beležimo sleherni pritisk z
miško na spletne povezave, ki se nahajajo znotraj določene spletne strani. To je pa že precej
blizu tistemu, česar si želimo in kar sem z UML diagramom aktivnosti poskušal prikazati.
Torej v tej predstopnji dimenzijskega modeliranja sem določil šest dimenzij in dve dejstvi, kar
bi pomenilo, da bo glavna zvezdna shema sestavljena iz ene tabele dejstev in šestih
dimenzijskih tabel. Druga tabela dejstev “seja” bo vsebovala tri dimenzijske tabele.
4.1.3 Slikovni prikaz 20: Konceptualni model vodnega toka (slapa) za dejstva
Slika 20 prikazuje z lastnega miselnega izhodišča “Področna zanimanja” dve izpeljani dejstvi.
To sta “Klik dejstvo” in “Seja dejstvo” (kot priloga h klik dejstvu), ki se še nadalje členi na
dejstvo “Podseja”.
[67]
4.2 Preglednica 11: CPS Bus arhitekturna matrika
Dimenzije, ki sem jih izbral so naslednje: datum, čas, spletni obiskovalec, informacijska
storitev, stran (objekt), seja (podseja).
1.) Dimenzija datum – dimenziji datum in čas morata biti obvezno ločeni!
KLJUČ: Datum_ključ
[68]
KLJUČ: Čas_ključ
Ključ: SpletniObiskovalec_ključ
Ključ: InformacijskaStoritev_ključ
5.) Dimenzija stran (objekt) – je koristna za ugotavljanje, na kateri strani se nahaja spletni
obiskovalec.
Ključ: Stran_ključ
Ključ: Seja_ključ
a.) Dopolnilna dimenzija podseja – priloga k seji (želim zajeti vse možne klike z miško znotraj
sleherne seje)
Ključ: Podseja_ključ
1.) Glavno dejstvo je “Klik” dejstvo (modeliramo posamične klike), ki mu je dodano “Seja”
dejstvo (modeliramo celotno zbirko klikov”) kot priloga in “Podseja” dejstvo kot priloga seji.
[69]
Šest dimenzij (vse sem že malo poprej navedel)
a.) Seja
a1.) Podseja
Atributi: podseja_sekunde
Na podlagi izbora dimenzij in opredelitve njihovih prvin, lahko zdaj v nadaljevanju izdelam
dimenzijske tabele, ki bodo pozneje služile kot dober pripomoček za izdelavo zvezdnih shem.
V predhodnem podpoglavju sem vse dimenzije zgolj besedno opisal, tako da bo sedanji
pristop slikovitejši, kajti vse do doslej opisanih ključev in atributov bom umestil v posebne
dimenzijske preglednice ali tabele. Držal se bom pri tem istega vrstnega reda kot pri
besednem opisu vseh šestih dimenzij. Najprej bom prikazal dimenzijsko preglednico datum,
nato čas, spletni obiskovalec, informacijska storitev (v dimenzijski preglednici bom to
dimenzijo imenoval kot storitev), stran (objekt) in nazadnje še seja (podseja). Vse te dimenzije
sestavljajo temeljno dejstvo, ki je “Klik” dejstvo. V nadaljevanju bom še prikazal dimenzijske
tabele za suplementno dejstvo “Seja” (in “Podseja”).
[70]
4.6.1 Slikovni prikaz 21: Šest dimenzijskih tabel in dopolnilna
Velja podoben princip kot pri podpoglavju točka 4.6. Na podlagi izbora dejstev in opredelitve
njihovih prvin, lahko zdaj v nadaljevanju izdelam tabele dejstev, ki bodo prav tako pozneje
služile kot dober pripomoček za izdelavo zvezdnih shem. Temeljna tabela dejstev bo “Klik”
dejstvo, suplementna tabela dejstev bo “Seja” dejstvo in znotraj nje še tabela dejstvo
“Podseja”. V poznejšem podpoglavju bom podrobneje opisal, zakaj sem se odločil za ta
pristop. Za zdaj naj navedem zgolj okvirno obrazložitev, da ne želim zgolj zajeti posamične
“klike”, ampak tudi skupine tovrstnih akcij in znotraj teh želim natančno zajeti kot že
omenjeno, vse možne klike znotraj seje. Prav to željo oziroma zahtevo pa modela “Klik” in
“Seja” dejstvo ne moreta zadovoljiti ter je zato potrebno uvesti model “Podseja” dejstev.
[71]
Na sliki 22 vidimo tri tabele dejstev; temeljna je tabela “Klik” dejstvo, suplementna je tabela
“Seja” dejstvo in znotraj nje še tabela dejstev “Podseja”, ki se ob posamičnih “klikih” in
enoštevilčnih sejah ne uporablja, kar sem na sliki prikazal s črtkano puščico. Ta tabela dejstev
pride do izraza, če znotraj ene seje prihaja vsaj še do dodatne seje itd. Naj to ponazorim z
naslednjim slikovnim prikazom.
Slika 23 prikazuje takšno sejo s štirimi “kliki”, ki se potem razdeli na šest podsej. Povrhu tega
slika 23 pokaže tudi dolžino oziroma trajanje (v sekundah) posameznih podsej, česar seveda
seja ne zmore prikazati.
Zvezdne sheme bom izdelal na podlagi izdelanih dimenzijskih tabel in na podlagi izdelanih
tabel dejstev.
[72]
4.8.1 Slikovni prikaz 24: Zvezdna shema “Klik” dejstvo
Slika 24 prikazuje temeljno zvezdno shemo “Klik” dejstvo s povezavami do vseh šestih
dimenzij. V sredini se nahaja tabela dejstev, ki povezuje šest dimenzijskih tabel.
[73]
Na sliki 25 zagledamo zvezdno shemo “Seja” dejstvo. Tabela dejstev v sredini “Seja” dejstvo
se povezuje s tremi dimenzijskimi tabelami (datum, čas in spletni obiskovalec).
Slika 26 prikazuje zvezdno shemo “Podseja” dejstvo. Preglednica v sredini “Podseja” dejstvo
se povezuje s štirimi dimenzijskimi tabelami, pri čemer velja poudariti, da gre pri dimenzijski
tabeli “URLZaporedje” za izpeljano dimenzijo, ki je nastala na podlagi predhodnih
shem111(oz. konkretneje: je posredno izpeljana s tabele “Klik” dejstev in s tabele “Seja”
dejstev.)
Na naslednji strani bom še slikovno prikazal združene zvezdne sheme, ki bi veljale še zlasti
tedaj, kadar bi spletni obiskovalec izvedel številne in zelo podrobne aktivnosti na spletnih
straneh UDK leksikona (npr. gl. na strani 66 sliko 18 UML diagram aktivnosti). Po tem
celovitem slikovnem prikazu, bom še podal računsko oceno potrebne velikosti zamišljenega
CPS-a za sleherno zvezdno shemo posebej in celokupno. Največji problem pri tem modelu
“Podseja” dejstvo je prav v tem, da se še dodatno povečuje pritok podatkov v CPS, za kar pa
do sedaj še niso iznašli učinkovitega “zdravila”. Prav ta problem pa presega, kljub njegovi
izredni pomembnosti, osrednje zanimanje te seminarske naloge. Reševanje tovrstnega
problema bi si pa lahko predstavljal kot izjemen znanstveni vložek, ki bi po moji oceni
zahteval tako različne preizkuse kot tudi natančne meritve.
[74]
4.8.4 Slikovni prikaz 27: Celotna zvezdna shema kot predlog za CPS
[75]
Na sliki 27 vidimo celokupno zvezdno shemo, ki jo predlagam za CPS. V tem modelu so
združene vse prej obravnavane zvezdne sheme in s tem vsa dejstva ter dimenzije. Temeljna
zvezdna shema “Klik” dejstvo je ogrodje tega modela in obravnava posamične klike na
spletne povezave, ki jih izvedejo spletni obiskovalci po bolj ali manj različnih področjih
človekovega znanja (odvisno od spletnega obiskovalca), t.j. na spletnem UDK leksikonu.
Druga zvezdna shema “Seja” dejstvo nam daje vpogled glede začetka in konca aktivnosti, ki
jih izvedejo spletni obiskovalci. Zabeležijo se skupinski kliki na posamezne spletne povezave
znotraj različnih področij. Nenazadnje tretja zvezdna shema “Podseja” dejstvo nam daje
podrobnejši vpogled v posamezne seje spletnih obiskovalcev, kar vključuje tudi trajanje
posameznih podsej znotraj vseh sej.
Skupaj (Na)= 7
Izračun za en dan:
Za tri leta:
Skupaj (Na)= 3
[76]
Število bytov, ki ga zaseda en zadetek (“en klik” - Nk) = 200 B
Izračun za en dan:
Za tri leta:
Skupaj (Na)= 5
Izračun za en dan:
Za tri leta:
4.) Celokupno
S preglednice 12 vidimo, da so vse naloge glede zastavljenega načrta projekta CPS (v okviru
[77]
seminarske naloge) uresničene, kar je prikazano s črnimi krogci. To vključuje uvod, pripravo
projekta, vzpostavitev projekta, načrtovanje projekta / vodenje, opredelitev zahtev
(organizacijske zahteve, poslovne zahteve, določitev virov podatkov in ocena kakovosti
podatkov), pregled za nazaj in dimenzijsko modeliranje podatkov.
5 Zaključek
Izgradnja (C)PS pomeni zelo draga naložba, ki lahko stane od 100000 do 10000000 Eurov,
kar je seveda odvisno od velikosti zamišljenega (C)PS. V tej seminarski nalogi sem razmišljal
o CPS, s katerim bi bilo možno shranjevati veliko količino podatkov v zvezi s sledovi, ki so
jih za sabo pustili spletni obiskovalci na UDK digitalni knjižnici oziroma UDK leksikonu. Ob
tem se seveda takoj porodi vprašanje, če bi se tovrstna investicija obrestovala tudi po denarni
strani, kajti pravega 100 odstotnega jamstva za popolni denarni uspeh pri PS ne obstaja in to
niti za PS, katerih tematska zasnova gre v smeri dobičkonosnega poslovanja. Kljub poprej
zapisanemu, bi si dovolil oceno, da bi lahko tudi tako tematsko zastavljeno CPS, ki je bilo
predmet te seminarske naloge, v obdobju npr. dveh let lahko pripomoglo k družbeni blaginji
tudi v obliki denarne vrednosti. Ta ocena bi še zlasti veljala tedaj, če je v družbi prisoten nek
ugoden poslovni in organizacijski kolektivni duh, kajti če je ta ugoden, lahko na trgu uspevajo
celo takšni izdelki (ali zamisli), ki po izrazitih poslovnih pogledih niso obetali veliko
donosnost.
Zamišljeno CPS, ki je bilo predmet obravnave te seminarske naloge, bi lahko delovalo pod
okriljem standardiziranih / urejenih slovenskih UDK digitalnih knjižnic (teh zaenkrat ni prav
mnogo), ki bi bile financirane s strani ministrstev, IZUM-a / COBISS, podjetij, tujih
vlagateljev, TELEKOM-a itd. Te sodobne knjižnice se ne bi toliko ukvarjale s sicer
značilnimi knjižničnimi opravili, ampak bi lahko nudile tudi storitve v smeri poslovnih
odločitev, analiz, iskanja ustreznih informacij glede npr. interesnih področij spletnih
obiskovalcev za gradbene materiale ipd. Ustrezne in pravočasne informacije, ki jih prejme
ustrezni naslovnik, pa že pomenijo blaginjo, ki lahko tudi pozitivno vplivajo na poslovanje.
Več kot je takšnih pozitivnih in uspešnih informacijskih - poslovnih dogodkov, tembolj se
lahko tudi krepi globalna kakovost in učinkovitost poslovanja v Sloveniji, kajti poslovanje ni
zgolj v domeni dveh ali treh posameznikov, ampak je to krog, v katerem tiči ves civilizirani
svet.
[78]
6 Viri in uporabljena programska orodja
1. Kimball, R. … [et al.].(1998). The Data warehouse lifecycle toolkit : expert
methods for designing, developing and deploying data warehouses. New
York: John Wiley & Sons, 771 str.
2. Kimball, R. & Ross, M.(2002). 2nd. ed. The data warehouse toolkit : the
complete guide to dimensional modeling. New York : John Wiley & Sons,
436 str.
3. English, L.P.(1999). Improving business information quality : methods for
reducing costs and increasing profits. New York [etc.]: John Wiley &Sons,
518 str.
4. Silič, M., Colnar, M., Krisper, M. [etal …].(2000) EMRIS - Enotna
metodologija razvoja informacijskih sistemov. #Zv. #2, Objektni razvoj.
Ljubljana : Vlada Republike Slovenije, Center za informatiko, 412 str.
2.) ecom.fov.uni-
mb.si/seminarji.nsf/0/93cb1c225297db73c1256aef002b3cc4/$FILE/Podatkovno%
20skladisce%20in%20E-poslovanje.ppt
2. http://dbtlab.uni-mb.si/pb2/casestudy.pdf
3. http://www.drustvo-
informatika.si/dogodki/arhiv/dsi2001/sekcija_a/golob_welzer.doc.
4. http://www.merkur.si/slo/e-
valilnica/pic/ppt/2003/Analiza_obiska_v_spletni_trgovini.pdf.
5.) http://www.clickstreamconsulting.com
6.) http://www.nyoug.org/clickstream01.pdf
7.)http://searchdatabase.techtarget.com/bestWebLinks/0,289521,sid13_tax288296,
00.html
8.) http://www.rkimball.com/html/articlesArchitecture/articlesIndustryApp.html
[79]
9.) http://www.weg.ee.usyd.edu.au/projects/ni.ca/movie7.htm
10.) http://www.syncsort.com/pdf/sswp5.pdf
11.) http://www.cis.drexel.edu/faculty/thu/My%20Publication/Journal-
papers/JofIS/jis_tonynick.pdf
12.) http://www.teradatalibrary.com/pdf/eb1196.pdf
13.) http://www.nasi.com/pdfs/tivoliwebsiteanalyzer.pdf
14.)http://www.cis.drexel.edu/faculty/song/dolap00/paper/Andersen_107.pdf
15.) http://media.wiley.com/product_data/excerpt/09/04713768/0471376809.pdf
16.) http://www.chrispeiris.com/articles/data_WebHousing.html
17.)http://verdi.unisg.ch/org/iwi/iwi_pub.nsf/wwwPublRecentEng/173010B2C
D2D63E9C1256D090050B55F/$file/dw2002.pdf
18.) http://www.archive.org
19.) http://greg.abstrakt.ch/docs/data_webhouse_paper.pdf
20.)http://verdi.unisg.ch/org/iwi/iwi_pub.nsf/wwwPublRecentEng/A63E2D038
6E8370EC1256D4D0053E671/$file/CS_Datenqualitaet.pdf
21.) http://www.ec3.at/dox/ergebinisbericht2002.PDF
22.) http://www.gerstbach.at/2002/DataQualityManagement/dqm.pdf
23.) http://docserver.bis.uni-
oldenburg.de/publikationen/dissertation/2002/hindat02/inhalt.html
24.) http://www.decus.de/slides/sy2000/Vortraege_2903/2L04.PDF
25.)http://www.ifi.unizh.ch/ifiadmin/staff/rofrei/DA/DA_Arbeiten_2000/Scherz_R
enate.PDF
26.) http://www.wi.uni-muenster.de/inst/arbber/ab51.pdf
27.) http://wwwiti.cs.uni-magdeburg.de/~sattler/hal/dw02.pdf
28.) http://www4.in.tum.de/~schaetz/Projektmanagement03/4-3-
Qualitaetsmanagement.pdf
[80]
29.) http://www.imise.uni-leipzig.de/lehre/medinf/KIS/KIS-2S/KIS-II-
Seminar_WS01_02/KIS-II-Seminar_WS01_02_V7/v7_folien.pdf
30.) http://www.beepworld.de/members29/udkleksikon
31.) http://www.ub.uni-bielefeld.de/biblio/search/smkurs.htm
32.) http://www.clearinghouse.net/
[81]
6.4 Slovar kratic in izrazov
Slovar kratic in izrazov je izdelek, ki se izdeluje sproti ter na dolgi rok. Po EMRIS-u II. del
(strateško načrtovanje) je to točka 8.
Akter je oseba / uporabnik, ki je nosilec ene ali več vlog v okviru organizacijskega sistema
(delovne organizacije) in s tem tudi informacijskega sistema (IS)
Aplikacija je programska rešitev, ki kot sestavni del IS podpira neko logično celoto delovanja
organizacijskega sistema
Bit per second (bps ali b/s) so biti na sekundo. Merilo za modemovo hitrost prenosa
podatkov.
Cilj je zapis prihodnjih izidov ali stanja, ki ga želi organizacija doseči. Mora biti natančno
opredeljen tako po času kot tudi po obsegu, kajti cilj mora biti merljiv
Clickstream podatkovno skladišče (CPS) – ali spletno podatkovno skladišče (angl. data
webhouse) – To je podatkovno skladišče, ki se uporablja za črpanje podatkov z medmrežja.
Sicer je identično klasičnemu podatkovnemu skladišču (PS), ki je enotna zbirka podatkov, ki
nastanejo kot izid delovanja posameznih funkcij. Zajema najpomembnejše podatkovne
entitete celotnega organizacijskega sistema (ali delovne organizacije – organizacijski vidik) in
predstavlja osnovo sistemov za podporo odločanju
Član projektne skupine je tisti, ki ima določene naloge in zadolžitve v zvezi s projektom, na
katerem sodeluje. Ti člani so lahko notranji ali pa zunanji
Datoteka z dnevnikom (angl. log file) ali dnevnik spletnega strežnika je datoteka, v katero
ponavadi različni programi zapisujejo dogodke, stanja itd. (pogosto vključno s časom in
opisom dogodka, stanja itd.)
E-poslovanje oziroma “elektronsko poslovanje”, izpeljano iz besed kot sta “e-pošta” in “e-
trgovanje” pomeni za združbo poslovanje ob uporabi spleta ter drugih informacijskih
tehnologij (IT)
[82]
GIF (Graphics Interchange Format) je oblika zapisa za izmenjavo grafičnih podatkov. GIF
je standardna oblika zapisa za datoteke s slikami v WWW. Oblika zapisa GIF je priljubljena
zato, ker s stiskanjem zmanjša velikost datotek.
IP (Internet Protocol) je tisti, ki opredeli enote informacij za izmenjavo med sistemi, kar
zagotavlja storitve osnovne paketne dostave
IP naslov (IP address) pomeni 32-bitni naslov Internetovega protokola, dodeljen gostitelju.
IP naslov ima del, ki se nanaša na gostitelja, in del, ki se nanaša na omrežje
[83]
MPEG (Moving Pictures Expert Group) je standardni način za stiskanje polno gibljivega
videa
Prenos navzdol ali nalaganje na disk (download) pomeni prenos programov ali podatkov iz
računalnika v priključeno napravo, najpogosteje iz strežnika v osebni računalnik
Presojevalci ali ocenjevalci so lahko osebe z ustreznimi izkušnjami na strani naročnika ali pa
tudi osebe neodvisnih zunanjih svetovalnih ustanovah z izkušnjami na področjih IT in
strateškega načrtovanja
Projektni svet je telo, v katerem so predstojnik projekta in ostali člani (npr. tehnični
svetovalec, predstavnik uporabnikov)
Univerzalni lokator virov (URL - Uniform Resource Locator) je oblika naslova mesta, ki
razkriva ime strežnika, v katerem so shranjene datoteke mesta, pot do datoteke in ime
datoteke
Uporabnik rezultata projekta je tista oseba, na katero bodo izdelki projekta najbolj vplivali.
Prav zaradi tega je uporabnik projekta ključnega pomena pri določanju izdelkov projekta
Vodja projekta je oseba, ki dobro pozna tako delovanje delovne organizacije kot tudi njegov
IS in njegove ključne uporabnike
[84]
1 Prototip
UDK leksikona sem izdelal v letih 2002 – 2004, po obsegu vsebuje
vključno z različnimi lastnimi prispevki približno 1000 strani formata A4 in je
dostopen na naslednjem spletnem naslovu:
http://www.beepworld.de/members29/udkleksikon .
2 Slikovniprikaz 2 sem za svoje potrebe dopolnil in sestavljal na podlagi spletnega
vira: ecom.fov.uni-
mb.si/seminarji.nsf/0/93cb1c225297db73c1256aef002b3cc4/$FILE/Podatkovno%2
0skladisce%20in%20E-poslovanje.ppt (2004-04-27)
3
Pri izdelavi tega slikovnega prikaza sem se naslonil na naslednji vir: Kimball, R.
[et … al.].(1998). The data warehouse lifecycle toolkit …, na strani 33.
4
Kot že omenjeno sem izdelal prototip UDK Leksikona s pomočjo nekoliko
brezplačne spletne storitve Beepworld in izvajam tudi že dve leti raziskave v zvezi
s spremljanjem zanimanj spletnih obiskovalcev prav s pomočjo teh nekoliko
brezplačnih spletnih storitev.
5
Pri vzpostavitvi projekta in tudi za ostale stopnje sem se vzgledoval - vira: Silič,
M., Colnar, M., Krisper, M. [etal …].(2000) EMRIS na str. 298 in
http://searchdatabase.techtarget.com (2004-04-27)
6 Kimball, R.(1998). The data warehouse lifecycle …, slikovni prikaz na strani 96.
[85]