You are on page 1of 148

SVEUILITE U ZAGREBU

EKONOMSKI FAKULTET U ZAGREBU

LEO MRI

PRIMJENA METODA RUDARENJA PODATAKA


U TRGOVINI TEKSTILNIM I SRODNIM
PROIZVODIMA

MAGISTARSKI RAD

ZAGREB, 2004.
PODACI I INFORMACIJE O MAGISTRANDU
Prezime i ime:
Mri Leo

Datum i mjesto roenja:


27. 06. 1973., Zagreb, Medveak

Naziv zavrenog fakulteta i godina diplomiranja:


Ekonomski fakultet Zagreb, smjer vanjska trgovina, 1997.

PODACI O MAGISTARSKOM RADU

1. Vrsta studija: znanstveni

2. Naziv studija: Poslijediplomski studij "Informatiki management"

3. Naslov magistarskog rada: Primjena metoda rudarenja podataka u trgovini


tekstilnim i srodnim proizvodima

4. UDK:

5. Fakultet na kojem je rad obranjen: Ekonomski fakultet Zagreb

POVJERENSTVA, OCJENA I OBRANA RADA


1. Povjerenstvo za ocjenu podobnosti teme:
1. dr. eljko Panian, predsjednik Povjerenstva
2. dr. Vesna Bri Stipevi, lan Povjerenstva
3. dr. Ivan Strugar, lan Povjerenstva

2. Datum prihvaanja teme: 30. 11. 2004.

3. Mentor: dr. eljko Panian

4. Povjerenstvo za ocjenu rada


1. dr. Vesna Bri Stipevi, predsjednik Povjerenstva
2. dr. eljko Panian, lan Povjerenstva
3. dr. Ivan Strugar, lan Povjerenstva

5. Povjerenstvo za obranu rada:


1. dr. Vesna Bri Stipevi, predsjednik Povjerenstva
2. dr. eljko Panian, lan Povjerenstva
3. dr. Ivan Strugar, lan Povjerenstva

6. Datum obrane rada: 10. 02. 2005.


Sveuilite u Zagrebu
Ekonomski fakultet u Zagrebu

Poslijediplomski studij
"Informatiki management"

MAGISTARSKI RAD

PRIMJENA METODA RUDARENJA PODATAKA


U TRGOVINI TEKSTILNIM I SRODNIM PROIZVODIMA

Mentor: Izradio:
prof. dr. eljko Panian Leo Mri, dipl. oec.

Zagreb
studeni 2004.
SADRAJ

1. UVOD 1
1.1. Saetak, cilj rada i ciljevi istraivanja 1

1.2. Hipoteze i obrazloenje hipoteza 2

1.3. Metode rada 3

1.4. Oekivan znanstveni doprinos 3

2. OPENITO O TRGOVINI TEKSTILNIM PROIZVODIMA 4


2.1. Razvoj trita 4

2.2. Trendovi u veleprodaji tekstilnih proizvoda 6

2.3. Trendovi u maloprodaji tekstilnih proizvoda 9

2.4. Utjecaj razvoja informacijske tehnologije u trgovini tekstilnim i srodnim proizvodima 12

3. POSLOVNA INTELIGENCIJA 17
3.1. Pojam poslovne inteligencije 17

3.2. Evolucija poslovnih informacijskih sustava 20

3.3. Poslovne informacije 22


3.3.1. Shannonov kvantitativni pristup vrednovanju informacija 25
3.3.2. Hammingov vremenski pristup vrednovanju informacija 26
3.3.3. Liautaudov poslovno pragmatiki pristup vrednovanju informacija 28

3.4. Primjene poslovne inteligencije 31

3.5. Skladite podataka 33


3.5.1. Pojam skladita podataka 33
3.5.2. Skladite podataka i poslovna inteligencija 36

3.6. Izvoenje znanja iz podataka 37

4. RUDARENJE PODATAKA 40
4.1. Pojam i znaenje 40

4.2. Metode i alati za rudarenje podataka 43


4.2.1. ienje i pretprocesiranje podataka 45
4.2.2. Analiza relevantnosti atributa 46
4.2.3. Problemi "kombinatorne eksplozije" 48
4.2.3. Vizualizacija podataka 48

4.3. Bayesove mree 49

I
4.3.1. Veze meu elementima 52
4.3.2. Primjena Bayesovih mrea 53

4.4. Stabla odluivanja 54


4.4.1. Pojam stabla odluivanja 55
4.4.2. Proces stvaranja stabla odluivanja 57
4.4.3. Odabir atributa kao najboljeg klasifikatora 58
4.4.5. Problemi u modeliranju podataka metodom stabla odluivanja 60
4.4.7. Prednosti i slabe strane metode stabla odluivanja 62

4.5. Klasteriranje 63
4.5.1. Algoritam K-srednjih vrijednosti 64
4.5.2. Posebni aspekti metoda segmentiranja podataka 65
4.5.3. Aspekti primjene tehnika segmentiranja 66

4.6. Asocijacijska pravila 66


4.6.1. Primjena asocijacijskih pravila 68

4.7. Analiza vremenskih serija 70


4.7.1. Problemi rudarenja vremenskih serija 72

4.8. REFII model 72


4.8.1. Prednosti REF II modela 78

5. PONAANJE POTROAA 81
5.1. Pojam ponaanja potroaa 81

5.2. Model ponaanja potroaa 83

5.3. Donoenje odluke o kupnji tekstilnih i srodnih proizvoda 84


5.3.1. Vrste odluka potroaa 86

5.4. imbenici koji utjeu na potroae u trgovini tekstilnim proizvodima 87


5.4.1. Ciklus prihvaanja mode 89

5.5. Ponaanje potroaa i rudarenje podataka 90

6. POTENCIJALNE PRIMJENE METODA RUDARENJA PODATAKA U


TRGOVINI TEKSTILNIM I SRODNIM PROIZVODIMA 93
6.1. Uloga primjene metoda rudarenja podataka u trgovini tekstilnim proizvodima 93

6.2. Tehnike pretprocesiranja podataka 95


6.2.1. Podaci koriteni u istraivanju 95
6.2.2. Plan istraivanja 97

6.3. Otkrivanje varijabli utjecaja 99


6.3.1. Prodaja enske trikotae 99
6.3.2. Prodaja muke trikotae 100
6.3.3. Prodaja enske konfekcije 100
6.3.4. Prodaja muke konfekcije 101
6.3.5. Prodaja obue 101
6.3.6. Prodaja enskog rublja 101

6.4. Otkrivanje odnosa meu varijablama 102

II
6.5. Otkrivanje pravilnosti u trendovima prodaje tekstilnih proizvoda pomou REFII modela 107
6.5.1. Otkrivanje sezonskih oscilacija u trgovini tekstilnim proizvodima 109
6.5.2. Direktno otkrivanje pravila iz vremenskih serija 111
6.5.3. Analiza osjetljivosti trendova pomou Bayesove mree 112

6.7. Potencijali poslovne primjene dobivenih rezultata analize 115

7. ZAKLJUAK 117

POPIS KORITENIH IZVORA 119

PUBLIKACIJE, LANCI, WEB IZVORI 120

POPIS ILUSTRACIJA I TABLICA 122

IVOTOPIS 124

SAETAK 125

SUMMARY 126

Prilog 1 Boxplot dijagrami kategorija 127

Prilog 2 Kategorizacija podataka 128

Prilog 3 - Analiza relevantnosti atributa 129

Prilog 4 Odnos: dan u mjesecu, godinje doba, prodaja 130

Prilog 5 Asocijacijska pravila 131

Prilog 6 Stabla odluivanja 133

Prilog 7 Podaci transformirani u REFII model 139

Prilog 8 Sezonske oscilacije na temelju otklona kuteva 140

Prilog 9 Bayesove mree 141

Prilog 10 Gradske etvrti Grada Zagreba 142

III
1. UVOD

1.1. Saetak, cilj rada i ciljevi istraivanja


Trendovi okrupnjavanja u gotovo svim trgovakim djelatnostima zahvaaju i trgovinu
tekstilnim proizvodima. Informacijski sustavi suoavaju se s izazovom eksplozije
informacija te potrebom da se iste pravovremeno uoblie, evidentiraju te procesiraju.
Priroda informacijskih sustava za praenje poslovanja umnogome je specifina kada se
radi o tekstilnim proizvodima. Razni modni trendovi, drutvene skupine, klimatski
uvjeti, drutveni status, medijske akcije pa sve do osnovne ivotne potrebe motivacije
su koje mogu u kratkom vremenu promijeniti trina uporita. Procesiranje podataka
podrazumijeva aktivno praenje raznih atributa proizvoda (veliine, boje, dezena,
sastava, uvjeta odravanja proizvoda...) kako bi se to kvalitetnije uoile eventualne
pravilnosti u prodaji te primjenom tih saznanja reagiralo na vrlo promjenjivo trite.

Prvi dio rada opisuje utjecaj globalizacije na trine aktivnosti kao to su stvaranje lanca
nabave i udruivanje tvrtki radi zajednikog nastupa na tritu. Prikazani su trendovi
koji se mogu razabrati kao posljedica sve otrijih trinih uvjeta. Kao projekcija buduih
kretanja naznaen je utjecaj Interneta te prikazane neke svjetske tvrtke koje su se ve
odluile na poslovanje tim putem i naina na koji su to uinile.

Tree poglavlje odreuje pojam poslovne inteligencije. Opisuje evoluciju poslovnih


informacijskih sustava i daje odgovore na neke specifinosti vezano uz njihovo
projektiranje u svrhu podrke poslovanju, posebno trgovini tekstilnih proizvoda.
Opisane su neke mogue primjene poslovne inteligencije u poduzeima te prikazana
naela skladita podataka i alata za analizu kao preduvjeta rudarenju podataka.
Formaliziranje dobivenog znanja odnosno interpretacija kao zavrna faza naglaava
odnos istraivaa, istraivanja i rezultata.

etvrto poglavlje objanjava pojam rudarenja podataka, navodi metode i alate rudarenja
podataka. Detaljno su opisane metode koje e biti primjenjene u estom poglavlju.

1
Posebno je naveden REFII model kao hibridni model koji osim analize moe sluiti kao
alat za pretprocesiranje.

Peto poglavlje opisuje ponaanje potroaa. Pojam i model ponaanja potroaa


proiruju se specifinostima karakteristinim za tekstilne proizvode koje se pak stavlja u
kontekst odluke o kupnji. Razliiti utjecaji koji utjeu na ponaanje potroaa prikazani
su u kontekstu vrijednosti pogodnih za istraivanje metodama rudarenja podataka.

esto poglavlje bavi se istraivanjem na podacima o prodaji. Na uzorku prodaje u


Gradu Zagrebu podaci su analizirani metodama rudarenja podataka te stavljeni u odnos
sa nekim vanjskim imbenicima u svrhu uoavanja zakonitosti u ponaanju potroaa,
zakonitosti meu kategorijama unutar podataka, analizi sezonskih oscilacija te
predvianju trendova u budunosti.

Ciljevi ovog istraivanja oituju se u predvianju prodaje primjenom metoda rudarenja


podataka na poslovnim podacima u kombinaciji sa vanjskim podacima te u analizi
varijabli u modelu s ciljem otkrivanja uzoraka, razumijevanja odnosa i otkrivanja
zakonitosti meu njima.

Skladite podataka o prodaji primjenom metoda rudarenja podataka postaje sredstvo


zadravanja postojeih kupaca i pridobivanje novih, uz projekciju nekih kretanja i
odnosa sa vanjskim faktorima koja se mogu iskoristiti kao dodatni pomak u odnosu na
konkurenciju.

1.2. Hipoteze i obrazloenje hipoteza


Kroz istraivanje dokazat e se, ili opovrgnuti, slijedee hipoteze:
ponaanje potroaa mogue je predvidjeti ponaanje potroaa u nekoj se
mjeri podudara sa odreenim uzorkom koji se pak ponavlja u vremenu;
ponaanje potroaa mogue je predvidjeti primjenom metoda rudarenja
podataka primjenom metoda rudarenja podataka mogue je uoiti obrasce
ponaanja i predvidjeti ih u buduem vremenu;

2
ponaanje potroaa tekstilnih i srodnih proizvoda mogue je predvidjeti
primjenom metoda rudarenja podataka tekstilni i srodni proizvodi sa svojim
posebnostima dodatno poveavaju sloenost istraivanja bilo na strani vanjskih
utjecaja bilo na strani potroaa;
kvaliteta informacijskog sustava za praenje poslovanja i pripadajueg skladita
podataka preduvjet su uspjenosti rudarenja podataka u trgovini tekstilnim i
srodnim proizvodima tek kvalitetno uobliene i evidentirane poslovne
informacije mogu biti temelj za analizu.

1.3. Metode rada


Podaci o prodaji prikupljeni su iz skladita podataka izgraenog u svrhu praenja
poslovanja i agregirani na razini kategorije interesne robne skupine. Ovaj je princip
koriten kako bi se ispitala primjenjivost predloenih metoda a istovremeno dovoljno
prikrili transakcijski podaci tvrtke vlasnika podataka. Od vanjskih podataka prikupljeni
su podaci o vremenskim prilikama (srednja dnevna temperatura, srednja dnevna
vrijednost tlaka zraka, dnevna vrijednost naoblake, dnevna koliina oborina, dnevna
koliina snijega, broj sunanih sati u danu) od Dravnog hidrometeorolokog zavoda1,
podaci statistikog odjela Gradskog zavoda za planiranje razvoja Grada i zatitu
okolia2 prema popisu stanovnitva iz 2001. godine a podijeljen na etvrti unutar Grada
Zagreba. Ostale metode koritene u ovom istraivanju su analiza, sinteza, klasifikacija,
komparacija te odabrane metode rudarenja podataka.

1.4. Oekivan znanstveni doprinos


Oekivani znanstveni doprinos magistarskog rada oitovat e se u primjenjivosti
odabranih metoda rudarenja podataka u otkrivanju zakonitosti u prodaji tekstilnih i
srodnih proizvoda. Rad e pokazati postoji li prepoznatljiv odnos izmeu promatranih
podataka. Primjena odabranih metoda dat e bolji uvid u potencijal njihove primjene na
ovom podruju te omoguiti jasniju spoznaju o vezi izmeu podruja koja su predmet
ovog rada.

1
DHMZ, Gri 3, http://meteo.hr
2
Gradski zavod za planiranje razvoja grada i zatitu okolia, Odjel za statistiku, Zagreb, Sv. irila i
Metoda 5

3
2. OPENITO O TRGOVINI TEKSTILNIM
PROIZVODIMA

2.1. Razvoj trita


Ve u davnoj prvoj polovici devetnaestog stoljea amerika plovila prevozila su pamuk
u Veliku Britaniju te neke gotove tekstilne proizvode u zemlje Azije. U drugoj polovici
istog stoljea amerikim se pamukom aktivno trgovalo diljem Kine uz dominaciju u
sjevernim pokrajinama3. Prisjeanje tako davnih injenica svjedoi o tome da je
globalizacija tekstilnih proizvoda zapoela mnogo ranije nego to na prvu pomisao
moemo percipirati.

Starom vijeu moemo dakle smatrati kretanje tekstilnih proizvoda i odjee izmeu
granica razliitih zemalja u zavisnosti o cijeni rada, posrednih trokova, cijene kapitala,
prijevoza osiguranja i ostalih trokova. Razliite ulazne kvote i posebne poreze pojedine
zemlje ve su odavno usvojile kao mehanizme zatite vlastite tekstilne industrije. Za
neke vanije projekcije budunosti svakako je vano napomenuti da, u WTO trenutno
kvotama optereena Kina, u 2005. godini postaje potpuno osloboena ogranienja koja
su joj nametana godinama.

Iako navedeno i dalje odreuje tokove kontingenata tekstilnih proizvoda kao posebno
vana pojavljuju se obiljeja povezana s distribucijom. Takoer, razvoj tehnologije
promijenio je odnos i karakteristike ponude i potranje te postavio nove temelje
potroakog drutva. Posebnosti tekstilnih proizvoda u usporedbi sa nekim uobiajenim
potroakim proizvodima u kontekstu nove trine ekonomije postavlja sasvim nove
zadatke pred proizvoaa i posrednika. Upravo je potroa, uz uobiajeni faktor
trokova, generator trendova koji se mogu razabrati kako u veleprodaji tako i u
maloprodaji tekstilnih i srodnih proizvoda. Pod pojmom "srodni" u ovom radu
podrazumijevaju se posoblje, tepisi, pozamanterija, metrane tkanine, obua i sl. te e
se dalje u tekstu isti podrazumijevati ukljueni u podruje istraivanja.

3
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-2, 2-3

4
Dugogodinja tradicija hrvatskih poduzea u tekstilnoj i odjevnoj industriji, premda smo
svakih nekoliko mjeseci svjedoci loeg stanja pojedinih poduzea, razlog je postavljanja
te grane na jedno od najvanijih mjesta kako u vrijeme ranih devedesetih godina tako i u
novijoj povijesti4. U naoj zemlji takoer su prisutne velike posrednike tvrtke za uvoz i
distribuciju tekstilnih proizvode koje se uspjeno nose sa nadolazeom konkurencijom
pratei svjetske trendove u tom podruju. Odgovarajui marketing uz visokokvalitetan
tekstil modernog dizajna pa ak i samo atraktivan dizajn dovoljni su da se probije na
trite i uini prvi korak bilo da se radi o vlastitoj proizvodnji ili tek posrednitvu u
distribuciji.

Heterogenost proizvoda, smanjivanje rizika vezivanja zaliha te porast broja proizvoda


utjeu na ponudu u mnogim podrujima i izvan tekstila. Smanjivanje transportnih i
komunikacijskih trokova pridonosi rastu i razvoju trita. Nasuprot smanjenju tih
trokova pojavljuju se novi vezani uz rizike upravljanja poslovanjem u nesigurnim
uvjetima. Rokovi isporuke postaju sve vaniji faktor u konkurentnosti a u kombinaciji s
pritiskom na cijenu proizvoda dovode globalno do regionalizacije trita i pojave
potrebe za sasvim novim uslugama koordinacije na temelju znanja dobivenog iz
informacija o prodaji i profilu potroaa. Menaderi moraju kombinirati razne
pokazatelje te donositi i, to je vanije, reagirati promjenama na odluke pri svakoj
znaajnijoj naznaci promjene kljunih pokazatelja. Od globalne vizije do podjele radnih
zadataka, postojanje jasnih pravila uz predvianje kriznih situacija zajedno s modelima
za njihovo rjeavanje preraslo je potrebu i postalo nunost suvremenog poslovanja.

4
Soljai I. "Tekstilna i odjevna industrija u hrvatskoj", http//www.hatz.hr/hrv/glasnik/Ivo Soljacic.htm,
05.09.2004.

5
2.2. Trendovi u veleprodaji tekstilnih proizvoda
Globalizacija trita te dominantno potroau orijentirana ponuda zahvatila je i
veletrgovinu tekstilom. Premda je pri kupnji npr. raunalnih komponenti lako
"prokrstariti" Internetom, usporediti cijene i pronai najbolji odnos kvalitete i cijene,
tekstilni proizvodi ipak nisu toliko usporedivi niti osjetljivi na informatiki pismenije
pripadnike potroake zajednice. Ono to informacijska tehnologija moe uiniti je
poslati informaciju o modnim kretanjima, novim kolekcijama te, kod nekih
veletrgovaca, dostaviti informaciju o cjelokupnoj ponudi proizvoaa5 ukljuivo s
cijenama u gotovo svim valutama kako ne biste morali odluivati u samoj trgovini6 ve
voeni informacijom krenuli u ciljanu nabavku. Prva pomisao upravo je izuzetna
uslunost do koje su spremni ii veletrgovci no u pitanju je veliki pritisak na distributere
odnosno moemo rei da se najvei problem proizvoaa i veletrgovaca tekstilnih
proizvoda danas oituje se u aspektima distribucije proizvoda.

Dvije kljune pojave7 umnogome utjeu na probleme snabdjevaa potroake industrije


a posebno se oituju i u podruju tekstilnih proizvoda. Jedna od njih podrazumijeva
dopunjavanje zaliha kupaca estim isporukama prema narudbama koje maloprodajni
trgovci izrauju kao rezultat analiza informacija o tekuoj prodaji i stanja na zalihama.
Uobiajena praksa ranije, koliko je mogue govoriti o uobiajenom u trinim prilikama
koje se stalno mijenjaju, potpuno je drugaija. Povremene, velike narudbe i isporuke
izmeu proizvoaa, veletrgovaca i prodavaa na malo karakterizirale su tzv.
tradicionalni model koji je utjecao na nain formiranja cijene i distribuciju. Vremenski
ogranienu proizvodnju/ponudu odreene kolekcije, esto povezanu sa sezonom i
tritem za koje se proizvodi te ogranienu koliinom, zamijenila je potreba za eom
dodatnom isporukom veeg postotka proizvodnog programa unutar sezone prodaje.
Nasuprot specificiranju jedne, velike, narudbe daleko prije oekivanog roka isporuke,
vodei proizvoai/veletrgovci suoeni su sa zahtjevima ispunjenja vie manjih
narudbi u kraim rokovima, a istraivanja pokazuju da se radi o periodima od tri do pet

5
http://www.camper.es, Camper (obua), http://www.mango.es, Mango (odjea)
6
http://www.mango.es, Mango (odjea)
7
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-4

6
dana8. Evidentno je da nisu svi proizvodi zahvaeni ovim trendom, no postotak takvih
se drastino poveava pa ak i kod tipino modnih proizvoda koji se sve vie naruuju
ee i u manjih koliinama.

Druga pojava odnosi se na sve vei broj razliitih proizvoda. U kontekstu ranije opisane
pojave, potrebno je imati sve vei broj proizvoda na dispoziciji kupcima. ak i na prvi
pogled jednostavno profilirani proizvodi kao npr. muka majica mogu se pojaviti u
raznim, brojnim kombinacijama boje, veliine, dezena, tkanine, kroja i sl. Prema analizi
ponude u katalogu proizvoaa Lands' End, muka polo majica samo u plavoj i bijeloj
boji, razne kombinacije dizajna na vratu i rukavima te kroja, predstavljaju ponudu 5779
razliitih inaica. Ovaj primjer ilustrira tek jednu inaicu majice koju navedena (ili neka
druga) kompanija nudi. Pridodajmo tome ostale atribute karakteristine za tekstilne
proizvode i brzo dolazimo do desetaka tisua kombinacija. Porast broja proizvoda znai
da se ono to je poetkom osamdesetih godina bilo distribuirano kroz stotinjak
proizvoda danas se broji u tisuama. Ako ove podatke stavimo u kontekst ponude
veletrgovaca, oni moraju osigurati dovoljne koliine svake kombinacije i oekivati
tjednu narudbu tono odreenog dezena. Narudba moe biti poslana bez posebnog
pravila to ju ini nepredvidivom ak i za velikog trgovca koji je do sada navikao na
prodaju velike koliine u kritinoj masi proizvoda. Porast broja (inaica) proizvoda
umnogome mijenja prilike snabdjevaa. Odnos prema promjenjivoj potranji krucijalno
je pitanje konkurencije u novo doba. ak i za neke osnovne proizvode potranja varira
od dana do dana, od tjedna do tjedna. Jedno od starih pravila je da se narudbe koje se
oekuju planiraju na temelju ispunjenih do tog trenutka, no taj princip sve manje daje
upotrebljive rezultate. Sve je vie imbenika koje je potrebno ukljuiti u analize. Sve je
vei pritisak na kvalitetu i brzinu prikupljanja informacija koje mogu pomoi u
determiniranju trinih zakonitosti.

8
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-4
9
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-5

7
Slijedei prikazane pojave dolazimo, do jo jednog trenda koji je vano spomenuti.
Veina proizvoaa tekstila i obue, u emu se ne razlikuju od drugih, trae naine da
snize trokove. Jedan od najpopularnijih naina, ukoliko ste dovoljno veliki, jest
prebaciti proizvodnju u inozemstvo u zemlje u kojima je nia cijena radne snage koja
pri veim trokovima transporta i neto duim rokovima isporuke jo uvijek dri cijenu
konkurentnom na tritu. Ovaj trend u raznim je industrijama posebno oit u
posljednjim godinama. Ranije je spomenuto da je oekivani odgovor na zahtjev za
isporukom tri do pet dana. Ukoliko se iskoriste prednosti inozemnih ulaganja pri
uvjetima estih isporuka (skup transport), nemogunosti da se brzo reagira na potranju
(zbog udaljenosti i proizvodnog procesa) proizvodi vrlo lako mogu postati
nekonkurentni cijenom. Razna istraivanja prouavaju utjecaj novih trinih pravila na
proizvodnju te odnose profita i utjecaja zaliha pri emu efikasno planiranje ima posebnu
vanost. Jedno od takvih istraivanja10 pokazuje da odnos proizvodnje koji maksimizira
profit iznosi 50:50 proizvodnje u inozemstvu u odnosu na domau pri emu odreivanje
to e se gdje i u kojoj koliini proizvoditi zahtjeva iznimnu sposobnost planiranja. To
bi znailo da proizvoai u svoje planove kalkuliraju ponovno pokretanje ili
reorganizaciju proizvodnje u vlastitoj zemlji ili blizu velikih trita uz poveanje stupnja
tehnoloke razvijenosti proizvodnih pogona kojima e odgovarati na zahtjeve trita.

Utjecaj razvoja informacijske tehnologije upravo je vidljiv u odnosu transporta,


komunikacija i poslovnih inovacija koje konstantno smanjuju trokove transakcija
izmeu potroaa i snabdjevaa ukljuenih u lanac nabave. Prouavanje navedenih
odnosa uz kvalitetno proaktivno interpretiranje rezultata iz prolosti bilo je nezamislivo
zbog slabe razvijenosti ponajprije sklopovlja, no taj pristup tek otvara neke nove pojave
koje e biti kao izazov postavljene pred sve tzv. tradicionalne proizvoae i velike
posrednike u tekstilnoj industriji.

Dok se novi pristupi razvijaju, uspjenost tvrtki je najee u rukama dobrih


pregovaraa u slubama nabave. U ovakvom stanju stvari oni su u poziciji ponuditi
proizvoaima tradicionalni pristup (dostava nekoliko velikih narudbi na centralizirana

10
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-8

8
skladita) uz odreenu cijenu (najee zahtjevajui dodatne rabate) ili zauzeti otvoren,
nepredvidljiv, neobavezan stav malog kupca. Neprilagoenost i zaostajanje za
tehnolokim razvojem jednostavno se nee isplatiti bez obzira na veliinu.

2.3. Trendovi u maloprodaji tekstilnih proizvoda


Svakodnevno smo svjedoci pojave da veliki maloprodajni trgovaki lanci potiskuju
male trgovce do zatvaranja njihovih trgovina koje esto, ako opstanu, postaju njihovim
dijelovima. Istovremeno snaga maloprodajnih trgovakih lanaca se poveava i oni
zauzimaju sve znaajnije mjesto u lancu ponude. U sve veoj mjeri oni diktiraju uvjete
veletrgovcima te istrauju nove naine privlaenja potroaa. Bez obzira na sve
navedeno, zadrati panju potroaa na due vrijeme postaje pusta iluzija. Razne
preferencije i ukusi, rast konkurencije, demografska kretanja pa i simpatini "uinimo
neto novo, drugaije" pokreti mijenjaju trinu sliku. Danas, vie nego ikad, trgovci na
malo idu korak dalje u razumijevanju svojih kupaca. Pored toga, karakterizira ih sve
vei angaman u lancu nabave, unapreivanju prodajnih mjesta te iznalaenju
alternativnih prodajnih kanala kao to je Internet.

Informacijska tehnologija igra kljunu ulogu u naporima trgovaca u agresivnim


prilikama trita. Agilni prodavai brzo prevladavaju osnovnu rutinu i ovladavaju
novim tehnologijama kao to su CRM (Customer Relationship Management -
upravljanje odnosima s kupcima), poslovna inteligencija i sl.

Kljuni trendovi u maloprodaji mogu se opisati kroz nekoliko pojava11 koje e biti
opisani u nastavku.

Porast broja trgovakih centara u posljednjih dvadeset godina vidljiv je kako u Europi
tako i na ostalim kontinentima. Lanci supermarketa ukazuju na rast konsolidacije i
globalizacije pri emu pregovaraka mo trgovaca raste unutar lanca nabave. Naznake
pokazuju da e se ovaj trend globalnog irenja, uz poveanje konkurentnosti, nastaviti i
u budunosti. Posebni sluajevi biljee ulaganja distributera u poveanje utjecaja ili ak

11
Business Intelligence and Retailing: "Aplications od data warehousing and data mining in the retail
industry", R.P. Srinivasa, Saurabh S., Wipro Technologies

9
preuzimanje maloprodajnih lanaca kako bi imali mogunost predvianja terena za
plasman vlastitih proizvoda.
Upravljanje odnosima s kupcima (CRM) postaje kljuni pokreta poslovanja. Bolje
organizirani trgovci preorijentirali se svoje poslovanje oko sve zahtjevnijih potroaa. U
utrci privlaenja novih kupaca spoznali su da je jednako vano zadrati i postojee.
Poveana interakcija uz sofisticirane tehnike analize pruaju trgovcima nesluene
mogunosti pronicanja u nain razmiljanja potroaa. Ove se informacije koriste za
uspostavljanje prisnijih odnosa s kupcima, ciljani marketing i promotivne kampanje,
unutarnje ureivanje duana, upravljanje elektronikim kanalima i sl.

Upravljanje lancem nabave (SCM Supply Chain Management) takoer je postao jedan
od pokretaa poslovanja. Trgovci upravljaju logistikom formirajui vlastite
distribucijske mree. Jedna od vitalnih odrednica uspjeha u budunosti svakako e biti
sposobnost efikasne distribucije diljem svijeta te logistike koja podrava sustave
prezentacije i prodaje. Globalni lanac prodaje mora biti sposoban osigurati visoku
razinu dostupnosti proizvoda koje potroai poele kupiti.

Porast on-line prodaje svakodnevno je mogue detektirati informacijama iz raznih


medija. Premda je, zbog prirode tekstilnih proizvoda, razvoj on-line trgovina u ovom
podruju uglavnom ogranien na prezentaciju, u slijedeem odjeljku bit e prikazani
neki vrlo uspjeni i zapaeni primjeri kao npr. Mango (odjea) ili Camper (cipele).
esto smo svjedoci tvrdnji kako e Internet potpuno promjeniti nain prodaje nasuprot
kojih stoje one kako ustaljen materijalni karakter (opip i osjeaj) robe ipak ostaje
dominantan te e Internet imati marginalan utjecaj na ponaanje potroaa. Premda se
eka dostizanje odgovarajueg stupnja integriranosti postojeeg naina poslovanja i e-
poslovanja koji je u ovom podruju ipak sloeniji cilj, mnogi veliki proizvoai i
distributeri iz sezone u sezonu razvijaju prezentacijsko prodajne sustave sa sve veim
brojem on-line korisnika.

Moemo govoriti o segmentaciji kupaca i kljunih proizvoda i ciljanom marketingu kao


vanim konceptima u budunosti maloprodaje. Pojedine vrste proizvoda iz raznih
razloga (modna kretanja, lojalnost brandu, kvaliteta...) mogu postati trino

10
preferencijalnim no isto tako mogu i nestati s trita. Preostaje samo prepoznati
potranju i uobliiti kvalitetan spoj ponude, i initi to stalno i uvijek iznova drugaijim.
Posebna panja posveuje se kanalima prodaje koji utjeu na eve sudionike u prodaji,
od proizvoaa, veletrgovca/distributera pa sve do maloprodaje i kupca. Jo prije
nekoliko godina tipini je kupac uao u prodavaonicu, informirao se o veliini i cijeni
proizvoda i kupio ono to mu treba. Ako je elio veu pozornost prodavaa, izabrao bi
duan u kojem to moe dobiti i, najee, platio veu cijenu. Ako je bio u potrazi za
jeftinijom robom jednostavno bi se uputio u prodavaonicu s takvom ponudom.
Ponaanju potroaa posveen je dio rada u nastavku no na ovom mjestu vano je
spomenuti da, prema analizama Forrester Researcha12, amerike kompanije za
istraivanje trita, danas se svaki drugi kupac u razvijenim potroakim drutvima
koristi jednim kanalom prodaje za prikupljanje informacija o proizvodu da bi zatim
kupovinu ostvario na drugom mjestu. Prihvaanjem ponaanja potroaa uz razvijanje
prodajnih putova koji odgovaraju tom ponaanju u pojedinim fazama, o kojima e biti
rijei kasnije, kompanija ima priliku utjecati na potroae i navesti ih na onaj put koji
ima potencijal poveati zaradu i nadmaiti uloeno u privlaenje kupca.

12
Vukovi L. "Nove strategije privlaenja kupaca", Poslovni Magazin br.11, studeni 2004. str. 46

11
2.4. Utjecaj razvoja informacijske tehnologije u trgovini tekstilnim i
srodnim proizvodima
Pojam poslovna inteligencija, kako e detaljnije biti opisano u slijedeem odjeljku,
odnosi se na sposobnost prikupljanja i analiziranja velike koliine podataka o kupcima,
dobavljaima, tritima, internim procesima i poslovnom okruenju. Skladite podataka,
kako e takoer biti prikazano u slijedeem odjeljku, osnova je korporacijskog sustava
poslovne inteligencije. Razni alati za analitiku obradu podataka i rudarenje podataka
koriste se za transformaciju podataka iz skladita i aktivne poslovne informacije

upravljanje upravljanje upravljanje


tvrtkom ljudskim financijama i
resursima trajnim dobrima
vrijednost
upravljanje odnosima s klijentima
klijenata
upravljanje operacije na alternativni
opskrbim lancem i prodajnim prodajni kanali
nabavom mjestima

SLIKA 2.1. Stvaranje vrijednosti za klijenta u maloprodaji13

Ilustracija pokazuje upravljanje odnosa s klijentima kao sredinju toku putem koje
bitne informacije o klijentima, uz primjenu alata poslovne inteligencije proimaju sve
ostale dijelove tvrtke. Poslovna inteligencija igra vanu ulogu i u svim ostalim
maloprodajnim funkcijama kao to su upravljanje opskrbnim lancem, operacije na
prodajnim mjestima i upravljanje kanalima prodaje.

Tipina maloprodajna tvrtka posluje s velikim brojem klijenata ije su potrebe u znatnoj
mjeri diferencirane. Bez odgovarajuih sredstava za analizu mnogobrojnih podataka o
klijentima strategija upravljanja odnosima s klijentima bila bi osuena na neuspjeh. Od
najvee koristi za analitiko upravljanje odnosima s klijentima su funkcije marketinga i
prodaje koje predstavljaju glavne kontaktne toke putem kojih se stvara uvid u obiljeja
i ponaanje klijenata.

13
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 450

12
Upravo razvoj informacijske tehnologije omoguio je neke najvanije primjene
analitikog upravljanja odnosima s klijentima kao to su14:
segmentacija klijenata kljuni marketinki element u trgovini na malo.
Segmentacijom se stvara uvid u to kako razliiti segmenti klijenata odgovaraju
na razliite promjene,
analiza uinkovitosti marketinkih kampanja i promidbenih aktivnosti kad se
pokrene odreena marketinka kampanja, njena se uinkovitost moe istraivati
prema razliitim medijima i u kontekstu koristi i trokova. Time e se saznati to
se moe smatrati uspjenom kampanjom,
vrijednost klijenata tijekom cjelokupnog ivotnog ciklusa kako svi klijenti nisu
jednako profitabilni tako se i profitabilnost klijenata mijenja kroz vrijeme. To su
razlozi zbog kojih je vano identificirati klijente ija je vrijednost tijekom
cjelokupnog ivotnog ciklusa velika te s njima uspostaviti prisne odnose.

SLIKA 2.2. Detalj on-line duana tvrtke Mango15

14
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 451
15
http://www.mango.es, 19.10.2004.

13
Rast procesorske snage prati razvoj i sve ira upotreba raznih analiza i predvianja
usmjerenih klijentima (lojalnosti klijenata, unakrsna prodaja, odreivanje ciljane cijene,
ciljani marketing) ali i dobavljaima (analiza djelotvornosti dobavljaa, kontrola zaliha,
protok proizvoda, prognoziranje potranje). Kako je ranije navedeno, naglasak na
vanosti logistike uz potrebu razumijevanja sloenih mehanizama trita i statistikih
metoda analize poslovnih podataka, dovodi do specijalizacije pojedinih tvrtki u
pruanju iskljuivo logistikih usluga. Moe se rei da je razvoj informacijske
tehnologije umnogome utjecao na tradicionalne postavke trita tekstilne industrije koje
i dalje trpi navedene utjecaje.

Utjecaj razvoja informacijske tehnologije nije potpun ako se ne spomene primjena


odnosno potencijali primjene Interneta u poslovanju. Veini ranije navedenih trendova
upravo je razvoj Interneta bio najznaajniji katalizator. Tvrtke koje imaju ambiciju
razvijati i iriti vlastito poslovanje prepoznaju mogunosti koje nudi ruenje prostornih i
vremenskih prepreka tradicionalnog poslovanja. Izlaskom na virtualno trite tvrtka
postaje podjednako lako dostupna svim potencijalnim klijentima. Osim webocentrine
orijentacije, ukoliko eli uspjeno zadovoljiti potrebe potroaa u ovakovom okruenju
mora postati i klijentocentrinom16.

Utjecaj Interneta u prvi plan stavlja kvalitetu usluge dok se zahtjevi klijenta poveavaju
bilo da se radi o kvaliteti usluga ili aurnosti informacija, dok istovremeno strpljenje
klijenata postaje sve manje jer konkurencija je udaljena tek jedan click mia.

Tekstilna brana ovdje se suoava sa vrstim tradicionalnim pristupom materijalne


ponude koju korisnik moe opipati, osjetiti, te sa novom generacijom klijenata u web
okruenju koji se u virtualnom svijetu snalaze gotovo jednako kao i u stvarnom.
Takoer, put od proizvoaa prema krajnjim potroaima skrauje se na najmanju
moguu mjeru, odnosno ovisi o sposobnosti ponuaa da se predstavi na Internetu na
to ga i tako pritiu veletrgovci i zahtjevi modernih lanaca nabave s jedne te trina
orijentiranost s druge strane.

16
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003, str. 81

14
Ipak, mogunosti za zadravanje kupaca u ovoj su trinoj grani daleko vee nego u
drugima. Dok smo danas svjedoci procjena da e trite direktne prodaje
osiguravateljnih usluga kakvim ga poznajemo u godinama koje slijede potpuno nestati,
rad na sadraju koji se nudi kupcima uz kvalitetne nabavne i distribucijske kanale moe
osigurati stabilnost tekstilne tvrtke i u novim vremenima. Pri tome ne treba zanemariti
prezentacijski potencijal Interneta no u obzir je potrebno uzeti ciljano regionalno
okruenje, ciljane segmente potroaa i proizvoda, vodei rauna o kvaliteti ponude.
Alternativno, kvalitetan nastup proizvoaa na web prostoru na povlateno mjesto
stavlja sudionike u vlastitoj distribucijskoj mrei. Upravo na tim osnovama baziran je
pristup tvrtke proizvoaa sportske opreme Nike17 koja na vlastitim stranicama nudi
mogunost da potroa dizajnira vlastiti model tenisica s mogunou dodatne
personalizacije u obliku vlastite poruke izvezene na finalnom proizvodu.

Prema dostupnim informacijama18 Nike godinje izbaci oko 120.000 razliitih


proizvoda. Iako je tvrtka krajem devedesetih zapala u krizu poslovanja, upravo
uvoenjem novog informacijskog sustava vrijednog 500 milijuna amerikih dolara koji
je zamijenio 27 dotada razliitih sustava. Zahvaljujui tehnologiji, vrijeme lansiranja
novog proizvoda smanjeno je s devet na est mjeseci a uvoenje novog sustava
istraivanja trita dovelo je do toga da Nike samo tri posto tenisica proizvodi za
nepoznatog kupca.

Kao ilustracija, prikazani su detalji jednog od dizajnom, ponudom i uporabljivou


najkvalitetnijeg web duana odjeom, panjolskog Manga19, te takoer panjolskog,
Campera,20 trendsetera u podruju obue.

Razlog odabira upravo ove dvije tvrtke je njihov dugogodinji razvoj spomenutih usluga
koje su atraktivnim dizajnom i tehnolokim rjeenjima doveli na vrlo visku razinu. Bez
obzira u kojoj se zemlji nalazite (razlike u domicilnim valutama, oznakama veliina
odjee i obue) pregled i odabir mogue je prilagoavati do najsitnijih detalja. Poseban

17
http://www.nike.com
18
Brezovnjaki A. "Just Do It", Poslovni Magazin br.11, studeni 2004. str. 40
19
http://www.mango.es
20
http://www.camper.es

15
sustav na Mangovim stranicama brine se o ponudi adekvatnih dodataka proizvodu ili
proizvodima koje ste odabrali, kao neka vrsta virtualnog stilista koji Vam je uvijek pri
ruci a prije nego kupite proizvode virtualni model pokazat e Vam kako bi cijela
kombinacija trebala izgledati.

SLIKA 2.3. Detalj on-line duana tvrtke Camper21

Na raspolaganju Vam za savjete stoje virtualni trgovci koji e na Vae komentare


odgovoriti u zapanjujue kratkom roku. Sve je u funkciji zadovoljstva kupca, u funkciji
prodaje. Sve je u funkciji kvalitetne prezentacije i podrke distribucijskoj mrei. Kupac
je pokreta svih aktivnosti.

21
http://www.camper.es, 19.10.2004.

16
3. POSLOVNA INTELIGENCIJA

3.1. Pojam poslovne inteligencije


Povezanost Interneta i srodnih tehnologija otvara ljudima nezapamene mogunosti
upravljanja informacijama na nain koji osigurava najveu poslovnu iskoristivost.
Nasuprot stvaranju nepreglednih spremita podataka, navedeno je omogueno
sustavnim pristupom upotrebe najboljih proizvoda i iskustava za pojedine zadatke te
poticanjem potrebnih veza meu istraivaima kako bi prepoznali i izrazili znanje
skriveno u tim podacima. Prema jednoj dostupnoj definiciji,22 poslovna inteligencija je
stjecanje i iskoritavanje znanja baziranog na injenicama u svrhu unapreivanja
strateke i taktike poslovne prednosti na tritu. Ova jednostavna definicija predstavlja
tek jedan od pogleda na navedeni pojam.

Prema strooj definiciji pojam poslovne inteligencije objedinjava metodologije,


tehnologije i platforme za skladitenje podataka (Data Warehousing), OLAP
procesiranje podataka (On-line Analytical Processing) i rudarenje podataka (Data
Mining) koje omoguavaju tvrtkama kreiranje korisnih upravljakih informacija iz
podataka o poslovanju koji se nalaze disperzirani na razliitim transakcijskim sustavima
te dolaze iz razliitih internih i eksternih izvora23.

Isti autor navodi da je u stvarnosti poslovna inteligencija s jedne strane nain poslovnog
promiljanja koji omoguava da se poslovne odluke na svim razinama odluivanja
donose temeljene na relevantnim i aurnim poslovnim informacijama, a ne temeljene na
predosjeaju i subjektivnom utisku. S druge, informatike, strane to je sloeni
informacijski sustav koji automatiziranim procedurama prikuplja podatke iz raznih
izvora, obrauje ih, transformira i integrira te omoguava korisnicima dostup do
kvalitetne informacije na intuitivan i lako razumljiv nain.

Pojmu poslovne inteligencije moe se pristupati i sa slijedea dva motrita24:

22
E-Solutions Integrator Inc. 2001: "Business Intelligence: With or Without the E", e-SI whitepaper,
http://www.esionweb.com, 20.11.2003.
23
Oreanin D. "BI hit ili mit?", Banka poseban prilog, sijeanj 2003., str 4.
24
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 21

17
s makroaspekta, i
s mikroaspekta.

Razmatranje s makroaspekta odreuje poslovnu inteligenciju kao sloenu, agregiranu


kategoriju koja se stvara sustavnim ali unaprijed neciljanim prikupljanjem podataka o
makroekonomskim kretanjima u odreenoj sredini, njihovim organiziranjem i
strukturiranim biljeenjem odnosno pohranjivanjem, pretraivanjem, te logikom i/ili
strojnom obradom poradi otkrivanja makroekonomskih trendova ili tendencija, te
predvianja i prognoziranja procesa i dogaaja u makroekonomskim sustavima i
njihovih buduih stanja.

Razmatranje s mikroaspekta nailazi na razne interpretacije te oteava istraivanje uslijed


nemogunosti da se jednoznano odredi predmet istraivanja, nasuprot porastu svijesti o
potrebi prihvaanja koncepta poslovne inteligencije te razvojem i primjenom alata u tu
svrhu. U svrhu detaljnijeg prezentiranja prenosim neke elemente koji se kao zajedniki
mogu izvesti iz prilino heterogenih definicija25:
cilj je stvaranja poslovne inteligencije podrka i unapreenje postupaka
donoenja poslovnih odluka u poduzeima,
poslovna inteligencija nastaje kao rezultat dobro upravljanog i promiljenog
procesa izvoenja novih ili prikrivenih znanja iz podataka koji se u poslovnoj
praksi rutinski generiraju, zahvaaju, memoriraju i koriste,
poslovna se inteligencija moe izvesti iz operativnih podataka primjenom
odgovarajuih logiko-raunskih metoda,
primjena takvih metoda iziskuje razvijanje odgovarajuih informatikih
sredstava i alata kojih se ve danas na tritu moe nai razmjerno puno,
stvaranje poslovne inteligencije nalae uspostavu koherentnog pristupa
upravljanju podacima i razvijanje jedinstvenog stava prema njihovoj ulozi i
vanosti u poduzeu.

25
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 24

18
Koliina podataka, premda ima vanu ulogu, nije od presudnog znaenja. Obzirom na
koliinu generiranih informacija, koncept poslovne inteligencije poiva na slijedeim
temeljnim zamislima26:
namjera koncepta poslovne inteligencije nije stvaranje vee koliine informacija,
ve iskljuivo generiranje boljih, kvalitetnijih informacija potrebnih pri
donoenju poslovnih odluka,
upravo to je ono svojstvo poslovne inteligencije koje joj daje mo poticanja i
stvaranja pozitivnih promjena u sredini u kojoj se stvara i primjenjuje,
poslovna inteligencija prua korisnicima samo one informacije koje su im
potrebne , ali zato pravovremeno i iskazane na nain koji ima najvie odgovara,
uz valjanu primjenu, koncept poslovne inteligencije smanjit e koliinu
informacija kojoj se zaposlenici tvrtke izlau, poveavajui istovremeno
kvalitetu tih informacija.

Meu osnovne znaajke poslovne inteligencije mogu se ubrojiti slijedee27:


zasniva se na personalizaciji,
proaktivna je,
nastaje iz operativnih podataka.

Personalizacija znai primjenu tehnologije u svrhu proaktivnog zahvaanja i


dostavljanja informacija pojedincima. Poslovna inteligencija automatizira dostavu
informacija primateljima, koristei pritom posebne uvjete i odstupanja od planiranih
aktivnosti kao poticaje za takvu komunikaciju.

Premda je pojam "poslovna inteligencija" u uporabi razmjerno kratko vrijeme, njegova


je bit razvijena prilino davno. Sedamnaesto stoljee razdoblje je procvata meunarodne
trgovine. Otkriveni su novi teritoriji i plovni putevi a pomorci na raznim putovanjima
bili izloeni kunjama, izazovima i novim tipovima rizika. Pojavila se potreban za
nekim vrstom zatite od opasnosti koje su vrebale. To je nadahnulo novi tip poduzetnika
pomorske osiguravatelje koji su bili spremni pokriti tete, odnosno gubitke u
zamjenu za odgovarajuu naknadu ili premiju. Ve tada osiguravatelji su ovisili o
26
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 25
27
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 25

19
tonim i aurnim informacijama najrazliitije prirode. Upravo navedene prilike upuuju
da poetke osiguravateljne djelatnosti moemo smatrati roenjem poslovne
28
inteligencije .

3.2. Evolucija poslovnih informacijskih sustava


Ogroman napredak informacijske tehnologije potie revolucionarne promjene u nainu
na koji obavljamo razne poslove. Revolucionarnost promjena ne oituje se samo u
nainu na koji obavljamo pojedine poslove (primjenjivanjem informacijskih tehnologija
kako bi bre i sigurnije obavljali pojedine zadatke) ve u prirodi samih poslova, dakle u
onome to radimo - upravljamo poslovnom strategijom primjenom tehnologije.
Tehnologija mijenja prirodu poslovnog svijeta koja se sve vie temeljni na upravljanju
znanjem.

Tradicionalni sustavi za podrku odluivanju (DSS Decision Support Systems) u


naelu ne personaliziraju informacije, pa ih zato u svakoj novoj primjeni ne treba
mijenjati ili dotjerivati. Poslovna inteligencija utire put "novom valu" sustava potpore
odluivanju, odnosno sustavima upravljanja znanjem (Knowledge Management
Systems) tako to funkcionira prema modelu koji se sastoji iz pet glavnih
komponenata29:
informacije,
analize i segmentacije,
personalizacije,
dostave informacija putem kanala,
akcije, interakcije i/ili transakcije.

Kada su ispravno konfigurirane i usklaene, navedene komponente ine snanu,


proirivu i prilagodljivu platformu poslovne inteligencije. Takve aplikacije pretvaraju
tradicionalne sustave potpore odluivanju, koji funkcioniraju prema naelu pitanja i
odgovora, u sustave upravljanja znanjem. Najnovija generacija aplikacija koncepta
upravljanja znanjem podrazumijeva logiku koja je upravo obrnuta u odnosu na logiku

28
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 28
29
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 26

20
tradicionalnih sustava potpore odluivanju a svodi se na pitanje: to ako sustav ne eka
da korisnik (klijent) postavi odreeni upit?
Primjena poslovne inteligencije polazi od pretpostavke da korisnici ne vole nepotrebne
informacije pa e, ako mogu, rado pokazati svoje preferencije glede tipa informacija
koje ele dobivati, uestalosti primanja poruka i komunikacijskog medija putem kojega
e mu informacije pristizati.

Moe se pretpostaviti kako e slijedea generacija primjene poslovne inteligencije


koristiti novu tehnologiju, tehnologiju mobilnog elektronikog poslovanja, koja e
omoguiti pristup bazama i skladitu podataka putem prenosivih ureaja. Dok su raniji
modeli poivali samo na statinim informacijama o transakcijama klijenata. Poslovna
inteligencija pretpostavlja da valja teiti primjeni infrastrukture koja najbolje odgovara
potrebama klijenata jer e tada i usluge koje im se pruaju biti daleko kvalitetnije.

U domeni razvoja transakcijskih informacijskih sustava, kao podloge za kvalitetno


prikupljanje informacija, podruje tekstilnih proizvoda esto se poistovjeuje sa slinim,
jednostavnije klasificiranim, robama. Problemi koji se postavljaju pred projektante
ovakvih sustava velika je koliina raznolikih informacija koji bi bilo korisno imati o
svakom proizvodu. Dok mlijeko dolazi u vie inaica zasienosti mastima ono je u
naelu dobro poznat proizvod ijom kupnjom ne oekujemo iznenaenja. Sve to
moramo znati je koliina koju elimo kupiti. Tekstilni proizvodi uvelike se razlikuju.
Postojanje podataka o boji, dezenu, veliini, sezoni kojoj je proizvod namjenjen,
materijalu (koji moe bili kombiniran od vie razliitih materijala) tek su neki od
moguih a svaki od njih moe u odreenom trenutku biti vaan sustavu podrke
odluivanju. Oznaavanje, pakiranje takve robe zahtjeva vjetinu planiranja do
najsitnijeg detalja.

Upravo razvoj informacijsko telekomunikacijske tehnologije otvara mogunost


najposobnijima da razviju takve efikasne transakcijske sustave temeljene na navedenim
pretpostavkama i na njima baziraju skladita poslovnih informacija, baze znanja te
planiraju i predviaju budua kretanja.

21
3.3. Poslovne informacije
Kljuno pitanje suvremenog poslovanja je slijedee: to je najvanija pretpostavka
preivljavanja tvrtke na dananjim turbulentnim tritima30?

Odgovor je jednostavan informacija, ili, preciznije, informacija koja omoguuje


poduzimanje odgovarajue akcije. Navedeno podjednako vrijedi za sve industrije,
gospodarske grane i djelatnosti, od poljoprivrede, energetike i strojogradnje, preko
trgovine i bankarstva, do osiguranja i obrazovanja.

Pojmovi podatak, informacija i znanje u meusobnim su odnosima logike nadreenosti


i podreenosti, odnosno logike hijerarhije.

znanje

informacije

podaci

SLIKA 3.1. Logika hijerarhija podataka, informacija i znanja31

Na vrhu piramide nalazi se znanje. Ono se moe protumaiti kao mogunost


ostvarivanja ili posjedovanja dubokog uvida u odreeni fenomen. Tako tvrtka posjeduje
znanje o svojim klijentima kada moe u potpunosti shvatiti i razumjeti njihove znaajke,
ponaanje i preferencije. Znanje je mogue posjedovati ako se posjeduju informacije
koje odraavaju neku cjelinu.

Informacija je temelj na kojem se gradi znanje. Istovremeno, informacija se gradi na


podacima. Ako ljudi ne raspolau dobrim podacima nee imati dobre informacije pa e
svako znanje izvedeno iz njih biti opasno po poduzee. Koliina podataka to nastaju
nastupanjem poslovnih dogaaja i realizacijom poslovnih procesa u poduzeu

30
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 27
31
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003., str. 193

22
proporcionalna je brojnosti tih dogaaja i sloenosti procesa. Izmeu koliine podataka
i njihove kakvoe (kvalitete) ne mora bezuvjetno postojati izravna proporcionalnost.
Velika koliina podataka ne mora ujedno znaiti visoku kvalitetu, vrijednost i
upotrebljivost tih podataka u procesima odluivanja. Navedeno upuuje na potrebu za
kontroliranjem kvalitete podataka odnosno upravljanje sustavom u svrhu prikupljanja
to kvalitetnijih podataka. Broj razliitih izvora podataka iz kojih tvrtka moe crpsti
podatke vane za poslovanje u dananje vrijeme vrlo je velik. Brojnost izvora podataka
eksponencijalno raste onda kada se tvrtka u svojem djelovanju odlui usmjeriti prema
Internetu i konceptu elektronikog poslovanja32. Uz poveanu koliinu dohvatljivih
podataka javljaju se i mogunosti viekanalskog pristupa tim podacima, putem
tradicionalnih komunikacijskih kanala ali i putem novih kanala (World Wide Web,
elektronika pota i sl.).

Brzo nastajanje novih tehnologija pridonosi poveanju rizika od nesvjesne uporabe


loih podataka kao podloge za poslovno odluivanje, ili pak neodgovornog ignoriranja
takvih rizika. injenica jest da u mnogim tvrtkama postoji svijest o looj kvaliteti
odreenih podataka koju esto prati zanemarivanje poduzimanja aktivnosti kojima bi se
takve pojave ispravile. Nekvalitetni podaci na razliite naine mogu utjecati na
poslovanje poduzea. Premda moramo biti svjesni da e odreen stupanj kvalitete
odnosno loe kvalitete nuno zahvatiti odreene podatke, spoznaja o stanju podataka,
mjeri u kojoj podaci ne odgovaraju istini te svijesti o moguim posljedicama takvog
stanja vrlo su bitne.

Premda je problem kvalitete podataka u stanovitoj mjeri ovisan o obiljejima tvrtke i


njena poslovanja mogue je uoiti etiri osnovne kategorije kakvoe podataka koje
imaju izravni utjecaj na donoenje poslovnih odluka u poduzeu33:
standardiziranost,
podudarnost,
verificiranost,
proirivost.

32
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 29
33
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 31

23
Standardiziranost podrazumijeva ujednaenost u izrazu te standardizacija dokumenata
nositelja poslovnih informacija. Podudarnost se odnosi na identificiranje podudarnih
podataka iz brojnih izvora i njihovu eliminaciju. Verificiranost ukljuuje postupak
usporedbe nekog podatka sa poznatim izvorom kako bi se utvrdila relevantnost podatka.
Proirivost podrazumijeva mogunost dodavanja novih podataka postojeem skupu.

Prilikom osmiljavanja dobre strategije cjelovitog nadzora, kontrole i upravljanja


kakvoom podataka potrebno je uzeti u obzir pet slijedeih zahtjeva34:
jednostavnost uporabe,
prilagodljivost,
uinkovitost,
neovisnost o raunalnoj platformi,
ekonominost.

Izraun i tumaenje vrijednosti poslovnih informacija vrlo je teko izmeu ostalog i


zbog toga to informacija nije materijalna pa se pri utvrivanju vrijednosti ne mogu
primijeniti konvencionalne metode. Odreivanju a posebno izraunavanju egzaktne
vrijednosti informacija potrebno je pristupiti vrlo paljivo. Tri odabrana pristupa,
Shanonnov kvantitativni pristup, Hammingov vremenski pristup i Liautaudov poslovno-
pragmatiki pristup, ukratko su prikazani u nastavku. Njihovo navoenje ukazuje na
potrebu ozbiljnog pristupa kvaliteti informacija pri planiranju sloenijih poslovnih
sustava ili aktivnosti.

34
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 36

24
3.3.1. Shannonov kvantitativni pristup vrednovanju informacija35
Ovaj pristup postavlja jednakost izmeu koliine informacija i entropije polja sluajnih
dogaaja koje stvara informaciju. Osnovna formula za izraun entropije glasi:
n
H ( X ) = pi ld pi
i =1, n
i =1

pri emu je:


H(X) = entropija polja sluajnih dogaaja X
pi = vjerojatnost i-tog dogaaja iz polja X
ld pi = dualni logaritam vrijednosti vjerojatnosti i-tog dogaaja iz polja X

U kasnijim istraivanjima Shannon pokuava izvesti vrijednost informacije iz njene


koliine. Pritom polazi od pretpostavke da polje sluajnih dogaaja X prije nastupa i-tog
dogaaja karakterizira jedna vrijednost entropije, koju naziva prethodnom entropijom i
oznaava s H(X,1), dok to isto polje nakon nastupa i-tog dogaaja karakterizira neka
druga vrijednost entropije, pri emu se moe govoriti o naknadnoj entropiji koja se
oznaava s H(X,2). Razlika tih dvaju entropija predstavlja koliinu informacija I(X)
generiranu nastupom i-tog dogaaja:
I(X) = H(X,1) - H(X,2).

Shannon nastoji uspostaviti vezu izmeu koliine informacija i njene vrijednosti na


sljedei nain:
ako vrijedi: H(X,l) > 0 i H(X,2) = 0, generirana je potpuna (perfektna)
informacija
ako vrijedi: H(X,l) > 0 i H(X,2) > 0 te H(X,l) > H(X,2), generirana je nepotpuna
(imperfektna) informacija
ako vrijedi: H(X,l) = H(X,2) > 0, generirana je nulta informacija
ako vrijedi: 0 < H(X,l) < H(X,2), generirana je negativna informacija, odnosno
dezinformacija

Kao to je vidljivo, Shannon je povezujui koliinu s vrijednou informacija uspio


samo djelomino, jer te vrijednosti razvrstava u samo etiri kategorije, to je suvie

35
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 40

25
"gruba", tek orijentacijska podjela kakva je teko iskoristiva za bilo kakve ozbiljnije
praktine analize. Sam pokuaj odreivanja i karakterizacije pojma vrijednosti
informacije, bez obzira na primjenjivost, predstavlja velik doprinos znanstvenoj
spoznaji u ovom podruju.

3.3.2. Hammingov vremenski pristup vrednovanju informacija36


Richard Hamming polazi od koncepta ivotnog ciklusa informacije (Information Life
Cycle), koji pretpostavlja da svaka informacija u odreenom trenutku nastaje, neko
vrijeme traje, da bi nakon isteka tok vremena nestala. Vrijednost informacije u tom
kontekstu smatra funkcijom vremena; drugim rijeima, vrijednost nije postojano, ve
vremenski promjenjivo obiljeje svake informacije.

Funkciju vrijednosti informacije u vremenu obiljeavaju tri karakteristina podruja.


Prvo je podruje prognoziranja, kada se odgovarajua informacija dobiva i prije no to
je potrebno donijeti neku odluku. Njena je vrijednost tada najvea i ona s vremenom
nelinearno opada. Drugo je karakteristino podruje stvarnog (realnog) vremena u
kojemu se informacija dobiva (odnosno nastaje) upravo onda kada treba donijeti
odluku. Vrijednost informacije je konstantna sve do podruja zastarijevanja, koje
nastupa onda kada se informacija dobiva prekasno, onda kada odluka vie nije potrebna
ili nije relevantna za daljnji tijek dogaaja (procesa). U ovome podruju vrijednost
informacije strmo eksponencijalno pada.

Vrijeme je pokazalo da su Hammingova istraivanja dala neke vrlo vrijedne rezultate.


Njegova su razmiljanja, naime, naila na vrlo dobar odjek u okvirima teorije
menadmenta. Suvremeni menadment zahtijeva raspoloivost informacije u podruju
prognoziranja, odnosno u podruju stvarnog vremena, kada njena vrijednost nadmauje
ili je uravnoteena s "teinom" odluke koju treba donijeti. Zato se danas naglasak stavlja
na istraivanje moguih naina primjene informacijske tehnologije koji e osigurati
isporuku informacija donositeljima odluka onda kada je njena vrijednost najvea.

36
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 42

26
Pri donoenju odluka na temelju informacija iz podruja prognoziranja potrebna je ipak
stanovita doza opreza, jer znanost jo uvijek ne poznaje posve sigurne prognostike
metode. Zato se u praktinim uvjetima obino postavlja zahtjev za posjedovanjem
informacija iz podruja stvarnog vremena, koje e omoguiti pravovremeno donoenje
dobrih odluka.

SLIKA 3.2. Shematski prikaz vrijednosti informacije kao vremenski promjenjive


veliine37

37
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 42

27
3.3.3. Liautaudov poslovno pragmatiki pristup vrednovanju informacija38
Tumaenje i vrednovanje informacija po Bernardu Liautaudu poiva u injenici da se
vrijednost odreene informacije protee u kontinuumu. Uporaba informacije iri se
(propagira) diljem poduzea, pa ak i izvan njega, prema klijentima i partnerima. Iz
toga Liautaud izvodi zakljuak da se vrijednost informacija moe zadovoljavajue
precizno definirati kao funkcija broja korisnika koji mogu pristupati tim informacijama i
analizirati ih i broja poslovnih podruja kojima korisnici pripadaju, te iskazati sljedeim
izrazom:
vrijednost (informacija) korisnici2 x poslovna podruja

Vrijednost odreene informacije raste razmjerno kvadratu broja korisnika koji mogu
pristupati toj informaciji pomnoenom s brojem poslovnih podruja u kojima ti
korisnici rade. Sam autor tvrdi kako se u navedeni izraz odluio uvrstiti kvadrat broja
korisnika inspiriran poznatim Metcalfeovim zakonom mree39.

Liautaud dokazuje kako se svojevrsni "mreni uinak" moe uoiti i kada je u pitanju
vrijednost poslovnih informacija. Naime, to vie ljudi dijeli iste informacije, oni se
bolje razumiju, jednostavnije komuniciraju, tjenje surauju i donose bolje odluke. Uz
to, vrijednost informacije raste skokovito onda kada neko novo poslovno podruje
tvrtke ostvari mogunost online pristupa istim informacijama. Time se stvara nova
organizacijska inteligencija.

Prema Liautaudu, u kontinuumu vrijednosti odreene informacije moe se uoiti pet


karakteristinih zona40:
1. zona u kojoj podaci predstavljaju troak
2. zona u kojoj podaci poinju stvarati novu vrijednost
3. zona inteligencije poduzea
4. zona proirenog poduzea
5. zona u kojoj informacija postaje roba kojom se trguje
38
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 43
39
Bob Metcalfe, poznat kao izumitelj mrene arhitekture Ethernet predstavio je formulu za izraunavanje
vrijednosti raunalnih mrea u kojoj vrijednost mree stavlja u odnos proporcionalnosti s kvadratom
njenih korisnika
40
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 44

28
SLIKA 3.3. Kontinuum vrijednosti informacije41

U prvoj fazi, podaci koji su jednostavno pohranjeni u raunalnu memoriju i


predstavljaju za tvrtku iskljuivo troak. Umjesto da predstavljaju iskoristivu imovinu
tvrtke, tj. aktivu, oni postaju obveza, dakle pasiva, odnosno, trokovi koje izazivaju
podaci vei od vrijednosti stvarnih ili potencijalnih informacija to se iz njih mogu
izvesti.

Prvi korak koji treba nainiti da bi se podaci transformirali iz poslovne pasive u aktivu
jest stvaranje uvjeta u kojima e im zaposlenici tvrtke moi pristupati izravno, tj. online
to predstavlja preduvjet za drugu fazu. U tu svrhu bit e potrebno izgraditi lokalnu
raunalnu mreu, koja se danas obino implementira kao intranet. Intranet je bilo kakva
unutarnja mrea raunala neke tvrtke koja funkcionira na nain slian i kompatibilan
Internetu. Valjat e takoer tono utvrditi i razgraniiti kojim podacima tko smije i treba
pristupati, kako ne bi dolo do nesporazuma, sukoba interesa, a moda ak i zloporaba.

U treoj fazi poduzee ini dostupnom poslovnu inteligenciju stvorenu na razini


pojedinane slube ostalim slubama ili odjelima. Poslovni korisnici sada mogu

41
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 45

29
razmatrati podatke s razliitih stajalita, odnosno iz raznih aspekata. Za njih e to
predstavljati novu vrijednost ili korist.

Svaka tvrtka interagira sa svojom okolinom, to vie to bolje po nju. Menaderi i


zaposlenici komuniciraju s klijentima, dobavljaima, poslovnim partnerima, organima
dravne vlasti, pa, u nekim situacijama, i s konkurencijom. Kontroliranom razmjenom
informacija s odabranim subjektima iz okoline poduzee moe dodatno obogaivati
svoju poslovnu inteligenciju. Poduzee se na taj nain proiruje, prerastajui u tzv.
ekstrapoduzee (Extraprise).

Koncept elektronikog poslovanja podrazumijeva intenzivnu primjenu informacijske i,


posebice, internetske tehnologije pri izvravanju svih kljunih poslovnih funkcija tvrtke.
Primjena tog suvremenog oblika poslovanja pogoduje stvaranju poslovne inteligencije.
Teoretski govorei, poslovna se inteligencija moe stvarati (to se povremeno i inilo) i
u uvjetima tradicionalnog poslovanja, ali uz puno vie potekoa, trokova i potrebnog
vremena te uz skromnije rezultate nego li je to sluaj onda kada se tvrtka usmjeri
konceptu e-poslovanja. Uz koritenje poslovne inteligencije kumulirane e-poslovanjem,
tvrtke se mogu posvetiti traenju novih poslovnih modela, naputajui postupno one
tradicionalne. U jednom takvom obeavajuem novom modelu tvrtke se usmjeravaju
pronalaenju informacija do kojih su same dole i njihovoj prodaji drugim
zainteresiranim poslovnim subjektima. Postupajui tako, one zapravo ulaze u onu
vrijednosnu zonu u kojoj informacije postaju roba kojom se trguje.

30
3.4. Primjene poslovne inteligencije
Mnoge velike i srednje tvrtke aktivno pristupaju pojmu poslovne inteligencije, razvijaju
i implementiraju takve sustave i koriste ih u svojem elektronikom poslovanju. Tvrtke
uspijevaju pretvarati informacije u poslovnu inteligenciju, poslovnu inteligenciju u
organizacijsko znanje a kolektivno organizacijsko znanje u poveani profit42.

Svakodnevno smo svjedoci raznih primjena koncepta poslovne inteligencije u raznim


podrujima djelatnosti. Obzirom je ovaj rad orijentiran na rudarenje podataka, ukratko
e biti izloen odnos sustava poslovne inteligencije i rudarenja podataka.

SLIKA 3.4. Model sustava poslovne inteligencija zasnovan na rudarenju podataka43

Model sustava poslovne inteligencije vezan je uz transakcijsku bazu podataka i vanjske


podatke prikupljene iz razliitih izvora. Posrednik izmeu trita i transakcijske baze
podataka te metoda koje generiraju pravila jest segment koji je zaduen za ienje i
skladitenje podataka. Podaci potom ulaze u dio modela koji je zaduen za generiranje
pravila, a u sebi ima integrirane spomenute metode koje mu to omoguuju (lista
postupaka). Sljedei segment modela jest modul koji pravila prilagouje formatu kojega
iziskuje konkretni ekspertni sustav. Tako su ona nakon upisa u bazu znanja spremna za
koritenje.

42
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 182
43
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 385

31
Vano je napomenuti da autonomnost ovakvog sustava (ovdje se prvenstveno misli na
segmente koji su zadueni za ienje i skladitenje podataka te segment koji generira
pravila primjenom neke od metoda) ovisi o uniformnosti problema koje treba rijeiti. Kod
standardiziranih problema, odnosno problema koje su ve ranije rjeavani, sustav ne treba
vanjsku intervenciju analitiara, nego je sam sposoban provesti ienje podataka i
selekciju metode ili niza metoda. Kod rjeavanja nekog novog problema, odnosno
generiranja nekog novog skupa pravila na osnovu spomenutih izvora, analitiar
"algoritmizira" postupak ienja podataka i selekciju metoda. Tako sustav postaje
sposoban generirati pravila.

Jednom sugerirano rjeenje za odreeni tip problema sustav usvaja. Prilikom narednog
zahtjeva, sustav pronalazi rjeenje u svojoj listi postupaka ako je takav tip problema ve
rjeavan te se vlada na osnovi njega. U protivnom trai sugestije analitiara.

Transparentnost sustava ovisi o uestalosti njegove analize prikupljenih podataka, to jest


o uestalosti osvjeavanja i administriranja injenica koje su generirane ovim modelom.

SLIKA 3.5. Dijagram tijeka manipulacije sustava tijekom postupaka44

Za razliku od medicinskih sustava koji svoju bazu injenica temelje gotovo iskljuivo na
"tvrdim pravilima", u sustavima poslovne inteligencije, ova metoda moe biti od izuzetne

44
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 386

32
koristi kod obrade "mekih pravila" koja su rezultat obrade nekom metodom umjetne
inteligencije odnosno rudarenja podataka.

O stupnjevima pouzdanosti koje zadaje analitiar ovisi ishod rezultata, odnosno


prihvaanje ili odbijanje neke tvrdnje.

3.5. Skladite podataka

3.5.1. Pojam skladita podataka


Skladite podataka ili spremite podataka (Data Warehouse) pripada viedimenzijskim
bazama podataka koje su izraene na osnovama dimenzijskog modela. Skladite
podataka je onaj oblik baze podataka kojem su svojstvena sljedea etiri obiljeja45:
usmjerenost predmetima (funkcionalnim podrujima)
sadrajna nepromjenjivost
integriranost
vezanost uz vrijeme (vremenska odreenost)

Ne ulazei dublje u razradu svih elemenata skladita podataka i njegove izgradnje, za to


upuujem na referentnu literaturu, izdvojio bih kao kljune vremensku dimenziju i
kvalitetno razraen pristup prema pravilima transformacije poslovnih, transakcijskih i
drugih podataka u skladite podataka.

Openito, skladite podataka je informacijska baza oblikovana da podupire analitike


zadatke znalaca. Poslovi znalaca (knowledgeworkers), osoba koje se bave znanjem i
njime se koriste u poslovnom procesu, temelje se na46:
pravilima poslovi izvjeivanja i monitoriranja obavljaju se pretraivanjem
podataka postavljajui upite i formalizirajui dobivene rezultate,
umjenosti poslovi analize i dijagnosticiranja obavljaju se pronalaenjem
informacija preteno interaktivnim putem postavljajui upite i analizirajui
dobivene rezultate,

45
Inmon, William H. "Building the data warehouse", Wiley,1992, str. 9-10.
46
Oreanin D. "Skriveni potencijali naih datoteka", http://www.skladistenje.com/jedan.asp?ID=182,
01.04.1998.

33
znanju poslovi planiranja i simulacije obavljaju se izradbom i izvravanjem
modela plana ili simulacije.

Openito govorei, dva su izvora podataka za skladite podataka. To su vanjski i


unutranji podaci47.

Unutranji podaci pripadaju poduzeu i generirani su putem transakcijskog sustava. Ti


podaci opisuju aktivnosti koje su se dogodile u poduzeu. U tipinom se poduzeu
moe prepoznati 30-40 transakcijskih aplikacija odnosno podsustava, kao to su
financijski podsustavi, logistiki podsustavi, podsustavi prodaje, podsustavi
proizvodnje, podsustavi praenja djelatnih resursa, podsustavi naplate, informacijski
podsustavi.

Vanjski podaci se pribavljaju izvan poduzea, najee posredstvom specijaliziranih


ustanova koje se bave prikupljanjem i distribucijom informacija. Vanjski su podaci od
kritine vanosti za strateke odluke jer pomou njih organizacija uoava povoljne
mogunosti kao i prijetnje. Razliite vrste vanjskih podataka mogue je npr. uvrstiti u
podatke konkurentnosti (proizvodi, usluge, promjene konkurentnih poduzea...),
ekonomske podatke (fluktuacija valuta, politiki indikatori, kretanja kamata, burzovni
podaci...), strukovne (tehnoloki trendovi, marketinki trendovi...), ekonometrijske
(prihodi pojedinih grupa, ponaanje kupaca...), psihometrijske (profiliranje kupaca...), i
marketinke podatke. Jedan od najvanijih ciljeva skladita podataka jest integrirati
vanjske i unutranje podatke. Vano je takoer razluiti koje odluke trebaju agregirane
podatke i kojeg stupnja. Stoga podaci mogu biti podrobni, agregirani te agregirani s
uzorcima podrobnih.

Za skladitenje podataka veinom se izrauje dimenzijski model za razliku od


transakcijskih sustava koji uvijek imaju model podataka temeljen na objektima i
njihovim odnosima. Dimenzijski model skladita podataka daje bolje mogunosti
vizualizacije podataka, to je s obzirom na namjenu skladita velika prednost. Upravo
mogunost lake vizualizacije podataka, koji su po svojoj prirodi apstraktni, jest klju
47
Oreanin D. "Skriveni potencijali naih datoteka", http://www.skladistenje.com/jedan.asp?ID=182,
01.04.1998.

34
razumijevanja i prihvaanja dimenzijskog modela podataka. U menaderskom govoru
"proizvode prodajemo na razliitim tritima, zanima nas prodaja u vremenu"
prepoznajemo dimenzije kroz koje se prati navedena poslovna pojava. Ljudima je
prirodno promatrati poslovne pojave kroz dimenzije. Ako se pojava prati u tri
dimenzije, rije je o kocki, a u vie dimenzija, o hiperkocki. Svakoj dimenziji kocke
pripada jedan parametar pojave, ovdje proizvod, trite i vrijeme. Svaka toka u kocki
ima tono odreene vrijednosti svake promatrane dimenzije, npr. broj prodanih
primjeraka proizvoda 00506 u sijenju 1997.

Modeli podataka transakcijskih sustava su, naprotiv, izgraeni na drugom naelu. Oni
prikazuju poslovne objekte i njihove meusobne odnose koji proizlaze iz poslovnog
procesa. Tablini modeli transakcijskih sustava prikladniji su za praenje odnosno
upravljanje poslovnim procesom, a dimenzijski modeli skladita podataka za
izvjetavanje o uincima poslovnog procesa.

Oba modela, dimenzijski i objektni, sposobna su prihvatiti i opisati isti skup podataka te
iz njih nainiti isti skup izvjea ili obaviti iste analize. Osnovna je razlika u prezentaciji
podataka. Dimenzijski model pristupa odozgo-dolje, jer je usmjeren na konano pitanje
na koje je menader traio odgovor, a objektni model pristupa odozdo-gore prikazujui
osnovne objekte potrebne pri upravljanju odnosno voenju poslovnog procesa.

Obzirom ovaj rad rezultate istraivanja bazira na jednom takvom, dvodimenzionalnom,


skladitu podataka koje je za potrebe rada dopunjeno eksternim podacima jedno od
ogranienja kvalitetnije poslovne primjene je razina detalja o poslovnim akcijama koja je
dostupna u skladitu. Kako je za kvalitetnu analizu potrebno imati vremenski
kontinuitet, svaka promjena na strukturi, ako ju je uope mogue implementirati,
zahtjeva odreen vremenski odmak prije kojeg moemo kvantificirati kvalitetu bilo
podataka bilo pretpostavke s kojom smo krenuli u istraivanje.

35
3.5.2. Skladite podataka i poslovna inteligencija
Poslovna se inteligencija izvodi iz podataka to nastaju tijekom redovitog poslovanja
tvrtke. No, kako je tih podataka puno, kako nastaju na razliitim mjestima i budui da se
unose u informacijski sustav putem razliitih ureaja i kanala, to ih u raunalnoj memoriji
treba organizirati na primjeren nain.

Za potrebe operativnog voenja poslovanja najprikladniji do danas razvijeni oblik


organiziranja podataka u informacijskom sustavu tvrtke su baze podataka. Osnovni je
zahtjev to se postavlja pred operativne baze podataka taj da one odraavaju stvarno,
najnovije stanje poslovnog sustava. Drugim rijeima, podaci u bazama podataka moraju
biti aurni, to znai da se stare vrijednosti podataka trebaju zamijeniti novima odmah,
odnosno to prije nakon zbivanja poslovnog dogaaja koji je uzrokovao promjenu.

Sa stajalita poslovne inteligencije transakcijske baze podataka nisu zadovoljavajue


rjeenje. Poslovna inteligencija se izvodi prvenstveno iz poznavanja vremenskog
redoslijeda zbivanja poslovnih dogaaja. Iz takve se povijesne perspektive nastoje izvesti
nova znanja i otkriti skrivene zakonitosti. Isto tako, proces odluivanja na temelju
informacija poslovne inteligencije nastoji se decentralizirati, kako bi u njemu moglo
sudjelovati to vie zainteresiranih i kompetentnih strunjaka48.

48
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 80

36
3.6. Izvoenje znanja iz podataka
Nakon to se u procesu rudarenja podataka otkrije niz korisnih pravila, ta je pravila
potrebno povezati i formalizirati, kako bi se otkrivena znanja mogla uspjeno i svrhovito
iskoristiti.

Izraz otkrivanje znanja u bazama podataka (KDD Knowledge Discovery in Databases)


skovan je na prvom KDD skupu 1989. da bi se naglasilo da je znanje konani proizvod
otkria nad podacima. Jedna od definicija otkrivanja znanja u podacima opisuje ga kao
netrivijalan proces identifikacije neospornih, novih, potencijalno korisnih, i konano,
razumljivih oblika (pattern) u podacima49.

Dva su osnovna naina koritenja znanja otkrivenog u procesu rudarenja podatka:50


prezentiranje znanja i otkrivenih pravila u obliku izvjetaja,
formaliziranje i skladitenje znanja u sustave zasnovane na pravilima (Rule Based
Systems, RBS)

Formaliziranje i skladitenje znanja odnosi se na onu vrstu pravila koja se mogu izraziti u
obliku AKO - ONDA. Postoje i hibridni sustavi, koji su osim pravila sposobni prihvatiti i
dinamike modele, poput Bayesovih i neuralnih mrea i slino.

Kada se radi o sustavima zasnovanim na pravilima, mogu se izdvojiti dva osnovna tipa
takvih sustava - tradicionalni ekspertni sustavi i sustavi zasnovani na neizrazitoj logici.
Rezultati istraivanja kao to je ovo predstavljeno u radu mogu se iskoristiti kao podloga
ili dopuna nekom od ovakvih sustava.

Jedan vaan cilj, zajedniki profesionalnim informatiarima, strunjacima i


istraivaima je omoguiti korisnicima uvid u podatke. Realizacija toga cilja postala je
osobito teak zadatak i izazov zbog eksplozivnoga rasta mnogih komercijalnih,
dravnih i znanstvenih baza podataka. Taj je rast daleko nadmaio nae mogunosti da

49
Oreanin D. "Otkrivanje znanja i kopanje podataka", http://www.skladistenje.com/jedan.asp?ID=204,
01.06.1998.
50
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 369

37
analiziramo, interpretiramo, razumijemo, vizualiziramo podatke te im damo neki
smisao. Nuno su potrebni alati i tehnike za automatiziranu i inteligentnu analizu.

Koraci u procesu otkrivanja znanja iz podataka su sljedei51:


1. identifikacija cilja (sa stajalita potroaa), razvoj razumijevanja o aplikacijskoj
domeni i odgovarajuem prethodnom znanju,
2. kreiranje ciljnog skupa(ova) podataka nad kojim e se provesti proces
otkrivanja; odabir baza, varijabli i uzoraka,
3. ienje i pretprocesiranje podataka,
4. redukcija i projekcije podataka: traenje korisnih svojstava za predstavljanje
podataka u ovisnosti od cilja rudarenja podataka,
5. uparivanje ciljeva s odreenom metodom za rudarenje podataka (npr. saimanje,
klasifikacija, regresija, klasteriranje, itd.),
6. istraivaka (exploratory) analiza, odabiranje metode i hipoteze,
7. rudarenje podataka: traenje zanimljivih oblika (pattern),
8. interpretacija oblika dobivenih rudarenjem, povratak na korake 1-7 i
vizualizacija.

Uporaba otkrivenoga znanja: izravnom primjenom, ukljuivanjem znanja u drugi sustav


za daljnje akcije ili jednostavnim dokumentiranjem i izvjeivanjem zainteresiranim
stranama. Taj proces ukljuuje i testiranje te rjeavanje moguih nesuglasica s
prethodno prihvaenim (ili iskopanim) znanjem. Gornji koraci se najuinkovitije
implementiraju u sklopu skladita podataka, budui da su podaci u skladitu ve isti,
integrirani i potpuni (koraci 2-4). Iako je kopanje podataka mogue provesti i bez
skladita podataka, ono znatno poveava izglede uspjeha kopanja podataka.
Konkurentska prednost je u brzom, fleksibilnom prepoznavanju oblika i analizi.

Kao ilustraciju iskoristit u jednostavan prikaz hipoteza za odreeni skup podataka koje
istraiva moe percipirati vizualizacijom.

51
Oreanin D. "Otkrivanje znanja i kopanje podataka", http://www.skladistenje.com/jedan.asp?ID=204,
01.06.1998.

38
SLIKA 3.6. Tri hipoteze za dani set podataka 52

Pravci interpretiraju potencijalna pravila na istom setu podataka. Voen odreenim


nainom razmiljanja istraiva moe krenuti u pogrenom smjeru stoga mora u svakom
trenutku biti svjestan opcija kojima moe krenuti te moguih pogreaka.

52
Kantardi M., "Data mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 4.1.

39
4. RUDARENJE PODATAKA

4.1. Pojam i znaenje


Pojam rudarenje podataka moe se definirati kao pronalaenje zakonitosti meu
podacima53. Podaci kao predmet prouavanja mogu biti sadrani u bazama podataka,
razni tekstualni podaci, nestrukturirani podaci ili podaci organizirani u vremenske serije.

Prednosti i ogranienja ove metodologije esto se iskrivljeno interpretiraju


prezentirajui potencijal kao rjeenje svih poslovnih problema ili rjeenja svih problema
suvremenog poslovanja54. injenice pokazuju da se primjenom metoda i alata za
rudarenje podataka mogu otkriti ponekad iznenaujui obrasci ponaanja nekih osoba ili
neoekivani odnosi meu pojavama, no to nije razlog da se jasno ne izraze ogranienja
odnosno preuveliavaju mogunosti ovih tehnika.

Jedna od definicija rudarenja podataka glasi55: rudarenje podataka je sustavan,


interaktivan i iterativan (ponavljajui) proces izvoenja i prikazivanja korisnoga,
implicitnog i inovativnog znanja iz podataka.

Vano je uz definiciju spomenuti da uspjenost primjene metoda i alata ove namjene


ovisi prvenstveno o strunosti i poslovnoj kompetenciji onih koji tumae dobivene
rezultate. Upravo te osobe svojim znanjem i iskustvom mogu biti sposobne neki
naizgled besmislen uzorak interpretirati na poslovno korektan i smislen nain i
pretvoriti ga u vrijednu informaciju.

Dva su glavna tipa rudarenja podataka56:


verifikacija hipoteze cilj je provjeriti da li je neka ideja ili dojam o vanosti
odnosa meu odreenim podacima utemeljen ili ne;

53
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 247
54
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 235
55
http://www.webopedia.com/totd.asp
56
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 235

40
otkrivanje novih znanja meu nekim pojavama mogu postojati neki jo
nepoznati a statistiki vani odnosi koje ovjek ni iskustvom niti svojim
intelektualnim sposobnostima ne moe dokuiti

RUDARENJE PODATAKA

VERIFIKACIJA HIPOTEZA OTKRIVANJE ZNANJA

SQL Upitni alati Opisivanje Prognoziranje

Klasifikacija Statistika
regresija

Vizualizacija
Stabla
odluivanja
"Grozdovi"
Izvoenje
Asocijacija pravila

Saimanje Neuralne mree

SLIKA 4.1. Taksonomija rudarenja podataka 57

Rudarenje podataka je izrazito multidisciplinarno podruje. Ono obuhvaa podruja


baza podataka, ekspertnih sustava, teorije informacija, statistike, matematike, logike te
itav niz pridruenih podruja. Podruja u kojima se rudarenje podataka moe uspjeno
primjenjivati su raznolika, primjerice, poslovanje poduzea, ekonomija, mehanika,
medicina, genetika itd. Openito gledajui, rudarenje podataka primjenjivo je u svim
onim podrujima gdje se raspolae velikom masom podataka na osnovu kojih se ele
otkriti odreene pravilnosti, veze i zakonitosti.

Obzirom da postoji itav niz imbenika koji mogu utjecati na ishod nekog dogaaja,
zadatak je rudarenja podataka otkriti najznaajnije meu njima i njihove karakteristike s
obzirom na ciljana stanja. Bez obzira na podruje primjene dobro iskoritene metode
rudarenja podataka sposobne su otkriti zakonitosti iz velike mase podataka pri emu

57
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 238

41
podruje primjene ostaje u drugom planu to zapravo jest snaga primjene metoda
rudarenja podataka naglasak je na podacima a ne na podruju provoenja analiza.

Izraz rudarenje podataka (DM Data Mining) odnosi se ili na itav proces otkrivanja
znanja ili ue, na specifinu fazu "strojnog uenja". Razni dobavljai DM tehnologija
daju razne interpretacije toga termina. SAS Institut, vodei u podruju tehnologija za
rudarenje podataka (posebno statistikih) jo od 1972., rudarenje podataka odreuje kao
napredne metode za istraivanje i modeliranje veza u velikim koliinama podataka.
Meu osnovnim tehnologijama za rudarenje podataka su statistika, sistemi bazirani na
pravilima, neuralne mree, strojno uenje, umjetna inteligencija, upravljanje bazama
podataka, itd. Ipak, svi se slau da je analitika statistika jezgra tih novih procesa za
otkrivanje znanja. Iz statistike perspektive, rudarenje podataka se moe opisati kao
raunalski automatizirana istraivaka analiza podataka iz (obino) velikih i sloenih
baza podataka s razliitih platformi, lokacija, operacijskih sistema i softvera58.

Poslovni procesi i znanstveni instrumenti mogu lako generirati terabyte podataka. Brzo
se iri jaz izmeu mogunosti prikupljanja podataka i sposobnosti analize podataka
kako u biznisu, tako i u znanosti. Rudarenje podataka najkorisnije je tamo gdje je stalno
prisutna prijetnja poplave informacijama.

Rudarenje podataka osobito je vano kod sustava s velikom koliinom podataka, u


kojima je mogue pronai injenice za koje nismo znali da postoje. Rudarenjem je
mogue utvrditi sljedee vrste informacija:
klase, postupkom klasificiranja prema unaprijed definiranim klasama,
klastere odnosno kategorije, postupkom klasificiranja bez unaprijed zadanih
klasa,
asocijacije, koje su uvjetovane dogaajima (npr. kupci koji kupuju proizvod A u
65% sluajeva kupuju i proizvod B),
sekvence, koje ustanovljuju dogaaje koji u odreenoj vjerojatnosti slijede jedan
za drugim,
prognoze, kojima se prognozira budunost iz postojeih podataka.
58
Oreanin D. "Otkrivanje znanja i kopanje podataka", http://www.skladistenje.com/jedan.asp?ID=204,
01.06.1998.

42
Pronaene pojave u podacima, kao pronaeno znanje, treba prikazati na prikladan
grafiki nain. Zato je vana vizualizacija podataka. Tehnikama klaster analize npr.
dobivaju se brojani podaci korelacije ili mjera udaljenosti. Ljudsko e oko mnogo bre
i preciznije prepoznati klastere ako su rezultati prikazani grafiki umjesto brojano, a
razumijevanje uoene pojave bit e bolje.

4.2. Metode i alati za rudarenje podataka


Metode i alati koriteni u raznim fazama razvitka koncepta rudarenja podataka
uglavnom su bili izvedeni iz metoda statistike analize. Nova su se znanja rudarenjem
podataka otkrivala uglavnom analizom59:
distribucije vrijednosti podataka
odnosa meu podacima

Analiza distribucije vrijednosti podataka jedna je od temeljnih statistikih metoda.


Poznate su dvije inaice te analize, ovisno o tome koriste li se opisni (desktiptivni) ili
brojani (numeriki) podaci.

Jednostavna analiza distribucije na temelju opisnih podataka dijelit e podatke prema


npr. spolu, zemljopisnim podrujima, preferencijama itd. Analiza opisnih podataka
najee rezultira distribucijom zasnovanom na apsolutnoj vrijednosti podataka.

Analiza distribucije temeljene na brojanim podacima najee se naziva jednostavnom


statistikom jer dobiveni rezultati predstavljaju neke dobro poznate statistike
pokazatelje (aritmetike sredine, standardne devijacije, varijance itd).

Analiza odnosa meu podacima moe takoer biti opisna ili brojana. Obzirom se
istrauju odnosi najmanje dvaju pojava, metodoloku osnovicu ove vrste analize ine
odreene viedimenzionalne ili matrine metode.

Postoji odreen broj tzv. glavnih i opeprihvaenih metoda no isto tako postoji itav niz
metoda iz ostalih podruja koje se ne mogu svrstati u neku kategoriju. Pojedine metode

59
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 237

43
konstruirane su uz pomo elementa linearne algebre, teorije informacija, matematike i
drugih podruja.

Od mnogih metoda za rudarenje podataka koje se preporuuju u literaturi, zapravo samo


je nekoliko temeljnih tehnika: klasteriranje, klasifikacija, regresija, itd., ali i mnotvo
razliitih algoritama (za svaku od tih tehnika) trenutano ponuenih u statistici,
strojnom uenju i prepoznavanju oblika. Veina alata koji se danas rabe za kopanje
podataka mogu se svrstati u jednu od sljedeih skupina:
klasine metode za multivarijantnu analizu podataka i statistiku (klaster analiza,
diskriminativna analiza, logistina regresija, linearna i nelinearna regresija,
metoda glavnih komponenata, analiza vremenskih serija, itd.),
metode grananja (tree-based methods) klasifikacijska i regresijska stabla
(CART), hi-kvadrat automatska detekcija interakcija (CHAID),
neuralne mree.

S obzirom na funkciju, alati za rudarenje podataka mogu se klasificirati na sljedei


nain:
klasifikacija: klasificira podatak (entitet) u jednu od nekoliko prethodno
definiranih klasa (diskriminativna analiza, logistina regresija, metode grananja,
neuralne mree),
regresija: uspostavljanje relacija uz pomo prediktorskih varijabli (linearna i
nelinearna regresija, logistina regresija, itd),
klasteriranje: klasificiranje podataka (entiteta) u jednu od nekoliko klasa
(klastera), pri emu se klase moraju odrediti iz podataka - za razliku od
klasifikacije, kod koje su klase prethodno definirane (klaster analiza, metoda
glavnih komponenata, i dr.),
saimanje, ukljuujui vizualizaciju i istraivaku analizu podataka,
modeliranje ovisnosti (kauzalni modeli, faktorska analiza),
asocijacije (analiza trine koarice),
sekvencijalna analiza (analiza vremenskih serija), itd.

44
Da li e proces kopanja podataka biti promaaj ili uspjeh ovisi o vie imbenika, kao to
su prethodno znanje o podruju te raspoloivost i odabir alata za kopanje podataka,
kvaliteta podataka, dobra interakcija izmeu lanova projektnog tima, kvaliteta skladita
podataka, jasnoa misije i cilja kopanja podataka, prikaz rezultata na jednostavan i
pravilan nain, itd.

U ovom radu detaljnije e biti opisane neke od metoda za koje se oekuje da doprinesu
ciljevima istraivanja. Kvalitetno istraivanje podataka metodama rudarenja
podrazumijeva irok raspon znanja analitiara te poznavanje pojedinosti svake pojedine
metode. Razlog ovome je nunost pripreme podataka za pojedinu analizu pri emu je
poznavanje metode od kljune vanosti.

4.2.1. ienje i pretprocesiranje podataka


Uspjenost rudarenja podataka odreena je kvalitetom podataka koji se analiziraju.
Iskustva pokazuju da analitiar obino i do 80% vremena potroi na istei i
pretprocesirajui podatke da bi tek 20% vremena primjenjivao metode na tako
pripremljnim podacima60.

Jedna od glavnih prednosti sustava poslovne inteligencije oituje se u koritenju skladita


podataka kao izvora podataka za analize, to analitiaru znatno tedi vrijeme. No,
analitiar ponekad ipak mora izravno pristupiti izvornoj bazi podataka - ako neki
podatak ne postoji u skladitu podataka, ili ako se ne pojavljuje na zadovoljavajuem
stupnju granulacije.

Podaci u izvornom obliku mogu biti nekompletni, atributi mogu imati nedostajue
vrijednosti, ili moe postojati nedostatak atributa. Isto tako moe se pojaviti
nekonzistentnost unutar samih podataka, primjerice nedosljednost u oznaavanju
pojedinih kategorija ili grupa.

60
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 252.

45
Govorei o pretprocesiranju podataka, moemo izdvojiti najznaajnije metodoloke
postupke pretprocesiranja u koje ubrajamo61:
pronalaenje ekstremnih vrijednosti
dijagnostika nedostajuih vrijednosti i predvianje nedostajuih vrijednosti
povezivanje relacijskih kljueva iz razliitih izvora podataka
postizanje jednoobraznosti (konzistentnosti) u podacima
uzorkovanje
kategorizacija vrijednosti atributa
formiranje izvedenih atributa (Binning)
grupiranje (saimanje podataka)
normiranje podataka

Iz navedenog jasno proizlazi da je ienje, procjena kvalitete i pretprocesiranje najzahtjevniji


dio istraivanja. Uz ove uvodne naznake, aktivnosti primijenjene u ovom radu opisane su u
odjeljku koje se bavi primjenama metoda rudarenja podataka.

4.2.2. Analiza relevantnosti atributa


Nakon pretprocesiranja podataka, analitiar se uvijek pita je li izabrao ispravan skup
atributa koji jednoznano opisuju problematiku koju treba razrijeiti, jesu li vrijednosti tih
atributa adekvatno grupirane, te je li opravdano vriti analizu nad izabranim stupnjem
granulacije podataka.

Jedna od vrlo jednostavnih mjera koja nam moe pruiti informacije o korelacijskoj
zavisnosti izmeu dviju varijabli je koeficijent korelacije koji se rauna na temelju
formule62:

rx , y =
( x x )( y y )
(n 1) x y

Pri emu je:


rx,y koeficijent korelacije
n broj promatranih sluajeva u populaciji
x,y nizovi vrijednosti
61
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 252
62
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 261

46
x,y srednje vrijednosti x i y
x , y su standardne devijacije nizova vrijednosti x i y
Zakljuci koji se mogu izvui su sljedei:
ako je vrijednost koeficijenta korelacije vea od 0, tada su nizovi vrijednosti
pozitivno korelirani,
ako je vrijednost koeficijenta korelacije manja od nule, tada su vrijednosti nizova
negativno korelirani,
ako je vrijednost koeficijenta korelacije jednaka 0, tada ne postoji korelacijska
meuzavisnost.

Ova mjera moe biti korisna kada se, primjerice, eli vidjeti ima li neka varijabla
pozitivan, negativan ili neutralan smjer korelacije s obzirom na ciljnu varijablu.

Analiza relevantnosti atributa, izmeu ostalog, utjee i na kontrolu "kombinatorne


eksplozije", jer ona analitiaru sugerira "slabe" atribute, to moe rezultirati njihovim
neuvrtavanjima u daljnje procese analize. U ovom radu koritena je analiza putem Gini
indeksa koji pokazuje vjerojatnost da e dva novoizabrana elementa iz uzorka biti
razliite kategorije. Alati kojima se izrauju spomenute analize najee prikazuju vie
razliitih pokazatelja (Prilog 3) dok neki autori upuuju na koritenje pojedinih metoda
rudarenja podataka u iste svrhe (npr. stabla odluivanja).

Od popularnijih pokazatelja valja spomenuti:


information gain mjeri oekivan pad entropije,
gain ratio uveden kao pokuaj da se sprijee skokovi vrijednosti atributa sa vie
vrijednosti. Rauna se ka o information gain podijeljen entropijom vrijednosti
atributa,
gini index koriten u analizi u ovom radu, interpretira se kao vjerojatnost da
dva nasumino odabrana primjera pripadaju razliitom razredu.

47
4.2.3. Problemi "kombinatorne eksplozije"
Ranije u radu navedeno je kako problem raznih atributa koji opisuju tekstilne proizvode
pri zahtjevima za praenjem svih detalja, vrlo brzo od nekoliko jednostavnih artikala
dovede do velikog broj artikala koje treba ispravno evidentirati.

Razne tehnike omoguuju da se podaci proiste i grupiraju, kombiniraju za odreene


vrste metoda rudarenja podataka. Povran pristup ovom problemu moe rezultirati
nemogunou provoenja istraivanja odnosno odreeni proces analize moe se
protegnuti preko vremenski smislene granice. Problematika kombinatorne eksplozije
esto se neopravdano zaobilazi kao predmet koji ne iziskuje paljivije razmatranje. No,
ona je posebice nezaobilazna kada samostalno kreiramo vlastita algoritamska rjeenja iz
domene rudarenja podataka, a gdje se zahtijeva manipulacija kombinacijama atributa i
njihovih vrijednosti. Iako rast procesorske snage danas omoguuje sve sloenije
operacije, jo uvijek je potrebno poseban naglasak dati na ovaj problem.

4.2.3. Vizualizacija podataka


Jedno od dostupnih objanjenja pojma vizualizacija jest "mentalna slika". U tehnikom
smislu vizualizacija se bavi prikazivanjem ponaanja odnosno stanja, posebno u
kompleksnim uvjetima, na nain razumljiv ljudskom oku.

Jedna od vrlo popularnih metoda upoznavanja s podacima pa i jednostavnijih analiza


podataka je vizualizacija. Vizualizaciju podataka moemo promatrati iz nekoliko osnovnih
aspekta63:
vizualizacija segmenta neoienih podataka,
vizualizacija oienih podataka,
vizualizacija pretprocesiranih podataka.

U osnovi, cilj je uoiti pravilnosti ili anomalije, ovisno o tome to elimo vizualizacijom
postii, u svrhu poveanja kvalitete istraivanja.

63
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 271

48
SLIKA 4.2. Primjer primjene vizualizacije za unapreenje procesa klasteriranja64

Vizualizacijske tehnike mogu se klasificirati na razne naine. Openito, vizualizacija se


upotrebljava za65:
pretraivanje podataka,
potvrivanje odreene hipoteze,
manipulaciju pogledom na podatke.

4.3. Bayesove mree


U proteklih nekoliko godina metode razluivanja temeljene na vjerojatnosti postaju sve
zanimljivije irem krugu istraivaa. Na alost, zbog svoje prirode sloenost procesa
izgradnje modela prepreka je eem koritenju. Osnovni koncept Bayesovih mrea
poiva na uvjetnoj vjerojatnosti. Uvjetnu se vjerojatnost definira kao66:
P(a\b) = m
to se moe interpretirati kao "Vjerojatnost dogaaja a iznosi m uz dani uvjet b".

Uvjetna vjerojatnost reducira polje sluajnih dogaaja, te donosi dodatnu informaciju


reducirajui pri tome stupanj neizvjesnosti ishoda dogaaja.

64
Kantardi M. "Data Mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 12.
65
Kantardi M. "Data Mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 12.
66
http://www.ai.mit.edu/~murphyk/Bayes/bnintro.html, 10.10.2004.

49
SLIKA 4.3. Jednostavan grafiki prikaz Bayesove mree 67

Ovakvi grafiki sustavi pogodni su modeli za automatizirani razluivanje pod nepotpuno


ureenim uvjetima.

Temeljno pravilo vjerojatnosti dogaaja a i b glasi:


P(a|b)P(b) = P(a,b)
Ako se dogaaji a i b promatraju u kontekstu dogaaja c, to se moe izraziti kao:
P(a|b,c)P(b|c) = P(a,b|c)
Na osnovu temeljnog pravila proizlazi:
P(a|b)P(b) = P(b|a)P(a)
iz ega se izvodi Bayesova formula:
P(a | b) P(b)
P (b | a) =
P(a)
odnosno gledajui u svjetlu dogaaja c:
P(a | b, c) P(b | c)
P(b | a, c) =
P (a | c)

Za sloeniji prikaz Bayesove mree potrebno je definirati distribuciju uvjetne


vjerojatnosti (Conditional Probability Distribution CPD) za svaku toku. Ako su
vrijednost varijabli diskretne mogu se prikazati tablicom koja prikazuje vjerojatnosti da
slijedea toka niza preuzima svaku od kombinacija vrijednosti roditelja, prethodnika.

67
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 311

50
Iz navedene ilustracije moemo raspraviti da izraz "trava je vlana" (W=true/istina) ima
dva mogua uzroka: ili je prskalica ukljuena (S=true/istina) ili kii (R=true/istina).
Snaga odnosa dana je u pripadajuim tablicama pa tako vjerojatnost da je trava vlana
(W=istina) pri injenici da radi prskalica (S=istina) i kii (R= istina) iznosi 0.99 ili 99%.

Bayesove mree predstavljene su tzv. usmjerenim aciklikim grafovima (kao prikazani


na ilustracijama). Jedna od karakteristika ovakvog pristupa jest to potpuna specifikacija
distribucije vjerojatnosti sadri znatno manje vrijednosti. Za etiri varijable potpuna
distribucija sadravala bi (2n-1) tj. petnaest vrijednosti za sve kombinacije. Spomenuti
sluaj s vlanom travom sadri ih devet. Za vei broj elemenata mree znaaj ovakvog
pristupa postaje jo vei.

SLIKA 4.4. Grafiki prikaz Bayesove mree i tablica uvjetne vjerojatnosti 68

68
***, "A Brief Introduction to Graphical Models and Bayesian Networks",
http://www.cs.berkeley.edu/~murphyk/Bayes/bayes.html, 02.11.2004.

51
4.3.1. Veze meu elementima
Elementi mree prikazani su kao ovisni o slijedu koji je naznaen strelicama, pri emu
smjer strelice odreuje smjer odnosa a vjerojatnosti se primjenjuju ovisno o vezama
koje mogu biti linearne, konvergentne ili divergentne kako je prikazano na slici 4.5.

A
A C B

B A C
C

SLIKA 4.5. Tri vrste veza meu elementima mree 69

Vezama se zapravo unaprijed navodi na ovisnosti koje su definirane kao znaajne ili
ovisne pri izgradnji modela. Elementi mree putem vjerojatnosti prenose informacije,
pri emu se mogua rjeenja generiraju kao aproksimativne vrijednosti. Ovaj pristup,
ovisno o mrei, omoguava vie puteva do istog rjeenja uz mogunost evaluiranja
rezultata tijekom analize. Time nam se prua mogunost rjeavanja problema na nain
koji ne mora nuno pratiti eksponencijalni rast pravila porastom kompleksnosti modela
kao to je sluaj pri tradicionalnim metodama.

Osnova za odreivanje uvjetnih vjerojatnosti jest strukturno uenje, odnosno, do


navedenih vrijednosti dolazi se uenjem putem algoritama razvijenih u tu svrhu. Alat
Hugin koji je koriten u ovom radu koristi tzv. NPC algoritam, unaprijeenu inaicu PC
algoritma koji pak slian IC algoritmu. Za detalje o svakom od njih upuujem na
referentnu literaturu dok u ovdje izloiti osnove potrebne za razumijevanje primjenje
tehnike. Hugin prihvaa podatke u obliku tablice te, uz odabir osnovnih kriterija,
omoguuje formiranje mreu putem arobnjaka (wizard).
69
Charniak E. "Bayesian Networks Without Tears", http://www.aaai.org, 02.11.2004.

52
PC algoritam se sastoji od sljedeih koraka:
testira nezavisnost izmeu svakog para varijabli,
kreira kostur mree putem pronaenih zavisno-nezavisnih veza,
odreuje kolizije,
odreuje smjerove ovisnosti.

U ovom radu za izradu mrea koriten je NPC algoritam koji se razlikuje u tome to pri
formiranju veza mora biti definiran tzv. neophodni put to implicira mogunost vie
poveznica meu varijablama. Svaka poveznica koja zadovolji kriterij ispravnosti se
usvaja.

4.3.2. Primjena Bayesovih mrea


Bayesove mree imaju vrlo irok raspon primjene u sustavima poslovne inteligencije.
Njihova glavna karakteristika odnosi se na sposobnost uenja, temeljenog na
probabilistici, direktno iz uzoraka podataka. Analitiar je prvenstveno zaduen za
kreiranje transparentnog modela, koji e obuhvatiti sve relevantne atribute i njihove
odnose, potujui uzrono-posljedine veze meu zadanim atributima. Vrlo efikasna
primjena je u interpretaciji znanja i odnosa, no model moe biti vrlo sloen za
postavljanje. Radovi na ovom podruju koji prouavaju aspekt primjene sve vie se
okreu automatiziranim alatima za konstrukciju modela na podacima specifinog
podruja na kojima analitiar moe dalje raditi.

Bayesove se mree mogu promatrati u svjetlu ekspertnih sustava, i to onih ekspertnih


sustava zasnovanih na probabilistikoj teoriji. Ono to je svojstveno svim modelima
zasnovanim na Bayesovim mreama, jest mogunost procjene vjerojatnosti ak i onda
kada neke informacije nedostaju, primjerice one o inicijatoru teta. to je vie
informacija, to je procjena pouzdanija, no u sluaju nepostojanja odreene informacije,
model je ipak sposoban predviati vjerojatnosti.

Bayesove mree mogu se uspjeno primijeniti u70:

70
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 313

53
medicini (dijagnostika bolesti kao to su bolesti miia i ivaca, respiratorne
bolesti i slino),
razvoju softvera (traenje pogreaka u programu, programi za dijagnostiku
problema kod eksternih jedinica kao to su pisai, programiranje pomoi u
programima),
proizvodnji (praenje proizvodnih procesa, te sugestije za optimizaciju i
izbjegavanje kvarova u sustavima),
ekonomiji (procjena kreditnih rizika, segmentacija trita, analiza rizika openito,
ponaanje klijenata),
vojnom sektoru (planiranje operacija, planiranje logistikih aktivnosti),
poljoprivredi i stoarstvu (selekcija i uzgoj bilja i ivotinja, planiranje
bakterioloke zatite),
farmaciji (istraivanje lijekova, istraivanje pojedinih sastojaka i njihovih
kombinacija kod otkrivanja novih vrsta lijekova za odreene tipove bolesti).

Ovaj rad pokazat e primjenu Bayesovih mrea u analizi podataka o prodaji tekstilnih
proizvoda.

Potekoe pri izgradnji ovakvih modela sastoje se u njihovoj sloenosti i potrebnom


predznanju. Danas na tritu postoji nekoliko alata kojima je mogue djelomino
nadomjestiti poetno neiskustvo.

4.4. Stabla odluivanja71


Stabla odluivanja vrlo su mone i popularne tehnike modeliranja za klasifikacijske i
predikcijske probleme. Privlanost stabla odluivanja lei u injenici da, u odnosu na
npr. neuralne mree, nude modela podataka u "itljivom", razumljivom obliku - ustvari
u obliku pravila. Ta pravila se lako mogu direktno interpretirati obinim jezikom, ili pak
koristiti u nekom od jezika za rad s bazama podataka (SQL), tako da se odreeni
primjeri iz baze mogu izdvojiti koritenjem pravila generiranih stablom odluivanja.

71
Data Mining Server, http://dms.irb.hr/, 10.10.2004.

54
Za neke je probleme od kljune vanosti samo tonost klasifikacije ili predikcije
modela. U takvim sluajevima itljivost modela nije od presudne vanosti. U drugim
situacijama upravo je sposobnost interpretiranja modela "ljudskim" jezikom od kljune
vanosti. U marketingu potrebno je npr. dobro opisati razliite segmente populacije
kupaca za marketinke strunjake kako bi oni mogli organizirati uinkovitu kampanju
radi poveanja prometa odreenih proizvoda. Generirani modeli moraju biti itljivi za
eksperte iz domene problema i oni moraju prepoznati i odobriti primjenu znanja
sadranog u novim modelima. Postoji itav niz razliitih algoritama za konstruiranje
stabla odluivanja koji sadre osnovne kvalitete ove tehnike a meu najpoznatijima su
ID3, c4.5, CHAID itd.

4.4.1. Pojam stabla odluivanja


Stablo odluivanja jest klasifikacijski algoritam u formi stablaste strukture, u kojoj se
razlikuju dva tipa vorova povezanih granama:
krajnji vor (leaf node) - kojim zavrava odreena grana stabla. Krajnji vorovi
definiraju klasu kojoj pripadaju primjeri koji zadovoljavaju uvjete na toj grani
stabla,
vor odluke (decision node) - ovaj vor definira odreeni uvjet u obliku
vrijednosti odreenog atributa (varijable), iz kojeg izlaze grane koje
zadovoljavaju odreene vrijednosti tog atributa.

Osnovni preduvjeti za koritenje tehnike stabla odluivanja su:


opis u obliku parova vrijednosti atributa - podaci o primjeru moraju biti opisani
u obliku konanog broja atributa,
prethodno definiran konaan broj klasa (vrijednosti ciljnog atributa) - kategorije
kojima primjeri pripadaju moraju biti definirane unaprijed i treba ih biti konaan
broj,
klase moraju biti diskretne - svaki primjer mora pripadati samo jednoj od
postojeih klasa, kojih mora biti znatno manje negoli broja primjera,
znaajan broj primjera - obino je poeljno da u skupu primjera za generiranje
stabla odluivanja postoji barem nekoliko stotina primjera.

55
Slika 4.6. Primjer jednostavnog stabla odluivanja72

72
Data Mining Server, http://dms.irb.hr/, 10.10.2004.

56
4.4.2. Proces stvaranja stabla odluivanja
Veina postojeih algoritama stabla odluivanja su varijacije osnovnog algoritma koji
posjeduje jednostavne karakteristike greedy, top-down metode pretraivanja prostora
rjeenja.

ID3 algoritam razvio je J. Ross Quinlan. Algoritam je baziran na tzv. Concept Learning
System (CLS) algoritmu.

funkcija ID3
Input: (R: skup nezavisnih atributa,
C: ciljni(zavisni) atribut,
S: skup primjera za uenje)
kao rezultat daje stablo odluivanja;

poni

Ako je S prazan, napravi jedan vor s vrijednou Pogreno;


Ako se S sastoji od primjera s istom vrijednou ciljnog atributa, napravi jedan krajnji vor s
tom vrijednosti ciljnog atributa;

Ako je R prazan, tada napravi jedan (krajnji) vor s vrijednosti koja je najea za ciljni atribut
za skup S; (u tom sluaju stablo e vjerojatno raditi i pogrene klasifikacije na skupu S, u mjeri u
kojoj su zastupljeni primjeri ostalih klasa);

Neka je A atribut s najveom vrijednosti Gain(A,S) izmedju svih atributa u R;


Neka su {aj| j=1,2, .., m} vrijednosti atributa A;
Neka su {Sj| j=1,2, .., m} podskupovi S koji se sastoje od primjera koji imaju aj za atribut A;
Napravi stablo s korijenom oznaenim A, te granama a1, a2, ..., am koja vode na stabla
(ID3(R-{A}, C, S1), ID3(R-{A}, C, S2), .....,ID3(R-{A}, C, Sm);

Rekurzivno primjeni ID3 to na podskupove {Sj| j=1,2, .., m} sve dok oni nisu prazni;

kraj

Slika 4.7. ID3 algoritam73

73
Data Mining Server, http://dms.irb.hr/, 10.10.2004.

57
ID3 pretrauje preko atributa svih primjera u skupu podataka, te nalazi atribut koji
najbolje odvaja primjere odreene klase. Ukoliko atribut savreno razdvaja klase ID3
algoritam se zaustavlja; inae se rekurzivno izvrava na m podskupova (gdje m
oznaava broj moguih vrijednosti atributa), traei "najbolje" atribute za njihovo
razdvajanje. Algoritam koristi greedy pristup, t.j. trai trenutno najbolji atribut i nikad
ne "gleda" unatrag, da bi provjerio ispravnost prethodnih izbora, odnosno razdvajanja.
Treba imati na umu da ID3 moe generirati stabla koja rade i pogrene klasifikacije na
skupu primjera za uenje.

Centralni dio algoritma jest selekcija atributa za stvaranje vora odluivanja, t.j. atributa
koji e posluiti za razdvajanje odreene grane stabla. Za selekciju atributa s
najheterogenijom strukturom vrijednosti ciljnog atributa, algoritam koristi koncept
entropije.

4.4.3. Odabir atributa kao najboljeg klasifikatora


Kriterij kvalitete u algoritmu stabla odluivanja vezan je uz selekciju atributa koji e
posluiti kao kriterij za razdvajanje primjera u odreenom voru odluivanja stabla. Cilj
je odabrati atribut koji je najupotrebljiviji s obzirom na osnovni cilj, klasifikaciju
primjera. Dobra kvantitativna mjera vrijednosti atributa u tom smislu je statistika
vrijednost nazvana informacijski dobitak (information gain), kojom se mjeri kako dobro
dani atribut razdvaja primjere prema njihovoj klasifikaciji. Ova se mjera koristi da bi se
odabrao najbolji kandidat (atribut) u svakom novom koraku stvaranja stabla
odluivanja.

Da bi se precizno definirao informacijski dobitak, potrebno je definirati mjeru, koja se


esto koristi u teoriji informacija, a naziva se entropija. Entropija karakterizira "istou
nekog skupa primjera. Uz zadan skup S, koji u ovom primjeru, jednostavnosti radi,
sadri samo dvije klase, pozitivne i negativne primjere, entropija ove binarne
klasifikacije je definirana slijedeim izrazom:
entropija(S) = - pp log2 pp pn log2 pn
gdje pp oznaava proporciju (postotak) pozitivnih primjera u S, a pn proporciju
negativnih primjera u skupu S. U svim proraunima entropije pretpostavlja se da vrijedi
0log0=0.

58
Jedna od interpretacija entropije iz teorije informacija jest da ona specificira minimalni
broj bitova informacije potreban da se kodira klasifikacija bilo kojeg lana skupa S (t.j.
ako se primjer iz skupa S sluajno odabere).

Ukoliko ciljni atribut poprima vie od dvije vrijednosti, npr. c razliitih vrijednosti, tada
je entropija skupa S u odnosu na takvu klasifikaciju definirana sa:
c
entropija ( S ) = pi log 2 pi
i =1

gdje je pi proporcija klase i u skupu S. Treba primijetiti da ako ciljni atribut poprima c
razliitih vrijednosti, maksimalna entropija iznosi log2c.

Uz danu entropiju kao mjeru "neistoe" u skupu primjera, sada moemo definirati
mjeru efektivnosti atributa u klasificiranju primjera. Ta mjera, informacijski dobitak,
predstavlja oekivanu redukciju entropije uzrokovanu razdvajanjem primjera na osnovu
tog atributa. Tonije, informacijski dobitak, gain(S,A), atributa A, u odnosu na skup
primjera S, definiran je kao:
| Sv |
dobitak ( S , A) = entropija ( S )
v vrijednost ( A ) | S |
entropija ( S v )

gdje je vrijednost(A)skup svih moguih vrijednosti atributa A, a Sv podskup od S, za


koji atribut A ima vrijednost v (t.j., Sv = {s 0 S | A(s) = v}). Prvi lan u jednadbi za
dobitak je entropija originalnog skupa S dok je drugi lan oekivana vrijednost entropije
nakon to je S razdvojen koritenjem atributa A. Oekivana entropija opisana drugim
lanom jednostavno je zbroj entropija podskupova Sv, s teinom proporcionalnom dijelu
primjera |Sv| / |S| koji pripadaju Sv. Dobitak(S,A) je dakle oekivana redukcija entropije
uzrokovana poznavanjem vrijednosti atributa A. Ili, na drugi nain, dobitak(S,A) je
informacija o vrijednosti ciljnog atributa, uz poznate vrijednosti atributa A.
Proces odabira novog atributa i razdvajanja primjera, ponavlja se za svaki vor
odluivanja, uz to da se koriste samo oni primjeri koji pripadaju tom voru. Pri tom su
svi atributi koriteni prije tog vora a u istoj grani stabla, iskljueni iz daljnjeg odabira,

59
to znai da se mogu pojaviti samo jednom na odreenoj grani stabla. Ovaj se proces
nastavlja sve dok na odreenom voru nije zadovoljen jedan od dva kriterija:
svi atributi su ve bili koriteni u toj grani stabla, ili
svi primjeri koji pripadaju tom voru imaju istu klasu - prema tome radi se o
krajnjem voru grane (entropija primjera jednaka je nuli).

U radu je koriten CHAID (Chi-Square Automatic Interaction Detection) algoritam za


grananje stabla odluivanja. Radi se o istraivakoj metodi za prouavanje veza izmeu
zavisnih varijabli i nizova prediktivnih varijabli. CHAID model definira set prediktora i
njihovih interakcija koje optimalno predviaju zavisnu mjeru u obliku stabla
odluivanja. Zavisna varijabla moe biti kvalitativni (nominalna ili ordinalna) ili
kvantitativni indikator. Za kvalitativne varijable stvara se niz chi-kvadrat analiza
izmeu zavisne i prediktivnih varijabli. Za kvantitativne varijable koristi se analiza
varijance pri emu se intervali za razdvajanje odreuju optimalno za nezavisne
varijable.

Za interpretaciju ovakvog stabla potrebno je shvatiti da ono nastaje dijeljenjem uzorka u


sve manje i manje dijelove. Na inicijalni uzorak primjenjuju se zavisne varijable pri
emu se trai statistiki signifikantna diskriminacija zavisne varijable. Najsnaniji
pokazatelji biraju se kao kriterij za dijeljenje. Svako sljedee dijeljenje vri se na isti
nain. Rezultat na kraju daje stablo podijeljeno u grupe koje se najvie meusobno
razlikuju prema zavisnoj varijabli.

4.4.5. Problemi u modeliranju podataka metodom stabla odluivanja


Praktina strana primjene metode stabla odluivanja ukljuuje rjeavanje problema
poput nivoa kompleksnosti stabla, tretmana kontinuiranih (numerikih) atributa,
tretmana atributa s neodreenim vrijednostima, poboljanja efikasnosti algoritma.
Spomenut u problem over-fitting-a, problem numerikih atributa i problem atributa s
neodreenim vrijednostima (missing values)

U principu, neki ID3 algoritam moe generirati stablo, dovoljno kompleksno da tono
klasificira sve primjere iz skupa podataka za uenje. Iako je to u odreenim sluajevima
razumna strategija, u veini situacija to raa dodatne probleme, bilo zbog uma u

60
podacima, ili pak nedovoljno velikog uzorka podataka koji bi trebao reprezentirati
populaciju primjera za odreeni klasifikacijski problem. Bez obzira da li se radi o
prvom ili drugom sluaju, jednostavni algoritam bi generirao stablo koje "pretjerano
dobro" (over-fitting) aproksimira odnose u podacima.

"Over-fitting" je znaajna potekoa u primjeni metoda stabla odluivanja, ali i drugih


tehnika modeliranja podataka. Nekoliko je moguih rjeenja za izbjegavanje "over-
fitting"-a. Ona se mogu grupirati na slijedei nain:
rjeenja koja zaustavljaju proces rasta stabla prije nego se postigne savrena
klasifikacija primjera iz skupa podataka za uenje;
rjeenja u kojima se najprije generira stablo koje savreno klasificira primjere, a
potom se odreene grane stabla "skrauju" prema prethodno definiranom
kriteriju.

Iako se na prvi pogled prvi pristup ini direktnijim, drugi se pristup u praksi pokazao
pouzdanijim. To je posljedica toga to je teko unaprijed definirati eljenu
kompleksnost stabla odluivanja.
Bez obzira na odabrani pristup, glavno je pitanje kako emo odrediti optimalnu
kompleksnost, odnosno veliinu stabla za konkretni problem. Kao rjeenja nameu se
slijedei pristupi:
koritenje posebnog skupa primjera (validacijski skup), koji je razliit od onog
koritenog za generiranje stabla, da bi se ocijenila uspjenost "skraivanja"
stabla;
koritenje posebnog statistikog testa na vorovima koji su kandidati za
"skraivanje", kojima se pokazuje da li e se izbacivanjem tog vora postii
poboljanje;
koritenje eksplicitne mjere kompleksnosti kodiranja primjera stablom
odluivanja, koja zaustavlja rast stabla kada je taj kriterij zadovoljen. Ovaj
pristup baziran je na heuristikom principu koji se naziva "Minimum Description
Length".

61
Prvi od ovih pristupa je i najei. Kod ovog pristupa, primjeri se dijele u dva skupa:
skup za uenje (training set) koji se koristi za generiranje stabla, te skup za provjeru
(validation set), koji se koristi za provjeru uinkovitosti metode skraivanja stabla.

Osnovni oblik ID3 algoritma ogranien je na atribute koji imaju ogranien skup
diskretnih vrijednosti. Kao prvo, ciljni atribut mora imati ogranien broj kategorija
(klasa). Nadalje, atributi koji se testiraju u vorovima odluivanja takoer moraju imati
diskretne vrijednosti. Ovaj drugi zahtjev se moe relativno lako zadovoljiti i u sluaju
da je atribut numerikog tipa (realne numerike varijable). To se moe postii
dinamikim definiranjem novih diskretnih vrijednosti realnih varijabli koje dijele
vrijednosti tog atributa u diskretni skup intervala. Konkretno, za atribut A koji je
numerikog tipa, moemo primijeniti algoritam koji e dinamiki kreirati novi atribut
binarnog tipa Ac koji poprima vrijednost 1 (true) ako vrijedi A < c, odnosno 0 (false)
ako prethodna tvrdnja nije tona. Pitanje je kako doi do granica interesantnih intervala,
t.j. vrijednosti c. Naravno, mi bismo eljeli vrijednosti c, koje e nam dati najvei
informacijski dobitak (gain). Sortiranjem primjera prema vrijednostima atributa A, te
identificiranjem susjednih primjera koji pripadaju razliitim klasama ciljnog atributa
moemo generirati skup vrijednosti c u sredini intervala vrijednosti atributa A za takva
dva susjedna primjera. Moe se pokazati da vrijednosti c koje maksimiziraju
informativni dobitak uvijek lee na ovako definiranim granicama intervala. Ovako
definirane diskretne vrijednosti atributa mogu posluiti za izraunavanje informacijskog
dobitka koji im pripada, i tako uestvovati u procesu selekcije s ostalim atributima koji
su na raspolaganju za generiranje stabla.

U mnogim praktinim primjenama postoje atributi kod kojih odreeni postotak primjera
ima neodreene vrijednosti (missing values). Na primjer, u medicinskoj domeni est je
sluaj da su odreeni rezultati laboratorijskih testova dostupni samo za dio pacijenata. U
tom je sluaju uobiajeno da se vrijednosti tih atributa (testova) odrede na osnovu
ostalih primjera (pacijenata) koji posjeduju rezultate tih testova.

4.4.7. Prednosti i slabe strane metode stabla odluivanja


Prednosti metode stabla odluivanja su:
sposobnost generiranja razumljivih modela;

62
relativno mali zahtjevi na raunalne resurse (vrijeme i memorija);
sposobnost koritenja svih tipova atributa (kategoriki, numeriki);
stabla odluivanja jasno odraavaju vanost pojedinih atributa za konkretni
klasifikacijski odnosno predikcijski problem.

Slabe strane metode stabla odluivanja:


metode stabla odluivanja su manje prikladne za probleme kod kojih se trai
predikcija kontinuiranih vrijednosti ciljnog atributa;
metode stabla odluivanja sklone su grekama u vie-klasnim problemima s
relativno malim brojem primjera za uenje modela;
u nekim situacijama generiranje stabla odluivanja moe bit raunalno zahtjevan
problem. Sortiranje kandidata za testiranje na vorovima stabla moe biti
zahtjevno, kao i metode "skraivanja" stabla, kod kojih je esto potrebno
generirati velik broj stabala da bi odabrali ono koje je najbolje za klasifikaciju
primjera odreenog problema;
stabla odluivanja nisu dobro rjeenje za klasifikacijske probleme kod kojih su
regije odreenih klasa "omeene" nelinearnim krivuljama u vie-
dimenzionalnom atributnom prostoru. Stabla odluivanja moemo opisati kao
vrlo osjetljiva na najmanje promjene. Pojanjenje ove tvrdnje svodi se na
injenicu da bilo kakva promjena u uzorku (drugaija diskretizacija i sl.) moe
rezultirati generiranjem potpuno drugaijeg stabla. Veina metoda stabla
odluivanja testiraju u svojim vorovima vrijednosti jednog atributa, i time
formiraju pravokutne regije i vie-dimenzionalnom prostoru;

4.5. Klasteriranje74
Tehnike segmentiranja podataka spadaju u grupu tzv. neusmjerenih metoda (undirected
data mining), dok se u podruju strojnog uenja primjenjuje naziv "uenje bez nadzora"
(unsupervised learning). Cilj neusmjerenih metoda je otkrivanje globalne strukture
podataka. U ovom pristupu ne postoji definiran ciljni atribut, kao u usmjerenih metoda
poput metode stabla odluivanja, pa ne postoji razlika izmeu atributa.

74
Data Mining Server, http://dms.irb.hr/, 10.10.2004.

63
Metode segmentiranja koriste se radi podjele primjera u niz grupa ili podskupova
(clusters), koji zadovoljavaju dva osnovna kriterija:
svaka grupa predstavlja homogen skup: primjeri koji pripadaju istoj grupi su
meusobno slini;
svaka grupa mora se razlikovati od ostalih grupa, tj. primjeri koji pripadaju
odreenoj grupi znaajno se razlikuju od primjera koji pripadaju ostalim
grupama.

Zavisno od konkretne metode, grupe mogu biti definirane na razliit nain:


identificirane grupe mogu biti ekskluzivne, tako da svaki primjer pripada
iskljuivo jednoj od grupa;
grupe se mogu preklapati; primjer moe istovremeno pripadati nekolicini grupa;
grupe mogu biti definirane probabilistiki: u tom sluaju primjer pripada svakoj
od grupa s odreenom vjerojatnosti
grupe mogu biti hijerarhijski strukturirane, sa grubom podjelom primjera na
najviem nivou, koji se potom moe finije strukturirati na niim nivoima.

U nastavku e biti spomenute najjednostavnije metode segmentiranja: tzv. algoritma "k-


srednjih vrijednosti" (k-means). Postoji itav niz metoda segmentiranja koje su znaajno
kompleksnije no metoda k-srednjih vrijednosti ini se najboljim primjerom za
ilustraciju osnovnih principa.

4.5.1. Algoritam K-srednjih vrijednosti


Ovaj algoritam ima kao ulaznu vrijednost prethodno definiran broj grupa, odnosno k
(otuda i ime k...). Srednja vrijednost u algoritmu odnosi se na "prosjenu" lokaciju (u
vie dimenzionalnom prostoru definiranom atributima). Kada se govori o metodama
segmentiranja podataka, nuno je uvesti pojam vie-dimenzionalnog prostora, koji je
definiran atributima kao osima tog prostora. Vrijednost svakog atributa primjera
predstavlja udaljenost tog primjera od ishodita takvog prostora po koordinati atributa.
Naravno, da bi ovu geometriju mogli efikasno koristiti, vrijednosti atributa moraju biti
numerike (vrijednosti nominalnih atributa moraju biti transformirane u numerike
vrijednosti!), a zatim i normalizirane da bi se omoguilo ravnopravno izraunavanje po
svim koordinatama (atributima) prostora.

64
SLIKA 4.8. Algoritam K-srednjih vrijednosti75

Algoritam K-srednjih vrijednosti je jednostavna, iterativna procedura u kojoj centralnu


ulogu igra pojam centroida. Centroid je umjetna toka u prostoru primjera, koja ustvari
reprezentira srednju ili prosjenu lokaciju odreene grupe primjera. Koordinate ove
toke izraunavaju se kao prosjene vrijednosti koordinata svih primjera koji pripadaju
toj grupi.

Obino ova iterativna procedura redefiniranja centroida te rasporeivanja primjera u


odgovarajue grupe zahtijeva samo nekoliko iteracija do zadovoljavajue
konvergencije.

4.5.2. Posebni aspekti metoda segmentiranja podataka


Posebni aspekti metoda automatskog segmentiranja podataka vezani su uz pitanja koja
elimo rijeiti procesom obrade podataka, odnosno proces pripreme podataka za njihovu
efikasnu primjenu kao to su:
pitanje mjerenja udaljenosti primjera (metrika prostora),
izbor ispravnog broja grupa,
interpretacija grupa.

75
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 296

65
Veina metoda segmentiranja koristi Euklidsku mjeru udaljenosti u prostoru primjera
(kvadratni korijen zbroja kvadrata udaljenosti po svim koordinatama (atributima)
prostora). Nominalni atributi moraju se prethodno transformirati i normirati prije za
primjenu metode segmentiranja. O ovoj transformaciji umnogome zavisi koliko e ovi
atributi biti vani za sam proces segmentiranja. Oni mogu biti dominantni, ali i potpuno
nebitni, ako se transformacija izvede na odreeni nain.

Ako je broj grupa K u metodi K-srednjih vrijednosti pogreno odabran, konani


rezultati nee biti dobri. Ispravan pristup odabiru broja grupa bio bi da se eksperimentira
s razliitim brojem grupa. U principu, optimalan broj grupa imat e najpovoljniji omjer
intra-grupnih i inter-grupnih udaljenosti primjera. Sofisticiranije tehnike segmentiranja
mjere ovaj omjer i same automatski optimiraju broj grupa u dodatnoj petlji (AutoClass).

Jednom otkrivene grupe potrebno je interpretirati, kako bi rezultat segmentiranja


podataka bio od koristi za proces obrade podataka.

4.5.3. Aspekti primjene tehnika segmentiranja


Tehnike segmentiranja koriste se u sluajevima kada se oekuje postojanje "prirodnih"
grupa u podacima. Otkriveni segmenti ili grupe podataka trebali bi predstavljati grupe
primjera koji imaju mnogo toga zajednikog. Stvaranje grupa primjera prije primjene
neke druge tehnike modeliranja podataka (neuralnih mrea, stabla odluivanja) moe
znatno reducirati kompleksnost odreenog problema, podjelom skupa primjera za
modeliranje. Ovakvi podskupovi primjera za uenje potom se mogu modelirati
odvojeno, a takva dvo-stepena procedura na kraju moe rezultirati boljim konanim
rezultatima (bilo u prediktivnom ili deskriptivnom smislu), nego bez prethodne
primjene tehnika segmentiranja podataka.

4.6. Asocijacijska pravila76


Asocijacijska pravila koriste se prije svega u obradi podataka u obliku transakcija.
Vani termini u terminologiji asocijativnih pravila su:

76
Data Mining Server, http://dms.irb.hr/, 10.10.2004.

66
element ili dio (u terminologiji obrade podataka uobiajenije je koritenje par
atribut-vrijednost);
transakcija (skup elemenata, korespondira terminu primjer u podruju obrade
podataka);
skup transakcija (korespondira pojmu skupa podataka).

Tipino za transakcije je da se razlikuju u broju elemenata, to uglavnom inae nije


sluaj s podacima koji se pripremaju za obradu podataka nekom od metoda modeliranja.
Stoga je za veinu ostalih metoda modeliranja podataka nuno transformirati
transakcijske podatke.

Svaka transakcija u skupu transakcija, daje nam informaciju o tome koji elementi se
zajedno pojavljuju u transakcijama. Koritenjem transakcija mogue je napraviti tablice
koje nam daju frekvenciju pojavljivanja parova (ili veeg broja elemenata) odreenih
elemenata u transakcijama. Iz tih tablica lako je napraviti jednostavna pravila poput:
R1="Element 1 pojavljuje se zajedno s elementom 2 u 10 % svih transakcija"

10% je mjera frekvencije pojavljivanja para elemenata 1 i 2 u skupu svih transakcija i


predstavlja "znaaj" (support) ili "signifikantnost" pravila. Ako je frekvencija
pojavljivanja elementa 1 u svim transakcijama 15%, a elementa 2, 20%, tada omjer
broja transakcija u kojima se pojavljuju oba elementa (odnosno znaaj pravila) prema
broju transakcija u kojima se pojavljuje element 1 (uvjetni dio pravila), nazivamo
pouzdanou (confidence) pravila. U ovom je sluaju pouzdanost pravila R1:
c (R1) = 10/15 = 0.666

Lako je napraviti i inverzno pravilo:


R2="Element 2 pojavljuje se zajedno s elementom 1 u 10 % svih transakcija"

Iako se naizgled radi o istom pravilu, svojstva R1 i R2 se razlikuju. Tako je pouzdanost


pravila:
c (R2) = 10/20 = 0.500

67
Pouzdanost pravila od 0.5 jednaka je tvrdnji da kada se u transkaciji pojavi element 2,
postoji 50% vjerojatnost da e se u istoj transakciji pojaviti takoer i element 1. Na prvi
pogled izgleda da su najpouzdanija pravila ona koja su najbolja. Problem se moe
pojaviti kada se npr. element 1 pojavljuje vrlo esto u transakcijama. (recimo, u 60%
transakcija). U tom sluaju pravilo moe imati slabiju pouzdanost od sasvim sluajnog
odabira. To pokazuje da kao mjera dobrog pravila treba neto bolje od pouzdanosti. Ta
mjera naziva se poboljanjem (improvemet). Ta nam mjera govori o tome koliko je
odreeno pravilo bolje od sluajnog odabira. Pouzdanost je dana slijedeim izrazom:
p (uvjeta i posljedice)
I ( R2 ) =
p(uvjeta) p ( posljedice)

U naem sluaju I(R2)=0.2/(0.2*0.1)=10, dok je za pravilo R1, I(R1)=0.1/(0.1*0.2)=5.


Kada je poboljanje vee od 1, pravilo je bolje od sluajnog odabira, kada je manje od
1, onda je loije. U naem je sluaju R2 10 puta, a R1 5 puta bolje od sluajnog odabira.

Generiranje asocijativnih pravila je iterativni proces. U svojoj biti vrlo je jednostavan i


svodi se na jednostavnu shemu:
1. generiraj tablicu frekvencija pojavljivanja pojedinanih elemenata;
2. generiraj tablicu frekvencija pojavljivanja dva razliita elementa. Iz tablice
izdvoji parove s poboljanjem veim od unaprijed zadanog kriterija;
3. generiraj tablicu frekvencija pojavljivanja tri razliita elementa. Iz tablice izdvoji
"triplete" s poboljanjem veim od unaprijed zadanog kriterija;
i tako dalje.

4.6.1. Primjena asocijacijskih pravila


Asocijacijska pravila koriste se u analizi tzv. "potroakih koarica" (market basket
analysis), primarno zbog jasnoe i iskoristivosti dobivenih pravila. Ona jasno izraavaju
u kojoj su mjeri vani produkti korelirani, te time sugeriraju konkretne akcije.
Asocijativna pravila koriste se prije svega u obradi podataka kod kojih su atributi
nominalnog (kategorikog) tipa. Osim samog procesa generiranja asocijativnih pravila,
za proces primjene ove tehnike vano je efikasno rijeiti i slijedee probleme:
izbor pogodnog skupa elemenata,

68
praktina ogranienja - velik broj elemenata koji se pojavljuju u velikom broju
interesantnih pravila

Osnova za obradu podataka metodom asocijativnih pravila su obino detaljni podaci


skupljeni na licu mjesta npr. toki prodaje, prodajnom mjestu. No, to ne znai da
emo konkretne produkte u tim transakcijama automatski proglasiti elementima
(primjerima) za proces obrade. Obino su artikli u prodavaonicama svrstani u kategorije
(taksonomija). Izbor prave razine kategorizacije moe igrati kljunu ulogu u smislenosti
konanih pravila, ali i redukciji velikog broja artikala u jedan element. Desetci, ponekad
i stotine artikala mogu biti svedeni na jednu ili vie kategorija (elemenata), koji dobro
reprezentiraju generalna svojstva svih artikala koje prodaje odreeni odjel. U
konkretnom sluaju pri kategorizaciji prodaje pojedinih grupa artikala koriteni su
povijesni podaci i ekspertno znanje osoba zaduenih za prodaju. Kategorizacija
primjenjena u ovom radu prikazana je u Prilogu 2.

Broj kombinacija za skupove s vie elemenata (itemsets) raste eksponencijalno s brojem


elemenata u transakcijama. Broj potrebnih izrauna mjera (znaaj, pouzdanost,
poboljanje) skupova elemenata, za npr., velik trgovaki centar s tisuama razliitih
artikala, brzo raste preko milion, kako raste i broj moguih elemenata u skupovima.
Npr. za 1000 razliitih produkata, ukupan broj moguih skupova od tri elementa jest:
n 1000
= = 166.167 *10 6
k 3

Kao to se iz ovog moe naslutiti, izraunavanje frekvencija i mjera kvalitete za


skupove elemenata s pet ili vie elemenata vrlo lako moe biti potpuno besmisleno
(vremenski neizvedivo). U tom je sluaju od prvorazrednog znaenja prethodno
spomenuto koritenje taksonomija, odnosno generalizacija elemenata.

Jake strane metode asocijativnih pravila su slijedee:


asocijativna pravila su jednostavna i jasna;
metoda je namijenjena problemima koji nisu klasifikacijskog odnosno
prediktivnog tipa, tj. nema ciljnog atributa;

69
omoguuje obradu podataka kod kojih primjeri imaju varijabilni broj atributa;
algoritmi kojima se generiraju asocijativna pravila u principu su vrlo
jednostavni.

4.7. Analiza vremenskih serija


Razne pojave, kao to je, na primjer, ponaanje kupca glede kupnje pojedinih proizvoda,
mogu se predstaviti vremenskim serijama. Karakteristika je vremenskih serija da
pokazuju razvoj pojedine pojave u jedinici vremena. Na osnovi vremenskog pomaka
moemo promatrati kupnju odreenih proizvoda kroz jedinicu vremena, kretanje
prihoda od prodaje odreene robe te itav niz drugih pojava koje mogu biti od vee ili
manje vanosti prilikom donoenja odluka.

SLIKA 4.9. Prikaz vremenske serije pomou vektora77

Pri promatranju vrijednosti atributa u jedinici vremena potrebno je unificirati vremenski


pomak na jednake intervale. Ponekad priroda pojave ili informacije koje pristiu, inei
vremensku seriju, ne dolaze u podjednakim vremenskim intervalima. U tom sluaju
moramo izvriti proces normiranja vremenskih distanca.

Kod pretprocesiranja vremenskih serija postoji metodoloka razlika koja proizlazi iz


njihove strukture. Pod pojmom normiranja podrazumijevam svoenje vremenske serije
na jednake vremenske pomake izmeu vrijednosti atributa. Prilikom normiranja valja
uzeti u obzir sve vremenske podintervale kako bi se dobila jedinstvena vrijednost na
kraju vremenskog pomaka. U literaturi se prilikom provoenja ovog procesa najee
prakticiraju metoda srednje vrijednosti, medijana, moda i sumiranja.

77
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 354

70
SLIKA 4.10. Pretprocesiranje vremenske serije78

Gledajui iz perspektive fokusa interesa, postupci analize vremenskih serija mogu se


svrstati u vie osnovnih kategorija koje ine79:
analiza kretanje trenda serije,
analize ciklikih pojava unutar serije,
analize sezonskih oscilacija unutar serije,
pronalaenje odsjeka vremenske serije koji korespondira sa odreenom trinom
pojavom,
pronalaenje slinosti uzoraka unutar serije,
pronalaenje i otklanjanje irelevantnih sekvenci iz serija,
analiza korelacijskih odnosa, kako izmeu vremenskih serija tako i njenih
odsjeaka,
autokorelacijska analiza vremenskih serija,
predvianje vremenskih serija,
analiza prirasta i osjetljivosti vremenskih serija,
analiza slinosti vremenskih serija.

Ovo je osnovna podjela koja uglavnom obuhvaa glavne tipove analize.


Jedna od najee koritenih metoda, koja esto prethodi detaljnim analizama, jest metoda
vizualizacije. Primjenom te metode mogue je na vrlo brz i efikasan nain spoznati
78
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 349
79
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 351

71
osnovne karakteristike promatrane pojave. Metodi vizualizacije esto prethodi ienje
podataka, odnosno nadomjetanje nedostajuih vrijednosti vremenske serije nakon ega
se primjenjuje neka od istraivakih metoda.

4.7.1. Problemi rudarenja vremenskih serija


Rudarenje vremenskih serija bazira se veim dijelom na tradicionalnim matematikim
metodama analize vremenskih serija i primjeni niza nepovezanih metoda zasnovanih na
strojnom uenju i prepoznavanju uzoraka unutar vremenskih serija.

Dosadanje metode koje se bave analizom vremenskih serija fokusirane su uglavnom na


odreeni problem te se ponaaju poput izoliranih dijelova. Na osnovi ulaznih parametara
(vremenska serija) one izvode informacije, poput onih o postojanju sezonskih oscilacija
ili ponavljajuih uzoraka, i slinih. Za sve njih je karakteristino da koriste vlastite
modele transformacije vremenske serije koji su uglavnom prilagoeni konkretnoj
problematici kojom se bave, te ih se ne moe, osim to su meusobno nekompatibilni, ni
ekstrahirati kao izlazne vrijednosti.

Takav pristup rezultira nemogunou automatske analize vremenskih serija, te postizanja


sinergijskog efekta ulanavanjem metoda prilikom analize vremenskih serija. Daljnji
problem to proizlazi iz ove situacije odnosi se i na nemogunost primjene tradicionalnih
metoda rudarenja podataka na vremenske serije. Model koji je naveden u nastavku
pretendira rijeiti neke od navedenih problema.

4.8. REFII model80


REFII model konstruiran je s ciljem objedinjavanja razliitih koncepcija analize
vremenskih serija, tradicionalnih metoda rudarenja podataka te s ciljem konstrukcije
novih algoritamskih postupaka iz oblasti analize trita, te pronalaenju rjeenja
problema automatskog pretprocesiranja vremenskih serija temeljei se iskljuivo na
novom idejnom rjeenju a ne na snanijem hardverskom okruenju.

80
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.

72
SLIKA 4.11. Metodologija procesiranja vremenske serije data mining algoritmima
posredstvom REFII modela81

Jedna od vrlo bitnih karakteristika prikazanog modela svodi se na injenicu da je


njegovom primjenom mogue izmodelirati rjeenja za odreene tipove problema kako u
bankarstvu tako i u podrujima trgovine, medicine, prepoznavanja uzoraka i slino.
Osnovna karakteristika ovog modela je jednoznanost opisa vremenske serije pomou
parametara modela. Matematika jednoznanost implicira mogunost provoenja
temeljnih matematikih operacija nad vremenskim odsjecima poput jednakosti,
razliitosti i slinosti.

Koncepcija REFII modela poiva na modelu u kojem se postiu uvjeti u kojima je


krivulju, ili neki njen segment mogue komparirati s drugom krivuljom odnosno nekim
njenim segmentom matematiki precizno.

Ova koncepcija nastoji zadovoljiti jo jedan kriterij, a to je kriterij povezanosti s


algoritmima koji se primjenjuju u rudarenju podataka. Do sada poznate metode za

81
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.

73
analizu vremenskih serija davale su odreene pokazatelje koji se kasnije nisu mogli
procesirati posredstvom nekog od poznatih algoritama u cilju ekstrahiranja dodatnog
znanja. REFII model tei ka otvorenosti, odnosno uz svoju matematiku prirodu koja
slui kako za opis, tako i za generiranje znanja koje se krije u vremenskoj seriji, daje
modalitete rjeenja povezivanja s ostalim data mining algoritmima.

Na taj nain mogue je iskoristiti snagu provjerenih algoritama na podruju vremenskih


serija, u sklopu standardnih softverskih rjeenja. U skupinu klasinih data mining
algoritama ubrajamo neuralne mree, klasteriranje, stabla odluivanja, analizu
potroake koarice, i slino, kao i sve mutacije i izvedenice ovih algoritama.

Jednostavno je pretpostaviti kolika snaga lei u sustavu koji je sposoban klasterirati


vremenske odsjeke, ili sustavu koji posredstvom algoritma stabla odluivanja
klasificira vremenske odsjeke ili pak kompletne vremenske serije. Isto tako, moemo
raditi razne analize nad vremenskim serijama ili njihovim odsjecima, kao i
proraunavati slinosti vremenskih serija na osnovu funkcije udaljenosti.

Ovom koncepcijom otvara se itavo jedno novo podruje koje nudi detaljniji i precizniji
analitiki princip u domeni vremenskih serija.

REFII model se koncentrira se na tri osnovna segmenta kojima se jednoznano moe


opisati krivulja a to su :
oblik krivulje (opis izgleda vremenske serije)
povrina ispod krivulje (kvantifikacija vremenske serije)
koeficijent kutnog nagiba pravca unutar vremenskog odsjeka (jaina trenda)

U REFII modelu za opis oblika krivulje zaduen je REF model82. Njegova


karakteristika je dijagnosticiranje i modeliranje oblika krivulje. Ovaj model ne moe
jednoznano definirati krivulju, te se s toga sluimo i s ostala dva spomenuta elementa
modela.

82
Klepac G. "Primjena inteligentnih raunalnih metoda u managementu", Sinergija, 2001., str. 63.

74
Povrina ispod krivulje daje kvantitativnu dimenziju odreenoj pojavi. Krivulja moe
imati jednaki oblik u odnosu na neku drugu krivulju, ali to ne znai da ima istu
kvantitativnu vrijednost, iz ega proizlazi pojam nejednakosti krivulje. Povrina ispod
krivulje moe pomoi u dobivanju tog pokazatelja. S ova dva elementa mogue je vrlo
precizno, gotovo jednoznano, opisati vremensku seriju. REFII model je jedinstveni
model transformacije koji jednoznano opisuje empirijsku krivulju (a sadri diskretne
vrijednosti), ija je zadaa povezati niz kako tradicionalnih, tako i ad hoc analitikih
postupaka.

Teoretski, krivulje mogu imati i jednak oblik opisan REF modelom, i jednaku povrinu,
a da ne budu u potpunosti jednake. To objanjava koritenje sva tri elementa u modelu.
Iako bi nam za potrebe analize podataka ova dva elementa u velikom broju sluajeva
bila dostatna za analize, na je cilj matematiki jednoznano opisati model krivulje pri
emu se smatra da u pojedinim sluajevima ove dvije krivulje mogu zadovoljavati
kriterij slinosti. Ponekad je apsolutno nerealno oekivati potpunu jednakost krivulja za
odreene pojave.

Da bi se u potpunosti uspjela jednoznano definirati vremenska serija matematikim


modelom potrebno je uvesti i trei element, a to je kut unutar vremenskog odsjeka ,
koji se izraava koeficijentom kutnog nagiba. Uvoenjem i ovog krajnjeg elementa
prikazan je koncept REF II modela, koji je orijentiran na data mining terminologiju
procjene, gdje je mjerilo pouzdanosti modela faktor sigurnosti.

Iz izloenog modela REF model se ini kao redundantni element, jer pomou
koeficijenta kutnog nagiba pravca moemo opisati oblik krivulje. Razlog uklapanja REF
modela kao referentnog segmenta sustava proizlazi iz injenice da je vrijeme koje stroj
utroi kod procjene slinosti krivulja na temelju REF modela mnogo krae nego kod
modela koji bi se bazirao na koeficijentima kutnog nagiba pravca. REF model je isto
tako mnogo neprecizniji od modela baziranog na koeficijentima kutnog nagiba pravca,
ali je mnogo tromiji u procesu obrade.

75
SLIKA 4.12. Uloga koeficjenta kutnog nagiba pravca u REF II modelu83

Prilikom procesa analize vremenske serije moemo uzeti sva tri elementa kao temelj za
analizu. Ovaj model sam po sebi ne daje gotova rjeenja ve je polazina osnova za
kompleksnije modele. S tim u skladu, i REF model i povrina ispod krivulje i
koeficijentu kutnog nagiba pravca mogu biti koriteni zajedno kod modeliranja rjeenja
sloenijih problema, ali isto tako i parcijalno, to ovisi o karakteru problema koji
rjeavamo.

Primjena klasinih data mining algoritama u vremenskoj seriji predstavlja transfer


pretprocesiranih vrijednosti opisanog modela u algoritme. S obzirom na prirodu
problema koji se rjeava, u algoritme moemo transferirati vrijednosti proizale iz svih
segmenata REF II modela, ili samo odreene vrijednosti.

U algoritme je tako mogue prosljeivati podatke o oblicima krivulja, povrinama ispod


krivulja, jaini trendova krivulja, te na osnovu toga moemo ekstrahirati nova znanja o
vremenskim serijama. Ponekad e u analizi biti bitan samo obrazac trenda kretanja bez

83
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.

76
kvantitativnog aspekta i jaine nagiba, pa emo procesirati podatke o obliku. U nekim
sluajevima kvantitativni aspekt moe igrati dominantnu ulogu te e on biti predmet
razmatranja i tako redom.

Vrsta analize Segment REFII modela


Analiza oblika krivulje REF i/ili koeficijent kutnog otklona
Kvantitativna analiza Povrina ispod krivulje
Traenje pravilnosti u vremenskoj seriji REF i povrina ispod krivulje
Jednoznana definicija krivulje REF, koeficijent kutnog otklona, povrina ispod krivulje
Otkrivanje epizoda i scenarija u vremenskim REF i /ili koeficijent kutnog otklona i/ili povrina ispod
serijama krivulje

TABLICA 4.1. Orijentacijski odnosi izmeu tipa analize i elemenata REFII modela84

Koncepcije poput otkrivanja epizoda i scenarija u vremenskim serijama isto je tako


mogue realizirati primjenom REF II modela.

Osnovni zadatak i cilj REFII modela je uspjeno modeliranje rjeenja problema iz


domene analize vremenskih serija. REFII model je dobra polazina osnova i temelj
rjeavanja problema iz poslovne prakse. Njegova primjenjivost lei u injenici to ulazi
u svaku poru vremenske serije, te ja na osnovu konkretnog problema mogue
dijagnosticirati analogiju izmeu elementa vremenske serije i konkretnog problemskog
prostora.

Vremenska serija na kojoj smo primijenili model moe se primjerice transformirati u


niz objekata koji kao vrijednosti sadre upravo vrijednosti proizale iz REFII modela.

Razliiti modaliteti rjeenja determiniraju razliite strukturalne formalizacije modela. U


odreenim situacijama vremenska e se serija morati lomiti u manje segmente s ciljem
traenja reprezentativnih uzoraka i znanja. Vrlo rijetko e ovako transformirana serija

84
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.

77
biti u originalnoj duini. Za potrebe sofisticiranijih analiza bit e potrebno segmentirati
seriju kako bi se olakao proces analize.

4.8.1. Prednosti REF II modela


Standardni modeli za analizu vremenskih serija, kao to je ve spomenuto koncentrirani
su prvenstveno na generiranje odreenih pokazatelja proizalih iz analize te su
fokusirani na usku problematiku. Ovakvi modeli ne pruaju mogunost direktnog
procesiranja vremenske serije posredstvom klasinih data mining algoritama, kao to je
to sluaj sa REFII modelom.

Ovaj model nadalje prua mogunost jednoznanog opisa vremenske serije, to rezultira
primjenom egzaktnih matematikih modela i procesa.

Model se oslanja na istovremeno koritenje sva tri podmodela u procesu analize, to


rezultira vrlo visokim stupnjem jednoznanosti i preciznosti u opisu krivulje. U
pojedinim sluajevima analize gdje se ne zahtijeva toliki stupanj egzaktnosti i
preciznosti, a potrebni su nam orijentacijski pokazatelji, mogue je u proces analize ui
s jednim ili dva elementa modela.

Kao primjer navodim ciklike analize pojavnosti, gdje nas ne interesira kvantitativni
aspekt pojave, nego samo pojavnost, tada iz navedenog sustava moemo izdvojiti REF
podmodel kao temelj za analizu.

Primjenjivost REF II modela u razliitim podrujima kao to su financije, trgovina,


bankarstvo, medicina, rudarenje teksta i slino, karakteristika je koja ovom modelu daje
dodatnu teinu kao univerzalnom sustavu za otkrivanju znanja u vremenskim serijama.

Generalno gledajui, REFII modelom opisujemo krivulju nizom parametara, a skup tih
parametara moemo kasnije procesuirati razliitim tipovima algoritama u razliitim
problemskim prostorima s ciljem otkrivanja znanja.Upravo procesi i problemski prostor
obrade ovih parametara determiniraju primjenu.

78
Osnovna koncepcija primjene REFII modela svodi se na tri koraka. U prvom koraku
vremenska se serija transformira u REFII sintaktiki model. Drugi korak odnosi se na
algoritmiranu obradu pokazatelja u formi REFII sintakse, dok se u treem koraku
ekstrahira znanje iz modela.

SLIKA 4.13. Etape u otkrivanju znanja primjenom REF II modelu85

Upravo itava lepeza algoritmiziranih obrada koje se mogu primijeniti nad vremenskom
serijom opisanom REFII sintaksom, jedna je od glavnih prednosti ove koncepcije, u
odnosu na ostale koncepcije koje su procesno orijentirane.

Algoritmizirana obrada moe se izvriti i posredstvom tzv. metodologije crne kutije


(black box upuuje na metodologiju koja s korisnike strane poznaje samo ulazni i
izlazni podatak, sve ostalo ostaje nepoznato za korisnika) na nain da algoritam bude
dio nekog softverskog proizvoda. U tom sluaju naglasak e poslije transformacije u
REFII sintaksu biti na pretprocesiranju podataka.

REFII model, osim deskriptivne funkcije, ima i procesne funkcije koje se oituju u
algoritmiziranim postupcima procjene faktora sigurnosti za svaki od tri elementa.
Proraun faktora sigurnosti determiniran je tipom analize koju provodimo nad
krivuljom, i stupnjem zahtijevane preciznosti .

Ovi algoritmizirani postupci za otkrivanje faktora sigurnosti dio su REFII modela.


Karakteristika koja je ujedno i prednost ove koncepcije oituje se u modularnosti koja je
determinirana problemskim prostorom i koja nudi modele rjeenja unutar tog

85
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.

79
problemskog prostora primjenom raspoloivog instrumentarija unutar samog modela,
ali isto tako procesuiranjem parametara posredstvom nadograenih modula.

Upravo ova koncepcija prua s jedne strane snanu metodologiju orijentiranu na


sofisticiranu analizu vremenskih serija, a sa druge strane dobivamo vrlo otvorenu
arhitekturu za nadogradnju modela rjeenja iz razliitih podruja.

U radu e biti prikazana analiza na temelju kutnog otklona krivulje.

80
5. PONAANJE POTROAA

5.1. Pojam ponaanja potroaa


Sedamdesetih godina prolog stoljea poetak je sazrijevanja svijesti da marketing mora
biti djelatnost koja e se orijentirati iskljuivo prema tritu i njegovim zakonitostima a
one su ponajvie odreene ponaanjem potroaa. Ponaanje potroaa se openito
odnosi na aktivnosti potroaa na tritu.

Ponaanje potroaa predstavlja proces pribavljanja i konzumiranja proizvoda, usluga i


ideja od potroake jedinice86. Ono takoer ukljuuje poslijeprodajne procese koji
obuhvaaju vrednovanje i poslijeprodajno ponaanje. Treba uoiti da se pod
potroakom jedinicom podrazumijeva pojedinac ili obitelj (kuanstvo) koje donosi
odluku. To moe takoer biti struna grupa u poduzeu, institucija i sl.

Definicija ponaanja potroaa upuuje na zakljuak da je rije o procesu. U tom se


procesu mogu izdvojiti tri faze a u okviru svake od njih postoji cijeli niz podfaza koje
ine cjelinu ponaanja potroaa87:
faza kupnje,
faza konzumiranja,
faza odlaganja.

U fazi kupnje razmatraju se imbenici koji utjeu na izbor proizvoda i usluga. Najvei
dio prouavanja ponaanja potroaa bavi se upravo ovom fazom ponaanja potroaa.

Faza konzumiranja bavi se procesom konzumiranja i stjecanja iskustvom koje ima


znaenje za budue ponaanje.

Faza odlaganja predstavlja odluku potroaa o tome to uiniti s iskoritenim


proizvodom ili onim to je ostalo od njega. Ovaj problem postaje sve aktualniji u

86
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2
87
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2

81
suvremenim ivotnim uvjetima i opoj brizi drutva za zatitu okolia i stvaranju
zdravih ivotnih uvjeta.

Pri prouavanju ponaanja potroaa istraivai polaze od pet osnovnih naela88:


1. potroa je suveren,
2. motivi ponaanja potroaa mogu se identificirati,
3. na ponaanje potroaa moe se utjecati,
4. utjecaji na potroaa moraju biti drutveno prihvatljivi,
5. ponaanje potroaa je dinamian proces.

Naelo suvrenosti podrava zakljuke teorije i prakse da se potroaem ne smije


manipulirati, samo mu se moe prilagoavati. Ponaanje potroaa uvijek je orijentirano
cilju. Potroai cijelog svijeta postaju sve obrazovaniji i informiraniji o svemu to se
dogaa i to se nudi.

Proces kupnje sastoji se od vie faza. U tom procesu postoji velik broj varijabli koje
imaju veeg ili manjeg utjecaja na pozitivan ili negativan rezultat kupovnog procesa.
Istraivanje usmjereno na pojedine elemente ponaanje potroaa i njihovu meusobnu
povezanost ima za cilj pojasniti sam proces donoenja odluke i naina, te jainu utjecaja
pojedinih varijabli u tom procesu. Ono to je specifino za sva drutvena istraivanja
jest da se uvjeti stalno mijenjaju pa s njima i intenzitet i smjer utjecaja pojedinih
varijabli.

Iako je suvremeni potroa suveren, mogue je utjecati na njegovo ponaanje


prilagoavanjem elemenata marketinkog spleta potroaevim potrebama. Uspjeh se
uvijek postie ako potrebe postoje ili ako su one latentne i ponua ih pokrene
proizvodom koji potroai svjesno ili podsvjesno trebaju.

Potrebe i motivi potroaa stvarni su i stoga njihovo zadovoljenje pravim i korisnim


proizvodima predstavlja korist za potroaa kao i za drutvo u cjelini stoga utjecaji na
potroaa moraju biti drutveno prihvatljivi.

88
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2

82
Ponaanje potroaa dinamian je proces. Pojedinac, grupe s kojima je u neprestanoj
interakciji i drutvo u trajnom su procesu promjene. Ovo je od krucijalnog interesa za
prouavanje potroaa kao polazita za donoenje marketing strategija. To znai da su
generalizirani zakljuci o ponaanju potroaa limitirani u odnosu na vrijeme, proizvod i
usluge.

5.2. Model ponaanja potroaa


Modeli ponaanja potroaa stvoreni su kao ilustracija procesa donoenja odluke o
kupnji s ciljem isticanja varijabli koje utjeu na donoenje odluke i njihovu meusobnu
povezanost. Sloenost modela varira meu autorima no sloeni modeli se u osnovi
razlikuju po tome odnose li se na prvu kupovinu ili rutinsku kupovinu. Razlika zapravo
ne postoji u broju imbenika i faza ve u stupnju psihike ukljuenosti i vremenu koje
se posveuje analizi pojedinih faza.

spoznaja
potrebe
utjecaji okruenja:

interno traenje kultura


pretraivanje socijalne grupe
izloenost osobni utjecaji
obitelj
alternativno situacija
panja vrednovanje
stimulansi

trino razumjevanje memorija indidualne razlike:


orjentirani
potroaevi resursi
prihvaanje kupnja motivacija i
ukljuenost
znanje
zadravanje rezultati stavovi
obiljeja linosti
vrijednsoti i stil
ivota
vanjsko
traenje

nezadovoljstvo zadovoljstvo

ulaz prerada proces donoenja varijable koje utjeu na


podataka informacija odluke donoenje odluke

SLIKA 5.1. Sloeni model ponaanja potroaa 89

89
Engel F.J., Blackwell D.R., Miniard W.P., "Consumer Behavior", The Dryden Press, 1995., str. 53

83
Ponaanje potroaa pod utjecajem je velikog broja imbenika koji su meusobno
povezani a mogu se grupirati u tri skupine:
drutveni imbenici,
osobni imbenici
psiholoki procesi.

Drutvene imbenike ine: kultura, drutvo i drutveni stalei, drutvene grupe, obitelj,
situacijski imbenici i osobni utjecaji.
Osobne imbenike ine: motivi i motivacija, percepcija. stavovi, obiljeja linosti
vrijednosti i stil ivota, znanje.
Psiholoki procesi su: prerada informacija, uenje, promjena stavova i ponaanja,
osobni utjecaji.

Sloenost procesa donoenja odluke o kupnji ovisi o mnogim utjecajima to dodaje


teinu na zadatak prediktivnog modela, odnosno uveava vrijednost pronalaenja
moguih zakonitosti.

5.3. Donoenje odluke o kupnji tekstilnih i srodnih proizvoda


Pri donoenju odluke o kupnji tekstilnih i srodnih proizvoda potroai su izloeni i
nekim, za tu vrstu proizvoda, specifinim utjecajima. Premda se ti utjecaji mogu svrstati
u teoretski model koji je izloen ranije, posebno se opisuju obzirom na vanost koju
imaju u promatranom procesu.

Ono na to elim skrenuti panju jest priroda tekstilnih proizvoda koja u kontekstu
donoenja odluke o kupnji moe: pobuditi kod potroaa tradicionalni proces
prikupljanja informacija nakon ega slijedi odabir prema odgovarajuim
karakteristikama ili pobuditi iracionalnu odluku o kupnji modnog proizvoda kako bi se
zadovoljili afiniteti koji ne moraju nuno biti vidljivi.

Istraivanja danas pokazuju da potroai ne slijede jednu strategiju ve da posjeduju


cijeli skup razliitih strategija koje zavravaju kupnjom90.

90
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 353

84
DONOENJE
ODLUKE AKO JE U TRADICIONALNO
PITANJU MODNI DONOENJE
PROIZVOD ODLUKE

Modni proizvod Prepoznavanje problema


(neki proizvod je atraktivno (shvaamo potrebu za
izloen, predstavljen) odijelom za neku prigodu)

Uoavanje (spoznaja) Prikupljanje informacija


proizvoda (raspitujemo se o moguim
(uoili smo proizvod) rjeenjima)

Zanimanje Procjena alternativa


(pokazujemo zanimanje i (usporeujemo nekoliko
gledamo proizvod) stilova i marki u trgovini
vezano uz sastav, porijeklo,
ciujenu i dodatne pogodnosti)

Procjena Odabir proizvoda


(isprobavamo proizvod i (odabiemo proizvod jer ima
trenutno poinjemo uivati u odgovarajue karakteristike)
njemu)

Odluka Rezultat
(kupujemo proizvod) (kupujemo proizvod i
uivamo u njemu)

Rezultat
(uivamo u kupljenom
proizvodu)

SLIKA 5.2. Faze u modnom i tradicionalnom procesu donoenja odluka 91

91
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 353

85
5.3.1. Vrste odluka potroaa
Jedan od zahvalnih naina karakteriziranja procesa donoena odluka je mjerenje
uloenog truda u donoenje odluke. U ovom kontekstu tzv. kontinuum donoenja
odluke o kupnji omeen je s jedne strane svakodnevnim, rutinskim odlukama o
rutinskim problemima te sloenim odlukama/problemima na suprotnoj strani. Veina
odluka pada u sredinu, podruje nazvano ogranieno rjeavanje problema92.

ogranieno rjeavanje rutinske odluke rjeavanje sloenih


problema problema

proizvodi niske cjene skuplji proizvodi

redovite kupnje rijetke kupnje

neznatan utjecaj veliki utjecaj


potroaa potroaa

poznati proizvodi nepoznati proizvodi


(vrsta, brand) (vrsta, brand)

malo vremena za dugo promiljanje,


razmiljanje, pretraivanje prije
pretraivanje prije kupnje
kupnje

SLIKA 5.3. Kontinuum donoenja odluka o kupnji 93

Razna istraivanja danas bave se pojedinim skupinama potroaa te prouava stilove


donoenja odluka. Kao neke od najzanimljivijim za trgovce u maloprodaji izdvojene su
neke skupine ije nazive prenosim u originalu u svrhu lakeg razumjevanja94:
shoppers karakterizira ih visok stupanj zanimanja za trgovine i planiranje
izleta u kupovinu,
loyals ukljueni u kupnju, raznovrsnost i vrijednost,
late bloomers slino prethodnima ali manje ukljueni znanjem o proizvodima,
vaan je faktor uvjerenja

92
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 354
93
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 354
94
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 356

86
narrowers nezainteresirani za proces kupovanja,
apathetics mlai, nemaju elju ili mogunost ukljuenja u kupnju,
avoiders najnegativniji prema procesu kupnje, imaju malo vremena na
raspolaganju.

5.4. imbenici koji utjeu na potroae u trgovini tekstilnim


proizvodima
Obzirom su kroz rad predstavljene sve posebnosti tekstilnih proizvoda u smislu atributa
koji ih odreuju a mogu biti od veeg ili manjeg znaenja u procesu odluke potroaa
ovaj odjeljak osvre se na jo jedan vaan pojam koji do sada nije napomenut modu.

Modna industrija zapoljava milijune ljudi diljem svijeta, profiti se mjere u milijardama
eura. Nedvojbeno utjee na gotovo sve potroae dananjeg svijeta. Moda se odraava
na nae drutvo i kulturu te na neki nain utjee na to kako ljudi doivljavaju sebe.
Utjee na promjenu garderobe, namjetaja, automobila koje vozimo. Poslovna praksa
takoer je podlona modnim utjecajima. Moda je svuda oko nas.

Zamislimo obinu T-shirt majicu koju zasigurno svatko posjeduje u vlastitom ormaru.
Istraivanja vlakana od kojih je sainjena, projekcije boja i kretanja modnih trendova,
istraivanja tehnolokih rjeenja u proizvodnji i tkanju, ukljuenost posrednika i
doraivaa, dizajneri, savjetnici, logistika, PR agencije, modni asopisi i, na kraju,
maloprodajni duan. Svi su oni nekim dijelom zasluni za navedenu kupnju.

Jo neke vane karakteristike mode su slojevitost (masovna, visoka), ovisnost o


veliinama i cijeni (dobne skupine, skupine prema veliinama) te ukus kao posebno
zanimljiv.

Razni autori upuuju i na vremensku dimenziju kao dodatni, do sada vrlo malo
spominjani, faktor utjecaja. Promatrajui vremensku dimeziju, jednostavno
stupnjevanje, prema teoretskom pristupu kojeg je razvio J. Laver, glasi95:
nepristojno 10 godina ispred svog vremena

95
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 12

87
besramno 5 godina prije vremena
hrabro 1 godinu prije vremena
pametno sada
neuredno 1 godinu nakon svog vremena
strano 10 godina nakon vremena
apsurdno 20 godina nakon vremena
smijeno 50 godina nakon vremena
armantno 70 godina nakon vremena
romantino 100 godina nakon vremena
lijepo 150 godina nakon vremena

Takoer, dostupna detaljna istraivanja96, provoena na tritu tekstilnih proizvoda u


Kini, odnosno njihovi rezultati, definiraju osam mentalnih karakteristika koje opisuju
donoenje odluka u potroaa. One su redom:
spoznaja o kvaliteti,
spoznaja o brandu,
spoznaja o modi,
rekreacijska i hedonistika orijentacija,
spoznaja o cijeni proizvoda,
tendencije impulzivnom i naglom ponaanju,
zbunjenost prevelikom ponudom i
lojalnost brandu.

Ovih osam stilova opisuje osnovne mentalne karakteristike donoenja odluka u


potroaa koje su direktno povezane s ponaanjem potroaa. Prema istom istraivanju
pri kupnji odjee potroai najee su posebnu panju posveivali redom: brandu,
stilu, dizajnu, boji, cijeni i zemlji porijekla robe.

96
Wang C.L., Hui A., Siu M., "Consumer decision-making styles on domestic and imported brand
clothing", 2002., http://www.emeraldinsight.com/0309-0566. htm

88
5.4.1. Ciklus prihvaanja mode
Ciklus prihvaanja mode pomiruje dolazak, prihvaanje, vrhunac te prestanak
prihvaanja odreenog stila. Slino nekim drugim proizvodnim ciklusima i ovaj je
mogue vizualizirati.

SLIKA 5.4. Uobiajen modni ciklus 97

Samo neki od stilova postaju klasici, oni koji bivaju prihvaeni uvijek i bilo gdje. Pri
planiranju nabave ili prodaje, proizvodnje ili pokuaju izgradnje prediktivnog modela
vano je znati koji od utjecaja mogu biti prisutni kako bismo prema njima mogu
korigirati rezultate istraivanja te u skladu s tim interpretirati zakljuke.

Moda biva prihvaena od strane malog broja klijenata prije nego postane predmetom
masovnog trita. Moda je sloen proces koji funkcionira na vie razina. Razliitosti
pokreta nemogue je cjelovito obuhvatiti no za eventualna kasnija istraivanja valja
spomenuti (obzirom ih nije bilo mogue kvalitetno prevesti neki su nazivi navedeni u
originalu)98: kolektivnu selekciju (pojavu kada naprosto svi nose i ele imati isti
proizvod), tickle-down (neki brand koji starta sa pozicije "ispod" drugoga trudi se doi
na njegovu razinu, po dolasku klijenti vjerni brandu koji je bio "iznad" naputaju taj
brand), tickle-across (irenje trendova unutar odreenih skupina bilo dobnih ili plateno
sposobnih kao odraz statusa), subkulturni ili tickle-up (originalni radovi subkulture
mogu se naglo probiti u trend).

97
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 13
98
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 20

89
SLIKA 5.5. Usporedba ciklusa prihvaanja za klasine, modne i hirovite proizvode 99

Bez obzira radi li se o proizvodnji ili prodaji vano je skrenuti panju na oscilacije koje
razliiti atributi koji opisuju tekstilni proizvod mogu uvjetovati. Ilustracija pokazuje
kako ciklusi prihvaanja mogu utjecati na trendove u prodaji. Prema tome, dobro
odmjeren odnos izmeu trendovskih, modnih i klasinih proizvoda upravo je ono to
traimo.

5.5. Ponaanje potroaa i rudarenje podataka


Ranije je spomenuto da openito moemo rei da se ponaanje potroaa odnosi na
aktivnosti potroaa na tritu. Istraivanjem ponaanja potroaa nastoje se nai
odgovori na slijedea pitanja100:
to potroai na tritu ine?
zato to ine?
kako to ine?

Kao i mnoge druge pojave u svijetu u kojem ivimo, i ponaanje potroaa s vremenom
se mijenja. Razlozi su tome mnogobrojni, a meu najvanije svakako spadaju opi
drutveni i ekonomski napredak, promjene u politikom ustrojstvu svijeta, povean

99
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 14
100
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003, str. 3

90
standard i kvaliteta ivota ljudi, obitelji i drutvenih zajednica, kumuliranje
individualnoga, organizacijskog i kolektivnog znanja te tehnologija.

Meu svim imbenicima posebno je potrebno istaknuti tehnologiju i to poglavito


informacijsku tehnologiju. Poboljane metode, tehnike, sredstva i alati kakve donosi i
stvara ta tehnologija omoguuju temeljitije i obuhvatno istraivanje ponaanja potroaa
to tvrtkama i njihovu managementu otvara mogunosti pronalaenja boljih naina
uspostavljanja, odravanja i unapreenja odnosa s potroaima odnosno njihovim
klijentima.

Pokuaji da se zakonitosti prirode egzaktno izraze i prikau kroz vrijeme je izazov


mnogim istraivaima. Rudarenje podataka bazirano je na raznim znanstvenim
disciplinama pa su stoga potrebne razne vjetine kako bi se dolo do upotrebljivih
rezultata.

"Ljudi e Vam rei da vole odreske. No, kada pripremaju prazninu zabavu kupuju
hamburgere. Postoji odmak izmeu onoga to ljudi kupuju i onoga to ele101". Slijedei
ovu izjavu moemo konstatirati da e jedan od najveih izazova rudarenju podataka biti
istovremeno i nerjeiv. Naime, rudarenjem podataka moemo doi do predvianja
ponaanja potroaa baziranog na ponaanju u prolosti (kojim navikama tee na
temelju ranije uinjenih transakcija, demografskih informacija itd.). Moe li se zaista
predvidjeti to ljudi ele kupiti?

Rudarenjem podataka utvrdit emo da je 34-godinjak, lan obiteljskog domainstva sa


suprugom i dvoje djece sklon kupnji npr. zimske jakne od perja svake tri godine. Ono
to ne znamo jest da li bi ta osoba kupila vuneni zimski kaput (koji je znatno skuplji
proizvod), ako bi kombinacija imbenika koji utjeu na kupnju na elu s cijenom bila
odgovarajua.

Zasigurno, svjedoci smo utjecaja kojeg ovakve analize imaju na trite, na ponudu i na
ponaanje ponuaa, doivljavamo ih openito i u pozitivnom kontekstu nas kao
101
Johnstone K. direktor BI odjela tvrtke Emerald Solutions,
http://news.com.com/Behind+the+numbers/2009-1017_3-252162.html, 20.10.2004.

91
potroa. No, jesmo li zaista svjesni kako ovakve analize mogu rezultirati npr.
usklaivanjem cjenovnih politika pri emu spoznaja da je neki proizvod popularan, i
shodno tome ponua odlui podii/zadrati odreenu cijenu, negativno djeluje na nas
kao potroaa?

Moe li se ciljanim marketingom djelovati na potroae odreene ivotne dobi i tome ih


pridobiti da u kasnijim razdobljima ivota ostanu vjerni odreenim proizvodima?
Mogue je da ako istraivanja pokau slijepu vjernost nekim proizvodima trgovci
odlue upravo na njima ostvarivati dodatnu zaradu. U budunosti nas oekuje sve vea
penetracija rudarenja podataka u domenu marketinga i ostalih, u osnovi nestatistiki
orijentiranih, podruja. Hoe li se i u kojoj mjeri to negativno odraziti na potroae
ostaje da se vidi.

Jedno je oito: strogo kategoriziranje potroaa nikada ne treba shvatiti doslovno.


Razliite kupnje mogu inicirati razliite obrasce, mogu na razliit nain utjecati na
kupca da potrai dodatne informacije jednako kao to iskustvo moe, bez posebnog
razloga za kupca, utjecati na promjenu odluke o kupnji. Ponaanje potroaa
prvenstveno ovisi o proizvodu a tek nakon toga o ostalim imbenicima.

Dostupnost informacija svakog dana postaje sve vea no na pojedincima ostaje da


svjesnou usmjere tehnoloke prednosti u vlastitu prednost. Kombiniranjem prodajnih
kanala uz kvalitetnu i jasnu strategiju marketinga koja je podrana analitikim
izvjetajima mogue je doprijeti do potroaa.

92
6. POTENCIJALNE PRIMJENE METODA RUDARENJA
PODATAKA U TRGOVINI TEKSTILNIM I SRODNIM
PROIZVODIMA

6.1. Uloga primjene metoda rudarenja podataka u trgovini tekstilnim


proizvodima
Primjena rudarenja podataka omoguuje rad sa znanjem. Znanje koje je u podatke
poduzea ugraeno samo po sebi potrebno je izdvajati i s njime stalno raditi. Sve
ukljuene slube potrebno je opskrbiti svim relevantnim podacima i alatima i pruiti im
uvid u mogunosti koje rad sa znanjem prua102.

Nove korporacijske organizacijske sheme unose mnoge novosti, ukljuujui nove ljude
u poslove donoenja odluka. Iako ti zaposlenici moda nee donositi konane odluke,
oni su odgovorni za davanje preporuka koje se temelje na njihovom poznavanju
poslovanja. Zajedno s rezultatima do kojih e doi prekopavajui podatke, ti e ljudi
predstavljati bazu znanja o poslovanju tvrtke. Naprijed spomenuti alati mahom moraju
biti prilagoeni za uporabu ljudima koji nisu informatiari. Upravo grafiko suelje
jedna je od bitnih prednosti koje su tijekom godina poveale uporabljivost brojnih
softverskih alata. Sve donedavno, tvrtke su za analizu podataka, odlunih za poslovanje,
angairale statistiare. Sa zahtjevima za pronalaenje trendova i pravila ponaanja,
grupiranja i razdvajanja korporacijskih podataka, kreiranje profila i pronalaenje
odstupanja, postaje neizbjeno angairati vlastite ljude i njihov rad poduprijeti
posebnim alatima.

Uloga ovjeka jo je uvijek od izuzetne vanosti. Prije spomenute Bayesove mree


primjer su alata gdje je ovjek bitan za ishod njegove primjene. Alati koji se temelje na
Bayesovim mreama zahtijevaju odreeno vrijeme poduavanja mree. Mrea ui tako
da interaktivno s ovjekom prouava podatke. Konani proizvod, rjeenje koje e se
kasnije primjenjivati, temelji se na mrei koja mu daje snagu i uporabljivost, ali ovjek
koji je poduavao mreu dao mu je mo prepoznavanja problema kojega treba rjeavati.

102
Previ M. "Podaci kao poslovni resurs", http://www.skladistenje.com/jedan.asp?ID=113, 20.02.2001.

93
Svrha je uporabe alata za rudarenje izrada modela ili aplikacije za kasniju uporabu.
Model moe biti izgraen samo jednim pristupom ili njihovim uspjenim
kombiniranjem.

Primjena tehnika rudarenja podataka u trgovini tekstilnim proizvodima potencijalno je


vrlo iroka. Mogu se rabiti za istraivanje trita, ispitivanje profila kupaca, izravnu
ponudu, procjenu rizika, procjenu kvalitete itd.

Neke od primjena mogu biti:


profiliranje navika i prilika potroaa - na temelju statistikih podataka o
potroaa (dob, prihodi, mjesto boravka i sl.) utvrditi navike pojedinih grupa, i
razlike odnosno slinosti meu njima
ovisnost o klimatolokim prilikama - na temelju podataka o vremenskim
prilikama pratiti krivulje prodaje,
upravljanje postojanou - ako se standardnom skupu podataka dodaju podaci o
postupcima potroaa kroz dui vremenski period pratiti kako se mijenjaju
afiniteti kroz vrijeme,
predvianje rizika - istraivanjem u skupu podataka o potroaima identificirati
one koji su skloni promjenama,
analiza trendova - koristei ve stvoreni model koji pokazuje trendove prodaje,
zanimanja ili bilo koje druge mjerljive pokazatelje, utvrditi podatke koji
odstupaju od uobiajenih. Analiza trenda prikladna je uvijek kada postoje
povijesni podaci s kojima se novi skup podataka moe usporediti,
studija prodajnih mjesta - na temelju koliine prodaje i broja posjetitelja utvrditi
karakteristike prodajnih mjesta,
studija etvrti/regija - ako se raspolae odacima sa svih prodajnim mjesta
mogue je sustavno pratiti pojedine segmente i ukrtati ih s raznim statistikim
podacima.

Ovisno o stvarnim podacima, oni e se rudariti klasifikacijom ili grupiranjem, a po


potrebi e se vizualizirati.

94
6.2. Tehnike pretprocesiranja podataka
Baze podataka u poslovnim sustavima podlone su raznim gubitcima, neistoama i
nekonzistencijom podataka, najee uslijed veliine koja prelazi gigabajte podataka.
Tehnike pretprocesiranja pomau poveanju kvalitete podataka pa tako utjeu i na
kvalitetu rezultata rudarenja.

Meu brojnim tehnikama pretprocesiranja najuobiajenije su103:


ienje podataka,
integracija podataka,
transformacije podataka,
reduciranje podataka.

ienje podataka koristi se za uklanjanje "umova" u podacima te ispravljanje


nekonzistencija. Integracija objedinjava podatke iz razliitih izvora u koherentno
skladite podataka. Transformacije mogu poveati tonost i efikasnost, kao npr.
normalizacija pri istraivanju udaljenih rezultata. Redukcija podataka podrazumijeva
agregiranje, eliminiranje redundantnih podataka, klasteriranje u svrhu svoenja
podataka na skup primjenjiviji pojedinom pristupu.

Pojedine primijenjene tehnike bit e opisane u nastavku onako kako su koritene, za


detaljniji prikaz upuujem na relevantnu literaturu. Vano je spomenuti da kvalitetno
skladite podataka moe umnogome olakati rad.

6.2.1. Podaci koriteni u istraivanju


Priroda poslovnih podataka uvijek povlai kriterij tajnosti vanih poslovnih informacija
stoga uzorci na kojima se provode istraivanja sadravaju pojednostavljene vrijednosti
agregirane na nekoj razini kako bi se osigurala primjenjivost metoda a iskljuila svaka
mogunost otkrivanja bitnih poslovnih injenica.
U ovom radu koriteni su podaci prikupljeni s odabranih prodajnih mjesta u Gradu
Zagrebu, agregirani na razini odabranih robnih kategorija koje su nakon toga dobile ime

103
Han J., Kamber M. "Data Mining: Concepts and Techniques", 2000., Morgan Kaufmann, odjeljak 3,
str. 3

95
robne grupe kojoj pripadaju. Navedene vrijednosti izraene su sumarno na dnevnoj bazi,
a nazvane su muka trikotaa, enska trikotaa, obua, ensko rublje, muka konfekcija
i enska konfekcija. Ve prema pokazateljima, u pojedinim analizama sudjeluju one
grupe koje su se pokazale osjetljivijima tj. zanimljivijima za interpretaciju. Takoer, na
kraju istraivanja osvrnut u se na moguu podjelu po etvrtima unutar Grada odnosno
neke mogunosti primjene koje u ovom radu nisu iskoritene. Za potrebe istraivanja od
Gradskog zavoda za planiranje razvoja Grada i zatitu okolia kupljeni su statistiki
podaci o stanovnitvu podijeljeni po etvrtima a potencijal ovakvih i slinih podataka
koje Zavod nudi ili ih planira nuditi u budunosti, naznaiti e se u zavrnom dijelu
istraivanja.

Detaljniji prikazi karakteristika potroaa uvjetuju pripremu podataka na razini


pojedinanog rauna ukljuivo odreene podatke o samom kupcu. Obzirom na kriterij
tajnosti poslovnih podataka, ovakva analiza nije provedena ve su, uz promatrane
meuzavisnosti varijabli roba, u istraivanju primijenjene vrijednosti klimatskih uvjeta
koje je za potrebe istraivanja ustupio Dravni Hidrometeoroloki Zavod. Dobivene
vrijednosti su prosjena dnevna temperatura, prosjeni tlak zraka, relativna vlanost,
koliina oborina i snijega, naoblaka, broj sunanih sati i temperatura u 14:00 sati s
mjerne postaje u Maksimiru. Vremenske prilike imaju sve vei utjecaj na trgovinu
tekstilom uslijed neuobiajenih promjena uvjetovanih globalnim zatopljenjem kojih
smo svjedoci proteklih godina, stoga je ovaj pristup vrlo zanimljiv.

Za potrebe pojedinih analiza, podaci u kategorizirani, o emu je detalje mogue pronai


u prilozima. Osnovne deskriptivne pokazatelje koritenih vrijednosti takoer je mogue
pronai u prilozima.

U dijelu istraivanja primjenjen je REFII model pri emu je koriteno programsko


rjeenje Time Explorer, razvijeno u Visual FoxPro alatu. Ostali alati koriteni u
istraivanju su SPSS verzija 12.0 (ustupljena o dstrane tvrtke Prizma istraivanja),
Hugin Lite 6.4 te open source rjeenja Python Orange modul i Weka. SPSS kao snaan i
popularan alat za analizu koriten je za deskriptivnu statistiku, analizu sezonskih
oscilacija, grupiranje, klasteriranje te neke vizualizacije. Hugin Lite posluio je za

96
izradu Bayesove mree na podacima transformiranim REFII modelom. Python Orange
modul iskoriten je za analizu relevantnosti atributa i asocijacijska pravila.

Skladite podataka izgraeno je na Oracle bazi podataka pa je stoga pri pretprocesiranju


koriten PL/SQL jezik.

6.2.2. Plan istraivanja


Kao jedan od vanih preduvjeta uspjenosti istraivanja mnogi autori navode definiranje
plana istraivanja. Uobiajeno je da faze izgledaju otprilike ovako104:
razmatranje prostora istraivanja,
razmatranje prostora moguih rjeenja,
odreivanje metoda,
rudarenje podataka (ralanjeno od tri podfaze):
o priprema podataka,
o analiziranje podataka,
o modeliranje podataka.

Pri tome se navodi da vrijeme potrebno za prve tri faze oduzima oko 20% ukupnog
vremena potrebnog za istraivanje dok ostale oduzimaju preostalih 80%. Nasuprot
tome, vanost ispravno postavljenog prostora, rjeenja i metoda sudjeluje sa 80% dok
na preostali dio otpada 20%.

Problem kojeg sam se elio dotaknuti u ovom istraivanju ponajprije je iskoritavanje


potencijala primjene metoda rudarenja podataka u trgovini tekstilnih i srodnih
proizvoda.

Kvaliteta i dostupnost poslovnih podataka sljedee su razmatrano podruje. Za potrebe


poslovanja ranije je izgraeno skladite podataka koje je u najveoj mjeri odredilo
stupanj granulacije. Dodatni zahtjev koji je trebalo ispuniti je apsolutno osigurati da
podaci na bilo koji nain ne odaju bilo kakve poslovne tajne.

104
Pyle D. "Data Preparation for Data Mining", Morgan Kaufmann Publishers, 1999., str. 10

97
Odabrane metoda rudarenja smatrao sam dobrom mjerom kako bi se sadrajno
zaokruenim pristupom prikazale mogunosti primjene. Nakon to je definiran nain na
koji e se podaci agregirati, pristupio sam prikupljanju iz skladita podataka. Paralelno
sam pretraivao vanjske izvore u potrazi za podacima o vremenskim prilikama i
pojedinim statistikim pokazateljima. Nakon to su se svi podaci nali u poetnoj bazi
podataka, pristupio sam kategoriziranju za potrebe pojedinih metoda. Kategorizirane i
kontinuirane varijable, povezane s vanjskim podacima i agregirane oko datuma u godini
bile su spremne za analizu.

Analiza relevantnosti atributa esto je uvodni pokazatelj. Premda razni autori koriste
razne tehnike, najee se koriste razni indeksi koji pokazuju entropiju ili stabla
odluivanja. Asocijativna pravila dodatno istiu pojedine veze meu varijablama.
Primjena stabala odluivanja na ilustrativan nain takoer pokazuje vanost nekih
odnosa s karakteristikom primjene na manje uzorke pri emu se istiu neke zakonitosti
teko vidljive na neki drugi nain.

Klasteriranje je spomenuto s ciljem analize u viedimenzionalnom prostoru. Premda


ima raznih primjena, ova metoda, uz vizualizaciju, posebno je zanimljiva za primjenu
na podruju ovog rada.

Vie je pak razloga za odabir REFII modela. Osim to ga je mogue iskoristiti kao alat
za pretprocesiranje, njegova primjena za analizu podataka koji imaju svojstvo oscilacije
u vremenu kombinira jednostavnost primjene i snagu metoda procesiranja vremenskih
serija. Koliina ekspertnog znanja moe no i ne mora biti preprekom za primjenu ove
metode. Meutim, kvalitetniji rezultati svakako e zahtjevati to veu razinu istog.
Uslijed elje da se sadrajno obuhvati sve navedeno, pri koritenju REFII modela
koncentrirao sam se na analizu putem kutnog otklona dok za ovo istraivanje nisu
koritene ostale mogunosti REFII modela (analiza povrine ispod krivulje).

98
6.3. Otkrivanje varijabli utjecaja
Odnose meu kategorijama mogue je promatrati kao zakonitosti iz kojih je direktno
mogue izvoditi pravila ili kao pokazatelje pojedinih podruja zanimljivih za
istraivanje.

Boxplot grafikoni (Prilog 1) prikazuju vrijednost varijabli prema danima u tjednu. Izvan
oblika prikazane su ekstremne vrijednosti dok su objektima prikazane minimalne i
maksimalne vrijednosti, srednja vrijednost i prosjeno odstupanje. Iz grafikona se vide
najvea odstupanja kod prodaje enske konfekcije i najmanja kod prodaje enskog
rublja.

Analiza relevantnosti atributa provedena je za sve kategorije robe kao ciljne varijable,
pri emu su iste kategorizirane prema pravilima u Prilogu 2. Analiza relevantnosti
atributa nalazi se u Prilogu 3. Izvedena je Python Orange modulom i bazira se na Gini
indeksu, koji pokazuje vjerojatnost da dva nasumce odabrana uzorka ne pripadaju
navedenoj kategoriji.

6.3.1. Prodaja enske trikotae


Analiza pokazuje da je, prema promatranim podacima, prodaja enske trikotae
najosjetljivija na promjenu prodaje muke trikotae zatim enskog rublja, muke
konfekcije, enske konfekcije, obue, nakon ega slijedi dan u tjednu, godinje doba,
temperatura, vlaga, dok je vrlo malo osjetljiva na koliinu oborina i datum[3] u mjesecu
(kao to je vidljivo u Prilogu 2. promatrani mjeseci podjeljeni su na treine (1-10, 10-
20, 20-31) pri emu varijabla nosi naziv datum[3] i, drugom varijablom, datum[7] na
sedam podruja oko "okruglih" datum u mjesecu, s ciljem da se potencijalno uoi
pravilnost vezana uz npr. datum isplate osobnih dohodaka i sl.).

Poslovna interpretacija navodi na postojanje znaajnije povezanosti izmeu prodaje


enske trikotae te muke trikotae, enskog rublja, muke konfekcije i enske
konfekcije. Pretpostavka moe biti da potroai (vjerojatno enskog spola) pri kupnji
enske trikotae ee kupe i poneto osobama mukog spola te pokoji proizvod iz
grupe enskog donjeg rublja dok se, ako im je primarni cilj bila trikotaa, u manjem

99
broju sluajeva odluuju za neki konfekcijski proizvod i to prije muki nego enski.
Ovo moe upuivati i na obiteljsku kupovinu odnosno na situaciju u kojoj obitelj ciljano
krene u nabavku nove odjee ili na pomisao da enska osoba u obitelji kupuje za cijelu
obitelj.

6.3.2. Prodaja muke trikotae


Prodaja muke trikotae najosjetljivija na promjenu prodaje muke konfekcije zatim
enske trikotae, enskog rublja, enske konfekcije, obue, nakon ega slijedi dan u
tjednu, godinje doba, temperatura, koliina snijega, dok je vrlo malo osjetljiva na
datum u mjesecu[3] i koliinu oborina.

Poslovna interpretacija upuuje na pretpostavku da se potroai (vjerojatno mukog


spola) esto pored konfekcijskog proizvoda odluuju i za proizvod iz grupe muke
trikotae. Jednostavnije reeno uz npr. odijelo odluit e se i za poneku majicu. Slijedi
povezanost s enskom trikotaom pa enskim donjim rubljem.

6.3.3. Prodaja enske konfekcije


Prodaja enske konfekcije najosjetljivija na promjenu prodaje muke trikotae zatim
muke konfekcije, enskog rublja, obue, enske trikotae, nakon ega slijedi dan u
tjednu, godinje doba, temperatura, dok je vrlo malo osjetljiva na datum u mjesecu[3] i
oborine.

Prodaja enske konfekcije u je najveoj mjeri povezana sa mukom gupom proizvoda,


trikotaom. Nakon toga slijedi muka konfekcija pa ensko rublje. Ponovno otkrivena
povezanost enske i muke grupe proizvoda na neki nain potvruje pretpostavku da su
enske osobe dominantniji potroai koji donose odluke za cijelu obitelj. Zanimljivo je
da se tek u manjem broju sluajeva uz ensku konfekciju prodaje i enska trikotaa bez
obzira na prirodnu povezanost ovih grupa proizvoda (npr. majica ispod enskog
kompleta). Ovo moe ukazivati na injenicu da se odluka o kupnji u manjem broju
sluajeva donosi za cijeli komplet proizvoda a ee u funkciji dopune postojee
garderobe.

100
6.3.4. Prodaja muke konfekcije
Prodaja muke konfekcije najosjetljivija je na promjenu prodaje muke trikotae, enske
konfekcije, enske trikotae, enskog rublja, obue, nakon ega slijedi dan u tjednu i
godinje doba, dok je vrlo malo osjetljiva na vlagu i datum u mjesecu[3].

Muke grupe proizvoda potvruju manje zanimljive ovisnosti. Prirodna povezanost


konfekcije i trikotae ovdje je znaajnije zastupljena. Povezanost sa enskom
trikotaom upuuje na zajednike kupovine pri kojima se dogodi i poneka odluka o
kupnji proizvoda iz grupe ensko rublje.

6.3.5. Prodaja obue


Prodaja obue najosjetljivija je na promjenu prodaje enske konfekcije, muke trikotae,
enske trikotae, enskog rublja, muke konfekcije, nakon ega dolazi dan u tjednu,
godinje doba i temperatura, dok je vrlo malo osjetljiva na datum u mjesecu [3] i
oborine.

Poslovna interpretacija ukazuje da je prodaja obue ee povezana uz osobe koje


kupuju ensku konfekciju (vjerojatno enski spol). Pretpostavka na neki nain potvruje
ensku sklonost obui. Detaljnija analiza u kategoriji obue zasigurno bi pokazala jo
zanimljivije rezultate (vrsta obue, vrsta konfekcijskih proizvoda itd.). Trend u modi u
kojem sve dominantniju ulogu ispred tzv. klasinog zauzima sportski, tzv. casual stil na
neki je nain potvren povezanou obue i trikotae.

6.3.6. Prodaja enskog rublja


Prodaja enskog rublja najosjetljivija je na promjenu muke trikotae, enske trikotae,
enske konfekcije, muke konfekcije, obue, nakon ega slijedi dan u tjednu, godinje
doba, dok je vrlo malo osjetljiva na oborine i koliinu snijega.

Povezanost prodaje enskog rublja i trikotae ne istie se niim neobinim.


Nepostojanje zanimljivijih povezanosti moe se opisati injenicom da se, ako je
primarni predmet kupnje, ensko rublje najee kupuje bez kombinacije s nekim
drugim proizvodom.

101
Kada bismo imali na raspolaganju dodatne podatake o spolu potroaa oni bi zasigurno
dodatno konkretizirli odnose. Pretpostavke poput navedenih predstavljaju podlogu za
istraivanje odjela u tvrtkama koji se bave ovim pitanjima. Ovisno o opsegu istraivanja
nakon postavljanja ovakvih hipoteza ide se u detaljnije istraivanje.

U ovom radu koristio sam se podacima sumiranim na dnevnoj razini. Postojanje


podataka o pojedinanim kupnjama (raunima) te uvoenjem potroakih kartica koje bi
pomogle da se dodatno personalizira kupnja prema kupcu (njegovoj dobi i sl.)
omoguavala bi tzv. analizi potroake koarice i, jo bolje, analizu unakrsne prodaje
analizu. Potroaka koarica zamiljena je vie kao model za analizu dok analiza
unakrsne prodaje (pronalaenje odnosa izmeu artikala koji se esto povezano zajedno
prodaju) upravo u tekstilu moe biti zanimljiv odmak od uobiajenih pristupa. Kvaliteta
i razina podataka koji se dobijaju iz skladita ovdje su bili kljuan ograniavajui faktor
o kojem bi trebalo razmiljati pri gradnji takvih sustava.

Pouzdanost navedenih pretpostavki moemo provjeriti primjenimo li na kategorizirane


podatke metodu asocijacijskih pravila. Moemo utvrditi da navedene pokazatelje
proiruju asocijativna pravila prikazana u Prilogu 5 pa je tako (brojevi oznaavaju
support/pojavnost i confidence/pouzdanost vrijednosti) s prilinom pouzdanou
vidljivo da visoka prodaja muke konfekcije znai i visoku prodaju muke trikotae. Na
slian nain, s visokim stupnjevima pouzdanosti, vidljive su i ostale pretpostavke.

pojavnost pouzdanost pravilo


0.249 0.752 PRO_TRIKOTAZA_MUSKA=3 -> PRO_KONFEKCIJA_MUSKA=3
0.249 0.827 PRO_KONFEKCIJA_MUSKA=3 -> PRO_TRIKOTAZA_MUSKA=3
0.241 0.793 PRO_RUBLJE_ZENSKO=3 -> PRO_TRIKOTAZA_MUSKA=3
0.241 0.727 PRO_TRIKOTAZA_MUSKA=3 -> PRO_RUBLJE_ZENSKO=3

6.4. Otkrivanje odnosa meu varijablama


Pretpostavimo da elimo odgovoriti na pitanje u kojem dijelu mjeseca moemo
oekivati veu prodaju. Danas u naoj zemlji este pekulacije upravo govore o tome da
djelatnici kad prime plau i plate osnovne ivotne potrebe, kreu u potragu za tekstilnim

102
proizvodima. Prilog 4 pokazuje odnose prodaje promatranih kategorija, dana u mjesecu
grupiranih u kategorije te godinjeg doba.

Nadovezujui se na podatke o utjecajnim varijablama oiti su prodajni maksimumi u


proljee izmeu 10. i 15. u mjesecu kod svih kategorija. Takoer je zanimljivo vidjeti
prodaju svih kategorija u zimskim mjesecima u kojima su vrijednost na poetku
mjeseca vrlo niske nakon ega rastu i ljetnih u kojima su vrlo visoke nakon ega
opadaju. Pronalaenje "skrivenog" datuma u mjesecu povezanog sa estom
pretpostavkom da se u kupovinu kree "kad stigne plaa" teko je jednoznano uoiti no
u peroidu oko 10. u mjesecu u gotovo svim kombinacijama zabiljeen je rast prodaje.

Znaajnost u odnosima pojedinih varijabli ilustrirat u primjenom CHAID analize i


prikazom u obliku stabla odluivanja. Stabla s varijablom prodaje svake pojedine
kategorije nalaze se u Prilogu 6.

Iz analize je vidljivo da je prodaja enskog rublja u najveoj mjeri (52,05%, n=190) bila
srednje vrijednosti. Najutjecajnija slijedea varijabla bila je prodaja muke trikotae. Na
sluajeve visoke (>SREDNJA) prodaje muke trikotae otpada 33,15% unutar ega
72,73% na visoku prodaju rublja. Na sluajeve srednje (NISKA,SREDNJA) prodaje
muke trikotae otpada 49,32% unutar ega 87,22% na srednju prodaju rublja. Vano je
pratiti broj sluajeva kako bismo istovremeno kontrolirali pouzdanost odnosno
razlikovali pouzdanost od trenutnih oscilacija ili modnog hira. Analizirajui sljedee
grananje kao znaajna varijabla (prodaja rublja visoka prodaja muke trikotae) u
gornjem dijelu stabla definirana je enska trikotaa i to sa takoer kategorijom visoka
(>SREDNJA). U donjem dijelu stabla (prodaja rublja srednja prodaja muke
trikotae) odabran je dan u tjednu, posebno subota sa ak 10,14%. Znaajniji pokazatelj
u slijedeim granama vidljiv je u donjoj grani (prodaja rublja srednja prodaja muke
trikotae dan /svi osim subote i nedjelje/ ) i to dan u mjesecu[7] pri emu prodaja u
prvom djelu mjeseca (do 12. u mjesecu) sudjeluje sa 15,89%.

Pri ciljnoj varijabli prodaje enske trikotae takoer su dominantne vrijednosti unutar
srednje kategorije. Sljedee grananje vreno je na prodaji muke trikotae. U treem

103
grananju zanimljivo je primjetiti utjecaj godinjeg doba odnosno tlaka zraka u donjem
djelu stabla.

Pri ciljnoj varijabli prodaje muke trikotae, prodaja muke konfekcije i prodaja enske
trikotae definirane su kao dominantne prema broju u uzorku. Zanimljivo je da slijed
muka trikotaa, visoka prodaja muke konfekcije ima znaajnu pojavu i u visokoj
prodaji enskog rublja nakon kojeg je kao znaajna odabrana prodaja enske konfekcije.
Bez detaljnijih podataka moemo tek pretpostaviti da se ovdje moe raditi o nekom
obiteljskom planskom kupovanju.

Ciljna varijabla prodaje obue povezana je s prodajom enske konfekcije a nakon toga u
oba grananja s godinjim dobom. Moemo pretpostaviti da pri kupnji enske konfekcije
strast prema obui ima prednost pred godinjim dobom (jesen/zima loe vremenske
prilike, proljee/ljeto obua za sport i rekreaciju) koje bi se moglo protumaiti kao
razumski utjecaj. Utjecaj naoblake, broja sunanih sati i temperature potvruju utjecaj
vremenskih prilika na kupnju.

Ciljna varijabla prodaje muke konfekcije nakon prodaje muke trikotae nalazi utjecaj
u godinjem dobu. Pretpostavka koja se moe formirati je da mukarci (ili netko za njih)
kupuju vie stvari (odjevnu kombinaciju) odjednom i to prema godinjem dobu odnosno
ovisno o vremenskim prilikama.

Ciljna varijabla prodaje enske konfekcije stablom je predstavljena u odnosu prema


prodaji muke trikotae. Pri visokoj prodaji muke trikotae visoka je i prodaja ciljne
varijable s proljeem kao znaajnim godinjim dobom. Pri srednjoj prodaji muke
trikotae srednja je i prodaja ciljne varijable s evidentnim utjecajem temperature pri
emu se moe rei da hladno vrijeme utjee na koliinu prodaje.

Interpretacija stabala odluivanja obavezno je praena biljeenjem slijednosti


promatranih podgrupa jer dijeljenjem poetnog uzorka pada znaajnost broja sluajeva
u manjim uzorcima (90% na 10 uzoraka i 50% na 1000 uzoraka ima razliite
implikacije).

104
Valja napomenuti da faktor cijene nije ukljuen u analizu odnosno da su proizvodi
trikotae oni za koje odluka o kupnji esto ima manje predradnji. Navedene
interpretacije potvruju ranije izneene meuovisnosti.

Kao pomo pri istraivanju moemo se koristiti metodama grupiranja podataka.


Najee se grupiraju odreeni trini segmenti ili odredine skupine potroaa.
Obzirom varijable koritene u istraivanju predstavljaju vremenske prilike, sljedei
primjer ilustrira koritenje algoritma k srednjih vrijednosti u stvaranju dva klastera
vremenskih prilika koje je nakon toga mogue promatrati u kontekstu prodaje i ostalih
varijabli.

Postupak klasteriranja i karakteristike klastera prikazani su na slici 6.1.

SLIKA 6.1. Klasteriranje provedeno algoritmom k srednjih vrijednosti alatom SPSS

Specijalizirani alati na temelju podataka prema unaprijed utvrenim pravilima metode


formiraju poetne vrijednosti varijabli koje ine klaster (initial cluster centers). Nakon
iterativnog postupka utvrivanja klastera prikazan je konani rezultat te prikazan broj
sluajeva u svakom klasteru (number of cases in each cluster). Vano je voditi rauna o

105
tome da broj sluajeva u klasterima bude podjednako zastupljen. U navedenom sluaju
od ukupno 385, 179 ih je u klasteru 1 a 186 u klasteru 2. Konane vrijednosti sredita
klastera prikazane su u tablici (final cluster centers).

Nakon formiranja klastera, jedan jednostavan primjer ilustrira vizualizaciju prodaje


enskog rublja kroz period od godine dana prema klasterima pri emu moemo
zakljuiti da klaster 2 biljei vee vrijednosti prodaje. Karakteristike tog klastera su
umjerena temperatura, umjeren tlak, malo oborina, bez snijega, umjeren broj sunanih
sati, umjerena koliina vlage i naoblake. Moemo rei razmjerno ugodan, topao dan kao
stvoren za kupnju.

SLIKA 6.2. Scatterplot dijagram odnosa temperature i prodaje obojan prema izraenim
klasterima

Razni oblici vizualizacije omoguuju nam da lake percipiramo odreene odnose.


Problem nastaje u viedimenzionalnom prostoru pri emu tehnike klasteriranja pomau
prebroditi ogranienja viedimenzionalne percepcije. U navedenom primjeru analizirali
smo osam varijabli kroz klaster i dvije u dvodimenzionalnom grafu.

Osim ilustracijski, ovaj pristup prouavanju odnosa nee biti detaljnije razraivan u
ovom radu.

106
6.5. Otkrivanje pravilnosti u trendovima prodaje tekstilnih proizvoda
pomou REFII modela
Ranije prikazana naela REFII modela sada emo prikazati u praksi na stvarnom uzorku
podataka. Vrijednosti kategorija zavisnih varijabli transformirani su u REFII model
programskim rjeenjem Time Explorer. Postupak transformacije sastoji od nekoliko
faza.

SLIKA 6.3. pojednostavljen prikaz REFII modela

vremenska interpolacija; formiranje samostalnog vremenskog niza na intervalu


<1..n> (Dani, tjedni, mjeseci, kvartali, godine) sa vrijednou 0; interpolacija
nedostajuih vrijednosti u vremenskoj seriji kao 0 na temelju formiranog niza,
vremenska granulacija vremenske serije (dani, tjedni, mjeseci) koritenje
statistikih funkcija AVG(), SUM(), MOD() na razini granuliranog odsjeka,
normiranje na osnovu izraza za min-max normizaciju,
primjena REF pravila,
transformacija kutnog otklona,
povrina ispod krivulje; numerika integracija metodom pravokutnika,
kreiranje vremenskih indeksa graenje hijerarhijskog stabla indeksa (indeks
moe biti i artibut npr. ifra klijenta),
opcionalno povezivanje tablice transformacije s relacijskim tablicama
(atributskim vrijednostima),
kreiranje razreda kombinacije povrina i otklona kuteva

rezultat ega je matrica transformacije koja je prikazana u Prilogu 7.

107
SLIKA 6.4. Time Explorer

Program omoguuje da se u nekoliko koraka agregiraju podaci te definiraju radni


parametri. Navedeno je prikazano slikom 6.5.

SLIKA 6.5. Transformacija podataka u REFII model

Definicije razreda kutnih otklona definiraju granice u kojima se odreuju kategorije


podataka. Zbog sloenosti postupaka u ovom radu koritena je samo analiza na temelju
kutnih otklona. U alat je mogue unijeti eljene vrijednosti kutnih otklona te imena
razreda. Koritene vrijednosti navedene su u tablici 6.1.

108
Razred Donja granica Gornja granica REF
Nizak rast 0.000000000 0.300000000 R
Srednji rast 0.300000000 0.700000000 R
Visok rast 0.700000000 1.000000000 R
Nizak pad 0.000000000 0.300000000 F
Srednji pad 0.300000000 0.700000000 F
Otar pad 0.700000000 1.000000000 F
Bez promjene 0.000000000 0.000000000 E

TABLICA 6.1. Razredi kutnih otklona

Transformacije su provedene za kategorije: prodaja enskog rublje, srednja dnevna


temperatura, dnevni postotak vlage, prodaja obue, prodaja enske i muke konfekcije
pri emu su u daljim analizama koriteni oni za koje se pokazala najvea osjetljivost.

Analizom trendova (rast, pad, bez promjene) kroz vrijeme elimo prouavati zavisnosti,
odnose i pravilnosti te pri tome rezultate razmatrati kroz prizmu poslovne primjene u
prodaji tekstilnih proizvoda.

6.5.1. Otkrivanje sezonskih oscilacija u trgovini tekstilnim proizvodima


U procesiranje podataka kroz Time Explorer ugraeno je pozivanje skriptnog jezika
alata SPSS koji na temelju dobivenih podataka izradi tablice sezonskih oscilacija koje
su prikazane u Prilogu 8.

Uvidom u tablice prije svega potrebno je napomenuti da trgovine ne rade nedjeljom


stoga vrijednosti koje prikazuju pad nedjeljom i rast ponedjeljkom zapravo su posljedica
te injenice. Ono to te vrijednosti mogu otkriti jest da, ako se radi o otrom rastu u
ponedjeljak, to znai iznimno visoku vrijednost prodaje ponedjeljkom odnosno nizak
pad u nedjelju oznaava nisku vrijednost prodaje subotom.

U pogledu na podatke o prodaji enske konfekcije istie se vrijednost niskog pada


prodaje subotom (80,8% sluajeva), vrijednost srednjeg pada prodaje nedjeljom (86,5%
sluajeva), vrijednosti srednjeg rasta ponedjeljkom (78,8% sluajeva) te niskog rasta
utorkom (69,2% sluajeva). Srednji rast ponedjeljkom sugerira umjerenu prodaju
ponedjeljkom koja raste prema sredini tjedna uz sve vee oscilacije. Srednji pad

109
nedjeljom za koju znamo da nije radna sugerira lou prodaju subotom (ovdje zapravo
oekujemo otar pad) to uvidom u podatke moemo zakljuiti jer poinje ve u petak
(nizak pad 50,0%).

U pogledu na podatke o prodaji muke konfekcije istie se vrijednost niskog rasta


petkom (65,4% sluajeva), srijedom (67,3% sluajeva), srednji pad nedjeljom (63,5%
sluajeva) te srednji rast ponedjeljkom (67,3% sluajeva). Vrijednosti u nedjelju i
ponedjeljak imaju isto znaenje kao i u ranijem sluaju. Rast prodaje srijedom i petkom
povezan je s oscilacijom tj. svojevrsnom stagnacijom etvrtkom (nizak pad 42,3%,
nizak rast 48,1%) i produuje se prema suboti.

U pogledu na podatke o prodaji obue istie se vrijednost srednjeg rasta ponedjeljkom


(59,6% sluajeva) te niskog rasta petkom (61,5% sluajeva). Slabiji postotak pada
nedjeljom upuuje na lou prodaju subotom. Takoer, mala vrijednost rasta nedjeljom
moe upuivati na pogreku u podacima u skladitu podataka koja za potrebe ovog rada
nije pomnije istraivana zbog minornog utjecaja.

U pogledu na podatke o prodaji enskog rublja istiu se vrijednosti srednjeg pada


nedjeljom (82,7% sluajeva), niskog pada subotom (92,3% sluajeva), niskog rasta
utorkom (61,5% sluajeva) te srednjeg rasta ponedjeljkom (88,5% sluajeva). Rezultati
upuuju na dobru prodaju utorkom odnosno lou subotom.

Odnosi sezonskih oscilacija naznauju nizak pad prodaje enskog rublja i enske
konfekcije subotom (92,3% sluajeva i 80,8% sluajeva) to upuuje na zakonitost.
Znaajniji postotak srednjeg pada nedjeljom karakteristika je enske konfekcije, muke
konfekcije i enskog rublja. Sve kategorije biljee znaajniji postotak srednjeg rasta
ponedjeljkom pri emu se dijelom taj rast biljei i utorkom, dakle, prodaja raste u
prvom djelu tjedna.

Detaljnijom analizom ostalih utjecajnih varijabli dodatno bi se konkretizirala slika


odnosa no ovdje sam se zadrao na primjenjivosti navedene metode.

110
Sezonske oscilacije mogu se u ovom kontekstu upotrijebiti kroz usporeivanje
povijesnih podataka te zakonitosti koje se ponavljaju kako bi se izdvojile one
najznaajnije i primjenom ostalih metoda protumaili njihovi uzroci.

6.5.2. Direktno otkrivanje pravila iz vremenskih serija


Primjenom asocijacijskih pravila na transformirane podatke dodatno moemo potvrditi
pretpostavke do kojih smo stigli analizom sezonskih oscilacija. Tako upotrebom Orange
Python modula generirana asocijacijska pravila uz 20% pojavnost i 60% pouzdanosti
dobijamo slijedee vrijednosti.

pojavnost pouzdanost pravilo


0.250 0.689 Konf_zen=Nizak pad -> Rublje_zensko=Nizak pad
0.250 0.674 Rublje_zensko=Nizak pad -> Konf_zen=Nizak pad
0.288 0.660 Vlaga=Nizak pad -> Srednja_temp=Nizak rast
0.247 0.726 Konf_zen=Nizak rast -> Konf_muska=Nizak rast

Uobiajeni postotci pouzdanosti, iako bismo eljeli to je mogue vee vrijednosti,


preko 60% smatraju se dobrim rezultatima. Naznaeni odnosi potvruju ranije izreene
pretpostavke. Postotak pojavnosti u ovom kao i u ranijem sluaju moramo uzeti u
kontekstu broja podataka koji su bili jednaki broju dana u godini, dakle radi se o
relativno malom broju podataka.

Direktno otkrivanje znanja moe se predstaviti stablima odluivanja. Sljedee stablo


generirano je s ciljnom varijablom prodaja enskog rublja. Znaajnost utjecaja pojedinih
varijabli preglednije je vidljiva ovakvim nainom prikazivanja. Takoer pojedini alati
(SPSS Answer Tree 3.0) imaju razne dodatne mogunosti kojima je mogue inicijalno
izgraeno stablo mijenjati izmjenama eljenih prediktora i ukidanjem pojedinih grana
to otvara dodatne mogunosti iskoritavanja ekspertnog znanja (koliko imamo poznat
sekundarni cilj)

111
SLIKA 6.6. Stablo odluivanja izgraeno na podacima iz REFII modela

6.5.3. Analiza osjetljivosti trendova pomou Bayesove mree


U prilogu 9 nalazi se prikaz Bayesove mree izraen u alatu Hugin Lite 6.4 a
primjenom podataka dobivenih iz REFII modela. Model A izraen je upotrebom
arobnjaka (wizard) u alatu dok je model B sastavljen prema vlastitom nahoenju i
ekspertnom znanju do kojeg sam doao iskustvom u svakodnevnom radu i ovim
istraivanjem.

Prilog pokazuje model s poetnim vrijednostima uvjetne vjerojatnosti pri emu strelice
u vezana predstavljaju smjer ovisnosti pa tako u modelu prodaja obue i muke
konfekcije ovisi o godinjem dobu, prodaja obue ovisi o prodaji muke konfekcije,
prodaja muke konfekcije ovisi o prodaji enske konfekcije, dan u tjednu utjee na
prodaju enske konfekcije, prodaja enske konfekcije ovisi o prodaji enskog rublja te
dan u tjednu utjee na prodaju enskog rublja. Na isti nain moe se interpretirati i
model B.

Definiranjem pojedinih vrijednosti mrea preko koeficijenata uvjetne vjerojatnosti


mijenja ostale vjerojatnosti te nam konkretizira traene indikatore.

Kao primjer za zadane sve vrijednosti kako je prikazano u tablici mrea A predvia
trend prodaje enske konfekcije. Upotrebljivost ovakvog pristupa sastoji se u tome to
pripremljeni model moe biti prezentiran osobama koje imaju poslovna znanja (kad se

112
mrea jednom formira nju mogu koristiti npr. menaderi) kojima mogu pretraivati
zakonitosti koje su im zanimljive.

Prodaja Prodaja en. Prodaja muke


MODEL A Dan u tjednu Prodaja obue Godinje doba
enskog rublja konfekcija konfekcije
Zadane Nizak pad PETAK Nizak pad Nizak pad ZIMA
vrijednosti (100%) (100%) (100%) (100%) (100%)
Mogue Nizak rast
vrijednosti (14,09%)
Nizak pad
(85,91,%)

Pogledajmo rezultate vjerojatnosti kategorija pri srednjem rastu prodaje svih kategorija.

Prodaja Prodaja en. Prodaja muke


MODEL A Dan u tjednu Prodaja obue Godinje doba
enskog rublja konfekcija konfekcije
Zadane Srednji rast Srednji rast Srednji rast Srednji rast
vrijednosti (100%) (100%) (100%) (100%)
Mogue SUBOTA ZIMA
vrijednosti (2,50%) (21,58%)
PONEDJELJAK PROLJEE
(95,00%) (27,11%)
UTORAK LJETO
(2,50%) (24,11%)
JESEN
(27,20%)

Pogledajmo rezultate vjerojatnosti kategorija pri visokom rastu prodaje enskog rublja,
etvrtkom, visokom rastu prodaje obue u proljee.

Prodaja Prodaja en. Prodaja muke


MODEL A Dan u tjednu Prodaja obue Godinje doba
enskog rublja konfekcija konfekcije
Zadane Visok rast ETVRTAK Visok rast PROLJEE
vrijednosti (100%) (100%) (100%) (100%)
Mogue Srednji rast Srednji rast
vrijednosti (70,80%) (100%)
Visok rast
(29,20%)

Postojanje informacijskog sustava visokog stupnja raspoloivosti i kvalitetno


izgraenog skladita podataka mogue je provoditi ove analize u potrazi za zanimljivim,
poslovno primjenjivim zakonitostima.

113
Analizirani model A potvrdio je ranije predstavljene utjecaje (promjenu varijable u
odnosu na zavisne) i odnose (stupanj promjene) te ilustriranim vezama sugerirao na
smjer i prirodu utjecaja pojedinih varijabli u modelu. Pri provoenju analize mora se
voditi rauna o smjerovima meuovisnoti (ilustrirani strelicma) koji upuuju na znaaj
pojedinih veza i navode na smjer kojim bi trebalo interpretirati rezultate. Naravno,
mrea e funkcionirati bez obzira na uvaavanje ovih pretpostavki, no za vei stupanj
pouzdanosti nuno je znati kako funkcionira.

Model B namjerno je izgraen kao malo sloeniji. Varijabla praznik naelno se


pokazala loom za predikciju obzirom se radi o podacima samo unutar jedne godine i
podacima o prodaji (praznikom je ona uvijek nula) pa varijabla ima sklonost odvui
model u odreeno podruje. Praznik, postotak vlage i srednja dnevna temperatura
dodani su u model.

Pogledajmo rezultate ove mree za prvi sluaj koji je primjenjen na mrei A. Rezultati
su slini uz veliki postotak niskog rasta temperature i blagu dominaciju trenda pada
relativne vlanosti.

Prodaja Prodaja Prodaja


Dan u Prodaja Godinje
MODEL B enskog en. Praznik Vlaga muke Temp.
tjednu obue doba
rublja konfekcija konfekcije
Nizak Nizak
Zadane PETAK Nizak pad ZIMA
pad pad
vrijednosti (100%) (100%) (100%)
(100%) (100%)
Mogue Nizak rast NE Nizak rast Nizak rast
vrijednosti (3,40%) (100%) (38,83%) (74,86%)
Nizak pad Nizak pad Nizak pad
(96,43,%) (49,97,%) (24,91,%)

Same smjernice veza mogu nam ilustrirati njihovu vanost. Istraivau preostaje
odabrati ili odbaciti ostale odnosno prihvatiti sugestiju sustava za modeliranje da neke
varijable ispusti uslijed irelevantnog utjecaja.

Rezultati ovih modela dodatno potvruju ranije spomenute pretpostavke.

114
6.7. Potencijali poslovne primjene dobivenih rezultata analize
Tvrtke koje nemaju viziju primjene ovih metoda a bave se odnosima nalik opisanima u
radu svakako bi trebale razmotriti potencijale primjene u vlastitom poslovanju.
Istraivanje je provedeno prikupljanjem podataka iz skladita podataka koje nije
specifino izgraeno u svrhu ovakvih analiza pa stoga ne sadri pojedine podatke, niti
za postojee podatke posjeduje razinu koja bi omoguila detaljnije analize. Bez obzira
na spomenuto, metode rudarenja i posebno REFII model daju drugaiju projekciju
ovisnosti koritenih varijabli te impliciraju na zakonitosti koje i na prikazanoj razini
navode na razmiljanje i evidentno ih je mogue primijeniti u poslovno promidbenim
aktivnostima.

Kao ilustraciju, elio bih spomenuti mogunost kombiniranja ovih podataka s podacima
o stanovnitvu. Ranije spomenuti podaci o naseljenosti i nekim drugim pokazateljima
mogu se koristiti bilo kao potencijal za otvaranje novih prodavaonica bilo za
promatranje utjecaja prodaje kroz podatke o potroaima koji su naseljeni na
odreenom podruju. Jedan od problema tekstilne trgovine je specijaliziranost
prodavaonica uslijed velikog broja razliitih robnih grupa to nije sluaj s, recimo,
trgovinama robe iroke potronje. Drugi problem je neravnomjeran raspored trgovina
prema gradskim etvrtima za koje gradske institucije prate statistiku pa bi provoenje
ovakovog istraivanja otkrilo svojevrsne specifinosti koje se tretiraju poslovnim
tajnom. Trea i, za mene najvanija prepreka zbog koje navedene istraivanja nisam
provodio u ovom radu, jest potreba ekspertnih znanja u definiranju parametra
potencijala odreenog prodajnog mjesta kao funkcije oekivane frekvencije
posjeenosti, blizine ustaljenih potroakih puteva, atraktivnosti lokacije, ureenja
prodajnog mjesta i same robe (brand i sl.).

U velikim gradovima sve se vie izdvajaju zone kupovanja u kojima je potroaima na


raspolaganju najraznovrsnija ponuda i koji su najee izvan grada. Posjeivanje takvih
zona u potrazi za raznim proizvodima esto utjee i na odluku potroaa da kupi neto
samo zato to mu je u promatranom trenutku dostupno. Bez obzira na takve zone,
odreeni postotak otpada i na potroae koji e neke proizvode potraiti upravo u blizini
mjesta stanovanja. Identifikacijom takvih proizvoda u razmatranje gradskih etvrti s

115
potencijalno znaajnom potranjom moe rezultirati dobrim poslovnim rezultatom.
Podjela na etvrti prikazana je u Prilogu 10.

SLIKA 6.7. Prikaz broja stanovnika prema dobi i nekim gradskim etvrtima

Upravo kombiniranje raznih tehnika, podataka iz raznih izvora i ekspertnog znanja


dovodi tvrtku u poziciju da razmatra pojedine odluke na kvalitetniji nain s veim
brojem injenica i moguih implikacija. Uvaavanje takvog pristupa otvara mogunost
stalnog propitivanja i podizanja kvalitete poslovanja. Dodatni odmak moe se uiniti
povezivanjem ovakvih sustava sa zemljopisnim kartama. Mnogi alati na tritu ve
imaju ugraene mape te definirane postupke kojima je potrebno pripremiti podatke.
Time se dodatno poveava kvaliteta spomenutih informacija.

116
7. ZAKLJUAK
Ovaj rad evidentno je pokazao primjenjivost metoda rudarenja podataka u trgovini
tekstilnim proizvodima. Kod ove vrste roba posebno izraen sezonski karakter te
mnotvo zavisnih utjecajnih varijabli pogodno je za obradu podataka ove vrste i
provoenje analiza na njima. Eventualan ograniavajui faktor izraen je u kvaliteti
dostupnih podataka i znanju istraivaa. Transakcijski sustavi koji se izrauju za
potrebe praenja poslovanja esto, upravo zbog karaktera robe koji implicira praenje
mnogih atributa, bivaju vrlo sloeni ili, nasuprot tome, krajnje pojednostavljeni na
osnovne funkcije dok postprocesiranjem omoguuju korisnicima uvid u ostale podatke.
Ovakav pristup najee rezultira prekasnim dobivanjem informacija, prekasnim da bi
se moglo pravovremeno reagirati na trine zahtjeve. Pomno planiranje, uz cjelovit
pristup potrebama transakcijskog ali i izvjetajnog dijela sustava, ovdje je od velike
vanosti.

Poslovnu vrijednost primjene odabranih metoda nemogue je kvantificirati u ovom radu


no dokazana .je njihova upotrebljivost u otkrivanju skrivenih informacija. Otkrivena
znanja poveavaju vrijednosti poslovnih informacija i ozbiljuju san svakog trgovca:
proniknuti u um potroaa. ak i u koritenom poslovnom kontekstu (model skladita
nije izgraen specifino za ovu uporabu, eksterni podaci su prikupljeni iz javnih izvora)
vidljiv je potencijal u pronalaenju zakonitosti. Nekoliko pretpostavki koje su proizale
i u nekoliko navrata potvrene znaajnijim postotokom vjerojatnosti evidentno upuuju
na obrasce u ponaanju potroaa. Moderne metode marketinga istiu potrebu za
segmentacijom trita i ciljanim marketingom kao nunima u dananje doba.
Kombiniranje segmentacije artikala sa spomenutim aktivnostima, uz primjenu metoda
rudarenja podataka, otvara nove mogunosti kako djelovanja tako i praenja rezultata
tih djelovanja na tritu.

Cjelovitost rudarenja podataka i dalje pribliavanje iznalaenju zakonitosti u ponaanju


potroaa mogua je jedino integracijom svih relevantnih podataka iz poslovnog
okruenja na odgovarajuoj razini detalja, uz odgovarajuu dostupnost u kombinaciji s
kvalitetnim podacima iz vanjskih izvora. Eventualna ogranienost nekih metoda
rudarenja ipak najvie ovisi o kvaliteti podataka.

117
Cilj primjene metoda rudarenja podataka je kvalitetnije donoenje poslovnih odluka te,
uz primjenu tehnologije, dostupnost podataka kako bi se uoavale i kombinirale
dugorone i trenutne zakonitosti i u skladu s njima reagiralo odgovarajuom poslovnom
politikom na zahtjeve sve nepredvidljivijeg trita.

118
POPIS KORITENIH IZVORA
Engel F.J., Blackwell D.R., Miniard W.P. (1995) "Consumer Behavior", The
Dryden Press
Han J., Kamber M. (2000) "Data Mining: Concepts and Techniques", Morgan
Kaufmann
Inmon, William H. (1992) "Building the data warehouse", Wiley
Kantardi M. (2003) "Data Mining: Concepts, Models, Methods and
Algorithms", Wiley
Kesi T. (1999) "Ponaanje potroaa", Adeco
Kimball R. (1996) "The Data Warehouse Toolkit", Wiley
Klepac G. (2001) "Primjena inteligentnih raunlanih metoda u managementu",
Sinergija
Klepac G. (2004) "Otkrivanje zakonitosti primjenom jedinstvenog modela
transformacije vremenske serije", radni materijal
Klepac G. (2000) "Otkrivanje zakonitosti iz perspektive poduzea primjenom
metoda umjetne inteligencije", Ekonomski fakultet Zagreb, magistarski rad
Kockar I. (2002) "Metode rudarenja podataka u kartinom poslovanju",
Ekonomski fakultet Zagreb, magistarski rad
Panian . (2002) "Izazovi elektronikog poslovanja", Narodne Novine
Panian ., (2003) "Odnosi s klijentima u e-poslovanju", Sinergija
Panian ., Klepac G. (2003) "Poslovna inteligencija", Masmedia
Pyle D. (1999) "Data preparation for Data Mining", Morgan Kaufmann
Rudd P.O. (2001) "Data Mining Cookbook - Modeling Data for Marketing,
Risk, and Customer Relationship Management", Wiley
Solomon M.R., Rabolt N.J. (2004) "Consumer Behavior in Fashion", Prentice
Hall
Sria V. Mller J. (2001) "Put k elektronikom poslovanju", Sinergija
Sria V., Spremi M. (2000) "Informacijskom tehnologijom do poslovnog
uspjeha", Sinergija

119
PUBLIKACIJE, LANCI, WEB IZVORI
Stanovnitvo, kuanstva i stanovi, publikacija, Gradski zavod za planiranje
razvoja Grada i zatitu okolia, Odjel za statistiku (2001)
Zbornik radova 9. konferencije hrvatske udruge Oracle korisnika (HrOUG)
(2004)

Abernathy F.H., Dunlop J.T., Hammond J.H., Weil D. (2002) "Globalization in


the Apparel and Textile Industries: What is New and What is Not?", Harvard
Center for Textile and Apparel Research Harvard University
Brezovnjaki A. (2004) "Just Do It", Poslovni magazin br. 11
Charniak E. (1991) "Bayesian Networks Without Tears", American Association
for Artificial Intelligence, http://www.aaai.org
Oreanin D. "BI - hit ili mit?", http://www.skladitenje.com,
Soljai I. "Tekstilna i odjevna industrija u hrvatskoj",
http//www.hatz.hr/hrv/glasnik/Ivo Soljacic.htm, 05.09.2004.
Vukovi L. (2004 )"Nove strategije privlaenja kupaca", Poslovni magazin, br.
11
Wang C.L., Hui A., Siu M., (2002) "Consumer decision-making styles on
domestic and imported brand clothing", http://www.emeraldinsight .com/0309-
0566. htm

Hugin Lite 6.4, http://www.higun.com


Orange modul za Python, Fakultet raunarstva i informacijskih znanosti
SPSS 12.0, http:/www.spss.com
Weka 3: Data Mining Software in Java, The University of Waikato,
http://www.cs.waikato.ac.nz/~ml/weka/index.html

Camper, http://www.camper.es
DHMZ, http://www.meteo.hr
Institut Ruer Bokovi, Data Mining Server, http://www.orb.hr
Mango, http://www.mango.es

120
MIT, http://www.ai.mit.edu
Nike, http://www.nike.com
Skladitenje podataka u Hrvata, http://www.skladitenje com
Webopedia, http://www.webopedia.com

121
POPIS ILUSTRACIJA I TABLICA
SLIKA 2.1. Stvaranje vrijednosti za klijenta u maloprodaji
SLIKA 2.2. Detalj on-line duana tvrtke Mango
SLIKA 2.3. Detalj on-line duana tvrtke Camper
SLIKA 3.1. Logika hijerarhija podataka, informacija i znanja
SLIKA 3.2. Shematski prikaz vrijednosti informacije kao vremenski promjenjive
veliine
SLIKA 3.3. Kontinuum vrijednsti informacije
SLIKA 3.4. Model sustava poslovne inteligencija zasnovan na rudarenju podataka
SLIKA 3.5. Dijagram tijeka manipulacije sustava tijekom postupaka
SLIKA 3.6. Tri hipoteze za dani set podataka
SLIKA 4.1. Taksonomija rudarenja podataka
SLIKA 4.2. Primjer primjene vizualizacije za unapreenje procesa klasteriranja
SLIKA 4.3. Grafiki prikaz Bayesove mree
SLIKA 4.4. Grafiki prikaz Bayesove mree i tablice uvjetne vjerojatnosti
SLIKA 4.5. Tri vrste veza meu elementima mree
SLIKA 4.6. Primjer jednostavnog stabla odluivanja
SLIKA 4.7. ID3 algoritam
SLIKA 4.8. Algoritam K-srednjih vrijednosti
SLIKA 4.9. Prikaz vremenske serije pomou vektora
SLIKA 4.10. Pretprocesiranje vremenske serije
SLIKA 4.11. Metodoligija procesuiranja vremenske serije data mining algoritmima
posredstvom REF II modela
SLIKA 4.12. Uloga koeficjenta kutnog nagiba pravca u REF II modelu
SLIKA 4.13. Etape u iotkrivanju znanja primjenom REF II modelu
SLIKA 5.1. Sloeni model ponaanja potroaa
SLIKA 5.2. Faze u modnom i tradicionalnom procesu donoenja odluka
SLIKA 5.3. Kontinuum donoenja odluka o kupnji
SLIKA 5.4. Uobiajen modni ciklus
SLIKA 5.5. Usporedba ciklusa prihvaanja za klasine, modne i hirovite proizviode
SLIKA 6.1. Klasteriranje provedeno algritmom k srednjih vrijednosti alatom SPSS

122
SLIKA 6.2. Scatterplot dijagram odnosa temeprature i prodaje obojan prema izraenim
klasterima
SLIKA 6.3. Pojednostavljen prikaz REFII modela
SLIKA 6.4. Time Explorer
SLIKA 6.5. Transformacija podataka u REFII model
SLIKA 6.6. Stablo odluivanja izgraeno na podacima iz REFII modela
SLIKA 6.7. Prikaz broja stanovnika prema dobi i nekim gradkim etvrtima

TABLICA 4.1. Orijentacijski odnosi izmeu tipa analize i elemenata REFII modela
TABLICA 6.1. Razredi kutnih otklona

123
IVOTOPIS
Roen sam 27. lipnja 1973. godine u Zagrebu. Srednju kolu, Centar za odgoj i
usmjereno obrazovanje Ivani Grad, zavravam 1992., sa zvanjem prirodoslovno-
matematiki tehniar. kolovanje nastavljam 1993. na Ekonomskom fakultetu
Sveuilita u Zagrebu. Diplomirao sam 1997. godine na katedri za vanjsku trgovinu,
tema diplomskog rada: Kasko osiguranje u brodskom prometu (praksa i rad vezani uz
Helios d.d. za osiguranje, Zagreb). Poslijediplomski studij Informatiki management
upisujem 2003. godine kao student VI. generacije.

U sijenju 1998. godine zapoljavam se u Domu zdravlja u Ivani Gradu kao pomonik
ravnatelja ustanove za informatiku i financije gdje radim do sredine 1999. godine. U
rujnu 1999. godine zapoljavam se u dionikom drutvu Tekstilpromet, u slubi
informatike, kao projektant/organizator. Na ovom radnom mjestu obavljam vie
funkcija voditelja/sudionika na razliitim projektima (evidencija radnih sati, carinsko
skladite, financijsko poslovanje, robno poslovanje) te sam aktivno ukljuen u projekte
organiziranja, razvoja i uvoenja aplikacija (baze podataka: ORACLE (7.1. 10g), MS
Access, Paradox, DBase; alati: Oracle Designer, Developer (3.0 9i), Oracle
Discoverer, T.O.A.D., SQL Expert). U sklopu radnih zadataka pohaam vie
specijaliziranih teajeva za rad s Oracle alatima.

Kao dodatna znanja navodim programske jezike: Basic, Pascal, Fortran, Clipper, SQL,
PL/SQL; alate/baze podataka: Oracle, MS Access, Borland/Inprise Delphi, DBase,
HTML i skriptni jezici (Java, JavaScript...), Macromedia Fireworks, Macromadia Flash,
Macromedia Dreamweaver

Sluim se engleskim jezikom u govoru i pismu.

124
SAETAK
Rad opisuje utjecaj globalizacije na trine aktivnosti kao to su nabava i udruivanje
tvrtki radi zajednikog nastupa na tritu. Prikazani su trendovi koji se mogu razabrati
kao posljedica sve otrijih trinih uvjeta. Kao projekcija buduih kretanja naznaen je
utjecaj interneta, a prikazani su i primjeri nekih svjetskih kompanija koje su se ve
odluile na poslovanje tim putem i naini na koji su to uinile. Uz odreenje pojma
poslovne inteligencije opisana je evolucija poslovnih informacijskih sustava. Ukazano
je i na neke specifinosti vezane uz njihovo projektiranje u svrhu podrke trgovini
tekstilnim proizvodima. Opisane su neke mogue primjene poslovne inteligencije u
poduzeima te prikazana naela skladita podataka i alata za analizu kao preduvjeta
rudarenju podataka. Uz pojam rudarenja podataka navedene su i pripadajue metode i
alati. Detaljnije su opisane odabrane metode, s naglaskom na REFII model kao hibridni
model, koji, osim analize, moe posluiti i kao alat za pretprocesiranje. Pojam i model
ponaanja potroaa proireni su specifinostima karakteristinim za tekstilne proizvode
koje se, pak, stavlja u kontekst odluke o kupnji. Razliiti utjecaji, koji utjeu na
ponaanje potroaa, prikazani su u kontekstu vrijednosti pogodnih za istraivanje
metodama rudarenja podataka. Analiza podataka izvrena je na uzorku prodaje u Gradu
Zagrebu. Podaci su analizirani odabranim metodama rudarenja podataka te stavljeni u
odnos s nekim vanjskim imbenicima u svrhu uoavanja zakonitosti u ponaanju
otroaa, zakonitosti meu kategorijama unutar podataka, za analizu sezonskih
oscilacija te predvianju trendova u budunosti.

125
SUMMARY
This study shows a globalization influence on market activities such as supply chain,
company mergers and/or joint-ventures. These trends could be identified as the result of
growingly severe market requirements. Future projections that include influence of the
Internet are described and associated with some examples and case studies of global
companies already utilizing it. Defining of the term business intelligence was combined
with information systems evolution description. Furthermore, the specific solutions to
information systems building, for the use in the textile product trade, were pointed out.
Some business intelligence applications were also described together with portraying
the data warehouses and analytic tools as preconditions for data mining methods and
instruments. In a more detailed manner, a hybrid model REFII was explained because it
can be used for analysis and data preparation at the same time. Specific characteristics
of consumer behavior related to textile products were shown in the context of decision
making process. Various motives that influence consumer behavior were recognized as
values set for the data mining analysis. The research was conducted on data sample that
included point-of-sale spots in the city of Zagreb, Croatia. Analysis included data
mining methods in relation to selected external factors with the purpose of finding
consumer behavior and category patterns, seasonal fluctuations and future sales
projections.

126
Prilog 1 Boxplot dijagrami kategorija

*uz pomo SPSS 12.0 Interactive Graph - Boxplot

127
Prilog 2 Kategorizacija podataka
Varijabla Vrijednost Varijabla Vrijednost
/ kategorije Naziv kategorije / kategorije Naziv kategorije
sek. trans. (<=) sek. trans (<=)

Datum u mjesecu [7] Konfekcija enska


1 2 -2 1 120 NISKA
2 7 3-7 2 400 SREDNJA
3 12 8-12 3 >400 VISOKA
4 18 13-18
5 22 19-22 Konfekcija muka
6 27 23-27 1 90 NISKA
7 >27 28+ 2 350 SREDNJA
3 >350 VISOKA
Datum u mjesecu [3]
1 10 1-10
2 20 11-20 Obua
3 >20 21+ 1 115 NISKA
2 360 SREDNJA
Srednja dnevna temperatura (C) 3 >360 VISOKA
1 0,00 HLADNO
2 10,00 PROHLADNO Trikotaa enska
3 20,00 TOPLO 1 90 NISKA
4 >20,00 VRUE 2 270 SREDNJA
3 >270 VISOKA
Srednja dnevna vrijednost tlaka zraka (HPa)
1 997,00 NIZAK
2 1003,00 SREDNJI Trikotaa muka
3 >1003,00 VISOK 1 150 NISKA
2 580 SREDNJA
Dnevna koliina oborina (mm) 3 >580 VISOKA
1 0,00 NEMA
2 5,00 UMJERENO Rublje ensko
3 <5,00 OBILNO 1 200 NISKA
2 1150 SREDNJA
Koliina napadnog snijega (cm) 3 >1150 VISOKA
1 0,00 NEMA
2 10,00 UMJERENO
3 >10,00 OBILNO

Sunanih sati u danu (h)


1 0,00 NEMA
2 4,00 MALO
3 8,00 UMJERENO
4 >8,00 MNOGO

Relativna vlanost
1 50,00 NISKA
2 75,00 SREDNJA
3 >75,00 VISOKA

Naoblaka (0 do 10)
1 1,00 VEDRO
2 4,00 POLUOBLANO
3 8,00 OBLANO
4 >8,00 VRLO OBLANO

Temperatura u 14:00 sati (C)


1 5,00 HLADNO
2 15,00 PROHLADNO
3 25,00 TOPLO
4 >25,00 VRUE

*uz pomo SPSS 12.0 Visual bander, kategorije formirane na temelju ekspertnog znanja i rezultata istraivanja

128
Prilog 3 - Analiza relevantnosti atributa

Trikotaa enska Trikotaa muka

Konfekcija enska Konfekcija muka

Obua ensko rublje

nazivi interpretacije predstavljaju ciljne varijable

*uz pomo Python Orange modul Rank Gini index

129
Prilog 4 Odnos: dan u mjesecu, godinje doba, prodaja

*uz pomo SPSS 12.00 Interactive Graph Line

130
Prilog 5 Asocijacijska pravila
supp conf rule
0.290 0.602 SERD_TLAK_HPA=3 -> PRO_OBUCA=2
0.323 0.670 SERD_TLAK_HPA=3 -> PRO_TRIKOTAZA_ZENSKA=2
0.340 0.626 VLAGA_POSTOTAK=2 -> SUNCANIH_SATI=4
0.340 0.821 SUNCANIH_SATI=4 -> VLAGA_POSTOTAK=2
0.244 0.618 VLAGA_POSTOTAK=3 -> PRO_KONFEKCIJA_ZENSKA=2
0.288 0.729 VLAGA_POSTOTAK=3 -> PRO_OBUCA=2
0.293 0.743 VLAGA_POSTOTAK=3 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.660 VLAGA_POSTOTAK=3 -> PRO_RUBLJE_ZENSKO=2
0.252 0.719 PRO_KONFEKCIJA_ZENSKA=3 -> VLAGA_POSTOTAK=2
0.403 0.770 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.403 0.850 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.403 0.717 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.403 0.850 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2
0.392 0.794 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.392 0.827 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.411 0.711 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.411 0.867 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.386 0.742 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.386 0.815 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.752 PRO_TRIKOTAZA_MUSKA=3 -> PRO_KONFEKCIJA_ZENSKA=3
0.249 0.711 PRO_KONFEKCIJA_ZENSKA=3 -> PRO_TRIKOTAZA_MUSKA=3
0.389 0.693 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.389 0.743 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2
0.441 0.894 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.441 0.843 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.463 0.801 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.463 0.885 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.414 0.795 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.414 0.791 PRO_KONFEKCIJA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.752 PRO_TRIKOTAZA_MUSKA=3 -> PRO_KONFEKCIJA_MUSKA=3
0.249 0.827 PRO_KONFEKCIJA_MUSKA=3 -> PRO_TRIKOTAZA_MUSKA=3
0.389 0.789 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.389 0.693 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.449 0.777 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.449 0.800 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.392 0.753 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.392 0.698 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2
0.466 0.806 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.466 0.944 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.430 0.826 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_MUSKA=2
0.430 0.872 PRO_TRIKOTAZA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.241 0.793 PRO_RUBLJE_ZENSKO=3 -> PRO_TRIKOTAZA_MUSKA=3
0.241 0.727 PRO_TRIKOTAZA_MUSKA=3 -> PRO_RUBLJE_ZENSKO=3
0.466 0.895 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.466 0.806 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.258 0.797 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.258 0.959 SERD_TLAK_HPA=3 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.247 0.763 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.247 0.849 SERD_TLAK_HPA=3 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.255 0.788 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.255 0.989 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.960 SERD_TLAK_HPA=3 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.805 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.266 0.907 VLAGA_POSTOTAK=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.266 0.924 VLAGA_POSTOTAK=3 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.266 0.674 VLAGA_POSTOTAK=3 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.249 0.958 VLAGA_POSTOTAK=3 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.249 0.850 VLAGA_POSTOTAK=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.632 VLAGA_POSTOTAK=3 -> PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.337 0.866 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2
0.337 0.644 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.337 0.711 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.359 0.814 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.359 0.916 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.359 0.891 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.359 0.728 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.359 0.686 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.359 0.757 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.364 0.787 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.364 0.887 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.364 0.905 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.364 0.630 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.364 0.696 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.364 0.769 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.342 0.828 PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.342 0.887 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.342 0.850 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.342 0.658 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.342 0.654 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.342 0.723 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2
0.337 0.866 PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.337 0.860 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.337 0.683 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.337 0.711 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2
0.353 0.787 PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.353 0.860 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.353 0.878 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.353 0.611 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.353 0.629 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.353 0.746 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.329 0.839 PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.329 0.851 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.329 0.816 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2
0.329 0.632 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.329 0.694 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2
0.373 0.800 PRO_TRIKOTAZA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.373 0.907 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.373 0.951 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.373 0.645 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.373 0.756 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.373 0.786 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.353 0.822 PRO_TRIKOTAZA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.353 0.915 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_MUSKA=2
0.353 0.902 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.353 0.679 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.353 0.717 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.353 0.746 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2 PRO_RUBLJE_ZENSKO=2

131
0.359 0.771 PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.359 0.929 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.359 0.873 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.359 0.689 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.359 0.621 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.359 0.757 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.340 0.873 PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.340 0.770 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.340 0.873 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.340 0.689 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.340 0.605 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.340 0.649 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2
0.351 0.780 PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.351 0.757 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.351 0.901 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.351 0.607 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.351 0.624 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.351 0.670 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.312 0.797 PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.312 0.755 PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.312 0.803 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2

*uz pomo Python Orange modul Association rules minimal support 20% (pojavnost) / minimal confidence (pouzdanost) 60% -
dio uzorka

132
Prilog 6 Stabla odluivanja

enska trikotaa

133
muka trikotaa

134
muka konfekcija

135
obua

136
enska konfekcija

137
ensko rublje

* uz pomo SPSS 12.0 Answer Tree 3.0 CHAID


minimum number of cases: parent node 10 / child node 5

138
Prilog 7 Podaci transformirani u REFII model
Rublje_zensko Dan Praznik Doba Srednja_temp Vlaga Obuca Konf_zen Konf_muska
Srednji rast CETVRTAK NE ZIMA Nizak rast Nizak rast Srednji rast Nizak rast Srednji rast
Nizak rast PETAK NE ZIMA Nizak rast Nizak pad Nizak rast Nizak rast Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak pad
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak rast Nizak pad Srednji pad Srednji pad
Bez promjene PONEDJELJAK DA ZIMA Nizak pad Nizak pad Bez promjene Bez promjene Bez promjene
Nizak rast UTORAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak rast SRIJEDA NE ZIMA Nizak pad Nizak pad Nizak rast Nizak rast Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak pad Nizak pad Nizak pad Nizak pad
Nizak rast PETAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad NEDJELJA NE ZIMA Nizak pad Nizak rast Nizak pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak rast Nizak rast Nizak rast Srednji rast Srednji rast
Nizak rast UTORAK NE ZIMA Nizak rast Nizak rast Nizak pad Nizak rast Nizak pad
Nizak pad SRIJEDA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak rast Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak rast Nizak rast Nizak rast Nizak pad Nizak rast
Nizak pad PETAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak rast
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak pad Nizak pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak pad Nizak rast Srednji rast Srednji rast Srednji rast
Nizak pad UTORAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad SRIJEDA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak pad Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak pad PETAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad SUBOTA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak pad Nizak rast
Nizak pad NEDJELJA NE ZIMA Nizak pad Nizak pad Srednji pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak pad Nizak pad Srednji rast Srednji rast Srednji rast
Nizak rast UTORAK NE ZIMA Nizak rast Nizak rast Nizak pad Nizak pad Nizak rast
Nizak pad SRIJEDA NE ZIMA Nizak pad Nizak rast Nizak rast Nizak pad Nizak pad
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak rast Nizak pad Nizak rast Nizak pad
Nizak pad PETAK NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak pad
Nizak pad SUBOTA NE ZIMA Nizak pad Srednji pad Nizak rast Nizak rast Nizak rast
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak rast Srednji pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak rast Nizak rast Nizak rast Nizak rast Srednji rast

* uz pomo Time Explorera, dio stvarnih podataka za period od godine dana, navedeno je djelomian prikaz podataka

139
Prilog 8 Sezonske oscilacije na temelju otklona kuteva
enska konfekcija

Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast

Red % Red % Red % Red % Red % Red % Red %

ETVRTAK .0% 44.2% 46.2% 1.9% 3.8% 1.9% 1.9%


NEDJELJA 1.9% 9.6% .0% 1.9% 86.5% .0% .0%
PETAK 1.9% 50.0% 44.2% .0% .0% 1.9% 1.9%
Dan PONEDJELJAK 3.8% .0% 11.5% .0% .0% 78.8% 5.8%
SRIJEDA .0% 42.3% 53.8% 1.9% 1.9% .0% .0%
SUBOTA .0% 80.8% 13.5% .0% 3.8% 1.9% .0%
UTORAK .0% 26.9% 69.2% .0% 1.9% 1.9% .0%

Muka konfekcija

Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast

Red % Red % Red % Red % Red % Red % Red %

ETVRTAK .0% 42.3% 48.1% .0% 3.8% 3.8% 1.9%


NEDJELJA 1.9% 19.2% .0% 15.4% 63.5% .0% .0%
PETAK .0% 28.8% 65.4% .0% 1.9% .0% 3.8%
Dan PONEDJELJAK 3.8% .0% 13.5% .0% 11.5% 67.3% 3.8%
SRIJEDA 1.9% 26.9% 67.3% .0% 3.8% .0% .0%
SUBOTA 1.9% 46.2% 48.1% .0% 3.8% .0% .0%
UTORAK 3.8% 34.6% 48.1% .0% .0% 11.5% 1.9%

Obua

Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast

Red % Red % Red % Red % Red % Red % Red %

ETVRTAK .0% 44.2% 44.2% 1.9% 1.9% 7.7% .0%


NEDJELJA 1.9% 21.2% 7.7% 13.5% 55.8% .0% .0%
PETAK .0% 28.8% 61.5% .0% 5.8% 1.9% 1.9%
Dan PONEDJELJAK 3.8% 3.8% 7.7% .0% 7.7% 59.6% 17.3%
SRIJEDA .0% 44.2% 48.1% .0% 5.8% 1.9% .0%
SUBOTA 1.9% 50.0% 36.5% .0% 9.6% 1.9% .0%
UTORAK 1.9% 48.1% 30.8% .0% 7.7% 9.6% 1.9%

ensko rublje

Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast

Red % Red % Red % Red % Red % Red % Red %

ETVRTAK .0% 32.7% 55.8% 3.8% 1.9% 3.8% 1.9%


NEDJELJA 1.9% 15.4% .0% .0% 82.7% .0% .0%
PETAK 1.9% 48.1% 44.2% .0% 1.9% 1.9% 1.9%
Dan PONEDJELJAK 3.8% .0% 3.8% .0% .0% 88.5% 3.8%
SRIJEDA .0% 36.5% 57.7% .0% 3.8% 1.9% .0%
SUBOTA .0% 92.3% 1.9% .0% 3.8% 1.9% .0%
UTORAK .0% 34.6% 61.5% .0% 1.9% 1.9% .0%

140
Prilog 9 Bayesove mree

Model A

Model B

* uz pomo Hugin Lite 6.4

141
Prilog 10 Gradske etvrti Grada Zagreba

142

You might also like