Professional Documents
Culture Documents
LEO MRI
MAGISTARSKI RAD
ZAGREB, 2004.
PODACI I INFORMACIJE O MAGISTRANDU
Prezime i ime:
Mri Leo
4. UDK:
Poslijediplomski studij
"Informatiki management"
MAGISTARSKI RAD
Mentor: Izradio:
prof. dr. eljko Panian Leo Mri, dipl. oec.
Zagreb
studeni 2004.
SADRAJ
1. UVOD 1
1.1. Saetak, cilj rada i ciljevi istraivanja 1
3. POSLOVNA INTELIGENCIJA 17
3.1. Pojam poslovne inteligencije 17
4. RUDARENJE PODATAKA 40
4.1. Pojam i znaenje 40
I
4.3.1. Veze meu elementima 52
4.3.2. Primjena Bayesovih mrea 53
4.5. Klasteriranje 63
4.5.1. Algoritam K-srednjih vrijednosti 64
4.5.2. Posebni aspekti metoda segmentiranja podataka 65
4.5.3. Aspekti primjene tehnika segmentiranja 66
5. PONAANJE POTROAA 81
5.1. Pojam ponaanja potroaa 81
II
6.5. Otkrivanje pravilnosti u trendovima prodaje tekstilnih proizvoda pomou REFII modela 107
6.5.1. Otkrivanje sezonskih oscilacija u trgovini tekstilnim proizvodima 109
6.5.2. Direktno otkrivanje pravila iz vremenskih serija 111
6.5.3. Analiza osjetljivosti trendova pomou Bayesove mree 112
7. ZAKLJUAK 117
IVOTOPIS 124
SAETAK 125
SUMMARY 126
III
1. UVOD
Prvi dio rada opisuje utjecaj globalizacije na trine aktivnosti kao to su stvaranje lanca
nabave i udruivanje tvrtki radi zajednikog nastupa na tritu. Prikazani su trendovi
koji se mogu razabrati kao posljedica sve otrijih trinih uvjeta. Kao projekcija buduih
kretanja naznaen je utjecaj Interneta te prikazane neke svjetske tvrtke koje su se ve
odluile na poslovanje tim putem i naina na koji su to uinile.
etvrto poglavlje objanjava pojam rudarenja podataka, navodi metode i alate rudarenja
podataka. Detaljno su opisane metode koje e biti primjenjene u estom poglavlju.
1
Posebno je naveden REFII model kao hibridni model koji osim analize moe sluiti kao
alat za pretprocesiranje.
2
ponaanje potroaa tekstilnih i srodnih proizvoda mogue je predvidjeti
primjenom metoda rudarenja podataka tekstilni i srodni proizvodi sa svojim
posebnostima dodatno poveavaju sloenost istraivanja bilo na strani vanjskih
utjecaja bilo na strani potroaa;
kvaliteta informacijskog sustava za praenje poslovanja i pripadajueg skladita
podataka preduvjet su uspjenosti rudarenja podataka u trgovini tekstilnim i
srodnim proizvodima tek kvalitetno uobliene i evidentirane poslovne
informacije mogu biti temelj za analizu.
1
DHMZ, Gri 3, http://meteo.hr
2
Gradski zavod za planiranje razvoja grada i zatitu okolia, Odjel za statistiku, Zagreb, Sv. irila i
Metoda 5
3
2. OPENITO O TRGOVINI TEKSTILNIM
PROIZVODIMA
Starom vijeu moemo dakle smatrati kretanje tekstilnih proizvoda i odjee izmeu
granica razliitih zemalja u zavisnosti o cijeni rada, posrednih trokova, cijene kapitala,
prijevoza osiguranja i ostalih trokova. Razliite ulazne kvote i posebne poreze pojedine
zemlje ve su odavno usvojile kao mehanizme zatite vlastite tekstilne industrije. Za
neke vanije projekcije budunosti svakako je vano napomenuti da, u WTO trenutno
kvotama optereena Kina, u 2005. godini postaje potpuno osloboena ogranienja koja
su joj nametana godinama.
Iako navedeno i dalje odreuje tokove kontingenata tekstilnih proizvoda kao posebno
vana pojavljuju se obiljeja povezana s distribucijom. Takoer, razvoj tehnologije
promijenio je odnos i karakteristike ponude i potranje te postavio nove temelje
potroakog drutva. Posebnosti tekstilnih proizvoda u usporedbi sa nekim uobiajenim
potroakim proizvodima u kontekstu nove trine ekonomije postavlja sasvim nove
zadatke pred proizvoaa i posrednika. Upravo je potroa, uz uobiajeni faktor
trokova, generator trendova koji se mogu razabrati kako u veleprodaji tako i u
maloprodaji tekstilnih i srodnih proizvoda. Pod pojmom "srodni" u ovom radu
podrazumijevaju se posoblje, tepisi, pozamanterija, metrane tkanine, obua i sl. te e
se dalje u tekstu isti podrazumijevati ukljueni u podruje istraivanja.
3
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-2, 2-3
4
Dugogodinja tradicija hrvatskih poduzea u tekstilnoj i odjevnoj industriji, premda smo
svakih nekoliko mjeseci svjedoci loeg stanja pojedinih poduzea, razlog je postavljanja
te grane na jedno od najvanijih mjesta kako u vrijeme ranih devedesetih godina tako i u
novijoj povijesti4. U naoj zemlji takoer su prisutne velike posrednike tvrtke za uvoz i
distribuciju tekstilnih proizvode koje se uspjeno nose sa nadolazeom konkurencijom
pratei svjetske trendove u tom podruju. Odgovarajui marketing uz visokokvalitetan
tekstil modernog dizajna pa ak i samo atraktivan dizajn dovoljni su da se probije na
trite i uini prvi korak bilo da se radi o vlastitoj proizvodnji ili tek posrednitvu u
distribuciji.
4
Soljai I. "Tekstilna i odjevna industrija u hrvatskoj", http//www.hatz.hr/hrv/glasnik/Ivo Soljacic.htm,
05.09.2004.
5
2.2. Trendovi u veleprodaji tekstilnih proizvoda
Globalizacija trita te dominantno potroau orijentirana ponuda zahvatila je i
veletrgovinu tekstilom. Premda je pri kupnji npr. raunalnih komponenti lako
"prokrstariti" Internetom, usporediti cijene i pronai najbolji odnos kvalitete i cijene,
tekstilni proizvodi ipak nisu toliko usporedivi niti osjetljivi na informatiki pismenije
pripadnike potroake zajednice. Ono to informacijska tehnologija moe uiniti je
poslati informaciju o modnim kretanjima, novim kolekcijama te, kod nekih
veletrgovaca, dostaviti informaciju o cjelokupnoj ponudi proizvoaa5 ukljuivo s
cijenama u gotovo svim valutama kako ne biste morali odluivati u samoj trgovini6 ve
voeni informacijom krenuli u ciljanu nabavku. Prva pomisao upravo je izuzetna
uslunost do koje su spremni ii veletrgovci no u pitanju je veliki pritisak na distributere
odnosno moemo rei da se najvei problem proizvoaa i veletrgovaca tekstilnih
proizvoda danas oituje se u aspektima distribucije proizvoda.
5
http://www.camper.es, Camper (obua), http://www.mango.es, Mango (odjea)
6
http://www.mango.es, Mango (odjea)
7
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-4
6
dana8. Evidentno je da nisu svi proizvodi zahvaeni ovim trendom, no postotak takvih
se drastino poveava pa ak i kod tipino modnih proizvoda koji se sve vie naruuju
ee i u manjih koliinama.
Druga pojava odnosi se na sve vei broj razliitih proizvoda. U kontekstu ranije opisane
pojave, potrebno je imati sve vei broj proizvoda na dispoziciji kupcima. ak i na prvi
pogled jednostavno profilirani proizvodi kao npr. muka majica mogu se pojaviti u
raznim, brojnim kombinacijama boje, veliine, dezena, tkanine, kroja i sl. Prema analizi
ponude u katalogu proizvoaa Lands' End, muka polo majica samo u plavoj i bijeloj
boji, razne kombinacije dizajna na vratu i rukavima te kroja, predstavljaju ponudu 5779
razliitih inaica. Ovaj primjer ilustrira tek jednu inaicu majice koju navedena (ili neka
druga) kompanija nudi. Pridodajmo tome ostale atribute karakteristine za tekstilne
proizvode i brzo dolazimo do desetaka tisua kombinacija. Porast broja proizvoda znai
da se ono to je poetkom osamdesetih godina bilo distribuirano kroz stotinjak
proizvoda danas se broji u tisuama. Ako ove podatke stavimo u kontekst ponude
veletrgovaca, oni moraju osigurati dovoljne koliine svake kombinacije i oekivati
tjednu narudbu tono odreenog dezena. Narudba moe biti poslana bez posebnog
pravila to ju ini nepredvidivom ak i za velikog trgovca koji je do sada navikao na
prodaju velike koliine u kritinoj masi proizvoda. Porast broja (inaica) proizvoda
umnogome mijenja prilike snabdjevaa. Odnos prema promjenjivoj potranji krucijalno
je pitanje konkurencije u novo doba. ak i za neke osnovne proizvode potranja varira
od dana do dana, od tjedna do tjedna. Jedno od starih pravila je da se narudbe koje se
oekuju planiraju na temelju ispunjenih do tog trenutka, no taj princip sve manje daje
upotrebljive rezultate. Sve je vie imbenika koje je potrebno ukljuiti u analize. Sve je
vei pritisak na kvalitetu i brzinu prikupljanja informacija koje mogu pomoi u
determiniranju trinih zakonitosti.
8
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-4
9
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-5
7
Slijedei prikazane pojave dolazimo, do jo jednog trenda koji je vano spomenuti.
Veina proizvoaa tekstila i obue, u emu se ne razlikuju od drugih, trae naine da
snize trokove. Jedan od najpopularnijih naina, ukoliko ste dovoljno veliki, jest
prebaciti proizvodnju u inozemstvo u zemlje u kojima je nia cijena radne snage koja
pri veim trokovima transporta i neto duim rokovima isporuke jo uvijek dri cijenu
konkurentnom na tritu. Ovaj trend u raznim je industrijama posebno oit u
posljednjim godinama. Ranije je spomenuto da je oekivani odgovor na zahtjev za
isporukom tri do pet dana. Ukoliko se iskoriste prednosti inozemnih ulaganja pri
uvjetima estih isporuka (skup transport), nemogunosti da se brzo reagira na potranju
(zbog udaljenosti i proizvodnog procesa) proizvodi vrlo lako mogu postati
nekonkurentni cijenom. Razna istraivanja prouavaju utjecaj novih trinih pravila na
proizvodnju te odnose profita i utjecaja zaliha pri emu efikasno planiranje ima posebnu
vanost. Jedno od takvih istraivanja10 pokazuje da odnos proizvodnje koji maksimizira
profit iznosi 50:50 proizvodnje u inozemstvu u odnosu na domau pri emu odreivanje
to e se gdje i u kojoj koliini proizvoditi zahtjeva iznimnu sposobnost planiranja. To
bi znailo da proizvoai u svoje planove kalkuliraju ponovno pokretanje ili
reorganizaciju proizvodnje u vlastitoj zemlji ili blizu velikih trita uz poveanje stupnja
tehnoloke razvijenosti proizvodnih pogona kojima e odgovarati na zahtjeve trita.
10
Harvard Centre for Textile and Apparel Research Harvard University: "Globalization in Textile and
Apparel Industries: What is New and What is Not?", F.H. Abernahty, J.T. Dunlop, J.H. Hammond, D.
Weil, 2003, odjeljak 2-8
8
skladita) uz odreenu cijenu (najee zahtjevajui dodatne rabate) ili zauzeti otvoren,
nepredvidljiv, neobavezan stav malog kupca. Neprilagoenost i zaostajanje za
tehnolokim razvojem jednostavno se nee isplatiti bez obzira na veliinu.
Kljuni trendovi u maloprodaji mogu se opisati kroz nekoliko pojava11 koje e biti
opisani u nastavku.
Porast broja trgovakih centara u posljednjih dvadeset godina vidljiv je kako u Europi
tako i na ostalim kontinentima. Lanci supermarketa ukazuju na rast konsolidacije i
globalizacije pri emu pregovaraka mo trgovaca raste unutar lanca nabave. Naznake
pokazuju da e se ovaj trend globalnog irenja, uz poveanje konkurentnosti, nastaviti i
u budunosti. Posebni sluajevi biljee ulaganja distributera u poveanje utjecaja ili ak
11
Business Intelligence and Retailing: "Aplications od data warehousing and data mining in the retail
industry", R.P. Srinivasa, Saurabh S., Wipro Technologies
9
preuzimanje maloprodajnih lanaca kako bi imali mogunost predvianja terena za
plasman vlastitih proizvoda.
Upravljanje odnosima s kupcima (CRM) postaje kljuni pokreta poslovanja. Bolje
organizirani trgovci preorijentirali se svoje poslovanje oko sve zahtjevnijih potroaa. U
utrci privlaenja novih kupaca spoznali su da je jednako vano zadrati i postojee.
Poveana interakcija uz sofisticirane tehnike analize pruaju trgovcima nesluene
mogunosti pronicanja u nain razmiljanja potroaa. Ove se informacije koriste za
uspostavljanje prisnijih odnosa s kupcima, ciljani marketing i promotivne kampanje,
unutarnje ureivanje duana, upravljanje elektronikim kanalima i sl.
Upravljanje lancem nabave (SCM Supply Chain Management) takoer je postao jedan
od pokretaa poslovanja. Trgovci upravljaju logistikom formirajui vlastite
distribucijske mree. Jedna od vitalnih odrednica uspjeha u budunosti svakako e biti
sposobnost efikasne distribucije diljem svijeta te logistike koja podrava sustave
prezentacije i prodaje. Globalni lanac prodaje mora biti sposoban osigurati visoku
razinu dostupnosti proizvoda koje potroai poele kupiti.
10
preferencijalnim no isto tako mogu i nestati s trita. Preostaje samo prepoznati
potranju i uobliiti kvalitetan spoj ponude, i initi to stalno i uvijek iznova drugaijim.
Posebna panja posveuje se kanalima prodaje koji utjeu na eve sudionike u prodaji,
od proizvoaa, veletrgovca/distributera pa sve do maloprodaje i kupca. Jo prije
nekoliko godina tipini je kupac uao u prodavaonicu, informirao se o veliini i cijeni
proizvoda i kupio ono to mu treba. Ako je elio veu pozornost prodavaa, izabrao bi
duan u kojem to moe dobiti i, najee, platio veu cijenu. Ako je bio u potrazi za
jeftinijom robom jednostavno bi se uputio u prodavaonicu s takvom ponudom.
Ponaanju potroaa posveen je dio rada u nastavku no na ovom mjestu vano je
spomenuti da, prema analizama Forrester Researcha12, amerike kompanije za
istraivanje trita, danas se svaki drugi kupac u razvijenim potroakim drutvima
koristi jednim kanalom prodaje za prikupljanje informacija o proizvodu da bi zatim
kupovinu ostvario na drugom mjestu. Prihvaanjem ponaanja potroaa uz razvijanje
prodajnih putova koji odgovaraju tom ponaanju u pojedinim fazama, o kojima e biti
rijei kasnije, kompanija ima priliku utjecati na potroae i navesti ih na onaj put koji
ima potencijal poveati zaradu i nadmaiti uloeno u privlaenje kupca.
12
Vukovi L. "Nove strategije privlaenja kupaca", Poslovni Magazin br.11, studeni 2004. str. 46
11
2.4. Utjecaj razvoja informacijske tehnologije u trgovini tekstilnim i
srodnim proizvodima
Pojam poslovna inteligencija, kako e detaljnije biti opisano u slijedeem odjeljku,
odnosi se na sposobnost prikupljanja i analiziranja velike koliine podataka o kupcima,
dobavljaima, tritima, internim procesima i poslovnom okruenju. Skladite podataka,
kako e takoer biti prikazano u slijedeem odjeljku, osnova je korporacijskog sustava
poslovne inteligencije. Razni alati za analitiku obradu podataka i rudarenje podataka
koriste se za transformaciju podataka iz skladita i aktivne poslovne informacije
Ilustracija pokazuje upravljanje odnosa s klijentima kao sredinju toku putem koje
bitne informacije o klijentima, uz primjenu alata poslovne inteligencije proimaju sve
ostale dijelove tvrtke. Poslovna inteligencija igra vanu ulogu i u svim ostalim
maloprodajnim funkcijama kao to su upravljanje opskrbnim lancem, operacije na
prodajnim mjestima i upravljanje kanalima prodaje.
Tipina maloprodajna tvrtka posluje s velikim brojem klijenata ije su potrebe u znatnoj
mjeri diferencirane. Bez odgovarajuih sredstava za analizu mnogobrojnih podataka o
klijentima strategija upravljanja odnosima s klijentima bila bi osuena na neuspjeh. Od
najvee koristi za analitiko upravljanje odnosima s klijentima su funkcije marketinga i
prodaje koje predstavljaju glavne kontaktne toke putem kojih se stvara uvid u obiljeja
i ponaanje klijenata.
13
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 450
12
Upravo razvoj informacijske tehnologije omoguio je neke najvanije primjene
analitikog upravljanja odnosima s klijentima kao to su14:
segmentacija klijenata kljuni marketinki element u trgovini na malo.
Segmentacijom se stvara uvid u to kako razliiti segmenti klijenata odgovaraju
na razliite promjene,
analiza uinkovitosti marketinkih kampanja i promidbenih aktivnosti kad se
pokrene odreena marketinka kampanja, njena se uinkovitost moe istraivati
prema razliitim medijima i u kontekstu koristi i trokova. Time e se saznati to
se moe smatrati uspjenom kampanjom,
vrijednost klijenata tijekom cjelokupnog ivotnog ciklusa kako svi klijenti nisu
jednako profitabilni tako se i profitabilnost klijenata mijenja kroz vrijeme. To su
razlozi zbog kojih je vano identificirati klijente ija je vrijednost tijekom
cjelokupnog ivotnog ciklusa velika te s njima uspostaviti prisne odnose.
14
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 451
15
http://www.mango.es, 19.10.2004.
13
Rast procesorske snage prati razvoj i sve ira upotreba raznih analiza i predvianja
usmjerenih klijentima (lojalnosti klijenata, unakrsna prodaja, odreivanje ciljane cijene,
ciljani marketing) ali i dobavljaima (analiza djelotvornosti dobavljaa, kontrola zaliha,
protok proizvoda, prognoziranje potranje). Kako je ranije navedeno, naglasak na
vanosti logistike uz potrebu razumijevanja sloenih mehanizama trita i statistikih
metoda analize poslovnih podataka, dovodi do specijalizacije pojedinih tvrtki u
pruanju iskljuivo logistikih usluga. Moe se rei da je razvoj informacijske
tehnologije umnogome utjecao na tradicionalne postavke trita tekstilne industrije koje
i dalje trpi navedene utjecaje.
Utjecaj Interneta u prvi plan stavlja kvalitetu usluge dok se zahtjevi klijenta poveavaju
bilo da se radi o kvaliteti usluga ili aurnosti informacija, dok istovremeno strpljenje
klijenata postaje sve manje jer konkurencija je udaljena tek jedan click mia.
16
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003, str. 81
14
Ipak, mogunosti za zadravanje kupaca u ovoj su trinoj grani daleko vee nego u
drugima. Dok smo danas svjedoci procjena da e trite direktne prodaje
osiguravateljnih usluga kakvim ga poznajemo u godinama koje slijede potpuno nestati,
rad na sadraju koji se nudi kupcima uz kvalitetne nabavne i distribucijske kanale moe
osigurati stabilnost tekstilne tvrtke i u novim vremenima. Pri tome ne treba zanemariti
prezentacijski potencijal Interneta no u obzir je potrebno uzeti ciljano regionalno
okruenje, ciljane segmente potroaa i proizvoda, vodei rauna o kvaliteti ponude.
Alternativno, kvalitetan nastup proizvoaa na web prostoru na povlateno mjesto
stavlja sudionike u vlastitoj distribucijskoj mrei. Upravo na tim osnovama baziran je
pristup tvrtke proizvoaa sportske opreme Nike17 koja na vlastitim stranicama nudi
mogunost da potroa dizajnira vlastiti model tenisica s mogunou dodatne
personalizacije u obliku vlastite poruke izvezene na finalnom proizvodu.
Razlog odabira upravo ove dvije tvrtke je njihov dugogodinji razvoj spomenutih usluga
koje su atraktivnim dizajnom i tehnolokim rjeenjima doveli na vrlo visku razinu. Bez
obzira u kojoj se zemlji nalazite (razlike u domicilnim valutama, oznakama veliina
odjee i obue) pregled i odabir mogue je prilagoavati do najsitnijih detalja. Poseban
17
http://www.nike.com
18
Brezovnjaki A. "Just Do It", Poslovni Magazin br.11, studeni 2004. str. 40
19
http://www.mango.es
20
http://www.camper.es
15
sustav na Mangovim stranicama brine se o ponudi adekvatnih dodataka proizvodu ili
proizvodima koje ste odabrali, kao neka vrsta virtualnog stilista koji Vam je uvijek pri
ruci a prije nego kupite proizvode virtualni model pokazat e Vam kako bi cijela
kombinacija trebala izgledati.
21
http://www.camper.es, 19.10.2004.
16
3. POSLOVNA INTELIGENCIJA
Isti autor navodi da je u stvarnosti poslovna inteligencija s jedne strane nain poslovnog
promiljanja koji omoguava da se poslovne odluke na svim razinama odluivanja
donose temeljene na relevantnim i aurnim poslovnim informacijama, a ne temeljene na
predosjeaju i subjektivnom utisku. S druge, informatike, strane to je sloeni
informacijski sustav koji automatiziranim procedurama prikuplja podatke iz raznih
izvora, obrauje ih, transformira i integrira te omoguava korisnicima dostup do
kvalitetne informacije na intuitivan i lako razumljiv nain.
22
E-Solutions Integrator Inc. 2001: "Business Intelligence: With or Without the E", e-SI whitepaper,
http://www.esionweb.com, 20.11.2003.
23
Oreanin D. "BI hit ili mit?", Banka poseban prilog, sijeanj 2003., str 4.
24
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 21
17
s makroaspekta, i
s mikroaspekta.
25
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 24
18
Koliina podataka, premda ima vanu ulogu, nije od presudnog znaenja. Obzirom na
koliinu generiranih informacija, koncept poslovne inteligencije poiva na slijedeim
temeljnim zamislima26:
namjera koncepta poslovne inteligencije nije stvaranje vee koliine informacija,
ve iskljuivo generiranje boljih, kvalitetnijih informacija potrebnih pri
donoenju poslovnih odluka,
upravo to je ono svojstvo poslovne inteligencije koje joj daje mo poticanja i
stvaranja pozitivnih promjena u sredini u kojoj se stvara i primjenjuje,
poslovna inteligencija prua korisnicima samo one informacije koje su im
potrebne , ali zato pravovremeno i iskazane na nain koji ima najvie odgovara,
uz valjanu primjenu, koncept poslovne inteligencije smanjit e koliinu
informacija kojoj se zaposlenici tvrtke izlau, poveavajui istovremeno
kvalitetu tih informacija.
19
tonim i aurnim informacijama najrazliitije prirode. Upravo navedene prilike upuuju
da poetke osiguravateljne djelatnosti moemo smatrati roenjem poslovne
28
inteligencije .
28
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 28
29
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 26
20
tradicionalnih sustava potpore odluivanju a svodi se na pitanje: to ako sustav ne eka
da korisnik (klijent) postavi odreeni upit?
Primjena poslovne inteligencije polazi od pretpostavke da korisnici ne vole nepotrebne
informacije pa e, ako mogu, rado pokazati svoje preferencije glede tipa informacija
koje ele dobivati, uestalosti primanja poruka i komunikacijskog medija putem kojega
e mu informacije pristizati.
21
3.3. Poslovne informacije
Kljuno pitanje suvremenog poslovanja je slijedee: to je najvanija pretpostavka
preivljavanja tvrtke na dananjim turbulentnim tritima30?
znanje
informacije
podaci
30
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 27
31
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003., str. 193
22
proporcionalna je brojnosti tih dogaaja i sloenosti procesa. Izmeu koliine podataka
i njihove kakvoe (kvalitete) ne mora bezuvjetno postojati izravna proporcionalnost.
Velika koliina podataka ne mora ujedno znaiti visoku kvalitetu, vrijednost i
upotrebljivost tih podataka u procesima odluivanja. Navedeno upuuje na potrebu za
kontroliranjem kvalitete podataka odnosno upravljanje sustavom u svrhu prikupljanja
to kvalitetnijih podataka. Broj razliitih izvora podataka iz kojih tvrtka moe crpsti
podatke vane za poslovanje u dananje vrijeme vrlo je velik. Brojnost izvora podataka
eksponencijalno raste onda kada se tvrtka u svojem djelovanju odlui usmjeriti prema
Internetu i konceptu elektronikog poslovanja32. Uz poveanu koliinu dohvatljivih
podataka javljaju se i mogunosti viekanalskog pristupa tim podacima, putem
tradicionalnih komunikacijskih kanala ali i putem novih kanala (World Wide Web,
elektronika pota i sl.).
32
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 29
33
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 31
23
Standardiziranost podrazumijeva ujednaenost u izrazu te standardizacija dokumenata
nositelja poslovnih informacija. Podudarnost se odnosi na identificiranje podudarnih
podataka iz brojnih izvora i njihovu eliminaciju. Verificiranost ukljuuje postupak
usporedbe nekog podatka sa poznatim izvorom kako bi se utvrdila relevantnost podatka.
Proirivost podrazumijeva mogunost dodavanja novih podataka postojeem skupu.
34
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 36
24
3.3.1. Shannonov kvantitativni pristup vrednovanju informacija35
Ovaj pristup postavlja jednakost izmeu koliine informacija i entropije polja sluajnih
dogaaja koje stvara informaciju. Osnovna formula za izraun entropije glasi:
n
H ( X ) = pi ld pi
i =1, n
i =1
35
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 40
25
"gruba", tek orijentacijska podjela kakva je teko iskoristiva za bilo kakve ozbiljnije
praktine analize. Sam pokuaj odreivanja i karakterizacije pojma vrijednosti
informacije, bez obzira na primjenjivost, predstavlja velik doprinos znanstvenoj
spoznaji u ovom podruju.
36
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 42
26
Pri donoenju odluka na temelju informacija iz podruja prognoziranja potrebna je ipak
stanovita doza opreza, jer znanost jo uvijek ne poznaje posve sigurne prognostike
metode. Zato se u praktinim uvjetima obino postavlja zahtjev za posjedovanjem
informacija iz podruja stvarnog vremena, koje e omoguiti pravovremeno donoenje
dobrih odluka.
37
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 42
27
3.3.3. Liautaudov poslovno pragmatiki pristup vrednovanju informacija38
Tumaenje i vrednovanje informacija po Bernardu Liautaudu poiva u injenici da se
vrijednost odreene informacije protee u kontinuumu. Uporaba informacije iri se
(propagira) diljem poduzea, pa ak i izvan njega, prema klijentima i partnerima. Iz
toga Liautaud izvodi zakljuak da se vrijednost informacija moe zadovoljavajue
precizno definirati kao funkcija broja korisnika koji mogu pristupati tim informacijama i
analizirati ih i broja poslovnih podruja kojima korisnici pripadaju, te iskazati sljedeim
izrazom:
vrijednost (informacija) korisnici2 x poslovna podruja
Vrijednost odreene informacije raste razmjerno kvadratu broja korisnika koji mogu
pristupati toj informaciji pomnoenom s brojem poslovnih podruja u kojima ti
korisnici rade. Sam autor tvrdi kako se u navedeni izraz odluio uvrstiti kvadrat broja
korisnika inspiriran poznatim Metcalfeovim zakonom mree39.
Liautaud dokazuje kako se svojevrsni "mreni uinak" moe uoiti i kada je u pitanju
vrijednost poslovnih informacija. Naime, to vie ljudi dijeli iste informacije, oni se
bolje razumiju, jednostavnije komuniciraju, tjenje surauju i donose bolje odluke. Uz
to, vrijednost informacije raste skokovito onda kada neko novo poslovno podruje
tvrtke ostvari mogunost online pristupa istim informacijama. Time se stvara nova
organizacijska inteligencija.
28
SLIKA 3.3. Kontinuum vrijednosti informacije41
Prvi korak koji treba nainiti da bi se podaci transformirali iz poslovne pasive u aktivu
jest stvaranje uvjeta u kojima e im zaposlenici tvrtke moi pristupati izravno, tj. online
to predstavlja preduvjet za drugu fazu. U tu svrhu bit e potrebno izgraditi lokalnu
raunalnu mreu, koja se danas obino implementira kao intranet. Intranet je bilo kakva
unutarnja mrea raunala neke tvrtke koja funkcionira na nain slian i kompatibilan
Internetu. Valjat e takoer tono utvrditi i razgraniiti kojim podacima tko smije i treba
pristupati, kako ne bi dolo do nesporazuma, sukoba interesa, a moda ak i zloporaba.
41
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 45
29
razmatrati podatke s razliitih stajalita, odnosno iz raznih aspekata. Za njih e to
predstavljati novu vrijednost ili korist.
30
3.4. Primjene poslovne inteligencije
Mnoge velike i srednje tvrtke aktivno pristupaju pojmu poslovne inteligencije, razvijaju
i implementiraju takve sustave i koriste ih u svojem elektronikom poslovanju. Tvrtke
uspijevaju pretvarati informacije u poslovnu inteligenciju, poslovnu inteligenciju u
organizacijsko znanje a kolektivno organizacijsko znanje u poveani profit42.
42
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 182
43
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 385
31
Vano je napomenuti da autonomnost ovakvog sustava (ovdje se prvenstveno misli na
segmente koji su zadueni za ienje i skladitenje podataka te segment koji generira
pravila primjenom neke od metoda) ovisi o uniformnosti problema koje treba rijeiti. Kod
standardiziranih problema, odnosno problema koje su ve ranije rjeavani, sustav ne treba
vanjsku intervenciju analitiara, nego je sam sposoban provesti ienje podataka i
selekciju metode ili niza metoda. Kod rjeavanja nekog novog problema, odnosno
generiranja nekog novog skupa pravila na osnovu spomenutih izvora, analitiar
"algoritmizira" postupak ienja podataka i selekciju metoda. Tako sustav postaje
sposoban generirati pravila.
Jednom sugerirano rjeenje za odreeni tip problema sustav usvaja. Prilikom narednog
zahtjeva, sustav pronalazi rjeenje u svojoj listi postupaka ako je takav tip problema ve
rjeavan te se vlada na osnovi njega. U protivnom trai sugestije analitiara.
Za razliku od medicinskih sustava koji svoju bazu injenica temelje gotovo iskljuivo na
"tvrdim pravilima", u sustavima poslovne inteligencije, ova metoda moe biti od izuzetne
44
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 386
32
koristi kod obrade "mekih pravila" koja su rezultat obrade nekom metodom umjetne
inteligencije odnosno rudarenja podataka.
45
Inmon, William H. "Building the data warehouse", Wiley,1992, str. 9-10.
46
Oreanin D. "Skriveni potencijali naih datoteka", http://www.skladistenje.com/jedan.asp?ID=182,
01.04.1998.
33
znanju poslovi planiranja i simulacije obavljaju se izradbom i izvravanjem
modela plana ili simulacije.
34
razumijevanja i prihvaanja dimenzijskog modela podataka. U menaderskom govoru
"proizvode prodajemo na razliitim tritima, zanima nas prodaja u vremenu"
prepoznajemo dimenzije kroz koje se prati navedena poslovna pojava. Ljudima je
prirodno promatrati poslovne pojave kroz dimenzije. Ako se pojava prati u tri
dimenzije, rije je o kocki, a u vie dimenzija, o hiperkocki. Svakoj dimenziji kocke
pripada jedan parametar pojave, ovdje proizvod, trite i vrijeme. Svaka toka u kocki
ima tono odreene vrijednosti svake promatrane dimenzije, npr. broj prodanih
primjeraka proizvoda 00506 u sijenju 1997.
Modeli podataka transakcijskih sustava su, naprotiv, izgraeni na drugom naelu. Oni
prikazuju poslovne objekte i njihove meusobne odnose koji proizlaze iz poslovnog
procesa. Tablini modeli transakcijskih sustava prikladniji su za praenje odnosno
upravljanje poslovnim procesom, a dimenzijski modeli skladita podataka za
izvjetavanje o uincima poslovnog procesa.
Oba modela, dimenzijski i objektni, sposobna su prihvatiti i opisati isti skup podataka te
iz njih nainiti isti skup izvjea ili obaviti iste analize. Osnovna je razlika u prezentaciji
podataka. Dimenzijski model pristupa odozgo-dolje, jer je usmjeren na konano pitanje
na koje je menader traio odgovor, a objektni model pristupa odozdo-gore prikazujui
osnovne objekte potrebne pri upravljanju odnosno voenju poslovnog procesa.
35
3.5.2. Skladite podataka i poslovna inteligencija
Poslovna se inteligencija izvodi iz podataka to nastaju tijekom redovitog poslovanja
tvrtke. No, kako je tih podataka puno, kako nastaju na razliitim mjestima i budui da se
unose u informacijski sustav putem razliitih ureaja i kanala, to ih u raunalnoj memoriji
treba organizirati na primjeren nain.
48
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 80
36
3.6. Izvoenje znanja iz podataka
Nakon to se u procesu rudarenja podataka otkrije niz korisnih pravila, ta je pravila
potrebno povezati i formalizirati, kako bi se otkrivena znanja mogla uspjeno i svrhovito
iskoristiti.
Formaliziranje i skladitenje znanja odnosi se na onu vrstu pravila koja se mogu izraziti u
obliku AKO - ONDA. Postoje i hibridni sustavi, koji su osim pravila sposobni prihvatiti i
dinamike modele, poput Bayesovih i neuralnih mrea i slino.
Kada se radi o sustavima zasnovanim na pravilima, mogu se izdvojiti dva osnovna tipa
takvih sustava - tradicionalni ekspertni sustavi i sustavi zasnovani na neizrazitoj logici.
Rezultati istraivanja kao to je ovo predstavljeno u radu mogu se iskoristiti kao podloga
ili dopuna nekom od ovakvih sustava.
49
Oreanin D. "Otkrivanje znanja i kopanje podataka", http://www.skladistenje.com/jedan.asp?ID=204,
01.06.1998.
50
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 369
37
analiziramo, interpretiramo, razumijemo, vizualiziramo podatke te im damo neki
smisao. Nuno su potrebni alati i tehnike za automatiziranu i inteligentnu analizu.
Kao ilustraciju iskoristit u jednostavan prikaz hipoteza za odreeni skup podataka koje
istraiva moe percipirati vizualizacijom.
51
Oreanin D. "Otkrivanje znanja i kopanje podataka", http://www.skladistenje.com/jedan.asp?ID=204,
01.06.1998.
38
SLIKA 3.6. Tri hipoteze za dani set podataka 52
52
Kantardi M., "Data mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 4.1.
39
4. RUDARENJE PODATAKA
53
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 247
54
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 235
55
http://www.webopedia.com/totd.asp
56
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 235
40
otkrivanje novih znanja meu nekim pojavama mogu postojati neki jo
nepoznati a statistiki vani odnosi koje ovjek ni iskustvom niti svojim
intelektualnim sposobnostima ne moe dokuiti
RUDARENJE PODATAKA
Klasifikacija Statistika
regresija
Vizualizacija
Stabla
odluivanja
"Grozdovi"
Izvoenje
Asocijacija pravila
Obzirom da postoji itav niz imbenika koji mogu utjecati na ishod nekog dogaaja,
zadatak je rudarenja podataka otkriti najznaajnije meu njima i njihove karakteristike s
obzirom na ciljana stanja. Bez obzira na podruje primjene dobro iskoritene metode
rudarenja podataka sposobne su otkriti zakonitosti iz velike mase podataka pri emu
57
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 238
41
podruje primjene ostaje u drugom planu to zapravo jest snaga primjene metoda
rudarenja podataka naglasak je na podacima a ne na podruju provoenja analiza.
Izraz rudarenje podataka (DM Data Mining) odnosi se ili na itav proces otkrivanja
znanja ili ue, na specifinu fazu "strojnog uenja". Razni dobavljai DM tehnologija
daju razne interpretacije toga termina. SAS Institut, vodei u podruju tehnologija za
rudarenje podataka (posebno statistikih) jo od 1972., rudarenje podataka odreuje kao
napredne metode za istraivanje i modeliranje veza u velikim koliinama podataka.
Meu osnovnim tehnologijama za rudarenje podataka su statistika, sistemi bazirani na
pravilima, neuralne mree, strojno uenje, umjetna inteligencija, upravljanje bazama
podataka, itd. Ipak, svi se slau da je analitika statistika jezgra tih novih procesa za
otkrivanje znanja. Iz statistike perspektive, rudarenje podataka se moe opisati kao
raunalski automatizirana istraivaka analiza podataka iz (obino) velikih i sloenih
baza podataka s razliitih platformi, lokacija, operacijskih sistema i softvera58.
Poslovni procesi i znanstveni instrumenti mogu lako generirati terabyte podataka. Brzo
se iri jaz izmeu mogunosti prikupljanja podataka i sposobnosti analize podataka
kako u biznisu, tako i u znanosti. Rudarenje podataka najkorisnije je tamo gdje je stalno
prisutna prijetnja poplave informacijama.
42
Pronaene pojave u podacima, kao pronaeno znanje, treba prikazati na prikladan
grafiki nain. Zato je vana vizualizacija podataka. Tehnikama klaster analize npr.
dobivaju se brojani podaci korelacije ili mjera udaljenosti. Ljudsko e oko mnogo bre
i preciznije prepoznati klastere ako su rezultati prikazani grafiki umjesto brojano, a
razumijevanje uoene pojave bit e bolje.
Analiza odnosa meu podacima moe takoer biti opisna ili brojana. Obzirom se
istrauju odnosi najmanje dvaju pojava, metodoloku osnovicu ove vrste analize ine
odreene viedimenzionalne ili matrine metode.
Postoji odreen broj tzv. glavnih i opeprihvaenih metoda no isto tako postoji itav niz
metoda iz ostalih podruja koje se ne mogu svrstati u neku kategoriju. Pojedine metode
59
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija 2003., str. 237
43
konstruirane su uz pomo elementa linearne algebre, teorije informacija, matematike i
drugih podruja.
44
Da li e proces kopanja podataka biti promaaj ili uspjeh ovisi o vie imbenika, kao to
su prethodno znanje o podruju te raspoloivost i odabir alata za kopanje podataka,
kvaliteta podataka, dobra interakcija izmeu lanova projektnog tima, kvaliteta skladita
podataka, jasnoa misije i cilja kopanja podataka, prikaz rezultata na jednostavan i
pravilan nain, itd.
U ovom radu detaljnije e biti opisane neke od metoda za koje se oekuje da doprinesu
ciljevima istraivanja. Kvalitetno istraivanje podataka metodama rudarenja
podrazumijeva irok raspon znanja analitiara te poznavanje pojedinosti svake pojedine
metode. Razlog ovome je nunost pripreme podataka za pojedinu analizu pri emu je
poznavanje metode od kljune vanosti.
Podaci u izvornom obliku mogu biti nekompletni, atributi mogu imati nedostajue
vrijednosti, ili moe postojati nedostatak atributa. Isto tako moe se pojaviti
nekonzistentnost unutar samih podataka, primjerice nedosljednost u oznaavanju
pojedinih kategorija ili grupa.
60
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 252.
45
Govorei o pretprocesiranju podataka, moemo izdvojiti najznaajnije metodoloke
postupke pretprocesiranja u koje ubrajamo61:
pronalaenje ekstremnih vrijednosti
dijagnostika nedostajuih vrijednosti i predvianje nedostajuih vrijednosti
povezivanje relacijskih kljueva iz razliitih izvora podataka
postizanje jednoobraznosti (konzistentnosti) u podacima
uzorkovanje
kategorizacija vrijednosti atributa
formiranje izvedenih atributa (Binning)
grupiranje (saimanje podataka)
normiranje podataka
Jedna od vrlo jednostavnih mjera koja nam moe pruiti informacije o korelacijskoj
zavisnosti izmeu dviju varijabli je koeficijent korelacije koji se rauna na temelju
formule62:
rx , y =
( x x )( y y )
(n 1) x y
46
x,y srednje vrijednosti x i y
x , y su standardne devijacije nizova vrijednosti x i y
Zakljuci koji se mogu izvui su sljedei:
ako je vrijednost koeficijenta korelacije vea od 0, tada su nizovi vrijednosti
pozitivno korelirani,
ako je vrijednost koeficijenta korelacije manja od nule, tada su vrijednosti nizova
negativno korelirani,
ako je vrijednost koeficijenta korelacije jednaka 0, tada ne postoji korelacijska
meuzavisnost.
Ova mjera moe biti korisna kada se, primjerice, eli vidjeti ima li neka varijabla
pozitivan, negativan ili neutralan smjer korelacije s obzirom na ciljnu varijablu.
47
4.2.3. Problemi "kombinatorne eksplozije"
Ranije u radu navedeno je kako problem raznih atributa koji opisuju tekstilne proizvode
pri zahtjevima za praenjem svih detalja, vrlo brzo od nekoliko jednostavnih artikala
dovede do velikog broj artikala koje treba ispravno evidentirati.
U osnovi, cilj je uoiti pravilnosti ili anomalije, ovisno o tome to elimo vizualizacijom
postii, u svrhu poveanja kvalitete istraivanja.
63
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 271
48
SLIKA 4.2. Primjer primjene vizualizacije za unapreenje procesa klasteriranja64
64
Kantardi M. "Data Mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 12.
65
Kantardi M. "Data Mining: Concepts, Models, Methods and Algorithms", Wiley, 2003., odjeljak 12.
66
http://www.ai.mit.edu/~murphyk/Bayes/bnintro.html, 10.10.2004.
49
SLIKA 4.3. Jednostavan grafiki prikaz Bayesove mree 67
67
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 311
50
Iz navedene ilustracije moemo raspraviti da izraz "trava je vlana" (W=true/istina) ima
dva mogua uzroka: ili je prskalica ukljuena (S=true/istina) ili kii (R=true/istina).
Snaga odnosa dana je u pripadajuim tablicama pa tako vjerojatnost da je trava vlana
(W=istina) pri injenici da radi prskalica (S=istina) i kii (R= istina) iznosi 0.99 ili 99%.
68
***, "A Brief Introduction to Graphical Models and Bayesian Networks",
http://www.cs.berkeley.edu/~murphyk/Bayes/bayes.html, 02.11.2004.
51
4.3.1. Veze meu elementima
Elementi mree prikazani su kao ovisni o slijedu koji je naznaen strelicama, pri emu
smjer strelice odreuje smjer odnosa a vjerojatnosti se primjenjuju ovisno o vezama
koje mogu biti linearne, konvergentne ili divergentne kako je prikazano na slici 4.5.
A
A C B
B A C
C
Vezama se zapravo unaprijed navodi na ovisnosti koje su definirane kao znaajne ili
ovisne pri izgradnji modela. Elementi mree putem vjerojatnosti prenose informacije,
pri emu se mogua rjeenja generiraju kao aproksimativne vrijednosti. Ovaj pristup,
ovisno o mrei, omoguava vie puteva do istog rjeenja uz mogunost evaluiranja
rezultata tijekom analize. Time nam se prua mogunost rjeavanja problema na nain
koji ne mora nuno pratiti eksponencijalni rast pravila porastom kompleksnosti modela
kao to je sluaj pri tradicionalnim metodama.
52
PC algoritam se sastoji od sljedeih koraka:
testira nezavisnost izmeu svakog para varijabli,
kreira kostur mree putem pronaenih zavisno-nezavisnih veza,
odreuje kolizije,
odreuje smjerove ovisnosti.
U ovom radu za izradu mrea koriten je NPC algoritam koji se razlikuje u tome to pri
formiranju veza mora biti definiran tzv. neophodni put to implicira mogunost vie
poveznica meu varijablama. Svaka poveznica koja zadovolji kriterij ispravnosti se
usvaja.
70
Panian ., Klepac G. "Poslovna inteligencija", Masmedia, 2003., str. 313
53
medicini (dijagnostika bolesti kao to su bolesti miia i ivaca, respiratorne
bolesti i slino),
razvoju softvera (traenje pogreaka u programu, programi za dijagnostiku
problema kod eksternih jedinica kao to su pisai, programiranje pomoi u
programima),
proizvodnji (praenje proizvodnih procesa, te sugestije za optimizaciju i
izbjegavanje kvarova u sustavima),
ekonomiji (procjena kreditnih rizika, segmentacija trita, analiza rizika openito,
ponaanje klijenata),
vojnom sektoru (planiranje operacija, planiranje logistikih aktivnosti),
poljoprivredi i stoarstvu (selekcija i uzgoj bilja i ivotinja, planiranje
bakterioloke zatite),
farmaciji (istraivanje lijekova, istraivanje pojedinih sastojaka i njihovih
kombinacija kod otkrivanja novih vrsta lijekova za odreene tipove bolesti).
Ovaj rad pokazat e primjenu Bayesovih mrea u analizi podataka o prodaji tekstilnih
proizvoda.
71
Data Mining Server, http://dms.irb.hr/, 10.10.2004.
54
Za neke je probleme od kljune vanosti samo tonost klasifikacije ili predikcije
modela. U takvim sluajevima itljivost modela nije od presudne vanosti. U drugim
situacijama upravo je sposobnost interpretiranja modela "ljudskim" jezikom od kljune
vanosti. U marketingu potrebno je npr. dobro opisati razliite segmente populacije
kupaca za marketinke strunjake kako bi oni mogli organizirati uinkovitu kampanju
radi poveanja prometa odreenih proizvoda. Generirani modeli moraju biti itljivi za
eksperte iz domene problema i oni moraju prepoznati i odobriti primjenu znanja
sadranog u novim modelima. Postoji itav niz razliitih algoritama za konstruiranje
stabla odluivanja koji sadre osnovne kvalitete ove tehnike a meu najpoznatijima su
ID3, c4.5, CHAID itd.
55
Slika 4.6. Primjer jednostavnog stabla odluivanja72
72
Data Mining Server, http://dms.irb.hr/, 10.10.2004.
56
4.4.2. Proces stvaranja stabla odluivanja
Veina postojeih algoritama stabla odluivanja su varijacije osnovnog algoritma koji
posjeduje jednostavne karakteristike greedy, top-down metode pretraivanja prostora
rjeenja.
ID3 algoritam razvio je J. Ross Quinlan. Algoritam je baziran na tzv. Concept Learning
System (CLS) algoritmu.
funkcija ID3
Input: (R: skup nezavisnih atributa,
C: ciljni(zavisni) atribut,
S: skup primjera za uenje)
kao rezultat daje stablo odluivanja;
poni
Ako je R prazan, tada napravi jedan (krajnji) vor s vrijednosti koja je najea za ciljni atribut
za skup S; (u tom sluaju stablo e vjerojatno raditi i pogrene klasifikacije na skupu S, u mjeri u
kojoj su zastupljeni primjeri ostalih klasa);
Rekurzivno primjeni ID3 to na podskupove {Sj| j=1,2, .., m} sve dok oni nisu prazni;
kraj
73
Data Mining Server, http://dms.irb.hr/, 10.10.2004.
57
ID3 pretrauje preko atributa svih primjera u skupu podataka, te nalazi atribut koji
najbolje odvaja primjere odreene klase. Ukoliko atribut savreno razdvaja klase ID3
algoritam se zaustavlja; inae se rekurzivno izvrava na m podskupova (gdje m
oznaava broj moguih vrijednosti atributa), traei "najbolje" atribute za njihovo
razdvajanje. Algoritam koristi greedy pristup, t.j. trai trenutno najbolji atribut i nikad
ne "gleda" unatrag, da bi provjerio ispravnost prethodnih izbora, odnosno razdvajanja.
Treba imati na umu da ID3 moe generirati stabla koja rade i pogrene klasifikacije na
skupu primjera za uenje.
Centralni dio algoritma jest selekcija atributa za stvaranje vora odluivanja, t.j. atributa
koji e posluiti za razdvajanje odreene grane stabla. Za selekciju atributa s
najheterogenijom strukturom vrijednosti ciljnog atributa, algoritam koristi koncept
entropije.
58
Jedna od interpretacija entropije iz teorije informacija jest da ona specificira minimalni
broj bitova informacije potreban da se kodira klasifikacija bilo kojeg lana skupa S (t.j.
ako se primjer iz skupa S sluajno odabere).
Ukoliko ciljni atribut poprima vie od dvije vrijednosti, npr. c razliitih vrijednosti, tada
je entropija skupa S u odnosu na takvu klasifikaciju definirana sa:
c
entropija ( S ) = pi log 2 pi
i =1
gdje je pi proporcija klase i u skupu S. Treba primijetiti da ako ciljni atribut poprima c
razliitih vrijednosti, maksimalna entropija iznosi log2c.
Uz danu entropiju kao mjeru "neistoe" u skupu primjera, sada moemo definirati
mjeru efektivnosti atributa u klasificiranju primjera. Ta mjera, informacijski dobitak,
predstavlja oekivanu redukciju entropije uzrokovanu razdvajanjem primjera na osnovu
tog atributa. Tonije, informacijski dobitak, gain(S,A), atributa A, u odnosu na skup
primjera S, definiran je kao:
| Sv |
dobitak ( S , A) = entropija ( S )
v vrijednost ( A ) | S |
entropija ( S v )
59
to znai da se mogu pojaviti samo jednom na odreenoj grani stabla. Ovaj se proces
nastavlja sve dok na odreenom voru nije zadovoljen jedan od dva kriterija:
svi atributi su ve bili koriteni u toj grani stabla, ili
svi primjeri koji pripadaju tom voru imaju istu klasu - prema tome radi se o
krajnjem voru grane (entropija primjera jednaka je nuli).
U principu, neki ID3 algoritam moe generirati stablo, dovoljno kompleksno da tono
klasificira sve primjere iz skupa podataka za uenje. Iako je to u odreenim sluajevima
razumna strategija, u veini situacija to raa dodatne probleme, bilo zbog uma u
60
podacima, ili pak nedovoljno velikog uzorka podataka koji bi trebao reprezentirati
populaciju primjera za odreeni klasifikacijski problem. Bez obzira da li se radi o
prvom ili drugom sluaju, jednostavni algoritam bi generirao stablo koje "pretjerano
dobro" (over-fitting) aproksimira odnose u podacima.
Iako se na prvi pogled prvi pristup ini direktnijim, drugi se pristup u praksi pokazao
pouzdanijim. To je posljedica toga to je teko unaprijed definirati eljenu
kompleksnost stabla odluivanja.
Bez obzira na odabrani pristup, glavno je pitanje kako emo odrediti optimalnu
kompleksnost, odnosno veliinu stabla za konkretni problem. Kao rjeenja nameu se
slijedei pristupi:
koritenje posebnog skupa primjera (validacijski skup), koji je razliit od onog
koritenog za generiranje stabla, da bi se ocijenila uspjenost "skraivanja"
stabla;
koritenje posebnog statistikog testa na vorovima koji su kandidati za
"skraivanje", kojima se pokazuje da li e se izbacivanjem tog vora postii
poboljanje;
koritenje eksplicitne mjere kompleksnosti kodiranja primjera stablom
odluivanja, koja zaustavlja rast stabla kada je taj kriterij zadovoljen. Ovaj
pristup baziran je na heuristikom principu koji se naziva "Minimum Description
Length".
61
Prvi od ovih pristupa je i najei. Kod ovog pristupa, primjeri se dijele u dva skupa:
skup za uenje (training set) koji se koristi za generiranje stabla, te skup za provjeru
(validation set), koji se koristi za provjeru uinkovitosti metode skraivanja stabla.
Osnovni oblik ID3 algoritma ogranien je na atribute koji imaju ogranien skup
diskretnih vrijednosti. Kao prvo, ciljni atribut mora imati ogranien broj kategorija
(klasa). Nadalje, atributi koji se testiraju u vorovima odluivanja takoer moraju imati
diskretne vrijednosti. Ovaj drugi zahtjev se moe relativno lako zadovoljiti i u sluaju
da je atribut numerikog tipa (realne numerike varijable). To se moe postii
dinamikim definiranjem novih diskretnih vrijednosti realnih varijabli koje dijele
vrijednosti tog atributa u diskretni skup intervala. Konkretno, za atribut A koji je
numerikog tipa, moemo primijeniti algoritam koji e dinamiki kreirati novi atribut
binarnog tipa Ac koji poprima vrijednost 1 (true) ako vrijedi A < c, odnosno 0 (false)
ako prethodna tvrdnja nije tona. Pitanje je kako doi do granica interesantnih intervala,
t.j. vrijednosti c. Naravno, mi bismo eljeli vrijednosti c, koje e nam dati najvei
informacijski dobitak (gain). Sortiranjem primjera prema vrijednostima atributa A, te
identificiranjem susjednih primjera koji pripadaju razliitim klasama ciljnog atributa
moemo generirati skup vrijednosti c u sredini intervala vrijednosti atributa A za takva
dva susjedna primjera. Moe se pokazati da vrijednosti c koje maksimiziraju
informativni dobitak uvijek lee na ovako definiranim granicama intervala. Ovako
definirane diskretne vrijednosti atributa mogu posluiti za izraunavanje informacijskog
dobitka koji im pripada, i tako uestvovati u procesu selekcije s ostalim atributima koji
su na raspolaganju za generiranje stabla.
U mnogim praktinim primjenama postoje atributi kod kojih odreeni postotak primjera
ima neodreene vrijednosti (missing values). Na primjer, u medicinskoj domeni est je
sluaj da su odreeni rezultati laboratorijskih testova dostupni samo za dio pacijenata. U
tom je sluaju uobiajeno da se vrijednosti tih atributa (testova) odrede na osnovu
ostalih primjera (pacijenata) koji posjeduju rezultate tih testova.
62
relativno mali zahtjevi na raunalne resurse (vrijeme i memorija);
sposobnost koritenja svih tipova atributa (kategoriki, numeriki);
stabla odluivanja jasno odraavaju vanost pojedinih atributa za konkretni
klasifikacijski odnosno predikcijski problem.
4.5. Klasteriranje74
Tehnike segmentiranja podataka spadaju u grupu tzv. neusmjerenih metoda (undirected
data mining), dok se u podruju strojnog uenja primjenjuje naziv "uenje bez nadzora"
(unsupervised learning). Cilj neusmjerenih metoda je otkrivanje globalne strukture
podataka. U ovom pristupu ne postoji definiran ciljni atribut, kao u usmjerenih metoda
poput metode stabla odluivanja, pa ne postoji razlika izmeu atributa.
74
Data Mining Server, http://dms.irb.hr/, 10.10.2004.
63
Metode segmentiranja koriste se radi podjele primjera u niz grupa ili podskupova
(clusters), koji zadovoljavaju dva osnovna kriterija:
svaka grupa predstavlja homogen skup: primjeri koji pripadaju istoj grupi su
meusobno slini;
svaka grupa mora se razlikovati od ostalih grupa, tj. primjeri koji pripadaju
odreenoj grupi znaajno se razlikuju od primjera koji pripadaju ostalim
grupama.
64
SLIKA 4.8. Algoritam K-srednjih vrijednosti75
75
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 296
65
Veina metoda segmentiranja koristi Euklidsku mjeru udaljenosti u prostoru primjera
(kvadratni korijen zbroja kvadrata udaljenosti po svim koordinatama (atributima)
prostora). Nominalni atributi moraju se prethodno transformirati i normirati prije za
primjenu metode segmentiranja. O ovoj transformaciji umnogome zavisi koliko e ovi
atributi biti vani za sam proces segmentiranja. Oni mogu biti dominantni, ali i potpuno
nebitni, ako se transformacija izvede na odreeni nain.
76
Data Mining Server, http://dms.irb.hr/, 10.10.2004.
66
element ili dio (u terminologiji obrade podataka uobiajenije je koritenje par
atribut-vrijednost);
transakcija (skup elemenata, korespondira terminu primjer u podruju obrade
podataka);
skup transakcija (korespondira pojmu skupa podataka).
Svaka transakcija u skupu transakcija, daje nam informaciju o tome koji elementi se
zajedno pojavljuju u transakcijama. Koritenjem transakcija mogue je napraviti tablice
koje nam daju frekvenciju pojavljivanja parova (ili veeg broja elemenata) odreenih
elemenata u transakcijama. Iz tih tablica lako je napraviti jednostavna pravila poput:
R1="Element 1 pojavljuje se zajedno s elementom 2 u 10 % svih transakcija"
67
Pouzdanost pravila od 0.5 jednaka je tvrdnji da kada se u transkaciji pojavi element 2,
postoji 50% vjerojatnost da e se u istoj transakciji pojaviti takoer i element 1. Na prvi
pogled izgleda da su najpouzdanija pravila ona koja su najbolja. Problem se moe
pojaviti kada se npr. element 1 pojavljuje vrlo esto u transakcijama. (recimo, u 60%
transakcija). U tom sluaju pravilo moe imati slabiju pouzdanost od sasvim sluajnog
odabira. To pokazuje da kao mjera dobrog pravila treba neto bolje od pouzdanosti. Ta
mjera naziva se poboljanjem (improvemet). Ta nam mjera govori o tome koliko je
odreeno pravilo bolje od sluajnog odabira. Pouzdanost je dana slijedeim izrazom:
p (uvjeta i posljedice)
I ( R2 ) =
p(uvjeta) p ( posljedice)
68
praktina ogranienja - velik broj elemenata koji se pojavljuju u velikom broju
interesantnih pravila
69
omoguuje obradu podataka kod kojih primjeri imaju varijabilni broj atributa;
algoritmi kojima se generiraju asocijativna pravila u principu su vrlo
jednostavni.
77
Panian ., Klepac G. "Poslovna inteligencija", Masmedia 2003., str. 354
70
SLIKA 4.10. Pretprocesiranje vremenske serije78
71
osnovne karakteristike promatrane pojave. Metodi vizualizacije esto prethodi ienje
podataka, odnosno nadomjetanje nedostajuih vrijednosti vremenske serije nakon ega
se primjenjuje neka od istraivakih metoda.
80
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.
72
SLIKA 4.11. Metodologija procesiranja vremenske serije data mining algoritmima
posredstvom REFII modela81
81
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.
73
analizu vremenskih serija davale su odreene pokazatelje koji se kasnije nisu mogli
procesirati posredstvom nekog od poznatih algoritama u cilju ekstrahiranja dodatnog
znanja. REFII model tei ka otvorenosti, odnosno uz svoju matematiku prirodu koja
slui kako za opis, tako i za generiranje znanja koje se krije u vremenskoj seriji, daje
modalitete rjeenja povezivanja s ostalim data mining algoritmima.
Ovom koncepcijom otvara se itavo jedno novo podruje koje nudi detaljniji i precizniji
analitiki princip u domeni vremenskih serija.
82
Klepac G. "Primjena inteligentnih raunalnih metoda u managementu", Sinergija, 2001., str. 63.
74
Povrina ispod krivulje daje kvantitativnu dimenziju odreenoj pojavi. Krivulja moe
imati jednaki oblik u odnosu na neku drugu krivulju, ali to ne znai da ima istu
kvantitativnu vrijednost, iz ega proizlazi pojam nejednakosti krivulje. Povrina ispod
krivulje moe pomoi u dobivanju tog pokazatelja. S ova dva elementa mogue je vrlo
precizno, gotovo jednoznano, opisati vremensku seriju. REFII model je jedinstveni
model transformacije koji jednoznano opisuje empirijsku krivulju (a sadri diskretne
vrijednosti), ija je zadaa povezati niz kako tradicionalnih, tako i ad hoc analitikih
postupaka.
Teoretski, krivulje mogu imati i jednak oblik opisan REF modelom, i jednaku povrinu,
a da ne budu u potpunosti jednake. To objanjava koritenje sva tri elementa u modelu.
Iako bi nam za potrebe analize podataka ova dva elementa u velikom broju sluajeva
bila dostatna za analize, na je cilj matematiki jednoznano opisati model krivulje pri
emu se smatra da u pojedinim sluajevima ove dvije krivulje mogu zadovoljavati
kriterij slinosti. Ponekad je apsolutno nerealno oekivati potpunu jednakost krivulja za
odreene pojave.
Iz izloenog modela REF model se ini kao redundantni element, jer pomou
koeficijenta kutnog nagiba pravca moemo opisati oblik krivulje. Razlog uklapanja REF
modela kao referentnog segmenta sustava proizlazi iz injenice da je vrijeme koje stroj
utroi kod procjene slinosti krivulja na temelju REF modela mnogo krae nego kod
modela koji bi se bazirao na koeficijentima kutnog nagiba pravca. REF model je isto
tako mnogo neprecizniji od modela baziranog na koeficijentima kutnog nagiba pravca,
ali je mnogo tromiji u procesu obrade.
75
SLIKA 4.12. Uloga koeficjenta kutnog nagiba pravca u REF II modelu83
Prilikom procesa analize vremenske serije moemo uzeti sva tri elementa kao temelj za
analizu. Ovaj model sam po sebi ne daje gotova rjeenja ve je polazina osnova za
kompleksnije modele. S tim u skladu, i REF model i povrina ispod krivulje i
koeficijentu kutnog nagiba pravca mogu biti koriteni zajedno kod modeliranja rjeenja
sloenijih problema, ali isto tako i parcijalno, to ovisi o karakteru problema koji
rjeavamo.
83
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.
76
kvantitativnog aspekta i jaine nagiba, pa emo procesirati podatke o obliku. U nekim
sluajevima kvantitativni aspekt moe igrati dominantnu ulogu te e on biti predmet
razmatranja i tako redom.
TABLICA 4.1. Orijentacijski odnosi izmeu tipa analize i elemenata REFII modela84
84
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.
77
biti u originalnoj duini. Za potrebe sofisticiranijih analiza bit e potrebno segmentirati
seriju kako bi se olakao proces analize.
Ovaj model nadalje prua mogunost jednoznanog opisa vremenske serije, to rezultira
primjenom egzaktnih matematikih modela i procesa.
Kao primjer navodim ciklike analize pojavnosti, gdje nas ne interesira kvantitativni
aspekt pojave, nego samo pojavnost, tada iz navedenog sustava moemo izdvojiti REF
podmodel kao temelj za analizu.
Generalno gledajui, REFII modelom opisujemo krivulju nizom parametara, a skup tih
parametara moemo kasnije procesuirati razliitim tipovima algoritama u razliitim
problemskim prostorima s ciljem otkrivanja znanja.Upravo procesi i problemski prostor
obrade ovih parametara determiniraju primjenu.
78
Osnovna koncepcija primjene REFII modela svodi se na tri koraka. U prvom koraku
vremenska se serija transformira u REFII sintaktiki model. Drugi korak odnosi se na
algoritmiranu obradu pokazatelja u formi REFII sintakse, dok se u treem koraku
ekstrahira znanje iz modela.
Upravo itava lepeza algoritmiziranih obrada koje se mogu primijeniti nad vremenskom
serijom opisanom REFII sintaksom, jedna je od glavnih prednosti ove koncepcije, u
odnosu na ostale koncepcije koje su procesno orijentirane.
REFII model, osim deskriptivne funkcije, ima i procesne funkcije koje se oituju u
algoritmiziranim postupcima procjene faktora sigurnosti za svaki od tri elementa.
Proraun faktora sigurnosti determiniran je tipom analize koju provodimo nad
krivuljom, i stupnjem zahtijevane preciznosti .
85
Klepac G. "Otkrivanje zakonitosti primjenom jedinstvenog modela transformacije vremenske serije",
radni materijal, 2004.
79
problemskog prostora primjenom raspoloivog instrumentarija unutar samog modela,
ali isto tako procesuiranjem parametara posredstvom nadograenih modula.
80
5. PONAANJE POTROAA
U fazi kupnje razmatraju se imbenici koji utjeu na izbor proizvoda i usluga. Najvei
dio prouavanja ponaanja potroaa bavi se upravo ovom fazom ponaanja potroaa.
86
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2
87
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2
81
suvremenim ivotnim uvjetima i opoj brizi drutva za zatitu okolia i stvaranju
zdravih ivotnih uvjeta.
Proces kupnje sastoji se od vie faza. U tom procesu postoji velik broj varijabli koje
imaju veeg ili manjeg utjecaja na pozitivan ili negativan rezultat kupovnog procesa.
Istraivanje usmjereno na pojedine elemente ponaanje potroaa i njihovu meusobnu
povezanost ima za cilj pojasniti sam proces donoenja odluke i naina, te jainu utjecaja
pojedinih varijabli u tom procesu. Ono to je specifino za sva drutvena istraivanja
jest da se uvjeti stalno mijenjaju pa s njima i intenzitet i smjer utjecaja pojedinih
varijabli.
88
Kesi T. "Ponaanje potroaa", Adeco, 1999., str. 2
82
Ponaanje potroaa dinamian je proces. Pojedinac, grupe s kojima je u neprestanoj
interakciji i drutvo u trajnom su procesu promjene. Ovo je od krucijalnog interesa za
prouavanje potroaa kao polazita za donoenje marketing strategija. To znai da su
generalizirani zakljuci o ponaanju potroaa limitirani u odnosu na vrijeme, proizvod i
usluge.
spoznaja
potrebe
utjecaji okruenja:
nezadovoljstvo zadovoljstvo
89
Engel F.J., Blackwell D.R., Miniard W.P., "Consumer Behavior", The Dryden Press, 1995., str. 53
83
Ponaanje potroaa pod utjecajem je velikog broja imbenika koji su meusobno
povezani a mogu se grupirati u tri skupine:
drutveni imbenici,
osobni imbenici
psiholoki procesi.
Drutvene imbenike ine: kultura, drutvo i drutveni stalei, drutvene grupe, obitelj,
situacijski imbenici i osobni utjecaji.
Osobne imbenike ine: motivi i motivacija, percepcija. stavovi, obiljeja linosti
vrijednosti i stil ivota, znanje.
Psiholoki procesi su: prerada informacija, uenje, promjena stavova i ponaanja,
osobni utjecaji.
Ono na to elim skrenuti panju jest priroda tekstilnih proizvoda koja u kontekstu
donoenja odluke o kupnji moe: pobuditi kod potroaa tradicionalni proces
prikupljanja informacija nakon ega slijedi odabir prema odgovarajuim
karakteristikama ili pobuditi iracionalnu odluku o kupnji modnog proizvoda kako bi se
zadovoljili afiniteti koji ne moraju nuno biti vidljivi.
90
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 353
84
DONOENJE
ODLUKE AKO JE U TRADICIONALNO
PITANJU MODNI DONOENJE
PROIZVOD ODLUKE
Odluka Rezultat
(kupujemo proizvod) (kupujemo proizvod i
uivamo u njemu)
Rezultat
(uivamo u kupljenom
proizvodu)
91
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 353
85
5.3.1. Vrste odluka potroaa
Jedan od zahvalnih naina karakteriziranja procesa donoena odluka je mjerenje
uloenog truda u donoenje odluke. U ovom kontekstu tzv. kontinuum donoenja
odluke o kupnji omeen je s jedne strane svakodnevnim, rutinskim odlukama o
rutinskim problemima te sloenim odlukama/problemima na suprotnoj strani. Veina
odluka pada u sredinu, podruje nazvano ogranieno rjeavanje problema92.
92
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 354
93
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 354
94
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 356
86
narrowers nezainteresirani za proces kupovanja,
apathetics mlai, nemaju elju ili mogunost ukljuenja u kupnju,
avoiders najnegativniji prema procesu kupnje, imaju malo vremena na
raspolaganju.
Modna industrija zapoljava milijune ljudi diljem svijeta, profiti se mjere u milijardama
eura. Nedvojbeno utjee na gotovo sve potroae dananjeg svijeta. Moda se odraava
na nae drutvo i kulturu te na neki nain utjee na to kako ljudi doivljavaju sebe.
Utjee na promjenu garderobe, namjetaja, automobila koje vozimo. Poslovna praksa
takoer je podlona modnim utjecajima. Moda je svuda oko nas.
Zamislimo obinu T-shirt majicu koju zasigurno svatko posjeduje u vlastitom ormaru.
Istraivanja vlakana od kojih je sainjena, projekcije boja i kretanja modnih trendova,
istraivanja tehnolokih rjeenja u proizvodnji i tkanju, ukljuenost posrednika i
doraivaa, dizajneri, savjetnici, logistika, PR agencije, modni asopisi i, na kraju,
maloprodajni duan. Svi su oni nekim dijelom zasluni za navedenu kupnju.
Razni autori upuuju i na vremensku dimenziju kao dodatni, do sada vrlo malo
spominjani, faktor utjecaja. Promatrajui vremensku dimeziju, jednostavno
stupnjevanje, prema teoretskom pristupu kojeg je razvio J. Laver, glasi95:
nepristojno 10 godina ispred svog vremena
95
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 12
87
besramno 5 godina prije vremena
hrabro 1 godinu prije vremena
pametno sada
neuredno 1 godinu nakon svog vremena
strano 10 godina nakon vremena
apsurdno 20 godina nakon vremena
smijeno 50 godina nakon vremena
armantno 70 godina nakon vremena
romantino 100 godina nakon vremena
lijepo 150 godina nakon vremena
96
Wang C.L., Hui A., Siu M., "Consumer decision-making styles on domestic and imported brand
clothing", 2002., http://www.emeraldinsight.com/0309-0566. htm
88
5.4.1. Ciklus prihvaanja mode
Ciklus prihvaanja mode pomiruje dolazak, prihvaanje, vrhunac te prestanak
prihvaanja odreenog stila. Slino nekim drugim proizvodnim ciklusima i ovaj je
mogue vizualizirati.
Samo neki od stilova postaju klasici, oni koji bivaju prihvaeni uvijek i bilo gdje. Pri
planiranju nabave ili prodaje, proizvodnje ili pokuaju izgradnje prediktivnog modela
vano je znati koji od utjecaja mogu biti prisutni kako bismo prema njima mogu
korigirati rezultate istraivanja te u skladu s tim interpretirati zakljuke.
Moda biva prihvaena od strane malog broja klijenata prije nego postane predmetom
masovnog trita. Moda je sloen proces koji funkcionira na vie razina. Razliitosti
pokreta nemogue je cjelovito obuhvatiti no za eventualna kasnija istraivanja valja
spomenuti (obzirom ih nije bilo mogue kvalitetno prevesti neki su nazivi navedeni u
originalu)98: kolektivnu selekciju (pojavu kada naprosto svi nose i ele imati isti
proizvod), tickle-down (neki brand koji starta sa pozicije "ispod" drugoga trudi se doi
na njegovu razinu, po dolasku klijenti vjerni brandu koji je bio "iznad" naputaju taj
brand), tickle-across (irenje trendova unutar odreenih skupina bilo dobnih ili plateno
sposobnih kao odraz statusa), subkulturni ili tickle-up (originalni radovi subkulture
mogu se naglo probiti u trend).
97
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 13
98
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 20
89
SLIKA 5.5. Usporedba ciklusa prihvaanja za klasine, modne i hirovite proizvode 99
Bez obzira radi li se o proizvodnji ili prodaji vano je skrenuti panju na oscilacije koje
razliiti atributi koji opisuju tekstilni proizvod mogu uvjetovati. Ilustracija pokazuje
kako ciklusi prihvaanja mogu utjecati na trendove u prodaji. Prema tome, dobro
odmjeren odnos izmeu trendovskih, modnih i klasinih proizvoda upravo je ono to
traimo.
Kao i mnoge druge pojave u svijetu u kojem ivimo, i ponaanje potroaa s vremenom
se mijenja. Razlozi su tome mnogobrojni, a meu najvanije svakako spadaju opi
drutveni i ekonomski napredak, promjene u politikom ustrojstvu svijeta, povean
99
Solomon M.R., Rabolt N.J., "Consumer Bahavior in Fashion", Prentice Hall, 2004., str. 14
100
Panian . "Odnosi s klijentima u e-poslovanju", Sinergija, 2003, str. 3
90
standard i kvaliteta ivota ljudi, obitelji i drutvenih zajednica, kumuliranje
individualnoga, organizacijskog i kolektivnog znanja te tehnologija.
"Ljudi e Vam rei da vole odreske. No, kada pripremaju prazninu zabavu kupuju
hamburgere. Postoji odmak izmeu onoga to ljudi kupuju i onoga to ele101". Slijedei
ovu izjavu moemo konstatirati da e jedan od najveih izazova rudarenju podataka biti
istovremeno i nerjeiv. Naime, rudarenjem podataka moemo doi do predvianja
ponaanja potroaa baziranog na ponaanju u prolosti (kojim navikama tee na
temelju ranije uinjenih transakcija, demografskih informacija itd.). Moe li se zaista
predvidjeti to ljudi ele kupiti?
Zasigurno, svjedoci smo utjecaja kojeg ovakve analize imaju na trite, na ponudu i na
ponaanje ponuaa, doivljavamo ih openito i u pozitivnom kontekstu nas kao
101
Johnstone K. direktor BI odjela tvrtke Emerald Solutions,
http://news.com.com/Behind+the+numbers/2009-1017_3-252162.html, 20.10.2004.
91
potroa. No, jesmo li zaista svjesni kako ovakve analize mogu rezultirati npr.
usklaivanjem cjenovnih politika pri emu spoznaja da je neki proizvod popularan, i
shodno tome ponua odlui podii/zadrati odreenu cijenu, negativno djeluje na nas
kao potroaa?
92
6. POTENCIJALNE PRIMJENE METODA RUDARENJA
PODATAKA U TRGOVINI TEKSTILNIM I SRODNIM
PROIZVODIMA
Nove korporacijske organizacijske sheme unose mnoge novosti, ukljuujui nove ljude
u poslove donoenja odluka. Iako ti zaposlenici moda nee donositi konane odluke,
oni su odgovorni za davanje preporuka koje se temelje na njihovom poznavanju
poslovanja. Zajedno s rezultatima do kojih e doi prekopavajui podatke, ti e ljudi
predstavljati bazu znanja o poslovanju tvrtke. Naprijed spomenuti alati mahom moraju
biti prilagoeni za uporabu ljudima koji nisu informatiari. Upravo grafiko suelje
jedna je od bitnih prednosti koje su tijekom godina poveale uporabljivost brojnih
softverskih alata. Sve donedavno, tvrtke su za analizu podataka, odlunih za poslovanje,
angairale statistiare. Sa zahtjevima za pronalaenje trendova i pravila ponaanja,
grupiranja i razdvajanja korporacijskih podataka, kreiranje profila i pronalaenje
odstupanja, postaje neizbjeno angairati vlastite ljude i njihov rad poduprijeti
posebnim alatima.
102
Previ M. "Podaci kao poslovni resurs", http://www.skladistenje.com/jedan.asp?ID=113, 20.02.2001.
93
Svrha je uporabe alata za rudarenje izrada modela ili aplikacije za kasniju uporabu.
Model moe biti izgraen samo jednim pristupom ili njihovim uspjenim
kombiniranjem.
94
6.2. Tehnike pretprocesiranja podataka
Baze podataka u poslovnim sustavima podlone su raznim gubitcima, neistoama i
nekonzistencijom podataka, najee uslijed veliine koja prelazi gigabajte podataka.
Tehnike pretprocesiranja pomau poveanju kvalitete podataka pa tako utjeu i na
kvalitetu rezultata rudarenja.
103
Han J., Kamber M. "Data Mining: Concepts and Techniques", 2000., Morgan Kaufmann, odjeljak 3,
str. 3
95
robne grupe kojoj pripadaju. Navedene vrijednosti izraene su sumarno na dnevnoj bazi,
a nazvane su muka trikotaa, enska trikotaa, obua, ensko rublje, muka konfekcija
i enska konfekcija. Ve prema pokazateljima, u pojedinim analizama sudjeluju one
grupe koje su se pokazale osjetljivijima tj. zanimljivijima za interpretaciju. Takoer, na
kraju istraivanja osvrnut u se na moguu podjelu po etvrtima unutar Grada odnosno
neke mogunosti primjene koje u ovom radu nisu iskoritene. Za potrebe istraivanja od
Gradskog zavoda za planiranje razvoja Grada i zatitu okolia kupljeni su statistiki
podaci o stanovnitvu podijeljeni po etvrtima a potencijal ovakvih i slinih podataka
koje Zavod nudi ili ih planira nuditi u budunosti, naznaiti e se u zavrnom dijelu
istraivanja.
96
izradu Bayesove mree na podacima transformiranim REFII modelom. Python Orange
modul iskoriten je za analizu relevantnosti atributa i asocijacijska pravila.
Pri tome se navodi da vrijeme potrebno za prve tri faze oduzima oko 20% ukupnog
vremena potrebnog za istraivanje dok ostale oduzimaju preostalih 80%. Nasuprot
tome, vanost ispravno postavljenog prostora, rjeenja i metoda sudjeluje sa 80% dok
na preostali dio otpada 20%.
104
Pyle D. "Data Preparation for Data Mining", Morgan Kaufmann Publishers, 1999., str. 10
97
Odabrane metoda rudarenja smatrao sam dobrom mjerom kako bi se sadrajno
zaokruenim pristupom prikazale mogunosti primjene. Nakon to je definiran nain na
koji e se podaci agregirati, pristupio sam prikupljanju iz skladita podataka. Paralelno
sam pretraivao vanjske izvore u potrazi za podacima o vremenskim prilikama i
pojedinim statistikim pokazateljima. Nakon to su se svi podaci nali u poetnoj bazi
podataka, pristupio sam kategoriziranju za potrebe pojedinih metoda. Kategorizirane i
kontinuirane varijable, povezane s vanjskim podacima i agregirane oko datuma u godini
bile su spremne za analizu.
Analiza relevantnosti atributa esto je uvodni pokazatelj. Premda razni autori koriste
razne tehnike, najee se koriste razni indeksi koji pokazuju entropiju ili stabla
odluivanja. Asocijativna pravila dodatno istiu pojedine veze meu varijablama.
Primjena stabala odluivanja na ilustrativan nain takoer pokazuje vanost nekih
odnosa s karakteristikom primjene na manje uzorke pri emu se istiu neke zakonitosti
teko vidljive na neki drugi nain.
Vie je pak razloga za odabir REFII modela. Osim to ga je mogue iskoristiti kao alat
za pretprocesiranje, njegova primjena za analizu podataka koji imaju svojstvo oscilacije
u vremenu kombinira jednostavnost primjene i snagu metoda procesiranja vremenskih
serija. Koliina ekspertnog znanja moe no i ne mora biti preprekom za primjenu ove
metode. Meutim, kvalitetniji rezultati svakako e zahtjevati to veu razinu istog.
Uslijed elje da se sadrajno obuhvati sve navedeno, pri koritenju REFII modela
koncentrirao sam se na analizu putem kutnog otklona dok za ovo istraivanje nisu
koritene ostale mogunosti REFII modela (analiza povrine ispod krivulje).
98
6.3. Otkrivanje varijabli utjecaja
Odnose meu kategorijama mogue je promatrati kao zakonitosti iz kojih je direktno
mogue izvoditi pravila ili kao pokazatelje pojedinih podruja zanimljivih za
istraivanje.
Boxplot grafikoni (Prilog 1) prikazuju vrijednost varijabli prema danima u tjednu. Izvan
oblika prikazane su ekstremne vrijednosti dok su objektima prikazane minimalne i
maksimalne vrijednosti, srednja vrijednost i prosjeno odstupanje. Iz grafikona se vide
najvea odstupanja kod prodaje enske konfekcije i najmanja kod prodaje enskog
rublja.
Analiza relevantnosti atributa provedena je za sve kategorije robe kao ciljne varijable,
pri emu su iste kategorizirane prema pravilima u Prilogu 2. Analiza relevantnosti
atributa nalazi se u Prilogu 3. Izvedena je Python Orange modulom i bazira se na Gini
indeksu, koji pokazuje vjerojatnost da dva nasumce odabrana uzorka ne pripadaju
navedenoj kategoriji.
99
broju sluajeva odluuju za neki konfekcijski proizvod i to prije muki nego enski.
Ovo moe upuivati i na obiteljsku kupovinu odnosno na situaciju u kojoj obitelj ciljano
krene u nabavku nove odjee ili na pomisao da enska osoba u obitelji kupuje za cijelu
obitelj.
100
6.3.4. Prodaja muke konfekcije
Prodaja muke konfekcije najosjetljivija je na promjenu prodaje muke trikotae, enske
konfekcije, enske trikotae, enskog rublja, obue, nakon ega slijedi dan u tjednu i
godinje doba, dok je vrlo malo osjetljiva na vlagu i datum u mjesecu[3].
101
Kada bismo imali na raspolaganju dodatne podatake o spolu potroaa oni bi zasigurno
dodatno konkretizirli odnose. Pretpostavke poput navedenih predstavljaju podlogu za
istraivanje odjela u tvrtkama koji se bave ovim pitanjima. Ovisno o opsegu istraivanja
nakon postavljanja ovakvih hipoteza ide se u detaljnije istraivanje.
102
proizvodima. Prilog 4 pokazuje odnose prodaje promatranih kategorija, dana u mjesecu
grupiranih u kategorije te godinjeg doba.
Iz analize je vidljivo da je prodaja enskog rublja u najveoj mjeri (52,05%, n=190) bila
srednje vrijednosti. Najutjecajnija slijedea varijabla bila je prodaja muke trikotae. Na
sluajeve visoke (>SREDNJA) prodaje muke trikotae otpada 33,15% unutar ega
72,73% na visoku prodaju rublja. Na sluajeve srednje (NISKA,SREDNJA) prodaje
muke trikotae otpada 49,32% unutar ega 87,22% na srednju prodaju rublja. Vano je
pratiti broj sluajeva kako bismo istovremeno kontrolirali pouzdanost odnosno
razlikovali pouzdanost od trenutnih oscilacija ili modnog hira. Analizirajui sljedee
grananje kao znaajna varijabla (prodaja rublja visoka prodaja muke trikotae) u
gornjem dijelu stabla definirana je enska trikotaa i to sa takoer kategorijom visoka
(>SREDNJA). U donjem dijelu stabla (prodaja rublja srednja prodaja muke
trikotae) odabran je dan u tjednu, posebno subota sa ak 10,14%. Znaajniji pokazatelj
u slijedeim granama vidljiv je u donjoj grani (prodaja rublja srednja prodaja muke
trikotae dan /svi osim subote i nedjelje/ ) i to dan u mjesecu[7] pri emu prodaja u
prvom djelu mjeseca (do 12. u mjesecu) sudjeluje sa 15,89%.
Pri ciljnoj varijabli prodaje enske trikotae takoer su dominantne vrijednosti unutar
srednje kategorije. Sljedee grananje vreno je na prodaji muke trikotae. U treem
103
grananju zanimljivo je primjetiti utjecaj godinjeg doba odnosno tlaka zraka u donjem
djelu stabla.
Pri ciljnoj varijabli prodaje muke trikotae, prodaja muke konfekcije i prodaja enske
trikotae definirane su kao dominantne prema broju u uzorku. Zanimljivo je da slijed
muka trikotaa, visoka prodaja muke konfekcije ima znaajnu pojavu i u visokoj
prodaji enskog rublja nakon kojeg je kao znaajna odabrana prodaja enske konfekcije.
Bez detaljnijih podataka moemo tek pretpostaviti da se ovdje moe raditi o nekom
obiteljskom planskom kupovanju.
Ciljna varijabla prodaje obue povezana je s prodajom enske konfekcije a nakon toga u
oba grananja s godinjim dobom. Moemo pretpostaviti da pri kupnji enske konfekcije
strast prema obui ima prednost pred godinjim dobom (jesen/zima loe vremenske
prilike, proljee/ljeto obua za sport i rekreaciju) koje bi se moglo protumaiti kao
razumski utjecaj. Utjecaj naoblake, broja sunanih sati i temperature potvruju utjecaj
vremenskih prilika na kupnju.
Ciljna varijabla prodaje muke konfekcije nakon prodaje muke trikotae nalazi utjecaj
u godinjem dobu. Pretpostavka koja se moe formirati je da mukarci (ili netko za njih)
kupuju vie stvari (odjevnu kombinaciju) odjednom i to prema godinjem dobu odnosno
ovisno o vremenskim prilikama.
104
Valja napomenuti da faktor cijene nije ukljuen u analizu odnosno da su proizvodi
trikotae oni za koje odluka o kupnji esto ima manje predradnji. Navedene
interpretacije potvruju ranije izneene meuovisnosti.
105
tome da broj sluajeva u klasterima bude podjednako zastupljen. U navedenom sluaju
od ukupno 385, 179 ih je u klasteru 1 a 186 u klasteru 2. Konane vrijednosti sredita
klastera prikazane su u tablici (final cluster centers).
SLIKA 6.2. Scatterplot dijagram odnosa temperature i prodaje obojan prema izraenim
klasterima
Osim ilustracijski, ovaj pristup prouavanju odnosa nee biti detaljnije razraivan u
ovom radu.
106
6.5. Otkrivanje pravilnosti u trendovima prodaje tekstilnih proizvoda
pomou REFII modela
Ranije prikazana naela REFII modela sada emo prikazati u praksi na stvarnom uzorku
podataka. Vrijednosti kategorija zavisnih varijabli transformirani su u REFII model
programskim rjeenjem Time Explorer. Postupak transformacije sastoji od nekoliko
faza.
107
SLIKA 6.4. Time Explorer
108
Razred Donja granica Gornja granica REF
Nizak rast 0.000000000 0.300000000 R
Srednji rast 0.300000000 0.700000000 R
Visok rast 0.700000000 1.000000000 R
Nizak pad 0.000000000 0.300000000 F
Srednji pad 0.300000000 0.700000000 F
Otar pad 0.700000000 1.000000000 F
Bez promjene 0.000000000 0.000000000 E
Analizom trendova (rast, pad, bez promjene) kroz vrijeme elimo prouavati zavisnosti,
odnose i pravilnosti te pri tome rezultate razmatrati kroz prizmu poslovne primjene u
prodaji tekstilnih proizvoda.
109
nedjeljom za koju znamo da nije radna sugerira lou prodaju subotom (ovdje zapravo
oekujemo otar pad) to uvidom u podatke moemo zakljuiti jer poinje ve u petak
(nizak pad 50,0%).
Odnosi sezonskih oscilacija naznauju nizak pad prodaje enskog rublja i enske
konfekcije subotom (92,3% sluajeva i 80,8% sluajeva) to upuuje na zakonitost.
Znaajniji postotak srednjeg pada nedjeljom karakteristika je enske konfekcije, muke
konfekcije i enskog rublja. Sve kategorije biljee znaajniji postotak srednjeg rasta
ponedjeljkom pri emu se dijelom taj rast biljei i utorkom, dakle, prodaja raste u
prvom djelu tjedna.
110
Sezonske oscilacije mogu se u ovom kontekstu upotrijebiti kroz usporeivanje
povijesnih podataka te zakonitosti koje se ponavljaju kako bi se izdvojile one
najznaajnije i primjenom ostalih metoda protumaili njihovi uzroci.
111
SLIKA 6.6. Stablo odluivanja izgraeno na podacima iz REFII modela
Prilog pokazuje model s poetnim vrijednostima uvjetne vjerojatnosti pri emu strelice
u vezana predstavljaju smjer ovisnosti pa tako u modelu prodaja obue i muke
konfekcije ovisi o godinjem dobu, prodaja obue ovisi o prodaji muke konfekcije,
prodaja muke konfekcije ovisi o prodaji enske konfekcije, dan u tjednu utjee na
prodaju enske konfekcije, prodaja enske konfekcije ovisi o prodaji enskog rublja te
dan u tjednu utjee na prodaju enskog rublja. Na isti nain moe se interpretirati i
model B.
Kao primjer za zadane sve vrijednosti kako je prikazano u tablici mrea A predvia
trend prodaje enske konfekcije. Upotrebljivost ovakvog pristupa sastoji se u tome to
pripremljeni model moe biti prezentiran osobama koje imaju poslovna znanja (kad se
112
mrea jednom formira nju mogu koristiti npr. menaderi) kojima mogu pretraivati
zakonitosti koje su im zanimljive.
Pogledajmo rezultate vjerojatnosti kategorija pri srednjem rastu prodaje svih kategorija.
Pogledajmo rezultate vjerojatnosti kategorija pri visokom rastu prodaje enskog rublja,
etvrtkom, visokom rastu prodaje obue u proljee.
113
Analizirani model A potvrdio je ranije predstavljene utjecaje (promjenu varijable u
odnosu na zavisne) i odnose (stupanj promjene) te ilustriranim vezama sugerirao na
smjer i prirodu utjecaja pojedinih varijabli u modelu. Pri provoenju analize mora se
voditi rauna o smjerovima meuovisnoti (ilustrirani strelicma) koji upuuju na znaaj
pojedinih veza i navode na smjer kojim bi trebalo interpretirati rezultate. Naravno,
mrea e funkcionirati bez obzira na uvaavanje ovih pretpostavki, no za vei stupanj
pouzdanosti nuno je znati kako funkcionira.
Pogledajmo rezultate ove mree za prvi sluaj koji je primjenjen na mrei A. Rezultati
su slini uz veliki postotak niskog rasta temperature i blagu dominaciju trenda pada
relativne vlanosti.
Same smjernice veza mogu nam ilustrirati njihovu vanost. Istraivau preostaje
odabrati ili odbaciti ostale odnosno prihvatiti sugestiju sustava za modeliranje da neke
varijable ispusti uslijed irelevantnog utjecaja.
114
6.7. Potencijali poslovne primjene dobivenih rezultata analize
Tvrtke koje nemaju viziju primjene ovih metoda a bave se odnosima nalik opisanima u
radu svakako bi trebale razmotriti potencijale primjene u vlastitom poslovanju.
Istraivanje je provedeno prikupljanjem podataka iz skladita podataka koje nije
specifino izgraeno u svrhu ovakvih analiza pa stoga ne sadri pojedine podatke, niti
za postojee podatke posjeduje razinu koja bi omoguila detaljnije analize. Bez obzira
na spomenuto, metode rudarenja i posebno REFII model daju drugaiju projekciju
ovisnosti koritenih varijabli te impliciraju na zakonitosti koje i na prikazanoj razini
navode na razmiljanje i evidentno ih je mogue primijeniti u poslovno promidbenim
aktivnostima.
Kao ilustraciju, elio bih spomenuti mogunost kombiniranja ovih podataka s podacima
o stanovnitvu. Ranije spomenuti podaci o naseljenosti i nekim drugim pokazateljima
mogu se koristiti bilo kao potencijal za otvaranje novih prodavaonica bilo za
promatranje utjecaja prodaje kroz podatke o potroaima koji su naseljeni na
odreenom podruju. Jedan od problema tekstilne trgovine je specijaliziranost
prodavaonica uslijed velikog broja razliitih robnih grupa to nije sluaj s, recimo,
trgovinama robe iroke potronje. Drugi problem je neravnomjeran raspored trgovina
prema gradskim etvrtima za koje gradske institucije prate statistiku pa bi provoenje
ovakovog istraivanja otkrilo svojevrsne specifinosti koje se tretiraju poslovnim
tajnom. Trea i, za mene najvanija prepreka zbog koje navedene istraivanja nisam
provodio u ovom radu, jest potreba ekspertnih znanja u definiranju parametra
potencijala odreenog prodajnog mjesta kao funkcije oekivane frekvencije
posjeenosti, blizine ustaljenih potroakih puteva, atraktivnosti lokacije, ureenja
prodajnog mjesta i same robe (brand i sl.).
115
potencijalno znaajnom potranjom moe rezultirati dobrim poslovnim rezultatom.
Podjela na etvrti prikazana je u Prilogu 10.
SLIKA 6.7. Prikaz broja stanovnika prema dobi i nekim gradskim etvrtima
116
7. ZAKLJUAK
Ovaj rad evidentno je pokazao primjenjivost metoda rudarenja podataka u trgovini
tekstilnim proizvodima. Kod ove vrste roba posebno izraen sezonski karakter te
mnotvo zavisnih utjecajnih varijabli pogodno je za obradu podataka ove vrste i
provoenje analiza na njima. Eventualan ograniavajui faktor izraen je u kvaliteti
dostupnih podataka i znanju istraivaa. Transakcijski sustavi koji se izrauju za
potrebe praenja poslovanja esto, upravo zbog karaktera robe koji implicira praenje
mnogih atributa, bivaju vrlo sloeni ili, nasuprot tome, krajnje pojednostavljeni na
osnovne funkcije dok postprocesiranjem omoguuju korisnicima uvid u ostale podatke.
Ovakav pristup najee rezultira prekasnim dobivanjem informacija, prekasnim da bi
se moglo pravovremeno reagirati na trine zahtjeve. Pomno planiranje, uz cjelovit
pristup potrebama transakcijskog ali i izvjetajnog dijela sustava, ovdje je od velike
vanosti.
117
Cilj primjene metoda rudarenja podataka je kvalitetnije donoenje poslovnih odluka te,
uz primjenu tehnologije, dostupnost podataka kako bi se uoavale i kombinirale
dugorone i trenutne zakonitosti i u skladu s njima reagiralo odgovarajuom poslovnom
politikom na zahtjeve sve nepredvidljivijeg trita.
118
POPIS KORITENIH IZVORA
Engel F.J., Blackwell D.R., Miniard W.P. (1995) "Consumer Behavior", The
Dryden Press
Han J., Kamber M. (2000) "Data Mining: Concepts and Techniques", Morgan
Kaufmann
Inmon, William H. (1992) "Building the data warehouse", Wiley
Kantardi M. (2003) "Data Mining: Concepts, Models, Methods and
Algorithms", Wiley
Kesi T. (1999) "Ponaanje potroaa", Adeco
Kimball R. (1996) "The Data Warehouse Toolkit", Wiley
Klepac G. (2001) "Primjena inteligentnih raunlanih metoda u managementu",
Sinergija
Klepac G. (2004) "Otkrivanje zakonitosti primjenom jedinstvenog modela
transformacije vremenske serije", radni materijal
Klepac G. (2000) "Otkrivanje zakonitosti iz perspektive poduzea primjenom
metoda umjetne inteligencije", Ekonomski fakultet Zagreb, magistarski rad
Kockar I. (2002) "Metode rudarenja podataka u kartinom poslovanju",
Ekonomski fakultet Zagreb, magistarski rad
Panian . (2002) "Izazovi elektronikog poslovanja", Narodne Novine
Panian ., (2003) "Odnosi s klijentima u e-poslovanju", Sinergija
Panian ., Klepac G. (2003) "Poslovna inteligencija", Masmedia
Pyle D. (1999) "Data preparation for Data Mining", Morgan Kaufmann
Rudd P.O. (2001) "Data Mining Cookbook - Modeling Data for Marketing,
Risk, and Customer Relationship Management", Wiley
Solomon M.R., Rabolt N.J. (2004) "Consumer Behavior in Fashion", Prentice
Hall
Sria V. Mller J. (2001) "Put k elektronikom poslovanju", Sinergija
Sria V., Spremi M. (2000) "Informacijskom tehnologijom do poslovnog
uspjeha", Sinergija
119
PUBLIKACIJE, LANCI, WEB IZVORI
Stanovnitvo, kuanstva i stanovi, publikacija, Gradski zavod za planiranje
razvoja Grada i zatitu okolia, Odjel za statistiku (2001)
Zbornik radova 9. konferencije hrvatske udruge Oracle korisnika (HrOUG)
(2004)
Camper, http://www.camper.es
DHMZ, http://www.meteo.hr
Institut Ruer Bokovi, Data Mining Server, http://www.orb.hr
Mango, http://www.mango.es
120
MIT, http://www.ai.mit.edu
Nike, http://www.nike.com
Skladitenje podataka u Hrvata, http://www.skladitenje com
Webopedia, http://www.webopedia.com
121
POPIS ILUSTRACIJA I TABLICA
SLIKA 2.1. Stvaranje vrijednosti za klijenta u maloprodaji
SLIKA 2.2. Detalj on-line duana tvrtke Mango
SLIKA 2.3. Detalj on-line duana tvrtke Camper
SLIKA 3.1. Logika hijerarhija podataka, informacija i znanja
SLIKA 3.2. Shematski prikaz vrijednosti informacije kao vremenski promjenjive
veliine
SLIKA 3.3. Kontinuum vrijednsti informacije
SLIKA 3.4. Model sustava poslovne inteligencija zasnovan na rudarenju podataka
SLIKA 3.5. Dijagram tijeka manipulacije sustava tijekom postupaka
SLIKA 3.6. Tri hipoteze za dani set podataka
SLIKA 4.1. Taksonomija rudarenja podataka
SLIKA 4.2. Primjer primjene vizualizacije za unapreenje procesa klasteriranja
SLIKA 4.3. Grafiki prikaz Bayesove mree
SLIKA 4.4. Grafiki prikaz Bayesove mree i tablice uvjetne vjerojatnosti
SLIKA 4.5. Tri vrste veza meu elementima mree
SLIKA 4.6. Primjer jednostavnog stabla odluivanja
SLIKA 4.7. ID3 algoritam
SLIKA 4.8. Algoritam K-srednjih vrijednosti
SLIKA 4.9. Prikaz vremenske serije pomou vektora
SLIKA 4.10. Pretprocesiranje vremenske serije
SLIKA 4.11. Metodoligija procesuiranja vremenske serije data mining algoritmima
posredstvom REF II modela
SLIKA 4.12. Uloga koeficjenta kutnog nagiba pravca u REF II modelu
SLIKA 4.13. Etape u iotkrivanju znanja primjenom REF II modelu
SLIKA 5.1. Sloeni model ponaanja potroaa
SLIKA 5.2. Faze u modnom i tradicionalnom procesu donoenja odluka
SLIKA 5.3. Kontinuum donoenja odluka o kupnji
SLIKA 5.4. Uobiajen modni ciklus
SLIKA 5.5. Usporedba ciklusa prihvaanja za klasine, modne i hirovite proizviode
SLIKA 6.1. Klasteriranje provedeno algritmom k srednjih vrijednosti alatom SPSS
122
SLIKA 6.2. Scatterplot dijagram odnosa temeprature i prodaje obojan prema izraenim
klasterima
SLIKA 6.3. Pojednostavljen prikaz REFII modela
SLIKA 6.4. Time Explorer
SLIKA 6.5. Transformacija podataka u REFII model
SLIKA 6.6. Stablo odluivanja izgraeno na podacima iz REFII modela
SLIKA 6.7. Prikaz broja stanovnika prema dobi i nekim gradkim etvrtima
TABLICA 4.1. Orijentacijski odnosi izmeu tipa analize i elemenata REFII modela
TABLICA 6.1. Razredi kutnih otklona
123
IVOTOPIS
Roen sam 27. lipnja 1973. godine u Zagrebu. Srednju kolu, Centar za odgoj i
usmjereno obrazovanje Ivani Grad, zavravam 1992., sa zvanjem prirodoslovno-
matematiki tehniar. kolovanje nastavljam 1993. na Ekonomskom fakultetu
Sveuilita u Zagrebu. Diplomirao sam 1997. godine na katedri za vanjsku trgovinu,
tema diplomskog rada: Kasko osiguranje u brodskom prometu (praksa i rad vezani uz
Helios d.d. za osiguranje, Zagreb). Poslijediplomski studij Informatiki management
upisujem 2003. godine kao student VI. generacije.
U sijenju 1998. godine zapoljavam se u Domu zdravlja u Ivani Gradu kao pomonik
ravnatelja ustanove za informatiku i financije gdje radim do sredine 1999. godine. U
rujnu 1999. godine zapoljavam se u dionikom drutvu Tekstilpromet, u slubi
informatike, kao projektant/organizator. Na ovom radnom mjestu obavljam vie
funkcija voditelja/sudionika na razliitim projektima (evidencija radnih sati, carinsko
skladite, financijsko poslovanje, robno poslovanje) te sam aktivno ukljuen u projekte
organiziranja, razvoja i uvoenja aplikacija (baze podataka: ORACLE (7.1. 10g), MS
Access, Paradox, DBase; alati: Oracle Designer, Developer (3.0 9i), Oracle
Discoverer, T.O.A.D., SQL Expert). U sklopu radnih zadataka pohaam vie
specijaliziranih teajeva za rad s Oracle alatima.
Kao dodatna znanja navodim programske jezike: Basic, Pascal, Fortran, Clipper, SQL,
PL/SQL; alate/baze podataka: Oracle, MS Access, Borland/Inprise Delphi, DBase,
HTML i skriptni jezici (Java, JavaScript...), Macromedia Fireworks, Macromadia Flash,
Macromedia Dreamweaver
124
SAETAK
Rad opisuje utjecaj globalizacije na trine aktivnosti kao to su nabava i udruivanje
tvrtki radi zajednikog nastupa na tritu. Prikazani su trendovi koji se mogu razabrati
kao posljedica sve otrijih trinih uvjeta. Kao projekcija buduih kretanja naznaen je
utjecaj interneta, a prikazani su i primjeri nekih svjetskih kompanija koje su se ve
odluile na poslovanje tim putem i naini na koji su to uinile. Uz odreenje pojma
poslovne inteligencije opisana je evolucija poslovnih informacijskih sustava. Ukazano
je i na neke specifinosti vezane uz njihovo projektiranje u svrhu podrke trgovini
tekstilnim proizvodima. Opisane su neke mogue primjene poslovne inteligencije u
poduzeima te prikazana naela skladita podataka i alata za analizu kao preduvjeta
rudarenju podataka. Uz pojam rudarenja podataka navedene su i pripadajue metode i
alati. Detaljnije su opisane odabrane metode, s naglaskom na REFII model kao hibridni
model, koji, osim analize, moe posluiti i kao alat za pretprocesiranje. Pojam i model
ponaanja potroaa proireni su specifinostima karakteristinim za tekstilne proizvode
koje se, pak, stavlja u kontekst odluke o kupnji. Razliiti utjecaji, koji utjeu na
ponaanje potroaa, prikazani su u kontekstu vrijednosti pogodnih za istraivanje
metodama rudarenja podataka. Analiza podataka izvrena je na uzorku prodaje u Gradu
Zagrebu. Podaci su analizirani odabranim metodama rudarenja podataka te stavljeni u
odnos s nekim vanjskim imbenicima u svrhu uoavanja zakonitosti u ponaanju
otroaa, zakonitosti meu kategorijama unutar podataka, za analizu sezonskih
oscilacija te predvianju trendova u budunosti.
125
SUMMARY
This study shows a globalization influence on market activities such as supply chain,
company mergers and/or joint-ventures. These trends could be identified as the result of
growingly severe market requirements. Future projections that include influence of the
Internet are described and associated with some examples and case studies of global
companies already utilizing it. Defining of the term business intelligence was combined
with information systems evolution description. Furthermore, the specific solutions to
information systems building, for the use in the textile product trade, were pointed out.
Some business intelligence applications were also described together with portraying
the data warehouses and analytic tools as preconditions for data mining methods and
instruments. In a more detailed manner, a hybrid model REFII was explained because it
can be used for analysis and data preparation at the same time. Specific characteristics
of consumer behavior related to textile products were shown in the context of decision
making process. Various motives that influence consumer behavior were recognized as
values set for the data mining analysis. The research was conducted on data sample that
included point-of-sale spots in the city of Zagreb, Croatia. Analysis included data
mining methods in relation to selected external factors with the purpose of finding
consumer behavior and category patterns, seasonal fluctuations and future sales
projections.
126
Prilog 1 Boxplot dijagrami kategorija
127
Prilog 2 Kategorizacija podataka
Varijabla Vrijednost Varijabla Vrijednost
/ kategorije Naziv kategorije / kategorije Naziv kategorije
sek. trans. (<=) sek. trans (<=)
Relativna vlanost
1 50,00 NISKA
2 75,00 SREDNJA
3 >75,00 VISOKA
Naoblaka (0 do 10)
1 1,00 VEDRO
2 4,00 POLUOBLANO
3 8,00 OBLANO
4 >8,00 VRLO OBLANO
*uz pomo SPSS 12.0 Visual bander, kategorije formirane na temelju ekspertnog znanja i rezultata istraivanja
128
Prilog 3 - Analiza relevantnosti atributa
129
Prilog 4 Odnos: dan u mjesecu, godinje doba, prodaja
130
Prilog 5 Asocijacijska pravila
supp conf rule
0.290 0.602 SERD_TLAK_HPA=3 -> PRO_OBUCA=2
0.323 0.670 SERD_TLAK_HPA=3 -> PRO_TRIKOTAZA_ZENSKA=2
0.340 0.626 VLAGA_POSTOTAK=2 -> SUNCANIH_SATI=4
0.340 0.821 SUNCANIH_SATI=4 -> VLAGA_POSTOTAK=2
0.244 0.618 VLAGA_POSTOTAK=3 -> PRO_KONFEKCIJA_ZENSKA=2
0.288 0.729 VLAGA_POSTOTAK=3 -> PRO_OBUCA=2
0.293 0.743 VLAGA_POSTOTAK=3 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.660 VLAGA_POSTOTAK=3 -> PRO_RUBLJE_ZENSKO=2
0.252 0.719 PRO_KONFEKCIJA_ZENSKA=3 -> VLAGA_POSTOTAK=2
0.403 0.770 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.403 0.850 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.403 0.717 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.403 0.850 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2
0.392 0.794 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.392 0.827 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.411 0.711 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.411 0.867 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.386 0.742 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.386 0.815 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.752 PRO_TRIKOTAZA_MUSKA=3 -> PRO_KONFEKCIJA_ZENSKA=3
0.249 0.711 PRO_KONFEKCIJA_ZENSKA=3 -> PRO_TRIKOTAZA_MUSKA=3
0.389 0.693 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.389 0.743 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2
0.441 0.894 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.441 0.843 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.463 0.801 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.463 0.885 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.414 0.795 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.414 0.791 PRO_KONFEKCIJA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.752 PRO_TRIKOTAZA_MUSKA=3 -> PRO_KONFEKCIJA_MUSKA=3
0.249 0.827 PRO_KONFEKCIJA_MUSKA=3 -> PRO_TRIKOTAZA_MUSKA=3
0.389 0.789 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.389 0.693 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.449 0.777 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.449 0.800 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.392 0.753 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.392 0.698 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2
0.466 0.806 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.466 0.944 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.430 0.826 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_MUSKA=2
0.430 0.872 PRO_TRIKOTAZA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.241 0.793 PRO_RUBLJE_ZENSKO=3 -> PRO_TRIKOTAZA_MUSKA=3
0.241 0.727 PRO_TRIKOTAZA_MUSKA=3 -> PRO_RUBLJE_ZENSKO=3
0.466 0.895 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.466 0.806 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.258 0.797 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.258 0.959 SERD_TLAK_HPA=3 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.247 0.763 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.247 0.849 SERD_TLAK_HPA=3 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.255 0.788 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.255 0.989 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.960 SERD_TLAK_HPA=3 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.260 0.805 SERD_TLAK_HPA=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.266 0.907 VLAGA_POSTOTAK=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.266 0.924 VLAGA_POSTOTAK=3 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.266 0.674 VLAGA_POSTOTAK=3 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.249 0.958 VLAGA_POSTOTAK=3 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.249 0.850 VLAGA_POSTOTAK=3 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.249 0.632 VLAGA_POSTOTAK=3 -> PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.337 0.866 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2
0.337 0.644 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.337 0.711 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.359 0.814 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.359 0.916 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.359 0.891 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.359 0.728 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.359 0.686 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.359 0.757 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.364 0.787 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.364 0.887 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.364 0.905 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.364 0.630 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.364 0.696 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.364 0.769 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.342 0.828 PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.342 0.887 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.342 0.850 PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.342 0.658 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_KONFEKCIJA_MUSKA=2
0.342 0.654 PRO_KONFEKCIJA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.342 0.723 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2
0.337 0.866 PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.337 0.860 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.337 0.837 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.337 0.683 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.337 0.711 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2
0.353 0.787 PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.353 0.860 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.353 0.878 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.353 0.611 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.353 0.629 PRO_OBUCA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.353 0.746 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.329 0.839 PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.329 0.851 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.329 0.816 PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2
0.329 0.632 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_OBUCA=2
0.329 0.694 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2
0.373 0.800 PRO_TRIKOTAZA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.373 0.907 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.373 0.951 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.373 0.645 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.373 0.756 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.373 0.786 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.353 0.822 PRO_TRIKOTAZA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.353 0.915 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_MUSKA=2
0.353 0.902 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.353 0.679 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.353 0.717 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.353 0.746 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_MUSKA=2 PRO_RUBLJE_ZENSKO=2
131
0.359 0.771 PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2
0.359 0.929 PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.359 0.873 PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_RUBLJE_ZENSKO=2
0.359 0.689 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.359 0.621 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.359 0.757 PRO_KONFEKCIJA_ZENSKA=2 -> PRO_TRIKOTAZA_ZENSKA=2 PRO_RUBLJE_ZENSKO=2
0.340 0.873 PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.340 0.770 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2 -> PRO_OBUCA=2
0.340 0.873 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_MUSKA=2
0.340 0.689 PRO_TRIKOTAZA_MUSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.340 0.605 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_MUSKA=2
0.340 0.649 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_MUSKA=2
0.351 0.780 PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2
0.351 0.757 PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_OBUCA=2
0.351 0.901 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_TRIKOTAZA_ZENSKA=2
0.351 0.607 PRO_TRIKOTAZA_ZENSKA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2
0.351 0.624 PRO_OBUCA=2 -> PRO_KONFEKCIJA_MUSKA=2 PRO_TRIKOTAZA_ZENSKA=2
0.351 0.670 PRO_KONFEKCIJA_MUSKA=2 -> PRO_OBUCA=2 PRO_TRIKOTAZA_ZENSKA=2
0.312 0.797 PRO_OBUCA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_KONFEKCIJA_MUSKA=2
0.312 0.755 PRO_KONFEKCIJA_MUSKA=2 PRO_RUBLJE_ZENSKO=2 -> PRO_OBUCA=2
0.312 0.803 PRO_KONFEKCIJA_MUSKA=2 PRO_OBUCA=2 -> PRO_RUBLJE_ZENSKO=2
*uz pomo Python Orange modul Association rules minimal support 20% (pojavnost) / minimal confidence (pouzdanost) 60% -
dio uzorka
132
Prilog 6 Stabla odluivanja
enska trikotaa
133
muka trikotaa
134
muka konfekcija
135
obua
136
enska konfekcija
137
ensko rublje
138
Prilog 7 Podaci transformirani u REFII model
Rublje_zensko Dan Praznik Doba Srednja_temp Vlaga Obuca Konf_zen Konf_muska
Srednji rast CETVRTAK NE ZIMA Nizak rast Nizak rast Srednji rast Nizak rast Srednji rast
Nizak rast PETAK NE ZIMA Nizak rast Nizak pad Nizak rast Nizak rast Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak pad
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak rast Nizak pad Srednji pad Srednji pad
Bez promjene PONEDJELJAK DA ZIMA Nizak pad Nizak pad Bez promjene Bez promjene Bez promjene
Nizak rast UTORAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak rast SRIJEDA NE ZIMA Nizak pad Nizak pad Nizak rast Nizak rast Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak pad Nizak pad Nizak pad Nizak pad
Nizak rast PETAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad NEDJELJA NE ZIMA Nizak pad Nizak rast Nizak pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak rast Nizak rast Nizak rast Srednji rast Srednji rast
Nizak rast UTORAK NE ZIMA Nizak rast Nizak rast Nizak pad Nizak rast Nizak pad
Nizak pad SRIJEDA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak rast Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak rast Nizak rast Nizak rast Nizak pad Nizak rast
Nizak pad PETAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak rast
Nizak pad SUBOTA NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak rast
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak pad Nizak pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak pad Nizak rast Srednji rast Srednji rast Srednji rast
Nizak pad UTORAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad SRIJEDA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak pad Nizak rast
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak rast Nizak rast Nizak rast Nizak rast
Nizak pad PETAK NE ZIMA Nizak rast Nizak pad Nizak pad Nizak pad Nizak pad
Nizak pad SUBOTA NE ZIMA Nizak rast Nizak pad Nizak rast Nizak pad Nizak rast
Nizak pad NEDJELJA NE ZIMA Nizak pad Nizak pad Srednji pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak pad Nizak pad Srednji rast Srednji rast Srednji rast
Nizak rast UTORAK NE ZIMA Nizak rast Nizak rast Nizak pad Nizak pad Nizak rast
Nizak pad SRIJEDA NE ZIMA Nizak pad Nizak rast Nizak rast Nizak pad Nizak pad
Nizak rast CETVRTAK NE ZIMA Nizak pad Nizak rast Nizak pad Nizak rast Nizak pad
Nizak pad PETAK NE ZIMA Nizak pad Nizak rast Nizak pad Nizak pad Nizak pad
Nizak pad SUBOTA NE ZIMA Nizak pad Srednji pad Nizak rast Nizak rast Nizak rast
Srednji pad NEDJELJA NE ZIMA Nizak pad Nizak rast Srednji pad Srednji pad Srednji pad
Srednji rast PONEDJELJAK NE ZIMA Nizak rast Nizak rast Nizak rast Nizak rast Srednji rast
* uz pomo Time Explorera, dio stvarnih podataka za period od godine dana, navedeno je djelomian prikaz podataka
139
Prilog 8 Sezonske oscilacije na temelju otklona kuteva
enska konfekcija
Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast
Muka konfekcija
Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast
Obua
Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast
ensko rublje
Bez promjene Nizak pad Nizak rast Otar pad Srednji pad Srednji rast Visok rast
140
Prilog 9 Bayesove mree
Model A
Model B
141
Prilog 10 Gradske etvrti Grada Zagreba
142