You are on page 1of 43

23.11.

2009

Poslovna inteligencija vrlo saeti podsjetnik

Poslovna inteligencija literatura


Panian, .; Klepac, G.: Poslovna inteligencija, Masmedia, 2003. Klepac, G.; Mri, L.: Poslovna inteligencija kroz poslovne sluajeve, Lider press d.d../TIM press d.o.o., Zagreb, 2006. Panian, . i suradnici: Poslovna inteligencija: studije sluajeva iz hrvatske prakse, Narodne novine d.d., 2007. Berry, Michael J. A.; Linoff, Gordon S.: Data Mininig Techniques for Marketing, Sales and Customer Relationship Management Second Edition, Wiley Publishing, Inc., Indianapolis, Indiana (SAD),2004.

23.11.2009

Kakvoa podataka

Premda je problem kvalitete podataka u stanovitoj mjeri ovisan o obiljejima tvrtke i njena poslovanja mogue je uoiti etiri osnovne kategorije kakvoe podataka koje imaju izravni utjecaj na donoenje poslovnih odluka u poduzeu:
standardiziranost (standardiziranost podrazumijeva ujednaenost u izrazu te standardizaciju dokumenata nositelja poslovnih informacija), podudarnost (podudarnost se odnosi na identificiranje podudarnih podataka iz brojnih izvora i njihovu eliminaciju), verificiranost (verificiranost ukljuuje postupak usporedbe nekog podatka sa poznatim izvorom kako bi se utvrdila relevantnost podatka), proirivost (proirivost podrazumijeva mogunost dodavanja novih podataka postojeem skupu).

Kakvoa podataka

Prilikom osmiljavanja dobre strategije cjelovitog nadzora, kontrole i upravljanja kakvoom podataka potrebno je uzeti u obzir pet slijedeih zahtjeva:

jednostavnost uporabe, prilagodljivost, uinkovitost, neovisnost o raunalnoj platformi, ekonominost.

23.11.2009

ienje i pretprocesiranje podataka


Na temelju cilja analize pripremamo podatke za pretprocesiranje. Same funkcije agregiranja, grupiranja i formiranja razreda ovise o cilju analize. Postoji itav niz izvedenica atributa ili njihovih kombinacija. Tako na osnovu koritenje metoda analiza vremenskih serija iz datuma transakcije moemo ekstrahirati podatke o pauzama u dolascima klijenata, te o njihovom ponovnom dolasku nakon pauze nedolaenja. Isto tako u realnim analizama moraju se obuhvatiti i kategorije kao to su uestale pauze, neprekidni dolasci i slino, kako bi model bio potpuniji, a segmentacija preciznija.

Pretprocesiranje podataka

1. Pronalaenje ekstremnih vrijednosti

Ako se u skupu podataka pojavljuju ekstremne vrijednosti (engl. Outliers) one se ne smiju iskljuiti bez prethodne dijagnostike uzroka zbog kojih se pojavljuju. Naime ekstremne vrijednosti ponekad mogu upuivati na pounu devijaciju te je stoga potrebno provesti dodatne analize i donijeti odluku o njihovu ukljuivanju ili iskljuivanju iz daljnjih analiza. U populaciji podataka moe se naii i na nedostajue vrijednosti. U tom sluaju u procesu analize podataka primijenit e se metode predvianja nedostajuih vrijednosti. Najee su to standardne metode rudarenja podataka. Ako se podaci prikupljaju iz razliitih izvora esto ne postoji jednoznana definicija relacijskih kljueva. Kad se primjenjuju razliiti sustavi kategoriziranja unutar podataka, dolazi do pojave nedosljednosti vrijednosti atributa vezanih uz iste relacijske kljueve.

2. Dijagnostika nedostajuih vrijednosti i predvianje nedostajuih vrijednosti

3. Povezivanje relacijskih kljueva iz razliitih izvora podataka

23.11.2009

Pretprocesiranje podataka

4. Postizanje jednoobraznosti (konzistentnosti) u podacima

U postupku rudarenja podataka, uz izvore podataka unutar poduzea (npr. Skladite podataka) esto se koristi i niz vanjskih izvora gdje su informacije iskazane u razliitim formatima. U tim sluajevima dolazi do izraaja kompleksnost itave problematike, jer se dodavanjem izvora moe promijeniti metodologija pretprocesiranja i ienja podataka. U sluajevima kad je fiziki nije mogue zahvatiti cjelokupnu populaciju koriste se metode uzorkovanja s time da uzorak to reprezentativnije predstavlja cijelu populaciju. Metoda uzorkovanja primjenjivat e se i pri cijepanju osnovne populacije na uzorak za uenje modela i testni uzorak. U postupku pretprocesiranja podataka jedan od vanih koraka odnosi se na formiranje kategorija na temelju podataka. Na primjer pri dodjeli vrijednosti atributa kategoriji starosne dobi (npr. od 20 do 40), u nju se uvrtavaju svi slogovi ija se vrijednost atributa starosna dob nalazi unutar tih granica.

5. Uzorkovanje

6. Kategorizacija vrijednosti atributa

Pretprocesiranje podataka

7. Formiranje izvedenih atributa (engl. Binning)

Slina metoda prethodno navedenoj metodologiji je i formiranje izvedenih atributa, a odnosi se na formiranje novih kategorija koje obuhvaaju vrijednosti sortiranog niza, pri emu svaka od kategorija sadri jednak broj vrijednosti definiranog niza. Primjenom ove metode velika koliina podataka saima se grupiranjem po odreenim kriterijima. Metode normiranja podataka koje se najee primjenjuju u procesu rudarenja podataka su: Min-max normiranje (primjenjuje se u sluajevima kad je poznata minimalna i maksimalna vrijednost izvornog niza), Z-skaliranje (primjenjuje se u sluaju da se ne zna minimalna i maksimalna vrijednost originalnog niza) i metoda Decimalnog skaliranja kad se normiranje provodi izravno na relacijskoj tablici.

8. Grupiranje (saimanje) podataka

9. Normiranje podataka

23.11.2009

Analiza relevantnosti atributa


Po zavretku postupaka pretprocesiranja podataka mogu se postaviti pitanja: da li je odabran pravi skup atributa koji jednoznano opisuju problem koji treba rijeiti, jesu li vrijednosti tih atributa pravilno grupirane, kao i je li opravdano provesti analizu nad izabranim stupnjem granulacije podataka i dr. Glavni zadatak analize relevantnosti atributa svodi se na otkrivanje onih atributa koji imaju slab ili skoro nikakav utjecaj na zadani analitiki cilj, to moe rezultirati njihovim neuvrtavanjem u daljnje procese analize. Utjee i na kontrolu kombinatorne eksplozije

Analiza relevantnosti atributa

Jedna od vrlo jednostavnih mjera koja nam moe pruiti informacije o korelacijskoj zavisnosti izmeu dviju varijabli je koeficijent korelacije: ako je KK > 0 tada su nizovi vrijednosti pozitivno korelirani ako je KK < 0 tada su nizovi vrijednosti negativno korelirani ako je KK = 0 tada ne postoji korelacijska meuzavisnost Ova mjera moe biti korisna kada se, primjerice, eli vidjeti ima li neka varijabla pozitivan, negativan ili neutralan smjer korelacije s obzirom na ciljnu varijablu.

23.11.2009

Vrijednost poslovnih informacija

Izraun i tumaenje vrijednosti poslovnih informacija teak je zadatak, izmeu ostalog i zbog toga to informacija nije materijalna pa se pri utvrivanju vrijednosti ne mogu primijeniti konvencionalne metode. Odreivanju, a posebno izraunavanju egzaktne vrijednosti informacija potrebno je pristupiti vrlo paljivo. Tri pristupa:

Shanonnov kvantitativni pristup, Hammingov vremenski pristup i Liautaudov poslovno pragmatiki.

Shannonov kvantitativni pristup vrednovanju informacija


Ovaj pristup postavlja jednakost izmeu koliine informacija i entropije polja sluajnih dogaaja koje stvara informaciju. U kasnijim istraivanjima Shannon pokuava izvesti vrijednost informacije iz njene koliine. Shannon je povezujui koliinu s vrijednou informacija uspio samo djelomino, jer te vrijednosti razvrstava u samo etiri kategorije, to je suvie "gruba", tek orijentacijska podjela kakva je teko iskoristiva za bilo kakve ozbiljnije praktine analize. Sam pokuaj odreivanja i karakterizacije pojma vrijednosti informacije, bez obzira na primjenjivost, predstavlja velik doprinos znanstvenoj spoznaji u ovom podruju.

23.11.2009

Hammingov vremenski pristup vrednovanju informacija

Richard Hamming polazi od koncepta ivotnog ciklusa informacije (Information Life Cycle), koji pretpostavlja da svaka informacija u odreenom trenutku nastaje, neko vrijeme traje, da bi nakon isteka tok vremena nestala. Vrijednost informacije u tom kontekstu smatra funkcijom vremena; drugim rijeima, vrijednost nije postojano, ve vremenski promjenjivo obiljeje svake informacije.

Hammingov vremenski pristup vrednovanju informacija


Funkciju vrijednosti informacije u vremenu obiljeavaju tri karakteristina podruja. Prvo je podruje prognoziranja, kada se odgovarajua informacija dobiva i prije no to je potrebno donijeti neku odluku. Njena je vrijednost tada najvea i ona s vremenom nelinearno opada. Drugo je karakteristino podruje stvarnog (realnog) vremena u kojemu se informacija dobiva (odnosno nastaje) upravo onda kada treba donijeti odluku. Vrijednost informacije je konstantna sve do podruja zastarijevanja, koje nastupa onda kada se informacija dobiva prekasno, onda kada odluka vie nije potrebna ili nije relevantna za daljnji tijek dogaaja (procesa). U ovome podruju vrijednost informacije strmo eksponencijalno pada.

23.11.2009

Liautaudov poslovno pragmatiki pristup vrednovanju informacija

Tumaenje i vrednovanje informacija po Bernardu Liautaudu poiva u injenici da se vrijednost odreene informacije protee u kontinuumu. Uporaba informacije iri se (propagira) diljem poduzea, pa ak i izvan njega, prema klijentima i partnerima. Iz toga Liautaud izvodi zakljuak da se vrijednost informacija moe zadovoljavajue precizno definirati kao funkcija broja korisnika koji mogu pristupati tim informacijama i analizirati ih i broja poslovnih podruja kojima korisnici pripadaju, te iskazati sljedeim izrazom: Sam autor tvrdi kako se u navedeni izraz odluio uvrstiti kvadrat broja korisnika inspiriran poznatim Metcalfeovim zakonom mree. Bob Metcalfe, poznat kao izumitelj mrene arhitekture Ethernet predstavio je formulu za izraunavanje vrijednosti raunalnih mrea u kojoj vrijednost mree stavlja u odnos proporcionalnosti s kvadratom njenih korisnika.

Liautaudov poslovno pragmatiki pristup vrednovanju informacija

Prema Liautaudu, u kontinuumu vrijednosti odreene informacije moe se uoiti pet karakteristinih zona:
1. zona u kojoj podaci predstavljaju troak 2. zona u kojoj podaci poinju stvarati novu vrijednost 3. zona inteligencije poduzea 4. zona proirenog poduzea 5. zona u kojoj informacija postaje roba kojom se trguje

23.11.2009

Poslovna inteligencija

Prema jednoj dostupnoj definiciji, poslovna inteligencija je stjecanje i iskoritavanje znanja baziranog na injenicama u svrhu unapreivanja strateke i taktike poslovne prednosti na tritu. Ova jednostavna definicija predstavlja tek jedan od pogleda na navedeni pojam.

to je poslovna inteligencija?

Makroekonomski aspekt otkrivanje gospodarskih trendova i predvianje buduih dogaaja, procesa i stanja Mikroekonomski aspekt otkrivanje prikrivenih poslovnih znanja iz rutinski prikupljanih podataka o poslovnim transakcijama

23.11.2009

Makroekonomski aspekt

Agregirana (sloena) kategorija. Stvara se:

sustavnim, ali unaprijed (a priori) neciljanim prikupljanjem podataka o makroekonomskim kretanjima u odreenoj geopolitikoj sredini organiziranim i strukturiranim biljeenjem i pohranjivanjem tih podataka

logikom i/ili raunskom obradom radi otkrivanja makroekonomskih trendova te predvianja i prognoziranja procesa i dogaaja u makroekonomskim sustavima i njihovih budu ih stanja

Mikroekonomski aspekt

Odnosi se na poslovnu inteligenciju tvrtke. Koriste se poslovni podaci koje tvrtka rutinski zahvaa prilikom obavljanja razliitih poslovnih transakcija.

Podaci se organiziraju u baze i skladita podataka.


Cilj je otkrivanje nepoznatih ili novih znanja ih tih podataka. Primjenjuju se analitike, statistike i druge istraivake metode, te metode rudarenja podataka (engl. Data Mining). Neophodna je primjena raunala i prikladnog softvera.

10

23.11.2009

Interpretacije pojma poslovne inteligencije

Ciljevi stvaranja BI su podrka i unaprjeenje postupaka donoenja poslovnih odluka u poduzeima. BI nastaje kao rezultat dobro upravljanog procesa izvoenja novih ili prikrivenih znanja iz podataka koji se u poslovnoj rutinski generiraju, zahvaaju, memoriraju i koriste. BI se izvodi iz operativnih podataka primjenom odgovarajuih logiko-raunskih metoda. Primjena takvih metoda iziskuje razvijanje odgovarajuih informatikih sredstava i alata (hardvera i softvera), kojih se ve danas na tritu moe nai razmjerno puno. Stvaranje BI nalae uspostavu koherentnog pristupa upravljanju podacima i razvijanje jedinstvenog stava prema njihovoj ulozi i vanosti u poduzeu.

Temeljne ideje poslovne inteligencije

Namjera koncepta BI nije stvaranje vee koliine informacija, ve iskljuivo generiranje boljih, kvalitetnijih informacija potrebnih pri donoenju poslovnih odluka. Upravo to je ono svojstvo BI koje joj daje mo poticanja i stvaranja pozitivnih promjena u sredini u kojoj se stvara i primjenjuje (engl. Actionable BI). BI prua korisnicima samo one informacije koje su im potrebne, ali zato pravovremeno i iskazane na nain koji im najvie odgovara. Primijeni li se kako valja, koncept BI e smanjiti koliinu informacija kojoj se zaposlenici tvrtke izlau, poveavajui istovremeno kakvou tih informacija.

11

23.11.2009

Kljune znaajke poslovne inteligencije


Zasniva se na personalizaciji. Proaktivna je. Nastaje iz operativnih podataka.

to je poslovna inteligencija?

U najirem smislu predstavlja ranije prikriveno znanje koje se otkriva iz operativnih, rutinski prikupljanih poslovnih podataka primjenom odgovarajuih raunsko-logikih metoda, obino podranih informacijskom tehnologijom. Polazei od injenice da su poslovni podaci koji tvrtke rutinski prikupljaju obavljajui svoje poslovne aktivnosti heterogeni, u prvom koraku moemo uoiti da postoje dvije velike skupine izvora takvih podataka, i to :
Vanjski izvori podataka: podaci koji pristiu iz okruenja tvrtke, odnosno s trita na kojima tvrtka djeluje. Unutarnji izvori podataka: podaci koji nastaju realizacijom poslovnih procesa unutar same tvrtke.

12

23.11.2009

to je poslovna inteligencija?

Temeljem navedenog, mogue je razgraniiti dvije osnovne podvrste poslovne inteligencije:


trina inteligencija, i unutarnja inteligencija tvrtke.

to je trina inteligencija?

Ukoliko se promatra kategorija trine inteligencije, mogu se razluiti tri glavna izvora iz kojih dolaze podaci:
klijenti tvrtke: podatke tvrtka prikuplja odravanjem razliitih odnosa sa svojim postojeim i potencijalnim klijentima konkurencija tvrtke: tvrtka prikuplja podatke o konkurentskim tvrtkama na legalan i etian nain poslovni partneri tvrtke u opskrbnom lancu : uspostavljanjem opskrbnog lanca nastaju brojni tokovi podataka meu sudionicima u tom lancu, od kojih je jedan tvrtka, a ostali su njeni poslovni partneri.

13

23.11.2009

to je trina inteligencija?

Iz tih podataka mogu se stvoriti tri potkategorije trine, a nakon toga i ukupne poslovne inteligencije:

klijentska inteligencija, kompetitivna inteligencija, i inteligencija opskrbnog lanca.

to je unutarnja inteligencija?

Uz trinu inteligenciju druga osnovna podvrsta poslovne inteligencije jest unutarnja inteligencija tvrtke. Unutarnja inteligencije tvrtke nije homogena, ve nastaje iz podataka koji se generiraju iz dvije razliite skupine izvora:

operativni poslovni procesi: obavljanjem poslovnih procesa nastaju poslovni dogaaji koji stvaraju podatke koji tvrtka evidentira upravljaki procesi: upravljanje poslovanjem podrazumijeva donoenje odreenih poslovnih odluka, planova, budeta, preporuka, naredbi, savjeta itd., to su sve izvori podataka iz kojih se moe izvesti poslovna inteligencija.

28

14

23.11.2009

to je unutarnja inteligencija?

Unutarnju inteligenciju tvrtke ine dva glavna elementa:


inteligencija poslovnih procesa, i inteligencija menadmenta

to je poslovna inteligencija?

Uzme li se u obzir sve navedeno, moe se utvrditi kako ukupnu poslovnu inteligenciju ine sljedee glavne sastavnice:

1. 2. 3. 4. 5.

klijentska inteligencija, kompetitivna inteligencija, inteligencija opskrbnog lanca, inteligencija poslovnih procesa, i inteligencija menadmenta

15

23.11.2009

Evolucija metoda poslovne inteligencije

Zbog jo uvijek esto nedostatnog razumijevanja stvarne prirode poslovne inteligencije i njenih dometa, ne zauuje injenica da ne postoji ni dovoljno poznavanje i razumijevanja svih oblika u kojima se ona danas javlja, odnosno metoda u skladu s kojima se moe prakticirati. Uzimajui u obzir povijesni razvitak aplikacija i tehnologije, danas se moe govoriti o pet dominantnih grupa metoda poslovne inteligencije.

Evolucija metoda poslovne inteligencije

1. Poslovno izvjetavanje Odnosi se na iroku lepezu izvjetaja raznih formata namijenjenih operativnom poslovnom izvjetavanju te poredbenih tablica rezultata poslovanja i poslovnih kontrolnih ploa namijenjenih primjeni od strane korisnika informacija razliitih profila. 2. OLAP kocke Analitiki alati koji omoguuju "presijecanje i raslojavanje" (engl. Slice and Dice) ogranienih skupova podataka namijenjenih menaderima i ostalim djelatnicima, koji zahtijevaju sigurno i jednostavno okruenje za provedbu bazinih analiza podataka. 3. Ad hoc upiti i analize Softver koji korisnicima omoguuje postavljanje praktiki neogranienog broja i vrsta upita prema svim raspoloivim podacima i OLAP analizu cjelokupnih baza podataka, sve do razine detaljnih transakcijskih podataka ako je to neophodno. Namijenjen je preteito istraivaima i naprednijim poslovnim korisnicima.

16

23.11.2009

Evolucija metoda poslovne inteligencije

4. Rudarenje podataka Aplikacije koje omoguuju cjelovitu i sloenu matematiku, financijsku i statistiku obradu podataka za svrhe analize korelacije, analize trendova, trinih analiza, financijskih analiza te predvianja buduih dogaaja i procesa, odnosno otkrivanje prikrivenih znanja iz raspoloivih podataka. Namijenjene su profesionalnim analitiarima. 5. Alarmni alati i sustavi ranog obavjetavanja Alati i sustavi za proaktivno, rano obavjetavanje i upozoravanje irokog kruga korisnika prema unaprijed utvrenim kriterijima i dogaajima koji e posluiti kao poticaj ("okida", "otponac") za aktiviranje obavjetajnog mehanizma. Namijenjeni su podjednako unutarnjim i vanjskim korisnicima informacija.

Evolucija metoda poslovne inteligencije

Najsofisticiranije i najinteraktivnije metode i alate poslovne inteligencije koriste razmjerno malo brojne skupine naprednijih korisnika, poput menadera i poslovnih analitiara, to je i razumljivo jer je bavljenje podacima, informacijama i analizama njihov osnovni zadatak i posao. Manje interaktivne i manje "snane" metode i alati nude elementarnije i jednostavnije podatke i rezultate kakvi trebaju veim korisnikim populacijama, poput klijenata, zaposlenika i poslovnih partnera. Potreba za implementacijom alata poslovne inteligencije koji e moi podrati sve navedene metode postaje imperativ.

34

17

23.11.2009

Evolucija metoda poslovne inteligencije


Veina danas raspoloivih alata i tehnologija usmjerena je jednom ili samo nekima od navedenih pet metoda poslovne inteligencije. Tvrtke danas trebaju i trae tehnologiju koja e moi jedinstvenim rjeenjem podrati sve navedene metode poslovne inteligencije u bilo kojoj kombinaciji aplikacija. Sukladno tome tei se arhitekturi koja e korisnicima omoguiti:

jednostavno povezivanje i isprepletanje svih navedenih metoda poslovne inteligencije i njihovih funkcionalnosti, koritenje jedinstvenog suelja za pristup softverskim alatima koji podravaju bilo koju od tih metoda, dostavljanje, odnosno isporuku rezultata putem jedne jedine platforme, koja e se zasnivati na jedinstvenoj ontologiji podataka i unificirati metapodatke te pruati zadovoljavajuu razinu sigurnosti i podravati razliite profile korisnika, osiguravajui tako jednu jedinu inaicu istine posvuda u organizaciji i smanjiti napore i trokove administracije i odravanja.

Scenariji primjene metoda poslovne inteligencije

Danas je ve opeprihvaeno stajalite da se svi ljudi koji na bilo kakav nain sudjeluju u poslovnim procesima, od glavnog i izvrnih direktora, preko poslovnih partnera do izvritelja pomonih poslova, trebaju baviti nekim stupnjem i vrstom analize poslovanja, na nain koji je primjeren njihovoj ulozi u realizaciji cjelokupnog poslovnog i radnih procesa. Neovisno o kojem se tipu i razini analize radilo ona bi trebala biti:

temeljita i istraivaki orijentirana. inicirana automatski, ili ugraena u svakodnevne poslovne procedure.

Analiza moe biti:


18

23.11.2009

Scenariji primjene metoda poslovne inteligencije

Zadatak menadmenta i poslovnih analitiara je utvrditi:

koja je metoda poslovne inteligencije primjerena pojedinim instancama u tvrtki, koji se alati u tu svrhu trebaju nabaviti, te kako i kada ih koristiti.

Dunost je menadmenta i poslovnih analitiara razraditi razliite scenarije primjene alata za stvaranje poslovne inteligencije u razliitim dijelovima organizacije, imajui u vidu ope ciljeve i intencije njihove uporabe.

Poslovno izvjetavanje

Poslovni izvjetaji mogu biti namijenjeni svim tipovima korisnika zaposlenicima tvrtke na svim razinama organizacijske strukture, na svim radnim mjestima, u svim poslovnim funkcijama i slubama pa ak i partnerima u vrijednosnom lancu. U biti, poslovno izvjetavanje znai stvaranje poslovne inteligencije za masovnu upotrebu. Najznaajnije obiljeje svakog sustava poslovnog izvjetavanja jest njegova sposobnost podravanja vrlo fleksibilnih formata izvjetaja, tako da se podaci mogu predstavljati u bilo kojem obliku prema kojemu korisnici "potroai informacija" iskazuju posebne sklonosti.

19

23.11.2009

Poslovno izvjetavanje

Osim fleksibilnosti kao temeljne znaajke sustava poslovnog izvjetavanja, vane su i sljedee znaajke:
Podrka svim vrstama i oblicima poslovnih izvjetaja , od poredbenih tablica rezultata poslovanja i poslovnih kontrolnih ploa na jednoj strani, do detaljnih operativnih izvjetaja na drugoj, s mnotvom varijacija izmeu ta dva ekstrema. Izvjetavanje putem weba prema zahtjevima korisnika , to izvjetaje ini privlanijima, personaliziranima i relevantnijima za svakog pojedinca. Brzina stvaranja i distribucije izvjetaja koja omoguuje dostavu izvjetaja korisnicima putem onih kanala koji sami izaberu, pa izvjetaji postaju opeprisutnima u poduzeu i prikladnima za uporabu od strane svakog djelatnika. Precizan i primjeren dizajn izvjetaja bez ikakvog programiranja , to za korisnike predstavlja izuzetno privlanu opciju.

Sva navedena obiljeja sustava poslovnog izvjetavanja nedvosmisleno objanjavaju zbog ega je upravo ova metoda poslovne inteligencije danas jo uvijek najprisutnija u poslovnoj praksi.

Analize pomou OLAP kocke

Radi se o metodi poslovne inteligencije primjerenoj analizi i predviaju nekih dogaaja i procesa koji bi se mogli zbiti u blioj budunosti. OLAP je skraenica punog engleskog naziva OnLine Analytic Processing, odnosno online analitika obrada podataka. Analiza OLAP kocke moe se smatrati najjednostavnijim oblikom analize koji omoguuje praktiki svakom zaposleniku analiziranje podataka s kojima se susree u svome radu. No, najee e je ipak koristiti menaderi koji ele ostvariti dublji uvid i razumijevanje osnovnih uzroka zbog kojih su podaci u poslovnim izvjetajima takvi kakvi jesu, ali koji ipak nisu dovoljno vjeti da se mogli koristiti alatima za postavljanja ad hoc upita i provedbu prigodnih analiza.

20

23.11.2009

Analize pomou OLAP kocke

OLAP kocke pruaju korisnicima mogunost promatranja podataka sadranih u poslovnim izvjetajima iz razliitih aspekata, primjenom danas ve standardnih OLAP obiljeja kao to su:

listanje po stranicama, pivotiranje, odnosno rotacija oko neke osi kocke, razvrstavanje, odnosno sortiranje prema nekom kriteriju, filtriranje, te "svrdlanje", tj. produbljivanje analize prema gore ili prema dolje.

Takve funkcije omoguuju korisnicima "rezanje i presijecanje" (engl. Slice-and-Dice) kocke podataka ili analitike kocke jednostavnim klikom mia.

41

Ad hoc upiti i analize

Metoda poslovne inteligencije koja je oslanja prije svega na prigodne, ad hoc upite i analize omoguuje provoenje istraivakih analiza poslovnih podataka, sve do razine detaljnih podataka generiranih pojedinanim transakcijama. Namijenjena je prije svega naprednijim korisnicima kojima trebaju mogunosti ispitivanja svake mogue kombinacije podataka. Ad hoc upiti i analize mogu se koristiti u bi kojem podruju poslovanja, to se moe zahvaliti njihovim sljedeim obiljejima:
Parametarski voeno izvjetavanje uz usmjeravanje analiza . Ovo obiljeje omoguuje korisnicima stvaranje radikalno razliitih izvjetaja jednostavnim odgovaranjem na niz pitanja (ili zahtjeva) neposredno prije generiranja izvjetaja. Ono to parametarski voeno izvjetavanje ini posebno korisnim su mogunosti brze iteracije uz primjenu niza parametara i pohranjivanja rezultata takvih iterativnih obrada za neku buduu uporabu. "Svrdlanje" bilo gdje. Korisnici mogu "skakati" po bazi podataka koritenjem OLAP funkcionalnosti slijedei poslovni model koji se reflektira u ustroju skladita podataka. Mogu "svrdlati" prema gore ili prema dolje po hijerarhijski strukturiranim podacima, te obavljati raznovrsne unakrsne analize.

21

23.11.2009

Ad hoc upiti i analize

Ad hoc upiti i analize mogu se koristiti u bilo kojem podruju poslovanja, to se moe zahvaliti njihovim sljedeim obiljejima:

Sofisticirano filtriranje podataka. Korisnici mogu segmentirati podatke prema razliitim poslovnim kriterijima s ciljem rafiniranja, odnosno dotjerivanja i detaljnijeg prikazivanja odreenog skupa podataka. Grupiranje podataka prema definicijama koje daju korisnici . Korisnicima se omoguuje dotjerivanje poslovnog modela bez potrebe za mijenjanje ustroja baze podataka ili opeg poslovnog modela. Rjeenje koje nudi ova metoda poslovne inteligencije jesu mogunosti grupiranja podataka prema samostalnim, neovisnim definicijama korisnika koje s njihova aspekta imaju smisla jer im omoguuju provedbu nekih specifinih analiza i odraavaju njihov kut gledanja na odreeni poslovni problem, proces ili situaciju.

Sustavi ranog obavjetavanja i upozoravanja

Sustavi ranog obavjetavanja i upozoravanja omoguuju tvrtkama distribuciju mnotva izvjetaja ili poruka koje se proaktivno distribuiraju potencijalno velikom broju korisnika iz jednog centra. Korisnici se mogu predbiljeiti ili pretplatiti na proizvoljan broj izvjetaja ili poruka koje spadaju u njihovo podruje interesa. Izvjetaji se najee alju elektronikom potom ili putem Weba. To se moe smatrati minimumom funkcionalnosti sustava ranog obavjetavanja i upozoravanja, ali na tritu se ve javljaju i sustavi ovoga tipa s nekim dodatnim funkcionalnostima, kao to su:

Distribucija putem razliitih kanala. Distribucija na temelju predbiljebe i isporuka uz intervenciju administratora Isporuka na zahtjev, prema unaprijed utvrenom planu ili potaknuta dogaajima Automatska personalizacija sadraja.

22

23.11.2009

Rudarenje podataka

Pojam rudarenje podataka moe se definirati kao pronalaenje zakonitosti meu podacima. Podaci kao predmet prouavanja mogu biti sadrani u bazama podataka, razni tekstualni podaci, nestrukturirani podaci ili podaci organizirani u vremenske serije. Prednosti i ogranienja ove metodologije esto se iskrivljeno interpretiraju prezentirajui potencijal kao rjeenje svih poslovnih problema ili rjeenja svih problema suvremenog poslovanja. injenice pokazuju da se primjenom metoda i alata za rudarenje podataka mogu otkriti ponekad iznenaujui obrasci ponaanja nekih osoba ili neoekivani odnosi meu pojavama, no to nije razlog da se jasno ne izraze ogranienja odnosno preuveliavaju mogunosti ovih tehnika.

Rudarenje podataka

Jedna od definicija rudarenja podataka glasi: rudarenje podataka je sustavan, interaktivan i iterativan (ponavljajui) proces izvoenja i prikazivanja korisnoga, implicitnog i inovativnog znanja iz podataka. Vano je uz definiciju spomenuti da uspjenost primjene metoda i alata ove namjene ovisi prvenstveno o strunosti i poslovnoj kompetenciji onih koji tumae dobivene rezultate. Upravo te osobe svojim znanjem i iskustvom mogu biti sposobne neki naizgled besmislen uzorak interpretirati na poslovno korektan i smislen nain i pretvoriti ga u vrijednu informaciju. Dva su glavna tipa rudarenja podataka:
verifikacija hipoteze cilj je provjeriti da li je neka ideja ili dojam o vanosti odnosa meu odreenim podacima utemeljen ili ne (vie od 80% nae prodaje ostvarili su potroai karakteristika x,y...; otkrivanje novih znanja meu nekim pojavama mogu postojati neki jo nepoznati, a statistiki vani odnosi koje ovjek ni iskustvom niti svojim intelektualnim sposobnostima ne moe dokuiti (identifikacija najprofitabilnijih skupina potroaa -temeljem varijabli x,y,z...)

23

23.11.2009

ienje i pretprocesiranje podataka


Uspjenost rudarenja podataka odreena je kvalitetom podataka koji se analiziraju. Iskustva pokazuju da analitiar obino i do 80% vremena potroi istei i pretprocesirajui podatke da bi tek 20% vremena primjenjivao metode na tako pripremljenim podacima. Jedna od glavnih prednosti sustava poslovne inteligencije oituje se u koritenju skladita podataka kao izvora podataka za analize, to analitiaru znatno tedi vrijeme. No, analitiar ponekad ipak mora izravno pristupiti izvornoj bazi podataka - ako neki podatak ne postoji u skladitu podataka, ili ako se ne pojavljuje na zadovoljavajuem stupnju granulacije. Podaci u izvornom obliku mogu biti nekompletni, atributi mogu imati nedostajue vrijednosti, ili moe postojati nedostatak atributa. Isto tako moe se pojaviti nekonzistentnost unutar samih podataka, primjerice nedosljednost u oznaavanju pojedinih kategorija ili grupa.

Metode otkrivanja znanja


1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.

Temeljne statistike metode, OLAP i vizualizacija podataka Fuzzy ekspertni sustavi Klasteriranje Neuronske mree Samoorganizirajue mape (SOM) Bayesove mree Stabla odluivanja Survival modeli Asocijativni algoritmi REFII model Analiza veza

Osnovne znaajke Pretprocesiranje podataka Rjeive skupine problema Interpretabilnost rezultata analize

24

23.11.2009

Temeljne statistike metode, OLAP i vizualizacija podataka


Zajednika je znaajka navedenih skupina metoda da otkrivanje znanja uz pomo njihove primjene ponajprije ovisi o analitiaru. One nemaju automatski razraene algoritme koji su sposobni prepoznati pravilnosti unutar podataka, nego analitiar pronalazi znanje i meuzavisnosti kombinirajui itav niz raspoloivih atributa/faktora radi otkrivanja informacije koja moe biti iskoristiva u poslovnome smislu. Uspjeh primjene tih skupina metoda uglavnom ovisi o intuiciji analitiara. Dakle, analitiar odreuje koje e od raspoloivih varijabli koristiti za kreiranje izvjetaja.

Temeljne statistike metode, OLAP i vizualizacija podataka


Za provoenje OLAP analiza podrazumijeva se ureenost podataka u obliku skladita podataka, to znai da su provedeni ETL procesi te izvrena metrika kvalitete podataka. Za razliku od primjene OLAP alata, vizualizacija podataka i temeljne statistike metode mogu se uspjeno primijeniti i na podacima koji nemaju toliki stupanj ureenosti i istoe. U najee koritene temeljne statistike metode spadaju izrauni:

Srednje vrijednosti

(suma svih rezultata/broj rezultata); (prosjeno odstupanje od aritmetike sredine); (najea vrijednost u nekom nizu podataka; dominantna vrijednost); (centralna vrijednost; dijeli skup podataka na 2 jednaka dijela; (N+1)/2); (meusobna povezanost izmeu razliitih pojava predstavljenih vrijednostima dvaju varijabli; nezavisna i zavisna varijabla);

Standardne devijacije

Moda

Medijana

Korelacije

Frekvencija pojavnosti.

25

23.11.2009

Temeljne statistike metode, OLAP i vizualizacija podataka

OLAP analiza se, za razliku od tradicionalnih metoda data mininga, u postupcima provoenja analize ponajprije oslanja na analitiara kao primarnog subjekta u procesima otkrivanja znanja. To znai da je pri provoenju OLAP analize analitiar osnovni imbenik u procesu otkrivanja znanja, a ne algoritamski postupak na kojemu se temelje tradicionalne metode data mininga. Pri provedbi OLAP analize analitiar testira odreene hipoteze stavljajui dimenzije podataka u odreene odnose, ili pak ciljano analizira odreene trendove, pri emu je OLAP analiza usmjerena na kreiranje izvjetaja. Uzevi u obzir raspoloive skupove promatranih podataka postoji itav niz kombinacija temeljem kojih je mogue provesti OLAP analizu, a analitiar, temeljem svojih iskustava i potrebe analize, provodi odreeni skup analiza (kreiranja izvjetaja) u skladu sa problemskim prostorom.

Temeljne statistike metode, OLAP i vizualizacija podataka

U svjetlu promatrane problematike, OLAP analize se koriste u svrhu kreiranja izvjetaja, gdje analitiaru stoji na raspolaganju pripremljen skup podataka. Isto tako one imaju znaajnu ulogu i kao alat koji nadopunjuje provedene data mining analize, na nain provoenja OLAP analiza nad podacima proizalima kao rezultat obrade nekom od analiza data mininga. Temeljne statistike metode, kao i metode vizualizacije podataka, imaju znaajnu ulogu u upoznavanju podataka prije procesa provedbe analize i kreiranja samoga modela analize, ali su i vrlo koristan alat pri provedbi analiza i kreiranja analitikih modela rjeenja. Rezultati proizali kao rezultat primjene temeljnih statistikih metoda, vizualizacije podataka i OLAP analize lako se interpretiraju.

26

23.11.2009

Fuzzy ekspertni sustavi

Fuzzy ekspertni sustavi, za razliku od ostalih metoda otkrivanja znanja, imaju bitno obiljeje koje ih izdvaja od ostalih skupina metoda, a to je njihova orijentiranost ka koritenju znanja eksperata iz odreenog podruja u procesima kreiranja modela i provedbe analize. Za razliku od tradicionalnih ekspertnih sustava, fuzzy ekspertni sustavi pokazuju znatno vei stupanj fleksibilnosti u kreiranju analitikih modela, te rjeavaju probleme koji nastaju kao posljedica koritenja otrih granica razreda u postupcima kategorizacija varijabli. Koriste se za rjeavanje problema iz domene:

Scoriranja Segmentacije Klasifikacije

NAPOMENA: uvoenjem vremenske komponente u fuzzy ekspertne sustave moemo dobiti snaan alat za monitoring trinih segmenata.

Fuzzy ekspertni sustavi

Fuzzy ekspertni sustavi u procesima otkrivanja znanja koriste se za potrebe klasifikacije, segmentacije i scoriranja, pri emu je u tim procesima osnovni naglasak stavljen na znanja eksperata koja se ugrauju u te sustave. Ako nam je, primjerice, cilj poveati udio visokovrijednih klijenata tada, na temelju kreiranog ekspertnog sustava, prvo dijagnosticiramo koji su to za poduzee visokovrijedni klijenti. Tu zadaa fuzzy ekspertnog sustava zavrava, te koristimo ostale metode otkrivanja znanja kako bismo, primjerice, otkrili koji su tipini obrasci ponaanja visokovrijednih klijenata, koji je osnovni motivator poveanja kupovine toga segmenta trita, to uvjetuje, gledano iz perspektive scoringa, klijente sa niim stupnjem scoringa na veu kupovinu, lojalnost i ostale imbenike koji pridonose veem ponderu vanosti za poduzee kako bi to vei broj tih klijenata u budunosti svojim odnosom sa poduzeem zasluio vei stupanj scoringa.

27

23.11.2009

Klasteriranje

Klasteriranje bismo ukratko mogli definirati kao pronalaenje slinih grupa unutar podataka. Grupe se formiranju postupkom dijeljenja skupa podataka, pri emu se pripadnost grupi definira na temelju znaajki slinih obiljeja ( npr. dob, spol, upanija). Postoji itav niz algoritama za klasteriranje, no najpoznatiji algoritam za klasteriranje je K-mean clustering, koji, pomou funkcija za procjenu distance i centroida, u iterativnom postupku kreira klastere. U iterativnom postupku svakoj se grupi (klasteru) pridruuju funkcije udaljenosti najsliniji elementi iz populacije (proraun se vri na temelju prorauna udaljenosti svakog elementa populacije od sredinjih vrijednosti, "centroida"). Nakon svakog ciklusa (iteracije), ponovno se izraunavaju nove sredinje vrijednosti svakog klastera (centroidi), te se ulazi u novi iterativni ciklus, sve dok vrijednosti centroida ne postanu stabilne. U kontekstu data mininga klaster moemo deklarirati kao skupinu atributa, koji sadre sline vrijednosti dobivene kroz proces klasteriranja.

Klasteriranje

Metode segmentiranja koriste se radi podjele primjera u niz grupa ili podskupova (clusters), koji zadovoljavaju dva osnovna kriterija:

svaka grupa predstavlja homogen skup: primjeri koji pripadaju istoj grupi su meusobno slini; svaka grupa mora se razlikovati od ostalih grupa, tj. primjeri koji pripadaju odreenoj grupi znaajno se razlikuju od primjera koji pripadaju ostalim grupama.

Zavisno od konkretne metode, grupe mogu biti definirane na razliit nain:


identificirane grupe mogu biti ekskluzivne, tako da svaki primjer pripada iskljuivo jednoj od grupa; grupe se mogu preklapati; primjer moe istovremeno pripadati nekolicini grupa; grupe mogu biti definirane probabilistiki: u tom sluaju primjer pripada svakoj od grupa s odreenom vjerojatnosti grupe mogu biti hijerarhijski strukturirane, sa grubom podjelom primjera na najviem nivou, koji se potom moe finije strukturirati na niim nivoima.

28

23.11.2009

Klasteriranje

Algoritmi klasteriranja u osnovi koriste numerike vrijednosti kao ulazne parametre za provoenje procesa analize. Jedan od vrlo bitnih imbenika je provoenje normiranja nad nizovima vrijednosti atributa koji sudjeluju u procesu analize uz pomo algoritma klasteriranja. Npr. provodimo klasteriranje pomou K-mean clusteringa gdje se u procesu analize obrauju dvije varijable, npr. godine kupca i estomjeseni iznos kupovine robe u trgovini. Veina softverskih paketa automatski prije provoenja procesa klasteriranja provodi normiranje varijabli, no tamo gdje to nije sluaj, potrebno je provesti proces normiranja prije provoenja procesa analize. Sljedei problem koji se pojavljuje pri pretprocesiranju podataka je transformacija vrijednosti nenumerikih varijabli u numerike varijable. U tom sluaju potrebno je osmisliti numeriki sustav koji e najbolje interpretirati opisne vrijednosti uzimajui u obzir znaenje algoritma za klasteriranje. To znai da e se, npr., pri numeraciji upanija voditi rauna o njihovoj teritorijalnoj udaljenosti.

Klasteriranje

Klasteriranje primjenjujemo u situacijama kada unutar podataka elimo prepoznati skupine slinih svojstava, to moe biti korisno u provoenju analiza profila, gdje elimo iz ukupnog skupa podataka izdvojiti tipine trine podskupine slinih svojstava. Jedan od temeljnih nedostataka metode klasteriranja K-mean clusteringa iz perspektive poslovnih analiza je obvezno odreivanje broja klastera prije provoenja analize od strane analitiara.

29

23.11.2009

Neuronske mree

Polazite ideje o neuronskim mreama potie iz neuropsihologije. Iskoritena su saznanja o ponaanju ivane stanice koja funkcionira po principu aktivacije, odnosno poveanja potencijala na sinapsama. U tome matematikoom modelu osnovna jedinica je dizajnirana po uzoru na bioloki neuron. Temeljni princip uenja neuronske mree su veze izmeu eksperimentalnih uzoraka, pri emu postoje dvije paradigme:

autoasocijativno (uzorci se pridruuje sebi samome) i heteroasocijativno uenje (dva razliita tipa uzoraka pridruuju se jedan drugome) .

Postupke uenja (s obzirom na to koriste li procedure uenja vanjske signale povratnu vezu okoline) moemo podijeliti u tri skupine:
nadzirano uenje (eng. supervised learning), nenadzirano uenje (eng. unsupervised learning), pridruujue pojaavajue uenje (eng. associative reinforcement learning).

Neuronske mree

U nadziranom uenju (uenje s uiteljem) uklanjaju se razlike izmeu eljenog izlaza i stvarnog izlaza uzoraka metodom povratne veze. U nenadziranom uenju naglasak je na samoorganizaciji, odnosno klasteriranju pa se, za razliku od ostala dva modela, ne pojavljuje povratna veza. Pridruujue pojaavajue uenje (uenje s kritikom) u svojim temeljima ima povratnu vezu koja indicira kada se aktualni i eljeni uzorci podudaraju te je evaluacijski orijentiran.

30

23.11.2009

Neuronske mree

Pretprocesiranje podataka za potrebe analize uz pomo modela neuronskih mrea (npr. za primjenu Error backpropagation modela), provodi se s obzirom na tip problema koji elimo rijeiti. Error backpropagation model neuronskih mrea, meu ostalim, uglavnom koristimo za potrebe predikcije i klasifikacije. Problemi predikcije mogu se odnositi na predikciju temporalnoga i netemporalnoga znaenja. Pri koritenju Error backpropagation modela neuronskih mrea za potrebe predikcije netemporalnoga znaenja, broj predikcijskih varijabli u numerikome formatu odreuje broj ulaznih neurona, dok izlazni neuron predstavlja predikcijsku varijablu. Na primjer, ako elimo vriti procjenu cijene kvadratnoga metra stambenoga prostora, a raspolaemo varijablama starost objekta u godinama, lokacija, povrina okunice, blizina prometnom voritu..., tada je potrebno numeriki izraziti sve spomenute varijable. Interpretabilnost

Bayesove mree

Bayesove mree bismo mogli definirati kao grafike modele koji pokazuju probabilistike relacije temeljene na uvjetnim vjerojatnostima izmeu setova varijabli. Sastoje se od izravnih neciklikih grafova i tablica uvjetnih vjerojatnosti (eng. conditional probability table). Tablica uvjetnih vjerojatnosti je sastavni element Bayesove mree koji sadri informacije o uvjetnim vjerojatnostima meu varijablama. Prije kreiranja tablice uvjetnih vjerojatnosti potrebno je kreirati strukturu Bayesove mree bilo na temelju ekspertnog znanja ili temeljem automatiziranog algoritma kao npr. NPC (eng. Necessary Path Condition) algoritma. Bayesove mree mogu davati procjene i u uvjetima nekompletnih setova podataka, te u procesu procjene mogu ravnopravno koristiti znanje dobiveno analitikim putem iz podataka, i znanje eksperata.

31

23.11.2009

Bayesove mree

Vrlo irok raspon primjene. Glavna znaajka: sposobnost uenja temeljenog na probabilistici izravno iz uzoraka podataka. Ono to je znakovito za modele temeljene na Bayesovim mreama, jest mogunost procjene vjerojatnosti i na temelju nedostajuih informacija. Pri kreiranju modela Bayesovih mrea koriste se kategorike ili diskretne vrijednosti varijabli. Potrebno je kreirati optimalan broj kategorija/diskretnih vrijednosti kako bi se olakao proces uenja mree i kako bi interpretacija analize imala smisla.

Bayesove mree

Bayesove mree koristimo u situacijama kada elimo procijeniti vjerojatnosti odvijanja nekog dogaaja uz uvjet dogaanja drugih dogaaja. Procjena vjerojatnosti uvjetovane nizom dogaaja procjenjuje se pomou deklariranja uvjetovanih dogaaja, kao niza dogaaja koji e se dogoditi sa pouzdanou 100%. Taj postupak se u literaturi deklarira kao postavljanje evidence vrijednosti u modelu Bayesove mree. Npr. procjena vjerojatnosti kupovine uz uvjet da je:

kupac zatraio katalog proizvoda u prethodnom razdoblju kupio barem jedan proizvod naeg poduzea klijent poduzea vie od 2 godine...

Dakle, model Bayesove mree prati logiku kauzalnost vezanu uz neki problemski prostor.

32

23.11.2009

Bayesove mree

Pogodne su i za analizu osjetljivosti varijabli:


Utjee li na odluku o kupnji proizvoda injenica to je kupac klijent poduzea vie od 2 godine i to je lokacijski smjeten blizu prodajnog mjesta poduzea? Je li muka populacija klijenata sklonija kupovini police ivotnog osiguranja od enske populacije?

Pri provoenju analize uz pomo modela, gdje se eli procijeniti vjerojatnost dogaanja dogaaja C, uz uvjet dogaanja dogaaja A i B, vjerojatnost odvijanja dogaaja A i B deklarira se kao siguran dogaaj (evidence). Analiza osjetljivosti provodi se na nain praenja porasta vjerojatnosti dogaanja promatranoga dogaaja uz promjene sigurnoga dogaanja uvjetovanih dogaaja. Rezultate analize Bayesovih mrea lako je interpretirati, jer se oslanjaju na teoriju vjerojatnosti, to znai da vjerojatnost 1 oznaava siguran dogaaj, dok vjerojatnost 0 oznaava dogaaj koji se zasigurno nee dogoditi.

Stabla odluivanja

Stablo odluivanja je data mining metoda, koja za cilj ima klasifikaciju atributa s obzirom na zadanu ciljanu varijablu. Osim te funkcije metoda stabla odluivanja koristi se i za kreiranje predikcijskih modela. Stabla odluivanja prezentiraju rezultate obrade u obliku stabla odakle im i potjee ime. Njih karakterizira vrlo laka mogunost interpretacije rezultata obrade u obliku pravila. Postoji itav niz algoritama na temelju kojih se formira stablo odluivanja. Najpoznatiji su ID3, C4.5, CHAID, CR&T i QUEST. Osnovna primjena stabala odluivanja odnosi se na probleme klasifikacije i predikcije.

33

23.11.2009

Stabla odluivanja

Osnovna metodologija graenja stabala sastoji se od sljedeih koraka:


Stablo zapoinje jedinstvenim korijenom (ciljanom varijablom) koja reprezentira cijeli uzorak. Ako svi uzorci pripadaju istoj klasi, tada vor postaje list i oznaava se tom klasom. U protivnom algoritam koristi mjeru temeljenu na entropiji (eng. information gain) za selekciju atributa koji e najbolje razdijeliti uzorak na podklase. Algoritmi se u tom dijelu uglavnom razlikuju s obzirom na sposobnost operiranja razliitim tipovima varijabli. Stablo se dalje razgranava za svaku vrijednost testnog atributa.

Osnovna primjena stabala odluivanja odnosi se na probleme klasifikacije i predikcije.

Survival modeli

Za potrebe rane dijagnostike zajednikih znaajki klijenata koji su prekinuli suradnju, analizu trendova prekida, te prorauna vjerojatnosti duine poslovnog odnosa klijenta, koriste se modeli, koji se jo popularno zovu i survival analize. Ti modeli svoje podrijetlo vuku iz medicine, a u medicini se koriste pri procjeni uspjenosti razliitih vrsta terapija pri lijeenju pacijenata kroz odreeno vremensko razdoblje. Osnovna ideja survival modela svodi se na procjenu vjerojatnosti da e netko tko je "preivio" kao kupac poduzea odreeno vremensko razdoblje prekinuti ili nastaviti kupovinu u iduoj vremenskoj jedinici. Survival modeli poput Coxove regresije, meu ostalim, daju odgovore na pitanja kolika je vjerojatnost prekida kupovine s obzirom na razliita obiljeja kupaca/korisnika usluge.

34

23.11.2009

Survival modeli

U survival modelima postoje takozvane terminalne oznake neke aktivnosti,kao to je, primjerice, prekid kupovine. Bitna varijabla za taj model je broj mjeseci koritenja proizvoda/usluge. Ta se varijabla izvodi kao broj mjeseci od datuma prekida umanjeno za broj mjeseci od datuma kada je npr. potpisan ugovor s klijentom. Survival modele koristimo u situacijama u kojima elimo procijeniti trendove odlazaka/otkazivanja ugovora od strane kupaca/klijenata. Pojedine metode poput npr. Coxove regresije omoguavaju nam dubinsku analizu uz pomo prediktivnih varijabli, koje nas mogu uputiti na potencijalne uzroke prekida suradnje te na obiljeja klijenata koji prekidaju suradnju (npr. najveu tendenciju odlazaka pokazuju klijenti koji su vie od tri puta reklamirali proizvod unutar jamstvenoga roka, ili najveu tendenciju odlazaka pokazuju klijenti mlae ivotne dobi, pri emu konkurencija trenutno vodi kampanju prilagoenu upravo toj dobnoj skupini).

Asocijativni algoritmi

Rezultat obrade podataka uz pomo asocijativnih algoritama su asocijativna pravila. Asocijativna pravila ukazuju na to koliko esto se dogaaji pojavljuju zajedno. Najpoznatiji algoritmi za otkrivanje asocijativnih pravila su apriori algoritam i stablo frekventnih uzoraka. 40% transakcija u kojima je prodano mlijeko prodan je i kruh. 10% svih transakcija sadri oba artikla. Mjera pouzdanosti (confidence) pravila (X implicira Y) je mjera koja pokazuje koliko se puta pojavi Y kada se pojavi X, i izraava se u postocima. Ta mjera se moe statistiki izraziti i kao uvjetna vjerojatnost. Mjeru podrke (support) deklariramo kao mjeru za evaluaciju asocijativnih pravila, koja se izraava kao postotni omjer izmeu pravila u kojima se skup elemenata (artikala) pojavljuje zajedno u transakcijama i ukupnog broja promatranih transakcija.

35

23.11.2009

Asocijativni algoritmi

Glavni nedostatak apriori algoritma proizlazi iz njegove kompleksnosti i osjetljivosti na rast elemenata analize, to uzrokuje poveanje broja kombinacija. Popularna metode koje reduciraju broj kandidata koji ulaze u analizu pomou toga algoritma je metoda formiranja prividnih varijabli, te metoda grupiranja skupa proizvoda na temelju zajednikih znaajki. Nedostatak toga pristupa oituje se u gubitku preciznosti analize. Koritene mjere pouzdanosti u sklopu tog algoritma su spomenute mjere podrke i pouzdanosti. Vrlo djelotvoran algoritam za generiranje asocijativnih pravila je stablo frekvencije uzoraka.

REFII model

REFII model moemo definirati kao jedinstveni model transformacije vremenske serije, koji je polazina osnova za provoenje rudarenja znanja iz vremenskih serija na razliitim konceptualnim osnovama. Pretprocesiranje podataka za potrebe analize uz pomo REFII modela odvija se u devet osnovnih koraka. Pretprocesiranje podataka za potrebe primjene REFII modela svodi se na kreiranje matrice transformacije temeljem vrijednosti vremenske serije. Fleksibilnost REFII modela oituje se u mogunosti primjene lingvistikih varijabli temeljenih kako na klasinoj crisp logici, tako i na fuzzy logici.

36

23.11.2009

REFII model

Uz pomo REFII modela mogue je provesti:


Analizu sezonskih oscilacija Otkrivanje motiva u vremenskoj seriji Otkrivanje uzoraka iz vremenske serije Otkrivanje mutacija unutar vremenskih serija Klasteriranje vremenskih serija Otkrivanje slinosti vremenskih serija Primijeniti tradicionalne algoritme data mininga unutra vremenskih serija (SOM, Stabla odluivanja, fuzzy logika, klasteriranje, asocijativni algoritmi, Bayesove mree...) OLAP analizu vremenskih serija

Analiza veza

Analize veza (eng. link analysis) je metoda data mininga koja pronalazi meuzavisnosti izmeu promatranih kategorija atributa proraunavajui frekvencije pojavnosti veza meu njima. Kombinatorna eksplozija. U procesu grupiranja, osim standardnih principa poveanja granulacije podataka na nain uzimanja u obzir nadkategorija unutar podataka, isto tako moemo kreirati i prividne varijable. Analize veza tradicionalno se koriste u problemima vezanim uz kriminalistiku. Osim primjene u kriminalistici, analize veza imaju i vrlo rasprostranjenu primjenu u domeni poslovanja, gdje se mogu koristiti za potrebe otkrivanja potencijalnih prijevara, analize narudbi i prodaje, te planiranja i raspodjele robe u skladitenome poslovanju, odnosno u situacijama procjene optimalne preraspodjele robe izmeu niza trgovina u trgovakome lancu uvjetovanih raznim imbenicima (npr. sezonski).

37

23.11.2009

Skladitenje podataka

Skladitenje podataka usmjereno je na pravovremeno dobivanje relevantnih informacija potrebnih u postupcima odluivanja. Na tritu koje se globalizira vlada sve vea konkurencija te su kupci sve izbirljiviji. Proizvoai moraju stalno provjeravati svoju konkurentnost na tritu i pronalaziti uspjenu poslovnu strategiju.

Skladitenje podataka

Strateka prednost pred konkurentima ostvaruje se:


ispravnim planiranjem trita, inovacijama proizvoda, ispravnim odnosima s kupcima, odnosno klijentima...

Pritom je neophodno posjedovati pravovremene i relevantne informacije o svim aspektima poslovanja i situaciji na tritu.

38

23.11.2009

Skladitenje podataka

Skladitenje podataka je vaan koncept uinkovitog sustava potpore odluivanju, koji se intenzivno razvija posljednjih godina. Donosi ideju aktivnog pronalaenja i nuenja informacija menaderu, potrebnih u procesu odluivanja.

Skladite podataka

Skladite podataka (engl. data warehouse) je skup podataka organizacije na kojem se temelji sustav potpore odluivanju. Skladite podataka je skup integriranih i obogaenih podataka organizacije ne temelju kojeg se izgrauje sustav za potporu odluivanju. Manje skladite podataka koje obuhvaa podatke samo jednog poslovnog podruja naziva se podrunim skladitem podataka (engl. data mart).

39

23.11.2009

Skladite podataka

Iz svrhe proizlazi: da skladite podataka treba podacima potpuno "pokriti" jedno ili vie poslovnih podruja (npr. nabave, prodaje), da podaci u skladitu trebaju biti sveobuhvatni, tj. "integrirani" od unutarnjih podataka organizacije, ali i podataka iz njenog okruenja, podaci moraju obuhvatiti dui vremenski period (pet, deset ili vie godina), jer su vremenske analize poslovno vrlo znaajne, orijentiranost prema poslovnim analizama ne zahtijeva od skladita da se podaci promptno auriraju kao u bazi podataka.

Skladite podataka

Skladite podataka namijenjeno je menaderima, ali i svima koji u svom poslu obavljaju razliite analitike zadatke,

kao to su poslovi praenja i izvjetavanja, koji se temelje na primjeni razliitih poslovnih pravila, a obavljaju se postavljanjem usmjerenih upita i analizom dobivenih rezultata; poslovi analize i dijagnosticiranja, koji se temelje na umjenosti, a obavljaju se iterativnim pronalaenjem i analizom dobivenih informacija; i poslovi planiranja i simulacije, koji se temelje na znanju, a obavljaju se modeliranjem i izvrenjem izraenog modela.

40

23.11.2009

Skladite podataka vs. baza podataka

Odvajanjem baze i skladita podataka, u bazi podataka zadrava se uinkovitost transakcijske obrade, a u skladitu podataka ostvaruje mogunost dobre analitike obrade. Meutim, danas je, uz koritenje jaih sustava za upravljanje bazom podataka, mogue transakcijske podatke baze podataka i analitike podatke skladita podataka drati u jednoj fizikoj bazi podataka. U takvoj su bazi podataka transakcijski i analitiki podaci razdvojeni, a sustav za upravljanje bazom podataka sposoban je istovremeno izvravati transakcijske i analitike obrade podataka.

Unutarnji podaci

Unutarnji podaci pripadaju poduzeu i generirani su u sustavu za obradu transakcija te opisuju aktivnosti koje se odvijaju unutar poduzea:

financijski podsustavi (npr. glavna knjiga), logistiki podsustavi (planiranje materijala, nabava, transport, distribucija itd.), podsustavi prodaje,

podsustavi proizvodnje (upravljanje i kontrola proizvodnje, praenje radnih naloga, praenje projekata, upravljanje kvalitetom, proizvodnja podrana raunalom) i dr.

41

23.11.2009

Vanjski podaci

Vanjski podaci opisuju aktivnosti koje se odvijaju izvan poduzea. Pribavljaju se izvan poduzea posredstvom specijaliziranih institucija koje se bave prikupljanjem i distribucijom informacija: podaci o konkurentnosti (proizvodi, usluge, promjene konkurentnih poduzea), ekonomski podaci (fluktuacija valuta, politiki indikatori, kretanja kamata, burzovni podaci), strukovni podaci (tehnoloki trendovi, marketinki trendovi), financijski podaci, robni podaci (cijene sirovina), marketinki podaci i dr.

Skladite podataka

Pretprocesiranje podataka

Data mining

ienje podataka

Testiranje, evaluacija

Modeli, uzorci

Web

Transakcijska baza podataka

Tekstualne datoteka

42

23.11.2009

43

You might also like