Professional Documents
Culture Documents
Repetitorij
Repetitorij
2009
Panian, .; Klepac, G.: Poslovna inteligencija, Masmedia, 2003. Klepac, G.; Mri, L.: Poslovna inteligencija kroz poslovne sluajeve, Lider press d.d../TIM press d.o.o., Zagreb, 2006. Panian, . i suradnici: Poslovna inteligencija: studije sluajeva iz hrvatske prakse, Narodne novine d.d., 2007. Berry, Michael J. A.; Linoff, Gordon S.: Data Mininig Techniques for Marketing, Sales and Customer Relationship Management Second Edition, Wiley Publishing, Inc., Indianapolis, Indiana (SAD),2004.
23.11.2009
Kakvoa podataka
Premda je problem kvalitete podataka u stanovitoj mjeri ovisan o obiljejima tvrtke i njena poslovanja mogue je uoiti etiri osnovne kategorije kakvoe podataka koje imaju izravni utjecaj na donoenje poslovnih odluka u poduzeu:
standardiziranost (standardiziranost podrazumijeva ujednaenost u izrazu te standardizaciju dokumenata nositelja poslovnih informacija), podudarnost (podudarnost se odnosi na identificiranje podudarnih podataka iz brojnih izvora i njihovu eliminaciju), verificiranost (verificiranost ukljuuje postupak usporedbe nekog podatka sa poznatim izvorom kako bi se utvrdila relevantnost podatka), proirivost (proirivost podrazumijeva mogunost dodavanja novih podataka postojeem skupu).
Kakvoa podataka
Prilikom osmiljavanja dobre strategije cjelovitog nadzora, kontrole i upravljanja kakvoom podataka potrebno je uzeti u obzir pet slijedeih zahtjeva:
23.11.2009
Na temelju cilja analize pripremamo podatke za pretprocesiranje. Same funkcije agregiranja, grupiranja i formiranja razreda ovise o cilju analize. Postoji itav niz izvedenica atributa ili njihovih kombinacija. Tako na osnovu koritenje metoda analiza vremenskih serija iz datuma transakcije moemo ekstrahirati podatke o pauzama u dolascima klijenata, te o njihovom ponovnom dolasku nakon pauze nedolaenja. Isto tako u realnim analizama moraju se obuhvatiti i kategorije kao to su uestale pauze, neprekidni dolasci i slino, kako bi model bio potpuniji, a segmentacija preciznija.
Pretprocesiranje podataka
Ako se u skupu podataka pojavljuju ekstremne vrijednosti (engl. Outliers) one se ne smiju iskljuiti bez prethodne dijagnostike uzroka zbog kojih se pojavljuju. Naime ekstremne vrijednosti ponekad mogu upuivati na pounu devijaciju te je stoga potrebno provesti dodatne analize i donijeti odluku o njihovu ukljuivanju ili iskljuivanju iz daljnjih analiza. U populaciji podataka moe se naii i na nedostajue vrijednosti. U tom sluaju u procesu analize podataka primijenit e se metode predvianja nedostajuih vrijednosti. Najee su to standardne metode rudarenja podataka. Ako se podaci prikupljaju iz razliitih izvora esto ne postoji jednoznana definicija relacijskih kljueva. Kad se primjenjuju razliiti sustavi kategoriziranja unutar podataka, dolazi do pojave nedosljednosti vrijednosti atributa vezanih uz iste relacijske kljueve.
23.11.2009
Pretprocesiranje podataka
U postupku rudarenja podataka, uz izvore podataka unutar poduzea (npr. Skladite podataka) esto se koristi i niz vanjskih izvora gdje su informacije iskazane u razliitim formatima. U tim sluajevima dolazi do izraaja kompleksnost itave problematike, jer se dodavanjem izvora moe promijeniti metodologija pretprocesiranja i ienja podataka. U sluajevima kad je fiziki nije mogue zahvatiti cjelokupnu populaciju koriste se metode uzorkovanja s time da uzorak to reprezentativnije predstavlja cijelu populaciju. Metoda uzorkovanja primjenjivat e se i pri cijepanju osnovne populacije na uzorak za uenje modela i testni uzorak. U postupku pretprocesiranja podataka jedan od vanih koraka odnosi se na formiranje kategorija na temelju podataka. Na primjer pri dodjeli vrijednosti atributa kategoriji starosne dobi (npr. od 20 do 40), u nju se uvrtavaju svi slogovi ija se vrijednost atributa starosna dob nalazi unutar tih granica.
5. Uzorkovanje
Pretprocesiranje podataka
Slina metoda prethodno navedenoj metodologiji je i formiranje izvedenih atributa, a odnosi se na formiranje novih kategorija koje obuhvaaju vrijednosti sortiranog niza, pri emu svaka od kategorija sadri jednak broj vrijednosti definiranog niza. Primjenom ove metode velika koliina podataka saima se grupiranjem po odreenim kriterijima. Metode normiranja podataka koje se najee primjenjuju u procesu rudarenja podataka su: Min-max normiranje (primjenjuje se u sluajevima kad je poznata minimalna i maksimalna vrijednost izvornog niza), Z-skaliranje (primjenjuje se u sluaju da se ne zna minimalna i maksimalna vrijednost originalnog niza) i metoda Decimalnog skaliranja kad se normiranje provodi izravno na relacijskoj tablici.
9. Normiranje podataka
23.11.2009
Jedna od vrlo jednostavnih mjera koja nam moe pruiti informacije o korelacijskoj zavisnosti izmeu dviju varijabli je koeficijent korelacije: ako je KK > 0 tada su nizovi vrijednosti pozitivno korelirani ako je KK < 0 tada su nizovi vrijednosti negativno korelirani ako je KK = 0 tada ne postoji korelacijska meuzavisnost Ova mjera moe biti korisna kada se, primjerice, eli vidjeti ima li neka varijabla pozitivan, negativan ili neutralan smjer korelacije s obzirom na ciljnu varijablu.
23.11.2009
Izraun i tumaenje vrijednosti poslovnih informacija teak je zadatak, izmeu ostalog i zbog toga to informacija nije materijalna pa se pri utvrivanju vrijednosti ne mogu primijeniti konvencionalne metode. Odreivanju, a posebno izraunavanju egzaktne vrijednosti informacija potrebno je pristupiti vrlo paljivo. Tri pristupa:
Ovaj pristup postavlja jednakost izmeu koliine informacija i entropije polja sluajnih dogaaja koje stvara informaciju. U kasnijim istraivanjima Shannon pokuava izvesti vrijednost informacije iz njene koliine. Shannon je povezujui koliinu s vrijednou informacija uspio samo djelomino, jer te vrijednosti razvrstava u samo etiri kategorije, to je suvie "gruba", tek orijentacijska podjela kakva je teko iskoristiva za bilo kakve ozbiljnije praktine analize. Sam pokuaj odreivanja i karakterizacije pojma vrijednosti informacije, bez obzira na primjenjivost, predstavlja velik doprinos znanstvenoj spoznaji u ovom podruju.
23.11.2009
Richard Hamming polazi od koncepta ivotnog ciklusa informacije (Information Life Cycle), koji pretpostavlja da svaka informacija u odreenom trenutku nastaje, neko vrijeme traje, da bi nakon isteka tok vremena nestala. Vrijednost informacije u tom kontekstu smatra funkcijom vremena; drugim rijeima, vrijednost nije postojano, ve vremenski promjenjivo obiljeje svake informacije.
Funkciju vrijednosti informacije u vremenu obiljeavaju tri karakteristina podruja. Prvo je podruje prognoziranja, kada se odgovarajua informacija dobiva i prije no to je potrebno donijeti neku odluku. Njena je vrijednost tada najvea i ona s vremenom nelinearno opada. Drugo je karakteristino podruje stvarnog (realnog) vremena u kojemu se informacija dobiva (odnosno nastaje) upravo onda kada treba donijeti odluku. Vrijednost informacije je konstantna sve do podruja zastarijevanja, koje nastupa onda kada se informacija dobiva prekasno, onda kada odluka vie nije potrebna ili nije relevantna za daljnji tijek dogaaja (procesa). U ovome podruju vrijednost informacije strmo eksponencijalno pada.
23.11.2009
Tumaenje i vrednovanje informacija po Bernardu Liautaudu poiva u injenici da se vrijednost odreene informacije protee u kontinuumu. Uporaba informacije iri se (propagira) diljem poduzea, pa ak i izvan njega, prema klijentima i partnerima. Iz toga Liautaud izvodi zakljuak da se vrijednost informacija moe zadovoljavajue precizno definirati kao funkcija broja korisnika koji mogu pristupati tim informacijama i analizirati ih i broja poslovnih podruja kojima korisnici pripadaju, te iskazati sljedeim izrazom: Sam autor tvrdi kako se u navedeni izraz odluio uvrstiti kvadrat broja korisnika inspiriran poznatim Metcalfeovim zakonom mree. Bob Metcalfe, poznat kao izumitelj mrene arhitekture Ethernet predstavio je formulu za izraunavanje vrijednosti raunalnih mrea u kojoj vrijednost mree stavlja u odnos proporcionalnosti s kvadratom njenih korisnika.
Prema Liautaudu, u kontinuumu vrijednosti odreene informacije moe se uoiti pet karakteristinih zona:
1. zona u kojoj podaci predstavljaju troak 2. zona u kojoj podaci poinju stvarati novu vrijednost 3. zona inteligencije poduzea 4. zona proirenog poduzea 5. zona u kojoj informacija postaje roba kojom se trguje
23.11.2009
Poslovna inteligencija
Prema jednoj dostupnoj definiciji, poslovna inteligencija je stjecanje i iskoritavanje znanja baziranog na injenicama u svrhu unapreivanja strateke i taktike poslovne prednosti na tritu. Ova jednostavna definicija predstavlja tek jedan od pogleda na navedeni pojam.
to je poslovna inteligencija?
Makroekonomski aspekt otkrivanje gospodarskih trendova i predvianje buduih dogaaja, procesa i stanja Mikroekonomski aspekt otkrivanje prikrivenih poslovnih znanja iz rutinski prikupljanih podataka o poslovnim transakcijama
23.11.2009
Makroekonomski aspekt
sustavnim, ali unaprijed (a priori) neciljanim prikupljanjem podataka o makroekonomskim kretanjima u odreenoj geopolitikoj sredini organiziranim i strukturiranim biljeenjem i pohranjivanjem tih podataka
logikom i/ili raunskom obradom radi otkrivanja makroekonomskih trendova te predvianja i prognoziranja procesa i dogaaja u makroekonomskim sustavima i njihovih budu ih stanja
Mikroekonomski aspekt
Odnosi se na poslovnu inteligenciju tvrtke. Koriste se poslovni podaci koje tvrtka rutinski zahvaa prilikom obavljanja razliitih poslovnih transakcija.
10
23.11.2009
Ciljevi stvaranja BI su podrka i unaprjeenje postupaka donoenja poslovnih odluka u poduzeima. BI nastaje kao rezultat dobro upravljanog procesa izvoenja novih ili prikrivenih znanja iz podataka koji se u poslovnoj rutinski generiraju, zahvaaju, memoriraju i koriste. BI se izvodi iz operativnih podataka primjenom odgovarajuih logiko-raunskih metoda. Primjena takvih metoda iziskuje razvijanje odgovarajuih informatikih sredstava i alata (hardvera i softvera), kojih se ve danas na tritu moe nai razmjerno puno. Stvaranje BI nalae uspostavu koherentnog pristupa upravljanju podacima i razvijanje jedinstvenog stava prema njihovoj ulozi i vanosti u poduzeu.
Namjera koncepta BI nije stvaranje vee koliine informacija, ve iskljuivo generiranje boljih, kvalitetnijih informacija potrebnih pri donoenju poslovnih odluka. Upravo to je ono svojstvo BI koje joj daje mo poticanja i stvaranja pozitivnih promjena u sredini u kojoj se stvara i primjenjuje (engl. Actionable BI). BI prua korisnicima samo one informacije koje su im potrebne, ali zato pravovremeno i iskazane na nain koji im najvie odgovara. Primijeni li se kako valja, koncept BI e smanjiti koliinu informacija kojoj se zaposlenici tvrtke izlau, poveavajui istovremeno kakvou tih informacija.
11
23.11.2009
to je poslovna inteligencija?
U najirem smislu predstavlja ranije prikriveno znanje koje se otkriva iz operativnih, rutinski prikupljanih poslovnih podataka primjenom odgovarajuih raunsko-logikih metoda, obino podranih informacijskom tehnologijom. Polazei od injenice da su poslovni podaci koji tvrtke rutinski prikupljaju obavljajui svoje poslovne aktivnosti heterogeni, u prvom koraku moemo uoiti da postoje dvije velike skupine izvora takvih podataka, i to :
Vanjski izvori podataka: podaci koji pristiu iz okruenja tvrtke, odnosno s trita na kojima tvrtka djeluje. Unutarnji izvori podataka: podaci koji nastaju realizacijom poslovnih procesa unutar same tvrtke.
12
23.11.2009
to je poslovna inteligencija?
to je trina inteligencija?
Ukoliko se promatra kategorija trine inteligencije, mogu se razluiti tri glavna izvora iz kojih dolaze podaci:
klijenti tvrtke: podatke tvrtka prikuplja odravanjem razliitih odnosa sa svojim postojeim i potencijalnim klijentima konkurencija tvrtke: tvrtka prikuplja podatke o konkurentskim tvrtkama na legalan i etian nain poslovni partneri tvrtke u opskrbnom lancu : uspostavljanjem opskrbnog lanca nastaju brojni tokovi podataka meu sudionicima u tom lancu, od kojih je jedan tvrtka, a ostali su njeni poslovni partneri.
13
23.11.2009
to je trina inteligencija?
Iz tih podataka mogu se stvoriti tri potkategorije trine, a nakon toga i ukupne poslovne inteligencije:
to je unutarnja inteligencija?
Uz trinu inteligenciju druga osnovna podvrsta poslovne inteligencije jest unutarnja inteligencija tvrtke. Unutarnja inteligencije tvrtke nije homogena, ve nastaje iz podataka koji se generiraju iz dvije razliite skupine izvora:
operativni poslovni procesi: obavljanjem poslovnih procesa nastaju poslovni dogaaji koji stvaraju podatke koji tvrtka evidentira upravljaki procesi: upravljanje poslovanjem podrazumijeva donoenje odreenih poslovnih odluka, planova, budeta, preporuka, naredbi, savjeta itd., to su sve izvori podataka iz kojih se moe izvesti poslovna inteligencija.
28
14
23.11.2009
to je unutarnja inteligencija?
to je poslovna inteligencija?
Uzme li se u obzir sve navedeno, moe se utvrditi kako ukupnu poslovnu inteligenciju ine sljedee glavne sastavnice:
1. 2. 3. 4. 5.
klijentska inteligencija, kompetitivna inteligencija, inteligencija opskrbnog lanca, inteligencija poslovnih procesa, i inteligencija menadmenta
15
23.11.2009
Zbog jo uvijek esto nedostatnog razumijevanja stvarne prirode poslovne inteligencije i njenih dometa, ne zauuje injenica da ne postoji ni dovoljno poznavanje i razumijevanja svih oblika u kojima se ona danas javlja, odnosno metoda u skladu s kojima se moe prakticirati. Uzimajui u obzir povijesni razvitak aplikacija i tehnologije, danas se moe govoriti o pet dominantnih grupa metoda poslovne inteligencije.
1. Poslovno izvjetavanje Odnosi se na iroku lepezu izvjetaja raznih formata namijenjenih operativnom poslovnom izvjetavanju te poredbenih tablica rezultata poslovanja i poslovnih kontrolnih ploa namijenjenih primjeni od strane korisnika informacija razliitih profila. 2. OLAP kocke Analitiki alati koji omoguuju "presijecanje i raslojavanje" (engl. Slice and Dice) ogranienih skupova podataka namijenjenih menaderima i ostalim djelatnicima, koji zahtijevaju sigurno i jednostavno okruenje za provedbu bazinih analiza podataka. 3. Ad hoc upiti i analize Softver koji korisnicima omoguuje postavljanje praktiki neogranienog broja i vrsta upita prema svim raspoloivim podacima i OLAP analizu cjelokupnih baza podataka, sve do razine detaljnih transakcijskih podataka ako je to neophodno. Namijenjen je preteito istraivaima i naprednijim poslovnim korisnicima.
16
23.11.2009
4. Rudarenje podataka Aplikacije koje omoguuju cjelovitu i sloenu matematiku, financijsku i statistiku obradu podataka za svrhe analize korelacije, analize trendova, trinih analiza, financijskih analiza te predvianja buduih dogaaja i procesa, odnosno otkrivanje prikrivenih znanja iz raspoloivih podataka. Namijenjene su profesionalnim analitiarima. 5. Alarmni alati i sustavi ranog obavjetavanja Alati i sustavi za proaktivno, rano obavjetavanje i upozoravanje irokog kruga korisnika prema unaprijed utvrenim kriterijima i dogaajima koji e posluiti kao poticaj ("okida", "otponac") za aktiviranje obavjetajnog mehanizma. Namijenjeni su podjednako unutarnjim i vanjskim korisnicima informacija.
Najsofisticiranije i najinteraktivnije metode i alate poslovne inteligencije koriste razmjerno malo brojne skupine naprednijih korisnika, poput menadera i poslovnih analitiara, to je i razumljivo jer je bavljenje podacima, informacijama i analizama njihov osnovni zadatak i posao. Manje interaktivne i manje "snane" metode i alati nude elementarnije i jednostavnije podatke i rezultate kakvi trebaju veim korisnikim populacijama, poput klijenata, zaposlenika i poslovnih partnera. Potreba za implementacijom alata poslovne inteligencije koji e moi podrati sve navedene metode postaje imperativ.
34
17
23.11.2009
Veina danas raspoloivih alata i tehnologija usmjerena je jednom ili samo nekima od navedenih pet metoda poslovne inteligencije. Tvrtke danas trebaju i trae tehnologiju koja e moi jedinstvenim rjeenjem podrati sve navedene metode poslovne inteligencije u bilo kojoj kombinaciji aplikacija. Sukladno tome tei se arhitekturi koja e korisnicima omoguiti:
jednostavno povezivanje i isprepletanje svih navedenih metoda poslovne inteligencije i njihovih funkcionalnosti, koritenje jedinstvenog suelja za pristup softverskim alatima koji podravaju bilo koju od tih metoda, dostavljanje, odnosno isporuku rezultata putem jedne jedine platforme, koja e se zasnivati na jedinstvenoj ontologiji podataka i unificirati metapodatke te pruati zadovoljavajuu razinu sigurnosti i podravati razliite profile korisnika, osiguravajui tako jednu jedinu inaicu istine posvuda u organizaciji i smanjiti napore i trokove administracije i odravanja.
Danas je ve opeprihvaeno stajalite da se svi ljudi koji na bilo kakav nain sudjeluju u poslovnim procesima, od glavnog i izvrnih direktora, preko poslovnih partnera do izvritelja pomonih poslova, trebaju baviti nekim stupnjem i vrstom analize poslovanja, na nain koji je primjeren njihovoj ulozi u realizaciji cjelokupnog poslovnog i radnih procesa. Neovisno o kojem se tipu i razini analize radilo ona bi trebala biti:
temeljita i istraivaki orijentirana. inicirana automatski, ili ugraena u svakodnevne poslovne procedure.
18
23.11.2009
koja je metoda poslovne inteligencije primjerena pojedinim instancama u tvrtki, koji se alati u tu svrhu trebaju nabaviti, te kako i kada ih koristiti.
Dunost je menadmenta i poslovnih analitiara razraditi razliite scenarije primjene alata za stvaranje poslovne inteligencije u razliitim dijelovima organizacije, imajui u vidu ope ciljeve i intencije njihove uporabe.
Poslovno izvjetavanje
Poslovni izvjetaji mogu biti namijenjeni svim tipovima korisnika zaposlenicima tvrtke na svim razinama organizacijske strukture, na svim radnim mjestima, u svim poslovnim funkcijama i slubama pa ak i partnerima u vrijednosnom lancu. U biti, poslovno izvjetavanje znai stvaranje poslovne inteligencije za masovnu upotrebu. Najznaajnije obiljeje svakog sustava poslovnog izvjetavanja jest njegova sposobnost podravanja vrlo fleksibilnih formata izvjetaja, tako da se podaci mogu predstavljati u bilo kojem obliku prema kojemu korisnici "potroai informacija" iskazuju posebne sklonosti.
19
23.11.2009
Poslovno izvjetavanje
Osim fleksibilnosti kao temeljne znaajke sustava poslovnog izvjetavanja, vane su i sljedee znaajke:
Podrka svim vrstama i oblicima poslovnih izvjetaja , od poredbenih tablica rezultata poslovanja i poslovnih kontrolnih ploa na jednoj strani, do detaljnih operativnih izvjetaja na drugoj, s mnotvom varijacija izmeu ta dva ekstrema. Izvjetavanje putem weba prema zahtjevima korisnika , to izvjetaje ini privlanijima, personaliziranima i relevantnijima za svakog pojedinca. Brzina stvaranja i distribucije izvjetaja koja omoguuje dostavu izvjetaja korisnicima putem onih kanala koji sami izaberu, pa izvjetaji postaju opeprisutnima u poduzeu i prikladnima za uporabu od strane svakog djelatnika. Precizan i primjeren dizajn izvjetaja bez ikakvog programiranja , to za korisnike predstavlja izuzetno privlanu opciju.
Sva navedena obiljeja sustava poslovnog izvjetavanja nedvosmisleno objanjavaju zbog ega je upravo ova metoda poslovne inteligencije danas jo uvijek najprisutnija u poslovnoj praksi.
Radi se o metodi poslovne inteligencije primjerenoj analizi i predviaju nekih dogaaja i procesa koji bi se mogli zbiti u blioj budunosti. OLAP je skraenica punog engleskog naziva OnLine Analytic Processing, odnosno online analitika obrada podataka. Analiza OLAP kocke moe se smatrati najjednostavnijim oblikom analize koji omoguuje praktiki svakom zaposleniku analiziranje podataka s kojima se susree u svome radu. No, najee e je ipak koristiti menaderi koji ele ostvariti dublji uvid i razumijevanje osnovnih uzroka zbog kojih su podaci u poslovnim izvjetajima takvi kakvi jesu, ali koji ipak nisu dovoljno vjeti da se mogli koristiti alatima za postavljanja ad hoc upita i provedbu prigodnih analiza.
20
23.11.2009
OLAP kocke pruaju korisnicima mogunost promatranja podataka sadranih u poslovnim izvjetajima iz razliitih aspekata, primjenom danas ve standardnih OLAP obiljeja kao to su:
listanje po stranicama, pivotiranje, odnosno rotacija oko neke osi kocke, razvrstavanje, odnosno sortiranje prema nekom kriteriju, filtriranje, te "svrdlanje", tj. produbljivanje analize prema gore ili prema dolje.
Takve funkcije omoguuju korisnicima "rezanje i presijecanje" (engl. Slice-and-Dice) kocke podataka ili analitike kocke jednostavnim klikom mia.
41
Metoda poslovne inteligencije koja je oslanja prije svega na prigodne, ad hoc upite i analize omoguuje provoenje istraivakih analiza poslovnih podataka, sve do razine detaljnih podataka generiranih pojedinanim transakcijama. Namijenjena je prije svega naprednijim korisnicima kojima trebaju mogunosti ispitivanja svake mogue kombinacije podataka. Ad hoc upiti i analize mogu se koristiti u bi kojem podruju poslovanja, to se moe zahvaliti njihovim sljedeim obiljejima:
Parametarski voeno izvjetavanje uz usmjeravanje analiza . Ovo obiljeje omoguuje korisnicima stvaranje radikalno razliitih izvjetaja jednostavnim odgovaranjem na niz pitanja (ili zahtjeva) neposredno prije generiranja izvjetaja. Ono to parametarski voeno izvjetavanje ini posebno korisnim su mogunosti brze iteracije uz primjenu niza parametara i pohranjivanja rezultata takvih iterativnih obrada za neku buduu uporabu. "Svrdlanje" bilo gdje. Korisnici mogu "skakati" po bazi podataka koritenjem OLAP funkcionalnosti slijedei poslovni model koji se reflektira u ustroju skladita podataka. Mogu "svrdlati" prema gore ili prema dolje po hijerarhijski strukturiranim podacima, te obavljati raznovrsne unakrsne analize.
21
23.11.2009
Ad hoc upiti i analize mogu se koristiti u bilo kojem podruju poslovanja, to se moe zahvaliti njihovim sljedeim obiljejima:
Sofisticirano filtriranje podataka. Korisnici mogu segmentirati podatke prema razliitim poslovnim kriterijima s ciljem rafiniranja, odnosno dotjerivanja i detaljnijeg prikazivanja odreenog skupa podataka. Grupiranje podataka prema definicijama koje daju korisnici . Korisnicima se omoguuje dotjerivanje poslovnog modela bez potrebe za mijenjanje ustroja baze podataka ili opeg poslovnog modela. Rjeenje koje nudi ova metoda poslovne inteligencije jesu mogunosti grupiranja podataka prema samostalnim, neovisnim definicijama korisnika koje s njihova aspekta imaju smisla jer im omoguuju provedbu nekih specifinih analiza i odraavaju njihov kut gledanja na odreeni poslovni problem, proces ili situaciju.
Sustavi ranog obavjetavanja i upozoravanja omoguuju tvrtkama distribuciju mnotva izvjetaja ili poruka koje se proaktivno distribuiraju potencijalno velikom broju korisnika iz jednog centra. Korisnici se mogu predbiljeiti ili pretplatiti na proizvoljan broj izvjetaja ili poruka koje spadaju u njihovo podruje interesa. Izvjetaji se najee alju elektronikom potom ili putem Weba. To se moe smatrati minimumom funkcionalnosti sustava ranog obavjetavanja i upozoravanja, ali na tritu se ve javljaju i sustavi ovoga tipa s nekim dodatnim funkcionalnostima, kao to su:
Distribucija putem razliitih kanala. Distribucija na temelju predbiljebe i isporuka uz intervenciju administratora Isporuka na zahtjev, prema unaprijed utvrenom planu ili potaknuta dogaajima Automatska personalizacija sadraja.
22
23.11.2009
Rudarenje podataka
Pojam rudarenje podataka moe se definirati kao pronalaenje zakonitosti meu podacima. Podaci kao predmet prouavanja mogu biti sadrani u bazama podataka, razni tekstualni podaci, nestrukturirani podaci ili podaci organizirani u vremenske serije. Prednosti i ogranienja ove metodologije esto se iskrivljeno interpretiraju prezentirajui potencijal kao rjeenje svih poslovnih problema ili rjeenja svih problema suvremenog poslovanja. injenice pokazuju da se primjenom metoda i alata za rudarenje podataka mogu otkriti ponekad iznenaujui obrasci ponaanja nekih osoba ili neoekivani odnosi meu pojavama, no to nije razlog da se jasno ne izraze ogranienja odnosno preuveliavaju mogunosti ovih tehnika.
Rudarenje podataka
Jedna od definicija rudarenja podataka glasi: rudarenje podataka je sustavan, interaktivan i iterativan (ponavljajui) proces izvoenja i prikazivanja korisnoga, implicitnog i inovativnog znanja iz podataka. Vano je uz definiciju spomenuti da uspjenost primjene metoda i alata ove namjene ovisi prvenstveno o strunosti i poslovnoj kompetenciji onih koji tumae dobivene rezultate. Upravo te osobe svojim znanjem i iskustvom mogu biti sposobne neki naizgled besmislen uzorak interpretirati na poslovno korektan i smislen nain i pretvoriti ga u vrijednu informaciju. Dva su glavna tipa rudarenja podataka:
verifikacija hipoteze cilj je provjeriti da li je neka ideja ili dojam o vanosti odnosa meu odreenim podacima utemeljen ili ne (vie od 80% nae prodaje ostvarili su potroai karakteristika x,y...; otkrivanje novih znanja meu nekim pojavama mogu postojati neki jo nepoznati, a statistiki vani odnosi koje ovjek ni iskustvom niti svojim intelektualnim sposobnostima ne moe dokuiti (identifikacija najprofitabilnijih skupina potroaa -temeljem varijabli x,y,z...)
23
23.11.2009
Uspjenost rudarenja podataka odreena je kvalitetom podataka koji se analiziraju. Iskustva pokazuju da analitiar obino i do 80% vremena potroi istei i pretprocesirajui podatke da bi tek 20% vremena primjenjivao metode na tako pripremljenim podacima. Jedna od glavnih prednosti sustava poslovne inteligencije oituje se u koritenju skladita podataka kao izvora podataka za analize, to analitiaru znatno tedi vrijeme. No, analitiar ponekad ipak mora izravno pristupiti izvornoj bazi podataka - ako neki podatak ne postoji u skladitu podataka, ili ako se ne pojavljuje na zadovoljavajuem stupnju granulacije. Podaci u izvornom obliku mogu biti nekompletni, atributi mogu imati nedostajue vrijednosti, ili moe postojati nedostatak atributa. Isto tako moe se pojaviti nekonzistentnost unutar samih podataka, primjerice nedosljednost u oznaavanju pojedinih kategorija ili grupa.
Temeljne statistike metode, OLAP i vizualizacija podataka Fuzzy ekspertni sustavi Klasteriranje Neuronske mree Samoorganizirajue mape (SOM) Bayesove mree Stabla odluivanja Survival modeli Asocijativni algoritmi REFII model Analiza veza
Osnovne znaajke Pretprocesiranje podataka Rjeive skupine problema Interpretabilnost rezultata analize
24
23.11.2009
Zajednika je znaajka navedenih skupina metoda da otkrivanje znanja uz pomo njihove primjene ponajprije ovisi o analitiaru. One nemaju automatski razraene algoritme koji su sposobni prepoznati pravilnosti unutar podataka, nego analitiar pronalazi znanje i meuzavisnosti kombinirajui itav niz raspoloivih atributa/faktora radi otkrivanja informacije koja moe biti iskoristiva u poslovnome smislu. Uspjeh primjene tih skupina metoda uglavnom ovisi o intuiciji analitiara. Dakle, analitiar odreuje koje e od raspoloivih varijabli koristiti za kreiranje izvjetaja.
Za provoenje OLAP analiza podrazumijeva se ureenost podataka u obliku skladita podataka, to znai da su provedeni ETL procesi te izvrena metrika kvalitete podataka. Za razliku od primjene OLAP alata, vizualizacija podataka i temeljne statistike metode mogu se uspjeno primijeniti i na podacima koji nemaju toliki stupanj ureenosti i istoe. U najee koritene temeljne statistike metode spadaju izrauni:
Srednje vrijednosti
(suma svih rezultata/broj rezultata); (prosjeno odstupanje od aritmetike sredine); (najea vrijednost u nekom nizu podataka; dominantna vrijednost); (centralna vrijednost; dijeli skup podataka na 2 jednaka dijela; (N+1)/2); (meusobna povezanost izmeu razliitih pojava predstavljenih vrijednostima dvaju varijabli; nezavisna i zavisna varijabla);
Standardne devijacije
Moda
Medijana
Korelacije
Frekvencija pojavnosti.
25
23.11.2009
OLAP analiza se, za razliku od tradicionalnih metoda data mininga, u postupcima provoenja analize ponajprije oslanja na analitiara kao primarnog subjekta u procesima otkrivanja znanja. To znai da je pri provoenju OLAP analize analitiar osnovni imbenik u procesu otkrivanja znanja, a ne algoritamski postupak na kojemu se temelje tradicionalne metode data mininga. Pri provedbi OLAP analize analitiar testira odreene hipoteze stavljajui dimenzije podataka u odreene odnose, ili pak ciljano analizira odreene trendove, pri emu je OLAP analiza usmjerena na kreiranje izvjetaja. Uzevi u obzir raspoloive skupove promatranih podataka postoji itav niz kombinacija temeljem kojih je mogue provesti OLAP analizu, a analitiar, temeljem svojih iskustava i potrebe analize, provodi odreeni skup analiza (kreiranja izvjetaja) u skladu sa problemskim prostorom.
U svjetlu promatrane problematike, OLAP analize se koriste u svrhu kreiranja izvjetaja, gdje analitiaru stoji na raspolaganju pripremljen skup podataka. Isto tako one imaju znaajnu ulogu i kao alat koji nadopunjuje provedene data mining analize, na nain provoenja OLAP analiza nad podacima proizalima kao rezultat obrade nekom od analiza data mininga. Temeljne statistike metode, kao i metode vizualizacije podataka, imaju znaajnu ulogu u upoznavanju podataka prije procesa provedbe analize i kreiranja samoga modela analize, ali su i vrlo koristan alat pri provedbi analiza i kreiranja analitikih modela rjeenja. Rezultati proizali kao rezultat primjene temeljnih statistikih metoda, vizualizacije podataka i OLAP analize lako se interpretiraju.
26
23.11.2009
Fuzzy ekspertni sustavi, za razliku od ostalih metoda otkrivanja znanja, imaju bitno obiljeje koje ih izdvaja od ostalih skupina metoda, a to je njihova orijentiranost ka koritenju znanja eksperata iz odreenog podruja u procesima kreiranja modela i provedbe analize. Za razliku od tradicionalnih ekspertnih sustava, fuzzy ekspertni sustavi pokazuju znatno vei stupanj fleksibilnosti u kreiranju analitikih modela, te rjeavaju probleme koji nastaju kao posljedica koritenja otrih granica razreda u postupcima kategorizacija varijabli. Koriste se za rjeavanje problema iz domene:
NAPOMENA: uvoenjem vremenske komponente u fuzzy ekspertne sustave moemo dobiti snaan alat za monitoring trinih segmenata.
Fuzzy ekspertni sustavi u procesima otkrivanja znanja koriste se za potrebe klasifikacije, segmentacije i scoriranja, pri emu je u tim procesima osnovni naglasak stavljen na znanja eksperata koja se ugrauju u te sustave. Ako nam je, primjerice, cilj poveati udio visokovrijednih klijenata tada, na temelju kreiranog ekspertnog sustava, prvo dijagnosticiramo koji su to za poduzee visokovrijedni klijenti. Tu zadaa fuzzy ekspertnog sustava zavrava, te koristimo ostale metode otkrivanja znanja kako bismo, primjerice, otkrili koji su tipini obrasci ponaanja visokovrijednih klijenata, koji je osnovni motivator poveanja kupovine toga segmenta trita, to uvjetuje, gledano iz perspektive scoringa, klijente sa niim stupnjem scoringa na veu kupovinu, lojalnost i ostale imbenike koji pridonose veem ponderu vanosti za poduzee kako bi to vei broj tih klijenata u budunosti svojim odnosom sa poduzeem zasluio vei stupanj scoringa.
27
23.11.2009
Klasteriranje
Klasteriranje bismo ukratko mogli definirati kao pronalaenje slinih grupa unutar podataka. Grupe se formiranju postupkom dijeljenja skupa podataka, pri emu se pripadnost grupi definira na temelju znaajki slinih obiljeja ( npr. dob, spol, upanija). Postoji itav niz algoritama za klasteriranje, no najpoznatiji algoritam za klasteriranje je K-mean clustering, koji, pomou funkcija za procjenu distance i centroida, u iterativnom postupku kreira klastere. U iterativnom postupku svakoj se grupi (klasteru) pridruuju funkcije udaljenosti najsliniji elementi iz populacije (proraun se vri na temelju prorauna udaljenosti svakog elementa populacije od sredinjih vrijednosti, "centroida"). Nakon svakog ciklusa (iteracije), ponovno se izraunavaju nove sredinje vrijednosti svakog klastera (centroidi), te se ulazi u novi iterativni ciklus, sve dok vrijednosti centroida ne postanu stabilne. U kontekstu data mininga klaster moemo deklarirati kao skupinu atributa, koji sadre sline vrijednosti dobivene kroz proces klasteriranja.
Klasteriranje
Metode segmentiranja koriste se radi podjele primjera u niz grupa ili podskupova (clusters), koji zadovoljavaju dva osnovna kriterija:
svaka grupa predstavlja homogen skup: primjeri koji pripadaju istoj grupi su meusobno slini; svaka grupa mora se razlikovati od ostalih grupa, tj. primjeri koji pripadaju odreenoj grupi znaajno se razlikuju od primjera koji pripadaju ostalim grupama.
identificirane grupe mogu biti ekskluzivne, tako da svaki primjer pripada iskljuivo jednoj od grupa; grupe se mogu preklapati; primjer moe istovremeno pripadati nekolicini grupa; grupe mogu biti definirane probabilistiki: u tom sluaju primjer pripada svakoj od grupa s odreenom vjerojatnosti grupe mogu biti hijerarhijski strukturirane, sa grubom podjelom primjera na najviem nivou, koji se potom moe finije strukturirati na niim nivoima.
28
23.11.2009
Klasteriranje
Algoritmi klasteriranja u osnovi koriste numerike vrijednosti kao ulazne parametre za provoenje procesa analize. Jedan od vrlo bitnih imbenika je provoenje normiranja nad nizovima vrijednosti atributa koji sudjeluju u procesu analize uz pomo algoritma klasteriranja. Npr. provodimo klasteriranje pomou K-mean clusteringa gdje se u procesu analize obrauju dvije varijable, npr. godine kupca i estomjeseni iznos kupovine robe u trgovini. Veina softverskih paketa automatski prije provoenja procesa klasteriranja provodi normiranje varijabli, no tamo gdje to nije sluaj, potrebno je provesti proces normiranja prije provoenja procesa analize. Sljedei problem koji se pojavljuje pri pretprocesiranju podataka je transformacija vrijednosti nenumerikih varijabli u numerike varijable. U tom sluaju potrebno je osmisliti numeriki sustav koji e najbolje interpretirati opisne vrijednosti uzimajui u obzir znaenje algoritma za klasteriranje. To znai da e se, npr., pri numeraciji upanija voditi rauna o njihovoj teritorijalnoj udaljenosti.
Klasteriranje
Klasteriranje primjenjujemo u situacijama kada unutar podataka elimo prepoznati skupine slinih svojstava, to moe biti korisno u provoenju analiza profila, gdje elimo iz ukupnog skupa podataka izdvojiti tipine trine podskupine slinih svojstava. Jedan od temeljnih nedostataka metode klasteriranja K-mean clusteringa iz perspektive poslovnih analiza je obvezno odreivanje broja klastera prije provoenja analize od strane analitiara.
29
23.11.2009
Neuronske mree
Polazite ideje o neuronskim mreama potie iz neuropsihologije. Iskoritena su saznanja o ponaanju ivane stanice koja funkcionira po principu aktivacije, odnosno poveanja potencijala na sinapsama. U tome matematikoom modelu osnovna jedinica je dizajnirana po uzoru na bioloki neuron. Temeljni princip uenja neuronske mree su veze izmeu eksperimentalnih uzoraka, pri emu postoje dvije paradigme:
autoasocijativno (uzorci se pridruuje sebi samome) i heteroasocijativno uenje (dva razliita tipa uzoraka pridruuju se jedan drugome) .
Postupke uenja (s obzirom na to koriste li procedure uenja vanjske signale povratnu vezu okoline) moemo podijeliti u tri skupine:
nadzirano uenje (eng. supervised learning), nenadzirano uenje (eng. unsupervised learning), pridruujue pojaavajue uenje (eng. associative reinforcement learning).
Neuronske mree
U nadziranom uenju (uenje s uiteljem) uklanjaju se razlike izmeu eljenog izlaza i stvarnog izlaza uzoraka metodom povratne veze. U nenadziranom uenju naglasak je na samoorganizaciji, odnosno klasteriranju pa se, za razliku od ostala dva modela, ne pojavljuje povratna veza. Pridruujue pojaavajue uenje (uenje s kritikom) u svojim temeljima ima povratnu vezu koja indicira kada se aktualni i eljeni uzorci podudaraju te je evaluacijski orijentiran.
30
23.11.2009
Neuronske mree
Pretprocesiranje podataka za potrebe analize uz pomo modela neuronskih mrea (npr. za primjenu Error backpropagation modela), provodi se s obzirom na tip problema koji elimo rijeiti. Error backpropagation model neuronskih mrea, meu ostalim, uglavnom koristimo za potrebe predikcije i klasifikacije. Problemi predikcije mogu se odnositi na predikciju temporalnoga i netemporalnoga znaenja. Pri koritenju Error backpropagation modela neuronskih mrea za potrebe predikcije netemporalnoga znaenja, broj predikcijskih varijabli u numerikome formatu odreuje broj ulaznih neurona, dok izlazni neuron predstavlja predikcijsku varijablu. Na primjer, ako elimo vriti procjenu cijene kvadratnoga metra stambenoga prostora, a raspolaemo varijablama starost objekta u godinama, lokacija, povrina okunice, blizina prometnom voritu..., tada je potrebno numeriki izraziti sve spomenute varijable. Interpretabilnost
Bayesove mree
Bayesove mree bismo mogli definirati kao grafike modele koji pokazuju probabilistike relacije temeljene na uvjetnim vjerojatnostima izmeu setova varijabli. Sastoje se od izravnih neciklikih grafova i tablica uvjetnih vjerojatnosti (eng. conditional probability table). Tablica uvjetnih vjerojatnosti je sastavni element Bayesove mree koji sadri informacije o uvjetnim vjerojatnostima meu varijablama. Prije kreiranja tablice uvjetnih vjerojatnosti potrebno je kreirati strukturu Bayesove mree bilo na temelju ekspertnog znanja ili temeljem automatiziranog algoritma kao npr. NPC (eng. Necessary Path Condition) algoritma. Bayesove mree mogu davati procjene i u uvjetima nekompletnih setova podataka, te u procesu procjene mogu ravnopravno koristiti znanje dobiveno analitikim putem iz podataka, i znanje eksperata.
31
23.11.2009
Bayesove mree
Vrlo irok raspon primjene. Glavna znaajka: sposobnost uenja temeljenog na probabilistici izravno iz uzoraka podataka. Ono to je znakovito za modele temeljene na Bayesovim mreama, jest mogunost procjene vjerojatnosti i na temelju nedostajuih informacija. Pri kreiranju modela Bayesovih mrea koriste se kategorike ili diskretne vrijednosti varijabli. Potrebno je kreirati optimalan broj kategorija/diskretnih vrijednosti kako bi se olakao proces uenja mree i kako bi interpretacija analize imala smisla.
Bayesove mree
Bayesove mree koristimo u situacijama kada elimo procijeniti vjerojatnosti odvijanja nekog dogaaja uz uvjet dogaanja drugih dogaaja. Procjena vjerojatnosti uvjetovane nizom dogaaja procjenjuje se pomou deklariranja uvjetovanih dogaaja, kao niza dogaaja koji e se dogoditi sa pouzdanou 100%. Taj postupak se u literaturi deklarira kao postavljanje evidence vrijednosti u modelu Bayesove mree. Npr. procjena vjerojatnosti kupovine uz uvjet da je:
kupac zatraio katalog proizvoda u prethodnom razdoblju kupio barem jedan proizvod naeg poduzea klijent poduzea vie od 2 godine...
Dakle, model Bayesove mree prati logiku kauzalnost vezanu uz neki problemski prostor.
32
23.11.2009
Bayesove mree
Pri provoenju analize uz pomo modela, gdje se eli procijeniti vjerojatnost dogaanja dogaaja C, uz uvjet dogaanja dogaaja A i B, vjerojatnost odvijanja dogaaja A i B deklarira se kao siguran dogaaj (evidence). Analiza osjetljivosti provodi se na nain praenja porasta vjerojatnosti dogaanja promatranoga dogaaja uz promjene sigurnoga dogaanja uvjetovanih dogaaja. Rezultate analize Bayesovih mrea lako je interpretirati, jer se oslanjaju na teoriju vjerojatnosti, to znai da vjerojatnost 1 oznaava siguran dogaaj, dok vjerojatnost 0 oznaava dogaaj koji se zasigurno nee dogoditi.
Stabla odluivanja
Stablo odluivanja je data mining metoda, koja za cilj ima klasifikaciju atributa s obzirom na zadanu ciljanu varijablu. Osim te funkcije metoda stabla odluivanja koristi se i za kreiranje predikcijskih modela. Stabla odluivanja prezentiraju rezultate obrade u obliku stabla odakle im i potjee ime. Njih karakterizira vrlo laka mogunost interpretacije rezultata obrade u obliku pravila. Postoji itav niz algoritama na temelju kojih se formira stablo odluivanja. Najpoznatiji su ID3, C4.5, CHAID, CR&T i QUEST. Osnovna primjena stabala odluivanja odnosi se na probleme klasifikacije i predikcije.
33
23.11.2009
Stabla odluivanja
Survival modeli
Za potrebe rane dijagnostike zajednikih znaajki klijenata koji su prekinuli suradnju, analizu trendova prekida, te prorauna vjerojatnosti duine poslovnog odnosa klijenta, koriste se modeli, koji se jo popularno zovu i survival analize. Ti modeli svoje podrijetlo vuku iz medicine, a u medicini se koriste pri procjeni uspjenosti razliitih vrsta terapija pri lijeenju pacijenata kroz odreeno vremensko razdoblje. Osnovna ideja survival modela svodi se na procjenu vjerojatnosti da e netko tko je "preivio" kao kupac poduzea odreeno vremensko razdoblje prekinuti ili nastaviti kupovinu u iduoj vremenskoj jedinici. Survival modeli poput Coxove regresije, meu ostalim, daju odgovore na pitanja kolika je vjerojatnost prekida kupovine s obzirom na razliita obiljeja kupaca/korisnika usluge.
34
23.11.2009
Survival modeli
U survival modelima postoje takozvane terminalne oznake neke aktivnosti,kao to je, primjerice, prekid kupovine. Bitna varijabla za taj model je broj mjeseci koritenja proizvoda/usluge. Ta se varijabla izvodi kao broj mjeseci od datuma prekida umanjeno za broj mjeseci od datuma kada je npr. potpisan ugovor s klijentom. Survival modele koristimo u situacijama u kojima elimo procijeniti trendove odlazaka/otkazivanja ugovora od strane kupaca/klijenata. Pojedine metode poput npr. Coxove regresije omoguavaju nam dubinsku analizu uz pomo prediktivnih varijabli, koje nas mogu uputiti na potencijalne uzroke prekida suradnje te na obiljeja klijenata koji prekidaju suradnju (npr. najveu tendenciju odlazaka pokazuju klijenti koji su vie od tri puta reklamirali proizvod unutar jamstvenoga roka, ili najveu tendenciju odlazaka pokazuju klijenti mlae ivotne dobi, pri emu konkurencija trenutno vodi kampanju prilagoenu upravo toj dobnoj skupini).
Asocijativni algoritmi
Rezultat obrade podataka uz pomo asocijativnih algoritama su asocijativna pravila. Asocijativna pravila ukazuju na to koliko esto se dogaaji pojavljuju zajedno. Najpoznatiji algoritmi za otkrivanje asocijativnih pravila su apriori algoritam i stablo frekventnih uzoraka. 40% transakcija u kojima je prodano mlijeko prodan je i kruh. 10% svih transakcija sadri oba artikla. Mjera pouzdanosti (confidence) pravila (X implicira Y) je mjera koja pokazuje koliko se puta pojavi Y kada se pojavi X, i izraava se u postocima. Ta mjera se moe statistiki izraziti i kao uvjetna vjerojatnost. Mjeru podrke (support) deklariramo kao mjeru za evaluaciju asocijativnih pravila, koja se izraava kao postotni omjer izmeu pravila u kojima se skup elemenata (artikala) pojavljuje zajedno u transakcijama i ukupnog broja promatranih transakcija.
35
23.11.2009
Asocijativni algoritmi
Glavni nedostatak apriori algoritma proizlazi iz njegove kompleksnosti i osjetljivosti na rast elemenata analize, to uzrokuje poveanje broja kombinacija. Popularna metode koje reduciraju broj kandidata koji ulaze u analizu pomou toga algoritma je metoda formiranja prividnih varijabli, te metoda grupiranja skupa proizvoda na temelju zajednikih znaajki. Nedostatak toga pristupa oituje se u gubitku preciznosti analize. Koritene mjere pouzdanosti u sklopu tog algoritma su spomenute mjere podrke i pouzdanosti. Vrlo djelotvoran algoritam za generiranje asocijativnih pravila je stablo frekvencije uzoraka.
REFII model
REFII model moemo definirati kao jedinstveni model transformacije vremenske serije, koji je polazina osnova za provoenje rudarenja znanja iz vremenskih serija na razliitim konceptualnim osnovama. Pretprocesiranje podataka za potrebe analize uz pomo REFII modela odvija se u devet osnovnih koraka. Pretprocesiranje podataka za potrebe primjene REFII modela svodi se na kreiranje matrice transformacije temeljem vrijednosti vremenske serije. Fleksibilnost REFII modela oituje se u mogunosti primjene lingvistikih varijabli temeljenih kako na klasinoj crisp logici, tako i na fuzzy logici.
36
23.11.2009
REFII model
Analizu sezonskih oscilacija Otkrivanje motiva u vremenskoj seriji Otkrivanje uzoraka iz vremenske serije Otkrivanje mutacija unutar vremenskih serija Klasteriranje vremenskih serija Otkrivanje slinosti vremenskih serija Primijeniti tradicionalne algoritme data mininga unutra vremenskih serija (SOM, Stabla odluivanja, fuzzy logika, klasteriranje, asocijativni algoritmi, Bayesove mree...) OLAP analizu vremenskih serija
Analiza veza
Analize veza (eng. link analysis) je metoda data mininga koja pronalazi meuzavisnosti izmeu promatranih kategorija atributa proraunavajui frekvencije pojavnosti veza meu njima. Kombinatorna eksplozija. U procesu grupiranja, osim standardnih principa poveanja granulacije podataka na nain uzimanja u obzir nadkategorija unutar podataka, isto tako moemo kreirati i prividne varijable. Analize veza tradicionalno se koriste u problemima vezanim uz kriminalistiku. Osim primjene u kriminalistici, analize veza imaju i vrlo rasprostranjenu primjenu u domeni poslovanja, gdje se mogu koristiti za potrebe otkrivanja potencijalnih prijevara, analize narudbi i prodaje, te planiranja i raspodjele robe u skladitenome poslovanju, odnosno u situacijama procjene optimalne preraspodjele robe izmeu niza trgovina u trgovakome lancu uvjetovanih raznim imbenicima (npr. sezonski).
37
23.11.2009
Skladitenje podataka
Skladitenje podataka usmjereno je na pravovremeno dobivanje relevantnih informacija potrebnih u postupcima odluivanja. Na tritu koje se globalizira vlada sve vea konkurencija te su kupci sve izbirljiviji. Proizvoai moraju stalno provjeravati svoju konkurentnost na tritu i pronalaziti uspjenu poslovnu strategiju.
Skladitenje podataka
Pritom je neophodno posjedovati pravovremene i relevantne informacije o svim aspektima poslovanja i situaciji na tritu.
38
23.11.2009
Skladitenje podataka
Skladitenje podataka je vaan koncept uinkovitog sustava potpore odluivanju, koji se intenzivno razvija posljednjih godina. Donosi ideju aktivnog pronalaenja i nuenja informacija menaderu, potrebnih u procesu odluivanja.
Skladite podataka
Skladite podataka (engl. data warehouse) je skup podataka organizacije na kojem se temelji sustav potpore odluivanju. Skladite podataka je skup integriranih i obogaenih podataka organizacije ne temelju kojeg se izgrauje sustav za potporu odluivanju. Manje skladite podataka koje obuhvaa podatke samo jednog poslovnog podruja naziva se podrunim skladitem podataka (engl. data mart).
39
23.11.2009
Skladite podataka
Iz svrhe proizlazi: da skladite podataka treba podacima potpuno "pokriti" jedno ili vie poslovnih podruja (npr. nabave, prodaje), da podaci u skladitu trebaju biti sveobuhvatni, tj. "integrirani" od unutarnjih podataka organizacije, ali i podataka iz njenog okruenja, podaci moraju obuhvatiti dui vremenski period (pet, deset ili vie godina), jer su vremenske analize poslovno vrlo znaajne, orijentiranost prema poslovnim analizama ne zahtijeva od skladita da se podaci promptno auriraju kao u bazi podataka.
Skladite podataka
Skladite podataka namijenjeno je menaderima, ali i svima koji u svom poslu obavljaju razliite analitike zadatke,
kao to su poslovi praenja i izvjetavanja, koji se temelje na primjeni razliitih poslovnih pravila, a obavljaju se postavljanjem usmjerenih upita i analizom dobivenih rezultata; poslovi analize i dijagnosticiranja, koji se temelje na umjenosti, a obavljaju se iterativnim pronalaenjem i analizom dobivenih informacija; i poslovi planiranja i simulacije, koji se temelje na znanju, a obavljaju se modeliranjem i izvrenjem izraenog modela.
40
23.11.2009
Odvajanjem baze i skladita podataka, u bazi podataka zadrava se uinkovitost transakcijske obrade, a u skladitu podataka ostvaruje mogunost dobre analitike obrade. Meutim, danas je, uz koritenje jaih sustava za upravljanje bazom podataka, mogue transakcijske podatke baze podataka i analitike podatke skladita podataka drati u jednoj fizikoj bazi podataka. U takvoj su bazi podataka transakcijski i analitiki podaci razdvojeni, a sustav za upravljanje bazom podataka sposoban je istovremeno izvravati transakcijske i analitike obrade podataka.
Unutarnji podaci
Unutarnji podaci pripadaju poduzeu i generirani su u sustavu za obradu transakcija te opisuju aktivnosti koje se odvijaju unutar poduzea:
financijski podsustavi (npr. glavna knjiga), logistiki podsustavi (planiranje materijala, nabava, transport, distribucija itd.), podsustavi prodaje,
podsustavi proizvodnje (upravljanje i kontrola proizvodnje, praenje radnih naloga, praenje projekata, upravljanje kvalitetom, proizvodnja podrana raunalom) i dr.
41
23.11.2009
Vanjski podaci
Vanjski podaci opisuju aktivnosti koje se odvijaju izvan poduzea. Pribavljaju se izvan poduzea posredstvom specijaliziranih institucija koje se bave prikupljanjem i distribucijom informacija: podaci o konkurentnosti (proizvodi, usluge, promjene konkurentnih poduzea), ekonomski podaci (fluktuacija valuta, politiki indikatori, kretanja kamata, burzovni podaci), strukovni podaci (tehnoloki trendovi, marketinki trendovi), financijski podaci, robni podaci (cijene sirovina), marketinki podaci i dr.
Skladite podataka
Pretprocesiranje podataka
Data mining
ienje podataka
Testiranje, evaluacija
Modeli, uzorci
Web
Tekstualne datoteka
42
23.11.2009
43