You are on page 1of 84

Prof. dr.

Velimir Srića

POSLOVNI INFORMACIJSKI SUSTAVI


Otkrivanje znanja iz podataka

Katedra za informatiku
Ekonomski fakultet - Zagreb
Prof. dr. sc. Velimir Srića

 kabinet A 512
 telefon: 238-3294
 Kontakt: vsrica@efzg.hr
velimir@velimirsrica.com
http://www.youtube.com/user/SricaTV
 Personal web page
 LinkedIn blog
 Facebook page

 konzultacije: ponedjeljak 11:45-12:15


ponedjeljak 13:45-14:15 i po dogovoru
2
Raspored predavanja po temama
Tjedan Datumi Tema Str. u knjizi

1. 26.02. Uvod u PIS, Informacijski 1-17


sustav u organizaciji
2 05.03. Poslovni procesi i informacijski 19-38
sustav

3. 12.03. Transakcijska obrada 39-59

4. 19.03. Analitičke i upravljačke obrade 61-89

5. 26.03. Otkrivanje znanja iz podataka 89-112

6. 09.04. Specifične obrade potpore 113-141


odlučivanju
7. 16.04. Test 1 1-141
Raspored predavanja po temama
Tjedan Datumi Tema Str. u knjizi
9. 23.04. Informacijski sadržaji, Potpora 143-172
komunikaciji
10. 30.04. Povezivanje informacijskih 173-198
sustava
11. 7.05. Organizacija i razvoj 199-234
informacijskoga sustava
12. 14.05. Kvaliteta i sigurnost 257-274
informacijskoga sustava
13. 21.05. Budućnost informacijskih
sustava
14. 28.05. Test 2 143-274
15. 04.06. Potpisi i dogovor o ispitu

4 3/25/2018
Današnje prezentacije

TEMA prezentacije TIM – do tri člana

Informatička potpora upravljanju


ljudskim resursima (HRM) Borna Sorić, Karlo Sučić, Karlo
Stojko

Biometrijski dokumenti i sigurnost


Krizel Barbara, Rumenović
Katarina, Lea Rodić

Big Data i budućnost poslovne Andrea Šimić, Nikolina Šebalj ,


analitike Ivana Škrtić

5
Današnje prezentacije

TEMA prezentacije TIM – do tri člana

Digitalna transformacija poslovanja


Karla Georgiev, Marija Horvat

Sharing Economy
Kristina Ivić (…36), Meri
Janković, Ivan Jukić
Big Data i budućnost poslovne
analitike Sanja Jakupović, Martina Galić,
Ilić Ivona

6
Informacijski sustavi u poslovanju 7
Današnje prezentacije

Internet stvari (IoT –


Internet of Things) Lucija Roknić, Mateja Salopek

Sabljak Daniela, Svetec Pavla,


Digitalni marketing Šahurić Edina

8
Današnje prezentacije

Digitalne inovacije u Nika Jelačić, Katarina Ivandić,


zdravstvu Nina Ipša

Petra Jagić, Kristina Ivić, Mia


Digitalni marketing Jaušovec

9
Sadržaj: što ćemo učiti
• Što je otkrivanje znanja iz baza podataka?
• Koje se metode koriste za otkrivanja znanja iz
baza podataka?
• Koje su tipične primjene otkrivanja znanja iz
baza podataka?
• Što su veliki podaci (engl. big data)?
• Koje tehnologije se koriste u obradi velikih
podataka?
Informacijski sustavi u poslovanju 10
Literatura
• Obvezna:
– Informacijski sustavi u poslovanju (ur. Varga, M.,
Strugar, I.). Ekonomski fakultet, Zagreb, 2016.:
poglavlje Otkrivanje znanja iz podataka

Informacijski sustavi u poslovanju 11


SMART Trends
• The future of customer management: Intimacy in a
virtual world (Facebook, Youtube, Airbnb, Uber)
• The future of money: Apple pay, Google walet, PayPal,
Facebook Bank, Clever Kash, Cryptocurrency Market
• The future of retail: The “Intelligent Store”: Alibaba,
Macy’s, e-bay, Amazon Go, QuiBids Auction)
• The future of products: Smart stuff: Google car, Uber
car, Amazon Echo , 3D home chef, Digital Dude)
• The future of services: Lawyer app, IBM Innovation
Center for Watson, robot bank tellers
• The future of marketing: Piano stairs, Acxiom, What’s
new from Google
SMART Trends
• The future of healthcare: Bellabeat LEAF, Teddy The
Guardian, Cancer Memorial Center, iRobot’s RP-VITA
• The future of transportation: Hyperloop, self-driving car
• The future of cities: European partnership on SMART
cities, Helsinki, Amsterdam, 98 SMART cities in India
• The future of distribution: Amazon air
• The future of education: Coursera, EdX, Udacity…
• Crowdsharing: BlaBlaCar, Letgo
• Crowdfunding: Kickstarter, IndiegoGo, Tubestart…
• Crowdsourcing: Clickworker, Amazon Mechanical Turk
• The Museum of the Future: Dubai,
Facebook „Likes” and Big Data
• Michal Kosinski, Stanford University 2013
• Data analysis of 58.000 volonteers
• Cambridge Analytica, BrExit & Trump’s victory
Facebook „Likes” Precision
Big Data in Marketing
Acxiom - one of the biggest companies you've never heard of

DB with 500 million potential clients – the data obtained from


„analysis” of 50,000 billion „transactions”
Big Data - Extreme Data

US National Security Agency gradi podatkovni centar u


Bluffdaleu, Utah – s kapacitetom yottabyte podataka
Umjetna inteligencija i Big Data
• IBMovi superračunalo Watson analiziralo je preko 600.000
medicinskih izvješća o pacijentima liječenim od raka, 1,5
miliona patentnih prijava u onkologiji i 20 miliona stranica
analiza upotrebe lijekova i članaka u medicinskim časopisima
• Ti su podaci ugrađeni u Sustav za podršku odlučivanja u
Sloan-Kettering Cancer Memorial Center u New Yorku
Case study
https://www.technologyreview.com/s/538701/data-mining-reveals-the-surprising-factors-
behind-successful-movies/

“Data Mining Goes to Hollywood!”


Problem
Preporučeno rješenje
Rezultati
Odgovor i diskusija

19 Informacijski sustavi u poslovanju


https://www.technologyreview.com/s/538701/data-mining-reveals-the-surprising-factors-behind-successful-movies/
Informacijski sustavi u poslovanju 20
Sustav za prognoziranje zarade i profitabilnosti
filmova
 PODACI –Filmovi koji su “lansirani” u periodu 2000-2010;
Korišteni su podaci baze IMDb

 Korišteni podaci:
 “Snaga zvijezde” (e.g. zarada glumca i redatelja, profit filma sa
glumcem i redateljem)
 “Kolaboracija” (e.g. prosječan broj dosadašnjih suradnji svakog
glumca u filmu i redatelja)
 Prosječan godišnji profit svih filmova koje je “lansirao” studio
protekle godine
 Vrijeme “lansiranja” (Ljeto, Zima)
 Žanr filma
 Teme filmova
 Prosječna zarada svih filmova u žanru

 Cilj analize: Prognozirati prihod i profitabilnost filma


Proces otkrivanja znanja u IBM SPSS Modeler

Model
Development
process

Model
Assessment
process
Korištene metode
• Neuronske mreže
• Stabla odlučivanja
• Genetski algoritmi

Informacijski sustavi u poslovanju 23


Rezultat: Glumci koji su ostvarili najveći prihod nisu
ostvarili i najveći profit

Informacijski sustavi u poslovanju 24


Rezultat: Karakteristike filmova koji su ostvarili najveću
profitabilnost
Karakteristike najprofitabilnijih filmova:
Prosječan najveći profit glavnog glumca i redatelja
Prosječna zarada redatelja u prethodnom razdoblju
Film se počeo prikazivati zimi
Ukupan profit glumaca u filmu
Prosječan profit žanra filma (npr. akcijski)

Informacijski sustavi u poslovanju 25


Rezultat: Karakteristike filmova koji su ostvarili najmanju
profitabilnost
Karakteristike najmanje profitabilnih filmova:
Film nije za sve dobne skupine
Žanr: Drama
Teme filmova: (rat, misija, Amerika, borba)
Teme filmova: (muzika, bend, poznati, zvijezda, mjesto)
Strani filmovi (izvan USA)

Informacijski sustavi u poslovanju 26


Arhitektura Prediction Models

softvera Remote
Models

Movie Forecast
Local
Models
Guru (MFG)
Remote
GUI
Data Sources
(Internet Web Services
XML / SOAP ETL
Browser)

HTML
TCP/IP MFG Engine
(Web Server) ODBC
& ETL
User MFG
Database
(Manager)
XML

Knowledge Base
(Business Rules)
Pitanja za case study
• Zašto bi holivudski investitori trebali otkrivanje
znanja?
• Koji su izazovi za upravljanje holivudskom
filmskom industrijom?
• Mislite li da su istraživači iskoristili sve
dostupne podatke za model?
• Na koji način bi se mogla povećati prediktivna
efikasnost modela?
Što je otkrivanje znanja iz baza
podataka?

29
Otkrivanje znanja iz baza podataka
• Svakodnevno se bilježi velika količina podataka
• primjer:
– maloprodajne kuće vode podatke o prodanim artiklima po
kupcima, dućanima, grupama proizvoda i regijama
– u navedenim podatcima skrivaju se smislene pravilnosti, kojima
poduzeće može unaprijediti svoje poslovanje
– maloprodajno poduzeće može otkriti da klijenti često kupuju
zajedno dva proizvoda koji su na prvi pogled međusobno
nepovezani, pa može proizvode postaviti zajedno na policu u
dućanu i na taj način još više povećati njihovu prodaju
– takve pravilnosti nije jednostavno istražiti i analizirati u velikim
količinama podataka, koji se pohranjuju u baze podataka
– zbog toga se za otkrivanje takvih pravilnosti koriste automatske
metode, kao što su statistika ili strojno učenje

Informacijski sustavi u poslovanju 30


Definicija otkrivanja znanja iz baza
podataka
• Otkrivanje znanja iz baza podataka je istraživanje i
analiza velikih količina podataka korištenjem
automatskih metoda s ciljem otkrivanja smislenih
pravilnosti

• Otkrivanje znanja iz baza podataka: sinonimi?


• Ostala imena: rudarenje podataka (data mining),
ekstrakcija znanja (knowledge extraction), analiza
obrazaca (pattern analysis), žetva informacija
(information harvesting), cijeđenje podataka (data
dredging)
Otkrivanje znanja kao presjek
mnogih disciplina

Ar
tifi
Pattern

c
ial
Recognition

s
tic

Int
tis

ellig
Sta

en
ce
DATA Machine
MINING Learning

Mathematical
Modeling Databases

Management Science &


Information Systems
Baza podataka Vs. Otkrivanje znanja
• Pronađi sve tražitelje kredita sa prezimenom Božić
• Izlistaj sve kupce koji su kupili za više od 10,000 kn prošli mjesec
• Pronađi sve kupce koji su kupili mlijeko

• Pronađi sve tražitelje kredita koji su rizični (klasifikacija)


• Pronađi sve kupce sa sličnim kupovnim navikama (cluster analiza)
• Pronađi sve proizvode koji se često kupuju uz mlijeko (asocijativna pravila)
Definicija poslovnog
problema Korak 1: Definicija
poslovnog problema
Određivanje potrebnih
podataka

Transformacija i
Korak 2: Priprema podatka
uzorkovanje podataka

Vrednovanje podataka

Odabir tehnike
Korak 3: Modeliranje
rudarenja

Izrada i vrednovanje
modela

Interpretacija i
Korak 4: Implementacija
korištenje rezultata

P3. Proces otkrivanja znanja iz baza podataka


Korak 1: Definicija poslovnog problema
• Definicija poslovnog problema je pronalaženje pitanja značajnoga za
poslovanje na koje se traži odgovor primjenom otkrivanja znanja iz
baza podataka.
– u ovome koraku određuje se koje će osobe sudjelovati u projektu
otkrivanja znanja
• tipičan tim za otkrivanje znanja
– analitičar koji dobro poznaje metode otkrivanja znanja
– informatičar koji dobro poznaje baze podataka poduzeća
– stručnjaka iz poduzeća koji je dobro upoznat s potencijalnom
primjenom u poslovanju
• na čelu tima ključna osoba iz menadžmenta
– ne mora izravno raditi na projektu, ali ga treba podržati
– pomoć u rješavanju mogućih teškoća (primjerice otpor zaposlenika
prema primjeni novih tehnologija)

Informacijski sustavi u poslovanju 35


Mogući ciljevi projekta
1. Analiza profila kupaca (Profile Analysis)
– Mjerenje zajedničkih karakteristika poduzeću
zanimljive populacije (demografija, potrošnja
kupca)
2. Segmentacija (Segmentation)
– Nakon analize profila kupci se dijele u segmente
Mogući ciljevi projekta
3. Modeli odaziva (Response)
– Procjena vjerojatnost da će kupac odgovoriti
pozitivno na ponudu
– Paziti kod višestrukih ponuda – telefon, mail,
pošta
4. Rizik (Risk)
– Procjena rizičnost kupca
Mogući ciljevi projekta
5. Aktivacija (Activation)
• Procjena vjerojatnosti da će kupac početi koristi
proizvod u potpunosti
6. Prodaja dodatnih proizvoda
• Cross sell – prodaja novih proizvoda
• Up-sell – proidaja istog proizvoda
Mogući ciljevi projekta
7. Odlazak kupca kod konkurencije (Churn)
8. Vrijednost životnog vijeka (Lifetime Value)
• Predviđanje profitabilnosti klijenta kroz određeni
period
Definicija poslovnog Korak 1: Definicija poslovnog problema
problema

Određivanje potrebnih
podataka

Transformacija i
uzorkovanje podataka
Korak 2: Priprema
podatka

Vrednovanje podataka

Odabir tehnike
Korak 3: Modeliranje
rudarenja

Izrada i vrednovanje
modela

Interpretacija i
Korak 4: Implementacija
korištenje rezultata
Korak 2: Priprema podataka
• Priprema podataka obuhvaća:
– određivanje potrebnih podataka
– transformaciju podataka
– uzorkovanje podataka
– vrednovanje podataka podataka
• podaci za otkrivanje znanja mogu biti
pohranjeni u različitim oblicima (relacijske
baze podataka ili skladišta podataka)

Informacijski sustavi u poslovanju 41


Korak 2: Priprema podataka
• Tipični podaci koji se koriste za otkrivanje znanja
iz baza podataka su transakcijska baza podataka i
baza klijenata
– transakcijska baza podataka bilježi podatke za svaku
transakciju, pa je njezin generički sadržaj sljedeći: šifra
klijenta, broj računa, vrsta, iznos i datum transakcije
– baza podataka o klijentima generički sadrži šifru
klijenta, šifru kućanstva, broj računa, ime i prezime
kupca, adresu, telefon, demografske podatke,
proizvode i usluge, dosadašnje ponude i segmentaciju.

Informacijski sustavi u poslovanju 42


Korak 2: Priprema podataka
• Transformacija podataka je priprema
podataka u tablični oblik pri čemu se u
stupcima trebaju nalaziti atributi, a u recima
opažanja
– primjer opažanja može biti klijent, a primjeri
atributa su dob, spol i artikli kupljeni u trgovini
– transformacija podataka se odnosi i na operacije s
podacima jer se često podaci iz transakcijske baze
podataka moraju objediniti da bi bili korisni
(agregacija, selekcija, filtriranje, spajanje)

Informacijski sustavi u poslovanju 43


Kako pripremiti podatke?
1. Tabelarni oblik
– Retci – opažanja
– Stupci – varijable

2. Svaki redak mora


opisivati podatak
značajan za poduzeće
(npr. kupca, proizvod)
Operacije nad podacima
• Filtriranje (izbor redaka)
• Selekcija (izbor kolona)
• Agregacija ili grupiranje (npr. agregatni podaci
o prodaji po regijama, kućanstvima)
• Spajanje (npr. spajanje baze transakcija i
kupaca)
Agregacija
Korak 2: Priprema podataka
• U transakcijskim bazama podataka i bazama
klijenata nalaze se velike količine podataka a
za izradu modela nije potrebno toliko
podataka
• Stoga se koristi uzorkovanje podataka kako bi
se odabrala manja količina podataka
potrebnih za model
• Podaci se u uzorak najčešće izabiru slučajnim
izborom

Informacijski sustavi u poslovanju 47


Potrebna količina podataka
• Stablo odlučivanja – 2,000 – 3,000
• Neuronske mreže – 10,000

• Od 100,000 klijenata – 4,000 ima životno osiguranje


• Uzorak – 4,000 (ima osiguranje) + 4,000 (nema
osiguranje – slučajni izbor)
Korak 2: Priprema podataka
• U svakoj bazi podataka postoje netipične, netočne i nepostojeće
vrijednosti, kao i problematični i nejasno definirani podaci
– netipične vrijednosti seznačajno se razlikuju od ostalih podataka u
bazi podataka. Primjer netipičnih podataka mogu biti kupci s iznimno
visokim ili iznimno niskim primanjima. Mogu se zamijeniti nekim
drugim vrijednostima ili izbaciti iz analize
– netočne vrijednosti najčešće su posljedica pogrešnoga unosa
podataka u računalo
– problematični podaci odnose se na nepostojeće vrijednosti, nejasne
definicije podataka i netočne vrijednosti
– nepostojeće vrijednosti su česte, a obično se radi o situaciji da za
kupca ne postoje neki demografski podaci
– nejasne definicije podataka česte su kod transfera podataka iz jedne
baze podataka u drugu (primjerice: varijabla „Cijena 1“ u jednoj bazi
može označavati cijenu u eurima, a u drugoj cijenu u kunama)

Informacijski sustavi u poslovanju 49


Primjer: “Prljavi” podaci
• Nepostojeće vrijednosti (Missing Data) – postupak
isti kao i za netipične vrijednosti
• Nejasne definicije (npr. Cijena 1 može u jednom bazi
– jabuke, a u drugoj – kava)
• Netočne vrijednosti – pogrešan unos, pogrešno
vrijeme na računalu
Definicija poslovnog Korak 1: Definicija poslovnog problema
problema

Određivanje potrebnih
podataka

Korak 2: Priprema podataka


Transformacija i
uzorkovanje podataka

Vrednovanje podataka

Odabir tehnike
rudarenja Korak 3: Modeliranje

Izrada i vrednovanje
modela

Interpretacija i
Korak 4: Implementacija
korištenje rezultata
Korak 3: Modeliranje
• Metode koje se koriste za modeliranje podataka mogu se podijeliti u tri kategorije:
• Metode za klasifikaciju koriste se za predviđanje događaja
– primjer takvoga događaja može biti vraćanje kredita; otkrivanjem znanja želi se dati odgovor
na pitanje o vjerojatnosti da će pojedini klijent vratiti kredit
– Za klasifikaciju se često koriste stablo odlučivanja, logistička regresija te neuronske mreže.
• Metode prognoziranja koriste se za predviđanje brojčanih vrijednosti
– primjer takve brojčane vrijednosti može biti iznos kupnje u sljedećoj godini na temelju dobi,
zanimanja i dosadašnje potrošnje kupca.; otkrivanjem znanja želi se prognozirati iznos
potrošnje, uz određenu vjerojatnost
– Za predviđanje se također koriste neuronske mreže, ali i linearna regresija te metode
vremenskih serija
• Metode za grupiranje koriste se za pronalaženje tipičnih skupina
– primjer takvih skupina mogu biti korisnici usluge mobilnoga bankarstva; otkrivanjem znanja
žele se pronaći tipične skupine korisnika usluga, kojima se nakon toga mogu ponuditi proizvodi
posebno prilagođeni njihovim osobinama
– dvije najpoznatije metode za grupiranje su metoda analize tržišne košarice i metoda klaster
analize

Informacijski sustavi u poslovanju 52


Vrednovanje rezultata
 Metode otkrivanja – logičnost rezultata
 Metode predviđanja događaja i vrijednosti –
točnost predviđanja

 Modeli se vrednuju i kroz njihovo korištenje.


 Situacija A:
 Nakon slanja kataloga svim kupcima stopa odaziva je 5%
(5% od 100,000 = 5,000)
 Situacija B:
 Nakon slanja kataloga prema modelu otkrivanja znanja stopa
odaziva je 10%
(10% od 50,000 = 5,000)
Definicija poslovnog Korak 1: Definicija poslovnog problema
problema

Određivanje potrebnih
podataka

Korak 2: Priprema podataka


Transformacija i
uzorkovanje podataka

Vrednovanje podataka

Odabir tehnike Korak 3: Modeliranje


rudarenja

Izrada i vrednovanje
modela

Interpretacija i
korištenje rezultata
Korak 4: Implementacija
Implementacija rezultata
• Tri su mogućnosti implementacije:
– Implementacija gotovih indeksa (scores)
– Izrada ad hoc modela od strane in-house ekspertnog
tima, vanjskih konzultanata, softverskih kompanija…
– Izrada alata kojima se podupiru strateške, taktičke i
operativne odluke

• Proces modeliranja nije nikada u potpunosti


gotov. Modeli se dograđuju, a njihovi rezultati
koriste se u poslovanju.
Korak 4: Implementacija
• U ovoj fazi ključna je uloga stručnjaka za
poslovanje, koji na temelju specifičnih poslovnih
znanja može interpretirati rezultate (važno je da
rezultati modela budu u obliku jednostavnom za
interpretaciju – npr. u obliku grafikona ili pravila)
• Korištenje rezultata ovisi o njihovoj prezentaciji i
integraciji u svakodnevno poslovanje, a pravilo je
da što su rezultati bolje prezentirani, to će se više
koristiti

Informacijski sustavi u poslovanju 56


Koje se metode koriste za otkrivanja
znanja iz baza podataka?

57 Informacijski sustavi u poslovanju


Metode otkrivanja znanja iz baza
podataka
• Metode klasifikacije
– Osnovni cilj: grupiranje podataka u već ranije
definirane grupe (npr. svrstavanje klijenata banke u
skupinu rizičnih klijenata, koji neće moći vraćati kredit,
i skupinu nerizičnih klijenata, koji će biti u stanju
vraćati svoj kredit)
– metode klasifikacije rješavaju problem otkrivanja
kriterija po kojima će se moći provesti razvrstavanje
klijenata
– za probleme klasifikacije najčešće se koriste modeli
klasifikacijskih stabala, ako želimo saznati koji su
kriteriji grupiranja podataka

Informacijski sustavi u poslovanju 58


Primjer klasifikacijskoga stabla za
grupiranje kreditnih zahtjeva

Informacijski sustavi u poslovanju 59


Metode otkrivanja znanja iz baza
podataka
• Metode prognoziranja
– slične su ranije opisanim metodama klasifikacije,
no razlika se sastoji u vrsti konačnoga rezultata
– klasifikacija rezultira odabirom jedne od
postojećih skupina ili tzv. diskretnih vrijednosti,
koja će se dodijeliti promatranome objektu
– najčešće metode za izradu prognostičkih modela
su regresijska stabla, regresijska analiza i
neuronske mreže

Informacijski sustavi u poslovanju 60


Primjer prognoziranja broja nezaposlenih
korištenjem vremenskih serija

Informacijski sustavi u poslovanju 61


Metode otkrivanja znanja iz baza
podataka
• Metode grupiranja
– primjenjuju neusmjereni pristup otkrivanju znanja jer ne
postoje unaprijed definirane skupine ili međuovisnosti
između pojedinih varijabli u podacima
– osnovni zadatak modela grupiranja sastoji se u
segmentaciji polazne skupine heterogenih podataka u
manje grupe homogenih podataka. Pri tome poželjno je da
formirane grupe podataka sadrže podatke koji su
međusobno što sličniji, dok su obilježja formiranih grupa
međusobno bitno različita
– najčešće korištene metode grupiranja su klasteriranje
korištenjem k srednjih vrijednosti, samoorganizirajuće
mape te asocijativno grupiranje

Informacijski sustavi u poslovanju 62


Grafički prikaz segmentiranja podataka
u tri klastera (k = 3)

Informacijski sustavi u poslovanju 63


Segmentacija tržišta na temelju podataka
Tipične primjene otkrivanja znanja iz
baza podataka
• Predviđanje rizičnih događaja
• Prodaja dodatnih proizvoda postojećim
klijentima
• Zadržavanje postojećih klijenata
• Segmentacija
• Životna vrijednost kupca

Informacijski sustavi u poslovanju 65


Informacijski sustavi u poslovanju 66
http://croz.net/wp-content/uploads/2013/03/Prediktivna-analiza-predvidanje-buducnosti2.pdf
Izvor: http://croz.net/wp-content/uploads/2013/03/Prediktivna-analiza-predvidanje-
buducnosti2.pdf
Informacijski sustavi u poslovanju 67
Predviđanje rizičnih događaja
• Model predviđanja rizičnih događaja tipičan je
upravo za banke i osiguravajuća društva
• Modeli koji temeljem ponašanja kupaca brzo
detektiraju krađe kreditnih kartica smanjuju
gubitak kartične kuće
– Primjer: otkrivanje znanja iz baza podataka
pokazalo je da broj velikih transakcija u vrlo
kratkome vremenu raste nakon krađe kreditne
kartice

Informacijski sustavi u poslovanju 68


Prodaja dodatnih proizvoda
postojećim klijentima
• Modeli prodaje dodatnih proizvoda
postojećim kupcima određuju vjerojatnost da
će kupac koji već kupuje proizvode od
poduzeća kupiti dodatni proizvod
• Ponudom odabranih proizvoda odabranim
kupcima također se povećava kvaliteta odnosa
s kupcima

Informacijski sustavi u poslovanju 69


Zadržavanje postojećih klijenata
• Odlazak klijenata konkurenciji je problem brojnih
djelatnosti
• Klijenti često prelaze kod konkurencije zbog pogodnosti
koje im se nude, pa tako maloprodajne trgovačke kuće
u svijetu već godinama vode rat niskim cijenama kako
bi privukle klijente
• Otkrivanjem znanja iz baza podataka izrađuju se modeli
kojima se predviđa vjerojatnost da će kupac nakon što
se cijene podignu na normalnu razinu prijeći kod
konkurencije ili smanjiti potrošnju

Informacijski sustavi u poslovanju 70


Segmentacija
• Glavni resurs poduzeća su njegovi kupci, a tek
temeljem poznavanja njihovih osobina,
preferencija i specifičnih potreba banka im
može prilagoditi ponudu svojih usluga
• Velike količine podataka o kupcima
poduzećima bi trebale koristiti za analizu
osobina kupaca te temeljem njih formirati
segmente kojima se mogu posebno prilagoditi
usluge

Informacijski sustavi u poslovanju 71


Životna vrijednost kupca
• Životna vrijednost kupca je očekivana vrijednost zarade
od pojedinoga kupca kroz određeno vrijeme
– primjerice, banci je zanimljivo privući što više studentske
populacije od koje će velik dio postati profitabilni klijenti.
– trenutna zarada od usluga studentima može biti mala, ali
ako se stvori dobar odnos s klijentom, u budućnosti će se
ostvariti velika korist
– tek diplomiranome studentu trebat će kredit za auto, stan,
tekući račun, kreditne kartice, mirovinsko i životno
osiguranje…
– zbog visokoga obrazovanja očekuje se da će takva osoba
imati i iznadprosječna primanja te će si moći priuštiti sve te
proizvode

Informacijski sustavi u poslovanju 72


Što su veliki podaci?

73 Informacijski sustavi u poslovanju


Veliki podaci (engl. big data)
• U informacijskim sustavima se pohranjuju velike količine podataka,
koji mogu biti strukturirani ili nestrukturirani, koji nastaju unutar
organizacije ili pristižu izvan nje te koji opisuju najrazličitije poslovne
pojave
• primjeri:
– podaci poslovnih objekata kao što su proizvodi, cijene ili računi
stvaraju se u izvršnome dijelu informacijskoga sustava i pohranjuju u
transakcijskoj bazi podataka
– analitički podaci kao što su analize rezultata prodaje po mjesecima,
proizvodima i tržištima stvaraju se u upravljačkome dijelu
informacijskoga sustava i pohranjuju u skladištu podataka
– poslovni dokumenti koji mogu biti u obliku poslovne dokumentacije,
dopisa, poruka e-pošte, zapisa komunikacije društvenih medija kao što
su „tvitovi“ ili „lajkovi“ i sl., stvaraju se u suradničko-komunikacijskome
dijelu informacijskoga sustava i pohranjuju u različitim oblicima baza
dokumenata

Informacijski sustavi u poslovanju 74


Veliki podaci (engl. big data)
• Pojmom veliki podaci opisuju se skupovi
podataka koje je, zbog njihove veličine i
složenosti, teško i vremenski zahtjevno
obraditi korištenjem aplikacija namijenjenih
obradi strukturiranih podataka
• Teškoće se susreću pri svim fazama obrade
velikih podataka: prikupljanju, održavanju,
pohranjivanju, pretraživanju, dijeljenju, analizi
i prikazu podataka

Informacijski sustavi u poslovanju 75


Informacijski sustavi u poslovanju 76
Veliki podaci (engl. big data)
• Veliki podaci se obično definiraju V obilježjima
– volumen (engl. Volume): velika količina podataka (sve je
veća količina podataka pohranjenih u različitim uređajima
te oni rastu brže od količine podataka nastalih poslovnim
transakcijama)
– raznovrsnost (engl. Variety): podaci se nalaze u različitim
oblicima (nalaze se u bazama podataka, datotekama,
slikama, dokumentima ili drugim oblicima)
– promjenljivost, brzina (engl. Velocity): sadržaj podataka se
neprestance i brzo mijenja prihvaćanjem novih kolekcija
podataka, aktiviranjem prethodno arhiviranih kolekcija
podataka ili prihvaćanjem nizova podataka koji
kontinuirano pristižu

Informacijski sustavi u poslovanju 77


Veliki podaci (engl. big data)
• Uz velike podatke vezane su sljedeće značajne
promjene:
– ostvaruje se mogućnost obrade ogromnih količina
podataka odnosno podataka čitave populacije
promatrane pojave
– prihvaća se da veliki podaci mogu biti neuredni ili
neuređeni i da se ne mora ili ne može inzistirati na
potpunoj točnosti podataka, što osobito vrijedi pri
statističko-analitičkim obradama
– uvide dobivene analizom velikih podataka moguće je
ostvariti uočavanjem korelacija među pojavama, a da
se pritom ne utvrđuje uzročnost pojava

Informacijski sustavi u poslovanju 78


Veliki podaci (engl. big data)
• danas je na djelu podatkovanje (engl. datafication) različitih pojava
• pojam podatkovanje se odnosi na uzimanje podataka o pojavi kako bi se
ona mogla kvantificirati i kroz podatke analizirati
• primjerice, stranica teksta se digitalizacijom pretvara u njenu digitalnu
sliku, a podatkovanjem u podatkovljeni tekst koji omogućava brojenje
slova, riječi ili koju drugu analizu
• primjeri podatkovanih pojava:
– danas je podatkovana velika količina knjiga od kojih su stvoreni veliki korpusi
riječi i omogućena analiza jezika
– pametni mobiteli s ugrađenim GPS-om omogućuju njegovo lociranje pa tako
kada se potencijalni kupac s mobitelom nalazi na lokaciji koja je u blizini
prodavaonice, kafića ili restorana, može ga se informirati o „prednostima“
ulaska
– Naš digitalni trag ili sjena, koji se odnosi na podatke nastale kao nusprodukt
našega kretanja kroz život, može se korisno iskoristiti za analizu raznih
interakcija: na kojima smo stranicama bili, koliko smo se zadržali, jesmo li se na
njih vraćali – koristi se i kao mogućnost poboljšanja Web mjesta

Informacijski sustavi u poslovanju 79


Savjet o kupnji karte temeljem obrade
velikih podataka

Informacijski sustavi u poslovanju 80


Koje tehnologije se koriste u obradi
velikih podataka?

81 Informacijski sustavi u poslovanju


Tehnologije u obradi velikih podataka
• veliki podaci često nisu strukturirani ili je strukturiranost zbog njihove
promjenljivosti teško održavati
• za pohranjivanje velikih podataka često se koriste NoSQL-baze podataka
• obuhvaćaju različite oblike baza podataka, kao što su:
– dokumentne baze podataka – povezuju ključ s dokumentom
– grafovske baze podataka – sadrže podatke o „mrežama“, a koriste se
posebice u društvenim mrežama
– baze parova ključ-vrijednost – svaki zapis sadrži samo ime atributa
(ključ) i vrijednost atributa
– stupčaste baze podataka – sadrže invertirane podatke, a u zapis
pohranjuju podatke jednoga atributa (stupca) svih objekata, a ne kao
što je uobičajeno podatke svih atributa jednoga objekta
• podatke koje prikupljaju društvene mreže, kao što su to Twitter, Facebook,
LinkedIn ili Pinterest, prikladno je pohranjivati u ovome obliku
Informacijski sustavi u poslovanju 82
Zaključak
Modele treba koristiti, ali im ne treba vjerovati
Henri Theil

83 Informacijski sustavi u poslovanju


Zaključak: što smo naučili
• Pojam otkrivanja znanja iz baza podataka te
njegove metode i tipične primjene u praksi
• Definicija i primjeri velikih podataka (engl. Big
data)
• Tehnologije korištene u obradi velikih
podataka

Informacijski sustavi u poslovanju 84

You might also like