Professional Documents
Culture Documents
Velimir Srića
Katedra za informatiku
Ekonomski fakultet - Zagreb
Prof. dr. sc. Velimir Srića
kabinet A 512
telefon: 238-3294
Kontakt: vsrica@efzg.hr
velimir@velimirsrica.com
http://www.youtube.com/user/SricaTV
Personal web page
LinkedIn blog
Facebook page
4 3/25/2018
Današnje prezentacije
5
Današnje prezentacije
Sharing Economy
Kristina Ivić (…36), Meri
Janković, Ivan Jukić
Big Data i budućnost poslovne
analitike Sanja Jakupović, Martina Galić,
Ilić Ivona
6
Informacijski sustavi u poslovanju 7
Današnje prezentacije
8
Današnje prezentacije
9
Sadržaj: što ćemo učiti
• Što je otkrivanje znanja iz baza podataka?
• Koje se metode koriste za otkrivanja znanja iz
baza podataka?
• Koje su tipične primjene otkrivanja znanja iz
baza podataka?
• Što su veliki podaci (engl. big data)?
• Koje tehnologije se koriste u obradi velikih
podataka?
Informacijski sustavi u poslovanju 10
Literatura
• Obvezna:
– Informacijski sustavi u poslovanju (ur. Varga, M.,
Strugar, I.). Ekonomski fakultet, Zagreb, 2016.:
poglavlje Otkrivanje znanja iz podataka
Korišteni podaci:
“Snaga zvijezde” (e.g. zarada glumca i redatelja, profit filma sa
glumcem i redateljem)
“Kolaboracija” (e.g. prosječan broj dosadašnjih suradnji svakog
glumca u filmu i redatelja)
Prosječan godišnji profit svih filmova koje je “lansirao” studio
protekle godine
Vrijeme “lansiranja” (Ljeto, Zima)
Žanr filma
Teme filmova
Prosječna zarada svih filmova u žanru
Model
Development
process
Model
Assessment
process
Korištene metode
• Neuronske mreže
• Stabla odlučivanja
• Genetski algoritmi
softvera Remote
Models
Movie Forecast
Local
Models
Guru (MFG)
Remote
GUI
Data Sources
(Internet Web Services
XML / SOAP ETL
Browser)
HTML
TCP/IP MFG Engine
(Web Server) ODBC
& ETL
User MFG
Database
(Manager)
XML
Knowledge Base
(Business Rules)
Pitanja za case study
• Zašto bi holivudski investitori trebali otkrivanje
znanja?
• Koji su izazovi za upravljanje holivudskom
filmskom industrijom?
• Mislite li da su istraživači iskoristili sve
dostupne podatke za model?
• Na koji način bi se mogla povećati prediktivna
efikasnost modela?
Što je otkrivanje znanja iz baza
podataka?
29
Otkrivanje znanja iz baza podataka
• Svakodnevno se bilježi velika količina podataka
• primjer:
– maloprodajne kuće vode podatke o prodanim artiklima po
kupcima, dućanima, grupama proizvoda i regijama
– u navedenim podatcima skrivaju se smislene pravilnosti, kojima
poduzeće može unaprijediti svoje poslovanje
– maloprodajno poduzeće može otkriti da klijenti često kupuju
zajedno dva proizvoda koji su na prvi pogled međusobno
nepovezani, pa može proizvode postaviti zajedno na policu u
dućanu i na taj način još više povećati njihovu prodaju
– takve pravilnosti nije jednostavno istražiti i analizirati u velikim
količinama podataka, koji se pohranjuju u baze podataka
– zbog toga se za otkrivanje takvih pravilnosti koriste automatske
metode, kao što su statistika ili strojno učenje
Ar
tifi
Pattern
c
ial
Recognition
s
tic
Int
tis
ellig
Sta
en
ce
DATA Machine
MINING Learning
Mathematical
Modeling Databases
Transformacija i
Korak 2: Priprema podatka
uzorkovanje podataka
Vrednovanje podataka
Odabir tehnike
Korak 3: Modeliranje
rudarenja
Izrada i vrednovanje
modela
Interpretacija i
Korak 4: Implementacija
korištenje rezultata
Određivanje potrebnih
podataka
Transformacija i
uzorkovanje podataka
Korak 2: Priprema
podatka
Vrednovanje podataka
Odabir tehnike
Korak 3: Modeliranje
rudarenja
Izrada i vrednovanje
modela
Interpretacija i
Korak 4: Implementacija
korištenje rezultata
Korak 2: Priprema podataka
• Priprema podataka obuhvaća:
– određivanje potrebnih podataka
– transformaciju podataka
– uzorkovanje podataka
– vrednovanje podataka podataka
• podaci za otkrivanje znanja mogu biti
pohranjeni u različitim oblicima (relacijske
baze podataka ili skladišta podataka)
Određivanje potrebnih
podataka
Vrednovanje podataka
Odabir tehnike
rudarenja Korak 3: Modeliranje
Izrada i vrednovanje
modela
Interpretacija i
Korak 4: Implementacija
korištenje rezultata
Korak 3: Modeliranje
• Metode koje se koriste za modeliranje podataka mogu se podijeliti u tri kategorije:
• Metode za klasifikaciju koriste se za predviđanje događaja
– primjer takvoga događaja može biti vraćanje kredita; otkrivanjem znanja želi se dati odgovor
na pitanje o vjerojatnosti da će pojedini klijent vratiti kredit
– Za klasifikaciju se često koriste stablo odlučivanja, logistička regresija te neuronske mreže.
• Metode prognoziranja koriste se za predviđanje brojčanih vrijednosti
– primjer takve brojčane vrijednosti može biti iznos kupnje u sljedećoj godini na temelju dobi,
zanimanja i dosadašnje potrošnje kupca.; otkrivanjem znanja želi se prognozirati iznos
potrošnje, uz određenu vjerojatnost
– Za predviđanje se također koriste neuronske mreže, ali i linearna regresija te metode
vremenskih serija
• Metode za grupiranje koriste se za pronalaženje tipičnih skupina
– primjer takvih skupina mogu biti korisnici usluge mobilnoga bankarstva; otkrivanjem znanja
žele se pronaći tipične skupine korisnika usluga, kojima se nakon toga mogu ponuditi proizvodi
posebno prilagođeni njihovim osobinama
– dvije najpoznatije metode za grupiranje su metoda analize tržišne košarice i metoda klaster
analize
Određivanje potrebnih
podataka
Vrednovanje podataka
Izrada i vrednovanje
modela
Interpretacija i
korištenje rezultata
Korak 4: Implementacija
Implementacija rezultata
• Tri su mogućnosti implementacije:
– Implementacija gotovih indeksa (scores)
– Izrada ad hoc modela od strane in-house ekspertnog
tima, vanjskih konzultanata, softverskih kompanija…
– Izrada alata kojima se podupiru strateške, taktičke i
operativne odluke