Professional Documents
Culture Documents
Open Data FIN2019
Open Data FIN2019
PRIRODNO-MATEMATIČKI FAKULTET
2
Šta je Big Data?
3
Ko generiše podatke?
Mobilni uređaji
(i njihovi senzori)
Socijalne mreže i mediji
(svi mi geneišemo podatke)
Mreže senzora
Naučni instrumeti (mere razne veličine)
(skupljaju razne vrste podataka)
4
1-Veličina (Volume)
• Veličina podataka
• 44x porast od 2009 - 2020
• Od 0.8 ZB do 35ZB
• Eksponencijalni rast!
5
2-Kompleksnost (Varity)
6
3-Brzina (Velocity)
• Primeri
• E-Promocije: Na osnovu koordinata korisnika šalju se na
mobilni uređaj podaci o promocijama u obližnjem objektu.
• Monitoring u zdravstvu: Senzori beleže promene telesnih
parametara i momentalno se reaguje na loša očitavanja.
• Monitoring kritične infrastrukture
7
Šta pokreće Big Data Hype?
8
HPC – jedna od instalacija
●
2 management/storage servers - 12TB raw, Lustre FS
●
22 nodes, 2 x Intel Xeon E5-2670, 16 cores, 64GB RAM
●
4 Tesla K20m accelerators
●
Scientific Linux 6.9
●
Infiniband QDR interconnect (40 Gpbs)
●
Komercijalni paketi: Intel Fortran/C++, Gaussian
9
Obrazovanje – PMF Kragujevac
●
2011. godine uveden predmet
Paralelno programiranje u OAS
informatike
Proučavaju se MPI, OpenMP i CUDA
●
2014. godine u predmet Operativni
sistemi 2 uveden Hadoop i Spark
●
2016. godine IMI Blog pokriva
teme iz oblasti HPC i Big Data
●
2019. godine uvodi se MAS
program za Data Science
10
Primena - Hidroinformatika
●
Dugogodišnja saradnja sa Institutom Jaroslav Černi
●
Spin-off kompanija Vodena d.o.o.
●
Dve osnovne oblasti
– Optimizacija proizvodnje
– Praćenje bezbednosti hidroenergetskih objekata
11
Optimizacija proizvodnje električne energije
●
U produkciji od septembra 2018. god.
●
Podaci iz RHMZ, berze, senzora na brani itd.
●
Aplikacija za optimizaciju proizvodnje bazirana
na hidrološkoj prognozi, prognozi cena na
berzi, pod fizičkim, zakonskim i ekološkim
ograničenjima
12
Teški optimizacioni problemi
●
Genetski algoritmi
●
Svaka jedinka je posebna simulacija
●
100 jedniki kroz 100 generacija
●
33 h -> 20 min
13
Monitoring bezbednosti brane
●
Prosečna brana u Evropi je stara 50 godina
●
Zato se vrši monitoring pomoću različitih senzora
●
Procena očekivanih vrednosti vrši se pomoću statističkih
modela koji se kreiraju MANUELNO
●
Često se dešavaju otkazi opreme za monitoring
14
DEVONNA – automatsko generisanje ANN modela
●
Dam health assessment based on evolving
artificial neural networks
●
Kreiranje odgovarajućeg modela na osnovu
trenutno dostupnih podataka u realnom
vremenu
●
Rezervisano za HPC
15
Devonna – internacionalna priznanja
16
UNDP konkurs - izazov otvorenih podataka
●
Unapređenje dostupnosti medicinske opreme, na osnovu podataka Agencije za lekove i
medicinska sredstva i Instituta za javno zdravlje Srbije „Dr Milan Jovanović Batut“,
●
Upoznajte opštine u Srbiji, na osnovu podataka Republičkog zavoda za statistiku i Agencije za
privredne registre,
●
Informisanje građana o nivoima i promenama elektromagnetskog polja, na osnovu podataka
Regulatorne agencije za elektronske komunikacije i poštanske usluge (RATEL)
17
Monitoring nivoa izloženosti EM polju
●
http://emf.ratel.rs/lat/ispitivanja-em-po
lja/
●
Stepen korelacije između senzora je
značajan
●
Postoji jasan trend
18
Ideja – mapiranje urbane sredine
●
Heat mapa
●
Near real-time pokrivanje u slučaju otkaza senzora
●
Ohrabruje jaka korelacija serija na području Beograda
19
BlackFox – Automatsko prediktivno modeliranje korišćenjem ANN
20
BlackFox – integracija u data science ekosistem
21
BlackFox – Klaud servis za automatsko generisanje ANN modela
●
STANDARDNI MANUELNI PRISTUP Comparison
– Korak 1: Klasična izgradnja, obučavanje i testiranje 18
mreže pomoću biblioteke Keras. Zahteva ekspertsko
znanje iz oblasti mašinskog učenja. 16
12
– Korak 2: Optimizacija arhitekture ANN. Zahteva AI
ekspertizu i vremenski je zahtevna. 10
6
●
KORIŠĆENE BLACKFOX SERVISA 4
– Ne zahteva ekspertizu i izvršava se u vidu Cloud
servisa na HPC/IaaS infrastrukturi. 2
22
Naš tim
23