You are on page 1of 17

UNIVERZITET U TUZLI

FAKULTET ELEKTROTEHNIKE
ELEKTROTEHNIKA I RAČUNARSTVO

ZAVRŠNI RAD
METODE DUBOKOG UČENJA ZA ANALIZU I PREDVIĐANJA
VREMENSKIH SERIJA

Tuzla, Decembar 2020. Mentor: Dr.sc. Demirović Damir, vanr.prof


Vremenske serije
Analiza vremenskih serija
Vremenske serije predstavljaju nizove numeričkih podataka posmatrane
varijable, koji su odvojeni jednakim vremenskim intervalima i poredani
hronološkim redoslijedom.
Razlikujemo:
• područje analize vremenskih serija
• područje predviđanja(prognoze) vremenskih serija.

Komponente vremenskih serija su:


• Trend
• Sezonalnost
• Ciklusi
• Šum
Model se dobiva sabiranjem ili množenjem pojedinih komponenti vremenske
serije.

Na primjer: y(t)= trend + sezonalnost + šum


Vremenska serija
broja
AVIONSKIH
PUTNIKA kroz
godine
Prognoza(predviđanje) vremenskih serija se izvodi s
ciljem predviđanja budućih vrijednosti serije. Ona se
izvodi tako da se gradi model nad historijskim

Vremenske serije
podacima te se korištenjem modela predviđaju
vrijednosti serije u budućnosti.

Svaka prognoza vremenske serije je specifična, stoga je na


Predviđanje vremenskih serija početku postupka prognoziranja bitno detaljno analizirati
podatke, izvući zaključke te na temelju njih identificirati
najprikladniji model za zadani problem.

Bitno je prikupiti što više relevantnih i kvalitetnih


podataka. Podaci vremenskih sljedova često zahtijevaju
čišćenje, skaliranje ili transformaciju.
Predviđanje vremenskih serija strojnim
učenjem
Nadzirano učenje (engl. supervised learning) je oblik strojnog učenja u kojem imamo ulazne
Predviđanje kao problem nadziranog učenja
varijable (x) i izlaznu varijablu (Y), a cilj je pronaći preslikavanje Y= f (X) koje opisuje vezu
između podataka.
Preporučeno je podatke za učenje podijeliti u tri dijela: skup za učenje, skup za validaciju i skup za
testiranje.
Skup za učenje se koristi za treniranje modela, a na skupu za validaciju se radi evaluacija rješenja kako bi
se odabrali idealni hiperparametri modela.

Transformacija vremenske serije u problem


nadziranog učenja
MJERE TAČNOSTI PROGNOZE
Najčešće korištene mjere tačnosti prognoze vremenskih serija su:
● Prosječna apsolutna greška

Prosječna apsolutna greška (engl. Mean Absolute Error, MAE) dobiva se


usrednjavanjem apsolutne vrijednosti greške svakog pojedinog prognoziranog primjera.

● Korijen srednje kvadratne greške

Korijen srednje kvadratne greške (engl. Root Mean Squared Error, RMSE) je vrlo često korišten
u prognozama serija. Osim što daje iznos greške koji je izražen u jedinicama tražene varijable,
kvadriranje greške ima efekat dodavanja težina lošim primjerima.

● Prosječni postotak apsolutne greške

Prosječni postotak apsolutne greške(engl. Mean Absolute Percentage Error , MAPE) ima jednostavnu interpretaciju, govori
nam u kojem postotku model, u prosjeku, odstupa od prave vrijednosti,
tj. govori nam tačnost modela.
NEURONSKE
STATIČKE NEURONSKE MREŽE MREŽE DINAMIČKE NEURONSKE MREŽE

• Neuronska mreža -Računarski model koji radi na sličan način kao i


neuroni u ljudskom mozgu.

• Svaki neuron uzima ulaz, procesira neke operacije, a zatim


prosljeđuje izlaz sljedećem neuronu.

• Ljudski mozak se sastoji od 1011 neurona koji su organizirani u


slojeve te su međusobno povezani s oko 1015 veza što čini biološku
neuronsku mrežu.

• Dva su osnovna cilja istraživanja neuronskih mreža: prvi je razvoj


novih struktura umjetnih neuronskih mreža koje bi funkcionirale na
analogan način kao što funkcionira ljudski mozak i koje bi mogle
oponašati barem neke njegove funkcije, dok je drugi cilj njihova
primjena u rješavanju praktičnih problema.
Duboko učenje
• Polje je mašinskog učenja koje se bavi umjetnim neuronskim mrežama.
• Predstavlja tehniku mašinskog učenja koja računare uči da rade ono što je prirodno za ljude: učenje na primjeru.

 Zahtijeva velike količine označenih podataka.


 Zahtijeva značajnu računarsku snagu.

• Većina metoda dubokog učenja koristi arhitekture neuronskih mreža, zbog čega se modeli dubokog učenja često
nazivaju dubokim neuronskim mrežama.
• Izraz "duboko" obično se odnosi na broj skrivenih slojeva u neuronskoj mreži.

Neuronske mreže organizovane u slojevima


koji se sastoje od skupa međusobno povezanih čvorova.
Mreže mogu imati desetke ili stotine skrivenih slojeva.

CNN RNN LSTM RBM


Statičke neuronske mreže Dinamičke neuronske mreže
o Statičke neuronske mreže(engl. o Dinamičke ili rekurentne neuronske mreže
Feedforward neural networks) su (engl. Recurrent Neural Networks, RNN) LSTM NARX
najčešće korištene kada je riječ o sadrže dinamičke članove.
identifikaciji i upravljanju o Najčešća primjena im je u analizi vremenskih serija,
procesima, obradi signala te prepoznavanju govora i prepoznavanju rukopisa.
prepoznavanju lica i drugih oblika. o Zbog svoje dinamičke prirode, za razliku od statičkih neuronskih
o Nedostatak povratne veze ih čini mreža, sposobne su učiti kontekst.
strukturno stabilnima, što im je
glavna prednost u odnosu na
dinamičke neuronske mreže.

MLP RBF Opšta struktura dinamičke neuronske mreže


Jednoslojna MLP statička neuronska mreža
LSTM –Long Short-Term Memory
o Mreže s dugom kratkoročnom memorijom (engl. Long short-term memory, LSTM)
su podvrsta RNN-a koje su sposobne učiti dugoročne ovisnosti.
o Danas su široko rasprostranjene te ih koriste neke od najvećih svjetskih kompanija
kao što su Google, Apple, Amazon, Microsoft i Facebook.
o Umjesto da imaju jedan sloj neuronske mreže unutar ćelije, one imaju četiri sloja.
o Glavna ideja iza LSTM ćelije jest modifikacija stanja unutar ćelije.

Prikaz lančane strukture


LSTM mreže
Primjena dubokog učenja na tržište
o Predviđanje vremenskih serija modelirano je pomoću LSTM neuronske mreže te biblioteka
dionica
Tensorflow i Keras u programskom jeziku Python. Predmet rada je analiza i poređenje cijena dionica Apple
kompanije u odabranom periodu sa cijenama koje
su predviđene modelom neuronskih mreža.

Vrh pandas okvira podataka za Apple dionice

Zaključna cijena dionica


Apple kompanije
Kreiranje modela i treniranje

LSTM model

Greška nakon treniranja


PREDVIĐeni model
PRIBLIŽENI (ZOOMIRAN)
PREDVIĐENI MODEL
CNN i LSTM
o CNN -Znaju kako automatski izvući korisne karakteristike iz sirovih
podataka. Ovaj proces se zove učenje karakteristika. Sposobnost o RNN omogućava pokazivanje
izdvajanja karakteristika može se primijeniti na predviđanje vremenski dinamičkog
vremenskih serija. CNN može sirove ulazne podatke tretirati kao ponašanja. Koristi memoriju
jednodimenzionalnu sliku, a zatim ih pročitati i pohraniti kao važan za obradu sekvenci ulaznih
element. podataka promjenljive dužine.
Tabela: Postotak greške (gubitka)
Najpoznatiji RNN je LSTM.
kompanija lstm CNN Pored opštih prednosti koje
neuronske mreže imaju pri
INFOSYS 4.18 2.36 radu sa vremenskim serijama,
RNN nudi mogućnost učenja
TCS 7.82 8.96
vremenske ovisnosti iz ulaza i
cIPLA 3.94 3.63 može se dinamički mijenjati.
ZAKLJUČAK
o Danas se mnoga istraživanja
zasnovana na prognozi cijene
o Naprednije neuronske mreže, posebno dionica
Konvolucione neuronske mreže, istim bi principom sprovode koriteći CNN i LSTM,
postigle puno bolje rezultate što je dokaz kombinirajući prednosti obje mreže,
sposobnosti ove tehnologije i njenog potencijala na pa se jednim imenom zovu
tržištu dionica. hibridne neuronske mreže.
CNN je prepoznat kao najbolji model. Koristi Budući da razvoj naprednijih mreža
informacije date u određenom trenutku za zahtjeva veće investicije, vrijeme i
predviđanje. vještine, istraživanje se provelo
jednostavnijom LSTM mrežom.
o Neuronske mreže mogu biti moćan alat u analizi dionica, mogu smanjiti rizik investiranja,
a istodobno povećati efikasnost, samo je potrebna velika vještina i vrijeme da bi se mreža
adekvatno sagradila, specijalizirala te naučila da bi bila primjenjiva u praksi.
Hvala na
pažnji!

You might also like