Professional Documents
Culture Documents
ANS 04-Gmdfigd
ANS 04-Gmdfigd
Tačke podataka u vremenskim serijama prate paterne koji strogo zavise ne samo od broja i
promenljivosti snimljenih ulaza, već i od vremenske granuliranosti i osobina izabranih
sumarnih statistika. U ovoj nastavnoj jedinici ćemo se baviti paternima vremenskih serija i
tehnikama dolaženja do zaključaka na osnovu grafikona vremenskih serija. Analiziraćemo
anomalije u rezultatima monitoringa i njihove uzroke i prikazati anomalije koje se najčešće
javljaju.
Što je finija vremenska granuliranost, biće prikazan veći broj pikova u vremenskoj seriji,
dok će serije sa lošijom granulacijom prikazati manji obim promenljivosti vrednosti tačaka
podataka. Prikupljanjem više ulaza sa ekstremnim percentilima vodi do veće varijabilnosti
(veće fluktuacije) nego prikupljanje ulaznih podataka sa prosečnom vrednošću. Analiza
vremenskih serjia u kontekstu njihovih paterna je ključna za razumevanje njihovog
normalnog ponašanja i igra važnu ulogu u izboru prave strategije za sistem upozoravanja.
Pokazaćemo sada šta svaki patern predstavlja.
Objašnjenje
Spiky
Spiky („bodljikavi”) patern se često može pronaći u flow i throughput metrikama. Jedna od
ključnih osobina mu je da ima visoku varijabilnost, odnosno razuđenost ulaznih podataka
(podaci iznenada menjaju vrednosti ili kvantitet). Spiky paterni se najčešće koriste kod
metrika vezanih za merenje zauzeća bandwidtha, kao i na računarskim uređajima na kojima
se događaju iznenadne promene u stepenu njihovog korišćenja. Primer Spiky paterna je
prikazan na slici 4.1.
Interpretacija anomalija
„Vrhovi” i „depresije” takođe imaju suprotan smisao, ali je za povratak vremenske serije u
prvobitno stanje, potrebno mnogo više tačaka podataka. Zbog toga mogu da iniciraju
različite progresivne paterne: iznenadne skokove sa konstantnom tendecijom, linearni
rast/pad ili eksponencijalni rast i pad.
Flow (tok)
Flow evidentira zajedničke osobine za više događaja. n statistika opisuje nivoe tokova,
odnosno broj dolaznih događaja po jednom vremenskom intervalu. Uzmimo ponovo u
razmatranje zahteve koji dolaze na web server i njihovo vreme odziva. n statistika pirkazuje
nivoe saobraćaja. Nagla rasutost i uzvišenja mogu da budu atributi povećane korisničke
aktivnosti. U skladu sa tim, nemaju svi zahtevi istu cenu. Zbir vremena svih zahteva može
da se predstavi kao ukupna cena operacije, izražena u satima obrade. Prosek (avg) je
srednja vrednost potrebnog vremena za obradu zahteva. Nestabilan prosek ukazuje na
promene u raspodeli ulaznih vrednosti, najčešće na usporavanje obrade dela zahteva. Takve
promene se najbolje uočavaju korišćenjem percentila visoke vrednosti, kao što su p95 ili
p99. Njihove eksponencijalno visoke vrednosti otkrivaju nedostatke u resursima ili
prezauzeće bandwidtha. Ukoliko je reč o ranijim rezultatima, „uzvišenja” prikazana pomoću
p99 percentila bi trebalo poravnati sa „uzvišenjima” zbirnih rezultata (ukupna vremena
obrade) i osnovnim statistikama korišćenja resursa. Iako prosek može da bude deformisan
od strane obrađenih sporih zahteva, p50 na relevantan način opisuje realno korisničko
iskustvo.
Razlog zbog koga se promene raspodele češće prikazuju na višem nego na nižem nivou
percentila je taj što većina metrika ima „tvrde” granice za donje vrednosti. U isto vreme,
ne postoje ograničenja za gornje vrednosti. Uzmimo kao primer kašnjenja u mreži.
Najniža vrednost je mala onoliko koliko zakoni fizike to dozvoljavaju, dok ne postoji
ograničenje koje sprečeva da odziv traje proizvoljno dugo.
Stock (akumulacija)
Tip brojač (counter) je specijalni slučaj stock količine, u kome se regularni prilivi prihvataju,
ali se odliv sprovodi s vremena na vreme kako bi se brojač resetovao na nulu. Kako je stock
metrika single-N, ona ne koristi nijednu sumarnu statistiku. Proračunavanje stope promena
korišćenjem brojača formira vremenske serije za Flow, opisujujući stopu po kojoj se brojač
uvećava.
Drugi primer bi mogla da bude grupa servera koja zahteva redovno održavanje, što
podrazumeva određene intervencije bar jednom u 7 dana, ali može da se odigrava i češće.
Kako bi se vodila evidencija o vremenu proteklom od poslednje intervencije, moguće je
evidentirati razliku između trenutnog time stampa i time stampa kada je poslednja
intervencija završena. Alarm je potrebno postaviti po metrici sumarne statistike, sa
okidačem na 604800 sekundi, što će aktivirati upozorenje o isteku definisanog perioda kada
je potrebno ponovo sprovesti aktivnosti održavanja.
Availability je specijalan slučaj Flow metrike u kome ulazni podaci uzimaju dve moguće
vrednosti: 1 ili 0, u zavisnosti da li je rezultat uspešan ili neuspešan, respektivno. Kada
suma svih prikupljenih ulaza bude jednako raspodeljena po broju tačaka podataka, tačka
podataka uzima deo vrednosti, prikazujući dostupnost izraženu u procentima. Na primer,
ako 16 od 20 proba vrati uspešan rezultat i 4 vrate neuspešan, prosečna dostupnost za te
ulazne podatke će biti:
Throughput
Tabela 1.
Ukoliko u ovoj fazi pronađete nešto što može da ukaže na koren problema – odlično.
Ali, zapamtite da samo upoređivanje ne ukazuje nedvosmisleno na uzrok problema,
što nas vodi ka sledećem koraku.
U ovoj fazi bi trebalo da identifikujete jedan ili više potencijalnih uzroka problema
među komponentama sistema.
Kada merite progresiju zahteva, trebalo bi da isključite manje značajne varijable, koje su
prisutne u metrikama zauzeća resursa. Ove varijable obuhvataju veličinu resursa, tip
hardvera, efikasnost sosftvera itd.
Tokovi podataka koji nisu real-time mogu da odlože izvršenje viška zadataka za kasnije,
tako da su problemi najizražajniji kod interaktivnih sistema, kao što su veb-sajtovi, baze
podataka i slično.
Svi informacioni sistemi prate 24-časovni ciklus, od pika do minimuma. Veoma je važno doći
do informacije o tačnom vremenu kada sistem ulazi i kada napušta period najintenzivnijih
aktivnosti. To je period kada je sistem najproduktiniji, ali u isto vreme i najranjiviji. Sve
zadatke održavanja bi trebalo pokretati u „tihom” periodu – periodu kada u sistemu postoji
najmanje aktivnosti.
Osim dnevne fluktuacije, potrebno je analizirati i nedeljne promene. Zauzeće sistema tokom
vikenda će se verovatno razlikovati od zauzeća radnim danima. Patern strogo zavisi od
prirode sistema, ali i ljudskih faktora. Na primer, sistemi koji funkcionišu u kompanijama
čija je aktivnost zasnovana isključivo na funkcionisanju radnim danima tokom radnih dana
pokazavaće veće opterećenje, dok će sistemi koji funkcionišu u kompanijma čija aktivnost
traje 24/7 (na primer tehnička podrška) pokazati konstantno zauzeće tokom cele sedmice.
Rezime
• Što je finija vremenska granuliranost, biće prikazan veći broj pikova u vremenskoj
seriji, dok će serije sa lošijom granulacijom prikazati manji obim promenljivosti
vrednosti tačaka podataka. Prikupljanjem više ulaza sa ekstremnim percentilima vodi
do veće varijabilnosti (veće fluktuacije) nego prikupljanje ulaznih podataka sa
prosečnom vrednošću.
• Flow evidentira neke osobine koje poseduje više događaja. n statistika opisuje nivoe
tokova, odnosno broj dolaznih događaja po jednom vremenskom intervalu. Vrednosti
stocka evidentiraju informacije o kapacitetima određenih nivoa. Mogu da se odnose
na skladište, memoriju ili na apstraktne konstrukcije kao što su softverski redovi
čekanja. Stock metrike su, same po sebi, single-N tako da je suma njihova jedina
validna statistika. Tip brojač (counter) je specijalni slučaj stock količine, u kome se
regularni prilivi prihvataju, ali se odliv sprovodi s vremena na vreme kako bi se
brojač resetovao na nulu. Availability je specijalan slučaj Flow metrike u kome ulazni
podaci uzimaju dve moguće vrednosti: 1 ili 0, u zavisnosti od toga da li je rezultat
uspešan ili neuspešan, respektivno. Throughput metrike evidentiraju intenzitet
korišćenja resursa i prikazuju se kao prosečne jedinice protoka za određeni
vremenski period ili kao procenat ukupnog korišćenja resursa po intervalu. Anomalije
koje se najčešće sreću su:
o efekat izravnanja,
o efekat zagrevanja,
o redovne anomalije,
o pikovi u podnožjima talasa.
1. pronalaženje povezanosti,
2. uspostavljanje veze,
3. isključivanje kontradiktornih faktora.