You are on page 1of 6

Analiza metrika

Dobro razumevanje podataka prikazanih u metrikama je od suštinskog značaja za


donošenje pravilnih zaključaka na osnovu grafika vremenskih serija podataka.
Prepoznavanje kojoj kategoriji metrika pripadaju rezultati i odakle potiču njihovi podaci je
od velike pomoći pri identifikovanju uzroka zbog kojih nastaju odstupanja od paterna, kao i
u prikazivanju informacija na jasan način. Neke sumarne statistike daju bolji uvid od drugih,
tako da prikazi istih podataka mogu da budu različiti kada se prikazuju različitim
granularitetom. Razumevanje ovih razlika pomaže u konstruisanju grafika koji će
verodostojno predstaviti suštinu. Ova nastavna jedinica će detaljno predstaviti vrste metrika
prikazom njihovih osnovnih osobina. Uvid u metrike, na ovaj način, trebalo bi da vas nauči
kako da dođete do relevantnih pretpostavki o podacima i njihovima izvorima, kao i da
razumete promene u ponašanju metrika.

Tipovi jedinica

Svaka metrika monitoringa može da bude predstavljena na tri načina, u zavisnosti od tipa
jedinica koji su u njoj zastupljeni. Tipovi jedinica mogu da budurazličiti.

• Količina ‒ skup diskretnih ili kontinuiranih vrednosti koje su rezultat ulaza. Primer
mogu da budu brojna poklapanja (izražena numerički) koja su rezultat pretrage,
prikazi veličine paketa ili slobodnog prostora na disku. Ova grupa metrika je
najčešća. Rezultujući podaci, iscrtani u vremenskim serijama, prikazuju operativni
tok i stanja. Iznosi se obično evidentiraju na svim nivoima softverskog stacka.
Jedinice mogu da budu: bajtovi, paketi, broj vraćenih poruka itd.

• Vreme – period potreban za kompletiranje neke akcije. Primeri mogu da budu:


kašnjenje (latenca), vreme potrebno za odgovor na web upit, ICMP round-trip period
vreme provedeno od strane korisnika na nekom sajtu itd. Kao i kod količine, period
se beleži na svim nivoima i igra ključnu ulogu u nadgledanju performansi, zbog toga
što vreme odziva ima direktan uticaj na kreiranje korisničkog iskustva. Rezultujuće
tačke podataka su skoro uvek skup više različitih ulaza, koji su se dogodili u datom
periodu. Jedinice mogu da budu: milisekunde, sekunde, minuti, sati, dani, CPU
ciklusi i sl.

• Količina po vremenu – diskretne ili kontinuirane količine koje „teku” kroz sistem po
jedinici vremena i najčešće se odnose na protok, kao što su na primer bit rate i
Input/Output Operations per Seconds (IOPS). Ovakve metrike su dobre za
monitoring malih podataka (čija veličina se izražava u bitovima), a koji se produkuju
u velikoj količini, sa visokim potencijalom menjanja vrednosti tokom vremena.
Najčešće se koristi za metrike nižeg nivoa, kao što su statistike hardverskih uređaja.
Uobičajeno, osnovni hardverski uređaji imaju ugrađeni mehanizam za praćenje i
izveštavanje o toku protoka. U takvim slučajevima, metrike koje su zasnovane na
količini po vremenu, prikazuju jedan ulaz po tački podataka. To znači da je uređaju
poslat jedan upit za njegovo stanje u datom periodu. U drugim slučajevima, gde
postoji više dostupnih ulaza po jednoj tački podataka, promenljivost protoka može da
se posmatra kroz raspodelu ulaza korišćenjem percentila, kao u slučaju prethodna
dva tipa.

Copyright © Link group


Prikažimo opisane tipove jedinica kroz primer u kome se šalju upiti na web server. Web
server prihvata HTTP zahteve i vraća odgovor za svaki od njih, gde vraćanje odgovora
zahteva određenu količinu vremena. Trajanje izdavanja odgovora zavisi od veličine zahteva.
Pretpostavimo da server može da prihvati do 15 istovremenih zahteva i da je za obradu
svakog zahteva u proseku potrebno 200 ms. Zahtevi mogu da pristignu u različitim
trenucima i njihovo trajanje može da bude različito, ali pretpostavimo da je kapacitet
servera takav da može da prihvati 75 zahteva po sekundi. U ovom slučaju, sva tri tipa
metrika mogu da nađu svoju primenu.

• Količina: veličina upita ili zapis veličine svih upita izražen u bajtovima. Metrika može
da bude tumačena u kontekstu više sumarnih statistika:

o zbir svih ulaza otkriva ukupnu količinu dolaznih podataka od strane korisnika;
ova informacija može da bude korišćena kasnije, na primer, za formiranje
cene usluga;
o statističke funkcije avg, p0, p50 i p100 nose informacije o promenljivosti
veličine zahteva u smislu prosečne, najmanje, uobičajene i najveće vrednosti,
respektivno.

• Vreme: vreme odgovora ili količina vremena potrebna da zahtev bude kompletiran.
Sumarne statistike koje mogu da budu od interesa u ovom slučaju su prosečna
vrednost, od kojih fluktuacija otkriva nagle promene u osnovnoj raspodeli i p99, koja
sadrži vreme 1% najsporijih zahteva.

• Količina po vremenu: broj zahteva po sekundi, odnosno efektivni protok pristiglih


zahteva. Pod pretpostavkom da su ulazi mereni svake sekunde u cilju izgradnje
jednominutnih vremenskih tačaka, p100 otkriva maksimalan broj zahteva po
sekundi. Kada se ovaj broj približi definisanoj granici od 75 zahteva po sekundi,
moguće je uočiti degradaciju korisničkog iskustva – u nedostatku mehanizma
čekanja, svi zahtevi preko definisane granice će biti odbijeni, tako da će korisnici
morati ponovo da pošalju zahteve.

U prikazanom primeru postoji jaka veza između ova tri tipa metrika. Prva dva su pozitivno
povezana: što je više zahteva, duže je vreme odgovora. Metrika količine po vremenu i
preostale dve metrike su negativno povezane: što je više zahteva, i samim tim, duži period
odgovora, manji je broj zahteva po sekundi koji mogu da budu prihvaćeni.

Režim prikupljanja podataka

Agenti za prikupljanje podataka mogu da funkcionišu u dva režima – aktivni i pasivni, u


zavisnosti od akcija koje se preduzimaju za ekstrakciju podataka.

Aktivni režim

Aktivno posmatranje entiteta podrazumeva proaktivno pokretanje test zahteva, kako bi se


došlo do informacija o stanju entiteta. U takve primere spadaju ICMP ping zahtevi ili HTTP
GET health probe. Aktivni monitoring uvodi pojam overheada u cenu koštanja sistemskih
operacija. Overhead se obično, sam po sebi, ne posmatra, ali bi administrator zadužen za
monitoring trebalo da bude svestan proporcije novonastalih troškova (zbog overheada) i
ukupnih troškova standardnih sistemskih operacija. Uvek kada je to moguće, uticaj
monitoringa na stanje sistema bi trebalo držati na što nižem nivou.

Copyright © Link group


Pasivni režim

U pasivnom monitoring agent posmatra protok podataka i formira statistike bez uticaja na
sistem i bez formiranja dodatnih troškova. U posmatranoj mreži podaci se dobijaju čitanjem
statistika iz mrežnih uređaja i korišćenjem snifera. Rezultujuće informacije povećavaju broj
prenetih paketa i menjaju proporciju saobraćaja u OSI modelu.

Izvori podataka

Drugi način za klasifikaciju merenja je na osnovu mesta gde se nalazi agent za prikupljanje
podataka i po toj podeli postoje dve klasifikacije – interni izvori i eksterni izvori.

Interni

Merenja se vrše u okviru sistema (log podaci, statistički podaci uređaja). Ulazni podaci se
prikupljaju interno, uz pomoć agenata koji se izvršavaju kontinuirano ili u specificiranim
intervalima, a statistički izveštaji se dobijaju iz sistemskog interfejsa kao što je /proc fajl
sistem u Linuxu. Centralizovani monitoring sistemi mogu da dođu do podataka i u režimu
bez korišćenja agenata, otvaranjem SSH sesije sa centralne lokacije do skupa posmatranih
hostova u cilju čitanja statistika i njihove lokalne interpretacije.

Eksterni

Merenja i kreiranje izveštaja se vrše od strane eksternog entiteta. Eksterni posmatrači


najčešće funkcionišu u aktivnom režimu kako bi postigli dostupnost, ali isto tako mogu
pasivno da posmatraju protok podataka (na primer, inspekcija i klasifikacija saobraćaja kroz
mrežne snifere).

Broj ulaza po jednoj tački podataka

Metrička merenja mogu da budu razvrstana u dve potkategorije na osnovu broja ulaza
potrebnih za formiranje tačke podataka i same prirode merenja. Te potkategorije su Multi-N
I Single-N ili 1-N.

• Multi-N. Tačke podataka za multi-N metrike su sumarne statistike, kombinovane iz


više procesiranih ulaza. Ulazi se agregiraju i rezultujuća tačka podataka sadrži ceo
skup korisnih sumarnih statistika, koje opisuju kumulativne efekte (sum, n), tipične
veličine (prosečna vrednost, medijana) i raspodelu podataka (percentili). Primer
mogu da budu bajtovi podataka transportovanih kroz mrežu, broj HTTP zahteva,
prosečno vreme provedeno na sajtu, kao i p99 za proteklo vreme do odgovora.

• Single-N ili 1-N. Tačke podataka za ove metrike zahtevaju samo jedan ulaz u cilju
konstruisanja same tačke koja će imati smisao. U većini slučajeva metrika prikazuje
promenu stanja tokom vremena. Iako šema tačke podataka može da sadrži ceo skup
sumarnih statistika, samo jedna snimljena vrednost će im biti dodeljena, a n će imati
vrednost 1. Primeri za to su IOPS, zauzeće CPU resursa i brojanje poruka.

Copyright © Link group


Pitanje

Koliko režima prikupljanja podataka postoji?

a. dva
b. tri
c. pet
d. 1-N

Objašnjenje
Agenti za prikupljanje podataka mogu da funkcionišu u dva režima – aktivni i pasivni, u
zavisnosti od akcija koje se preduzimaju za ekstrakciju podataka.

Vrste količina

Metrike takođe mogu da budu tumačene i na osnovu tipa količine koju predstavljaju.

• Flow (tok). Ovaj tip metrike snima događaje i njihove osobine. Flow snima različit
broj ulaza po intervalu (zbog toga je multi-N). Podaci se dobijaju iz više izvora i
nakon agregacije se sumiraju. Visoka promenljivost ulaznih vrednosti omogućuje
posmatraču da dođe do zaključaka na osnovu raspodele ulaza. Visoke vrednosti ili
ekstremni percentili su rani pokazatelji promena, a neki čak mogu u toj fazi da budu
interpretirani i kao upozorenja. Primer za ovaj tip metrike mogu da budu: veličine
poslatih podataka, potrebno vreme za odgovor na svaki zahtev i sl.

• Throughput (protok). Ova metrika meri nivo procesiranja u određenom


vremenskom periodu. Throughput (protok) metrika snima kontinuiranost i intenzitet
toka (flow). Rezultati se prikazuju kao količina po jedinici vremena, pa na taj način
predstavljaju i nivoe zauzeća resursa. Zbog toga što granice protoka mogu da budu
relevantno testirane i precizno definisane, ovaj tip metrike se koristi za formiranje
alarma kada se javi zasićenje u korišćenju resursa i pronalaženju uskih grla. Primeri
su bit rate i IOPS.

• Stock (akumulacija). Prikazuje akumulirane vrednosti u određenom vremenskom


trenutku. Stock metrike pripadaju single-N potkategoriji. One snimaju jedan ulaz
podataka po intervalu tačke podataka. Tačke podataka se prikazuju u jednostavnim
kvantitativnim jedinicama i reprezentuju ukupnu akumuliranu vrednost. Nivoi
akumulacije mogu da budu promenjeni od strane procesa koji se snimaju od strane
flow metrika, a intenzitet ovih promena se prikazuje pomoću throughput metrika.
Primeri ovakvih metrika su zauzeće memorije, slobodan prostor na disku, dužine
redova čekanja, temperatura itd.

• Availability (dostupnost). Koriste se za određivanje stepena u kome je moguće


očekivati dobijanje rezultata. Izvori podataka koji predstavljaju ulaz u metrike
dostupnosti su probe – proaktivno poslati zahtevi, koji u slučaju prijema očekivanog
odgovora vraćaju da je rezultat uspešan ili suprotno, da je rezultat neuspešan. Probe
mogu da budu interne ili eksterne. Kao multi-N metrika sa malom promenljivošću
ulaznih vrednosti (1 – uspešno, 0 – neuspešno), njena prosečna vrednost ulaza daje
informaciju o dostupnosti izraženu u procentima (vrednosti mogu da budu od 0.0 do
1.0, odnosno od 0% do 100%). Primer za ovakvu metriku mogu da budu ICMP ping

Copyright © Link group


sistemskog interfejsa. Centralizovani monitoring sistemi mogu da dođu do podataka i
u režimu bez korišćenja agenata. U slučaju eksternih izvora, merenja i kreiranje
izveštaja se vrše od strane eksternog entiteta. Eksterni posmatrači najčešće
funkcionišu u aktivnom režimu kako bi postigli dostupnost, ali isto tako mogu
pasivno da posmatraju protok podataka.

• Metrička merenja mogu da budu razvrstana u više potkategorija na osnovu broja


ulaza potrebnih za formiranje tačke podataka i same prirode merenja. Te
potkategorije su:

o Multi-N. Tačke podataka za multi-N metrike su sumarne statistike kombinovane


iz više procesiranih ulaza.

o Single-N ili 1-N. Tačke podataka za ove metrike zahtevaju samo jedan ulaz u
cilju konstruisanja sam tačke, koja će imati smisao.

• Metrike takođe mogu da budu tumačene i na osnovu tipa količine koju predstavljaju.

o Flow (tok). Ovaj tip metrike snima događaje i njihove osobine. Flow snima
različit broj ulaza po intervalu (zbog toga je multi-N).

o Throughput (protok). Ova metrika meri nivo procesiranja tokom određenog


vremenskog perioda. Throughput snima kontinuiranost i intenzitet toka (flow).

o Stock (akumulacija). Prikazuje akumulirane vrednosti u određenom


vremenskom trenutku.

o Availability (dostupnost). Koriste se za određivanja stepena u kome je


moguće očekivati dobijanje rezultata.

Copyright © Link group

You might also like