You are on page 1of 20

VJEROJATNOST I STATISTIKA

Mjere disperzije ili rasipanja


MJERE DISPERZIJE ILI RASPRŠENOSTI

- Srednjim vrijednostima se bolje ili slabije predstavlja (opisuje) neki statistički skup
ovisno o stupnju varijabilnosti (promjenjivosti) njegovih elemenata.
- Ako je taj stupanj manji srednja vrijednost bolje prezentira skup i obrnuto.
- Za upoznavanje karakteristika podataka nije važno uočiti samo tendenciju gomilanja
podataka nego je značajna i informacija o stupnju njihove varijabilnosti.
- Moguće je da različiti skupovi podataka imaju jednake srednje vrijednosti, ali se
jako razlikuju po stupnju varijacija (raspršenosti) obilježja.

- Tu raspršenost zovemo disperzija ili rasipanje.


- Uobičajeno korištene mjere disperzije jesu: raspon varijacije, srednje
odstupanje, (interkvartil i koeficijent kvartilne devijacije - položajne mjere
disperzije), varijanca, iz nje izvedena mjera standardna devijacija i koeficijent
varijacije.

- Potpune mjere disperzije, odnosno mjere u čijem izračunu sudjeluju sve


vrijednosti (numeričke) varijable su: varijanca, standardna devijacija i
koeficijent varijacije, dok su ostale mjere nepotpune mjere disperzije.

- Raspon varijacije, interkvartil i standardna devijacija izraženi su u mjernim


jedinicama varijable za koju se izračunavaju, dok su ostale mjere izražene
relativno.

3
Raspon varijacije (rezultata)
Najjednostavnija (ali najnetočnija) mjera variranja oko neke srednje
vrijednosti je tzv. “raspon”, tj. razlika između najvećeg i najmanjeg
rezultata.
R  xmax  xmin

Osnovni nedostatak raspona je u tome što je on obično veći što je veći broj
mjerenja neke pojave.

Raspon varijacije koristi se kao prikladna mjera varijabilnosti cijena na


financijskim tržištima ili cijena općenito.

4
Prosječno apsolutno odstupanje
- Prosječna veličina odstupanja pojedinačnih rezultata (bez obzira na
smjer odstupanja) podijeljena sa brojem mjerenja.

Srednje odstupanje
 x x
i

gdje x  x
i označuje razliku svakog pojedinog rezultata od
aritmetičke sredine bez obzira na predznak.
- Grubi je pokazatelj razlikovanja rezultata od aritmetičke sredine (ili
neke druge srednje vrijednosti).

5
Varijanca?
Varijanca je prosječno kvadratno odstupanje vrijednosti numeričke
varijable X od njezine aritmetičke sredine.
Mjeri varijabilnost podataka i reprezentativnost aritmetičke sredine.
- Što je varijabilnost podataka veća, to je reprezentativnost prosjeka
manja i obrnuto.

 i
( x  x ) 2

Var   2  ( s ' ) 2  i 1
N
Pri izračunu varijance uobičajeno se koriste razvijeni izrazi:
N

 xi
2

Var    ( s ' ) 
2 2 i 1
N

 x
2

N = broj elemenata statističkog skupa

Varijanca kao mjera disperzije izražena je u kvadratima mjernih jedinica


varijable.
Stoga je potrebno izračunati standardnu devijaciju ( σ = s’), kao pozitivni
drugi korijen iz varijance.
Standardna devijacija
- Standardna devijacija je prosječno apsolutno odstupanje vrijednosti
numeričke varijable od njezine aritmetičke sredine.

Std  s '   Var    2

Std    s '
- Prosudba stupnja disperzije (rasipanja) olakšava se izračunavanjem
relativne mjere disperzije koja se naziva koeficijent varijacije.
- Koeficijent varijacije je omjer standardne devijacije i aritmetičke
sredine pomnoženo sa sto.

V  koeficijent / var ijacije  100(%)
x

- Koeficijent varijacije interpretira se kao prosječno relativno odstupanje


od prosjeka.
- Koeficijent varijacije najčešće poprima vrijednost iz intervala [0,100].
Što je bliže vrijednosti nula, to je disperzija podataka manja, a time i
reprezentativnost prosjeka veća.
- Koeficijent varijacije može poprimiti i vrijednost veću od 100%. To
ukazuje na veliku heterogenost podataka, odnosno na veliku disperziju.

- Tada aritmetička sredina nije reprezentativan pokazatelj. U tom slučaju


se preferiraju položajne srednje vrijednosti (mod i medijan).

- Postoji radno pravilo po kojem se vrijednost mjerena koeficijentom


varijacije većim od 30% smatra velikom, a reprezentativnost prosjeka
slaba.
x1 x1  x1 ( x1  x1 ) 2 x2 x2  x 2 ( x2  x 2 ) 2

90 90
x1  9 x1  9
10 10
Standardna devijacija 1. i 2. mjerenja je:

 x 
2
 x1 3
 1  s1  1
  0,3333  0,58
N1  1 9

 2  s2   x 2  x2  330
 36,67  6,06
N2 1 9

Standardna devijacija drugog mjerenja mnogo je veća od


standardne devijacije prvog mjerenja.

Standardna devijacija smije se računati samo uz aritmetičku


sredinu, a ne i uz druge srednje vrijednosti

12
- Koeficijent varijacije se tumači kao prosječno odstupanje vrijednosti
promatranog obilježja od aritmetičke sredine!
Primjeri: Izračunati ćemo koeficijent varijacije za rezultate 1. i 2.
mjerenja iz prethodnog primjera.

SD1 0,58
V1  100%  100  6,4%
x1 9
SD2 6,06
V2  100%  100  67,3%
x2 9

Koeficijent varijacije 2. mjerenja je znatno veći od koeficijenta


varijacije 1. mjerenja. To znači da su rezultati 2. mjerenja varijabilniji
od rezultata 1. mjerenja
13
- Varijanca, računata iz grupiranih podataka, predstavlja vaganu
aritmetičku sredinu kvadrata odstupanja vrijednosti obilježja od
njihove aritmetičke sredine.

 f i xi2
2
Var    ( s ' )
2 2
i
x
f i
i
Procjena varijance populacije
Procijenjena varijanca populacije je
N

 i
( x  x ) 2

Var   2  s 2  i 1
n 1
Procijenjena standardna devijacija je: N

 i
( x  x ) 2

 s i 1
n 1

Veza između standardne devijacije populacije i one izračunate za uzorak


je
𝑛−1
𝑠= ∙ 𝑠′
𝑛
Procjena varijance populacije

Za uzorke velikog opsega (za veliko n) s i s’ se gotovo ne razlikuju.

Za mali broj n , odnosno za male uzorke (n<30) razlika je značajna i ako


želimo izračunati varijancu, odnosno standardnu devijaciju populacije (s)
koristiti ćemo procjenu pomoću standardne devijacije uzorka koristeći
formulu koja povezuje s i s’.
Standardizirano obilježje

- Standardizirana vrijednost varijable ili standardizirano obilježje


primjenjuje se radi utvrđivanja položaja numeričkog podatka u nizu.
- Standardizirano obilježje neke vrijednosti statističkog skupa je njegovo
odstupanje od aritmetičke sredine izraženo u jedinicama standardne
devijacije.
xi  x
Zi 

za i = 1,2,...,N
Svojstva standardiziranog obilježja
- Aritmetička sredina standardiziranih vrijednosti z i jednaka je nuli

Z 0
- Varijanca i standardna devijacija standardiziranih vrijednosti zi
jednaka je jedan

Z 1
Na temelju standardiziranih vrijednosti moguće je usporediti relativni
položaj podataka u različitim numeričkim nizovima (s različitim
mjernim jedinicama i na različitim razinama vrijednosti).
Primjer: a) Analizirati pojedinačne uspjehe studenata po predmetima i
usporediti ih.
b) Usporediti varijabilnost broja bodova na ispitima iz predmeta A i B.
(podaci u tabicama)
Predmet A Predmet B

Aritmetička sredina
x A  57 x B  172

Standardna devijacija
 A  12  B  26
Student I
Broj bodova x1, A  81 x1, B  198
Standardizirana vrijednost 81  57 z1, B 
198  172
1
z1, A  2
broja bodova 12 26

Student II

Broj bodova xII , A  51 x II , B  185

Standardizirana vrijednost 51  57 185  172


z II , A   05 z II , B   0,5
broja bodova 12 26

Student I je bolje uradio ispit iz Predmeta A nego iz predmeta B jer


mu je standardizirana vrijednost za bodove iz predmeta A pozitivna i
veća nego standardizirana vrijednost za predmet B.

Student II je bolje uradio ispit iz Predmeta B nego iz predmeta A.

You might also like