4 PDF

You might also like

You are on page 1of 30

4.

MJERE DISPERZIJE

Josipa Perkov, prof., pred. 1


 Kod mnogih mjerenja se može opaziti da se rezultati grupiraju
i skupljaju oko jedne srednje vrijednosti
 Srednja vrijednost dobro reprezentira rezultate ako su vrijednosti
gusto grupirane (malo se razlikuju) oko srednje vrijednosti
 Srednja vrijednost loše reprezentira rezultate ako su vrijednosti
minimalno grupirane oko srednje vrijednosti

 srednju vrijednost prikupljenih podataka potrebno je nadopuniti


pokazateljem njihove raspršenosti (disperzije)
 mala vrijednost pokazatelja disperzije znači da je izračunata
srednja vrijednost bolji reprezentant skupa podataka i obrnuto
Josipa Perkov, prof., pred. 2
 najpoznatije mjere disperzije:
(1) apsolutne mjere disperzije:
 raspon varijacije obilježja
 varijanca i standardna devijacija
 interkvartil

(2) relativne mjere disperzije:


 koeficijent varijacije
 koeficijent kvartilne devijacije

Josipa Perkov, prof., pred. 3


4.1. RASPON VARIJACIJE (RV)
 Najjednostavnija mjera disperzije (koriste se samo 2
vrijednosti)

 Za niz od N negrupiranih kvantitativnih podataka RV dan


je izrazom:
Rx = xmax − xmin
 RV jednak je nuli kad nema disperzije

 RV u distribuciji frekvencija diskretne numeričke varijable


je razlika između posljednje i prve vrijednosti
Rx = xk − x1
Josipa Perkov, prof., pred. 4
 RV distribucije frekvencija s razredima može se odrediti
ako je poznata najveća i najmanja vrijednost varijable

 raspon se aproksimira kao razlika gornje granice


posljednjeg i donje granice prvog razreda ili kao razlika
razredne sredine posljednjeg i prvog razreda

 kod takvih distribucija frekvencija određivanje RV je


nepouzdano

Josipa Perkov, prof., pred. 5


PRIMJER 1.

Prilikom dva puta po 10 mjerenja neke pojave, dobivena su


2 niza rezultata (rezultati su poredani po veličini)

1. mjerenje: 8 8.5 8.5 9 9 9 9 9.5 9.5 10


2. mjerenje: 1 2 3 5 9 9 13 15 16 17

Izračunajte aritmetičku sredinu i raspon varijacije za oba


mjerenja. Interpretirajte rezultat.

Josipa Perkov, prof., pred. 6


4.2. INTERKVARTIL I KOEFICIJENT
KVARTILNE DEVIJACIJE
 Kvantili su vrijednosti numeričke varijable koji niz uređen
po veličini dijele na q jednakih dijelova

 Broj kvantila p je za jedan manji od njegova reda q , pr.


medijan je kvantil reda q = 2 ⇒ p = 1 (dovoljna je jedna
vrijednost da se niz podijeli u dva jednakobrojna dijela)

 Kvartili su kvantili koji dijele niz na 4 jednaka dijela,


decili su kvantili reda 10, percentili su kvantili reda 100, ...

Josipa Perkov, prof., pred. 7


Postoje 3 kvartila: prvi (donji) kvartil, drugi kvartil (medijan) i
treći (gornji) kvartil

N/4 N/2 3N/4


Xmin Xmax

Q1 Me Q3

25% 25%

Josipa Perkov, prof., pred. 8


 TUMAČENJE KVARTILA:

 Donji kvartil je vrijednost varijable koja članove niza dijeli u dvije


skupine
 U 1. skupini se nalazi ¼ (25%) elemenata s vrijednostima varijable koja
je jednaka ili manja od kvartila
 U 2. skupini su ¾ (75%) članova s većim vrijednostima od kvartila

 Treći kvartil je vrijednost varijable koja dijeli niz na 2 dijela


 U 1. skupini se nalazi ¾ (75%) elemenata s vrijednostima varijable
koja je jednaka ili manja od kvartila
 U 2. skupini su ¼ (25%) članova s većim vrijednostima od kvartila

 Drugi kvartil jednak je medijanu


Josipa Perkov, prof., pred. 9
INT je oznaka
za “cijeli dio
razlomka”
 ODREĐIVANJE KVARTILA:

1. Uređivanje niza po veličini,


2. Pronalaženje članova s određenim rednim brojevima
donji kvartil:  N N
 xr , 4 ≠ INT , r = INT  4  + 1
Q1 =   
 xr + xr +1 , N = INT , r = N
 2 4 4

gornji kvartil:  3N  3N 
 xr , 4 ≠ INT , r = INT  4  + 1
Q3 =   
 xr + xr +1 , 3 N = INT , r = 3N
 2 4 4
Josipa Perkov, prof., pred. 10
PRIMJER 2.

Promatramo dob zaposlenih u poduzeću X, stanje 31.12.2007.


xi : 28 23 59 25 23 20 31 48 32 god.

Odredite donji i gornji kvartil.

Josipa Perkov, prof., pred. 11


Uredimo prvo zadani niz:
20 23 23 25 28 31 32 48 59

Donji kvartil:
N = 9 ⇒ 9 / 4 ≠ INT ⇒ Q1= xr , r = INT(9/4) + 1 = 2 + 1 = 3
Dakle, prvi kvartil je x3 , odnosno 23 godine (25% zaposlenih je
mlađe ili jednako dobi od 23 godine, a 75% zaposlenih je starije ili
jednako dobi od 23 godine)

Gornji kvartil:
N = 9 ⇒ (3N / 4) ≠ INT ⇒ Q3= xr , r = INT(27/4) + 1 = 6 + 1 = 7
Gornji kvartil je x7 , odnosno 32 godine (75% zaposlenih je mlađe
ili jednako dobi od 32 godine, a 25% zaposlenih je starije ili
jednako dobi od 32godine)

Josipa Perkov, prof., pred. 12


Izraz za određivanje Izraz za određivanje
donjeg kvartila gornjeg kvartila
distribucije frekvencija distribucije frekvencija

N 3N
− ∑ f1 − ∑ f1
Q1 = L1 + 4 ⋅i Q3 = L1 + 4 ⋅i
f k var f k var

L1 označava donju granicu razreda u kojemu se nalazi donji


(gornji) kvartil,

Σ f1 označava zbroj frekvencija do kvartilnog razreda,

f kvar je oznaka za frekvenciju kvartilnog razreda


Josipa Perkov, prof., pred. 13
PRIMJER 3.

Tabela. Gradovi prema broju izgrađenih stanova

Broj izgrađenih
Broj gradova
stanova
50 – 150 5 Odredite donji i gornji kvartil.
150 – 250 8 Interpretirajte rezultate.
250 – 350 6
350 – 450 4
450 – 550 2
550 – 650 1
Ukupno 26

Josipa Perkov, prof., pred. 14


Donji kvartil: 26/4 ≠ INT ⇒ r = INT(26/4) + 1 = 6 + 1 = 7
Gornji kvartil: r = INT (3·26 / 4) + 1 = 19 + 1 = 20

Broj izgrađenih Razredna Kumulativni niz


Broj gradova
stanova sredina “manje od”

50 – 150 5 100 5
150 – 250 8 200 13
250 – 350 6 300 19
350 – 450 4 400 23
450 – 550 2 500 25
550 – 650 1 600 26

Ukupno 26 - -

Josipa Perkov, prof., pred. 15


Što je interkvartil
brojčano manji disperzija
će biti manja i obrnuto

 Interkvartil (oznaka: Iq) je apsolutna mjera disperzije


koja pokazuje veličinu raspona varijacije središnjih 50%
podataka uređenog numeričkog niza – iz razmatranja se
isključuje po 25% najmanjih i najvećih vrijednosti obilježja

 Računa se kao razlika između gornjeg i donjeg kvartila


Iq = Q3 – Q1

 Nije potpuna mjera disperzije jer se za njegovo računanje


koriste samo dvije vrijednosti

Josipa Perkov, prof., pred. 16


 Može se izračunati i koeficijent kvartilne devijacije (oznaka Vq)
Q3 − Q1
Vq = , 0 ≤ Vq ≤ 1
Q3 + Q1

 Disperzija je to manja što je Vq bliže nuli, a relativno veća


što se više približava jedinici

 Izračunajte interkvartil i koeficijent kvartilne devijacije u


primjeru 3. Interpretirajte rezultat.

Josipa Perkov, prof., pred. 17


4.3. VARIJANCA, STANDARDNA DEVIJACIJA
I KOEFICIJENT VARIJACIJE

 Razlike između vrijednosti numeričke varijable i njezine AS


pokazivat će stupanj varijacije (što su razlike veće veći je i
stupanj varijabilnosti i obrnuto)

 Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti


numeričke varijable X od njezine aritmetičke sredine, a za
negrupirane podatke računamo je po formuli:

1 N
1 N

2
ili 1 N
1 N

2

2
σ = ∑ 2
xi − 
N
∑ xi 

2 2
σ =b  ∑ 2
di − 
N
∑ di 


N i =1 i =1  N i =1 i =1 
Napomena: Umjesto apsolutnih, pri računanju varijance dopuštena je
upotreba i relativnih frekvencija
Josipa Perkov, prof., pred. 18
kao brza kontrola nam može poslužiti odnos
između raspona i standardne devijacije: taj odnos
gotovo nikad nije manji od 2 ili veći od 6.5

 Radi lakše prosudbe stupnja varijabilnosti obilježja definira


se standardna devijacija kao pozitivni drugi korijen iz
varijance:
2 2
1 N
1 N
 1 N
1 N

σ=
N

i =1
2
xi − 
N

i =1
xi

ili σ =b
N

i =1
2
di − 
N

i =1
d i

 Standardna devijacija je prosječno odstupanje vrijednosti


numeričke varijable od njezine aritmetičke sredine – smije se
računati samo uz AS

Josipa Perkov, prof., pred. 19


Simbol xi označava originalne vrijednosti
obilježja (ako su formirane grupe) ili njihove
procjene, tj. vrijednosti razrednih sredina

 Varijanca distribucije frekvencija diskretne numeričke varijable je


vagani prosjek kvadrata odstupanja vrijednosti te varijable od
njezine AS:

1 N
1 N 2
 1 N
1 N

2

σ2 = ∑ f i xi 2 −  ∑
2 2
f i xi  ili σ = b  ∑ 2
fi di − 
N
∑ fi di 


N i =1 N i =1   N i =1 i =1 

 Varijanca i iz nje izvedena standardna devijacija je najvažnija


mjera disperzije (potpuna mjera disperzije) – kad su poznate AS i
standardna devijacija nekih rezultata, onda su ti rezultati potpuno
definirani

Josipa Perkov, prof., pred. 20


Reprezentativnost AS je vrlo velika
ako je koef. varijacije ispod 20%

 Kad su nam poznate aritmetička sredina i standardna devijacija


nekih rezultata tada ih možemo uspoređivati s drugim
rezultatima – koeficijent varijacije

 Koeficijent varijacije je omjer standardne devijacije i


aritmetičke sredine pomnožen sa sto, tj. pokazuje koliki postotak
vrijednosti AS iznosi vrijednost standardne devijacije:

σ
V= ⋅100
x
 Koeficijent varijacije je relativna mjera disperzije
Josipa Perkov, prof., pred. 21
PRIMJER 4.

Statistički skup čini 30 učenika jednog razreda, a promatrano


obilježje je uspjeh učenika. Dobiveni su ovi podaci:

4 3 4 3 1 3 4 3 3 3
2 4 1 5 3 4 1 3 3 1
3 5 4 3 1 4 5 4 1 3

a) Sastavite tablicu distribucije frekvencija


b) Nacrtajte histogram frekvencija
c) Izračunajte aritmetičku sredinu, varijancu, standardnu
devijaciju i koeficijent varijacije

Josipa Perkov, prof., pred. 22


PRIMJER 5.

Izračunajte prosječnu starost radnika poduzeća X, varijancu


i standardnu devijaciju za podatke navedene u tabeli:

godine starosti broj radnika


xi fi
18 - 20 2
20 - 22 5
22 - 28 6
28 - 32 4

Josipa Perkov, prof., pred. 23


4.4. STANDARDIZIRANA VARIJABLA.
PRAVILO ČEBIŠEVA

 Da bi se utvrdio položaj numeričkog podatka u nizu primjenjuje


se standardizirana vrijednost varijable ( z – obilježje)

 Standardizirano obilježje je odstupanje vrijednosti numeričkog


obilježja od aritmetičke sredine izraženo u jedinicama
standardne devijacije:
xi − x
zi = , i = 1, 2,..., N
σ

 Budući da standardizirano obilježje ne ovisi o mjernim


jedinicama, može poslužiti za usporedbu položaja podataka u
raznovrsnim nizovima
Josipa Perkov, prof., pred. 24
PRIMJER 6.

Prosječna plaća u poduzeću A iznosi 6.000,00 kn s prosječnim


odstupanjem od 1.000,00 kn. U poduzeću B prosječna plaća
iznosi 10.000,00 kn s prosječnim odstupanjem od 2.000,00 kn.

Usporedite relativni položaj osobe s plaćom 8.000,00 kn u


poduzeću A s položajem osobe s plaćom od 11.500,00 kn u
poduzeću B

Josipa Perkov, prof., pred. 25


 Usporedimo relativni položaj osobe s plaćom od 8.000,00 kn u
poduzeću A s položajem osobe s plaćom od 11.500,00 kn u
poduzeću B

xA − x A 8000 − 6000
zA = = =2
σ 1000

xB − xB 11500 − 10000
zB = = = 0.75
σ 2000

Obje osobe imaju iznadprosječnu plaću. Osoba iz poduzeća A u


relativno je povoljnijem položaju na platnoj listi od osobe B, jer
njezina plaća odstupa od prosjeka za + 2 standardne devijacije
Josipa Perkov, prof., pred. 26
PRIMJER 7.

Prosječni ostvareni ukupni godišnji prihod iznosio je 200


milijuna kn s prosječnim odstupanjem od 10 milijuna kn.
Prosječna stopa dobiti za skupinu iznosi 9.8 s prosječnim
odstupanjem od 2.2.

Prihod odabranog poduzeća iznosi 185 milijuna kn, a stopa


dobiti 5.6. Kakav je položaj poduzeća u skupini s obzirom na:
a) prihod,
b) stopu dobiti ?

Josipa Perkov, prof., pred. 27


 Standardizirana varijabla poprima različite vrijednosti, koje
po predznaku mogu biti pozitivne i negativne

 Pravilo Čebiševa:

pojas od x ± 2σ obuhvaća najmanje 75% svih podataka,

pojas od x ± 3σ obuhvaća najmanje 88.89% svih podataka

Josipa Perkov, prof., pred. 28


PRIMJER 8.

Uzmimo osnovni skup od 20.000 žiro-računa komitenata jedne


banke. Prosječno kvartalno stanje sredstava iznosi 500.000,00 kn s
prosječnim odstupanjem od 100.000,00 kn

Pomoću pravila Čebiševa procijenite broj računa s


prosječnim stanjem kvartalnih stanja između 300.000,00 i
700.000,00 kn.

Josipa Perkov, prof., pred. 29


PITANJA ZA USMENI DIO ISPITA

1. Objasnite pojam raspršenosti. Nabrojite


najvažnije mjere disperzije.
2. Koje su relativne mjere disperzije? Navedite
njihova svojstva.
3. Koje su apsolutne mjere disperzije? Navedite
njihova svojstva.
4. Što je standardizirano obilježje? Navedite
pravilo Čebiševa.

Josipa Perkov, prof., pred. 30

You might also like