You are on page 1of 8

Sampling error

• Sample – uzorak
• Sampling – uzorkovanje, uzimanje uzorka
• Populacija
Sampling distribucija • Parametar populacije (Population Parameter)
– Izračunata vrijednost na osnovu podataka cijele populacije
• Uzorak
• Statistika uzorka (Sample Statistics)
Prof. dr. Mugdim Pašid – Izračunata vrijednost na osnovu podataka uzorka
• Zaključivanje o populaciji na osnovu uzorka
• Uzorak mora biti slučajan
– Uzorak uzet na način da bilo koji mogudi uzorak date veličine
ima jednaku šansu da bude odabran
• Inferential statistics
1 2

Sampling error Sampling error


• Statistika uzorka (Sample Statistics) se koristi • Problemi:
da se procijene parametri populacije – Različiti uzorci daju različite procjene parametara
(Population Parameters) populacije
• Npr. aritmetička sredina uzorka 𝑥 - sample – Varijabilitet uzorka
statistics – Odrediti adekvatnu veličinu uzorka.
• Na osnovu 𝑥 procijenjujemo aritmetičku • Vedi uzorak - manja greška
sredinu populacije µ • Vedi uzorak – više košta
• Ako uzmemo drugi uzorak, 𝑥 de se (vjerovatno) • Koliko je dobra (tačna) procjena parametra
promijeniti populacije na osnovu statistike uzorka.
3 4

Sampling error Sampling error


• Da se podsjetimo aritmetičke sredine: • Razlika između vrijednosti izračunate iz uzorka
(statistics) i korespodentne vrijednosti
izračunate iz populacije (parameter).
• Npr. za aritmetičku sredinu:
Sampling error = 𝑥 − µ
gdje je:
μ = aritmetička sredina populacije • Očekivani sampling error se smanjuje ako se
= aritmetička sredina uzorka veličina uzorka povedava
= vrijednosti u populaciji ili uzorku
N = veličina populacije (𝑥 − µ) može biti pozitivna i negativna vrijednost
n = veličina uzorka
5 6

1
Sampling distribucija Sampling distribucija
• Hipotetički: • Neka je populacija četiri osobe A, B, C i D
– Da bismo koristili statistiku uzorka da zaključujemo o • Veličina populacije N=4
parametrima populacije treba da ispitamo sve mogude • Slučajna varijabla x je
uzorke date veličine iz populacije. broj grešaka na ispitu
• Sampling distribution je distribucija rezultata za osoba A, B, C, I D
slučaj kada bi se ispitali svi mogudi uzorci date • Vrijednosti slučajne
veličine iz populacije. varijable x su:
osoba A: 1 greška,
– U praksi se ne ispituju svi mogudi uzorci date veličine
iz populacije (veoma skupo, vrijeme, ...) osoba B: 2 greške,
osoba C: 3 greške,
– U praksi se uzme jedan uzorak
osoba D: 4 greške;

Sampling distribucija Sampling distribucija


μ
x 
1 2  3  4
 2,5
 (x  μ) 2
• Izračunati aritmetičku sredinu populacije σ  1,12
i i

μ
x i
N 4 N

N 1 P(x)
• Izračunati standardnu devijaciju populacije p (1) 
4
 0,25 0,3

0,25

σ
 (x i  μ) 2 1
p (2)   0,25
4
0,2

0,15
N
1
p (3)   0,25
0,1

• Nacrtati dijagram vjerovatnode distribucije 4 0,05

slučajne varijable x 1
p (4)   0,25
0
1 2 3 4

4
– p(1), p(2), p(3), p(4) Uniformna distribucija

Redni Kombinacija
Sampling distribucija broj
1 A, A 1, 1 1
2 A, B 1, 2 1,5
• Napravi sve mogude kombinacije uzoraka veličine dvije 3 A, C 1, 3 2
osobe i izračunaj u excelu µ (aritmetička sredina od 4 A, D 1, 4 2,5
aritmetičkih sredina svih mogudih uzoraka date 5 B, A 2, 1 1,5
6 B, B 2, 2 2
veličine) 7 B, C 2, 3 2,5
Redni Kombinacija
8 B, D 2, 4 3
broj 9 C, A 3, 1 2
10 C, B 3, 2 2,5
• Nacrtaj u excelu distribuciju vjerovatnode aritmetičkih 11 C, C 3, 3 3
sredina svih mogudih uzoraka date veličine 12 C, D 3, 4 3,5
13 D, A 4, 1 2,5
• Izračunaj standardnu devijaciju aritmetičkih sredina od 14 D, B 4, 2 3
aritmetičkih sredina svih mogudih uzoraka date veličine 15 D, C 4, 3 3,5
16 D, D 4, 4 4
µ = 2,5
11 12

2
Sampling distribution Sampling distribution
• Distribucija vjerovatnode aritmetičkih sredina svih
mogudih uzoraka date veličine
• µ = 2,5 (aritmetička sredina aritmetičkih 0,3
0,25

sredina svih mogudih uzoraka date veličine) 0,25

0,2 0,1875 0,1875

• Ved smo ranije izračunali da je aritmetička 0,15 0,125 0,125

sredina populacije µ: 0,1


0,0625 0,0625
0,05

μ
x i

1 2  3  4
 2,5
0
1 1,5 2 2,5 3 3,5 4

N 4
• 16 uzoraka, 16 aritmetičkih sredina
• µ =µ • Artimetičke sredine uzoraka su manje varijabilne od
individualnih vrijednosti slučajne varijable x
• Sa povedanjem veličine uzorka uticaj jedne ekstremne
vrijednosti u uzorku se smanjuje jer se uprosječuje sa više
13
vrijednosti 14

1
Usporedba Populacije sa Sampling
1,5
1,5 Sampling distribution
2
2 Aritmetička sredina od aritmetičkih sredina uzoraka µ
distribucijom
2
2,5 𝑥𝑖 1 + 1,5 + 1,5 + 2,0 + ⋯ + 4
2,5 µ𝑥 = = = 2,5
2,5 𝑁 16 0,3
0,3
0,25
2,5 0,25
0,25
3
3
Standardna devijacija svih mogudih aritmetičkih sredina 0,2
0,2 0,1875 0,1875

0,15 0,125 0,125


3 naziva se Standard Error of the Mean (standardna greška 0,15
0,1
3,5 0,0625 0,0625
3,5 aritmetičke sredine) : 0,1

0,05
0,05
4
0
0
1 1,5 2 2,5 3 3,5 4
1 2 3 4
(𝑥𝑖 − µ𝑥 )2 (1 − 2,5)2 + (1,5 − 2,5)2 + (1,5 − 2,5)2 + (2,0 − 2,5)2 + (2,0 − 2,5)2 + … + (4 − 2,5)2
𝜎𝑥 = =
𝑁 16

10
Populacija: Distribucija aritmetičkih sredina uzoraka
= = 0,63 = 0,79
16 N=4; µ=2,5: σ=1,12 n=2;
ili:
𝜎 𝑠𝑡. 𝑑𝑒𝑣. 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑗𝑒 1,12
𝜎𝑥 = = = = 0,79
𝑛 𝑣𝑒𝑙𝑖č𝑖𝑛𝑎 𝑢𝑧𝑜𝑟𝑘𝑎 2
15 16

Standardna greška aritmetičke sredine Ako je populacija normalno


Standard Error of the Mean (SEM) distribuirana
𝜎𝑥 =
𝜎
=
𝑠𝑡. 𝑑𝑒𝑣. 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑗𝑒 • Ako je populacija normalno distribuirana sa
𝑛 𝑣𝑒𝑙𝑖č𝑖𝑛𝑎 𝑢𝑧𝑜𝑟𝑘𝑎
aritmetičkom sredinom μ i standardnom
• Ako se veličina uzorka poveda standardna devijacijom σ, sampling distribucija od x je
greška aritmetičke sredine (Standard Error of također normalno distribuirana sa AS
the Mean) se smanjuje faktorom jednakim jednakom AS populacije i SD jednakom SD
kvadratnom korjenu veličine uzorka. podijeljeno sa kvadratnim korijenom veličine
uzorka:
σ
μx  μ σx 
n
17 18

3
z vrijednost sampling distribucije
z vrijednost sampling distribucije
• Normalna distribucija: • z vrijednost sampling distribucije za x:
– postoji formula za računanje z vrijednosti i 𝑥 −µ 𝑥 𝜎
površine ispod bilo koje vrijednosti x: 𝑧= ; pošto je µ𝑥 = µ i 𝜎𝑥 = 𝑠𝑙𝑖𝑗𝑒𝑑𝑖
𝜎𝑥 𝑛
𝑥−µ
𝑧= 𝑥−µ 𝜎
𝜎 𝑧= 𝜎 ; ⟹𝑥 =µ+𝑧
𝑛
– Dakle, računa se koliko je jedna vrijednost x 𝑛
udaljena od aritmetičke sredine gdje je: x = aritmetička sredina uzorka
• U sampling distribuciji umjesto jedne μ = aritmetička sredina populacije
vrijednosti x imamo aritmetičku sredinu σ = standardna devijacija populacije
n = veličina uzorka
L = donja granična vrijednost U = gornja granična vrijednost
19

Osobine Sampling distribucije Osobine Sampling distribucije

Normalno distribuirana populacija

Ako se n povedava, Vedi uzorak

σ x se smanjuje
μx  μ μ x
Manji uzorak
Normalna sampling distribucija
(ima istu aritmetičku sredinu)

μx
x μ x

Ako populacija nije normalno


Central Limit teoreoma
distribuirana
• Primjenjuje se Central Limit teorema: • Za slučajni uzorak veličine n uzet iz populacije
• Ako populacija nije normalno distribuirana aritmetičke sa aritmetičkom sredinom µ i standardnom
sredine uzoraka de aproksimativno biti normalno
distribuirane sve dok je veličina uzorka dovoljno velika i
devijacijom σ, bez obzira na distribuciju
sampling distribucija de imati: populacije, uz uvjet da je uzorak dovoljno
velik, distribucija aritmetičkih sredina uzoraka
σ
μx  μ σx  de aproksimativno biti normalna sa
n aritmetičkom sredinom jednakom μx  μ
σ
standardnom devijacijom jednakom σ x 
n

23 24

4
Šta znači da je uzorak dovoljno velik Central Limit Theorem

• Za vedinu distribucija veličina uzorka n ≥ 30 Sampling


Ako je n↑
distribucija
daje sampling distribuciju koja je uzorak
postaje skoro
aproksimativno normalna dovoljno
sasvim
velik ...
normalno
distribuirana
bez obzira na
oblik populacije

Ako populacija nije normalno


Primjer
distribuirana
Distribucija populacije • Iz podataka o prodaji se vidi da je prodaja
Osobine sampling distribucije:
right-skewed sa aritmetičkom sredinom
populacije 12,50 KM po kupcu i standardnom
μx  μ devijacijom od 5,50 KM. Menadžer prodavnice
μ x je uzeo uzorak od 100 računa. Menadžer je
Sampling Distribution
σ (postaje normalna sa povedanjem n)
zainteresiran da odredi vjerovatnodu da de
σx  Vedi aritmetička sredina bit između 12,25 KM i
n Manji uzorak uzorak
13,00 KM.

μx x 28

Primjer Primjer
𝑥 − µ𝑥 𝑥−µ
1. Odrediti aritmetičku sredinu uzorka 4. Izračunaj z vrijednosti 𝑧 = = 𝜎
𝜎𝑥
x=12,25 i x=13,00 𝑛
2. Definiraj sampling distribuciju 𝑥 − µ𝑥 𝑥−µ 12,25 − 12,50
𝑧1 = = 𝜎 = = −0,46
µ𝑥 = 12,5; 𝜎𝑥 =
5,5
= 0,55 𝐾𝑀 𝜎𝑥 5,50
100 𝑛 100
3. Definiraj događaj od interesa
𝑥 − µ𝑥 𝑥−µ 13,00 − 12,50
P(12,25 ≤ x ≥ 13,00) 𝑧2 = = 𝜎 = = 0,91
𝜎𝑥 5,50
𝑛 100
29 30

5
Primjer Proporcija
5. Odrediti vjerovatnodu za dogadjaj od interesa: • Kategorijske varijable
– Za z=-0,46 slijedi vjerovatnoda 0,1772 • Dvije kategorije
– Za z=0,91 slijedi vjerovatnoda 0,3186
– Da, Ne
– P = 0,1772 + 0,3186 = 0,4958
– Zadovoljan, Nezadovoljan
– ...
6. Zaključak:
Vjerovatnoda da de aritmetička sredina uzorka
biti u intervalu od 12,25 KM i 13,00 KM je
49,58%.
31 32

Proporcija Proporcija - populacija


p = proporcija populacije • Firma istražuje zadovoljstvo kupaca novim
p = proporcija uzorka automobilskim gumama. Firma je poslala
upitnik svim kupcima, njih 120, koji su kupili
𝑋 𝑥 gume sa jednim pitanjem: Da li ste zadovoljni
𝑝= 𝑝=
𝑁 𝑛 kupljenim gumama. Broj kupaca koji su
gdje je:
X broj elemenata populacije sa određenim atributom i N veličina odgovorili sa DA je bio 105. 15 kupaca je
populacije odgovorilo sa NE.
x broj elemenata uzorka sa određenim atributom i n veličina uzorka 𝑋 105
𝑝= = = 0,875
𝑁 120
34

Proporcija - uzorak Sampling Error Proporcije


• Pretpostavimo da je firma uzela uzorak od 40 • Sampling error proporcije = p – p
kupaca. Pretpostavimo da su u ovom uzorku • U našem primjeru:
svih 15 koji su odgovorili sa NE. Tada je
• p – p = 0,625 – 0,875= -0,25
𝑥 25
𝑝= = = 0,625
𝑛 40

• Proporcija uzorka je 62,5% dok je proporcija


populacije 87,5%.
• Razlika između ovih vrijednosti naziva se
Sampling Error Proporcije
35 36

6
Sampling distribucija proporcije z-vrijednost proporcije

• Aproksimira se sa normalnom distribucijom


ako je: P(p) Sampling distribucija pp pp
.3 z 
np  5 .2 σp p(1  p)
.1
n(1  p)  5 0
0 .2 .4 .6 8 1 p
n
gdje je
μp  p p(1  p)
i σp 
gdje je p = proporcija populacije i
n
p proporcija uzorka gdje je p = proporcija populacije, n
veličina uzorka i p proporcija uzorka

Primjer Primjer
• Menadžer jednih novina vjeruje da 80% stanova 1. Odrediti proporciju populacije
koji se oglašavaju za prodaju u njegovim novima p = 0,80 (na osnovu iskustva menadžera)
se zaista prodaju u roku od 4 sedmice.
• On ovu informaciju želi da stavi u novine. Ali prije 2. Izračunati proporciju uzorka
nego što ovo oglasi u novinama on je uzeo uzorak p = 73 / 100 = 0,73
od 100 stanova iz oglasnika i provjerio. Od tih 100
3. Izračunati aritmetičku sredinu i standardnu
stanova njih 73 se zaista prodalo u roku od 4
sedmice. devijaciju sampling distribucije
• Kolika je vjerovatnoda da de uzorak od 100 dati p(1  p)
proporciju ≤ 0,73. μ p  p = 0,80 σp 
n
39 σp  0,04 40

Primjer Primjer
4. Odredi događaj od interesa: 6. Odrediti vjerovatnodu za događaj od interesa:
Želimo odrediti vjerovatnodu da de proporcija prodanih • P(p ≤0,73) ili P (z ≤ -1,75):
stanova biti manja od 0,73
P(p ≤0,73) = ? Za z= -1,75 iz tabele se očita broj 0,4599, što je
5. Provjeriti površina od aritmetičke sredine do z vrijednosti.
np  5 100*0,80 ≥ 5
n(1  p)  5 100(1-0,80) ≥5

i izračunati z vrijednost: -0,73 0,80 p -1,75 0,0 z


pp pp P = 0,5-0,4599 = 0,0401
z  = -0,07/0,04= - 1,75
σp p(1  p) P(p ≤0,73) = 0,0401 ili 4,01%
n 41 42

7
Normal Table Primjer
7. Zaključak:
Standard Normal Curve Probability Distribution
• 4,01 % je vjerovatnoda da de slučajni uzorak od
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
n=100 dati proporciju uzorka manju od 0,73 (p
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 ≤0,73) ako je proporcija populacije 0,80.
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

43 44

You might also like