Professional Documents
Culture Documents
• Sample – uzorak
• Sampling – uzorkovanje, uzimanje uzorka
• Populacija
Sampling distribucija • Parametar populacije (Population Parameter)
– Izračunata vrijednost na osnovu podataka cijele populacije
• Uzorak
• Statistika uzorka (Sample Statistics)
Prof. dr. Mugdim Pašid – Izračunata vrijednost na osnovu podataka uzorka
• Zaključivanje o populaciji na osnovu uzorka
• Uzorak mora biti slučajan
– Uzorak uzet na način da bilo koji mogudi uzorak date veličine
ima jednaku šansu da bude odabran
• Inferential statistics
1 2
1
Sampling distribucija Sampling distribucija
• Hipotetički: • Neka je populacija četiri osobe A, B, C i D
– Da bismo koristili statistiku uzorka da zaključujemo o • Veličina populacije N=4
parametrima populacije treba da ispitamo sve mogude • Slučajna varijabla x je
uzorke date veličine iz populacije. broj grešaka na ispitu
• Sampling distribution je distribucija rezultata za osoba A, B, C, I D
slučaj kada bi se ispitali svi mogudi uzorci date • Vrijednosti slučajne
veličine iz populacije. varijable x su:
osoba A: 1 greška,
– U praksi se ne ispituju svi mogudi uzorci date veličine
iz populacije (veoma skupo, vrijeme, ...) osoba B: 2 greške,
osoba C: 3 greške,
– U praksi se uzme jedan uzorak
osoba D: 4 greške;
μ
x i
N 4 N
N 1 P(x)
• Izračunati standardnu devijaciju populacije p (1)
4
0,25 0,3
0,25
σ
(x i μ) 2 1
p (2) 0,25
4
0,2
0,15
N
1
p (3) 0,25
0,1
slučajne varijable x 1
p (4) 0,25
0
1 2 3 4
4
– p(1), p(2), p(3), p(4) Uniformna distribucija
Redni Kombinacija
Sampling distribucija broj
1 A, A 1, 1 1
2 A, B 1, 2 1,5
• Napravi sve mogude kombinacije uzoraka veličine dvije 3 A, C 1, 3 2
osobe i izračunaj u excelu µ (aritmetička sredina od 4 A, D 1, 4 2,5
aritmetičkih sredina svih mogudih uzoraka date 5 B, A 2, 1 1,5
6 B, B 2, 2 2
veličine) 7 B, C 2, 3 2,5
Redni Kombinacija
8 B, D 2, 4 3
broj 9 C, A 3, 1 2
10 C, B 3, 2 2,5
• Nacrtaj u excelu distribuciju vjerovatnode aritmetičkih 11 C, C 3, 3 3
sredina svih mogudih uzoraka date veličine 12 C, D 3, 4 3,5
13 D, A 4, 1 2,5
• Izračunaj standardnu devijaciju aritmetičkih sredina od 14 D, B 4, 2 3
aritmetičkih sredina svih mogudih uzoraka date veličine 15 D, C 4, 3 3,5
16 D, D 4, 4 4
µ = 2,5
11 12
2
Sampling distribution Sampling distribution
• Distribucija vjerovatnode aritmetičkih sredina svih
mogudih uzoraka date veličine
• µ = 2,5 (aritmetička sredina aritmetičkih 0,3
0,25
μ
x i
1 2 3 4
2,5
0
1 1,5 2 2,5 3 3,5 4
N 4
• 16 uzoraka, 16 aritmetičkih sredina
• µ =µ • Artimetičke sredine uzoraka su manje varijabilne od
individualnih vrijednosti slučajne varijable x
• Sa povedanjem veličine uzorka uticaj jedne ekstremne
vrijednosti u uzorku se smanjuje jer se uprosječuje sa više
13
vrijednosti 14
1
Usporedba Populacije sa Sampling
1,5
1,5 Sampling distribution
2
2 Aritmetička sredina od aritmetičkih sredina uzoraka µ
distribucijom
2
2,5 𝑥𝑖 1 + 1,5 + 1,5 + 2,0 + ⋯ + 4
2,5 µ𝑥 = = = 2,5
2,5 𝑁 16 0,3
0,3
0,25
2,5 0,25
0,25
3
3
Standardna devijacija svih mogudih aritmetičkih sredina 0,2
0,2 0,1875 0,1875
0,05
0,05
4
0
0
1 1,5 2 2,5 3 3,5 4
1 2 3 4
(𝑥𝑖 − µ𝑥 )2 (1 − 2,5)2 + (1,5 − 2,5)2 + (1,5 − 2,5)2 + (2,0 − 2,5)2 + (2,0 − 2,5)2 + … + (4 − 2,5)2
𝜎𝑥 = =
𝑁 16
10
Populacija: Distribucija aritmetičkih sredina uzoraka
= = 0,63 = 0,79
16 N=4; µ=2,5: σ=1,12 n=2;
ili:
𝜎 𝑠𝑡. 𝑑𝑒𝑣. 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑗𝑒 1,12
𝜎𝑥 = = = = 0,79
𝑛 𝑣𝑒𝑙𝑖č𝑖𝑛𝑎 𝑢𝑧𝑜𝑟𝑘𝑎 2
15 16
3
z vrijednost sampling distribucije
z vrijednost sampling distribucije
• Normalna distribucija: • z vrijednost sampling distribucije za x:
– postoji formula za računanje z vrijednosti i 𝑥 −µ 𝑥 𝜎
površine ispod bilo koje vrijednosti x: 𝑧= ; pošto je µ𝑥 = µ i 𝜎𝑥 = 𝑠𝑙𝑖𝑗𝑒𝑑𝑖
𝜎𝑥 𝑛
𝑥−µ
𝑧= 𝑥−µ 𝜎
𝜎 𝑧= 𝜎 ; ⟹𝑥 =µ+𝑧
𝑛
– Dakle, računa se koliko je jedna vrijednost x 𝑛
udaljena od aritmetičke sredine gdje je: x = aritmetička sredina uzorka
• U sampling distribuciji umjesto jedne μ = aritmetička sredina populacije
vrijednosti x imamo aritmetičku sredinu σ = standardna devijacija populacije
n = veličina uzorka
L = donja granična vrijednost U = gornja granična vrijednost
19
σ x se smanjuje
μx μ μ x
Manji uzorak
Normalna sampling distribucija
(ima istu aritmetičku sredinu)
μx
x μ x
23 24
4
Šta znači da je uzorak dovoljno velik Central Limit Theorem
μx x 28
Primjer Primjer
𝑥 − µ𝑥 𝑥−µ
1. Odrediti aritmetičku sredinu uzorka 4. Izračunaj z vrijednosti 𝑧 = = 𝜎
𝜎𝑥
x=12,25 i x=13,00 𝑛
2. Definiraj sampling distribuciju 𝑥 − µ𝑥 𝑥−µ 12,25 − 12,50
𝑧1 = = 𝜎 = = −0,46
µ𝑥 = 12,5; 𝜎𝑥 =
5,5
= 0,55 𝐾𝑀 𝜎𝑥 5,50
100 𝑛 100
3. Definiraj događaj od interesa
𝑥 − µ𝑥 𝑥−µ 13,00 − 12,50
P(12,25 ≤ x ≥ 13,00) 𝑧2 = = 𝜎 = = 0,91
𝜎𝑥 5,50
𝑛 100
29 30
5
Primjer Proporcija
5. Odrediti vjerovatnodu za dogadjaj od interesa: • Kategorijske varijable
– Za z=-0,46 slijedi vjerovatnoda 0,1772 • Dvije kategorije
– Za z=0,91 slijedi vjerovatnoda 0,3186
– Da, Ne
– P = 0,1772 + 0,3186 = 0,4958
– Zadovoljan, Nezadovoljan
– ...
6. Zaključak:
Vjerovatnoda da de aritmetička sredina uzorka
biti u intervalu od 12,25 KM i 13,00 KM je
49,58%.
31 32
6
Sampling distribucija proporcije z-vrijednost proporcije
Primjer Primjer
• Menadžer jednih novina vjeruje da 80% stanova 1. Odrediti proporciju populacije
koji se oglašavaju za prodaju u njegovim novima p = 0,80 (na osnovu iskustva menadžera)
se zaista prodaju u roku od 4 sedmice.
• On ovu informaciju želi da stavi u novine. Ali prije 2. Izračunati proporciju uzorka
nego što ovo oglasi u novinama on je uzeo uzorak p = 73 / 100 = 0,73
od 100 stanova iz oglasnika i provjerio. Od tih 100
3. Izračunati aritmetičku sredinu i standardnu
stanova njih 73 se zaista prodalo u roku od 4
sedmice. devijaciju sampling distribucije
• Kolika je vjerovatnoda da de uzorak od 100 dati p(1 p)
proporciju ≤ 0,73. μ p p = 0,80 σp
n
39 σp 0,04 40
Primjer Primjer
4. Odredi događaj od interesa: 6. Odrediti vjerovatnodu za događaj od interesa:
Želimo odrediti vjerovatnodu da de proporcija prodanih • P(p ≤0,73) ili P (z ≤ -1,75):
stanova biti manja od 0,73
P(p ≤0,73) = ? Za z= -1,75 iz tabele se očita broj 0,4599, što je
5. Provjeriti površina od aritmetičke sredine do z vrijednosti.
np 5 100*0,80 ≥ 5
n(1 p) 5 100(1-0,80) ≥5
7
Normal Table Primjer
7. Zaključak:
Standard Normal Curve Probability Distribution
• 4,01 % je vjerovatnoda da de slučajni uzorak od
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
n=100 dati proporciju uzorka manju od 0,73 (p
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 ≤0,73) ako je proporcija populacije 0,80.
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
43 44