Professional Documents
Culture Documents
Danutė Krapavickaitė
2019 m. ruduo
Temos planas
1) Pagrindinės sąvokos
2) Parametrinės hipotezės tikrinimo etapai
3) Hipotezės apie normaliosios populiacijos vidurkio lygybę
skaičiui tikrinimas
4) Neparametrinės hipotezės tikrinimo etapai
5) Hipotezės apie koreliacijos koeficiento lygybę 0 tikrinimas
6) Regresinės analizės pradmenys. Paprastosios tiesinės regresijos
modelio sudarymas
Statistinių hipotezių tikrinimo uždavinys
Tada,
kai statistikos T tankio funkcija lyginė, tai
α
P T (X1 , X2 , ..., Xn ) > T2kr |H0 teisinga = 2
Kritinės reikšmės
Apibrėžimas 5. Ribos, skiriančios hipotezės H0 atmetimo sritį D1
ir neatmetimo sritį D0 , vadinamos kritinėmis reikšmėmis.
II būdas sprendimui priimti.
Patogu, turint imties duomenis x1 , x2 , ..., xn , skaičiuoti statistikos
T (X1 , ..., Xn ) reikšmę, t. y. kriterijaus realizaciją
Temp = T (x1 , ..., xn ) ir rasti tikimybę
X̄ − a
Z= √ ∼ N (0, 1), kai teisinga H0 : µ = a.
σ/ n
5. Išvados formulavimas.
Hipotezės apie dispersiją pavyzdys
Prieš pradėdamas eksperimentą, psichologas nori sudaryti grupes iš
populiacijos, kurios vidutinis testo reultatas būtų 85 balai, o
standartinis nuokrypis – 10 balų.
1. Vienos iš sudarytų grupių testo rezultatai yra: 85; 92; 93; 90;
81; 78; 76; 78; 77; 80; 89; 92; 94 (vidurkis – 85 balai). Ar ši grupė
sudaryta iš populiacijos, kurios σ 2 = 100, atstovų? α = 0, 05.
2. Statistinė hipotezė:
H0 : σ 2 = 100,
H1 : σ 2 6= 100.
3. Kriterijaus statistika
1
(85 − 85)2 + (92 − 85)2 + ... = 568/100 = 5, 68.
Kemp =
100
4. Sprendimo taisyklė. Kadangi
χ20,975 (12) = 4, 404 < Kemp = 5, 68 < 23, 336 = χ20,025 (12),
tai H0 neatmetama.
5. Taigi galima manyti, kad grupė sudaryta iš atstovų,
priklausančių populiacijai su norimomis savybėmis.
Neparametrinės hipotezės tikrinimo etapai
Hipotezė, kad atsitiktinio dydžio X skirstinys priklauso kokiai nors
skirstinių klasei, (pavyzdžiui, normalusis ar binominis) yra
neparametrinė.
1. Duomenys Kiekybinių duomenų imtis, kurios dydis n.
2. Duomenų grupavimas. Grupuojame imties duomenis į k
vienodo ilgio intervalų.
Visų intervalų dažniai fi ≥ 5
(ci−1 ; ci ] [5;10] (10;15] (15;20] (20;25] (25;30] (30;35] (35;40] (40;45] Iš viso
ni 12 6 10 6 8 6 10 12 70
Braižoma histograma (juodi stupeliai). Kokį skirstinį ji primena?
I. Patikrinkime neparametrinę statistinę hipotezę apie tai, kad
prekybos pajamų skirstinys normalusis su reikšmingumo lygmeniu
α = 0, 1. (Ją turėtume atmesti)
3. Reikia nustatyti normaliojo skirstinio parametrus.
Imsime normaliojo skirstinio vidurkį ir dispersiją lygius imties
empiriniam vidurkiui ir dispersijai.
8 8
1 X 1 X
x̄? = x? fi = 25, 5; s?2 = (x? − x̄? )2 fi = 156.
70 i=1 i 70 − 1 i=1 i
6. Sprendimo taisyklė
Nustatome kritinį tašką χ2kr α;ν , čia ν = k − r − 1.
k = 8, nes imtis sugrupuota į 8 intervalus.
r = 2, nes normaliojo atsitiktinio dydžio pasiskirstymo funkcija
priklauso nuo dviejų parametrų.
Tada ν = 8 − 2 − 1 = 5,
α = 0, 1 yra pasirinktas reikšmingumo lygmuo.
Iš χ2 skirstinio kritinių reikšmių lentelės randame χ2kr 0,1;5 = 9, 23.
D0 = (0; 9, 23], D1 = (9.23; ∞).
Kadangi
χ2kr 0,1;5 = 9, 23 < 9, 69 = Kemp ,
tai nulinė hipotezė H0 apie populiacijos normalųjį skirstinį
atmetama su reikšmingumo lygmeniu 0, 1.
7. Išvados formulavimas. Su tikimybe 1 − α = 1 − 0, 1 = 0, 9
galime teigti, kad prekybos pajamos per vieną dieną X nėra
pasiskirstę pagal normalųjį skirstinį N (25, 5; 156).
II. Dabar patikrinkime hipotezę apie tai, kad pajamos pasiskirstę
pagal tolygųjį dėsnį intervale X ∼ U [5, 45] (imties mažiausia ir
didžiausia reikšmės) su reikšmingumo lygmeniu α = 0, 1.
1...2...3. H0 : X ∼ U (5; 45),
H1 : X ne U (5; 45).
4. Tolygiojo skirstinio tankio funkcija intervale [5,45] pastovi, ir
lygi 1/(45-5)=1/40. Tikimybė patekti į bet kurį intervalą
10 − 5 5 70 7
p1 = = = p2 = ... = p8 , npi = = .
40 40 40 4
5. Empirinė statistinio kriterijaus reikšmė
k k
X (fi − npi )2 X (fi − 7/4)2
Kemp = = = 2, 31.
i=1
npi i=1
7/4
6. Sprendimo taisyklė. Tolygusis skirstinys taip pat kaip ir
normalusis turi du parametrus – intervalo galus, todėl jam kritinė
reikšmė su tuo pačiu reikmingumo lygmeniu α = 0, 1 yra ta pati:
χ2kr 0,1;5 = 9, 23.
Hipotezės priėmimo sritis irgi ta pati: D0 = (0; 9, 23],
Kemp = 2, 31 ∈ D0 , ir šios hipotezės atmesti su reikšmingumo
lygmeniu α = 0, 1 neturime pagrindo.
7. Išvada. Su tikimybe 0,9 tvirtiname, kad populiacijos, iš kurios
išrinkta imtis, skirstinys yra tolygusis intervale [5,45].
Atsitiktinių dydžių koreliacijos koeficientas
Cov(X, Y ) √ √
ρ(X, Y ) = , σX = DX, σY = DY .
σX σY
Koreliacijos koeficiento savybės:
1) −1 ≤ ρ(X, Y ) ≤ 1
2) Jei X, Y nepriklausomi, tai ρ(X, Y ) = 0.
3) Jei Y = a + bX, čia a ir b – skaičiai, tai ρ(X, Y ) = ±1.
Koreliacijos koeficientas parodo atsitiktinių dydžių X, Y tiesinės
priklausomybės laipsnį.
ρ > 0 kai X didėja, tai ir Y didėja.
ρ < 0 kai X didėja, tai Y mažėja.
ρ ≈ 0 tarp X ir Y nėra tiesinės priklausomybės.
Koreliacijos koeficiento vertinimas
x: 8 9 10 8 7 8 9
y: 7 7 10 9 8 10 8
x̄ = 8, 42, ȳ = 8, 42.
cov(x, y) = 0, 2857,
sx = 0, 9759,
sy = 1, 2724,
ρ̂(x, y) = 0, 23.