You are on page 1of 40

Statistinių hipotezių tikrinimo įvadas

Danutė Krapavickaitė

2019 m. ruduo
Temos planas

1) Pagrindinės sąvokos
2) Parametrinės hipotezės tikrinimo etapai
3) Hipotezės apie normaliosios populiacijos vidurkio lygybę
skaičiui tikrinimas
4) Neparametrinės hipotezės tikrinimo etapai
5) Hipotezės apie koreliacijos koeficiento lygybę 0 tikrinimas
6) Regresinės analizės pradmenys. Paprastosios tiesinės regresijos
modelio sudarymas
Statistinių hipotezių tikrinimo uždavinys

Tenka susidurti su pateiktu statistiniu teiginiu apie populiaciją ir


konkuruojančiu statistiniu teiginiu.
Pavyzdys. Prekiautojai daržovėmis
Prekiautojų daržovėmis vidutinis atlyginimas 500 eurų
Prekiautojų daržovėmis vidutinis atlyginimas >500 eurų
Tarkime, kad iš imties duomenų apskaičiavę gauname, kad
prekiautojo daržovėmis vidutinis atlygnimas 530 eurų.
Ar skirtumas 530-500=30 (eurų) pakankamas teigti, kad visų
prekiautojų daržovėmis atlyginimo vidurkis >500 eurų?
Apibrėžimas 1. Kiekvieną teiginį apie atsitiktinio dydžio skirstinį
ar žinomo skirstinio parametrą vadiname statistine hipoteze.
Apibrėžimas 2. Su statistine hipoteze konkuruojantis teiginys
vadinamas alternatyva.
Žymėjimas, sąvokos
Hipotezė ir alternatyva:
H0 : teiginys1
H1 : teiginys2
Tai, kas norima įrodyti, formuluojama kaip alternatyva.
Statistiškai nustatome su pasirinkta tikimybe, ar teiginys1 yra
teisingas.
Galimos dviejų rūšių klaidos:
I rūšies klaida: atmesti teisingą hipotezę H0 . Apribojame jos
galimybę maža tikimybe, kurią vadiname reikšmingumo lygmeniu ir
žymime α, α ∈ (0, 1). Dažnai α = 0, 05; 0, 01; 0, 1.
α = P (atmesti hipotezȩ H0 | kai H0 teisinga)
II rūšies klaida: priimti klaidingą hipotezę H0 . Minimizuojama II
rūšies klaidos tikimybė, esant fiksuotai α. Ji žymima
1 − β = P (priimti hipotezȩ H0 | kai H0 klaidinga).
Dydis β = P (atmesti hipotezȩ H0 | kai H0 klaidinga) vadinamas
statistinio kriterijaus galia.
Statistinių hipotezių rūšys, hipotezės priėmimo ir
atmetimo sritys
Statistinei hipotezei tikrinti sudaroma imties duomenų funkcija –
statistika T (X1 , X2 , ..., Xn ), kurios skirstinys žinomas, kai H0
teisinga. Ši statistika vadinama statistiniu kriterijumi.
Remiantis statistinio kriterijaus empirine reikšme priimamas
sprendimas apie H0 priėmimą arba atmetimą.
Apibrėžimas 3. Jei hipotezėje tvirtinama apie skirstinio parametrą
– ji vadinama parametrine hipoteze.
Jei hipotezėje tvirtinama apie skirstinį – ji vadinama neparametrine
hipoteze.
Statistikos visų reikšmių aibė D skaidoma į dvi nesikertančias
 D = D0 ∪ D1 taip, kad
sritis: 
P T (X1 , X2 , ..., Xn ) ∈ D1 |H0 teisinga = α
Apibrėžimas 4. Statistinio kriterijaus reikšmių aibė D1 , kuriai H0
atmetama, vadinama atmetimo, arba kritine sritimi (Dkrit ).
Statistinio kriterijaus reikšmių aibė D0 , kuriai H0 neatmetama,
vadinama neatmetimo sritimi.
Parametrinės hipotezės pavyzdys

Formuluojama hipotezė ir alternatyva:


H0 : µ = µ0
H1 : µ 6= µ0
Jei kriterijaus T reikšmė

T (X1 , ..., Xn ) ∈ D0 = [T1kr , T2kr ] ⇒ H0 neatmetama

I būdas sprendimui priimti. Jei kriterijaus T reikšmė

T (X1 , ..., Xn ) ∈ D1 = (−∞, T1kr ) ∪ (T2kr , ∞) ⇒ H0 atmetama

Tada,
 kai statistikos T tankio funkcija lyginė, tai
α
P T (X1 , X2 , ..., Xn ) > T2kr |H0 teisinga = 2
Kritinės reikšmės
Apibrėžimas 5. Ribos, skiriančios hipotezės H0 atmetimo sritį D1
ir neatmetimo sritį D0 , vadinamos kritinėmis reikšmėmis.
II būdas sprendimui priimti.
Patogu, turint imties duomenis x1 , x2 , ..., xn , skaičiuoti statistikos
T (X1 , ..., Xn ) reikšmę, t. y. kriterijaus realizaciją
Temp = T (x1 , ..., xn ) ir rasti tikimybę

p = P (T > Temp |H0 teisinga).

Po to tikimybė p lyginama su pasirinktu reikšmingumo lygmeniu α:


Jei p < α/2 arba p > 1 − α/2 ⇒ H0 atmetama
Jei p ≥ α/2 arba p ≤ 1 − α/2 ⇒ H0 atmesti nėra pagrindo.
Pastaba 1. α lygmens kritinė reikšmė lygi 1 − α lygmens kvantiliui.
Pastaba 2. II būdas taikomas, kai sprendžiant uždavinį naudojamas
statistinių programų paketas.
Hipotezės apie vidurkio lygybę skaičiui tikrinimas,
kai dispersija žinoma
Stebime nepriklausomai n kartų normalųjį atsitiktinį dydį X:
X1 , X2 , ..., Xn , X ∼ N (µ, σ 2 ),
dispersija σ 2 žinoma, vidurkis µ nežinomas.
H0 : µ = a,
H1 : µ 6= a.
Imties realizacija x1 , x2 , ..., xn .
Paprasčiausias nežinomo vidurkio įvertinys yra
1
X̄ = (X1 + ... + Xn ),
n
jo realizacija x̄ = n1 (x1 + ... + xn ).
Jei X̄ realizacija x̄ mažai skiriasi nuo a reikšmės, tai H0 atmesti
nėra pagrindo,
jei jie skiriasi daug, tai H0 atmetame.
Reikia nustatyti ribą, skiriančią didelį a ir x̄ skirtumą nuo mažo.
Kritinei sričiai nustatyti sudaroma statistika

X̄ − a
Z= √ ∼ N (0, 1), kai teisinga H0 : µ = a.
σ/ n

Pasirinkime reikšmingumo lygmenį α ∈ (0, 1). Dažnai imamas


α = 0, 05; 0, 01; 0, 1.
Tegu zα/2 – skirstinio N (0, 1) α/2 lygmens kritinė reikšmė,
randama iš lentelės. Tai yra N (0, 1) skirstinio 1 − α/2 lygmens
kvantilis. T1kr = −zα/2 , T2kr = zα/2 .
Kritinė sritis D1 = (−∞, −zα/2 ] ∪ [zα/2 , ∞).
Hipotezės priėmimo sritis D0 = (−zα/2 , zα/2 )

P (atmesti H0 |H0 teisinga) = P (Z ∈ D1 |µ = a))


= P (Z < −zα/2 ) + P (Z > zα/2 )
= α/2 + α/2 = α.
Parametrinės hipotezės tikrinimo etapai
1. Duomenys. Kiekybinių duomenų imtis x1 , x2 , ..., xn , kuri
gaunama, matuojant nepriklausomai n kartų atsitiktinį dydį
X ∼ N (µ, σ 2 ). σ 2 žinoma, µ nežinomas.
2. Statistinė hipotezė.
H0 : µ = a,
H1 : µ 6= a.
3. Kriterijaus statistika. Apskaičiuojame kriterijaus reikšmę
n
x̄ − a 1X
Z= √ , x̄ = xi .
σ/ n n i=1

4. Sprendimo taisyklė. Kai H0 teisinga, tai Z ∼ N (0, 1) ir


statistinio kriterijaus reikšmės svyruoja apie 0. Jei teisinga
alternatyva – kriterijaus reikšmės dažnai daug nukryps nuo nulio.
Pasirinkime reikšmingumo lygmenį α ∈ (0, 1).
Jei |Z| > zα/2 , tai H0 atmetama
Jei |Z| ≤ zα/2 , tai H0 neatmetama su tikimybe 1 − α.
5. Išvados formulavimas.
Pavyzdys apie prekiautojų daržovėmis atlyginimą
Prieš keletą metų prekiautojų daržovėmis vidutinis atlyginimas
buvo 500 eurų, jo dispersija σ 2 = 400. Išsiaiškinsime, ar pakito
prekiautojų daržovėmis vidutinis atlyginimas. Laikoma, kad
atlyginimo skirstinys normalusis.
1. Šiemet apklausus 100 prekiautojų pasirodė, kad jų atlyginimo
vidurkis x̄ = 530. Disperiją laikysime žinoma: σ 2 = 400.
2. Statistinė hipotezė:
H0 : µ = 500,
H1 : µ 6= 500.
X̄−a
3. Kriterijaus statistikos Z = σ empirinė reikšmė
530 − 500 30
Zemp = √ √ = = 15.
400/ 100 20/10
4. Sprendimo taisyklė. Imkime α = 0, 05, iš lentelės randame
zα/2 = z0,025 = 1, 96.
Zemp = 15 > z0,025 = 1, 96, todėl su reikšmingumo lygmeniu
α = 0, 05 nulinę hipotezę H0 tenka atmesti.
5. Vidutinis prekiautojų atlyginimas statistiškai reikšmingai skiriasi
N(0,1) skirstinio kritinės reikšmės
Hipotezės tikrinimo taisyklė, kai dispersija žinoma
Statistinių hipotezių apie normalųjį skirstinį turinčios populiacijos
vidurkio lygybę skaičiui tikrinimo taisyklės, kai dispersija σ 2
žinoma n
x̄ − a 1X
Zemp = √ , x̄ = xi
σ/ n n i=1

Hipotezė H1 H0 atmetama, H0 neatmetama


jei jei

H0 : µ 6= a |Z| > zα/2 ; D1 = |Z| ≤ zα/2 ; D0 =


= (−∞; −zα/2 ) ∪ (zα/2 ; ∞) = [−zα/2 ; zα/2 ]

µ=a µ>a Z > zα Z ≤ zα


D1 = (zα ; ∞) D0 = (−∞; zα ]

σ 2 žin. µ<a Z < −zα Z ≥ −zα


D1 = (−∞; −zα ) D0 = [−zα ; ∞)
Tas pats pavyzdys su kita alternatyva
Prieš keletą metų prekiautojų daržovėmis vidutinis atlyginimas
buvo 500 eurų, jo dispersija σ 2 = 400. Gal atlyginimas padidėjo?
1. Šiemet 100 prekiautojų daržovėmis atlyginimo vidurkis x̄ = 530.
2. Statistinė hipotezė:
H0 : µ = 500,
H1 : µ > 500.
3. Statistinio kriterijaus empirinė reikšmė tokia pat:
530 − 500
Zemp = √ √ = 15.
400/ 100
4. Sprendimo taisyklė. Jei būtų teisinga alternatyva, tai kriterijaus
statistika dažniau būtų teigiama, ir reikia atskirti sistemingai
teigiamą statistikos reikšmę nuo atsitiktinės. Iš lentelės randame
zα = z0,05 = 1, 64.
Zemp = 15 > z0,05 = 1, 64, todėl su reikšmingumo lygmeniu
α = 0, 05 nulinę hipotezę H0 atmetame.
5. Išvada: vidutinis prekiautojų atlyginimas statistiškai reikšmingai
paaugo virš 500 eurų.
Hipotezė apie vidurkio lygybę skaičiui, kai dispersija
nežinoma
1. Duomenys. Kiekybinių duomenų imtis gaunama, matuojant
nepriklausomai n kartų atsitiktinį dydį X ∼ N (µ, σ 2 ). Vidurkis µ
nežinomas, dispersija σ 2 nežinoma.
2. Statistinė hipotezė.
H0 : µ = a,
H1 : µ 6= a.
3. Kriterijaus statistika. Apskaičiuojama kriterijaus statistika
v
n n
x̄ − a
u
1X u 1 X
T = √ , x̄ = xi , s=t (xi − x̄)2 .
s/ n n i=1
n − 1 i=1

4. Sprendimo taisyklė. T ∼ tn−1 , kai H0 teisinga, t. y. Stjudento


skirstinys su n − 1 laisvės laipsnių. Pasirenkamas α ∈ (0, 1)
Jei |T | > tα/2 (n−1) , tai H0 atmetama.
Jei |T | ≤ tα/2 (n−1) , tai H0 neatmetama su tikimybe 1 − α.
5. Išvados formulavimas.
Pavyzdys apie pirmakursių gabumus
Edukologas nori sužinoti, ar teisūs dėstytojai, sakydami, kad
pirmakursių gabumai pakito.
Prieš 5 metus studentų gabumo testo vidurkis buvo 80 balų.
1. Šiemet apklausus 25 studentus, gauta x̄ = 82, s2 = 26.
2. Statistinė hipotezė:
H0 : µ = 80,
H1 : µ 6= 80.
3. Kriterijaus statistikos empirinė reikšmė:
82 − 80 2
Temp = √ √ = = 1, 961.
26/ 25 5, 09/5

4. Sprendimo taisyklė. Imkime α = 0, 05, iš lentelės randame


tα/2 (n − 1) = t0,025 (24) = 2, 064.
Temp = 1, 961 < t0,025 (24) = 2, 064, todėl H0 atmesti nėra
pagrindo.
5. Su tikimybe 1 − α = 0, 95 galime tvirtinti, kad šiemet
pirmakursiai yra tokių pat gabumų kaip ir prieš 5 metus.
Hipotezės tikrinimo taisyklė, kai dispersija nežinoma

Statistinių hipotezių apie normalųjį skirstinį turinčios populiacijos


vidurkio lygybę skaičiui tikrinimo taisyklės, kai dispersija σ 2
nežinoma
v
n n
x̄ − a
u
1X u 1 X
Temp = √ , x̄ = xi , s=t (xi − x̄)2
s/ n n i=1
n − 1 i=1

Hipotezė H1 H0 atmetama, H0 neatmetama


jei jei
H0 : µ 6= a |T | > tα/2 (n−1) |T | ≤ tα/2 (n−1)
µ=a µ>a T > tα (n−1) T ≤ tα (n−1)
σ 2 nežin. µ<a T < −tα (n−1) T ≥ −tα (n−1)
Stjudento skirstinio kritinė reikšmė
Pavyzdys apie gabumus su kita alternatyva
Edukologas nori sužinoti, ar teisūs dėstytojai, sakydami, kad
pirmakursiai kasmet vis negabesni.
Prieš 5 metus studentų gabumo testo vidurkis buvo 80 balų.
1. Šiemet apklausus 25 studentus, gauta x̄ = 78, s2 = 26.
2. Statistinė hipotezė:
H0 : µ = 80,
H1 : µ < 80.
3. Kriterijaus statistika
78 − 80 2
Temp = √ √ =− = −1, 961.
26/ 25 5, 09/5

4. Sprendimo taisyklė. Imkime α = 0, 1, iš lentelės randame


tα (n − 1) = t0,1 (24) = 1, 318.
Temp = −1, 961 < −t0,1 (24) = −1, 318, todėl H0 tenka
atmesti.
5. Su tikimybe 1 − α = 0, 1 galime tvirtinti, kad šiemet
pirmakursiai mažesnių gabumų negu buvo prieš 5 metus.
Hipotezė apie dispersijos lygybę skaičiui
Statistinių hipotezių apie normalųjį skirstinį turinčios populiacijos
dispersijos lygybę skaičiui sprendimo taisyklės, kai vidurkis
nežinomas
1. Duomenys: X ∼ N (µ, σ 2 ), µ, σ 2 nežinomi.
2. Statistinė hipotezė. H0 : σ 2 = σ02 ; H1 : σ 2 6= σ02
3. Kriterijaus statistika:
 x − x̄) 2  x − x̄) 2  x − x̄ 2
1 2 n
K = + + ... +
σ0 σ0 σ0
(n − 1)s2
= ∼ χ2(n−1) , kai σ = σ0 .
σ02

Kai hipotezė H0 teisinga, statistikos K empirinė reikšmė Kemp


dažniau turėtų svyruoti apie 1.
O esant teisingai alternatyvai statistikos reikšmės dažniau turėtų
nuo 1 nukrypti.
Hipotezės priėmimo sritis turėtų būti apie 1.
Chi-kvadratu skirstinio kritinės reikšmės
4. Sprendimo taisyklė.

Hipotezė Altern. H0 atmetama, H0 neatmetama


H1 jei jei

H0 : σ 2 6= σ02 Kemp < χ21−α/2 (n − 1) χ21−α/2 (n − 1) <


arba Kemp > χ2α/2 (n − 1) < Kemp ir
Kemp < χ2α/2 (n − 1)

σ 2 = σ02 σ 2 > σ02 Kemp > χ2α (n − 1) Kemp ≤ χ2α (n − 1)

µ nežin. σ 2 < σ02 Kemp < χ21−α (n − 1) Kemp ≥ χ21−α (n − 1)

5. Išvados formulavimas.
Hipotezės apie dispersiją pavyzdys
Prieš pradėdamas eksperimentą, psichologas nori sudaryti grupes iš
populiacijos, kurios vidutinis testo reultatas būtų 85 balai, o
standartinis nuokrypis – 10 balų.
1. Vienos iš sudarytų grupių testo rezultatai yra: 85; 92; 93; 90;
81; 78; 76; 78; 77; 80; 89; 92; 94 (vidurkis – 85 balai). Ar ši grupė
sudaryta iš populiacijos, kurios σ 2 = 100, atstovų? α = 0, 05.
2. Statistinė hipotezė:
H0 : σ 2 = 100,
H1 : σ 2 6= 100.
3. Kriterijaus statistika
1
(85 − 85)2 + (92 − 85)2 + ... = 568/100 = 5, 68.

Kemp =
100
4. Sprendimo taisyklė. Kadangi
χ20,975 (12) = 4, 404 < Kemp = 5, 68 < 23, 336 = χ20,025 (12),
tai H0 neatmetama.
5. Taigi galima manyti, kad grupė sudaryta iš atstovų,
priklausančių populiacijai su norimomis savybėmis.
Neparametrinės hipotezės tikrinimo etapai
Hipotezė, kad atsitiktinio dydžio X skirstinys priklauso kokiai nors
skirstinių klasei, (pavyzdžiui, normalusis ar binominis) yra
neparametrinė.
1. Duomenys Kiekybinių duomenų imtis, kurios dydis n.
2. Duomenų grupavimas. Grupuojame imties duomenis į k
vienodo ilgio intervalų.
Visų intervalų dažniai fi ≥ 5

Intervalai [c0 , c1 ] (c1 , c2 ] ... (ck−2 , ck−1 ] (ck−1 , ck ]


Dažniai fi f1 f2 ... fk−1 fk
Santykiniai
dažniai fi /n f1 /n ... fk /n
Intervalų vidurio
taškai x?i x?1 ... x?k
Teorinės
tikimybės pi p1 ... pk
Teor.dažniai npi np1 ... npk
3. Statistinės hipotezės formulavimas. Prielaida apie skirstinio
tipą daroma, nubrėžus sugrupuotos imties santykinių dažnių
histogramą. Tegu F – skirstinys
H0 : X ∼ F ,
H1 : X ne F .
4. Teorinių tikimybių skaičiavimas. Skaičiuojamos tikimybės,
kad F skirstinį turinčio atsitiktinio dydžio reikšmės priklauso
intervalui [ci−1 , ci ):
pi = P (ci−1 < X ≤ ci ) = F (ci ) − F (ci−1 )
Dauginame pi iš imties dydžio n ir gauname teorinius intervalų
(ci−1 , ci ] dažnius npi , kurie turėtų būti, jei nulinė hipotezė H0
būtų teisinga.
5. Statistinis kriterijus:
k
X (fi − npi )2
K=
i=1
npi
6. Sprendimo taisyklė. Kai H0 teisinga, tai K ∼ χ2ν ,
ν = k − r − 1, k – intervalų skaičius, r – funkcijos F parametrų
skaičius.
Statistikos K reikšmių aibė: D = (0, ∞)
Hipotezės priėmimo sritis D0 = (0, χ2kr,α,ν ),
Hipotezės atmetimo sritis D1 = (χ2kr,α,ν , ∞)
Pasirenkame reikšmingumo lygmenį α ∈ (0, 1).
Statistikos K kritinė reikšmė χ2kr,α,ν tokia, kad pasirinktam α
galioja lygybė P (χ2ν > χ2kr,α,ν |H0 teisinga) = α
Apskaičiuojama empirinė statistikos reikšmė Kemp . Jei
Kemp > χ2kr,α,ν ⇒ H0 atmetame
Kemp ≤ χ2kr,α,ν ⇒ H0 atmesti nėra pagrindo. H0 priimame
su tikimybe 1 − α.
7. Išvados formulavimas
Neparametrinės hipotezės pavyzdys

1.Tiriamos Kauno miesto maisto prekių parduotuvių per dieną


gautos pajamos už parduotą produkciją. Surinkti duomenys apie
70 dienų prekybą. Jie pateikti tūkstančiais eurų.
2.Duomenys sugrupuoti ir užrašytas statistinis intervalinis
skirstinys:

(ci−1 ; ci ] [5;10] (10;15] (15;20] (20;25] (25;30] (30;35] (35;40] (40;45] Iš viso
ni 12 6 10 6 8 6 10 12 70
Braižoma histograma (juodi stupeliai). Kokį skirstinį ji primena?
I. Patikrinkime neparametrinę statistinę hipotezę apie tai, kad
prekybos pajamų skirstinys normalusis su reikšmingumo lygmeniu
α = 0, 1. (Ją turėtume atmesti)
3. Reikia nustatyti normaliojo skirstinio parametrus.
Imsime normaliojo skirstinio vidurkį ir dispersiją lygius imties
empiriniam vidurkiui ir dispersijai.
8 8
1 X 1 X
x̄? = x? fi = 25, 5; s?2 = (x? − x̄? )2 fi = 156.
70 i=1 i 70 − 1 i=1 i

Formuluojama hipotezė apie populiacijos normalųjį skirstinį:


H0 : X ∼ Φ ∼ N (25, 5; 156),
H1 : X ne Φ.
s = 12, 5.
4. Teorinių tikimybių skaičiavimas.
 c − 25, 5  c − 25, 5 
i i−1
pi = Φ(ci ) − Φ(ci−1 ) = Φ0,1 − Φ0,1
s s
5. Empirinė statistinio kriterijaus reikšmė
k
X (fi − npi )2
Kemp = = 9, 69.
i=1
npi

6. Sprendimo taisyklė
Nustatome kritinį tašką χ2kr α;ν , čia ν = k − r − 1.
k = 8, nes imtis sugrupuota į 8 intervalus.
r = 2, nes normaliojo atsitiktinio dydžio pasiskirstymo funkcija
priklauso nuo dviejų parametrų.
Tada ν = 8 − 2 − 1 = 5,
α = 0, 1 yra pasirinktas reikšmingumo lygmuo.
Iš χ2 skirstinio kritinių reikšmių lentelės randame χ2kr 0,1;5 = 9, 23.
D0 = (0; 9, 23], D1 = (9.23; ∞).
Kadangi
χ2kr 0,1;5 = 9, 23 < 9, 69 = Kemp ,
tai nulinė hipotezė H0 apie populiacijos normalųjį skirstinį
atmetama su reikšmingumo lygmeniu 0, 1.
7. Išvados formulavimas. Su tikimybe 1 − α = 1 − 0, 1 = 0, 9
galime teigti, kad prekybos pajamos per vieną dieną X nėra
pasiskirstę pagal normalųjį skirstinį N (25, 5; 156).
II. Dabar patikrinkime hipotezę apie tai, kad pajamos pasiskirstę
pagal tolygųjį dėsnį intervale X ∼ U [5, 45] (imties mažiausia ir
didžiausia reikšmės) su reikšmingumo lygmeniu α = 0, 1.
1...2...3. H0 : X ∼ U (5; 45),
H1 : X ne U (5; 45).
4. Tolygiojo skirstinio tankio funkcija intervale [5,45] pastovi, ir
lygi 1/(45-5)=1/40. Tikimybė patekti į bet kurį intervalą
10 − 5 5 70 7
p1 = = = p2 = ... = p8 , npi = = .
40 40 40 4
5. Empirinė statistinio kriterijaus reikšmė
k k
X (fi − npi )2 X (fi − 7/4)2
Kemp = = = 2, 31.
i=1
npi i=1
7/4
6. Sprendimo taisyklė. Tolygusis skirstinys taip pat kaip ir
normalusis turi du parametrus – intervalo galus, todėl jam kritinė
reikšmė su tuo pačiu reikmingumo lygmeniu α = 0, 1 yra ta pati:
χ2kr 0,1;5 = 9, 23.
Hipotezės priėmimo sritis irgi ta pati: D0 = (0; 9, 23],
Kemp = 2, 31 ∈ D0 , ir šios hipotezės atmesti su reikšmingumo
lygmeniu α = 0, 1 neturime pagrindo.
7. Išvada. Su tikimybe 0,9 tvirtiname, kad populiacijos, iš kurios
išrinkta imtis, skirstinys yra tolygusis intervale [5,45].
Atsitiktinių dydžių koreliacijos koeficientas

Apibrėžimas. Atsitiktinių dydžių X, Y koreliacijos koeficientas

Cov(X, Y ) √ √
ρ(X, Y ) = , σX = DX, σY = DY .
σX σY
Koreliacijos koeficiento savybės:
1) −1 ≤ ρ(X, Y ) ≤ 1
2) Jei X, Y nepriklausomi, tai ρ(X, Y ) = 0.
3) Jei Y = a + bX, čia a ir b – skaičiai, tai ρ(X, Y ) = ±1.
Koreliacijos koeficientas parodo atsitiktinių dydžių X, Y tiesinės
priklausomybės laipsnį.
ρ > 0 kai X didėja, tai ir Y didėja.
ρ < 0 kai X didėja, tai Y mažėja.
ρ ≈ 0 tarp X ir Y nėra tiesinės priklausomybės.
Koreliacijos koeficiento vertinimas

Jei (X, Y ) – populiacija, (X1 , Y1 ), ..., (Xn , Yn ) – imtis, tai


koreliacijos koeficiento įvertinys
1 Pn
n−1 i=1 (Xi− X̄)(Yi − Ȳ )
ρb(X, Y ) = ,
SX SY
n n
1X 1X
X̄ = Xi , Ȳ = Yi ,
n i=1 n i=1
n n
2 1 X 1 X
SX = (Xi − X̄)2 , SY2 = (Yi − Ȳ )2 .
n − 1 i=1 n − 1 i=1
Pavyzdys CO koreliacijos koeficientui skaičiuoti
Du dėstytojai taip įvertino studentų darbus:

x: 8 9 10 8 7 8 9
y: 7 7 10 9 8 10 8

x̄ = 8, 42, ȳ = 8, 42.
cov(x, y) = 0, 2857,
sx = 0, 9759,
sy = 1, 2724,
ρ̂(x, y) = 0, 23.

Tiesinė priklausomybė tarp dviejų dėstytojų įvertinimų yra nedidelė.


Hipotezės apie koreliacijos koeficiento lygybę 0
tikrinimas
1. Imties duomenys (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ).
2. Tikrinama hipotezė
H0 : ρ(X, Y ) = 0,
H1 : ρ(X, Y ) 6= 0.
q
n−2
3. Kriterijaus empirinė statistika Temp = ρ̂ 1−ρ̂2
, čia ρ̂ –
koreliacijos koeficiento realizacija (įvertis):
1 Pn
n−1 i=1 (xi − x̄)(yi − ȳ)
ρ̂ = ρ̂(X, Y ) =
sx sy

4. Sprendimo taisyklė. Jei H0 teisinga, tai T ∼ tα/2 (n − 2).


Pasirenkame reikšmingumo lygmenį α ∈ (0, 1).
Jei |T | > tα/2 (n − 2) ⇒ H0 atmetame,
Jei |T | ≤ tα/2 (n − 2) ⇒ H0 atmesti nėra pagrindo su
tikimybe 1 − α.
5. Išvados formulavimas
Pavyzdys hipotezei apie koreliacijos koeficiento
lygybę 0 tikrinti – pavyzdžio CO tęsinys
1. Imties duomenys
(8, 7), (9, 7), (10, 10), (8, 9), (7, 8), (8, 10), (9, 8).
2. Tikrinama hipotezė
H0 : ρ(X, Y ) = 0,
H1 : ρ(X, Y ) 6= 0.
3. Kriterijaus empirinė statistika
s s
n−2 7−2
Temp = ρ̂ = 0, 23 ≈ 0, 592.
1 − ρ̂2 1 − 0, 232
Kritinė reikšmė iš Stjudento skirstinio kritinių reikšmių lentelės
tα/2 (n − 2) = t0,05 (5) = 2, 015.
4. Sprendimo taisyklė. Kadangi
Temp = 0, 592 ≤ tα/2 (n − 2) = 0, 015 ⇒ H0 atmesti nėra pagrindo
su tikimybe 1 − α = 0, 95.
5. Išvados formulavimas. Su tikimybe 0,95 tvirtiname, kad
dviejų dėstytojų studentų darbų vertinimo rezultatai yra tiesiškai
nepriklausomi.
Ačiū už dėmesį!

You might also like