You are on page 1of 7

Weryfikacja hipotez statystycznych

Hipoteza statystyczna – każde przypuszczenie dotyczące rozkładu lub charakterystyk rozkładu


określonej zmiennej losowej wypowiedziane bez pełnej znajomości populacji generalnej.

Np.: Kobiety żyją dłużej od mężczyzn; Lekarstwo X jest bardziej skuteczne przy leczeniu
określonej choroby od lekarstwa Y; Partię rządzącą popiera 40% społeczeństwa.

Wyróżniamy hipotezy parametryczne (zakładające określony typ rozkładu, dotyczące


parametrów populacji generalnej) i nieparametryczne (pozostałe).

Wśród hipotez statystycznych możemy wyróżnić hipotezy:


– o tym, że wartość parametru równa się konkretnej liczbie,
– że parametr w 2 zbiorowościach równy jest tej samej liczbie,
– że parametr w 3 lub więcej zbiorowościach równy jest tej samej liczbie,
– że rozkład zmiennej losowej jest określonego typu (np. normalny),
– że rozkłady prawdopodobieństwa w 2 zbiorowościach są takie same,
– że rozkłady prawdopodobieństwa w 3 lub więcej zbiorowościach są takie same,
– o losowości,
– o niezależności,
– o jednomodalności,
– inne hipotezy.

Test statystyczny – procedura, która powinna doprowadzić do przyjęcia lub odrzucenia


hipotezy z małym ryzykiem popełnienia błędu.

Hipotezę możemy przyjąć lub odrzucić. Hipoteza może być prawdziwa lub fałszywa.

Jeśli hipoteza jest prawdziwa i ją przyjmujemy to OK (podejmujemy decyzję prawidłową).

Jeśli hipoteza jest fałszywa i ją odrzucamy to OK.


Jeśli hipoteza jest prawdziwa i ją odrzucamy to popełniamy błąd I rodzaju. Jego
prawdopodobieństwo nazywamy poziomem istotności i oznaczamy symbolem .
Jeśli hipoteza jest fałszywa i ją przyjmujemy to popełniamy błąd II rodzaju, którego
prawdopodobieństwo popełnienia oznaczamy symbolem .

Mocą testu nazywamy prawdopodobieństwo odrzucenia hipotezy fałszywej 1 – . Informuje


ono o skuteczności wykrywania nieprawdziwości weryfikowanej hipotezy i zależy w praktyce
od tego, jak bardzo nasza hipoteza jest odległa od rzeczywistości oraz od liczebności próby, na
podstawie której podejmujemy decyzję w procesie testowania. 

Im większa liczebność próby, tym większe prawdopodobieństwo wykrycia nawet małych


odstępstw między stanem zakładanym w badanej hipotezie, a rzeczywistością.
Im większa różnica między zakładanym stanem a rzeczywistością, tym łatwiej ją wykryć.

Prawdopodobieństwo błędnego odrzucenia prawdziwej weryfikowanej hipotezy jest najczęściej


określane z góry przez badacza. Zwykle  ≤ 0,1 (najczęściej  = 0,05). Mniejsza wartość
poziomu istotności oznacza mniejszą szansę na odrzucenie prawdziwej hipotezy, jednocześnie
trudniej odrzucić hipotezę fałszywą. Oznacza to, że różnica między zakładanym stanem, a
rzeczywistością musi być większa, aby uznać ją za nieprzypadkową (istotną statystycznie) lub
większa musi być liczebność próby.

Im mniejsze prawdopodobieństwa popełnienia błędów I i II rodzaju tym większe


prawdopodobieństwo, że nasza decyzja dotycząca przyjęcia albo odrzucenia weryfikowanej
hipotezy jest słuszna. Powinniśmy zatem dążyć do tego, aby wartości  i  były jak najmniejsze.
Udowodniono, że przy danej próbie n-elementowej zmniejszenie prawdopodobieństwa
popełnienia błędu I rodzaju powoduje wzrost prawdopodobieństwa popełnienia błędu II rodzaju
(i odwrotnie). Przy małym poziomie istotności  możemy uzyskać wymagany poziom
prawdopodobieństwa  odpowiednio zwiększając liczebność próby. Im bliższe zeru wartości
chcemy nadać dla  i  tym większa musi być liczebność próby, co oznacza sprzeczność z
naturalnym żądaniem zmniejszenia liczebności owej próby. Dobry test statystyczny powinien
zapewniać małe prawdopodobieństwo popełnienia zarówno błędu I jak i II rodzaju. Wybierać
zatem należy testy najmocniejsze (gwarantujące możliwie najmniejszą wartość ). Moc testu
określa się w sposób analityczny bądź szacuje poprzez badania symulacyjne, wykorzystując
generatory liczb losowych.
Test istotności, to taki rodzaj testu statystycznego, który pozwala na odrzucenie weryfikowanej
hipotezy z małym ryzykiem popełnienia błędu I rodzaju (nie jest rozważany błąd II rodzaju).

W testach istotności, aby nie popełnić błędu II rodzaju nie podejmujemy decyzji o przyjęciu
sprawdzanej hipotezy, stwierdzamy jedynie brak podstaw do odrzucenia tej hipotezy.

Hipoteza zerowa (H0) – sprawdzane (weryfikowane) przypuszczenie badawcze; określony sąd o


zbiorowości generalnej (dotyczący zwykle wartości parametru, równości parametrów,
przynależności, niezależności lub np. porównania typów rozkładu) zapisywany najczęściej
w postaci wzoru zawierającego znak równości.
(Np.:  = 100).

Hipoteza alternatywna (H1) – konkurencyjna hipoteza, którą przyjmiemy po odrzuceniu H0.


We wzorze określającym H1 występują zwykle znaki "<", "≠" lub ">" oznaczające istnienie
różnic między porównywanymi parametrami, typami rozkładu, itp. Hipoteza alternatywna jest
określana przez badacza. Od jej postaci zależy postać zbioru krytycznego.
(Np.:  > 100)

Statystyka testowa (sprawdzian hipotezy) – statystyka z próby, która pomoże nam zbadać
odstępstwa między zakładanym stanem, a stanem faktycznym, a przez to pomoże nam podjąć
odpowiednią decyzję dotyczącą H0. Wybieramy taką statystykę, która przy prawdziwości
hipotezy badawczej (H0) ma znany rozkład prawdopodobieństwa.
X  0
(Np.: U 
S
n , gdzie 0 = 100)
Znając rozkład możemy określić, które wartości owej statystyki (przy prawdziwości H0) są mało
prawdopodobne. Tworzą one tzw. zbiór krytyczny.

Zbiór krytyczny (zbiór odrzucenia, ZK) – zbiór wartości statystyki testowej powodujących
podjęcie decyzji o odrzuceniu hipotezy H0. Prawdopodobieństwo wystąpienia tych wartości jest
równe poziomowi istotności .

Liczby wyznaczające zbiór krytyczny (tzw. wartości krytyczne) odczytujemy z tablic


statystycznych rozkładu takiego jak rozkład statystyki testowej. W zależności od przyjętej
postaci hipotezy alternatywnej wyróżniamy zbiór krytyczny lewostronny (gdy w H 1 wykorzy-
stano znak "<"), obustronny ("≠") lub prawostronny (">"). ( Np.: Z K  u ;   )
Decyzja:
– jeśli wartość empiryczna statystyki testowej (obliczona na podstawie wyników pochodzących
z próby) należy do zbioru krytycznego, to na przyjętym poziomie istotności  (tzn.
z prawdopodobieństwem błędu ) odrzucamy hipotezę zerową i przyjmujemy hipotezę
alternatywną,
– jeśli wartość empiryczna statystyki testowej nie należy do zbioru krytycznego, to na przyjętym
poziomie istotności  stwierdzamy brak podstaw do odrzucenia hipotezy zerowej.
Nie oznacza to jeszcze przyjęcia H0. Przyjęcie hipotezy zerowej wiązałoby się z nieznanym
(nierozważanym przez test istotności) poziomem popełnienia błędu II rodzaju.

Schemat budowy testu istotności:

1. Określamy H0 i H1.
2. Przyjmujemy poziom istotności .
3. Wybieramy statystykę testową i obliczamy jej wartość empiryczną.
4. Wyznaczamy zbiór krytyczny.
5. Podejmujemy decyzję dotyczącą weryfikowanej hipotezy H0.

Korzystniejsza dla nas jest sytuacja, gdy odrzucimy hipotezę H0. Wiemy wtedy co przyjąć i jak
duży błąd możemy przy tym popełnić. Przydatna jest zatem wiadomość, na jaką wielkość błędu
I rodzaju powinniśmy się zgodzić (jaki poziom istotności należy przyjąć), aby można było
podjąć decyzję o odrzuceniu hipotezy zerowej. Na podstawie wyników próby, oblicza się taką
wartość graniczną prawdopodobieństwa błędu (p), przy której następuje zmiana decyzji
(z "odrzucić H0" na "brak podstaw do odrzucenia H0"). Jest to wartość prawdopodobieństwa
(czyli pole pod wykresem funkcji gęstości) zwana prawdopodobieństwem testowym (p-value)
odpowiadająca argumentowi równemu obliczonej wartości empirycznej statystyki testowej.
Wystarczy teraz porównać wyznaczoną wartość p z zakładanym poziomem istotności  (albo
inaczej: wybrać odpowiednią wartość poziomu istotności). Dla poziomów istotności  ≥ p
należy przyjąć hipotezę alternatywną, po uprzednim odrzuceniu hipotezy zerowej
(przypomnijmy, że jest to dla nas sytuacja korzystniejsza). Dla poziomów istotności  < p
stwierdzamy brak podstaw do odrzucenia hipotezy H0.
I TEST ISTOTNOŚCI DLA ŚREDNIEJ

Należy zweryfikować hipotezę: Ho:  = o


wobec hipotezy alternatywnej:
H1:  < o albo H1:   o albo H1:  >o

a) X~ N   ,   - znane,  - nieznane

X  o
statystyka testowa: U n,

Tworzymy obszar krytyczny ZK tak aby:


PU  u    
P U  u    PU  u   

Z K   , u* Z K   , u  u , Z K  u* ,  


* *
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym ( u ≠ u )
Jeżeli U  ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli U  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.

b) X~ N   ,  ,  ,  - nieznane, n - małe ( n  30 )

X  o X  o
t n n 1
Sˆ S

Tworzymy obszar krytyczny tak aby:


Pt  t    
P t  t   Pt  t   

Z K   , t2 
ZK  ,t  t , ZK  t2 ,
gdzie t  - wartość zmiennej losowej t o rozkładzie t-Studenta z n - 1 stopniami swobody
Jeżeli t  ZK to na poziomie istotności  odrzucamy hipotezę zerową Ho na korzyść hipotezy alternatywnej H1
Jeżeli t  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.

c) X - dowolny rozkład, n - duże ( n  30 )

X  o
U n,
S

Tworzymy obszar krytyczny tak aby:


PU  u    
P U  u    PU  u   

Z K   , u *
Z K   , u  u , Z K  u* ,  
*
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym
Jeżeli U  ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli U  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.
II TEST ISTOTNOŚCI DLA WARIANCJI

Należy zweryfikować hipotezę: Ho:  2   20


wobec hipotezy alternatywnej:
H1:  2   20 albo H1:  2   20 albo H1:  2   20

Uwaga: najczęściej przyjmuje się H1: 2 > 2, gdyż w praktyce niekorzystna jest sytuacja, gdy wariancja cechy jest duża.
Teoretycznie nie ma przeciwskazań aby 2 < 2 lub 2  2.
a) X~ N   ,  ,  ,  - nieznane, n - małe ( n  30 )

  2 nS 2

n  1Sˆ 2
 02  02
Tworzymy obszar krytyczny tak aby:

 
P  2   2   
P  2  12    
2
oraz 
P  2   2   
2
 
P  2   2  


2 2

ZK  0,  12 Z K  0, 12    2 , Z K   2 ,


2 2

 2 , 12  , 2 , 12 - wartości zmiennej losowej  2 o rozkładzie chi-kwadrat z n  1 stopniami swobody,
2 2

Jeżeli  2 ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli  2  Z K to na poziomie istotności  brak podstaw do odrzucenia hipotezy zerowej Ho.

b) X~ N   ,  ,  ,  - nieznane, n - duże ( n  30 )
2 nS 2
U  2n  3
 20
Tworzymy obszar krytyczny tak aby:
PU  u    
P U  u    PU  u   

Z K   , u* Z K   , u  u , Z K  u* ,  


*
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym
Jeżeli U  ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli U  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.

III TEST ISTOTNOŚCI DLA WSKAŹNIKA STRUKTURY


Należy zweryfikować hipotezę: Ho: p = po
wobec hipotezy alternatywnej:
H1: p < po albo H1: p  po albo H1: p > po

X - ma rozkład dwupunktowy, n - duże ( n  100 )


m
 p0
U n
p0 1  p0 
n
Tworzymy obszar krytyczny tak aby:
PU  u    
P U  u    PU  u   

Z K   , u* Z K   , u  u , Z K  u* ,  


*
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym
Jeżeli U  ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli U  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.
IV TEST ISTOTNOŚCI DLA PARAMETRU MODELU REGRESJI

Należy zweryfikować hipotezę: Ho: i = 0 (i – numer zmiennej)


wobec hipotezy alternatywnej:
H1: i < 0 albo H1: i ≠ 0 albo H1: i > 0

Statystyka testowa:
ai
t
D ai 
ai – ocena parametru i
Tworzymy obszar krytyczny tak aby: D(ai) – średni błąd szacunku parametru i

Pt  t     
P t  t   Pt  t   

Z K   , t2 ZK  ,t  t , ZK  t2 ,
gdzie t  , t 2 - wartości zmiennej losowej t o rozkładzie t-Studenta z n - 2 stopniach swobody
Jeżeli t  ZK to na poziomie istotności  odrzucamy hipotezę zerową Ho na korzyść hipotezy alternatywnej H1
Jeżeli t  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.

V TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA KORELACJI LINIOWEJ

Należy zweryfikować hipotezę: Ho:  (X,Y) = 0


wobec hipotezy alternatywnej:
H1:  (X,Y) < 0 albo H1:  (X,Y) ≠ 0 albo H1:  (X,Y) > 0

X ~ N 1 , 1  , Y ~ N 2 , 2  ,
R
t n2
1  R2

Tworzymy obszar krytyczny tak aby:


Pt  t    
P t  t   Pt  t   

Z K   , t2 
ZK  ,t  t , ZK  t2 ,
gdzie t  , t 2 - wartości zmiennej losowej t o rozkładzie t-Studenta z n - 2 stopniami swobody
Jeżeli t  ZK to na poziomie istotności  odrzucamy hipotezę zerową Ho na korzyść hipotezy alternatywnej H1
Jeżeli t  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.

You might also like