Weryfikacja Hipotez Statystycznych

Weryfikacja hipotez statystycznych
Hipoteza statystyczna – każde przypuszczenie dotyczące rozkładu lub charakterystyk rozkładu

określonej zmiennej losowej wypowiedziane bez pełnej znajomości populacji generalnej.
Np.: Kobiety żyją dłużej od mężczyzn; Lekarstwo X jest bardziej skuteczne przy leczeniu
określonej choroby od lekarstwa Y; Partię rządzącą popiera 40% społeczeństwa.
Wyróżniamy hipotezy parametryczne (zakładające określony typ rozkładu, dotyczące

parametrów populacji generalnej) i nieparametryczne (pozostałe).
Wśród hipotez statystycznych możemy wyróżnić hipotezy:

– o tym, że wartość parametru równa się konkretnej liczbie,
– że parametr w 2 zbiorowościach równy jest tej samej liczbie,
– że parametr w 3 lub więcej zbiorowościach równy jest tej samej liczbie,
– że rozkład zmiennej losowej jest określonego typu (np. normalny),
– że rozkłady prawdopodobieństwa w 2 zbiorowościach są takie same,
– że rozkłady prawdopodobieństwa w 3 lub więcej zbiorowościach są takie same,
– o losowości,
– o niezależności,
– o jednomodalności,
– inne hipotezy.
Test statystyczny – procedura, która powinna doprowadzić do przyjęcia lub odrzucenia

hipotezy z małym ryzykiem popełnienia błędu.
Hipotezę możemy przyjąć lub odrzucić. Hipoteza może być prawdziwa lub fałszywa.
Jeśli hipoteza jest prawdziwa i ją przyjmujemy to OK (podejmujemy decyzję prawidłową).
Jeśli hipoteza jest fałszywa i ją odrzucamy to OK.

Jeśli hipoteza jest prawdziwa i ją odrzucamy to popełniamy błąd I rodzaju. Jego
prawdopodobieństwo nazywamy poziomem istotności i oznaczamy symbolem .
Jeśli hipoteza jest fałszywa i ją przyjmujemy to popełniamy błąd II rodzaju, którego
prawdopodobieństwo popełnienia oznaczamy symbolem .
Mocą testu nazywamy prawdopodobieństwo odrzucenia hipotezy fałszywej 1 – . Informuje

ono o skuteczności wykrywania nieprawdziwości weryfikowanej hipotezy i zależy w praktyce
od tego, jak bardzo nasza hipoteza jest odległa od rzeczywistości oraz od liczebności próby, na
podstawie której podejmujemy decyzję w procesie testowania. 
Im większa liczebność próby, tym większe prawdopodobieństwo wykrycia nawet małych

odstępstw między stanem zakładanym w badanej hipotezie, a rzeczywistością.
Im większa różnica między zakładanym stanem a rzeczywistością, tym łatwiej ją wykryć.
Prawdopodobieństwo błędnego odrzucenia prawdziwej weryfikowanej hipotezy jest najczęściej

określane z góry przez badacza. Zwykle  ≤ 0,1 (najczęściej  = 0,05). Mniejsza wartość
poziomu istotności oznacza mniejszą szansę na odrzucenie prawdziwej hipotezy, jednocześnie
trudniej odrzucić hipotezę fałszywą. Oznacza to, że różnica między zakładanym stanem, a
rzeczywistością musi być większa, aby uznać ją za nieprzypadkową (istotną statystycznie) lub
większa musi być liczebność próby.
Im mniejsze prawdopodobieństwa popełnienia błędów I i II rodzaju tym większe

prawdopodobieństwo, że nasza decyzja dotycząca przyjęcia albo odrzucenia weryfikowanej
hipotezy jest słuszna. Powinniśmy zatem dążyć do tego, aby wartości  i  były jak najmniejsze.
Udowodniono, że przy danej próbie n-elementowej zmniejszenie prawdopodobieństwa
popełnienia błędu I rodzaju powoduje wzrost prawdopodobieństwa popełnienia błędu II rodzaju
(i odwrotnie). Przy małym poziomie istotności  możemy uzyskać wymagany poziom
prawdopodobieństwa  odpowiednio zwiększając liczebność próby. Im bliższe zeru wartości
chcemy nadać dla  i  tym większa musi być liczebność próby, co oznacza sprzeczność z
naturalnym żądaniem zmniejszenia liczebności owej próby. Dobry test statystyczny powinien
zapewniać małe prawdopodobieństwo popełnienia zarówno błędu I jak i II rodzaju. Wybierać
zatem należy testy najmocniejsze (gwarantujące możliwie najmniejszą wartość ). Moc testu
określa się w sposób analityczny bądź szacuje poprzez badania symulacyjne, wykorzystując
generatory liczb losowych.
Test istotności, to taki rodzaj testu statystycznego, który pozwala na odrzucenie weryfikowanej
hipotezy z małym ryzykiem popełnienia błędu I rodzaju (nie jest rozważany błąd II rodzaju).
W testach istotności, aby nie popełnić błędu II rodzaju nie podejmujemy decyzji o przyjęciu
sprawdzanej hipotezy, stwierdzamy jedynie brak podstaw do odrzucenia tej hipotezy.
Hipoteza zerowa (H0) – sprawdzane (weryfikowane) przypuszczenie badawcze; określony sąd o

zbiorowości generalnej (dotyczący zwykle wartości parametru, równości parametrów,
przynależności, niezależności lub np. porównania typów rozkładu) zapisywany najczęściej
w postaci wzoru zawierającego znak równości.
(Np.:  = 100).
Hipoteza alternatywna (H1) – konkurencyjna hipoteza, którą przyjmiemy po odrzuceniu H0.

We wzorze określającym H1 występują zwykle znaki "<", "≠" lub ">" oznaczające istnienie
różnic między porównywanymi parametrami, typami rozkładu, itp. Hipoteza alternatywna jest
określana przez badacza. Od jej postaci zależy postać zbioru krytycznego.
(Np.:  > 100)
Statystyka testowa (sprawdzian hipotezy) – statystyka z próby, która pomoże nam zbadać
odstępstwa między zakładanym stanem, a stanem faktycznym, a przez to pomoże nam podjąć
odpowiednią decyzję dotyczącą H0. Wybieramy taką statystykę, która przy prawdziwości
hipotezy badawczej (H0) ma znany rozkład prawdopodobieństwa.
X  0
(Np.: U 
S
n , gdzie 0 = 100)
Znając rozkład możemy określić, które wartości owej statystyki (przy prawdziwości H0) są mało
prawdopodobne. Tworzą one tzw. zbiór krytyczny.
Zbiór krytyczny (zbiór odrzucenia, ZK) – zbiór wartości statystyki testowej powodujących
podjęcie decyzji o odrzuceniu hipotezy H0. Prawdopodobieństwo wystąpienia tych wartości jest
równe poziomowi istotności .
Liczby wyznaczające zbiór krytyczny (tzw. wartości krytyczne) odczytujemy z tablic

statystycznych rozkładu takiego jak rozkład statystyki testowej. W zależności od przyjętej
postaci hipotezy alternatywnej wyróżniamy zbiór krytyczny lewostronny (gdy w H 1 wykorzy-
stano znak "<"), obustronny ("≠") lub prawostronny (">"). ( Np.: Z K  u ;   )
Decyzja:
– jeśli wartość empiryczna statystyki testowej (obliczona na podstawie wyników pochodzących
z próby) należy do zbioru krytycznego, to na przyjętym poziomie istotności  (tzn.
z prawdopodobieństwem błędu ) odrzucamy hipotezę zerową i przyjmujemy hipotezę
alternatywną,
– jeśli wartość empiryczna statystyki testowej nie należy do zbioru krytycznego, to na przyjętym
poziomie istotności  stwierdzamy brak podstaw do odrzucenia hipotezy zerowej.
Nie oznacza to jeszcze przyjęcia H0. Przyjęcie hipotezy zerowej wiązałoby się z nieznanym
(nierozważanym przez test istotności) poziomem popełnienia błędu II rodzaju.
Schemat budowy testu istotności:
1. Określamy H0 i H1.
2. Przyjmujemy poziom istotności .
3. Wybieramy statystykę testową i obliczamy jej wartość empiryczną.
4. Wyznaczamy zbiór krytyczny.
5. Podejmujemy decyzję dotyczącą weryfikowanej hipotezy H0.
Korzystniejsza dla nas jest sytuacja, gdy odrzucimy hipotezę H0. Wiemy wtedy co przyjąć i jak
duży błąd możemy przy tym popełnić. Przydatna jest zatem wiadomość, na jaką wielkość błędu
I rodzaju powinniśmy się zgodzić (jaki poziom istotności należy przyjąć), aby można było
podjąć decyzję o odrzuceniu hipotezy zerowej. Na podstawie wyników próby, oblicza się taką
wartość graniczną prawdopodobieństwa błędu (p), przy której następuje zmiana decyzji
(z "odrzucić H0" na "brak podstaw do odrzucenia H0"). Jest to wartość prawdopodobieństwa
(czyli pole pod wykresem funkcji gęstości) zwana prawdopodobieństwem testowym (p-value)
odpowiadająca argumentowi równemu obliczonej wartości empirycznej statystyki testowej.
Wystarczy teraz porównać wyznaczoną wartość p z zakładanym poziomem istotności  (albo
inaczej: wybrać odpowiednią wartość poziomu istotności). Dla poziomów istotności  ≥ p
należy przyjąć hipotezę alternatywną, po uprzednim odrzuceniu hipotezy zerowej
(przypomnijmy, że jest to dla nas sytuacja korzystniejsza). Dla poziomów istotności  < p
stwierdzamy brak podstaw do odrzucenia hipotezy H0.
I TEST ISTOTNOŚCI DLA ŚREDNIEJ
Należy zweryfikować hipotezę: Ho:  = o

wobec hipotezy alternatywnej:
H1:  < o albo H1:   o albo H1:  >o
a) X~ N   ,   - znane,  - nieznane
X  o
statystyka testowa: U n,

Tworzymy obszar krytyczny ZK tak aby:

PU  u    
P U  u    PU  u   
Z K   , u* Z K   , u  u , Z K  u* ,  

* *
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym ( u ≠ u )
Jeżeli U  ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli U  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.
b) X~ N   ,  ,  ,  - nieznane, n - małe ( n  30 )
X  o X  o
t n n 1
Sˆ S
Tworzymy obszar krytyczny tak aby:

Pt  t    
P t  t   Pt  t   

Z K   , t2 
ZK  ,t  t , ZK  t2 ,
gdzie t  - wartość zmiennej losowej t o rozkładzie t-Studenta z n - 1 stopniami swobody
Jeżeli t  ZK to na poziomie istotności  odrzucamy hipotezę zerową Ho na korzyść hipotezy alternatywnej H1
Jeżeli t  ZK to na poziomie istotności  nie ma podstaw do odrzucenia hipotezy zerowej Ho.
c) X - dowolny rozkład, n - duże ( n  30 )
X  o
U n,
S

PU  u    
P U  u    PU  u   
Z K   , u *
Z K   , u  u , Z K  u* ,  
*
gdzie u , u - wartości zmiennej losowej U o rozkładzie normalnym standaryzowanym
II TEST ISTOTNOŚCI DLA WARIANCJI
Należy zweryfikować hipotezę: Ho:  2   20

H1:  2   20 albo H1:  2   20 albo H1:  2   20
Uwaga: najczęściej przyjmuje się H1: 2 > 2, gdyż w praktyce niekorzystna jest sytuacja, gdy wariancja cechy jest duża.
Teoretycznie nie ma przeciwskazań aby 2 < 2 lub 2  2.
a) X~ N   ,  ,  ,  - nieznane, n - małe ( n  30 )
  2 nS 2

n  1Sˆ 2
 02  02
 
P  2   2   
P  2  12    
2
oraz 
P  2   2   
2
 
P  2   2  

2 2
ZK  0,  12 Z K  0, 12    2 , Z K   2 ,

2 2
 2 , 12  , 2 , 12 - wartości zmiennej losowej  2 o rozkładzie chi-kwadrat z n  1 stopniami swobody,
2 2
Jeżeli  2 ZK to odrzucamy hipotezę zerową Ho z prawdopodobieństwem błędu  na korzyść hipotezy alternatywnej H1
Jeżeli  2  Z K to na poziomie istotności  brak podstaw do odrzucenia hipotezy zerowej Ho.
b) X~ N   ,  ,  ,  - nieznane, n - duże ( n  30 )
2 nS 2
U  2n  3
 20
PU  u    
P U  u    PU  u   
Z K   , u* Z K   , u  u , Z K  u* ,  

*
III TEST ISTOTNOŚCI DLA WSKAŹNIKA STRUKTURY

Należy zweryfikować hipotezę: Ho: p = po
H1: p < po albo H1: p  po albo H1: p > po
X - ma rozkład dwupunktowy, n - duże ( n  100 )

m
 p0
U n
p0 1  p0 
n
PU  u    
P U  u    PU  u   
Z K   , u* Z K   , u  u , Z K  u* ,  

*
IV TEST ISTOTNOŚCI DLA PARAMETRU MODELU REGRESJI
Należy zweryfikować hipotezę: Ho: i = 0 (i – numer zmiennej)

H1: i < 0 albo H1: i ≠ 0 albo H1: i > 0
Statystyka testowa:
ai
t
D ai 
ai – ocena parametru i
Tworzymy obszar krytyczny tak aby: D(ai) – średni błąd szacunku parametru i
Pt  t     
P t  t   Pt  t   

Z K   , t2 ZK  ,t  t , ZK  t2 ,
gdzie t  , t 2 - wartości zmiennej losowej t o rozkładzie t-Studenta z n - 2 stopniach swobody
V TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA KORELACJI LINIOWEJ
Należy zweryfikować hipotezę: Ho:  (X,Y) = 0

H1:  (X,Y) < 0 albo H1:  (X,Y) ≠ 0 albo H1:  (X,Y) > 0
X ~ N 1 , 1  , Y ~ N 2 , 2  ,
R
t n2
1  R2

Pt  t    
P t  t   Pt  t   

Z K   , t2 
ZK  ,t  t , ZK  t2 ,
gdzie t  , t 2 - wartości zmiennej losowej t o rozkładzie t-Studenta z n - 2 stopniami swobody

Weryfikacja Hipotez Statystycznych - Teoria

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Weryfikacja Hipotez Statystycznych - Teoria

Uploaded by

Copyright:

Available Formats

Hipoteza statystyczna – każde przypuszczenie dotyczące rozkładu lub charakterystyk rozkładu

Wyróżniamy hipotezy parametryczne (zakładające określony typ rozkładu, dotyczące

Wśród hipotez statystycznych możemy wyróżnić hipotezy:

Test statystyczny – procedura, która powinna doprowadzić do przyjęcia lub odrzucenia

Jeśli hipoteza jest prawdziwa i ją przyjmujemy to OK (podejmujemy decyzję prawidłową).

Jeśli hipoteza jest fałszywa i ją odrzucamy to OK.

Mocą testu nazywamy prawdopodobieństwo odrzucenia hipotezy fałszywej 1 – . Informuje

Im większa liczebność próby, tym większe prawdopodobieństwo wykrycia nawet małych

Prawdopodobieństwo błędnego odrzucenia prawdziwej weryfikowanej hipotezy jest najczęściej

Im mniejsze prawdopodobieństwa popełnienia błędów I i II rodzaju tym większe

Hipoteza zerowa (H0) – sprawdzane (weryfikowane) przypuszczenie badawcze; określony sąd o

Hipoteza alternatywna (H1) – konkurencyjna hipoteza, którą przyjmiemy po odrzuceniu H0.

Liczby wyznaczające zbiór krytyczny (tzw. wartości krytyczne) odczytujemy z tablic

Schemat budowy testu istotności:

Należy zweryfikować hipotezę: Ho:  = o

Tworzymy obszar krytyczny ZK tak aby:

Z K   , u* Z K   , u  u , Z K  u* ,  

Tworzymy obszar krytyczny tak aby:

c) X - dowolny rozkład, n - duże ( n  30 )

Tworzymy obszar krytyczny tak aby:

Należy zweryfikować hipotezę: Ho:  2   20

ZK  0,  12 Z K  0, 12    2 , Z K   2 ,

Z K   , u* Z K   , u  u , Z K  u* ,  

III TEST ISTOTNOŚCI DLA WSKAŹNIKA STRUKTURY

X - ma rozkład dwupunktowy, n - duże ( n  100 )

Z K   , u* Z K   , u  u , Z K  u* ,  

Należy zweryfikować hipotezę: Ho: i = 0 (i – numer zmiennej)

V TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA KORELACJI LINIOWEJ

Należy zweryfikować hipotezę: Ho:  (X,Y) = 0

Tworzymy obszar krytyczny tak aby:

You might also like