You are on page 1of 21

Testarea ipotezelor statistice

Etapele verificării ipotezelor statistice
– Identificarea ipotezelor (H
0
,H
1
) ce trebuie testate
– Alegerea testului statistic
– Specificarea nivelului de semnificaţie
– Stabilirea regiunii critice Rc
– Stabilirea unor presupuneri referitoare la populaţia ce va fi
eşantionată (ex: normalitate)
– Calcularea valorii testului pe baza datelor din eşantion
– Utilizarea valorii testului pentru a calcula p-value si respingerea
H
0
dacă p-value≤α
– Luarea deciziei statistice si aplicarea ei


I. Teste pentru media populaţiei:
dispersia σ
2
este cunoscută
Testul “z”
•Se formulează ipoteza
•Se extrage un eşantion aleator din populaţie
și se calculează media
•Se calculează valoarea statisticii z:

•Se stabileşte pragul de semnificaţie α (de regulă 0,05)
•Se compară valoarea calculată z cu o valoare tabelată zα
(valoare critică) şi se ia decizia de acceptare/respingere
0
/
x
z
n
µ
o
÷
=
1
: ( ,..., )
n
x x x
x
TEST
Ipoteza
nulă
H
0

Ipoteza
alternativă
H
A

Decizia
bilateral
µ = µ
0
µ ≠ µ
0

unilateral
dreapta
µ ≤µ
0
µ > µ
0

unilateral
stânga
µ ≥µ
0
µ < µ
0

/ 2 0
0
z z resping H
altfel accept H
o
¦ > ¬
¦
´
¬
¦
¹
0
0
z z resping H
altfel accept H
o
> ¬
¦
´
¬
¹
0
0
z z resping H
altfel accept H
o
< ÷ ¬
¦
´
¬
¹
Regiunea critică
μ μ μ
a) b) c)
Regiunea critică pentru:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
/ 2
z
o
÷
/ 2
z
o
z
o
z
o
÷
Exemplu
• Se știe că vânzările medii zilnice ale unui magazin alimentar
sunt de 8000 lei, cu o abatere standard de 1200 lei.Magazinul
organizează mai multe campanii publicitare pentru creşterea
vânzărilor.
Pentru a vedea dacă a crescut volumul vânzărilor ca efect al
publicităţii, se înregistrează vânzările zilnice pe o perioadă de
64 zile şi se obţine un volum mediu zilnic de 8250 lei.
Se poate afirma, folosind o probabilitate de 95%, că volumul
mediu al vânzărilor este semnificativ mai mare în urma
campaniei publicitare?
Soluţie-testul z
• Variabila de interes: X – volumul mediu al vânzărilor –
presupunem o distribuţie normală
• Dispersia populaţiei este cunoscută, deci aplicăm testul z.


Ipotezele (test unilateral dreapta):
H
0
: μ ≤ μ
0
H
1
: μ > μ
0

• Pragul de semnificaţie:
• Valoarea critică: z(0,05)=1,65
0.05 (5%) o =
1200
8250
8000
0
=
=
=
o
µ
x
• Valoarea testului:



• Verificarea:
z=1,67 > z(0,05)= 1,65 => respingem H
0

=> acceptam H1 : putem afirma cu probabilitatea de 95% că
volumul mediu al vânzărilor în urma capaniei publicitare
este semnificativ mai mare decât volumul mediu înainte de
efectuarea campaniei publicitare.
67 , 1
64
1200
8000 8250
=
÷
= z
Recomandări
• Un volum mare al eşantionului (n≥30) este adecvat când
utilizăm procedura de testare utilizată în această secţiune
(testul z)
• Dacă n< 30 trebuie avută în vedere distribuţia populaţiei
eşantionate şi anume:
– Dacă populaţia e normal distribuită, procedura de testare e
cea pe care am descris-o şi poate fi utilizată ptr orice volum
al eşantionului
– Dacă populaţia nu e normal distribuită, dar e aproape
simetrică, pentru un volum mic al eşantionului, procedura
de testare poate furniza rezultate acceptabile.
II. Teste pentru media populaţiei (μ) :
dispersia σ
2
este necunoscută
0
/
x
t
s n
µ ÷
=
Testul “t”
•Se estimează dispersia populaţiei cu dispersia de eşantion:


•Se aplică testul “t. Se calculează valoarea statisticii:



•Valorile critice se obtin din tabelele repartiţiei t (Student), în funcţie
de nivelul de semnificaţie α ales, cu n-1 grade de libertate

2
2
1
( )
1
n
i
i
x x
s
n
=
÷
=
÷
¿
Regiunea critică-testul t
μ μ μ
a) b) c)
Regiunea critică pentru
a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
/ 2; 1 n
t
o ÷
÷
/ 2; 1 n
t
o ÷ ; 1 n
t
o ÷ ; 1 n
t
o ÷
÷
Exemplul 1 – testul t
• Un producător de bere afirmă că volumul unei cutii
este de 0.33 litri. Inspectorii de calitate vor să verifice
acest lucru şi selectează aleator un eşantion de 16
cutii.
În urma prelucrării datelor, s-au obţinut următoarele
rezultate:





Confirmă datele afirmaţia producătorului? Folosiţi un
nivel de încredere de 95%.
1
2
1
5.25
( ) 23.04
n
i
i
n
i
i
x
x x
=
=
¦
=
¦
¦
´
¦
÷ =
¦
¹
¿
¿
• Variabila de interes: X – volumul unei cutii de bere –
presupunem o distribuţie normală
• Dispersia populaţiei este necunoscută - va trebui
estimată:



• Volumul mediu ipotetic:
• Volumul mediu din eşantion:

• Pragul de semnificaţie:
0
0.33 µ =
1
0.328
n
i
i
x
x
n
=
= =
¿
0.05 (5%) o =
2
2
1
( )
23.04
1.536
1 15
n
i
i
x x
s
n
=
÷
= = =
÷
¿
• Ipotezele:


• Valoarea critică:

• Valoarea testului:

• Verificarea:

• Decizia : cu probabilitatea 95% nu sunt suficiente
motive pentru a respinge ipoteza nulă.
0 0
0
:
:
A
H
H
µ µ
µ µ
=
¦
´
=
¹
/ 2; 1 0.05/ 2;15
2.48 ( , 1)
n
t t TINV n
o
o
÷
= = = ÷
0
0.382 0.33
0.00038
/ 1.24/ 16
x
t
s n
µ ÷ ÷
= = = ÷
/ 2; 1
0.00038 2.48
n
t t
o ÷
= < =
Ex. 2. Conducerea unei companii apelează la 5 experţi pentru a
previziona profitul în anul curent. Valorile previzionate: 2,60; 3,32;
1,80; 3,43; 2,00 (mld lei, preţurile anului anterior). Ştiind că profitul
companiei în anul anterior a fost de 2,01 mld. lei, media previziunilor
experţilor este semnificativ mai mare decât profitul anului anterior
(pentru α = 0,05)?

Rezolvare. Media previziunilor experţilor este mld. lei,
cu dispersia:



şi abaterea medie pătratică:


63 , 2 x =
5507 0
4
203 2
1
2
2
,
,
= =
÷
÷
=
n
x x
s
i
74 0
2
, = = s s

Testarea ipotezei statistice:
H
0
: μ = 2,01,
H
1
: μ > 2,01 (test unilateral dreapta).



t
α,n-1
= t
0,05;4
= 2,132 => regiunea critică: t > t
α,n-1

Cum t=1,874 < t
0,05;4
=2,132, nu putem respinge ipoteza că media
profitului previzionată de cei 5 experţi pentru anul curent este mai
mică decât profitul anului trecut, de 2,01 mld. lei.

874 , 1
5 / 74 , 0
01 , 2 63 , 2
=
÷
=
÷
=
n s
x
t
x
µ
Recomandări
• Aplicabilitatea procedurii de testare în cazul în care σ
2
e necunoscută,
depinde de distribuţia populaţiei eşantionate şi de mărimea eşantionului.
• Când populaţia e normal distribuită, procedura de testare furnizează acelaşi
rezultat pentru orice n.
• Când populaţia nu e normal distribuită, procedura de testare furnizează
rezultate aproximative:
– Pentru n≥30 rezultatele furnizate sunt bune în majoritatea cazurilor
– Dacă n< 30 şi populaţia e aproximativ normal distribuită, rezultatele
furnizate sunt acceptabile
– Dacă populaţia prezintă asimetrie puternică, atunci este recomandată
utilizarea eşantioanelor mai mari de 50 unităţi.

Testarea ipotezei privind proporţia populaţiei
• Pentru variabile alternative (variabile cu 2 variante: admis/respins,
DA/NU):
– media p în colectivitatea generală (proporţia succeselor) este
raportul dintre nr. cazurilor afirmative (cele care îndeplinesc
condiţia cerută) şi numărul total de cazuri;
– dispersia în colectivitatea generală e p(1-p), iar abaterea medie
pătratică este

– media pentru eşantion e notată cu w, dispersia w(1-w), abaterea
medie pătratică

• Pentru testarea ipotezelor statistice privind proporţia este necesar ca
np≥5 şi n(1-p)≥5 → numai în acest caz distribuţia proporţiei este
aproximativ normal distribuită.

) 1 ( p p ÷
) 1 ( w w ÷

Ipoteza nulă indică faptul că proporția este egală cu o valoare
specificată în timp ce ipoteza alternativă răspunde la una dintre
cele trei întrebări:

– dacă proporţia este diferită de valoarea specificată (test
bilateral):

– dacă proporţia este mai mare decât valoarea specificată (test
unilateral dreapta):

– dacă proporţia este mai mică decât valoarea specificată (test
unilateral stânga): .

0 1
: p p H =
0
:
1
p p H >
0 1
: p p H <
• Testul statistic pentru proporţia p este:



• Regiunea critică (Rc) este dată de:

sau pentru testul bilateral;
pentru testul unilateral dreapta;
pentru testul unilateral stânga.

n p p
p w
z
/ )
0
1 (
0
0
÷
÷
=
2 / o
z z ÷ <
2 / o
z z>
o
z z>
o
z z ÷ <
Ex. Managerul unui lanţ de magazine consideră (în urma unei analize
financiare) că pentru un nou produs comercializarea este profitabilă dacă
procentul cumpărătorilor care ar dori să achiziţioneze produsul este mai
mare de 12%. El selectează 400 de cumpărători potenţiali şi află că 52
dintre aceştia vor achiziţiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care să convingă managerul să comercializeze produsul?

Rezolvare
Ipotezele sunt: (test unilateral dreapta).

Testul statistic este:





Cum şi z= 1,25 < 2,33,rezultă că nu ne aflăm în regiunea
critică (Rc), deci nu avem suficiente dovezi să respingem ipoteza nulă
(procentul cumpărătorilor ≤12%) → recomandarea este să nu
comercializeze produsul.

12 , 0 :
0
= p H
12 , 0 :
1
> p H
25 , 1
016 , 0
02 , 0
400 / 88 , 0 12 , 0
12 , 0 14 , 0
/ )
0
1 (
0
12 , 0
= =
·
÷
=
÷
÷
=
n p p
w
z
33 , 2
01 . 0
= = z z
o