You are on page 1of 38

1

ECONOMETRIE
- Curs 10 -
2
Tematic C10
Ipoteze statistice
Media erorilor egal cu zero
Homoscedasticitatea

Ipotezele statistice care se formuleaz n
modelarea econometric sunt ipoteze asupra
componentei aleatoare (erorilor) i ipoteze asupra
componentei deterministe (variabilelor
independente).
3
Ipotezele asupra componentei aleatoare
(erorilor) sunt urmtoarele:
a. Media erorilor este nul: M(
i
)=0.
b. Ipoteza de homoscedasticitate: V(
i
)=
2
.
c. Ipoteza de normalitate:
d. Ipoteza de necorelare sau de independen
a erorilor: cov(
i,

i
)=0.

) , 0 ( ~
2
o c N
i
4
a. Media erorilor este nul

1. Definire: M(
i
)=0.

2. Efectele nclcrii acestei ipoteze:
- dac aceast ipotez este nclcat, atunci se
modific proprietile estimatorilor parametrilor
modelului de regresie.

5


Exist dou situaii:

a) M(
i
)==constant

Considerm Y =
0
+
1
x
i
+ .

Fie Y =
0
+ +
1
x
i
+ =
0

*
+
1
x
i
+ *, unde:

0

* =

0
+ , iar * = .

Parametrul este estimat deplasat de estimatorul
:


Parametrul
1
este estimat nedeplasat de estimatorul .


1

|
0
| | | + =
0
*
0
)

( M
*
0

|
6
b) M(
i
)=
i
Considerm Y
i
=
0
+
i
+
1
x
i
+
i
=
0

*
+
1
x
i
+ *,
Parametrul
1
este estimat deplasat de estimatorul :




Etape:
- Se estimeaz modelul de regresie y
i
=
0
+
1
x
i
+ e
i
- Se determin erorile estimate e
i
= y
i
b
0
b
1
x
i

- Se verific dac media erorilor este zero.
( )

+ =
2
2
1 1
)

(
i i
i i i i
x x n
x x n
M

| |
1

|
7
3. Testarea ipotezei cu privire la media erorilor
Ipoteze:
H
0
: M(
i
)=0
H
1
:
Alegerea testului:

Calculul statisticii test:

Valoarea teoretic a testului: t
/2,n-1

Decizie

) ( M

i
calc
s
) e ( M
t
c
=
( ) ( )
( ) ( ) i
i i
M

M M

t
c
c c
=
0 ) ( M i = c
8
4. Exemplu
One-Sample Statistics
15 ,0000000 73271,63549 18918,65 Unstandardized Residual
N Mean Std. Deviation
Std. Error
Mean
Residuals Statistics
a
58508,12 6084511 1582428 1957596,554 15
-98125,2 131202,7 ,00000 73271,63549 15
-,778 2,300 ,000 1,000 15
-1,290 1,725 ,000 ,964 15
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum Mean Std. Deviation N
Dependent Variable: salariu
a.
One-Sample Test
,000 14 1,000 ,00000000 -40576,5 40576,48 Unstandardized Residual
t df Sig. (2-tailed)
Mean
Dif f erence Lower Upper
95% Conf idence
Interval of the
Dif f erence
Test Value = 0
9
5. Corectarea modelului
Modelul iniial se corecteaz cu ajutorul
estimaiei erorilor calculate la nivelul
eantionului.
Modelul corectat este de forma:

, unde:

i i i 0
*
i
u x y + + = | |
) ( M y y
i i
*
i
c =
10
b. Ipoteza de homoscedasticitate a erorilor
1. Definire
- ipoteza de homoscedasticitate presupune ca
variana erorilor s fie constant:


- aceast ipotez presupune o varian constant a
erorilor la nivelul distribuiilor condiionate de forma
.

2
i
) ( V o c =
i
x X Y =
11
2. Efectele nclcrii acestei ipoteze
pierderea eficienei estimatorilor parametrilor modelului
de regresie (estimeaz parametrul cu o varian mai
mare).

3. Identificarea heteroscedasticitii

3.1. Procedee grafice
- presupun reprezentarea distribuiei erorilor i aprecierea
varianei acesteia.
12
- cazul existenei heteroscedasticitii:
13
3.2. Procedee numerice
a. Testul Glejser
are la baz un model de regresie ntre variabila
rezidual estimat i variabila independent.

Etapele testrii:
1. Se estimeaz modelul de regresie de forma:


2. Se calculeaz erorile e
i
.
3. Se construiete un model de regresie pe baza
erorilor estimate n valoare absolut i variabila
independent. Exemplu:

c | | + + = X Y
1 0
i i i
u x + + =
1 0
o o c
14
4. Se testeaz parametrii acestui model: dac
parametrul
1
este semnificativ, atunci modelul iniial
este heteroscedastic.

Exemplu:
Coefficients
a
50921,663 12000,771 4,243 ,001
,016 ,012 ,348 1,337 ,204
(Constant)
PIB
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: erori
a.
15
b. Testul corelaiei neparametrice dintre erorile estimate i
valorile variabilei independente

- se bazeaz pe calculul rangurilor valorilor estimate ale
erorilor,
i
, i a valorilor X
i
.

Ipoteze statistice:
H
0
: ipoteza de homoscedasticitate
H
1
: ipoteza de heteroscedasticitate

16
Statistica test:
Se folosete statistica test t Student:



unde: r este estimaia coeficientului Spearman.

Regula de decizie:
t
calc
>t
teor
sau o valoare a lui Sig. asociat statisticii test t
Student calculate < 0,05 duce la respingerea ipotezei H
o
.

2
1
2
r
n r
t
calc

=
17
Exemplu:
n studiul legturii dintre dou variabile, X i Y, s-au obinut
urmtoarele rezultate:










Se cere s se testeze ipoteza de homoscedasticitate, considernd un risc
de 0,05.

Cor relations
1,000 ,000
. 1,000
5 5
,000 1,000
1,000 .
5 5
Correlation Coef f icient
Sig. (2-tailed)
N
Correlation Coef f icient
Sig. (2-tailed)
N
X
Unstandardized Residual
Spearman's rho
X
Unstandardiz
ed Residual
18

Rezolvare:

Pentru aceasta, se formuleaz urmtoarele
ipoteze statistice:
H
0
: ipoteza de homoscedasticitate
H
1
: ipoteza de heteroscedasticitate
Statistica test :

2

1
2 n

t
u
u

=
19
Coeficientul Spearman este:

Statistica test t Student se calculeaz astfel:


- pentru exemplul dat:


Deci, se accept, cu o probabilitate de 0,95, ipoteza Ho,
ipoteza de homoscedasticitate.

0 r =
0
0 1
2 5 0
r 1
2 n r
t
2
calc
=

=
) 182 , 3 ( ) 0 (
3 ; 025 , 0
= < = t t
calc
20
c. Testul Goldfeld-Quandt
Ipoteze statistice:

H
0
: ipoteza de homoscedasticitate
H
1
: ipoteza de heteroscedasticitate

21
Etape pentru calculul statisticii test:
- se ordoneaz cresctor seria valorilor empirice x
i
.

- se mparte seria n dou pri egale, dup omiterea unui
set de date din centrul seriei (n cazul seriilor cu un
numr mare de termeni);

- se estimeaz parametrii ecuaiei de regresie pentru
fiecare din cele dou seturi de date i se calculeaz
variaia rezidual (RSS) pentru fiecare model n parte;
22
- se calculeaz statistica test Fisher care compar
cele dou variaii reziduale:



unde: RSS
1
corespunde celei mai mici valori a variaiei
reziduale.
F urmeaz o lege de distribuie F( ),

unde: l reprezint numrul de termeni eliminai din
seria iniial
1
2
RSS
RSS
F
calc
=
k
l n
k
l n

2
,
2
23
Regula de decizie:

- dac sau Sig.<0.05, atunci se
respinge ipoteza Ho.


Exemplu:

Pentru dou variabile, X i Y, se cunosc urmtoarele
valori:

k n k n calc
F F

>
2 1 ; ; 05 , 0
24
x
i
y
i
2 15
3 20
1 10
4 19
6 25
5 23
7 30
8 35
9 38
10 40
25
Se cere s se testeze ipoteza de homoscedasticitate,
folosind testul Goldfeld-Quandt.

Rezolvare:
1. Se ordoneaz cresctor irul valorilor x
i
.
2. Se mparte seria valorilor x
i
n dou serii: prima serie
este reprezentat de valorile 1, 2, , 5; iar a doua
serie este reprezentat de valorile 6, 7, , 10.
26
3. Pentru fiecare din cele dou serii se estimeaz
parametrii modelului de regresie. Se obine:

Seria 1: Y
x
=8,3+3X
Seria 2: Y
x
=3,2+3,8X

4. Pentru aceste modele, se estimeaz variaia rezidual
(valoare prezentat n output-ul ANOVA):
- pentru seria 1: RSS=3,73;
- pentru seria 2: RSS=1,6.
27
5. Se calculeaz raportul F, considernd RSS
1
cea
mai mic valoare, i anume RSS
1
=1,6:
F
calc
=3,73/1,6=2,33.

6. Se compar valoarea calculat a statisticii test F cu
valoarea teoretic:


(k este numrul de parametri estimai).

. 277 , 9
2 5 ; 2 5 ; 05 , 0 ; ; 05 , 0
2 1
= =

F F
k n k n
28
7. Interpretare:


Pentru exemplul dat, se accept ipoteza de
homoscedasticitate, cu o probabilitate de 0,95.



) 277 , 9 ( ) 33 , 2 (
3 ; 3 ; 05 , 0
= < = F F
calc
29
4. Corectarea heteroscedasticitii
4.1. Dac se cunosc parametrii
Corecia heteroscedasticitii este aplicat
modelului de regresie liniar simpl:


Corectarea heteroscedasticitii presupune
ponderarea modelului iniial cu variabila .
2
i
o
i i 1 0 i
x y c | | + + =
i
1
o
30
Noul model de regresie (corectat) se obine
astfel:



Estimarea parametrilor acestui model se
realizeaz pe baza MCMMP ponderat
(method of weighted least squares).
i
i
i
i
1
i
0
i
i
x y
o
c
o
|
o
|
o
+ + =
31
4.2. Dac nu se cunosc parametrii
Corecia heteroscedasticitii se realizeaz pe
baza relaiei:




Corectarea heteroscedasticitii presupune
ponderarea modelului iniial cu variabila 1/x
i
.
2
i
o
2
i
2 2
i
x o o =
32
Noul model de regresie (corectat) este de
forma:





i
i
1
i
0
i
i
x x x
y c
|
|
+ + =
Coefficients
a
64.365 3.802 16.927 .000
-.004 .000 -.640 -8.625 .000
(Constant)
Gross domestic
product / capita
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Inf ant mortality (deaths per 1000 live births)
a.
Coefficients
a,b
36.414 2.989 12.184 .000
-.002 .000 -.609 -7.933 .000
(Constant)
Gross domestic
product / capita
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Inf ant mortality (deaths per 1000 live births)
a.
Weighted Least Squares Regression - Weighted by inv
b.
33
Testarea ipotezei de homoscedasticitate pentru
modelele multiple
Testarea homoscedaticitatii pentru modelele
multiple se poate face cu ajutorul testelor:
Testul Breusch-Pagan-Godfrey
Testul White
34
Testul Breusch-Pagan-Godfrey
Plecand de la ipoteza ca exista o legatura multipla liniara intre variabila Y
si variabilele X
1
si X
2
descrisa de relatia: Y=
0
+
1
X
1
+
2
X
2
+, testarea
homoscedasticitatii presupune parcurgerea urmatoarilor pasi:
estimarea parametrilor modelului de regresie liniara multipla:
0
;
1
si
2
pe baza modelului estimat se obtin valorile erorii de modelare;
construirea modelului auxiliar de regresie:
e
i
2
=
0
+
1
X
1
+
2
X
2
+u

se estimeaza raportul de determinatie a modelului auxiliar (R

2
). Pe baza
acestuia se caluleaza valoarea statisticii
2
= n R

2
care va fi comparata cu o
valoare teoretica
2
, k-1
, unde k reprezinta numarul parametrilor din modelul
auxiliar;
prin compararea valorii teoretice cu cea calculata a statisticii
2
se va accepta/
respinge ipoteza de homoscedasticitate a erorilor:


2
<
2
, k-1
=>AH
0
respectiv
2

2
, k-1
=>RH
0
35
Estimarea parametrilor modelului de baza
SAL salariul curent anual ($) ->Y
SAL
0
salariul anual la angajare ($) -> X
1

ED nivelul educatie (ani de scoala)-> X
2


Forma modelului liniar multiplu de estimat:
SAL =
0
+
1
*SAL
0
+
2
*ED+

Modelul estimat:
SAL = -7808.71415718 +1.67263052172*SAL
0
+
1020.3901421*ED+
36
Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 27.28751 Prob. F(2,471) 0.0000
Obs*R-squared 49.21954 Prob. Chi-Square(2) 0.0000
Scaled explained SS 245.2163 Prob. Chi-Square(2) 0.0000

Test Equation:
Dependent Variable: ^2
Method: Least Squares
Date: 01/15/13 Time: 20:38
Sample: 1 474
Included observations: 474

Var. Coefficient Std. Error t-Statistic P

0
-1.31E+08 40991028 -3.203380 0.0015
SAL
0
6150.668 1375.365 4.472026 0.0000
ED 6452228 3752366 1.719509 0.0862

R-sq. 0.103839 Mean dependent var 60401068
Adjusted R-sq. 0.100033 S.D. dependent var 1.92E+08
S.E. of reg. 1.82E+08 Akaike info criterion 40.88563
Sum sq. resid 1.56E+19 Schwarz criterion 40.91197
Log likelihood -9686.895 Hannan-Quinn criter. 40.89599
F-statistic 27.28751 Durbin-Watson stat 1.796592
Prob(F-statistic) 0.000000
37
Testul White
Testul White urmeaza acelasi algoritm ca
in cazul testului Breusch-Pagan-Godfrey,
singura diferenta consta in faptul ca se
utilizeaza o alta forma mult mai complexa a
modelului auxiliar:

e
i
2
=
0
+
1
X
1
+
2
X
2
+
3
X
1
X
2
+
4
X
1
2
+
5
X
2
2
+u

Calculul statisticii
2
si luarea deciziei se
realizeaza ca in cazul testului precedent.
38
Heteroskedasticity Test: White
F-statistic 11.97360 Prob. F(5,468) 0.0000
Obs*R-sq. 53.75859 Prob. Chi-Square(5) 0.0000
Scaled expl. SS 267.8303 Prob. Chi-Square(5) 0.0000

Test Equation:
Dependent Variable: ^2
Method: Least Squares
Date: 01/15/13 Time: 23:19
Sample: 1 474
Included observations: 474

Variable Coefficient Std. Error t-Statistic Prob.

0
-2.13E+08 1.67E+08 -1.275593 0.2027
SAL
0
13826.12 9771.187 1.414989 0.1577
SAL
0
^2 -0.138886 0.082003 -1.693663 0.0910
SAL
0
*ED 72.27410 765.1561 0.094457 0.9248
ED 9214356. 26870194 0.342921 0.7318
ED^2 -291287.7 1381016. -0.210923 0.8330

R-sq. 0.113415 Mean dependent va 60401068
Adj R-sq 0.103943 S.D. dependent var 1.92E+08
S.E. of reg 1.82E+08 Akaike info criterion 40.88755
Sum sq. res 1.55E+19 Schwarz criterion 40.94022
Log likelihood -9684.348 Hannan-Quinn criter 40.90826
F-statistic 11.97360 Durbin-Watson stat 1.799331
Prob(F-statistic) 0.000000

You might also like