Prelegerea 3: Modelul liniar de regresie pară

1. Estimări MCMMP ai coeficienţilor modelului liniar cu două variabile prin devieri de la
medii(valori centrate).
2. Proprietăţile estimărilor MCMMP: Dependenţa liniară a acestor estimatori de valorile observate;
nedeplasarea lor; dispersiile; covarianţa; eficienţa(teorema Gauss-Marcov). Estimatorul nedeplasat
2
u
S
al dispersiei variabilelor aleatoare de perturbaţie
2
u
σ
.
3. Verificarea ipotezelor de semnificaţie ai coeficienţilor
0
β
şi
1
β
(testul Student).
4. Intervalele de încredere ale coeficienţilor de regresie.
1. Estimări MCMMP ai coeficienţilor modelului liniar cu două variabile prin devieri de la
medii(valori centrate).
Notăm prin
X X x
i i
− ·
,
Y Y y
i i
− ·
valorile centrate observate, devierile de la medie. Astfel,
( )( )
( ) ( ) ( )
n
X n X
Y X n Y X
X n X X X
Y X n Y X X Y Y X
X X
Y Y X X
x
y x
b
i
i i
i i
i i i i
i
i i
i
i i
:
2
2
2
2
2
2 2
1


·
+ −
+ − −
·

− −
· ·


∑ ∑
∑ ∑ ∑
n
Y X
Y
n
X
Y X
n
Y X
X
n
Y
X Y
Y X
n
Y
X n Y X n
i i
i
i
i
i i
i
i
i
i
i
∑ ∑∑ ∑

· ·
· ·
· · * *
( )
2
2
1
*
X X
Y X Y X
b


·
X b Y b
1 0
− ·
2. Proprietăţile estimărilor MCMMP: Dependenţa liniară a acestor estimatori de valorile
observate; nedeplasarea lor; dispersiile; covarianţa; eficienţa(teorema Gauss-Marcov).
Estimatorul nedeplasat
2
u
S
al dispersiei variabilelor aleatoare de perturbaţie
2
u
σ
.
Notăm prin

·
2
i
i
i
x
x
w
. Proprietăţile estimatorilor MCMMP sunt:
• ∑ ∑ ∑
∑ ∑
· · · 0
1
2 2
i
i i
i
i
x
x x
x
w

( )
( )


· ·

,
_

¸
¸
·
2
2
2
2
2
2
2
1 1
i
i
i
i
i
i
x
x
x
x
x
w

( ) 1 *
1
*
2
2 2
· · · + · + ·
∑ ∑
∑ ∑
∑ ∑ ∑ ∑ i
i
i
i
i
i i i i i i i
x
x
x
x
x
w X x w X x w X w
∑ ∑
· · 1
i i i i
x w X w

( ) 1 · + · + ·
∑ ∑ ∑ ∑ i i i i i i i
w Y y w Y y w Y w
← · · · ·
∑ ∑ ∑
∑ ∑

i i i i i
i
i
i
i i
Y w y w y
x
x
x
y x
b *
2 2
1 funcţie liniară faţă de valorile observate Y şi
valorile centrate
1

,
_

¸
¸
− · − · − ·
∑ ∑ ∑ i i i i i
Y w X
n
Y w X Y
n
X b Y b
1 1
1 0
funcţie liniară de Y

( )
∑ ∑ ∑ ∑ ∑
+ · + + · + + ·
i i i i i i i i i i
w w x w w x w b ε β ε β β ε β β
1 1 0 1 0 1

¹
¹
¹
'
¹

,
_

¸
¸
− + ·
+ ·


i i
i i
w X
n
b
x b
ε β
ε β
1
0 0
1 1
Ultimele două proprietăţi ne arată că estimatorii
1 0
, b b
sunt funcţii liniare dependente de erori
i
ε
. Prin urmare
1 0
, b b
sunt variabile aleatoare şi au aceeaşi lege de repartiţie ca şi
i
ε
(repartiţie normală).
Covarianţa(dispersia):
( ) ( )( ) ( ) ( )
2 2 2
1 1 0 0 1 0
*
1 1
, cov
i i i i i i i i
w X M w w X
n
w w X
n
M b b M b b
ε
σ ε ε ε β β − ·

,
_

¸
¸
− ·

,
_

¸
¸

,
_

¸
¸
− · − − ·
∑ ∑ ∑
( )
2
2
1 0
, cov
ε
σ

− ·
i
x
X
b b
Iar, matricea de covarianţă a coeficienţilor este egală cu:
( )
( ) ( )

,
_

¸
¸

− +
·

,
_

¸
¸

,
_

¸
¸
+
·

∑ ∑

∑ ∑
2 2
2 2
2
2
2
2
2
2
2
2 2
2
2
2
1
1
2
1
1
cov
x x
X
x
X
x
X
n
x x
X
x
X
x
X
n
b
i
i i
i
i i
ε
ε ε
ε ε
σ
σ σ
σ σ

Teorema Gauss-Markov: Estimatorii metodei celor mai mici pătrate a modelului clasic
liniar simplu sunt nedeplasaţi, cu dispersie minimă(sunt eficienţi) şi consistenţi.
Estimatorul nedeplasat
2
u
S
al dispersiei variabilelor aleatoare de perturbaţie
2
u
σ
:
2 2
2
2 2

·

·

n
e
n
Q
S
i
3. Verificarea ipotezelor de semnificaţie a coeficienţilor
0
β
şi
1
β
(testul Student).
Testul Student presupune 2 ipoteze:
Ipoteza principală
" 0 :"
0
·
i
H β
(valoarea reală a necunoscutei este egală cu zero), atunci
( )
b
S
t n
i
b
i
→ − 2
Ipoteza de alternativă
" 0 :"
1

i
H β
0
0
0
b
b
S
b
t ·
1
1
1
b
b
S
b
t ·
Probabilitatea riscului % 5 · α (0.05) sau probabilitatea de încredere = 95%(pragul de semnificaţie).
Numărul gradelor de libertate 2 − · n k , unde n este numărul observaţiilor.
Se caută în tabelul Statisticii Student(t) elementul ce se află la intersecţia coloanei
α
şi a liniei n-
2. Elementul găsit este
( ) 2 , − · n t t
tab
α
.
Verificarea ipotezelor de semnificaţie a coeficienţilor
0
β
şi
1
β
cu ajutorul testului Student se
execută grafic:
2
Mulţimea punctelor DVA, sunt pentru adoptarea ipotezei Ho, iar mulţimea punctelor din domeniul
critic de stânga şi dreapta pentru adoptarea ipotezei H1. Ipotezele sunt contrar una celeilalte, şi în
momentul adoptării unei, alta se respinge.
Dacă
0
b
t
şi
1
b
t
nimeresc în unul din domeniile critice, atunci se adoptă ipoteza H1, şi se spune că
coeficienţii sunt semnificativi pentru model. Iar cu probabilitatea de încredere de cel puţin 95%, sau cea a
riscului de cel mult 5%, aceştia sunt semnificativ diferiţi de zero.
Dacă măcar una din valorile
0
b
t
sau
1
b
t
nimereşte în DVA, atunci se adoptă ipoteza Ho, şi se
spune că coeficienţii nu sunt semnificativi pentru model.
4. Intervalele de încredere ale coeficienţilor de regresie.
tab b tab b
t S b t S b * *
1 1
1 1 1
+ ≤ ≤ − β
tab b tab b
t S b t S b * *
0 0
0 0 0
+ ≤ ≤ − β
DVA
Domeniul critic de dreapta Domeniul critic de stânga
tab
t −
tab
t
Ho H1 H1
3

Sign up to vote on this title
UsefulNot useful