Professional Documents
Culture Documents
CAPITULO 4
MODELO LINEAL GENERAL
CONTENIDO
Inferencia estadstica
Prediccin
Y f ( X 2 , X 3 , X 4 ,..., X k )
,
Y 1 2 X 2 3 X 3 4 X 4 ... k X k
Si se tiene las siguientes observaciones:
Yi
X 2 i X 3i
X 4i
...
X ki
i 1,2,3,...,n
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
,
E ( i ) 0
Media
E ( i j ) 0
Covarianza
E(i2 ) 2
Varianza
i ~ NID(0, 2 )
X 2i , X 3i , X 4i ,..., X ki
Son fijas !!
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
Se deduce:
E (Yi ) 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
FRP
Puesto que:
E ( i ) 0
X 2i , X 3i , X 4i ,..., X ki
E (Yi ) 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki i
,
Y1 1 2 X 21 3 X 31 4 X 41 ... k X k1 1
Y2 1 2 X 22 3 X 32 4 X 42 ... k X k 2 2
Y3 1 2 X 23 3 X 33 4 X 43 ... k X k 3 3
...............................................................................
Yn 1 2 X 2 n 3 X 3n 4 X 4 n ... k X kn n
Y1 1
Y 1
2
Y3 1
... ...
Yn 1
X 21
X 22
X 23
...
X 2n
X 31
X 32
X 33
...
X 3n
...
...
...
...
...
En resumen:
Y XB U
X k1 1 1
X k 2 2 2
X k 3 3 3
... ... ...
X kn k n
ESTIMACIN
Funcin de regresin muestral
Dada una muestra de n pares de valores para las variables involucradas
en el modelo y asumiendo un mtodo apropiado se puede postular que la
estimacin muestral es la siguiente:
,
Yi 1 2 X 2i 3 X 3i 4 X 4i ... k X ki
Se puede escribir tambin:
Y1 1 2 X 21 3 X 31 4 X 41 ... k X k1
Y2 1 2 X 22 3 X 32 4 X 42 ... k X k 2
......................................................................
Yn 1 2 X 2n 3 X 3n 4 X 4n ... k X kn
FRM
ESTIMACIN
Funcin de regresin muestral
En resumen:
Y XB
Considerando que:
,
E Y Y
E Y XB
Entonces:
2
e
i E' E (Y XB )'(Y XB )
FRM
E' E
Sea mnimo.
X ' XB X ' Y
De donde:
B ( X ' X ) 1 X ' Y
Ecuaciones normales
Yi 1 2 X 2i
Entonces:
Y1
Y
2
Y Y3
...
Yn
1 X 21
1 X
22
X
... ...
1 X 2n
n
X'X
X 2 i
Yi
X 'Y
X
Y
2 i i
X
X
2i
2
2i
X
10
7
10
5
8
8
6
7
9
10
80
8
Suma
Promedio
X
1
1
1
1
1
1
1
1
1
1
10
7
10
5
8
8
6
7
9
10
Y
11
10
12
6
10
7
9
10
11
10
96
9,6
X'
1
10
1
7
X'X
10
80
80
668
X'Y
96
789
1
10
XY
110
70
120
30
80
56
54
70
99
100
789
78,9
1
5
1
8
(X'X)-1
BETA
1
8
1
6
X2
100
49
100
25
64
64
36
49
81
100
668
66,8
1
7
2,3857 -0,286
-0,286 0,0357
3,6
0,75
1
9
1
10
Yi 1 2 X 2i 3 X 3i
Entonces:
Y1
1
Y
1
2
Y Y3 X 1
...
...
Yn
1
X 21
X 22
X 23
...
X 2n
X ' X X 2 i
X 3i
X 31
X 32
X 33
...
X 3n
X
X
X X
2i
2
2i
2i
X
X X
X
2i
3i
2
3i
3i
3i
Yi
X ' Y X 2iYi
X 3iYi
X=
1
1
1
1
1
1
1
1
1
14
15
18
25
30
59
85
75
150
150
140
120
100
95
60
30
20
5
Y
15
20
50
45
26
80
90
120
160
606
67,33
X'
X2
14
15
18
25
30
59
85
75
150
471
52,33
X3
150
140
120
100
95
60
30
20
5
720
80,00
1
1
1
1
14 15 18 25
150 140 120 100
X'X
X'Y
9
471
720
471
41101
20050
606
48685
28720
1
30
95
Y*X2
210
300
900
1125
780
4720
7650
9000
24000
48685
5409,44
1 1
59 85
60 30
720
20050
80450
Y*X3
2250
2800
6000
4500
2470
4800
2700
2400
800
28720
3191,11
1
1
75 150
20
5
(X'X)-1
BETA
X2*X3
2100
2100
2160
2500
2850
3540
2550
1500
750
20050
2227,78
67,4641721
0,6054026
-0,3976697
1 1
2 2
Var Cov( B) E
1 1
...
k K
2 2 ... k k
Var Cov (B )
E ( 1 1 )(1 1 )
E ( 1 1 )(2 2 )
E ( 2 2 )(1 1 ) E ( 2 2 )(2 2 )
...
...
E ( K K )(1 1 ) E ( K K )(2 2 )
... E ( 1 1 )(K K )
... E ( 2 2 )(K K
...
...
... E ( K K )(K K
B ( X ' X ) 1 X ' Y
Y adems:
Y XB U
Reemplazando:
B ( X ' X ) 1 X ' ( XB U )
B ( X ' X ) 1 X ' XB ( X ' X ) 1 X 'U
B B ( X ' X ) 1 X 'U
B B ( X ' X ) 1 X 'U
Siendo:
E Y XB
E XB U X ( X ' X ) 1 X ' ( XB U )
E XB U X ( X ' X ) 1 X ' XB X ( X ' X ) 1 X 'U )
E XB U XB X ( X ' X ) 1 X 'U )
E U X ( X ' X ) 1 X 'U
E [ I X ( X ' X ) 1 X ' ]U
Si hacemos que:
A [ I X ( X ' X ) 1 X ' ]
E ' E 1
a12
a
21
... n a31
...
ak1
a13
a21
a31
...
ak 1
a14
a21
a31
...
ak 1
...
...
...
...
...
a1n 1
a2 n 2
a3n 3
... ...
ak1n n
E ' E E 1ai1
1 i2
1 i3
1
2
... 1ain 3
...
n
E' E 2Tr[ A]
E' E 2Tr[ I X ( XX )1 X ' ]
E' E 2 {Tr[ I ] Tr[ X ( XX )1 X ' ]}
E' E 2 {Tr[ I ] Tr[ X ' X ( XX )1 ]}
E' E 2 [n k ]
Por tanto:
E' E
nk
Y
15
20
50
45
26
80
90
120
160
606
67,33
X2
14
15
18
25
30
59
85
75
150
471
52,33
X3
Y*X2
150
210
140
300
120
900
100
1125
95
780
60
4720
30
7650
20
9000
5
24000
720
48685
80,00 5409,44
Y*X3
2250
2800
6000
4500
2470
4800
2700
2400
800
28720
3191,11
X2*X3
2100
2100
2160
2500
2850
3540
2550
1500
750
20050
2227,78
YEST
16,2894
20,8715
30,6411
42,8323
47,8476
79,3227
106,993
104,916
156,286
606
67,33
E
-1,2894
-0,8715
19,3589
2,16773
-21,848
0,67726
-16,993
15,084
3,71379
3,1E-12
0,00
Como:
E'E/n-3
231,6266049
(X'X)-1
Entonces:
1148,079214 -9,271341811 -7,964283787
VAR(B)
-9,271341811
-7,964283787
0,081286473
0,062716872
0,062716872
0,05852626
E*E
1,66243908
0,75943468
374,768677
4,69905879
477,318943
0,4586753
288,772321
227,527867
13,7922139
1389,75963
231,63
yi y i ei
Elevando al cuadrado y aplicando el operador de sumatoria se tiene:
2
2
e
(
y
y
)
i i i
Como:
2
2
2
y
i i i 2 yie
y e ( x )e
i
2 i
Entonces:
2
2
2
y
i i i
2 xi ei 0
SEC i
i
r2
2
STC yi2
y
i
r r
2
x y
x y
i
2
i
2
i
Yi i
Yi X i i
Yi 1 2
1
i
Xi
1
1 2 X i i
Yi
LnYi 1 2 LnX i i
LnYi 1 2 X i i
Yi a bX 2i cX 22i i
Yi 1 2 X 2i 3 X 3i i
Yi 1 2 X 2i 3 X 3i ... k X ki i
Yi 1 2 LnX i i
PRUEBAS DE HIPTESIS
El modelo clsico de regresin lineal normal (MCRLN)
El MCRLN supone que:
E ( i / X i ) 0
i ~ NID(0, 2 )
Cualquier funcin lineal de variables normalmente distribuidas estar
tambin normalmente distribuida.
PRUEBAS DE HIPTESIS
Propiedades de los estimadores MCO bajo el supuesto de normalidad
Z1
1 1
~ N (0,1)
2 2
Xi
xi2
2 2
Z2
~ N (0,1)
2
2
x
i
2
(n 2) 2 ~ n2 2
O alternativamente,
2
e
i
~ n22
PRUEBAS DE HIPTESIS
Teoremas tiles relacionadas con la distribucin normal
Teorema 1:
Z i ~ NI (0,1)
Teorema 2:
Z1 ~ N (0,1)
V2 ~ k2
2
2
Z
~
i n
i 1
Z1
~ tk
V2
k
Teorema 3:
V1 ~ k21
V2 ~ k22
Teorema 4:
tk2 F1,k
V1 / k1
~ Fk1 ,k 2
V2 / k 2
PRUEBAS DE HIPTESIS
Utilizando los teoremas planteados se deducen
Considerando que:
Z2
2 2
~ N (0,1)
2
V2 (n 2) 2 ~ n22
2
x
i
2 2
2
tn2
2
x
i
2
(n 2) 2
n2
2 2 2 2
2
S
2
x
i
PRUEBAS DE HIPTESIS
Utilizando los teoremas planteados se deducen
Por el teorema 1:
2 2
Z2
~ N (0,1)
2
2
x
i
2 2 2 [ 2 2 ]
2
Z2 [
]
2
2
2
x
i
12
2
x
i
Como tambin:
[ 2 2 ]2 xi2
V2 (n 2) 2 ~ n22
F1,n 2
2
(n 2) 2
n2
PRUEBAS DE HIPTESIS
En resumen se tiene las siguiente variables aleatorias
Z1
1 1
X
n x
2
i
~ N (0,1)
2 2
Z2
~ N (0,1)
2
2
x
i
2
i
1 1
X
n x
2
i
2
i
~ tn2
2 2
2
x
i
[ 2 2 ]2 xi2
~ F1,n 2
2
~ tn2
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
La relacin entre la variable endgena y exgena viene dada por la
dependencia lineal del valor medio de la variable endgena respecto de la
variable exgena:
E (Yi / X i ) 1 2 X i
La hiptesis de no relacin entre la variable endgena y la variable exgena
es:
H0 : 2 0
Si no tenemos ningn conocimiento previo respecto a los valores de los
parmetros de la regresin, la hiptesis alternativa ser:
H A : 2 0
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Para contrastar la hiptesis nula utilizamos el estadstico de prueba
deducido:
t
2
2 2
2
2
i
t
2
2
2
2
x
i
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Debido a que el estadstico de prueba sigue una distribucin t se puede
utilizar para determinar si un valor t particular es grande o pequeo
estableciendo intervalos de confianza como el siguiente:
2 2
Pr[ t / 2
t / 2 ] 1
2
2
i
Donde:
PRUEBAS DE HIPTESIS
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Se rechaza la
hiptesis nula
Area A = rea B
(A+B) = el nivel
deseado
de
significancia
Area A
Area B
- Valor
critico
+ Valor
critico
PRUEBAS DE HIPTESIS
Determinacin de los valores crticos
Distribucin de t Student
0.025
0.025
- 2.086
+ 2.086
INFERENCIA ESTADSTICA
Prueba de significancia individual Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
tn2
2
2
2
x
i
Regla de decisin:
0.6470
11 .65
86.9187
28,160
Se rechaza
Se rechaza
Se acepta
0.05
-2.306
Valor critico
0.05
2.306
Valor critico
11.65
INFERENCIA ESTADSTICA
Algunos aspectos prcticos
Si el nmero de grados de libertad es 20 y si el nivel de significancia, se
fija en 0.05, entonces la hiptesis nula puede ser rechazada si el t
calculado excede a 2 en valor absoluto.
0.05
PRUEBAS DE HIPTESIS
Prueba de significancia global
Puede demostrarse que:
E (SEC) E ( 22 xi ) 2 22 xi2
2
ei
[1]
E ( SRC) E (
n2
) E ( 2 ) 2
[2]
Hiptesis:
H0 : 2 0
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Estadstico de prueba:
F1,n 2
[ 2 2 ]2 xi2
F1,n 2
22 xi2
Pr[
2 2
Fk ,k , ] 1
2
1
2
x
i
PRUEBAS DE HIPTESIS
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Nivel de significancia
deseado
+ Valor
critico
PRUEBAS DE HIPTESIS
Determinacin de los valores crticos
Distribucin F Snedecor
+ 4.11
INFERENCIA ESTADSTICA
Prueba de significancia global Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
22 xi2 [0.418631][28,160]
F1,8
135.6285
2
86.9187
Regla de decisin:
Se acepta
Se rechaza
0.05
0.90
0.10
0.05
3.46
Valor critico
135.6285
PRUEBAS DE HIPTESIS
Tabla ANOVA ejemplo hipottico.
SUMA DE CUADRADOS
GRADOS
DE
LIBERTAD
yi2 22 xi
ei
n-2
STC
n-1
FUENTE DE VARIACIN
2
i
Regla de decisin:
FC FT
Se rechaza la hiptesis.
SUMA PROMEDIO DE
CUADRADOS
22 xi2
ei / n 2
2
PREDICCIN
Prediccin
PREDICCIN
Prediccin media
Supongamos que para un valor:
X 0 100
Deseamos predecir:
E (Y0 / X 0 ) 100
Deseamos predecir:
PREDICCIN
Prediccin media
PREDICCIN
Prediccin individual