You are on page 1of 58

UNIDAD II

Qu es Anlisis de regresin lineal?


UNIDAD II

Qu es Anlisis de regresin lineal?




el pensamiento estadstico algn da ser tan necesario para la ciudadana como la
capacidad de leer y escribir
H.G. Wells (hace 100 aos)

Cules son los conceptos generales del anlisis de regresin lineal?
Qu es un modelo, cules son sus elementos constitutivos?
Cul es el proceso de construccin de un modelo?
Cules son las caractersticas y supuestos del Modelo Lineal General?
Qu es estimacin de parmetros?
Cules son las propiedades de los estimadores?
Cmo se halla la estimacin de la varianza de trmino de perturbacin?




ANALISIS DE REGRESION LINEAL

ESQUEMA CONCEPTUAL



Conceptos generales
Naturaleza de
anlisis de regresin
Construccin del Modelo Elementos constitutivos
Conocimiento de la teora Econmica
Especificacin del Modelo
Estimacin de los parmetros
Verificacin
Prediccin
Ecuaciones
Variables
Parmetros

Estimacin de
parmetros
Propiedad de los
estimadores
Modelos predictivos
ANALISIS DE REGRESION LINEAL




COMPETENCIAS A LOGRAR


CONCEPTUAL PROCEDIMENTAL ACTITUDINAL
Explica qu es el anlisis
de regresin lineal, el
modelo predictivo, sus
procesos de construccin,
clases y supuestos.
Aplica las tcnicas
apropiadas del anlisis
de regresin lineal.
Estima o predice la media
o valor promedio de la
variable dependiente con
base en los valores
conocidos.


CONCEPTOS CLAVE

Variable, regresin, modelos, correlacin, parmetro, muestra, poblacin, estimador,
varianza.

51

LECCIN 1



CONCEPTOS GENERALES


1. VARIABLES
Es la representacin de un fenmeno (caracterstica), el cual puede tomar diferentes valores.
Tambin se define como la caracterstica de la muestra o de la poblacin nque se observa.

Ejemplo:
El precio de un bien, cantidad producida, gastos en publicidad, temperatura, regiones,
educacin, tipo de gobierno, prioridades, etc.


2. POBLACIN
Conjunto total de unidades definidas en un tiempo y espacio determinadas por el investigador
para realizar un anlisis. Por ejemplo, si el primer ejecutivo de una gran empresa textil desea
estudiar la produccin de todas las fbricas en el ao 2003 en el Per; la poblacin estara
formada por todas las plantas textiles ubicadas en el Per en el 2003.

Ejemplo:
Todos los asalariados del Per en el 2003.


3. PARMETRO
Es una medida descriptiva de la poblacin, la cual es de inters para el investigador.

Ejemplo:
La produccin total de las plantas textiles en el 2003 o los ingresos medios de todos los
asalariados del Per.


4. MUESTRA
Es la porcin representativa de la poblacin, la cual es obtenida cuando la poblacin es
demasiado grande para analizarla en su totalidad.

Ejemplo:
Relacin de 400 Hogares de Lima Metropolitana que son usados para medir el ingreso de los
asalariados en el 2003, esto representa una pequea parte del total de la poblacin (Total de
hogares de Lima Metropolitana en el 2003).


5. ESTADSTICO (O ESTIMADOR)
Es cualquier medida descriptiva de una muestra y es usado para la estimacin del parmetro
correspondiente de la poblacin.

52

Ejemplo:
El Ingreso medio de una muestra de 500 trabajadores calculados por el Ministerio de Trabajo
es un estadstico.
6. REGRESIN
Es una expresin cuantitativa de la naturaleza bsica de la relacin entre las variables
dependientes con la independiente.

Ejemplo:
Dado un modelo de regresin simple con una variable independiente, el modelo determinar
si las dos variables (independiente y dependiente) tienden a desplazarse en la misma direccin
- (las dos crecen o decrecen al mismo tiempo) o en sentidos opuestos (una aumenta cuando la
otra disminuye). Tambin indicar la cantidad en que Y cambiar cuando la variable
independiente vare en una unidad.


7. REGRESIN SIMPLE
Se presenta cuando la variable dependiente Y esta en funcin de una sola variable
independiente.

La notacin que lo expresa es:
) f(X Y
1
=


8. REGRESIN MLTIPLE
Abarca dos o ms variables independientes. Si se dice que Y depende de ms de dos variables
independientes, podemos escribir:


) X , , X ( f Y
n 1
L =


9. CORRELACIN
Determina la fuerza de la relacin; es decir, mientras que la regresin describe la naturaleza
bsica de la relacin entre las dos variables, la correlacin mide la solidez de dicha relacin.

Ejemplo:
Se puede estar interesado en conocer la correlacin entre el gasto en publicidad y las ventas
de una empresa; entre el nivel de produccin y la inflacin mensual; etc.



10. DIAGRAMAS DE DISPERSIN
Representan de forma grfica las relaciones entre 2 variables (la dependiente con una
independiente), lo habitual es colocar la variable dependiente en el eje vertical y la
independiente en el eje horizontal.



53



(a)




11. ANLISIS DE REGRESION
Estudia la relacin existente entre una variable endgena o dependiente (Y) y una o ms
variables exgenas o independientes (X), con el objeto de estimar la media o valor promedio
poblacional de la variable dependiente en trminos de los valores conocidos o fijos de las
independientes.

Ejemplo:
Cuando se analiza una regresin, se trata de predecir el valor promedio de la variable; Por
ejemplo: predecir el saldo de la cuenta de capitales teniendo informacin muestral de la tasa
de inters; predecir el monto total de crditos conociendo la tasa de encaje bancario; etc.


12. DEFINICIN DE MODELOS
Es un conjunto de relaciones funcionales, generalmente interrelacionadas., el cual puede ser
definido como una representacin simplificada e idealizada de la realidad. De esta definicin
se desprenden dos comentarios que reflejan en parte las ventajas y limitaciones del uso de
modelos:


a. Un modelo no es la realidad, pero tampoco es completamente independiente de ella.
b. Como representacin idealizada, parte de la interpretacin que el constructor del modelo
posee de la realidad.

Los modelos estn conformados por afirmaciones o hiptesis de comportamiento de unas
variables en base al comportamiento de otras, que se manifiestan en relaciones funcionales
expresadas matemticamente.






Lineal
(b) Lineal inversa (c) Curvilnea directa
(d) Curvilinea inversa (e) Lineal inversa
con ms dispersin
(d) Ninguna relacin
Y
X
Y
X
Y
X
Y
X
Y
X
Y
X
Relaciones posibles
entre X y Y vistos
en diagramas de
dispersin

54

LECCIN 2

ELEMENTOS CONSTITUTIVOS DE UN MODELO


Los elementos que integran un modelo son: las ecuaciones, las variables y los parmetros.

1. ECUACIONES
Una ecuacin es una relacin ponderada entre variables, que se verifica para determinados
valores numricos.

Un modelo se especifica mediante una ecuacin o varias ecuaciones, en donde cada una de
stas pretende explicar un sector (agrcola, minero, manufacturero, transporte, etc.) o una
categora (consumidores, productores, intermediarios, inversionistas, etc.) de la actividad
objeto de investigacin.


2. VARIABLES
Las variables son magnitudes susceptibles de modificarse cuantitativamente, dentro de un
cierto margen o campo de variabilidad.

Clasificacin de las Variables

a. Variables endgenas o dependientes
b. Variables predeterminadas o independientes
b.1 Exgenas
b.2 Endgenas con retardo
c. Variables aleatorias o estocsticas

a. Variables endgenas o dependientes.- Se caracterizan porque sus valores se
determinan como soluciones particulares del modelo.

b. Variables predeterminadas o independientes: Son aquellas cuyos valores no se
obtienen por la solucin del modelo sino que provienen fuera del mismo. Ellas
contribuyen a explicar el comportamiento de las variables endgenas de un modelo sin
ser explicadas por el modelo mismo. Se clasifican en:

b.1 Las Variables Exgenas incluyen variables econmicas y no econmicas que
explican el modelo, pero no son explicadas por ste.
b.2 Las Variables Endgenas con Retardo.- Son aquellas que actan como variables
explicativas o como datos del pasado que contribuyen a explicar el presente.

c. Variables aleatorias o estocsticas.- Se incluyen para justificar la omisin de variables
explicativas, los errores en la especificacin de las ecuaciones y errores en la medicin
de variables endgenas.




55



Ejemplo ilustrativo de clasificacin de variables:

Dado el siguiente modelo:

t t t t
1 t 3 t 1 0 t
t 2 2 t 1 t 1 0 t
1 t 1 1 t 2 1 t 1 t 1 0 t
G I C Y
1 g 0 , Y g g T
0 b , ) Y Y ( b b I
+ + =
< < + + =
> + + =
1 a 0 , C a ) T Y ( a a C < < + + + =


t
I
t
Y
1 t
T

2 t
Y



siendo :

C
t
= consumo nacional

T
t
= impuestos G
t
= gasto de gobierno
Y
t
= ingreso nacional

I
t
= inversin neta

Clasificando sus variables, tenemos lo siguiente:

a. Variables Endgenas o Dependientes :

t
C = Consumo del periodo de estudio.
= Inversin en el periodo de estudio.
t
T = Impuestos del periodo de estudio.
=Ingreso Nacional del periodo de estudio.

Estas variables son la razn de ser del modelo, al resolver el modelo debemos de hallarlas.


b. Variables Predeterminadas :

b.1 Variables Endgenas con Retardo:

1 t
Y

= Ingreso Nacional del periodo anterior.


= Impuestos del periodo anterior.
1 t
C

=Consumo Nacional del periodo anterior.
= Ingreso Nacional de 2 periodos anteriores.

b.2 Variable Exgena:

t
G = Gasto de gobierno.


56

Todas estas son variables Predeterminadas que ayudan a explicar a las variables
endgenas.
c. Variables Estocsticas o Aleatorias :

t 3 t 2 t 1


Son importantes porque con ellas se diferencia un modelo econmico de uno
economtrico; su ubicacin en el modelo justifica:

- Las omisiones de otras variables explicativas.
- Los errores por hacer las ecuaciones.
- Los errores al evaluar las variables dependientes.


3. PARMETROS

Los parmetros son los factores de ponderacin entre las variables incluidas en las ecuaciones
de un modelo.


Ejemplo ilustrativo de interpretacin de los parmetros:

Del modelo anterior, en la Ecuacin (1):
t 1 1 t 2 1 t 1 t 1 0 t
C a ) T Y ( a a C + + + =



a
0
: Vendra a ser el consumo autnomo. Este parmetro no est afectado por ninguna variable
explicativa. Tambin significa que as no hubiera consumo en el periodo precedente y
tambin sino hubiera ingreso disponible el periodo anterior, siempre va a existir un
consumo autnomo dado. Estadsticamente a
0
es el intercepto.

a
1
: Esta es la Propensin Marginal a Consumir., y nos muestra en cunto vara el consumo
cuando vara en una unidad monetaria el Ingreso disponible (del periodo anterior, para
este caso). En efecto esta variable no puede ser cero ya que eso implicara que el consumo
actual no estara afectado por el ingreso disponible del periodo anterior (lo cual es falso
porque siempre existe alguna participacin). Esta variable tampoco puede ser 1, porque
quiere decir que se gasta todo el ingreso disponible en el consumo, lo cual tambin es
falso porque siempre se ahorra algo. Por tanto 0<a
0
<1.

a
2
: Nos muestra en cunto vara el consumo actual cuando vara en una unidad el consumo
del periodo anterior. Ac entra a tallar lo que es los patrones de consumo de la gente.


En la Ecuacin (2):
t 2 2 t 1 t 1 0 t
) Y Y ( b b I + + =



b
0
: Viene a ser la Inversin Autnoma, la inversin que no est afectada por ninguna variable
explicativa (ni aleatoria). Es decir, implica que as no halla existido ingresos en periodos
anteriores, siempre se va a invertir algo (b
0
).


57

b
1
: Nos dice en cunto vara la inversin ante cambios en periodos anteriores del Ingreso. Es
la sensibilidad de la inversin ante cambios en ingresos anteriores.
En la Ecuacin (3):
t 3 t 1 0 t
Y g g T + + =

g
0
: Representa el Impuesto Autnomo, esto quiere decir, que as no existan ingresos, siempre
el gobierno debe recaudar impuestos (g
0
).

g
1
: Nos dice en cunto varan los impuestos cuando vara en una unidad monetaria los
ingresos. Mide la sensibilidad de los impuestos ante cambios en los ingresos.





ELEMENTOS CONSTITUTIVOS DE
UN MODELO
ECUACIONES VARIABLES PARAMETROS



58

LECCIN 3

PROCESO DE CONSTRUCCIN DE UN MODELO


El proceso de construccin de un modelo se puede presentar como una secuencia de etapas
que a continuacin se consideran:

1. Conocimiento de la Teora Econmica: esta etapa se refiere al conocimiento de aspectos
de la teora econmica requeridos para la especificacin del modelo economtrico a
aplicarse. Esta etapa es la ms importante en la construccin de un modelo.

2. Especificacin del Modelo Economtrico: son todos aquellos pasos previos a la
estimacin, es decir, precisar las variables y sus relaciones, la estructura lgica del modelo,
el perodo de tiempo a estudiarse, la identificacin, etc.

3. Estimacin: una vez especificado el modelo, la siguiente tarea consiste en la obtencin de
estimaciones (valores numricos) de los parmetros del modelo a partir de los datos
disponibles, generalmente proporcionados por el estadstico econmico. Estas estimaciones
le dan contenido emprico a la teora econmica.

4. Verificacin: (Inferencia Estadstica) habiendo obtenido estimaciones de los parmetros,
la siguiente labor es la verificacin de las hiptesis estadsticas y econmicas; es decir,
desarrollar los criterios apropiados para lograr establecer si las estimaciones obtenidas
estn de acuerdo con lo que se espera de la teora que se esta verificando.

Dentro de las hiptesis estadsticas nos referiremos a las pruebas de hiptesis acerca de la
significacin de los parmetros (Pruebas t y F), de las relaciones del modelo
(coeficientes de correlacin), de la validez de los supuestos de las perturbaciones (Pruebas
de heterocedasticidad, autocorrelacin, multiconlinealidad, etc.).

5. Prediccin o Pronstico: los modelos economtricos ya estimados se utilizan
frecuentemente para predecir el (los) valor (es) futuro (s) de la variable dependiente con
base a valores conocidos o esperados en el futuro para la (s) variable (s) explicativa (s).
Supongamos por ejemplo, que el Gobierno contempla la posibilidad de una reduccin de
los impuestos personales con el fin de estimular su quebrantada economa, Cul ser el
efecto de esta poltica sobre el consumo y por consiguiente sobre el empleo y el ingreso?


Ejemplo Ilustrativo del Proceso de Construccin de un Modelo

1. Conocimiento de la Teora Econmica.
Para ilustrar, consideramos la teora Keynesiana del consumo, Keynes dice: La Ley
psicolgica fundamental consiste en que los hombres estn dispuestos, por regla general y en
promedio, a aumentar su consumo a medida que su ingreso crece, aunque no tanto como el
crecimiento de dicho ingreso
1
.

1
John Maynard Keynes: La Teora General del Empleo, el Inters y el Dinero. New York, 1936, p. 96.

59

Keynes afirma que la propensin marginal a consumir (PMC), la razn de cambio del
consumo por un cambio unitario en el ingreso, es mayor que cero pero menor que uno.
2. Especificacin del Modelo Economtrico
En nuestra ilustracin, aunque Keynes postula una relacin positiva entre consumo e ingreso,
no especifica la forma precisa de la relacin funcional entre las dos variables.

Para simplificar un economista matemtico puede sugerir la siguiente forma para la funcin
consumo de Keynes:

( ) Y * C 1 + =

donde:

C = gastos de consumo
Y = ingreso
, = constantes o parmetros

el coeficiente de Y representa la pendiente o PMC.


La ecuacin (1), que afirma que el consumo est relacionado linealmente con el ingreso, es de
inters limitado para el analista, por cuanto supone una relacin exacta o determinista entre
consumo e ingreso. Sin embargo, las relaciones entre las variables econmicas son inexactas.

De este modo, si furamos a obtener las cifras de gastos de consumo y de ingreso disponible
(descontados los impuestos) de una muestra de 5,000 familias, por ejemplo, y luego
dispusiramos los datos en una grfica, colocando los gastos de consumo en el eje vertical y el
ingreso disponible en el eje horizontal, con toda seguridad, no esperara que las 5,000
observaciones ocurrieran exactamente sobre la lnea de la ecuacin (1), pues adems del
ingreso, existen otras variables que afectan los gastos de consumo; por ejemplo, el tamao de
la familia, la edad de sus miembros, el tiempo de constitucin de la familia, la religin y otros
factores que ejercen influencia en el consumo.

Para tener en cuenta la relacin inexacta entre las variables econmicas, el econometrista debe
modificar la funcin de consumo determinista de (1), de la siguiente manera:

( ) + + = Y * C 2

en la que es variable aleatoria o estocstica con propiedades probabilsticas bien
definidas.

La ecuacin (2), plantea la hiptesis de que la variable dependiente C (consumo) est
relacionada linealmente con la variable explicativa Y (ingreso), aunque no de manera exacta,
puesto que est sujeta a variaciones individuales.





60



3. Estimacin:
As por ejemplo, si en el estudio de la funcin consumo Keynesiana, se encuentra que
este valor no solo proporciona una estimacin numrica de la PMC, sino que
corrobora la hiptesis Keynesiana segn la cual, la PMC es menor que uno.
8 . 0 =

Cmo se estiman los parmetros y ? Eso lo trataremos posteriormente en el Modelo
Lineal General.


4. Verificacin: (Inferencia Estadstica)
Dentro de las hiptesis estadsticas nos referiremos a las pruebas de hiptesis acerca de la
significacin de los parmetros (Pruebas t y F), de las relaciones del modelo (coeficientes
de correlacin), de la validez de los supuestos de las perturbaciones (Pruebas de
heterocedasticidad, autocorrelacin, multicolinealidad, etc.). En cuanto a las hiptesis
econmicas nos referimos a la interpretacin del modelo, su validez en cuanto a reproducir el
perodo de anlisis y a su poder predictivo.

Como se vio anteriormente, Keynes pretenda que la PMC fuese positiva pero menor que uno.
Supongamos, por otro lado, que en un estudio de la funcin consumo se encuentra que la
PMC = 0.9; si bien es cierto que este resultado es menor que 1, nos podemos preguntar si es
suficientemente menor que 1 como para que logremos convencernos de que no es el resultado
accidental de un proceso de muestreo. En otras palabras, Es esta estimacin estadsticamente
menor que 1? Si es as, adquiere respaldo la afirmacin Keynesiana, de lo contrario queda
refutada.


5. Prediccin o Pronstico
Si la PMC = 0.8; quiere decir que si el ingreso aumenta en una unidad monetaria, se producir
finalmente un aumento en el consumo igual a 0.8 u.m.


Otro Ejemplo del Proceso de Construccin de un Modelo: Estimacin de un Modelo
Importaciones: 1998 2004

1. Especificacin del Modelo

El objetivo es el de encontrar una relacin de largo plazo que explique la evolucin de las
importaciones dentro del periodo de estudio el mismo que se caracterizo por estar en una
plena apertura comercial desde principio de los noventa.

Se sugiere el siguiente modelo para las importaciones:
LPBI LTCR Limport
3 2 1
+ =
Donde:
Limport : Logaritmo de las Importaciones
LTCR : Logaritmo del Tipo de Cambio Real

61

LPBI : Logaritmo del Producto Bruto Interno
3 2 1
, , : Constantes o parmetros
A continuacin se deben realizar las siguientes etapas:
1. Estimacin, Inferencia e Interpretacin.
2. Test de Estabilidad de los Parmetros
a. Test de Residuos Recursivos
b. Test del Cusum y Cusum Cuadrado
c. Test de Coeficientes Recursivos
d. Test de Punto de Quiebre de Chow
e. Test de Prediccin de Chow

3. Normalidad de las Perturbaciones
4. Anlisis de Multicolinealidad
5. Anlisis de Heteroscedasticidad
a. Test de White Sin Trminos Cruzados
b. Test de White Con Trminos Cruzados
c. Test ARCH LM

6. Anlisis de Autocorrelacin
Para analizar la existencia de autocorrelacin, podemos verificarlo utilizando
los siguientes test:
a. Test Durbin-Watson
b. Test LM de Correlacin Serial
c. Test Box-Pierce Q

7. Especificacin del Modelo
8. Evaluacin de la Prediccin


62


63
Fuente: Casas,2001
Evaluacin
Estimacin
Especificacin
Modelo Economtrico Tcnicas Estadsticas
Estadstica Matemticas
Datos refinados Estimacin del modelo
Evaluacin de polticas Prediccin Anlisis Estructural
Inferencia Estadstica
MODELO TERICO
TEORIA ECONOMICA

LECCIN 4


NATURALEZA DEL ANLISIS DE REGRESIN


El anlisis de regresin est relacionado con el estudio de la dependencia de una variable, la
variable dependiente, que est en funcin de una o ms variables explicativas con la
perspectiva de estimar y/o predecir el valor (poblacional) medio o promedio de la primera en
trminos de valores conocidos o fijos (en muestreos repetidos) de las segundas.

El objetivo es determinar una ecuacin de regresin que permita pronosticar el valor de una
variable (denotado por Y; denominado variable dependiente) en base a otra variable (denotada
por X; llamada variable independiente).


1. REGRESIN LINEAL SIMPLE

Establece que la variable dependiente Y es funcin de una sola variable independiente (X).
La notacin que lo expresa es:

= + + X Y
2 1

Donde:

1
: Es el parmetro constante del modelo.
2
: Es la pendiente de la ecuacin poblacional
: Es el trmino de perturbacin o error del modelo.

La ecuacin de regresin estimada queda definida por:

X

Y

2 1
+ =


2. REGRESIN LINEAL MLTIPLE

Es la ampliacin de la regresin lineal simple a dos o ms variables explicativas, es decir con
la regresin lineal mltiple se pueden predecir valores de la variable dependiente (Y) a travs
de varias variables explicativas (X
2
, X
3
,,X
k
)

El Modelo Estadstico es:

+ + + + + = X X X Y
k k 3 3 2 2 1


Donde
Y : Es la variable independiente
X
i
: Son las variables explicativas (i = 2,, k)

64

i
: Son los parmetros correspondientes a cada variable (i = 2,, k)
1
: Es el parmetro constante del modelo.
: Es el trmino de perturbacin o error del modelo.

Al estimar los parmetros se determina la ecuacin de regresin estimada:

k k 3 3 2 2 1
X

X

Y

+ + + + =

Una vez verificado las condiciones del modelo se pueden realizar las predicciones a travs de
la ecuacin anterior.


3. CURVA DE REGRESIN POBLACIONAL (Regresin de Y sobre X)

Es aquella que muestra el lugar geomtrico de las medias condicionales o esperanzas de la
variable endgena para los valores fijos de las variables exgenas.


Ejemplo Ilustrativo

Se renen datos (X Y) cuya relacin se desea estudiar y se organiza la informacin en una
tabla que represente la poblacin.

Por ejemplo se ha efectuado una encuesta de ingresos y gastos a una poblacin de 60
familias, que viven en un centro poblado. La informacin se presenta en el cuadro adjunto.

Se desea estudiar la relacin entre:
Y = Gasto de consumo de la familia.
X = Ingreso de la familia disponible
Se desea predecir el nivel de la media poblacional del Y (Gasto de consumo de la familia)

Se organiza y representa la distribucin de los valores que toma Y, condicionada a los
valores dados de X.

Supuestamente, se han formado las 60 familias en 10 grupos cada uno de ellos tiene los
ingresos iguales y se examinan los gastos de consumo de las familias (X). Por ejemplo con
ingresos de 800 soles, existen 5 familias cuyos gasto de consumo de la familia se
encuentran en el rango de S/. 520 a S/. 680. Cuando X es S/.1850 hay 5 familias cuyos
gastos de consumo se encuentran entre S/.1080 y S/. 1440









65


Ingreso de las Familias (X)
Y 650 800 950 1100 1250 1400 1550 1700 1850 2000
Gasto de
consumo
Familiar por
mes (S/.)
440 520 640 640 800 880 960 1080 1080 1240
480 560 680 680 920 920 1080 1120 1200 1280
520 560 720 760 840 960 1120 1080 1320 1320
560 640 680 720 960 1040 1200 1200 1400 1400
600 680 760 800 880 1080 1160 1240 1440 1440
640 920 1000 1120 1320 1480
960 1360 1560
880 1480
E(y/x) 520 600 696 795 900 1000 1104 1200 1288 1400


Se calcula las probabilidades condicionales p(Y/X) que se lee: probabilidad que Y tome
un valor, dado que X ha tomado un determinado valor.

Por ejemplo: la probabilidad de que Y tome un valor de S/.520 cuando X es igual a S/.650
es igual a 1/5, por que el nmero de familias que tienen este nivel de ingreso es 5, y slo
una gasta S/.520.

p(Y = 520/ X = 650) = 1/5

La probabilidad de que Y sea igual a S/.1400 cuando X es igual a S/.2000 es igual a 1/8,
por que existen 8 familias que tienen un ingreso de S/.2000 aunque cada uno tiene
diferentes niveles de consumo. El valor de S/.1500 slo lo muestra una de las familias.

p(Y = 1400/ X = 2000) = 1/8

Para cada una de las distribuciones de probabilidad condicional de Y podemos calcular su
media o valor promedio, conocido como la media condicional o esperanza condicional,
que se denota: ) X / Y ( p * Y ) X E(Y/X
i
= =

En el ejemplo:

( ) Esperanza promedio: 600
6
1
680
6
2
640
6
2
60 5
6
1
520 800 Y/X E =

= =
Entonces, el consumo promedio de las familias que ganan S/.800 es S/.600.

Esperanza promedio:
( ) 00 4 1
8
1
1560
8
2
1480
8
1
1440
8
1
0 140
8
1
1320
8
1
1280
8
1
1240 2000 Y/X E =

= =

El consumo promedio de las familias que ganan S/.2000 es S/.1400.

Luego, observamos las cifras en el siguiente diagrama de dispersin

66



1500


Se observa que el valor promedio del gasto de consumo tiende a aumentar a medida que el
ingreso aumenta.


4. FUNCIN DE REGRESIN POBLACIONAL (FRP)

Para la construccin de la funcin de regresin poblacional la curva de regresin debe
expresar todos los valores promedios de la variable dependiente para todos los valores fijos de
la variable explicativa.

La regresin poblacional nos muestra cmo el valor promedio de Y vara en relacin a los
valores de la variable X.

( ) ( )
i 2 1 i i
X X f X / Y E + = =

En el anlisis de regresin, se quiere estimar la FRP, es decir estimar los valores de
2 1
y no
conocidos con base en las observaciones de Y y X.

Ejemplo Ilustrativo
En el ejemplo anterior, se trata de los valores promedios de consumo en cada valor fijo del
ingreso.

( ) ( )
i 2 1 i
X X f Y/X E + = =

Donde:

1
,
2
son parmetros desconocidos pero fijos que se denominan coeficiente de regresin,
tambin llamados intercepto y coeficiente de la pendiente de la recta formada
respectivamente:

E(Y/X = 800) = 600 Valor promedio de Y para X = 800

650 800 950 1100 1250 1400 1550 1700 1850 2000

Ingreso Mensual S/.
500
G
a
s
t
o

d
e

C
o
n
s
u
m
o

M
e
n
s
u
a
l


S
/
.


1250


1000


750


250
X ) x / y ( E
2 1
= +

67

La diferencia entre el valor promedio obtenido y cada valor observado se debe al trmino de
perturbacin (
i
).


i i
E(Y/X) Y = +

i 2 1
X Yi + + = , reemplazando para c/u de los valores del consumo cuando el ingreso es
S/.800, nos da las siguientes expresiones:

Y
1
= 440 =
1
+
2
X +
1
Y
1
= 440 =
1
+
2
(650) +
1
Y
2
= 480=
1
+
2
(650) +
2

Y
3
= 520=
1
+
2
(650) +
3

Y
4
= 560=
1
+
2
(650) +
4

Y
5
= 600=
1
+
2
(650)+
5


Finalmente la regresin poblacional para un valor particular de la variable dependiente es:
i i 2 1 i
X Y FRP + + =


En el anlisis de regresin interesa es estimar la FRP, es decir, estimar los valores de
1
y
2

no conocidos en base a las observaciones de Y y X.


5. FUNCIN DE REGRESIN MUESTRAL (FRM)

Es la que se obtiene a partir de una muestra de observaciones y nos permite estimar los
parmetros de una funcin de la regresin poblacional, a partir de la informacin
proporcionada por la muestra. Su forma es la siguiente:
i i 2 1 i
X

Y FRM + + =

La diferencia con la FRP est dada en que en este ltimo caso los valores de los parmetros
son de los datos poblacionales . Asimismo el trmino de perturbacin est referido a
la diferencia de los valores promedios poblacionales respecto a cada uno de los valores
mencionados.
) (
i
) (
i


Podemos afirmar lo siguiente:
1

es un estimador de
1

2

es un estimador de
2

i
es un estimador de
i


En conclusin, lo que se trata con los modelos de regresin es estimar la funcin de regresin
poblacional (FRP) con base en la funcin de regresin muestral (FRM) en la forma mas
precisa posible.




68

6. SIGNIFICADO DEL TERMINO DE PERTURBACION (
i
)

Se tiene un modelo general, de la siguiente forma:

i 3 3 2 2 1 i
...... X X Y + + + + =

Donde los valores de los parmetros () son referidos a la poblacin. Suponiendo que alguien
nos diera los valores de los s, entonces nos faltara encontrar el valor del trmino de
perturbacin ( ).
i


El

se simboliza como una bolsa donde estn las otras variables respectivas del modelo y
que no estn incluidas en el mismo. Asimismo representa efectos aleatorios de la misma
naturaleza de las
i .

i


Por ejemplo:
En el caso del consumo
i
estara representando el efecto de otras variables como la riqueza,
el tamao de la familia, etc.

Sea el modelo
2 2 1
X Y + = , en el cual se ha estimado lo siguiente:

1
= 10;
2
= 2
i
N(0, 25)

X
2
Valor
Terico
(Y
i
)

i
Valor
Emprico
(Y
i)
2
5
4
6
14
20
18
22
-2
5
0
-3
12
25
18
19


Valor promedio
( ) ( )
i i 2 2 1
Y X / Y E X / Y E X = + = +
19 3 - 22 22 2(6) 10
18 0 18 18 2(4) 10
25 5 20 20 2(5) 10
12 2 - 14 14 2(2) 10
= = +
= + = +
= + = +
= = +





69

LECCIN 5

MODELO LINEAL GENERAL


1. MODELO LINEAL SIMPLE

El modelo lineal de dos variables es denominado tambin modelo lineal simple. Este caso
bivariante donde la variable Y es explicada por la variable X, est representada por la
siguiente expresin:

( )
n , , 2 , 1 i
1 X Y
i 2 i 2 1 i
K =
= + +


La expresin (1) muestra el modelo a partir de cada una de las observaciones. Sin embargo, el
modelo se puede expresar de forma alternativa, en la que utilizando la notacin matricial, se
recogen todas las observaciones del modelo.

( ) ( )
( ) ( )
( )
( )
( )

X 1
X 1
X 1
X y donde en
2 X Y
n
2
1
2 n
2
1
1 2
1 n 1 2
2 n 1 n

=
+ =



M M




2. HIPTESIS DEL MODELO DE REGRESIN LINEAL

Para obtener los estimadores de los parmetros desconocidos del modelo, as como para
realizar contrastes de hiptesis y la verificacin del modelo, se necesitan un conjunto de
hiptesis que se irn desarrollando en esta seccin a medida que se vayan necesitando.
Asimismo se har referencia de ellas en el momento en que se utilicen.

El conjunto de hiptesis sobre las que se basa el modelo de regresin versa sobre los
siguientes aspectos:

1) Forma funcional de la relacin. (supondremos que es lineal)
2) Correcta especificacin del modelo (es decir, que X es la nica variable explicativa)
3) La variable X es no estocstica.
4) Identificabilidad de los parmetros. (
1
y
2
se podrn estimar de forma nica)
5) Valor esperado de la perturbacin dada la informacin observada. (
( ) 1 n
0

= ) ( ) E
6) Varianzas y covarianzas de las perturbaciones dada la informacin observada.
[ ] I ' E
2

=

70

7) Distribucin de probabilidad de la parte estocstica del modelo.

A continuacin, se enumerarn y comentarn las hiptesis bsicas del modelo lineal simple.

Hiptesis 1: El modelo es lineal tanto en las variables como en los parmetros.
Esto es, que las variables entran en el modelo de forma lineal ya sea en sus variables
originales o despus de alguna transformacin previa. Los parmetros asociados a dichas
variables tambin aparecen de forma lineal. Esta hiptesis es fundamental debido a que si el
modelo no cumple con este supuesto habr que utilizar tcnicas no lineales que suponen un
mayor grado de complicacin.

Por ejemplo, el modelo
i 2 i 1 i
X Y + + = es lineal en sus parmetros mientras que el
modelo no lo es.
i i 1 i
2
X Y + =


Hiptesis 2: El modelo est correctamente especificado.
Esta hiptesis implica:
- Que se ha incluido la variable explicativa correcta.
- Que no se han omitido variables explicativas relevantes para explicar a la variable
endgena.
- Que la relacin es constante en todo el perodo muestral lo que implica que los
coeficientes del modelo son constantes.

Hiptesis 3: Regresores no estocsticos.
Las observaciones de X
i
son fijas durante todo el proceso de seleccin de muestra. De este
modo, slo se supone que el modelo de regresin y sus supuestos se aplican al conjunto
particular de las X que se han observado. As, la matriz X definida en (2) es de constantes
conocidas.

Hiptesis 4: Identificabilidad de los parmetros.
Esta hiptesis se traduce en que los coeficientes
2 1
y se podrn estimar de forma nica a
partir de unas observaciones dadas. Esto sucede cuando la variable X
i
no sea constante, es
decir, que presente variabilidad.

Si la variable explicativa fuese constante, el modelo presentara dos trminos constantes: el
asociado al parmetro y el asociado al parmetro
1

2
y ambos coeficientes mediran el
mismo efecto.

Hiptesis 5: La esperanza de las perturbaciones condicionada a la informacin dada es
nula.

Lo que significa que el valor esperado de las perturbaciones son cero, matricialmente se
denota por:
[ ] [ ]
[ ]
[ ]
[ ]

= =
0
0
0
E
E
E
E 0 E
n
2
1
i i
M
M


71


Por lo tanto este supuesto conduce a que las observaciones de X no contengan informacin
sobre el valor esperado de .
i


Ejemplo: En el ejercicio anterior de las 60 familias para un ingreso dado (650), existen 5
familias que tienen diferentes niveles de consumo, siendo su promedio igual a 650. El
i

para cada uno de ests familias se obtiene a partir de la siguiente tabla:

Y
i
E(Y/X
i
)=650
i
P(
i
)
i
P(
i
)
440
480
520
560
600
520
520
520
520
520
-80
-40
0
40
80
1/5
1/5
1/5
1/5
1/5
-80(1/5)
-40(1/5)
0(1/5)
40(1/5)
80(1/5)

E (Y/X
i
=650) = 520

( ) 0
5
1
=

= =
i i i j i
) ( p x / E ( ) 0 80 40 0 40 80
5
1
= + + +

Por ser
5
1
= ) (
i
0 ) X / , ( Cov
j i
=
P constante.

En lo sucesivo se utilizar E (u
i
)=0


Hiptesis 6: Las perturbaciones son esfricas.
Este supuesto se refiere a que las perturbaciones presentan varianza constante y estn
incorrelacionadas entre s. Esta hiptesis encierra dos supuestos:

- Perturbaciones homocedsticas: , es decir que las
varianzas de las perturbaciones son iguales.
n ,... 2 , 1 i para ) X / ( Var
2
s j
= =
- Perturbaciones incorreladas o ausencia de autocorrelacin: , lo que
significa que no existe relacin alguna entre las perturbaciones consideradas.

Estos dos supuestos se pueden expresar conjuntamente para un modelo ms general de la
forma siguiente:

[ ]
n
I X E X Var
2
2
2
2
... 0 0
... ... ... ...
0 ... 0
0 ... 0
/ ' ) / (

= = =

donde In es una matriz identidad de orden n.


72

Este supuesto describe la informacin sobre las varianzas y covarianzas que es proporcionada
por las variables independientes. Si satisface esta hiptesis, se dice que las perturbaciones
son esfricas.

Hiptesis 7: Las perturbaciones recogidas en se distribuyen de forma normal
Gaussiana
Esta hiptesis se establece por conveniencia, debido a que las derivaciones de los contrastes
son mucho ms sencillas. Adems permite la estimacin del modelo lineal y gaussiano por
mxima verosimilitud. Sin embargo, se puede utilizar cualquier otra funcin de probabilidad
sobre la distribucin de las perturbaciones, cambiando algunos de los resultados que se vern
posteriormente.

Analticamente, este supuesto se puede expresar: ( )
n
2
I , 0 N ~




3. MODELO LINEAL GENERAL

Este modelo establece una relacin lineal entre un conjunto de k-1 variables explicativas
(exgenas) y una variable a explicar (variable endgena).

Hiptesis:
Supongamos que existe una relacin lineal entre una variable Y
i
con k-1 variables
explicativas X
2
, X
3
,........... X
k
y un trmino de perturbacin ( ), la cual podemos escribir
como:

Ecuacin tradicional

X ...... X X Y
i ik k 3 i 3 2 i 2 1 i
+ + + + + = (i = 1,2,....n)

Y: Es la variable endgena o explicada cuyo comportamiento se quiere analizar.
X: Cada una de las variables exgenas o explicativas y que son consideradas como las
causas que crean transformaciones en la variable endgena.
2 1
, : Son los parmetros cuyo valor se desconoce y se va a estimar. A travs de la
estimacin de los parmetros se obtiene una cuantificacin de las relaciones
existentes entre la variable endgena (Y) y cada una de las variables explicativas
(X)..
i
: Perturbacin aleatoria que recoge el efecto conjunto de otras variables no
directamente explicitadas en el modelo, cuyo efecto individual sobre la endgena no
resulta relevante.
i: Es el subndice que hace referencia a las diversas observaciones para las cuales se
establece su validez. Segn el tipo de valores con los que est trabajando, el
subndice har referencia a distintos momentos del tiempo (series temporales: las
cotizaciones en bolsa diarias, los ndices de precio al consumo mensuales, los datos
anuales del PIB de un pas, etc.) o a distintas unidades econmicas.


73

El parmetro que corresponde al trmino constante debe ser interpretado como el valor que
toma la variable endgena cuando el resto de variables explicativas valen cero. Por ejemplo,
en una funcin de consumo, aunque ste dependa de la renta y de otras variables, cuando
todas ellas valen cero el individuo realiza un consumo para sobrevivir, lo que es conocido
como autoconsumo. Ese valor queda recogido en el modelo bsico de regresin lineal a
travs del parmetro que corresponde al trmino constante.

El resto de parmetros que acompaan a las variables explicativas miden la relacin entre
estas y la variable endgena a travs de su signo y su cuanta. El signo mide si la relacin
entre las variables es directa o inversa (si a medida que la variable explicativa se incrementa
tambin lo hace la endgena o viceversa). La cuanta sirve para medir que variable
explicativa, de todas las explicitadas en el modelo, es ms importante para explicar el
comportamiento de la endgena, de tal manera que si todas las variables estn medidas en las
mismas unidades de medida, la variable ms importante ser la que tenga un mayor valor de
su parmetro.

Por tanto, el anlisis de los parmetros estimados permite conocer la estructura econmica del
fenmeno que estamos analizando, entendiendo por estructura el patrn de comportamiento
de acuerdo con el cual se desarrolla una accin. Por ejemplo, en el modelo que trata de
explicar la evolucin del consumo en funcin de la renta y de los tipos de inters, la estructura
econmica quedar definida como incrementos de consumo a medida que incrementa la renta;
y reducciones de consumo cuando se incrementan los tipos de inters.


4. CLCULO MATRICIAL DEL MODELO LINEAL GENERAL

Para efectos del clculo matricial tenemos los siguientes:


1 13 3 12 2 1 1
...... + + + +
1
+ =
k
X X
2 2 23 3 2 2 2 1 2
......
k
X Y
+ + + + =
k
X X
k
X + Y

3 3 33 3 32 2 1 3
...... + + + + + =
k k
X X X Y
.
.
Y
n nk n n n
X X
k
X + + + + + = ......
3 3 2 2 1


que puede escribirse matricialmente

=
=
=
=
n
3
2
1
k
3
2
1
nk
k 3
k 2
k 1
3 n 2 n
33 32
23 22
13 12
n
3
2
1
.
.
.
.
*
X
.
.
X
X
X
. X X 1
. . . .
. . . .
. X X 1
. X X 1
. X X 1
Y
.
.
Y
Y
Y
n i
.
.
3 i
2 i
1 i
)
)
)
)
)
)
)
)

o simplemente: Y = X * +
Entonces, la forma extendida del Modelo Lineal General (MLG) puede compactarse
utilizando al anlisis matricial:

74

1 n 1 k nk n1
X Y + =


Para la estimacin del MLG se asume lo siguiente:

a. El modelo es lineal en los parmetros.
b. Las variables explicativas, definidas como las columnas de la matriz X son
determinsticas y linealmente independientes.
c. Los parmetros del modelo son constantes a lo largo de la muestra.
d. Existe una relacin de causalidad desde las variables exgenas hacia la variable
endgena y no viceversa.
e. El vector ( ) es un vector de variables aleatorias que cumplen con:
E( ) = 0 ; Var(u) = E( ' ) = I
2



5. SUPUESTOS DEL MODELO LINEAL GENERAL

Complementndose con los supuestos mencionados para el modelo lineal simple, el modelo
lineal general, adems supone:

1) Las variables X
2
,X
3
... X
K
son variables no aleatorias.

2) La variable explicada Y
i
es aleatoria con media:
E(Y
i
)
ik k 3 i 3 2 i 2 1
X ...... X X + + + + =
O tambin: E(Y)=XB
Varianza: E ( ) [ ] =
2
i i
) Y E Y (
( ) [ ]
2
u
2
i
2
ik k 2 i 2 1 i k ik 2 i 2 1
) ( E X ... X X ... X E = = + + + +

3) La variable Y
i
(explicada) y X
2
,X
3
...X
k
(explicativas) no tienen errores de observacin.

4) Entre las variables: X
2
,X
3
...X
k
no debe haber relacin lineal (no estn correlacionados
entre ellas.) es decir, Cov(X
i
X
j
)=0 cuando i j

5) Lo anterior significa que el rango de la matriz X debe ser k; por consiguiente ninguna
columna debe ser linealmente dependiente de otra columna.

6) Para poder estimar el modelo se requiere tomar una muestra de n elementos, tal que
n>k.

75

LECCIN 6

ESTIMACIN DE LOS PARMETROS



DESCRIPTIVA
INFERENCIAL
Prueba de
Hiptesis
ESTADISTICA Estimacin


1. CRITERIOS PARA SELECCIONAR UN ESTIMADOR

Coherencia: si al aumentar n, el estimador se aproxima al parmetro.
Eficiencia: Cuando proporciona menor error estndar que otros estimadores.
Suficiente: Si utiliza mayor cantidad de la informacin contenida en la muestra que otro
estimador.
Insesgado (o imparcial): Si el estimador tiende a tomar valores por encima y por debajo
del parmetro que estima, con la misma frecuencia.


2. MTODO DE ESTIMACIN DE LOS PARMETROS - MNIMOS CUADRADOS
ORDINARIOS (MCO)

Es el mtodo ms usado, eficaz y conocido del anlisis de regresin debido al contenido de
las propiedades estadsticas que posee. El principio sobre el cual descansa esta
metodologa consiste en la minimizacin de la raz cuadrada de la sumatoria de cada uno
de los errores o perturbaciones.

Principio bsico

El principio bsico para estimar los parmetros es que la suma de los residuales de cada
valor observado respecto al estimado sea lo ms pequea. Pero,
porque la recta estimada corta a los residuales por encima y debajo de manera que se
compensa. En consecuencia se debe de minimizar la suma de los cuadrados de cada uno
de los residuales, obtenindose los estimadores de los parmetros () que posean la menor
varianza en comparacin con cualquier otro mtodo, sus valores en forma matricial sern:
( )

= = 0 Y

Y
i i i
Y X ) X X (
1
=

)


76

Donde su varianza ser :

1 2
) X ' X ( )

( Var

=

Si se considera que se repite el proceso de muestreo, entonces las variables (X)
permanecen fijas de muestra a muestra, pero cada muestra dar un conjunto diferente de
, y por lo tanto un vector diferente, en donde se expresa a como una funcin lineal
del verdadero y de las perturbaciones .





Ejercicio Ilustrativo de Estimacin de Parmetros en un Modelo Lineal Simple (MCO)

Se dispone de informacin de los ingresos totales y gastos en alimentacin de 12 familias

Familia
Gasto
alimentacin
Ingreso Total
(nuevos soles) (nuevos soles)
1 830 2100
2 510 1100
3 420 900
4 560 1600
5 1250 3200
6 840 2300
7 720 1800
8 490 700
9 690 1300
10 850 2400
11 550 1200
12 780 1700

Se plantear un modelo de regresin lineal y se especificar el papel que desempea cada
una de las variables en funcin al estudio.
Variable explicativa (X) es el ingreso familiar
Variable explicada (Y) es el gasto en alimentos de la familia

X Y
2 1 i
+ =










77

Familia



1
830 2,100 1,743,000 4,410,000
830.22 -0.22
2
510 1,100 561,000 1,210,000
529.69 -19.69
3
420 900 378,000 810,000
469.58 -49.58
4
560 1,600 896,000 2,560,000
679.95 -119.95
5
1,250 3,200 4,000,000 10,240,000
1160.80 89.20
6
840 2,300 1,932,000 5,290,000
890.32 -50.32
7
720 1,800 1,296,000 3,240,000
740.06 -20.06
8
490 700 343,000 490,000
409.48 80.52
9
690 1,300 897,000 1,690,000
589.79 100.21
10
850 2,400 2,040,000 5,760,000
920.37 -70.37
11
550 1,200 660,000 1,440,000
559.74 -9.74
12
780 1,700 1,326,000 2,890,000
710.00 70.00
Totales
8,490 20,300 16,072,000 40,030,000
8,490 -7.96E-13


Solucin
Como los parmetros a estimar son
1
y
2
se establece las ecuaciones normales siguientes:

) 2 ( X X
) 1 ( X n
2
i 2 i 1
i 2 1

YX
Y


+ =
+ =
2 1

20300

12 + =

Y reemplazando, se tiene:
En (1) 8490

En (2) 16072000
2 1

40030000

20300 + =

Si se despeja de la primera ecuacin el intercepto y se reemplaza dicho valor en le segunda se
obtienen los siguientes estimadores:

1

= 199.108 = 0.301
2


La funcin de regresin muestral, es decir la regresin de Y con respecto a X:

i
Y

i
X 301 . 0 108 . 199 + =

Sustituyendo las observaciones muestrales de X en la ecuacin anterior se obtiene la columna
6 de la tabla.

Comparando estos valores con aquellos observados para la variable dependiente hallamos los
errores correspondientes a cada observacin de la muestra. Se verifica que la suma de errores
estimados es 0. (Columna
i
)


i
X
i
Y
i i
Y X
2
X i
Y

i i
Y

Y =
i

78

Mtodo Matricial

Familia


1
830 2,100 1,743,000 4,410,000
830.22 -0.22
2
510 1,100 561,000 1,210,000
529.69 -19.69
3
420 900 378,000 810,000
469.58 -49.58
4
560 1,600 896,000 2,560,000
679.95 -119.95
5
1,250 3,200 4,000,000 10,240,000
1160.80 89.20
6
840 2,300 1,932,000 5,290,000
890.32 -50.32
7
720 1,800 1,296,000 3,240,000
740.06 -20.06
8
490 700 343,000 490,000
409.48 80.52
9
690 1,300 897,000 1,690,000
589.79 100.21
10
850 2,400 2,040,000 5,760,000
920.37 -70.37
11
550 1,200 660,000 1,440,000
559.74 -9.74
12
780 1,700 1,326,000 2,890,000
710.00 70.00
Totales
8,490 20,300 16,072,000 40,030,000
8,490 -7.96E-13

La ecuacin matricial se escribe de la siguiente forma:

n
2
1
2
1
k 2
22
21
n
2
1
.
.
.
.
.
.
. X 1
. . . .
. . . .
.
. X 1
. X 1
Y
.
.
Y
Y
)
)
)
)
)


O simplemente: + = X Y

Para el caso de 2 variables: ) Y X (

) X X (
' '
=

( )

Y X
Y
Y X' y
X X
X n
X ' X
i i
i
2
i i
i


( )

=
16072000
8490
Y X' y
40030000 20300
20300 12
X ' X

( )

07 E 75773 . 1 000297349 . 0
000297349 . 0 586348323 . 0
X ' X
1



=
0.3005273
199.10795
16072000
8490

07 E 75773 . 1 000297349 . 0
000297349 . 0 586348323 . 0



Los son los mismos obtenidos que el mtodo anterior.
i
X i
Y
i i
Y X
2
X i
Y

i i
Y

Y =
i

79

Ejercicio Ilustrativo de Estimacin de Parmetros en un Modelo Lineal General (MCO)

El director de una agencia de viajes quiere estudiar el sector turstico en Per. Para ello
dispone de informacin relativa al grado de ocupacin hotelera (Y), nmero medio de turistas
(X
2
), medido en miles de turistas, y estancia media (X
3
), medida en das.


OBSERVACIN
I
N DE
OCUPACIN
HOTELERA
TURISTAS DAS DE
ESTANCIA (MILES)
i
Y
2
X
3
X
1 5 2 3
2 8 3 4
3 8 5 6
4 9 4 5
5 9 6 7
6 13 2 6
7 6 3 4
8 9 4 5
9 4 5 4
10 3 6 3


Solucin

En este caso se tienen 2 variables independientes, por lo que ser conveniente hacer uso de la
forma matricial, por lo tanto:


Modelo Lineal General:
i 3 3 2 2 1 i
X X Y + + + = , donde n =10; k=3

=



2
3 i 3 i 2 i 2 i
3 i 2 i
2
2 i 2 i
3 i 2 i
'
X x X X
X X X X
X X n
) X X (

i 3 i
i 2 i
1
'
Y X
Y X
Y
Y X

Los coeficientes del modelo sern:

= =

=

9608 . 1
0821 . 1
5529 . 2
Y X ) X X (

' 1 '
3
2
1


Luego, el modelo estimado es:

3 2 3 3 2 2 1 i
X 9608 . 1 X 0821 . 1 5529 . 2 X

X

Y

+ = + + =

80


LECCIN 7


PROPIEDADES DE LOS ESTIMADORES


1. INSESGABILIDAD

Los estimados son insesgados, es decir, si se obtuvieran los de las muestras posibles, en
promedio dara el verdadero valor del poblacional.


[ ] = + = + =

) ( E X ) X X ( X ) X X ( E )

( E
1 1


Entonces:

1 1
)

( E =
2 2
)

( E =
.
.
k k
)

( E =

Es decir, que el valor esperado del estimador (y no el valor del estimador) coincide con el
valor poblacional (desconocido) del parmetro.


Grfico de Distribucin de los Estimadores de a partir de todas las Muestras Posibles



dispersin
i






i i
)

( E =
Cada uno de los es igual a los verdaderos ms algo. Como los Xs son valores fijos,
entonces este algo va a depender de la perturbacin (u).


En consecuencia los estimados a partir de muestras diferirn entre ellos a partir de las
diferencias en su trmino de perturbacin (u). En efecto, diferentes muestras de valores
produciran diferentes (parmetros).

En general las diferencias entre los estimados por cada muestra sern parecidas, por lo tanto
cercano a los verdaderos s, ello en la medida que el componente aleatorio (u) sea lo ms
reducido posible.

81



2. EFICIENCIA


Decir que un estimador es eficiente se refiere a que posee la menor varianza, es decir, un
estimador es ms eficiente que otro, cuando obtenidos de la misma muestra, la varianza del
primero es menor que la del segundo.


) ( Var ) ( Var
i i

i


Donde:

es obtenido por otro procedimiento



3. CONSISTENCIA


Un estimador es consistente cuando a medida que aumente el tamao de la muestra la
media de la distribucin de ste ser ms prxima al valor verdadero del parmetro ,es
decir, que al cumplir con esta propiedad ser la media de tal distribucin.
i



La importancia de esta propiedad radica en que si un estimador resulta sesgado cuando se
posee una muestra de tamao reducido (menor de 25), el investigador puede eliminar el sesgo
se aumenta el tamao de la muestra, por tanto, para poder garantizar que el estimador sea
insesgado se deber utilizar muestras grandes.

82



Consistencia Eficiencia Insesgabilidad

PROPIEDADES DE LOS ESTIMADORES


83


LECCIN 8


ESTIMACIN DE LA VARIANZA DEL TRMINO DE PERTURBACION


Un estimador del trmino de perturbacin sera el residual (e). En consecuencia la varianza
del residual podra utilizarse como estimador de la varianza del trmino de perturbacin ().

Frmulas

La frmula usada para el Modelo Lineal Simple, que como se sabe tiene dos parmetros
( ) es:
1


2 n 2 n
) Y

Y (
S
2
i
2
2 2

= =




Entonces la frmula usada para el Modelo Lineal General que tiene k parmetros ( ; ; ;
) ser:
1



Forma Matricial:
k n
Y X

Y Y
k n
'
2





k n k n
Y Y
S
i

=

2 2
2
)

(


Donde:

n = nmero de observaciones
k = nmero de parmetros


Ejercicio 1

El director de una empresa piensa que el nivel de ventas de un producto que l comercializa
depende nicamente los gastos realizados en publicidad de este producto. Para estudiar las
ventas de este producto pretende estimar el siguiente modelo:

+ + = X Y
t 1 0 t



84

Donde Y
t
es la cantidad vendida anualmente del bien Y en el ao t y X
t
es gasto en publicidad
durante el ao t, por lo tanto
+ = X Y

Se dispone de los siguientes datos muestrales:

Ao
X
t

(Publicidad)
Y
t

(Ventas)
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
80
100
120
140
160
180
200
220
240
260
70
65
90
95
110
115
120
140
155
150

Para este caso se observa que slo se tiene una variable independiente que es gasto en
publicidad (X) , mientras que la dependiente son las ventas (Y)
Por lo que el modelo ser:

10
3
2
1
2
1
.
.
.
260 1
. .
. .
. .
120 1
100 1
80 1
150
.
.
.
90
65
70


Para estimar a los 2 parmetros se har uso de , luego: Y ' X ) X ' X (

1
=

=

1
1
2
i i
i
1
1
322000 1700
1700 10
x x
x n
260 1
. .
. .
. .
120 1
100 1
80 1

60 .........2 120 100 80
....1 .......... 1 1 1
) X ' X (

85

0.0000303 0.005152 -
0.005152 - 975757 . 0
10 1700 -
1700 - 322000
330000
1

=
205500
1110
150
.
.
.
65
70
80....260
1 .......... 1
Y ' X


Los coeficientes estimados del modelo sern:

=
50909 . 0
4545 . 24

205500
1110
0.0000303 0.005152 -
0.005152 - 0.975757

2
1




La Varianza del Trmino de Perturbacin

Se sabe que:
k n
Y ' X ' Y ' Y
) k n (
'
2



Haciendo las operaciones respectivas:

( ) 132100
150
.
.
.
65
70
50 .........1 65 70 Y ' Y =

=


( ) 49 . 131762
205500
1110
0.50909 4545 . 24 Y ' X '

=

Reemplazando en la frmula de la varianza de la perturbacin, tenemos:

18875 42
8
51 337
2 10
49 131762 132100
2
.
. .
= =




86

Calculo de la varianza estimada de los parmetros de regresin:

( )

=
0.0000303 0.005152 -
0.005152 - 0.975757
18875 . 42 )

( Var

( )
( )
0357533 . 0
416071082 . 6
: ser estimada estandar desviacin La
25 0012783191 . 0 0000303 . 0 18875 . 42
16596813 . 41 975757 . 0 18875 . 42
2
1
2
2
1
2
=
=
= =
= =




Ejercicio

En el ejercicio anterior del modelo lineal general: Grado de ocupacin hotelera (Y) en funcin
del nmero medio de turistas (X
2
), medido en miles de turistas, y estancia media (X
3
), medida
en das:

3 2 3 3 2 2 1 i
X 9608 . 1 X 0821 . 1 5529 . 2 X

X

Y

+ = + + =

La varianza del trmino de perturbacin es:

9914 . 0
k n
Y ' X ' Y ' Y
2
=


==












87

ANEXO

OPERACIONES CON MATRICES

En este anexo se presentarn las nociones bsicas del lgebra matricial, la cual es necesaria
para poder entender los captulos subsiguientes.
Dado los siguientes datos hipotticos (Periodo 1991-1995)

AO Y X1 X2
1991 3 3 5
1992 1 1 4
1993 8 5 6
1994 3 2 4
1995 5 4 6

Se desea estimar el siguiente modelo de regresin lineal:

Y
t
=
1
+
2
X
1t
+
3
X
2t
+
t

Donde:
Y
t
es la variable dependiente o endgena.
X
1
, X
2
son variables independientes o exgenas.

1,

2
y
3
son parmetros desconocidos. A
1
se le conoce con el nombre de intercepto, a
los
2
y
3
se les llaman coeficientes de regresin.

t
es una variable aleatoria no correlacionada y no observable.

A partir de los datos se crean las siguientes matrices:

X

=
5
3
8
1
3
Y

=
6 4 1
4 2 1
6 5 1
4 1 1
5 3 1
En este caso: n = 5 (numero de observaciones)
k = 3 (numero de parmetros del modelo)

Primeramente se tiene que tener en claro que una matriz es un arreglo de nmeros o
elementos en filas y en columnas. Cuando se habla del orden de una matriz se refiere a la
cantidad de elementos ordenados en filas y columnas, por ejemplo las matrices X es una
matriz de orden (3x5), mientras que la matriz Y es de (5x1).

Para estimar el modelo se har uso de:

( ) Y ' X X ' X
1

=

Por lo que para encontrar esos valores ser necesario realizar ciertos clculos matriciales
previos tales como:

88

TRANSPUESTA DE UNA MATRIZ

La transpuesta de una matriz X de orden (5x3) la cual se denota por X, es una matriz de
orden (3x5), la cual es obtenida a partir de cambiar las filas por las columnas, es decir que por
ejemplo la primera fila de X se convierte la primera columna de X.

Por lo tanto se tendr que las transpuestas de X e Y sern:

=
6 4 6 4 5
4 2 5 1 3
1 1 1 1 1
' X

[ ] 5 3 8 1 3 ' Y =

MULTIPLICACIN DE MATRICES

Cada elemento de esta nueva matriz se obtiene sumando los valores que resultan de
multiplicar los elementos de una fila de la matriz (por ejemplo de X) por su columna
correspondiente de la otra matriz (por ejemplo Y), lo que originar que se forme una matriz de
orden (3x1) la cual proviene de que la primera matiz tenga 3 filas y la segunda 1 columna. Por
ejemplo:

+ + + +
+ + + +
+ + + +
=

=
109
76
20
5 6 3 4 8 6 1 4 3 5
5 4 3 2 8 5 1 1 3 3
5 1 3 1 8 1 1 1 3 1
5
3
8
1
3

6 4 6 4 5
4 2 5 1 3
1 1 1 1 1
Y ' X

[ ] [ 108 5 5 3 3 8 8 1 1 3 3
5
3
8
1
3
5 3 8 1 3 Y ' Y = + + + + =

= ]

De manera similar se calcula (XX)

=
129 81 25
81 55 15
25 15 5
6 4 1
4 2 1
6 5 1
4 1 1
5 3 1

6 4 6 4 5
4 2 5 1 3
1 1 1 1 1
X ' X

89

DETERMINANTE

El determinante es un valor que obtiene a partir de una matriz cuadrada (posee igual nmero
de filas y columnas), el valor del determinante de una matriz es presentado por: la matriz
encerrada por unas llaves: . A

Por simplicidad se mostrar a continuacin como obtener una matriz de orden 2 y 3, para los
otros casos es ms conveniente hacer uso del computador ya que son operaciones que
requieren de una considerable cantidad de operaciones.

Hallar un determinante de una matriz de orden 2:

Sea la matriz

=
d c
b a
A

su determinante estar dado por: c b d a A =


Hallar un determinante de una matriz de orden 3:

Sea la matriz

=
p n m
f e d
c b a
A

su determinante estar dado por:

m e c n e c p d b m f b n f a p e a A + + =

INVERSA
2


Se debe tener presente que la inversa de una matriz origina otra matriz la cual se podr
calcular solamente cuando tenga la misma cantidad de filas y columnas, adems su
determinante debe ser diferente de cero.

Los pasos para obtener la inversa de un matriz son:
Hallar el determinante de la matriz, si es diferente de cero ser posible calcularlo.
Si se cumple con el punto anterior el paso siguiente consiste en reemplazar cada elemento de
la matriz por su cofactor correspondiente, obtenindose as la matriz de cofactores.

El cofactor de una matriz A de orden (nxn) es denotado por c
ij
, el cual esta definido por:

ij
j i
ij
M ) 1 ( c
+
=

2
La inversa de una matriz puede ser halla por medio de calculadoras matriciales, esto resulta til para el ahorro
de tiempo en los clculos.

90


donde
ij
M es el determinante que resulta de eliminar la isima fila y la jsima columna de la
matriz considerada inicialmente

Luego de obtener la matriz de cofactores se halla su transpuesta, la cual es conocida como la
matriz adjunta (Adj).

Como ltimo paso se procede a calcular la inversa de la forma siguiente:

) A ( Adj
A
1
A
1



Su determinante se obtiene por la frmula mostrada anteriormente: 20 X ' X =

El paso que sigue es la obtencin de la matriz de cofactores, a al cual la llamaremos C:

72 168 72
24 168 90
160 120 534
3 7
3 17
11 7
13 17
11 3
13 3
3 9
3 17
3 9
13 17
129 81
25 15
81 25
55 15
3 9
11 7
129 81
81 55
C



=

=

72 168 72
24 168 90
160 120 534
Adj



=

Luego:

= =

5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26
Adj
20
1
129 81 25
81 55 15
25 15 5
) X ' X (
1
1


Si se utiliza la frmula anteriormente dada se obtendrn los estimadores de parmetro




91

=
5 . 1
5 . 2
4
109
76
20

5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26




Valor estimando de la varianza de los trminos de perturbacin:
2


En el modelo de regresin lineal se obtiene a partir de:

) k n /( ) Y ' X ' Y ' Y (
2
=




[ ] 5 . 1 5 . 2 4 ' =




[ ] 5 . 106
109
76
20
5 . 1 5 . 2 4 Y ' X ' =





75 . 0
3 5
5 . 106 108
k n
) Y ' X ' Y ' Y (
2
=




Estimacin de la matriz de varianzas y covarianzas:

1
2
) X ' X ( )

var(

=
2



=
875 . 1 125 . 1 6
125 . 1 75 . 0 375 . 3
6 375 . 3 025 . 20
5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26
75 . 0 )

var(


R Estimando el


) Y n Y ' Y /( ) Y n Y ' X ' ( R
2 2
2
=



92




16 Y
4
5
5 3 8 1 3
Y
2
=
=
+ + + +
=




[ ] 5 . 106
109
76
20
5 . 1 5 . 2 4 Y ' X ' =

9464 . 0
16 5 108
16 5 5 . 106
R
2
=


=


Estimando el
2
R ajustado


2
2
2
ajustado
R
) k n (
) 1 n (
) Y n Y ' Y (
) Y ' X ' Y ' Y ( 1
) k n (
) 1 n (
R

=



8929 . 0 9464 . 0
3
4
16 5 108
16 5 5 . 106
3 5
1 5
R
2
ajustado
=

=

Para el clculo del F estadstico, utilizaremos la siguiente formula:

) k n /( ) R 1 (
) 1 k /( R
F
2
2
c


=

Reemplazando en la formula obtuvimos el siguiente valor:

6667 . 17
) 3 5 /( ) 9464 . 0 1 (
) 1 3 /( 9464 . 0
F
c
=


=


PREDICCION
3


Prediccin en Media:
=
) )
i i
' X Y


Prediccin de un valor puntual: =
) )
0 0 i
' X ) x /( Y


3
Este tema se vera detalladamente en la Unidad IV

93

Sea Entonces

=
8
6
1
X
0
[ 8 6 1 ' X
0
= ]

=
5 . 1
5 . 2
4
0
)

Finalmente: =
) )
0 0 i
' X ) x /( Y = 7

VARIANZA DE LA PREDICCION

5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26
) X ' X (
1
75 . 0
2
=

)


[ ] 3 5 . 1 3 . 10 ) X ' X ( ' X
1
0
=



7 . 4 Xo ) X
1
=

525 . 3 ) 7 . 4 ( 75 . 0 ) xo
' X ( ' Xo
/ Y var(

Remplazando en las frmulas para obtener las varianzas, tenemos:

Varianza de la prediccin promedio
o
1
o
2
x ) X ' X ( ' x ) xo / Y var(

=

= =

DS: Desviacin Estndar:
o
1
o
2
x ) X ' X ( ' x DS

= Entonces 8755 . 1 525 . 3 DS = =



El valor promedio de Y se encuentra en el intervalo comprendido entre:

Xo ) X ' X ( o ' X t Y ) Xo / Y ( E Xo ) X ' X ( o ' X t Yo
1 2
2 / o
1 2
2 /



+

7 Y
0
= Donde: 182 . 3 t
2
=

Con 3 grados de libertad y un nivel de significancia del 5%



Reemplazando los datos, tenemos que el valor promedio de Y se encuentra comprendido en el
intervalo: [ ] 974 . 12 , 0258 . 1
[ ] 275 . 4 7 . 4 1 75 . 0 ) xo / Y var( = + =

VARIANZA DE LA PREDICCION INDIVIDUAL:

[ ]
o
1
o
2
x ) X ' X ( ' x 1 ) xo / Y var(

+ =




94


[ ]
o
1
o
2
x ) X ' X ( ' x 1 DS

+ = Entonces 0676 . 2 275 . 4 DS = =




El intervalo de confianza al 95% para la prediccin puntual se calcula mediante la siguiente
frmula:
[ ] [ ]
o
1
o
2
2 / o
1
o
2
2 /
x ) X ' X ( ' x 1 t Yo ) Xo / Y ( E x ) X ' X ( ' x 1 t Yo

+ +

7 Y
0
=

Donde: 182 . 3 t
2
=



Entonces el intervalo de confianza para la prediccin individual es: [ ] 579 . 13 , 42087 . 0


EVALUACION DEL MODELO ESTIMADO (PARA PREDECIR)

=
6 4 1
4 2 1
6 5 1
4 1 1
5 3 1
X

=
5 . 1
5 . 2
4
)

=
5
3
5 . 7
5 . 0
4
Y
t
)

=
5
3
8
1
3
Y
t

=
0
0
5 . 0
5 . 0
1
Y Y
t t
)

=
0
0
25 . 0
25 . 0
1
) Y Y (
2
t t
)
5 n =

5 . 1 ) 0 0 25 . 0 25 . 0 1 ( ) Y Y (
2
n
1 t
t t
= + + + + =

=
)





Raz Cuadrtica Media (rms):

=
n
1 t
2
t
t Y Y
n
1
rms Donde:
t
Y
)
es el valor estimado de
t
Y
es el valor observado de
t
Y
t
Y

95


Reemplazando los datos: 5477 . 0 ) 5 . 1 (
5
rms =
1
=

La rms, debe ser lo ms pequeo posible para que el modelo sea bueno para predecir.


Coeficiente de Theil (U):

( )

= =


=
n
1 t
2
t
n
1 t
2
t
n
1 t
2
t
t
Y
n
1
Y
n
1
Y Y
n
1
U

Donde:
t
Y
)
Es el valor estimado de
t
Y
Es el valor observado de
t
Y
t
Y

=
25
9
25 . 56
25 . 0
16
) Y (
2
t
)

=
25
9
64
1
9
) Y (
2
t
5477 . 0 ) 5 . 1 (
5
1
Y Y
n
1
n
1 t
2
t
t = =



5 n =
5 . 106 ) = 25 9 25 . 56 25 . 0 16 ( ) Y (
2
t + + + + =



108 ) 25 9 64 1 9 ( ) Y (
2
t
= + + + + =


6152 . 4 ) 5 . 106 (
5
1
) Y (
n
1
2
t = =


6476 . 4 ) 108 (
5
1
) Y (
n
1
2
t = =




Reemplazando datos se tiene, que U es igual a:
0591 . 0
6476 . 4 6152 . 4
5477 . 0
U =
+
=

El ndice de Theil nos dice que cuanto ms cercano a cero, el modelo ser bueno para
predecir. Este coeficiente mide la rms en trminos relativos.

96

Ejercicio de autoconocimiento

Porqu hacer un anlisis de regresin lineal?

SI

NO NO S
1. Porque considero que es una tcnica estadstica
importante para una buena toma de decisiones
empresariales.


2. Porque permite recomendar un tratamiento para
los problemas en el comportamiento de los
agentes.


3. Para analizar el pasado y predecir el futuro de la
empresa.


4. Especifica la relacin entre variables.


5. Para utilizar el modelo correcto y adecuado para
un pronstico


6. Para establecer la importancia del estudio de las
variables.


7. Porque realiza la distincin entre variable
dependiente y la independiente.


8. Para interpretar los elementos constitutivos del
modelo de prediccin.


9. Para desarrollar la posibilidad de utilizar el
anlisis de regresin para estimar intervalos y
contrastar hiptesis.


10. Para predecir sucesos futuros.



CALIFICACION

Puntuar con un punto cada respuesta SI.
Si obtienes de de 1 - 3 puntos tienes pocas expectativas de hacer un buen anlisis de
regresin lineal.
Si tienes entre 4 7, tienes buenas expectativas de hacer un buen anlisis de regresin lineal.
Y si tienes entre 8 10, denotas excelentes expectativas de hacer un buen anlisis de
regresin lineal.


97

RESUMEN

Los elementos que integran un modelo son: las ecuaciones, las variables y los parmetros.

El proceso de construccin de un modelo se puede presentar como una secuencia de
etapas que a continuacin vamos a presentar:
-Conocimiento de la Teora Econmica
-Especificacin del Modelo Economtrico
-Estimacin
-Verificacin
-Prediccin

La idea clave del anlisis de regresin es la dependencia estadstica de una variable, la
variable dependiente, sobre una o ms variables, las variables explicativas.

El objetivo de este anlisis es estimar y/o predecir la media o el valor promedio de la
variable dependiente con base en los valores conocidos o determinados de las variables
explicativas.

Resumen de frmulas

La funcin de regresin lineal:
i 2 2 1 i
X Y + + =

Intercepto:
1
X ( Y
i

Coeficiente de la pendiente:
2


Perturbacin estructural o estocstica de la poblacin: ) / Y E =
1


Funcin de regresin poblacional: + + =
i 2 1 i
x

Y FRP
i


Funcin de regresin muestral:
i i 2 1 i
e x

Y FRM + + =

La forma extendida del Modelo Lineal General (MLG) puede compactarse as:

Y
n1
= X
nk

k1
+
n1

Mtodos de estimacin de los parmetros: Mnimos Cuadrados ordinarios (MCO),
Mtodo de momentos y Mxima verosimilitud

Modelo Lineal Simple:
2 i 2
x
I 1 i
y + + =

Clculo de estimadores:


=
) (
) )( (
2
2
2
x x
y y x x
b
i


98



2 2 1
x b y b + =

Modelo Lineal General:
I 3 3 2 i 2 1 i
x x y + + + =

Y X ) X X (
1
=

)



EXPLORACION ON LINE

1. Anlisis de regresin lineal

http://www.udc.es/dep/mate/estadstica 2

2. Regresin lineal entre dos variables.

http://bayes.escet.urjc.es/~jmmarin/libroelec,tema8.

3. Fundamentos del anlisis de regresin lineal

http://www.termodinamica.us.es/tecnicas/como/node

4. Introduccin al anlisis de regresin lineal.

http://www.cuspide.com/detalle_libro.php?isbn=9702403278

5. Optimizacin y anlisis de regresin lineal.

http: //members.lycos.co.uk/k59/artha/artha1.


















99




LECTURA

IMPORTANCIA DE LA REGRESIN.
Uno de los usos ms frecuentes de la regresin no es el de pronosticar, como en este ejemplo,
sino que usamos la regresin para el propsito de hablar de una relacin ms o menos general
entre las variables involucradas. Regresando al ejemplo, el argumento sera el siguiente:
si esta compaa de bolgrafos encontr una relacin entre las ventas y estas variables
independientes, ese mismo tipo de relacin se debe presentar en otra compaa
comercializadora o productora de bolgrafos
Una extensin de resultados como sta se sale ya del mbito de la estadstica y se adentra ms
en el del sentido comn.
En parecidas circunstancias, se encontrara una afirmacin que extendiera los resultados de un
anlisis de regresin en el tiempo. Diciendo algo como
si en los ltimos siete aos ha habido una relacin entre las ventas y estas variables
independientes, ese mismo tipo de relacin ser cierta en el prximo ao
A veces llegamos, incluso, al extremo de decir
si en esta compaa del ramo mercantil se ha presentado esta relacin, en otras compaas
del mismo ramo se presentar tambin; nuestra compaa debe poner ms cuidado al
elaborar su poltica de ventas en los factores siguientes:
nmero de agentes de ventas
nmero de spots en la televisin local y
eficiencia de los mayoristas
Claro que esta afirmacin se halla mucho ms retirada de la frialdad de los nmeros y de los
mnimos cuadrados.
Para poder calificar la validez de afirmaciones como las anteriores debemos fijarnos en la
cuestin de los sesgos.
En este caso, habra que ver qu tanto se parecen nuestros datos a una muestra al azar de
observaciones de la situacin mayor. Regresando a nuestro ejemplo habra que considerar qu
tan parecidas son las circunstancias de mercado de las compaas a las que queremos extender
los resultados con las de la compaa de donde se sacaron los datos analizados; habra que
hacer el mismo tipo de consideraciones en caso de querer extender los resultados en el
tiempo.
Fuente: Mendoza Durn, 2003

100





ACTIVIDADES


1. Dado el modelo:



t t t t t t
VE BC CG CP I PBI ) 1 ( + + + + =


t 2 1 t 10 1 t 9 1 t 8 1 t 7 1 t 6
t 5 t 4 t 3 t 2 1 t
I IDE LSF YT DEI
IDE LSF YT DEI I ) 2 (
+ + + + + +
+ + + + =




t 3 1 t 6 1 t 5 1 t 4 t 3 t 2 1 t
LSF TIPR PBI TIPR PBI LSF ) 3 ( + + + + + + =




t 4 1 t 6 1 t 5 1 t 4 t 3 t 2 1 t
IDE REM PBI REM PBI IDE ) 4 ( + + + + + + =



Donde:

PBI : Producto Bruto Interno
I : Inversin Total
LSF : Liquidez Total del Sistema Financiero
IDE : Inversin Directa Extranjera
CP : Consumo Privado Total
CG : Consumo del Gobierno Total
BC : Balanza Comercial
VE : Variacin de Existencias
DEI : Deuda Externa para la Inversin
YT : Ingresos Tributarios
TIPR : Tasa de Inters Pasiva Real del Sistema Financiero
REM : Remesas de utilidades al exterior

a. Clasificar las variables.
b. Interpretar los parmetros.


2. Una agente desea invertir 1 milln de soles en acciones que se coticen en Bolsa. Despus
de evaluar las distintas alternativas se plantea la decisin de invertir entre dos opciones:
acciones de la empresa A o acciones de la empresa B. En principio, su criterio de
eleccin se basa en preferir la compra de acciones de aquella empresa en la que espere
obtener un rendimiento por sol invertido ms elevado y a la vez que presente mayor
seguridad. Para ayudarse en la toma de decisin plantea un modelo economtrico donde
establece que la rentabilidad por cada 1000 soles invertidos en acciones de cada empresa
(REN) depende de dos variables:


101

Volumen de beneficios reales obtenidos por la empresa en millones de soles
(BEN)
Volumen de activos medio mantenido en millones de soles (ACT).

Dado que se evalan dos empresas, se plantea dos modelos independientes. Para ello
dispone de la siguiente informacin obtenida con los datos de los ltimos 20 aos:

Empresa A

( )

=

115
105
40
Y ' X
12 . 0
07 . 0 07 . 0
11 . 0 05 . 0 17 . 0
X ' X
50
30 35
25 10 20
X ' X
1
( )

=

110
90
30
Y ' X
22 . 0
20 . 0 23 . 0
14 . 0 10 . 0 15 . 0
X ' X
40
25 22
20 8 20
X ' X
1


Empresa B




Teniendo en cuenta la informacin proporcionada, se pide:


a) Efectuar la especificacin de cada uno de los modelos
b) Calcular los estimadores mnimos cuadrticos de los parmetros.
c) Estimar las varianzas de los trminos de perturbacin
d) Si el agente conoce los siguientes datos en el periodo n+1 :

Empresa A Empresa B
BEN 3.2 3.5
ACT 3.8 3.5

donde se estima que los valores de las variables explicativas son similares a sus
medias. En cul de las dos empresas decidir invertir teniendo en cuenta sus
criterios de inversin?

3. Sea Y: demanda de trabajo y X: tasa de desempleo.
Con los siguientes datos:

X
i
=432.970 Y
i
= 262467.06
X
i
= 82.7000 Y
i
= 1995.2000
X = 5.16875 Y = 1224.7000
X
i
Y
i
= 10042.3

Estime los parmetros del modelo, presente la funcin de regresin muestral Qu
comentarios le merece?

102


4. Un comerciante al menudeo llev a cabo un estudio para determinar la relacin entre los
gastos de publicidad semanal y las ventas. Se obtuvieron los siguientes datos:

X : Costos de publicidad ($) Y : Ventas ($)

X
i
= 15650 Y
i
= 2512925
X
i
= 410 Y
i
= 5445
X
i
Y
i
= 191325 n = 12

Estime los parmetros del modelo, presente la funcin de regresin e interprete.

5. La Empresa 'The Home" produce y comercializa muebles para el hogar. Esta empresa
tiene cierto poder en el mercado, en el sentido que puede manejar el precio de sus
productos, adems el constante gasto en publicidad diferencia sus productos de los de
la competencia.

Sin embargo, ltimamente la participacin de la empresa en el mercado de muebles
para el hogar ha disminuido. El Gerente General atribuye esto al hecho que no ha
existido una poltica clara en cuanto la fijacin de precios y publicidad. Por tanto, se
pide un estudio que determine el efecto que tiene en las ventas las variables precio y
publicidad.
Adems, se pide proponer una poltica en precio y publicidad si se desea aumentar las
ventas para el prximo periodo en 10%. Los datos son los siguientes:

VENTAS
(miles de soles)
PRECIO
soles/u
PUBLICIDAD
(miles de soles)
180.6 2.1 30
213.3 4.5 55
174.6 2.9 25
189.3 3.6 36
209.1 15 60
248.1 7.7 82
253.9 5.8 73
215.8 3.2 58
218.1 5 58
206.6 12.3 49












103


AUTOEVALUACIN

Encierra en un crculo la letra que contenga la alternativa correcta.

1. Cul de las siguientes etapas no pertenecen al proceso de construccin de un modelo:

a) Conocimiento de la Teora Econmica
b) Especificacin del Modelo Economtrico
c) Estimacin
d) Verificacin
e) Propiedad de los estimadores

2. La verdadera expresin de la ecuacin lineal con dos variables independientes es:

a)
3 3 2

2 1
X b X b b Y

+ + =
b) ,....)
3
X , X , X ( f Y

2 1
=
c) ) X / Y ( E Y
1 i
=
d) T
t
= + Y
t
+ u
t
; o < < 1
e) N.A.


3. La ecuacin tradicional del Modelo Lineal General es

a) ) / Y E X ( Y
1 i
=
b) ,....) X , X , X ( f Y

3 2 1
=
c)
i
x ...... x x Y
ik k i i i
+ + + + + =
3 3 2 2 1

d) Dependiente
e) N.A.

4. El grado de dureza de un mineral depende del contenido de otros dos minerales. Los
siguientes datos corresponden a dichas barras de minerales estudio.

Dureza 6 13 13 29 33 32 46 117.5
c
1
1 2 3 4 5 6 8 20
c
2
10 10 12 11 14 15 18 30

Considerar el modelo d
i
=
1
+
2
c
2i
+
3
c
2i
con los supuestos habituales:

4.1 Prueba la hiptesis: H
0:

1 =
0
con = 5% , H
1:

1
0

a. Se acepta la H
0
con un t calculado igual a 0.68.
b. Se rechaza la H
0
con un t calculado igual a 5.66.
c. Se acepta la H
0
con un t calculado igual a 1.98

104


4.2 Calcule un intervalo de confianza del 99 % para el valor esperado de la dureza de
una barra tal que c
1=
5 c
2=
10

(XX)
-1
= 15.258919 1.9536424 -1.806665
1.9536424 0.2649007 -0.238411
-1.806665 -0.238411 0.2177953

=
5960
3262
5 . 289
Y ' X YY = 19250.25 ( ) 66 . 2 , 76 . 8 , 51 . 22

=
S
2
= 8.94

a. [17.61,61.71]
b. [20.35,56.34]
c. [24.45,70.94]

4.3 Calcule un intervalo de confianza de 95 % para 2
a. [6.76,34.45]
b. [7.35,46.49]
c. [3.48,53.79]



RESPUESTAS DE CONTROL
1e, 2.a, 3.c, 4.1c, 4.2a, 4.3c






















105


106