You are on page 1of 5

Anlisis de Regresin

y
Anlisis de Varianza

Recordemos que:
SCT = SCE + SCR, la cual fragmenta la suma de cuadrados total
(SCT) en dos componentes:

La suma de cuadrados explicada (SCE) y


La suma de cuadrados de residuos (SCR).
El estudio de estos componentes de SCT se conoce como
anlisis de varianza (ANOVA) desde el punto de vista de la
regresin.
Asociados con toda suma de cuadrados estn sus gl, es decir, el
nmero de observaciones independientes en las que se basa.
La SCT tiene n 1 gl porque se pierde 1 gl en el clculo de la
media muestral .
La SCR tiene n 2 gl. (Nota: Esto slo es vlido para el modelo
de regresin con dos variables con presencia del intercepto 1 .).
SCE tiene 1 gl (de nuevo, esto slo vale para el caso de dos
variables), lo cual se deduce de que SCE= 22 2 sea una
funcin slo de 2 , pues se conoce 2 .
i.

Reorganicemos las sumas de cuadrados y sus gl asociados


en la siguiente tabla:

que es la forma estndar de la tabla AOV, denominada algunas


veces tabla ANOVA. Con la informacin de la tabla, consideremos
ahora la siguiente variable:
Si suponemos que las perturbaciones
estn normalmente distribuidas, lo
cual se cumple para el MCRLN, y si la
hiptesis nula (H0) es que 2 = 0,
puede demostrarse que la variable F
de la ecuacin anterior, satisface la
distribucin F con 1 gl en el numerador
y (n 2) gl en el denominador.

Qu uso puede hacerse de la razn F anterior? Puede


demostrarse que

(Observe que 2 y 2 al lado derecho de estas ecuaciones son los


verdaderos parmetros.) Por tanto, si 2 es en realidad cero, ambas
ecuaciones proporcionan estimaciones idnticas del verdadero 2. En
esta situacin, la variable explicativa X no tiene influencia lineal alguna
sobre Y, y toda la variacin en Y se explica con las perturbaciones
aleatorias ui. Por otra parte, si 2 es diferente de cero, las ecuaciones
sern diferentes y parte de la variacin en Y se atribuir a X. Por
consiguiente, la razn F (lamina anterior) constituye una prueba de la
hiptesis nula H0:2 =0. Como todas las cantidades que forman parte de
esta ecuacin se obtienen de la muestra disponible, esta razn F
constituye un estadstico de prueba para verificar la hiptesis nula de
que el verdadero 2 es igual a cero. Slo debe calcularse la razn F y
compararla con el valor crtico F obtenido de las tablas F en el nivel de
significancia seleccionado, u obtener el valor p del estadstico F
calculado.

Para esclarecer esto, continuamos con el ejemplo ilustrativo


(ingreso dada la escolaridad). La tabla ANOVA para este ejemplo
se presenta a continuacin:

El valor F calculado es 108,3026. El valor p de este estadstico F


correspondiente a 1 y 8 gl no puede obtenerse de la tabla F, pero
con tablas estadsticas electrnicas se demuestra que el valor p es
0,0000001, una probabilidad en efecto muy pequea. Si escoge el
mtodo del nivel de significancia para la prueba de hiptesis y fija
en 0,01, o en un nivel de 1%, se ver que la F calculada de
108,3026 es obviamente significativa en este nivel. Por tanto, si
rechazamos la hiptesis nula de que 2 =0, la probabilidad de
cometer un error tipo I es muy pequea. Para todo fin prctico, la
muestra no pudo provenir de una poblacin con un valor 2 igual a
cero, y se puede concluir con gran confianza que X, la
educacin, s afecta Y, el salario promedio.