You are on page 1of 10

Curso: Mtodos estadsticos de investigacin

Profesor: Ing Antonio Matos Alejandro

CURVA DE AJUSTE, REGRESIN Y CORRELACIN

Curva de ajuste.-
Es la relacin entre dos ms variables. Fundamentalmente se da entre dos variables.

1) Se realiza la coleccin de datos, los valores de las variables.


Ejemplo: Si x e y denotan la estatura y peso de una persona, entonces una muestra de n
individuos resultara en las estaturas x1, x2, ..., xn y los pesos correspondientes y1, y2,...,
yn.

2) Dibujar los puntos (x1, y1); (x2, y2); .

Relacin lineal Relacin no lineal Ninguna relacin

1) Regresin lineal (ecuacin de una recta) Y = a + bx

2) Relacin no lineal (curva cuadrtica o parablica) Y= a + bx + cx2

3) Ninguna relacin entre variables

Uno de los propsitos de la curva de ajuste es estimar una de las variables (dependiente) de
la otra (independiente). El proceso de estimaciones se conoce como regresin.

Regresin

Estudia la funcin matemtica que relaciona a la variable dependiente o respuesta, con la o las
variables independientes o predictoras o explicativas.

Y = f(x1, x2,...., xn)

Ejm.
- Tiempo de vida; depende de la alimentacin, del estado fsico, de la tranquilidad,
etc.
- En toxicologa; los efectos letales de una droga se describen por la regresin del %
muertes sobre la cantidad de droga.
% de muertes Y causado por la cantidad de droga X.
- Interesa conocer el grado de dependencia entre: el % de carcasa y el peso vivo de
animales; entre el rendimiento de granos (trigo) y la cada de la lluvia, etc. es decir,
como se incrementan o disminuyen los valores de una caracterstica al
incrementarse o disminuir los valores de otra caracterstica.
- Una caracterstica depende de la otra; ejm. el volumen del pan depende del % de
protena del trigo; la estabilidad del nctar depende del tamao de partculas as
como tambin de la concentracin de estabilizante.
La regresin entre dos caractersticas puede ser lineal o curvilnea.

Lineal (recta): Cuando las variaciones de la caracterstica dependiente estn ligadas


proporcionalmente con las variaciones de la caracterstica independiente.

Curvilnea (no lineal): Cuando no hay una dependencia de constante proporcionalidad,


cuando es cualquier curva.

De acuerdo al nmero de variables independientes en estudio la regresin puede ser simple


o mltiple. Es simple cuando se estudia una sola variable independiente, y es mltiple
cuando se estudia dos o ms variables independientes.

Correlacin
Estudia el grado de asociacin entre la variable respuesta y la o las variables
independientes. Se dice que la correlacin es simple cuando se estudia una variable
independiente asociada con la variable dependiente. La correlacin es parcial cuando en
una regresin mltiple estudiamos el grado de asociacin de una variable independiente
con la variable dependiente o respuesta, permaneciendo las dems variables independientes
constantes.
Regresin lineal simple

La regresin permite estudiar la influencia de una caracterstica respecto de otra, para


establecer como vara el promedio de la primera caracterstica al variar la segunda en una
unidad de su medida.
Se presentan casos como:
1.- Que las medidas o niveles de x sean seleccionados o escogidos por el investigador.
Entonces regresin de y sobre x.
2.- Que las medidas o niveles de x sean tomados al azar. Entonces regresin de y sobre x y
la x sobre y.

Modelo estadstico

El modelo poblacional es el siguiente:

Yi = 0 + 1Xi + Ei

i =1, 2, 3,......., n poblacin

Donde:

Yi = Variable dependiente o respuesta


Xi = Variable independiente, predictoras
o explicativas
o = Interseccin de la recta con el eje y,
cuando x = 0
1= Coeficiente de regresin o
pendiente de la recta
Ei= Error o residual; independientes

Ei, es una variable aleatoria tomada de una distribucin normal, con media cero y variancia
2, esto es, N(0, 2).

Estimacin del modelo:


Yi = 0 + 1Xi + Ei poblacin.

yi = b0+ b1xi + ei muestra. i = 1; 2; 3;.; n.

Donde:
b0 es el estimador de 0 (b0 0): b0 = 0
b1 es el estimador de 1 (b1 1): b1 = 1
La poblacin de valores de y correspondiente a una x seleccionada tiene una media que
yace en la recta:
= 0 + 1xi
Donde: 0 y 1 son parmetros
Yi = 0 + 1Xi + Ei

Yi = y.x + Ei
Estimacin de parmetros

Mtodo de los mnimos cuadrados:

Este mtodo permite obtener los valores estimados de 0 y 1 de modo que la suma de los
errores al cuadrado sea mnima, es decir, de lo que se trata es de calcular b 0 y b1 de modo
que:

1) Dado el modelo: yi = bo+ bix1+ ei .................(1)

i= 1, 2, 3,......n

Se determinar bo y b1 para ubicar la recta de regresin estimada:

yi = bo+ bix1

2) De la ec. (1), despejamos ei para minimizar la expresin

ei = yi - bo - bixi ---------(2)

3) ei2 = (yi - bo b1xi)2 = Q ---------(3)

4) Derivando la ec. (3) con respecto a bo, b1 tendremos:

dQ
= 2 (yi - bo b1xi) (-1)
dbo

dQ
= 2(yi bo - b1xi) (-xi)
db1

Luego igualando a 0:

dQ dQ
=0 y =0
dbo db1

Resolviendo ambas ecuaciones con respecto a bo y b1, tendremos:

5) (yi - bo - b1xi) = 0 yi - nbo b1xi = 0

Ecuaciones normales

(yi - bo - b1xi) = 0 xiyi boxi - b1xi2 = 0


6) De las ec. normales y resolviendo en trminos de bo y b1 tendremos:

b0
y i
b1
x i
y b1 x
n n

7) Reemplazando en la segunda ecuacin normal.

yx
y i
b1
x x i
b1 x12 0
n
i i i
n

( yi )( xi ) x 2

yx i i
n
b1
n
i
b1 xi2 0

y x b x 2

yx i i i

n
i
i

x 2
i
n
i

y x
xi yi i

n
i

b1 Suma _ de _ productos" xy" SPxy
x
x n
2
2 i
Suma _ de _ Cuadrados SCx
i

Resolviendo:

b1
x x y y
1 i

( x x) i
2

Donde: b1 = Coeficiente de regresin

xi = Valores de la caracterstica independiente


yi = Valores de la caracterstica dependiente

X = Promedio de los valores de la caracterstica independiente


Y = Promedio de valores de la caracterstica independiente

Coeficiente de determinacin (r2):

Mide el porcentaje de la variabilidad de la respuesta que es explicado por la variable predictora


para el modelo de regresin supuesto. Su valor va de 0 a 1.

SCregre .
r2 100%
SCtotal

Coeficiente de correlacin (r)


Mide el grado de asociacin entre la variable X y la variable Y. Toma valores desde -1 hasta 1.

SPXY
r 0,95 Vara: 1 r 1
SCX .SCY

0,95 indica una elevada correlacin(+)

Para interpretar un coeficiente de correlacin se debe tener en cuenta:

- Un valor de 1, significa una perfecta correlacin negativa, es decir todos los puntos caen sobre
una lnea con pendiente negativa.

Un valor de +1, significa una perfecta correlacin positiva, es decir, todos los puntos caen sobre
una lnea con pendiente positiva.

Un valor de cero (0), significa no correlacin.

Regresin no lineal

Modelo cuadrtico:

Poblacin : yi 0 1 xi 2 xi i ;.......Donde : i 1;2;...; N


2

: yi b0 b1 xi b2 xi ei ;.......Donde : i 1;2;..., n
2
Muestra

bo estima al parmetro 0
b1 estima al parmetro 1

b2 estima al parmetro 2

Estimacin de los valores estadsticos: b0, b1 y b2 mediante el principio de los mnimos


cuadrados..

(1) yi b0 b1 xi b2 xi2 ei

(2) Despejando ei:

ei yi b0 b1 xi b2 xi2

Hacemos Elevamos al cuadrado

e y
n n
2
2
i i b0 b1 xi b2 xi2 Q
i 1 i 1

Q Q Q
0, 0, 0
(3).Diferenciamos: b0 b1 b2 e igualamos a cero

1 2 3

Q

n
(4) En 1
b0
2
i 1
yi b0 b1 xi b2 xi2 ( 1) 0

Q
(5) En 2
b1

2 yi b0 b1 xi b2 xi2 ( xi ) 0

(6) En 3
Q
b2

2 yi b0 b1 xi b2 xi2 xi2 0

Tenemos:

(7) de (4) y i nb0 b1 xi b2 xi2 0

(8) de (5) x y i i b0 xi b1 xi2 b2 xi3 0

(9) de (6) x 2
i yi b0 xi2 b1 xi3 b2 xi4 0

(10) de ecuacin (7) tenemos:

b0
y i
b1
x i
b2
x 2
i

n n n
Reemplazando b0 en la ecuacin (8) y (9) tenderemos:

(11)

x y
y i
b1
x i
b2
x 2
i

( xi ) b1 xi2 b2 xi3 0
i i
n n n

Agrupando:


y x
x x
x n x n
x 2
2

x y
i
i i b1 b2 0
i 2 i 3 i i
n
i i

SPXY SCX SPX . X 2

(12)

xi2 y1
y i
b1
x i
b2
x x 2
1 2
b1 xi3 b2 x i 0
4

n
i
n n
( yi )( x ) 2
x x 2
( xi2 ) 2
xi2 yi n
i
b1 i

n
i
b2
n
b1 xi3 b2 xi4 0

Agrupando:


( yi )( xi2 ) ( xi )( xi2 ) ( xi2 ) 2
x yi 2
i b1 x b2 x 0 3
i
4
i
2 n n n
SPX Y SPX . X 2 SCX 2

Luego tendremos:

(13) De ec. (11): b1SCX b2 SPX . X 2 SPXY

(14) De ec. (12): b1SPX . X 2 b2 SCX 2 SPX 2Y

Resolviendo ec. (13) y (14) para b1 y b2 tendremos (por matrices):

SPXY SPX . X 2

b1
SPX 2Y SCX 2

SPXY SCX 2 SPX . X 2 SPX 2 .Y
SCX SPX . X 2 SCX SCX 2 ( SPX . X 2 ) 2
SPX . X 2 SCX 2
SCX SPXY

b2
SPX . X 2 SPX 2Y

SCX SPX 2Y SPXY SPX . X 2
SCX SPX . X 2 SCX SCX 2 SPX . X 2 2
SPX . X 2 SCX 2

Tenemos ecuacin de regresin estimada:

yi b0 b1 xi b2 xi2 .........................
Grficamente:

Clculo del punto estacionario:

y
0 Derivamos en funcin de X, de la ecuacin (*)
x

y
b1 2b2 x 0
x
b1
De donde obtenemos: X
2b2

Punto mximo y mnimo ser: (x; y


)

ANLISIS DE VARIANZIA (ANVA)

Hiptesis nula H 0 : 1 2 0 (No hay regresin parablica)

Hiptesis alternante H a : 1 2 0 (Si hay regresin parablica)


Cuadro (ANVA)

F.V. G.L. S.C. C.M. Fc Ft Sign.

Regresin p-1 b1SPXY b2 SPX 2 .Y SCRe g . / G.LRe g CM Re g / CM Re s


Residual n-p SCY SC REGRESIN SCRes/G.LRes.

Total SCY Y 2

Y 2

n-1
n

Regla de decisin:

1) Si Fc Ft p 1 , n p ; ; Rechazo H0 (Porque hay significacin)

2) Si Fc Ft p 1 , n p ; ; Acepto H0 (Porque no hay significacin)

You might also like