Professional Documents
Culture Documents
Uno de los objetivos en el anlisis de resultados es la de llegar a establecer una relacin cuantitativa entre dos
o ms variables y mediante esta relacin poder efectuar predicciones. Por lo general la relacin consiste en
una ecuacin que expresa cmo la variable dependiente ( cuyo valor se desea predecir ) es afectada por una o
ms variables independientes.
En este curso se tratar la forma de establecer la posible relacin de una variable dependiente con una sola
variable independiente. El primer paso es disponer de una coleccin de datos obtenidos experimentalmente.
Por ejemplo, si se representan por X y Y las variables independientes y dependientes respectivamente y sus
valores particulares por x1, y1, x2, y2, etc. En una tabla se representaran as:
X X1 X2 X3 ....... Xn
Y Y1 Y2 Y3 ....... Yn
El siguiente paso es representar los puntos (X1 , Y1), (X2, Y2) . . ., ( Xn, Yn) en un sistema de coordenadas
rectangulares. El sistema de puntos resultantes se llama a veces diagrama de dispersin.
Con el diagrama de dispersin es posible representar una curva que se aproxime a los datos. Tal curva se
llama curva de aproximacin. En la figura 4.15 a), por ejemplo, se ve que los datos se aproximan bien a una
lnea recta y se dice que entre las variables existe una relacin lineal. En b) existe una relacin no lineal.
Y
Y
X X
Figura 4.15 a) Relacin lineal Figura 4.15 b) Relacin no lineal
Las curvas mostradas en la fig. 4.15 a) y b) se denominan curvas de aproximacin y describen la tendencia
de los puntos en el diagrama de dispersin.
El problema general de hallar la ecuacin de la curva de aproximacin que se ajuste al conjunto de datos con
los que se obtuvo el diagrama de dispersin se denomina determinacin de la CURVA DE AJUSTE.
Una curva de aproximacin como el de la Fig. 4.15 (a) sugiere una ecuacin lineal ( ecuacin de la recta) y =
a + bx; mientras que la Fig. 4.15 (b) sugiere una ecuacin cuadrtica ( parablica) de la forma Y = a + bx +
cx2.
(x1, y1)
D1
(x2, y2)
D2
X
Figura 4.16
Para un valor de X, por ejemplo X1 habr una diferencia entre el valor de Y1 y el valor correspondiente de la
curva C.
Denotamos sta diferencia por D1 que algunas veces se conoce como desviacin, error o residuo y puede ser
positivo, negativo o cero. Anlogamente, correspondiente a los valores X 2 , X 3 .... , X n , obtenemos las
desviaciones D 2 , D3 .... , D n .
Una medida de la bondad de ajuste de la curva C al conjunto de datos la suministra la cantidad
D21 D22 . ..D2n . Si la suma es pequea el ajuste es bueno, si es grande el ajuste es malo.
Definicin:
De todas las curvas de aproximacin correspondientes a un conjunto de puntos dados, la curva que tenga la
2 2 2
propiedad de que D1 D2 . ..Dn es mnimo, se conoce como la mejor curva de ajuste.
Una curva con esta propiedad se dice que ajusta los datos por mnimos cuadrados y se llama curva de
regresin de mnimos cuadrados o simplemente curva de mnimos cuadrados.
Una recta con esta propiedad se llama recta de mnimos cuadrados, una parbola con esta propiedad se llama
parbola de mnimos cuadrados, etc.
4.10.3REGRESIN LINEAL
Con el siguiente ejemplo se ilustra como puede tratarse un caso de regresin lineal. En la tabla siguiente se
dan los resultados de 12 mediciones, las cargas en miles de libras X y las Y son las deflexiones
correspondientes en milsimas de pulgada, en la calibracin de un anillo tensor.
Primero se construye el diagrama de dispersin, a partir de aqu, y segn la tendencia de los puntos, se traza
la curva de aproximacin, que resulta en la forma que se ilustra en la fig. 4.17.
Y
Deflexin
(milsimas
de 200 --
pulgadas) 180 --
160 --
140 --
120 --
100 --
80 --
60 --
40 --
20 --
10 --
X
1 2 3 4 5 6 7 8 9 10 11 12 Carga (en miles de libras)
Figura 4.17
Se aplicar el mtodo de mnimos cuadrados para determinar la ecuacin de regresin. Para una relacin
lineal en general Yc = a + bx; Yc representa el valor terico de Yi el valor estimado de Y que corresponde a
un valor particular de x.
El criterio de mnimos cuadrados requiere la determinacin de los valores de a y b tal que yi y c 2
sea un mnimo ( es decir, que tienda a cero). Las constantes a y b se denominan coeficientes de
regresin; a es la interseccin con el eje de las ordenadas Y y b es la pendiente de la lnea que mejor se
ajusta.
Sea Z = y i y c 2 y sustituyendo yc = a + bx
2
Z = y i abx
La condicin para la mejor eleccin de a y b debe cumplir que:
z z
=0 y =0
a b
y i=nab x (1)
Derivando respecto a b se tiene:
z
=2 y iabx x =0
a
Desarrollando la sumatoria para cada trmino , se tiene:
2 xy i2 a x2b x 2=0 dividiendo toda la expresin entre 2
xy i=a xb x 2 (2)
Finalmente, simultneamente (1) y (2) encontramos los valores de a y b
y=nab x (1)
ECUACIONES NORMALES
xy=a x b x 2 (2)
xy=a x b x 2
9971=78 a650b
Resolviendo el sistema por el mtodo de suma y resta, vamos a eliminar la constante a multiplicando la
primera ecuacin por 78 y la segunda por 12:
1208=12 a78 b 78
9971=78 a650b 12
94224=936 a6084 b
119652=936 a7800 b
NOTA: Si el lector no recuerda los mtodos de solucin de un sistema de ecuaciones (lo ideal sera que
a=
X 2 Y X XY
2 2
n X X
n XY Y X
b=
n X 2 X 2
Le queda al lector comprobar estas frmulas, deber llegar a la misma ecuacin de regresin; Yc = 4.3 +
14.82 X. Anteriormente habamos dicho que el valor de a era el intercepto con el eje de las ordenadas Y; al
observar la grfica notamos que, efectivamente, la recta terica corta al eje Y en la divisin 4.3 que es el
valor que ha tomado a el valor de b = 14.82 milsimas de pulgadas de aumento en la deflexin del anillo
cuando la carga x aumenta en 1000 libras.
Con la ecuacin calculada, podemos hacer estimaciones de Y ( deflexin), y haciendo variar el valor de X
(carga). Por ejemplo, si deseamos estimar la deflexin del anillo para un valor de X = 3.5 (3500 libras); la
respuesta es:
Y c =4.314.82X
Y c =4.314.82 3.5
Y c=56.17 milsimas de pulgada
Conviene aclarar que con la ecuacin de regresin slo se pueden hacer interpolaciones, ya que la ecuacin
expresa funcionalmente la relacin de las variables, pero para pares de valores comprendidos en el rango
(dominio) donde se ha experimentado. En nuestro ejemplo se ha experimentado en el intervalo 1 a 12; si con
la ecuacin que hemos determinado, quisiramos estimar la deflexin para una carga de 20,000 libras; X =
20, el resultado es:
Y c =4.314.82 20 Y c=300.7 (milsimas de pulgada). Este resultado es un tanto dudoso, pues lo ms
probable es que al aplicar una carga mayor de la que se ha experimentado el anillo tensor se deforme o hasta
se rompa.
su valor, tenemos log Y i log a b logX 2 es un mnimo. Al derivar con respecto a a y respecto a b
e igualar a cero las derivadas, obtenemos las ecuaciones normales siguientes:
Ahora ajustemos una funcin potencial a la siguiente informacin, correspondiente al perodo de oscilacin
de un sistema resorte masa:
m(Kg) (X) 0.20 0.40 0.60 0.80 1.00 1.20 1.40
T(s) (Y) 0.34 0.47 0.58 0.66 0.74 0.84 0.90
Se obtiene el diagrama de dispersin y su respectiva curva de aproximacin, tal como se ilustra en la fig. 4.18
Perodo, T (s)Y
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
X Masa, m (Kg)
0.20 0.40 0.60 0.80 1.00 1.20 1.40
Figura 4.18
El diagrama de dispersin sugiere una relacin de la forma T =Km n ; en este caso, con
0n1 . La ecuacin se puede escribir como T =am b
Aplicando logaritmo a esta expresin:
log T =log ab log m
1.86205=3.71509 b
1.86205
b= b=0.50
3.71509
Sustituyendo en valor de b en ecuacin (1) para calcular el valor de a tenemos:
1.46569=7 log a1.19036 b
1.465691.19036 b=7 log a
1.465691.19036 b
log a=
7
1.465691.19036 0.50
log a=
7
x
B. CASO EXPONENCIAL Y c =ab
El caso exponencial se utiliza cuando se desea calcular especialmente tasas de crecimiento. Esto implica
tomar en cuenta la variable tiempo como variable independiente; sin embargo, puede considerarse cualquier
otra variable y ajustar la funcin sin hacer referencia a tasas de crecimiento. Veamos un ejemplo. La
siguiente informacin corresponde al nmero de palabras Y que un grupo de secretarias, escogidas al azar,
puede escribir ( en mquina elctrica) de acuerdo al nmero de meses X de entrenamiento:
X1 ( No. de Meses) 1 2 3 4 5 6 7 8
Y1 ( No. De palabras) 15 18 25 30 35 45 53 70
x
A esta informacin le ajustamos una funcin exponencial Y c =ab . Aplicando logaritmo a la funcin:
x
Y c =ab tenemos : log Y c =log ax log b
Multiplicando toda la ecuacin ( 1) por -9 y la ecuacin (2) por 2, para eliminar a log a
7.86082=84 logb
7.86082
log b=
84
log b=0.0935811
b=log 1 0.0935811
b=1.24
12.0730836 logb
log a= sustituyendo log b=0.0935811 , tenemos:
8
12.0730836 0.0935811
log a=
8
a=log1 1.08802
a=12.25
Sustituyendo los valores de a y b en la expresin general para este caso exponencial, se tiene:
x
y=ab
y=12.251.24 x
1
Y c=12.251.24 Y c=15.19 ver ltima columna en la tabla anterior para este caso.
Completar los restante valores tericos para Y c evaluando los valores de x=2 hasta x=8
4.11. CORRELACIN
La correlacin estudia si existe algn tipo de relacin entre dos o ms variables. Se busca dar respuesta a
preguntas como las siguientes:
Existe alguna relacin entre las estaturas y los pesos de las personas?
Hay alguna relacin entre el tiempo dedicado al estudio y las notas obtenidas en los exmenes?
El dimetro del tronco est relacionado con la altura del rbol?
La cantidad de maz que produce una mazorca est relacionada con las cantidades de agua y sol que recibe
la planta?
CORRELACIN RECTILNEA:
Cuando dos variables estn relacionadas y sta relacin entre ellas sigue la tendencia de una linea recta,
Si al aumentar una de las variables, aumenta tambin la otra, entonces se dice que la correlacin entre ellas es
positiva; mientras que si al aumentar una de las variables la otra disminuye, entonces la correlacin es
negativa.
Para investigar si existe correlacin rectilnea entre las variables X, Y puede hacerse de dos maneras:
a) Haciendo uso de un diagrama de dispersin.
b) Por medio del coeficiente de correlacin rectilnea.
Investigar, por medio de un diagrama de dispersin, si existe correlacin rectilnea, requiere bastante
prctica. Y en todo caso, los resultados que se obtienen son algo imprecisos, ya que dependen de la
percepcin del investigador.
x
r=0
No existe correlacin rectilnea
CLCULO DE r:
Para calcular el coeficiente de correlacin rectilnea, de los puntos x 1 , y1 , x 2 , y 2 ,..... , x n , y n ; se hace
uso de la siguiente frmula:
n n n
n x i y i x i yi
i=1 i=1 i=1
r=
n n n n
2 2
[n x i2 x i ][n y 2i y i ]
i=1 i=1 i=1 i=1
Tambin se puede calcular r haciendo uso de una calculadora de bolsillo. Algunas de stas tienen una tecla
Xi Yi Xi 2 Yi2 XiYi
6.0 1.5 36.00 2.25 9.00
6.5 1.2 42.25 1.44 7.80
6.7 4.8 44.89 23.04 32.16
7.0 6.2 49.00 38.44 43.40
9.5 9.4 90.25 88.36 89.30
x i =35.70 y i=23.10 2
x =262.39
i
2
y =153.53
i x i y i=181.66
Al sustituir, estos valores, en la frmula obtenemos:
5 5 5
5 x i y i x i yi
i =1 i=1 i=1
r=
5 5 5 5
2 2
x x i ][5 y y i ]
2 2
[5 i i
i =1 i=1 i=1 i=1
Como este valor est bastante cercano a 1, concluimos que entre los dos conjuntos de datos, existe
efectivamente correlacin rectilnea positiva.