You are on page 1of 19
LECCION 8 Regresion y correlaci6én Mapa conceptual FRegresién y comelacin Regresién y corelacion de potencia Diagrama de dispersion Ecuncion se Ecuactén de ‘estmacién estimacion cemiertede] | [conten pet cna Objetivos de aprendizaje + Calcularla ecuacién de regresién y el coeficiente de correlacién de una situacién ractica de los datos correspondientes a dos variables, + Analizar correctamente el adecuadamente, rado de relacién entre dos variables e interpretarlos + Desarrollar deseriptivamente los modelos de regresisn Ifneal y de poteneia simple y de potencia, como medio de utilizar una variable para predecir otra 'y medir la intensidad de 1a asociacién entre dos variables, Handbook of Statisties 16 + Dado un conjunto de puntos (S y de potencia y por medio del co ‘mejor ajuste, En la préetica encontramos con frecuencia una relacién entre dos o mas variables, por ejemplo: el peso de los adultos depende en algtin grado de su estatura; la cit ccunferencia depende de su radio, y la presidn de una masa dada de gas depende de su temperatura y Volumen, Con frecuencia deseamos expresar estas relaciones en forma matematica, determinando una ecuacién que conecte las variables, 8.1 Diagrama de dispersién Para ayudar a determinar una ecuacién que conecte las variables, un primer paso es Iarecoleccidn de datos, que muestren los Valores correspondientes de las variables bajo consideracién, I siguiente paso es dibujar los puntos (X,Y). (X.Y. coordenado rectangular. El grupo de pumtos resultant dlispersicn, Y,).enun sistema llamado un diagrama de [A partir de un diagrama de dispersin es posible visualizar una curva de aproxima- cidn suave de los datos, Tal curva es Hamada una curva de aprosimacién, EL problema general de encontrar una ecuacién de curva de aproximacién, la cual se adapta al grupo de puntos dados, llamado regresién. Frecuentemente, con base en los datos de Ia muestra, deseamos estimar los datos de la variable Y, correspondiente aun valor dado de una variable X. Esto puede ser realizado estimando los valores de Ya partir de una curva de mfnimos cuadrados, Ta cual se adapta alos datos de la muestra. La curva resultante es llamada una curva de regresién de ¥ en X, puesto que ¥ es estimado a partir de X. Figura 8.1 Aplicaciones a series de tiempo Si la variable independiente X, es tiempo, los datos muestran los valores de Y, en varios tiempos, Los datos ordenados de acuerdo con el tiempo, son Ilamados series de tiempo. La linea de regresiéno curva de ¥ en X, en este caso, es frecuentemente Iamada una linea de tendencia 0 curva de tendeneia y es usada para propésitos de estimacién, prediccién o pronéstico. Las ecuaciones més comtinmente usadas son Lineal: a+ bX} Potencia: aX® @ logy =loga + blog X Donde a y b son constantes, 8.3 Correlacién Consideramos ¢1 problema relacionado de correlacién 0 el grado de relacién entre Jas variables, el cual busca determinar c6mo una ecuacidn lineal, otra, describe 0 cexplica la relacién entre las variables, Si todos los valores de la Variable satisfacen Handbook of Statist 8 una ect jente correla- umente, decimos que ables estin perfes cionadas © que hay perfecta correlacién entre ellas Cuando sélo dos variables estin involucradas, hablamos de correlacién simple y regresion simple. Cuando més de dos variables estén involucradas, hablamos de correlactén multiple y regrestén miltiple._ En este capitulo s6lo consideramos la correlacién simple. i vamos a tratar con el problema de dispersion de datos muestrales de Iineas 0 curvas en una forma cuantitativa, sera necesario para nosotros idear una medida de correlacisn, Para describir el grado de relacién entre las variables, usamos el coeficiente de correlacién, el cual es denotado por r. s09sret 6 -ler=-09 ...correlacién excelente si082r<09 6 09 0018 y b= 2,538 entonces: a= F =0,0018x°™ Coefici e de correlacién, 8 9783. De acuerdo con los resultados es mejor la ecuacién de potencia, debido al valor de r Ejemplo 2: La produccién de acero en Estados Unidos, en millones de toncladas, durante los aftos 1989-1999, esti dada en la tabla 8.2 ‘a. Grafica de los datos. b. Eneuentre la ecuacidn lineal de mfnimos cuadrados que mejor se adapta a los datos. . Estime Ia produccién de acero en el tio 2.000. Leccién 8: Regresién y correlacién Tabla 82 a Produceién de acero en Estados Unidos (millones de toncladae) 1980 656 1900 49 1081 eae 1982 700 19903 %@ 1996 7052 1995 m2 1996 16 1997 283 1998 170 1999 1152 Solucién: a. Diagrama de dispersién Produceion sot 27 7 4 gg ht gs — ato Figura 83 . Diagrama de estimaci6n lineal Tabla 83 ‘Ano 1989 556 1990 49 1991 936 1992 1993 1994 1995 1986 1997 1998 1999 Handbook of Statistics 82 Donde el origen X= 0; es el allo 1989 y las unidades de X, son 1 ano, Dek jones normales tenemos: 752 b=3.95 centonces: =75,2+3,95X Feuacién de estimacién lineal, . Para la produccién de acero en el aflo 2000, entonees X 5" Y=752+3 18,6 Millones de toneladas. Problemas Leccién 8 Los datos de la (abla 8.4, muestran la edad y el peso de is (6) nifios. Tabla 8.4 a, Realiza el diagrama de dispersién. 'b, Encuentre la ecuaciéan lineal de mfnimos cuadrados que mejor se adapta a Ios datos. Resp. 7 =170,13x' . Encuentre el coeficiente de correlacisn. Resp. r= 0,973 nino de 5 afios de edad, 4. Estime el peso de Resp. 198k. 2. El indice de contaminacién atmosférica en los tiltimos cuatro aos fue (Labla 85) Tabla 86 fo index PAN ‘2000 350 "2001 200 ‘2002 2.450 a Reace el diagrama de dspesin, bh Eneventrelaecuacidn de estimacin de potencia, Resp. f=8 7842.21 . Encuentre el coeficiente de correlacisn. 83 Leccisn 8: Regresién y correlacién Resp. r= 0,929) 4. Estime el indice de contaminacién atmosférica para el ano 2003, Resp. 2344.7 ppm 3. La demanda (Q), de un producto depende del precio (P). Una compafa esta in- {entando estimar tal funcién para el producto y tiene los datos de la tabla 8.6. Tabla 86 Pe a ros) (Wridades) 10 100 47, 150 as 128 a0 120 45 162, 40 170 30 180 20 00 a, Realice el diagrama de dispersién, . Encuentre la ecuacidn de estimacién lineal Resp, P=88,924 9,64 . Encuentre el coeficiente de correlacién, Resp. r= 0.98 4. Los datos de la tabla 8.7 corresponden a cargamentos de café recolectados por lun agricultor. Tabla 8.7 ‘Aho Carga de caté w 1996 0 1997 cy 1898 110 1999 Ti ‘2000 124 2001 136 ce 350 a, Realice el diagrama de dispersién, . Encuentre la ecuacidn de estimacién lineal Resp, 7 =88,92+9,64% ce. Encuentre el coeficiente de correlacién, Resp. r= 0,994 Handbook of Sta 5. Los valores dela tabla 88 corresponden a los pesos en (k) y los niveles de glucosa en la sangre en (mg/100 mi), de 20 hombres adultos, aparentemente saltxlables. Tabla 8.8 a, Realice el diagrama de dispersién, ‘Glucora (ngioom 108 100 08 rc 102 'b, Encuentre la ecuacién de estimacién lineal Resp. ? =52,71+0,636X ‘e. Encuentre la ecuacin de estimacién de potencia Resp. ¥=13,04x°" d. {Cual es la mejor ecuacién y por qué? 6 Adaple una lines Fab, por el método de minimos cundrados pra Is si- _guientes observaciones: x o[a @ 16 78 ¥, 72) 59 28 13 rT Resp. ¥ =7,05~ 338K a, Encuentre el coeticiente de correlacién, Resp. - 0,996 85 Leceidn 8: Regresi6n y correlacién 7. Suponga que usted esta estudiando el efecto de cierta friccién constante y tuniforme sobre lminas metilicas del mismo espesor y la misma aleacién; se evan a cabo ocho observaciones cuyos resultados son: ‘iempo de friccién en horas 'spesor de Ia hoja en mm. x 10 2 | ¥ [85 90) 88 | e8 | a2 30 76 | 70 Con la ecuacién a-+bx, determine: a. Espesor original de las limi. Resp. 10.07 mm b, ;Cusntas horas dura la friceiGn en destruir la Kimina? Resp. 49,1 horas. Resumen Leccién 8 ¢. {Tiene algtin sentido pronosticar el espesor de una lmina después de 70 horas de friecién’? + Lagrificadelos puntos (X, ¥,), (X, Y,)uu OX, ¥,) enum sistema coordenado rectangular, se denomina diagrama de dispersién + Ala curva que mejor se adapta a los datos del diagrama de dispersién, se le ama curva de regresién o curva de tendencia y se utiliza para propésitos de estimacion, prediccién o pronéstico. + Las ecuaciones de regresién mas cominmente usadas son: = Lineal: Y= a+ bX Potencia: Y = aX" + El coeficiente de correlacién (r), mide laintensidad de la asociacién entre dos variables, ‘Términos clave Regresién Correlacién Diagrama de dispersién Regresidn y correlacisn lineal Regresién y correlacién de potencia Series de tiempo

You might also like