Capítulo 14

Ejemplos
Ejemplo 1.- Un analista desea estimar el tiempo de entrega como la
variable dependiente, con base en la distancia como la variable
independiente para partes industriales embarcadas por camión.
Supongamos que 10 embarques recientes se eligen de los
expedientes de la compañía de tal forma que las distancias por
carretera implicadas se hallen casi igualmente dispersas entre una
distancia de 100 millas y una distancia de 1 000 millas, y que se
registran los tiempos de entrega de cada embarque. Puesto que la
distancia por carretera se usara como la variable independiente,
esta selección de recorridos de distancias específicas es aceptable.
Por su parte, la variable dependiente de tiempo de entrega es una
variable aleatoria en este estudio, lo que cumple el supuesto
básico del análisis de regresión. La existencia o no de una relación
lineal entre las dos variables se investiga por lo general mediante
la elaboración de un diagrama de presión o de una gráfica de
residuales. Estos diagramas también se emplean para observar si
la dispersión vertical (varianza) es aproximadamente igual a lo
largo de la línea de regresión.

Ejemplo 2.-Un ejemplo de relación curvilínea seria l relación entre los
años desde la constitución de una empresa y el nivel de ventas,
dado que en cada año el nivel de ventas se haya incrementado en
el mismo porcentaje en comparación con el año precedente. La
curva con una pendiente creciente indicaría una llamada relación
exponencial.
Si el diagrama de dispersión indica en general una relación lineal, se
ajusta una línea recta a los datos. La ubicación precisa de esta
determinar por el método de mínimos cuadrados. Tal como se ilustra en
el ejemplo 3, una línea de regresión con pendiente positiva indica una
relación directa entre las variables, una pendiente negativa indica una
relación inversa entre las variables y una pendiente de cero indica
respecto de la línea de regresión indica el grado de relación entre las
dos variables.

Ejemplo 3.- La figura 14-1 incluye varios diagramas de dispersión y sus
líneas de regresión asociada en demostración de varios tipos de
relaciones entre las variables

A)

B)

C)

D)

E) F) .

sobre las variables de distancia por carretera y tiempo de entrega para una muestra de 10 embarques recientes de partes industriales embarcadas por camión. es evidente que resulta apta para el análisis de correlación. 1 4 .. 1 Ejemplo 4. . los 10 embarques se eligen en forma completamente aleatoria.. sin considerar ni la distancia por carretera ni el tiempo de entrega incluidos en cada observación. en el que solo el tiempo de entrega es una variable aleatoria. Ejemplo 5.Remítase la procedimiento de recolección de datos del ejemplo 1. por lo tanto. en este plan de muestreo revisado ambas variables aleatorias y. A diferencia del ejemplo 1. En lugar de que elijas los 10 embarques de manera que se hallen casi igualmente dispersos desde una distancia de 100 millas hasta una distancia de 1000 millas.En la figura se ilustra la apariencia general de los diagramas de dispersión asociadas con diversos valores de correlación.F i g .

Análisis de regresión lineal. misma en los valores . en millas Tiempo de entrega (Y). 5 21 5 107 0 55 0 48 0 92 0 135 0 67 0 121 5 1 4 2 1 3 4. Elabore el diagrama de dispersión de los datos de la tabla siguiente.5 32 5 1. Con base en el diagrama. Embarque muestreado Distancia(X).Supongamos que un analista toma una muestra aleatoria de 10 embarques recientes por camión realizado por una compañía y registra la distancia en millas y el tiempo de entrega al medio día más cercanos a partir del momento en que el embarque estuvo listo para su carga. en días 1 2 3 4 5 6 7 8 9 10 82 5 3.5 respecto al eje Y. siguen en general una relación lineal y que la dispersión vertical respecto de la línea es casi la.. Los otros nueve puntos del diagrama de dispersión se colocaron de la misma manera. todo indica que los puntos trazados. y considere si el análisis de regresión lineal parece apropiado. Problemas resueltos 14.1. El primer par de valores reportados en la tabla está representada por el punto colocado sobre 825 en el eje X y alineado con 3. 5 3 5 El diagrama de dispersión de estos datos se muestra en la figura anterior.

.Determine la ecuación de regresión de mínimos cuadrados para los datos del problema anterior.bajos y en los valores altos de X. el análisis de regresión lineal parece apropiado. y trace en el diagrama de dispersión la línea de regresión de estos datos. tiempo de entrega en dias. en millas 14.2. 6 5 4 Y. . 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 X. distancia de acarreo. Así.

0036 ) ( 762 )=0. en días 3. Y.11 b0 =Y´ −b X=2.85 Embarqu e muestre ado b1= Distanci a (X) en millas 2 XY X 2887.0036 X La línea de regresión estimada en datos muestrales aparece en el diagrama de dispersión de estos datos de la figura 14-4.0036 ∑ X 2−n X´ 2 7104 300−( 10 ) (762)2 1297 860 ´ ( 0. la suma de .11+0.75 ∑ XY −n XY´ = ( 26730 )−( 10 ) ( 762 )( 2.5 Y´ = 10 X´ =762 Y´ =2.5 3 5 28.25 1 16 4 1 9 20.1 2 3 4 5 6 7 8 9 10 Totales 825 215 1070 550 480 920 1350 325 670 1215 7620 ΣX X´ = n Tiempo de entrega (Y).003581 ≅0.5 ΣY Y´ = n Media 7620 X´ = 10 28.5 1 4 2 1 3 4.85− Y^ 0=b 0 +b1 X=0.5 215 4280 1100 480 2760 6075 487.85 ) = 4653 =0.25 2.5 1.1068 ≅0.25 9 25 99. Repárese en las líneas punteadas que indican el monto de desviaciones entre cada valor muestreado de Y y el valor estimado correspondiente.5 2010 6075 26370 680625 46225 1144900 302500 230400 846400 1822500 105625 448900 1476225 7104300 Y 2 12.

88 0.3 cálculo Tiempo de entrega (Y).52 0. en millas 14.48 0.48 1215 5 4. 6 5 4 Y.3.5 4.estas desviaciones al cuadrado es lo que la línea de regresión lineal.42 215 1 0.09 -0.22 670 3 2.97 -0.09 480 1 1.28 0.84 920 3 3.distancia de acarreo. reduce al mismo. usando la ecuación de regresión desarrollada en el problema anterior.5 1.12 1070 4 3. Embarque muestreado Distancia (X).en millas 1 2 3 4 5 6 7 8 9 10 Tabla 14.08 0.Determinar los residuales y elabore una gráfica de residuales respecto de los valores ajustados de los datos de la tabla.47 325 1. en días Valor ajustado ( Y^ ) Residual ( e=Y − Y^ ) 825 3.04 550 2 2.. Compare la gráfica de residuales con el diagrama de dispersión de la figura 14-4.96 0.84 -0. en millas 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 X. determinada por el procedimiento anterior.42 1350 4.5 3.52 de residuales para el problema de tiempo de entrega .tiempo de entrega.42 -0.

Calcule el error estándar del estimador para el problema de análisis de tiempo ..4 0.2.11 +0.5 4 4.5 1 1.4.75− ( 0.En la tabla anterior se presenta el cálculo de los residuales.5 5 5.71dias .11 ) ( 28. salvo por la prolongada escala vertical de la gráfica de residuales.5 Valor ajustado Ý 14.6 -0.2 -0. Nótese que la forma general de la dispersión de los valores de la variable dependiente Y respecto de la línea de regresión en el diagrama de dispersión y la dispersión de los residuales e respecto de la línea “o” en la gráfica de residuales son similares. Y 0.5 3 3..11+0.5 )−( 0. S YX = √ ∑Y −b 0 ∑ XY √ 99.5 2 2.0036 X =0. ¿Podría utilizarse esta ecuación de regresión para estimar el tiempo de entrega de un embarque de 2 500 millas? ^ =0.0036(1000)=3.6 0. estime el tiempo de entrega a partir del momento en que el embarque está listo para su carga de un embarque de 1000 millas.Usando la ecuación de regresión desarrollada en el problema 14.4 -0. remítase a los valores determinado en la solución del problema 14.8 -1 0.5.0036 )( 26 370 ) = n−2 10−2 . mientras que en la figura 14-5 aparece la gráfica de residuales.2.2 0 Residual e -0. 14.

5.En referencia al problema 14.05 )=± 2. inmediatamente anterior.5.46 8 14.2104=0. pruebe H 0 : β 1=0 la hipótesis nula para los datos de distancia de acarreo y tiempo de entrega de la tabla 14. pruebe H 0 : β 1 ≤0 la hipótesis nula al nivel de significancia de 5%. α =0.00 S b 0.4812 ≅048 n−2 10−2 Excepto por una ligera diferencia de redondeo.8526 S YX = √ = =0.6.2..3.2. Datos S¿ S h 1= SYX √ Σ X −n X´ 2 2 = 0. con un nivel de significancia de 5% YX=¿ 0.¿√ 1.0036 = =+9.5 14.0004 1 14.8. inmediatamente anterior.683 =√ 0.306 t= b1 0. Compare su respuesta con la obtenida por medio de la fórmula de cálculo en el problema 14.7.46 = =0.0004 2 √7104300−10 (762) 1139. ∑e 2 √ 1.24 H o=β 0=0 H 1=β 1> 0 t critica ( gl=8.46 0..Calcule el error estándar del estimador mediante la formula básica en la que se utilizan los residuales determinados en el problema 14.Usando el error estándar del estimador del problema 14.46 y los valores de la tabla 14. H 0=β 1=0 H 1: β 1 >0 ..4587 ≅ 0. esta respuesta coincide con la obtenida en el problema 14.7.

860.9.Determine el intervalo de confianza de 95% para β1 respecto de los datos de distancia de acarreo y tiempo de entrega expuestos en los problemas anteriores.10. En el caso de esta prueba de una cola.0045 Así. con cada milla adicional de distancia. concluimos que la línea de regresión de la población es positiva. Suponiendo una jornada laboral de 24 horas en los puntos de recepción. con una confianza de 95%. el número de días adicionales requeridos para la entrega es de entre 0.0004 ) ¿ 0. Dado que b1=0.5 minutos.860 . y por lo tanto que existe relación directa entre distancia de embarque y tiempo de entrega.0027 y 0.05)=+1.Usando los valores determinados en los problemas anteriores. t=+9. 14.0045 con una confianza de 95%.0036 ± 0. el intervalode confianza de 95 para β 1 es : b1 ±t s b 1=0. a=0.306 )( 0.0036 ± ( 2...0027 a 0. S Y´ X =SYX √ 1 + n ( X− X´ ) 2 ( ΣX )2 ΣX − n 2 .9 y 6.0036 y gl=n−2=10−2=8. elabore el intervalo de confianza de 95% para el tiempo de entrega medio respecto de una distancia de acarreo de 1000 millas. 14. esto equivale a un tiempo de entrega adicional por millas de entre 3.t critica ( gl=8. se rechaza la hipótesis nula.00 Dado que la estadística t calculada de +9 excede el valor critico de +1.0009=0.

en referencia a embarques por camiones de 1000 millas estimados que el tiempo de entrega medio a partir del momento en que el embarque está listo es de entre 3.10.32 y 4.39=3. con una confianza de 95%. elintervalo deprediccion de 95 es : Y^ ±t sYsiguiente =3.17 .84 dias Como era de esperar.13=2.2405=0. 14. S Ysiguiente= √ S2YX + S2Y´ X = √ ( 0.49)=3. Dadas Y^ ( para X=1000)=3.306(0.46 ) + ( 0. S YX =0.46 √ 2 (1000−762) 1 + =0.49 2 2 Donde gl=10−8=2.1748 ≅0. Compare este intervalo con el elaborado en el problema 14.17)=3. determine el intervalo de predicción de 95% para el tiempo de entrega de un solo embarque dada una distancia implicada de 1000 millas. ya que en la presente aplicación el intervalo se refiere a un valor individual para un embarque en particular.¿ 0.58 a 4.32 a 4. µ Así.71 dias ..17 10 7104300−( 7620 )2 / 10 El intervalo de confianza de 95% para la media condicional (donde gl=10-2= 8) es: ^ Y =±t s ^Y X =3.Usando los valores determinados en los problemas anteriores.4904 ≅ 0. no a una media.11. . este intervalo de predicción es ligeramente mas amplio que el intervalo de confianza para la media condicional del problema 14.71 ±2 .71 ± 1.46 y S Y´ X =0.306)(0.10.10 días.71 ±(2.71 ±0.17 ) =√ 0.10 dias .

30 25 20 Calificaion en examen 15 10 5 0 2 4 6 8 10 12 14 16 Horas de estudio Numero de rechazados (Y) Con base en el diagrama de dispersión los supuestos de linealidad e igualdad de las varianzas condicionales parecen cumplirse racionalmente.En la tabla 14. 7 18 72 8 22 77 .5 Horas de estudio en el curso de estadística y sus calificaciones en examen de una muestra de n=8 estudiantes. Estudiante muestreado Horas de estudio (X) Calificación en examen (Y) 1 20 64 2 16 61 3 34 84 4 23 70 5 27 88 6 32 92 Tabla 14.5 se presentan datos muestrales relacionados al número de horas de estudio fuera de clase durante un periodo de tres semanas de alumnos en un curso de estadística aplicada a la administración y a sus calificaciones en el examen al final de ese periodo.18.. Elabore un diagrama de dispersión para esos datos y observe si cumplen los supuestos de linealidad e igualdad de las varianzas condicionales.Problemas Complementarios 12.

5 X . Estudiant Horas Califica es de ción XY X2 Y2 muestrea estudi examen dos os (X) (Y) 1 20 64 1280 400 4096 2 16 61 976 256 3721 3 34 84 2856 1156 7056 4 23 70 1610 529 4900 5 27 88 2376 729 7744 6 32 92 2944 1024 8464 7 18 72 1296 324 5184 8 22 77 1694 484 5929 Totales 192 608 15032 4902 47094 ΣX ΣY X´ = Y´ = n n Media 192 X´ = 8 608 Y´ = 8 X´ =24 Y´ =76 ΣXY −n X´Y´ 15032−(8)(24)(76) 440 b1 = = = =1.14..49 ≅ 1.18.5 )( 24 )=40 Y^ =b 0 +b1 X=40+1.5 y trácela en el diagrama elaborado en el problema 14.19.5 294 Σ X 2−n X´ 2 4902−(8)(24 )2 b0 =Y´ −b 1 X´ =76−( 1.Determine la línea de regresión de mínimos cuadrados de los datos de la tabla 14.

30 25 20 Calificaion en examen 15 10 5 0 2 4 6 8 10 12 Horas de estudio 14 16 .

18. Estudiantes muestreados Horas de estudios (X) Calificación examen (Y) Valor ajustado ^ ( Y ) Residual ( e=Y − Y^ ) 1 2 3 4 5 6 7 8 20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77 70 64 91 74.5 88 67 73 -6 -3 -7 -4.Determine los residuales y elabore una gráfica de residuos respecto de los valores ajustados de los datos de la tabla 14. s YX = ¿ √ √ Σ Y 2−b0 ΣY −b1 ΣXY 47094−( 40 )( 608 )−( 1.359 √ 4902−8 ( 576 ) √ 294 y se concluye que existe una relación . Dado SYX =6.20.5 80.16 6.5 4 5 4 14.21.14.20.16 = =0.16 y los valores de latabla del problema14.16 6 14.14 ≈6.5 con base en los residuales determinados en el problema 14.5 usando la ecuación de regresión desarrollada en el problema 14.Calcule el error estándar del estimador de los datos de la tabla 14.18 a) Pruebe la hipótesis nula de que la pendiente de la alinea de regresión es cero.19.5 7.22.19 S b 1= SYX √Σ X 2 −n X´ Se rechaza significativa.5 ) (15032 ) = n−2 8−2 √ 226 ≅6.. con un nivel de insignificancia de 1% e interprete el resultado de su prueba. 2 H0 = 6. Compara la gráfica de residuales con el diagrama de dispersión elaborado en el problema 4.-En referencia a la información muestral presentada en el problema 14..

.06)≈ 3.18 Se rechaza H0 y se concluye que existe una relación positiva significativa.19 para estimar la calificación de en el examen de un estudiante que dedico 30 horas al estudio del material del curso.25.16 √ √ 1 + n ( X− X´ ) Σ X 2− 2 ( ΣX )2 n 2 (30−24) 1 + ≅ 3.Use la ecuación de regresión determinada en el problema 14.24.En la tabla 14.23=71.02 a 90.21 y 14. 14. S Y´ X =SYX ¿ 6.23 y elabore el intervalo de confianza de 90% para estimar la calificación media de los estudiantes que dedicaron 30 horas al estudio del curso.01 )=+3.06 8 4902−( 192 )2 / 8 µ ^ Y =Y^ ± t sY^ X =85 ±(4.143 t=+4. H o−β 0=0 H 1=β 1> 0 t critica ( gl=6. µ ^ Y =Y^ ± t sY^ X =85 ±5.23. α=0.Remítase a los problemas 14. con un nivel de insignificancia de 1%.71± 13. 95 a 98.5 ( 30 )=85 Y 14.5 X=40+1.41 14.16)(3.98 14.En referencia a los problemas anteriores.26.6 se presentan datos relativos al número de semanas de experiencia en un empleo implica la conexión de .. ^ =40+1.09=79..b) Repita la prueba de la hipótesis nula de que el coeficiente de regresión real es igual a o menor que cero. elabore el intervalo de predicción de 90% para la calificación de un estudiante en particular que dedicó 30 horas..

Obrero muestreado Semanas de experiencia (X) Numero de rechazados (Y) 1 2 3 7 9 6 2 6 2 0 2 8 4 1 4 1 6 5 8 2 3 6 7 1 2 1 8 1 0 2 4 8 9 4 2 2 6 3 8 Tabla 14. Trace estos datos en un diagrama de dispersión.componentes electrónicos en miniatura y el número de componentes que fueron rechazados durante la última semana en el caso de 12 trabajadores aleatoriamente seleccionados..Semanas de experiencia y número de componentes rechazados durante una semana muestreada para 12 obreros ensambladores.6. 40 35 30 25 Numero de rechazados 20 15 10 5 0 0 2 4 6 8 10 12 14 Semanas de experiencia 16 1 0 1 1 2 2 1 1 1 2 1 8 3 2 2 5 .

Obrero muestrea do 1 2 3 4 5 6 7 8 9 10 11 12 Totales Media b1 = Semanas de experien cia X 7 9 6 14 8 12 10 4 2 11 1 8 92 ΣX X´ = n Numero de rechazad os Y 26 20 28 16 23 18 24 26 38 22 32 25 298 ΣY Y´ = n 92 X´ = 12 298 Y´ = 12 X´ =7.66 ΣXY −n XY = = =1. Comente la naturaleza de la relación de acuerdo con lo indicado por la ecuación de regresión.6.83) −236..Con base en la tabla 14.57−1. determine la ecuación de regresión para predecir el número de componentes rechazados dado el número de semanas de experiencia y trace la línea de regresión en el diagrama de dispersión.40 2 2 2 ´ 170.39 ≅−1.58) b0 =Y´ −b 1 X´ =24.14.58 Y´ =24.27.83 XY X2 Y2 182 180 168 224 184 216 240 104 76 242 32 200 2048 49 81 36 196 64 144 100 16 4 121 1 64 876 676 400 784 256 529 324 576 676 1444 484 1024 625 7798 ´ 2048−(12)(7.4 )( 7.57 Y^ =b 0 +b1 X=35.58 ) ≅35.58)(24.66 Σ X −n X 876−( 12)(7.40 X .83− (−1.

40 35 30 25 Numero de rechazados 20 15 10 5 0 0 2 4 6 8 10 12 14 16 Semanas de experiencia .

µ ^ Y =±t s ^Y X =−1.19 S b 1= t= SYX √ Σ X −n X´ 2 2 2.57−1.6 = =0. √ Σ Y 2−b0 ΣY −b1 ΣXY 7798−( 35.28.4564 ) √ = b1 −1.40. 14.40 X=35. α =0.534 ≅2.30.4 = ≅−7.19 H o−β 1=0 H 1 :B 1 ≠ 0 t critica ( gl=10.40 ) ( 2048 ) s YX = = n−2 12−2 ¿ √ √ 65.6 10 Dado SYX =2.57−1.En referencia a la información de muestral de los problemas 14.26 y 14.37 14.6 y de que la pendiente de la línea de regresión de la población es cero.85 a−0..29.52 √876−12 ( 57.31.812 Se rechaza H0 y se concluye que existe una relación.40 ( 3 )=31.4 ± 0.-Siguiendo con el problema 14.6 y los valores de la tabla del problema14.19 186. Y^ =35.4 s b 1 0.57 )( 298 ) −(−1.14.45=−1.05 ) =1.34 =√6..Usando la ecuación de regresión desarrollada en el problema 14. elabore el intervalo de confianza de 95% para estimar el número medio de rechazos en el .95 14.27.27 estime el número de componentes rechazados en el caso de un empleado con tres semanas de experiencia en las operaciones.. con un nivel de significancia de 5% para la prueba.Pruebe la hipótesis nula de que no existe relación entre las variables de la tabla 4.6 2. elabore el intervalo de confianza de 95% para β1 estimar el valor del coeficiente de regresión de la población e interprete el valor de este coeficiente.

28=25. en efecto. ¿ 31.30 y 14.0036 )( 26 370 )− ( 10 )( 2.37 ± 2.58) 1 + ≅ 2.caso de los empleados con tres semanas de experiencia en las operaciones.-Remítase a los problemas 14.31 12 876−( 92 )2 / 10 ^ Y =±t s ^Y X =31.00 µ 14. 2 10 ¿(2. el análisis de correlación es aplicable a los datos muestrales. el procedimiento de muestreo descrito en el problema 14.09 a 37. Si suponemos además una distribución normal bivariada para la población y varianza condicionales iguales para cada variable.31.37 ±6. Calcule el coeficiente de determinación para los datos muéstrales.1 indica que.4)(0.75−¿ 2 b ∑Y +b1 ∑ XY −n Y´ ( 0.85 )2 r 2= 0 = ¿ ∑Y 2−n Y´ 2 .6 √ √ 1 + n ( X− X´ ) Σ X 2− 2 ( ΣX )2 n 2 (3−7. S Y´ X =SYX ¿ 2.85) 99.37 ±(−7.74 a 34.11 )( 28.12 En referencia a los datos de distancia de acarreo y tiempo de entrega. Usando los valores calculados en el problema 14. Elabore el intervalo de predicción de 95% para el número componentes rechazados en el caso de un empleado con tres semanas de experiencia en el puesto.5 ) + ( 0.32.2.63=28. ambas variables son variables aleatorias.19)≈ 31.65 Análisis de correlación Problemas resueltos 14.

2 b) Determinar el coeficiente de correlación usando la fórmula de cálculo alternativa de r.5 ) 2 2 46530 46530 = =+0.842 =0.. r= ¿ ¿ nΣXY −ΣXΣY √ nΣ X −( ΣX ) √ nΣ Y −( ΣY ) 2 2 2 2 10 ( 26370 )−( 7620 ) (28.9489 ≅+0.Respecto de los datos de distancia de acarreo y tiempo de entrega: a) Calcule el coeficiente de correlación en referencia al coeficiente de determinación del problema 14.95 El valor positivo del valor de correlación se basa en la observación b1 de que la pendiente de la línea de regresión es positiva.75 )−( 28.9091≅ 0.9091=+0.95 (3602.00(con base a la tabla 14.5 ) √10 ( 7104300 )−( 7620 ) √10 ( 99. Compare su respuesta en el inciso b) con las respuestas sobre el .14.Y )= Σ [(X− X´ )(Y −Y´ )] 4653 = =517.91 18.07) 49033.12 r= √ r 2 =√ 0.Respecto de los datos de acarreo y tiempo de entrega: a) Calcule la covarianza muestral.525 14..5824)(13.61. cov ( X .¿ 16.9535 ≅+ 0. como se determinó en el problema 14.668 14.4) n−1 9 b) Convierta el valor de la covarianza al coeficiente de correlación.13.

85 ¿ ¿ ¿2 99.65 -1.15 -0. ( 379. inmediatamente anterior. r= cov ( X . Y ) S X SY donde : 762 ¿ ¿ ¿2 7104300−10 ¿ √¿ 2 2 ∑ X −n X´ √ S X= =¿ n−1 2.00 =+0.2 180.95 ∑= 4653 ..7 970. en días 3.35 0.95 354.2 589.85 -1.85 X − X´ 63 -547 308 -212 -282 158 588 -437 -92 453 Y −Y´ 0.85 0.15 2.15 (X − X´ )(Y −Y´ ) 40.95 1011.7 23.coeficiente de correlación obtenido en el problema 14.7455 ) ( 1.65 -1.75−10 ¿ √¿ ∑Y 2 −n Y´ 2 SY = √ =¿ n−1 r= 517.9489 ≅+ 0.5 3 5 Y´ = 2.95 .8 973.85 1.13.5 1.4347 ) Embarq ue muestre ado Distancia (X). en millas 1 2 3 4 5 6 7 8 9 10 825 215 1070 550 480 920 1350 325 670 1215 X´ = 762 Tiempo de entrega (Y).2 521.15 1.95 -13.5 1 4 2 1 3 4.

la hipótesis nula de que no exista relación entre las dos variables se rechaza.9004 0.14 b) es significativamente diferente a cero al nivel de significancia de 5%. H 0 : ρ=0 H 1 : ρ≠ 0 .7.1116 10−2 Dado que la estadística de prueba de t=+8.9489 = =+8. con un nivel de significancia de 5%.306 t= r √ 2 1−r n−2 = √ 0. Nótese que esta conclusión coincide con la prueba de la β 1=0 hipótesis nula de que en el problema 14.16 En referencia a una muestra de n=10 receptores de préstamos de una compañía financiera. 14. a) Pruebe la hipótesis de que no existe correlación entre estas dos variables para la población entera de receptores de préstamos.50 se encuentra en un región de rechazo.50 . H 0 : ρ=0 H 1 : ρ≠ 0 t critica ( gl=8.14.Determinar si el valor de correlación calculado en el problema 14. se determina que el coeficiente de correlación entre ingreso doméstico y monto de deuda a corto plazo vigente es r=+ 0.9489 0.15.05)± 2. α =0. La diferencia en los valores calculado de t en estas dos pruebas se debe el redondeo de valores en los cálculos.. y concluimos que existe una relación significativa entre distancia de acarreo y tiempo de entrega.50 1−0.

de modo que se acepta el supuesto de que no exista relación entre las dos variables.50 podríamos 2 r =0. α =0.50 √ 2 1−(0.6 0. Con base en el coeficiente de correlación inclinarnos a concluir que puesto que de r =+0. Esto es cierto en relación con los datos muestrales.25 . Sin embargo. una interpretación más adecuada para la población es que no puede suponerse ninguna asociación entre la varianza en Y y cambios en X . inmediatamente anterior no fue rechazada.306 Dado que la estadística t calculada de +1.t critica ( gl=8. aproximadamente el 25% de la varianza en la deuda a corto plazo es explicado estadísticamente por el monto de ingreso doméstico.634 no se encuentra en una región de rechazo. .306 t= r √ 2 1−r n−2 = 0. La relación muestral observada puede atribuirse al azar con un nivel de significancia de 5%.50) 8 = 0. la hipótesis nula no puede rechazarse. dado que la hipótesis nula del inciso a).50 =+1.05)± 2. b) Interpreta el significado del coeficiente de correlación calculado.

5.33.-En referencia a los datos de la tabla 14. α =0.25. aprovechando los b0 b1 valores de y para la ecuación de regresión calculados en el problema 14.33. 14.. Interprete los coeficientes calculados.74=+ 0. con un nivel de insignificancia de 1% respectivamente en cada prueba.5(15032)−8(5776) 660 = = =0.05)± 2.86 14. los cuales fueron analizados en los problemas 14. H 0 : ρ=0 H 1 : ρ≠ 0 t critica ( gl=8.863≅+0.306 Se rechaza H0 y se concluye que existe una relación significativa.74 47094−8(5776) 886 Σ Y 2−n Y´ 2 r= √ r 2 =√ 0.35.7449≅ 0. Interprete sus resultados.En referencia al valor de correlación de muestral determinado en el problema 14..Problemas complementarios 14.Calcule el coeficiente de determinación y el coeficiente de correlación de los datos de la tabla 14. Se rechaza H0 y se concluye que existe una relación significativa positiva.19.34. r 2= bo ΣY + b1 ΣXY −n Y´ 2 40(608)+1.5: a) Calcule la covarianza muestral Estudian tes muestre ados 1 Horas de estudios (X) Calificación examen (Y) 20 64 X − X´ -4 Y −Y´ (X − X´ )(Y −Y´ ) -12 48 . pruebe la hipótesis nula de que ρ=0 y b) ρ≤0.18 a 14.

determine el valor del coeficiente de correlación con la fórmula que no se basa en el uso b0 b1 de los valores de y de la línea de regresión estimada.48)(11. Compare su respuesta en el inciso b) con el coeficiente de correlación obtenido en el problema 14.6 y analizados en los problemas 14.86 62..48 n−1 7 7 √∑Y 2 −n Y´ 2 = n−1 √ √ √ 47094−8 (5776) 886 = = √ 126.25) 72.2 3 4 5 6 7 8 Total 16 34 23 27 32 18 22 cov ( X . Interprete el significado de este valor calculando el coeficiente de determinación.857 ≅+62.26 a 14.8622≅ 0.33.25 7 7 14.9 donde : S X= √ SY = √ 4902−8 (576) ∑ X 2−n X´ 2 294 = = = √ 42=6.57=11.86 = = =+0.86 SX SY (6.Y )= 61 84 70 88 92 72 77 -8 10 -1 3 8 -6 -2 -15 8 -6 12 16 -4 1 120 80 6 36 128 24 -2 440 Σ [(X− X´ )(Y −Y´ )] 440 = =62.Respecto de los datos muestrales reportados en la tabla 14.32. .86 n−1 7 b) Convierta el valor de la covarianza al coeficiente de correlación.Y ) 62.36. r= cov ( X .

908 ≅−0.53 ) Σ Y −n Y´ 2 2 r= ¿ 2 334.8441≅ 0.84 ≈ 0.r= ¿ nΣXY −ΣXΣY √ nΣ X −( ΣX ) √ nΣ Y −( ΣY ) 2 2 2 = 12 ( 2048 ) −( 92 )( 298 ) √12 ( 876 ) −8464 √ 12 ( 7798 )−88804 24576−27416 −2840 −2840 = = =−0.04 .82 396.91 √2048 √ 4772 (45.25)(69.57 ( 298 )+ (−1.40 ) ( 2048 )−12 ( 616.08) 3126.53 ) = 2 2 7798−12 ( 616.19 bo ΣY + b1 ΣXY −n Y´ 35.3 =0.