Colegio de Bachilleres de

Tabasco
Plantel 27
Asignatura:
Probabilidad y estadística II
Profesor:
Ing. Jesús Magaña López
Capitulo:
14
Integrantes:

Jesús Stalin García Montejo
Janet Jiménez García
Juan Ramón López
Carlos Vicente Ovando López
Fausto Daniel Jiménez Hernández
Brandon Gómez Cerino
Jesús Javier Cerros Tosca

Nacajuca Tabasco., Junio de 2011

Capítulo 14
Ejemplos
Ejemplo 1.- Un analista desea estimar el tiempo de entrega como la
variable dependiente, con base en la distancia como la variable
independiente para partes industriales embarcadas por camión.
Supongamos que 10 embarques recientes se eligen de los
expedientes de la compañía de tal forma que las distancias por
carretera implicadas se hallen casi igualmente dispersas entre una
distancia de 100 millas y una distancia de 1 000 millas, y que se
registran los tiempos de entrega de cada embarque. Puesto que la
distancia por carretera se usara como la variable independiente,
esta selección de recorridos de distancias específicas es aceptable.
Por su parte, la variable dependiente de tiempo de entrega es una
variable aleatoria en este estudio, lo que cumple el supuesto
básico del análisis de regresión. La existencia o no de una relación
lineal entre las dos variables se investiga por lo general mediante
la elaboración de un diagrama de presión o de una gráfica de
residuales. Estos diagramas también se emplean para observar si
la dispersión vertical (varianza) es aproximadamente igual a lo
largo de la línea de regresión.

Ejemplo 2.-Un ejemplo de relación curvilínea seria l relación entre los
años desde la constitución de una empresa y el nivel de ventas,
dado que en cada año el nivel de ventas se haya incrementado en
el mismo porcentaje en comparación con el año precedente. La
curva con una pendiente creciente indicaría una llamada relación
exponencial.
Si el diagrama de dispersión indica en general una relación lineal, se
ajusta una línea recta a los datos. La ubicación precisa de esta
determinar por el método de mínimos cuadrados. Tal como se ilustra en
el ejemplo 3, una línea de regresión con pendiente positiva indica una
relación directa entre las variables, una pendiente negativa indica una
relación inversa entre las variables y una pendiente de cero indica

respecto de la línea de regresión indica el grado de relación entre las
dos variables.
Ejemplo 3.- La figura 14-1 incluye varios diagramas de dispersión y sus
líneas de regresión asociada en demostración de varios tipos de
relaciones entre las variables

A)

B)

C)

D)

E) F) .

Remítase la procedimiento de recolección de datos del ejemplo 1. 1 4 . En lugar de que elijas los 10 embarques de manera que se hallen casi igualmente dispersos desde una distancia de 100 millas hasta una distancia de 1000 millas.. Ejemplo 5. sin considerar ni la distancia por carretera ni el tiempo de entrega incluidos en cada observación.F i g . en este plan de muestreo revisado ambas variables aleatorias y. los 10 embarques se eligen en forma completamente aleatoria. A diferencia del ejemplo 1.. por lo tanto. sobre las variables de distancia por carretera y tiempo de entrega para una muestra de 10 embarques recientes de partes industriales embarcadas por camión. es evidente que resulta apta para el análisis de correlación. 1 Ejemplo 4. en el que solo el tiempo de entrega es una variable aleatoria. .En la figura se ilustra la apariencia general de los diagramas de dispersión asociadas con diversos valores de correlación.

siguen en general una relación lineal y que la dispersión vertical respecto de la línea es casi la. y considere si el análisis de regresión lineal parece apropiado. Con base en el diagrama. Los otros nueve puntos del diagrama de dispersión se colocaron de la misma manera. El primer par de valores reportados en la tabla está representada por el punto colocado sobre 825 en el eje X y alineado con 3. Problemas resueltos 14.1. en millas Tiempo de entrega (Y).5 32 5 1. en días 1 2 3 4 5 6 7 8 9 10 82 5 3. misma en los valores .Análisis de regresión lineal. Elabore el diagrama de dispersión de los datos de la tabla siguiente. 5 21 5 107 0 55 0 48 0 92 0 135 0 67 0 121 5 1 4 2 1 3 4.Supongamos que un analista toma una muestra aleatoria de 10 embarques recientes por camión realizado por una compañía y registra la distancia en millas y el tiempo de entrega al medio día más cercanos a partir del momento en que el embarque estuvo listo para su carga. todo indica que los puntos trazados. 5 3 5 El diagrama de dispersión de estos datos se muestra en la figura anterior. Embarque muestreado Distancia(X)..5 respecto al eje Y.

bajos y en los valores altos de X. Así.Determine la ecuación de regresión de mínimos cuadrados para los datos del problema anterior. el análisis de regresión lineal parece apropiado.2. . 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 X. distancia de acarreo. en millas 14. 6 5 4 Y. tiempo de entrega en dias. y trace en el diagrama de dispersión la línea de regresión de estos datos..

85 ) = 4653 =0.0036 ) ( 762 )=0.5 ΣY Y´ = n Media 7620 X´ = 10 28. en días 3.5 Y´ = 10 X´ =762 Y´ =2.25 9 25 99. Repárese en las líneas punteadas que indican el monto de desviaciones entre cada valor muestreado de Y y el valor estimado correspondiente.1068 ≅0. Y.11 b0 =Y´ −b X=2.25 1 16 4 1 9 20.5 1.11+0.5 1 4 2 1 3 4.75 ∑ XY −n XY´ = ( 26730 )−( 10 ) ( 762 )( 2. la suma de .1 2 3 4 5 6 7 8 9 10 Totales 825 215 1070 550 480 920 1350 325 670 1215 7620 ΣX X´ = n Tiempo de entrega (Y).0036 X La línea de regresión estimada en datos muestrales aparece en el diagrama de dispersión de estos datos de la figura 14-4.85− Y^ 0=b 0 +b1 X=0.5 2010 6075 26370 680625 46225 1144900 302500 230400 846400 1822500 105625 448900 1476225 7104300 Y 2 12.25 2.5 3 5 28.85 Embarqu e muestre ado b1= Distanci a (X) en millas 2 XY X 2887.5 215 4280 1100 480 2760 6075 487.0036 ∑ X 2−n X´ 2 7104 300−( 10 ) (762)2 1297 860 ´ ( 0.003581 ≅0.

Determinar los residuales y elabore una gráfica de residuales respecto de los valores ajustados de los datos de la tabla.84 -0.48 0.52 0.tiempo de entrega.96 0.48 1215 5 4.12 1070 4 3.28 0. Compare la gráfica de residuales con el diagrama de dispersión de la figura 14-4..42 215 1 0.84 920 3 3. usando la ecuación de regresión desarrollada en el problema anterior.52 de residuales para el problema de tiempo de entrega .97 -0.47 325 1.08 0. Embarque muestreado Distancia (X). reduce al mismo. 6 5 4 Y.88 0. en millas 3 2 1 0 0 200 400 600 800 1000 1200 1400 1600 X.09 -0.5 3.3 cálculo Tiempo de entrega (Y).5 4. en días Valor ajustado ( Y^ ) Residual ( e=Y − Y^ ) 825 3.42 1350 4.distancia de acarreo. en millas 14.3. determinada por el procedimiento anterior.09 480 1 1.estas desviaciones al cuadrado es lo que la línea de regresión lineal.en millas 1 2 3 4 5 6 7 8 9 10 Tabla 14.22 670 3 2.5 1.04 550 2 2.42 -0.

0036(1000)=3. 14.5 )−( 0.2 0 Residual e -0..5 1 1.2.2.4 0.11+0.5 5 5.5 2 2.4 -0.6 0.5 4 4. mientras que en la figura 14-5 aparece la gráfica de residuales.5 3 3.5 Valor ajustado Ý 14.2 -0.Usando la ecuación de regresión desarrollada en el problema 14.6 -0. salvo por la prolongada escala vertical de la gráfica de residuales.Calcule el error estándar del estimador para el problema de análisis de tiempo .11 +0. S YX = √ ∑Y −b 0 ∑ XY √ 99.4.75− ( 0.8 -1 0. Y 0. Nótese que la forma general de la dispersión de los valores de la variable dependiente Y respecto de la línea de regresión en el diagrama de dispersión y la dispersión de los residuales e respecto de la línea “o” en la gráfica de residuales son similares.5. estime el tiempo de entrega a partir del momento en que el embarque está listo para su carga de un embarque de 1000 millas.0036 )( 26 370 ) = n−2 10−2 . ¿Podría utilizarse esta ecuación de regresión para estimar el tiempo de entrega de un embarque de 2 500 millas? ^ =0. remítase a los valores determinado en la solución del problema 14.71dias ..0036 X =0.11 ) ( 28.En la tabla anterior se presenta el cálculo de los residuales.

inmediatamente anterior.8526 S YX = √ = =0.En referencia al problema 14.0004 2 √7104300−10 (762) 1139.6.Usando el error estándar del estimador del problema 14.7.4812 ≅048 n−2 10−2 Excepto por una ligera diferencia de redondeo. ∑e 2 √ 1.Calcule el error estándar del estimador mediante la formula básica en la que se utilizan los residuales determinados en el problema 14.8. inmediatamente anterior.24 H o=β 0=0 H 1=β 1> 0 t critica ( gl=8. Compare su respuesta con la obtenida por medio de la fórmula de cálculo en el problema 14.4587 ≅ 0.00 S b 0.5 14.306 t= b1 0.0036 = =+9.46 0..5.46 = =0. pruebe H 0 : β 1 ≤0 la hipótesis nula al nivel de significancia de 5%.2.46 y los valores de la tabla 14. H 0=β 1=0 H 1: β 1 >0 . con un nivel de significancia de 5% YX=¿ 0.¿√ 1.0004 1 14.683 =√ 0.2104=0.7..46 8 14.05 )=± 2.2.5. Datos S¿ S h 1= SYX √ Σ X −n X´ 2 2 = 0.3. pruebe H 0 : β 1=0 la hipótesis nula para los datos de distancia de acarreo y tiempo de entrega de la tabla 14.. esta respuesta coincide con la obtenida en el problema 14. α =0.

0027 a 0. el intervalode confianza de 95 para β 1 es : b1 ±t s b 1=0. En el caso de esta prueba de una cola. esto equivale a un tiempo de entrega adicional por millas de entre 3.0009=0. con cada milla adicional de distancia. t=+9.860.9.860 .0036 y gl=n−2=10−2=8. con una confianza de 95%.306 )( 0.0045 con una confianza de 95%.t critica ( gl=8.0004 ) ¿ 0.Usando los valores determinados en los problemas anteriores.0045 Así.10. 14. 14.9 y 6. Suponiendo una jornada laboral de 24 horas en los puntos de recepción. S Y´ X =SYX √ 1 + n ( X− X´ ) 2 ( ΣX )2 ΣX − n 2 . Dado que b1=0.00 Dado que la estadística t calculada de +9 excede el valor critico de +1..0036 ± ( 2. el número de días adicionales requeridos para la entrega es de entre 0. a=0.0036 ± 0..Determine el intervalo de confianza de 95% para β1 respecto de los datos de distancia de acarreo y tiempo de entrega expuestos en los problemas anteriores. elabore el intervalo de confianza de 95% para el tiempo de entrega medio respecto de una distancia de acarreo de 1000 millas.5 minutos. y por lo tanto que existe relación directa entre distancia de embarque y tiempo de entrega. concluimos que la línea de regresión de la población es positiva.05)=+1.0027 y 0. se rechaza la hipótesis nula.

Compare este intervalo con el elaborado en el problema 14.17 .13=2.49)=3.10.71 ±0.17 ) =√ 0.17 10 7104300−( 7620 )2 / 10 El intervalo de confianza de 95% para la media condicional (donde gl=10-2= 8) es: ^ Y =±t s ^Y X =3.71 ±2 .71 dias . µ Así.10. elintervalo de prediccion de 95 es : Y^ ±t sYsiguiente =3.4904 ≅ 0. Dadas Y^ ( para X=1000)=3. este intervalo de predicción es ligeramente mas amplio que el intervalo de confianza para la media condicional del problema 14. S Ysiguiente= √ S2YX + S2Y´ X = √ ( 0.84 dias Como era de esperar.32 y 4.71 ±(2.¿ 0.71 ± 1. S YX =0.10 días..39=3.306)(0. no a una media. 14.10 dias .2405=0.1748 ≅0. .46 √ 2 (1000−762) 1 + =0.Usando los valores determinados en los problemas anteriores.46 y S Y´ X =0.11. ya que en la presente aplicación el intervalo se refiere a un valor individual para un embarque en particular.306(0. en referencia a embarques por camiones de 1000 millas estimados que el tiempo de entrega medio a partir del momento en que el embarque está listo es de entre 3. determine el intervalo de predicción de 95% para el tiempo de entrega de un solo embarque dada una distancia implicada de 1000 millas.32 a 4. con una confianza de 95%.49 2 2 Donde gl=10−8=2.58 a 4.46 ) + ( 0.17)=3.

Problemas Complementarios 12.. Elabore un diagrama de dispersión para esos datos y observe si cumplen los supuestos de linealidad e igualdad de las varianzas condicionales.5 se presentan datos muestrales relacionados al número de horas de estudio fuera de clase durante un periodo de tres semanas de alumnos en un curso de estadística aplicada a la administración y a sus calificaciones en el examen al final de ese periodo. Estudiante muestreado Horas de estudio (X) Calificación en examen (Y) 1 20 64 2 16 61 3 34 84 4 23 70 5 27 88 6 32 92 Tabla 14.18. 30 25 20 Calificaion en examen 15 10 5 0 2 4 6 8 10 12 14 16 Horas de estudio Numero de rechazados (Y) Con base en el diagrama de dispersión los supuestos de linealidad e igualdad de las varianzas condicionales parecen cumplirse racionalmente.5 Horas de estudio en el curso de estadística y sus calificaciones en examen de una muestra de n=8 estudiantes.En la tabla 14. 7 18 72 8 22 77 .

5 294 Σ X 2−n X´ 2 4902−(8)(24 )2 b0 =Y´ −b 1 X´ =76−( 1.14. Estudiant Horas Califica es de ción XY X2 Y2 muestrea estudi examen dos os (X) (Y) 1 20 64 1280 400 4096 2 16 61 976 256 3721 3 34 84 2856 1156 7056 4 23 70 1610 529 4900 5 27 88 2376 729 7744 6 32 92 2944 1024 8464 7 18 72 1296 324 5184 8 22 77 1694 484 5929 Totales 192 608 15032 4902 47094 ΣX ΣY X´ = Y´ = n n Media 192 X´ = 8 608 Y´ = 8 X´ =24 Y´ =76 ΣXY −n X´Y´ 15032−(8)(24)(76) 440 b1 = = = =1.18.5 y trácela en el diagrama elaborado en el problema 14.Determine la línea de regresión de mínimos cuadrados de los datos de la tabla 14.5 X .19.5 )( 24 )=40 Y^ =b 0 +b1 X=40+1.49 ≅ 1..

30 25 20 Calificaion en examen 15 10 5 0 2 4 6 8 10 12 Horas de estudio 14 16 .

14.Determine los residuales y elabore una gráfica de residuos respecto de los valores ajustados de los datos de la tabla 14.Calcule el error estándar del estimador de los datos de la tabla 14.5 con base en los residuales determinados en el problema 14.5 88 67 73 -6 -3 -7 -4.16 6. s YX = ¿ √ √ Σ Y 2−b0 ΣY −b1 ΣXY 47094−( 40 )( 608 )−( 1.19.14 ≈6..20. Estudiantes muestreados Horas de estudios (X) Calificación examen (Y) Valor ajustado ^ ( Y ) Residual ( e=Y − Y^ ) 1 2 3 4 5 6 7 8 20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77 70 64 91 74.5 usando la ecuación de regresión desarrollada en el problema 14.359 √ 4902−8 ( 576 ) √ 294 y se concluye que existe una relación .22.5 7.20.18.21.19 S b 1= SYX √Σ X 2 −n X´ Se rechaza significativa.16 y los valores de latabla del problema14.16 = =0.5 80.5 ) (15032 ) = n−2 8−2 √ 226 ≅6.. con un nivel de insignificancia de 1% e interprete el resultado de su prueba. 2 H0 = 6.-En referencia a la información muestral presentada en el problema 14.18 a) Pruebe la hipótesis nula de que la pendiente de la alinea de regresión es cero.5 4 5 4 14. Dado SYX =6.16 6 14. Compara la gráfica de residuales con el diagrama de dispersión elaborado en el problema 4.

µ ^ Y =Y^ ± t sY^ X =85 ±5.01 )=+3.19 para estimar la calificación de en el examen de un estudiante que dedico 30 horas al estudio del material del curso. α=0.02 a 90.En la tabla 14.23=71.143 t=+4.25.24.23.71± 13. 14.16 √ √ 1 + n ( X− X´ ) Σ X 2− 2 ( ΣX )2 n 2 (30−24) 1 + ≅ 3.5 ( 30 )=85 Y 14.5 X=40+1.26.06)≈ 3. S Y´ X =SYX ¿ 6. H o−β 0=0 H 1=β 1> 0 t critica ( gl=6.09=79.b) Repita la prueba de la hipótesis nula de que el coeficiente de regresión real es igual a o menor que cero..98 14.En referencia a los problemas anteriores.06 8 4902−( 192 )2 / 8 µ ^ Y =Y^ ± t sY^ X =85 ±(4..41 14.23 y elabore el intervalo de confianza de 90% para estimar la calificación media de los estudiantes que dedicaron 30 horas al estudio del curso. con un nivel de insignificancia de 1%..6 se presentan datos relativos al número de semanas de experiencia en un empleo implica la conexión de . ^ =40+1.21 y 14..18 Se rechaza H0 y se concluye que existe una relación positiva significativa.16)(3. 95 a 98. elabore el intervalo de predicción de 90% para la calificación de un estudiante en particular que dedicó 30 horas.Remítase a los problemas 14.Use la ecuación de regresión determinada en el problema 14.

Semanas de experiencia y número de componentes rechazados durante una semana muestreada para 12 obreros ensambladores. 40 35 30 25 Numero de rechazados 20 15 10 5 0 0 2 4 6 8 10 12 14 Semanas de experiencia 16 1 0 1 1 2 2 1 1 1 2 1 8 3 2 2 5 .. Obrero muestreado Semanas de experiencia (X) Numero de rechazados (Y) 1 2 3 7 9 6 2 6 2 0 2 8 4 1 4 1 6 5 8 2 3 6 7 1 2 1 8 1 0 2 4 8 9 4 2 2 6 3 8 Tabla 14.6.componentes electrónicos en miniatura y el número de componentes que fueron rechazados durante la última semana en el caso de 12 trabajadores aleatoriamente seleccionados. Trace estos datos en un diagrama de dispersión.

Con base en la tabla 14.83) −236.66 Σ X −n X 876−( 12)(7.66 ΣXY −n XY = = =1.83− (−1. Comente la naturaleza de la relación de acuerdo con lo indicado por la ecuación de regresión.57 Y^ =b 0 +b1 X=35.40 2 2 2 ´ 170..40 X .58) b0 =Y´ −b 1 X´ =24.57−1.14. determine la ecuación de regresión para predecir el número de componentes rechazados dado el número de semanas de experiencia y trace la línea de regresión en el diagrama de dispersión.27.39 ≅−1.6.4 )( 7. Obrero muestrea do 1 2 3 4 5 6 7 8 9 10 11 12 Totales Media b1 = Semanas de experien cia X 7 9 6 14 8 12 10 4 2 11 1 8 92 ΣX X´ = n Numero de rechazad os Y 26 20 28 16 23 18 24 26 38 22 32 25 298 ΣY Y´ = n 92 X´ = 12 298 Y´ = 12 X´ =7.83 XY X2 Y2 182 180 168 224 184 216 240 104 76 242 32 200 2048 49 81 36 196 64 144 100 16 4 121 1 64 876 676 400 784 256 529 324 576 676 1444 484 1024 625 7798 ´ 2048−(12)(7.58 Y´ =24.58 ) ≅35.58)(24.

40 35 30 25 Numero de rechazados 20 15 10 5 0 0 2 4 6 8 10 12 14 16 Semanas de experiencia .

Y^ =35. α =0.19 186.40 ( 3 )=31.19 H o−β 1=0 H 1 :B 1 ≠ 0 t critica ( gl=10.4 = ≅−7.34 =√6..57 )( 298 ) −(−1.40 ) ( 2048 ) s YX = = n−2 12−2 ¿ √ √ 65.4 ± 0.26 y 14.6 2.29.57−1.14.4 s b 1 0. µ ^ Y =±t s ^Y X =−1.6 y de que la pendiente de la línea de regresión de la población es cero.28. 14.37 14.19 S b 1= t= SYX √ Σ X −n X´ 2 2 2.4564 ) √ = b1 −1.En referencia a la información de muestral de los problemas 14. con un nivel de significancia de 5% para la prueba.95 14.6 = =0.40 X=35.534 ≅2.31.85 a−0.05 ) =1.-Siguiendo con el problema 14.6 10 Dado SYX =2. √ Σ Y 2−b0 ΣY −b1 ΣXY 7798−( 35.Pruebe la hipótesis nula de que no existe relación entre las variables de la tabla 4.Usando la ecuación de regresión desarrollada en el problema 14.52 √876−12 ( 57.812 Se rechaza H0 y se concluye que existe una relación.30..27.. elabore el intervalo de confianza de 95% para β1 estimar el valor del coeficiente de regresión de la población e interprete el valor de este coeficiente.27 estime el número de componentes rechazados en el caso de un empleado con tres semanas de experiencia en las operaciones.6 y los valores de la tabla del problema14. elabore el intervalo de confianza de 95% para estimar el número medio de rechazos en el .40.45=−1.57−1.

caso de los empleados con tres semanas de experiencia en las operaciones.11 )( 28.85 )2 r 2= 0 = ¿ ∑Y 2−n Y´ 2 .5 ) + ( 0. ¿ 31.74 a 34.30 y 14.00 µ 14. ambas variables son variables aleatorias. Si suponemos además una distribución normal bivariada para la población y varianza condicionales iguales para cada variable.85) 99.37 ±(−7.75−¿ 2 b ∑Y +b1 ∑ XY −n Y´ ( 0. Usando los valores calculados en el problema 14.2.4)(0. el análisis de correlación es aplicable a los datos muestrales. 2 10 ¿(2.65 Análisis de correlación Problemas resueltos 14. en efecto.31 12 876−( 92 )2 / 10 ^ Y =±t s ^Y X =31.19)≈ 31.32. Elabore el intervalo de predicción de 95% para el número componentes rechazados en el caso de un empleado con tres semanas de experiencia en el puesto.28=25.37 ± 2.37 ±6.0036 )( 26 370 )− ( 10 )( 2. Calcule el coeficiente de determinación para los datos muéstrales.-Remítase a los problemas 14.63=28.6 √ √ 1 + n ( X− X´ ) Σ X 2− 2 ( ΣX )2 n 2 (3−7. el procedimiento de muestreo descrito en el problema 14.12 En referencia a los datos de distancia de acarreo y tiempo de entrega.31.1 indica que.58) 1 + ≅ 2. S Y´ X =SYX ¿ 2.09 a 37.

00(con base a la tabla 14. r= ¿ ¿ nΣXY −ΣXΣY √ nΣ X −( ΣX ) √ nΣ Y −( ΣY ) 2 2 2 2 10 ( 26370 )−( 7620 ) (28. como se determinó en el problema 14.¿ 16.4) n−1 9 b) Convierta el valor de la covarianza al coeficiente de correlación.9535 ≅+ 0.Y )= Σ [(X− X´ )(Y −Y´ )] 4653 = =517.842 =0.12 r= √ r 2 =√ 0.9091=+0.525 14.75 )−( 28.14.91 18.07) 49033.9489 ≅+0..95 (3602.2 b) Determinar el coeficiente de correlación usando la fórmula de cálculo alternativa de r.Respecto de los datos de distancia de acarreo y tiempo de entrega: a) Calcule el coeficiente de correlación en referencia al coeficiente de determinación del problema 14.5 ) 2 2 46530 46530 = =+0. Compare su respuesta en el inciso b) con las respuestas sobre el .61.668 14.5 ) √10 ( 7104300 )−( 7620 ) √10 ( 99.9091≅ 0. cov ( X .5824)(13.95 El valor positivo del valor de correlación se basa en la observación b1 de que la pendiente de la línea de regresión es positiva..Respecto de los datos de acarreo y tiempo de entrega: a) Calcule la covarianza muestral.13.

35 0. en millas 1 2 3 4 5 6 7 8 9 10 825 215 1070 550 480 920 1350 325 670 1215 X´ = 762 Tiempo de entrega (Y). en días 3..65 -1.8 973.95 -13.4347 ) Embarq ue muestre ado Distancia (X).85 ¿ ¿ ¿2 99.85 X − X´ 63 -547 308 -212 -282 158 588 -437 -92 453 Y −Y´ 0.9489 ≅+ 0.13.95 1011. ( 379.85 1.2 521.7 23.00 =+0.95 354.5 3 5 Y´ = 2.65 -1.85 -1.15 2.2 589.75−10 ¿ √¿ ∑Y 2 −n Y´ 2 SY = √ =¿ n−1 r= 517.85 0. inmediatamente anterior. r= cov ( X .15 -0.15 1.95 ∑= 4653 .95 . Y ) S X SY donde : 762 ¿ ¿ ¿2 7104300−10 ¿ √¿ 2 2 ∑ X −n X´ √ S X= =¿ n−1 2.7 970.2 180.5 1.coeficiente de correlación obtenido en el problema 14.7455 ) ( 1.15 (X − X´ )(Y −Y´ ) 40.5 1 4 2 1 3 4.

H 0 : ρ=0 H 1 : ρ≠ 0 .9004 0.14. La diferencia en los valores calculado de t en estas dos pruebas se debe el redondeo de valores en los cálculos. H 0 : ρ=0 H 1 : ρ≠ 0 t critica ( gl=8.9489 = =+8. la hipótesis nula de que no exista relación entre las dos variables se rechaza.9489 0.1116 10−2 Dado que la estadística de prueba de t=+8. y concluimos que existe una relación significativa entre distancia de acarreo y tiempo de entrega.Determinar si el valor de correlación calculado en el problema 14.14 b) es significativamente diferente a cero al nivel de significancia de 5%. 14. se determina que el coeficiente de correlación entre ingreso doméstico y monto de deuda a corto plazo vigente es r=+ 0.15.50 . con un nivel de significancia de 5%..50 1−0.306 t= r √ 2 1−r n−2 = √ 0.50 se encuentra en un región de rechazo.7. Nótese que esta conclusión coincide con la prueba de la β 1=0 hipótesis nula de que en el problema 14.05)± 2.16 En referencia a una muestra de n=10 receptores de préstamos de una compañía financiera. a) Pruebe la hipótesis de que no existe correlación entre estas dos variables para la población entera de receptores de préstamos. α =0.

306 t= r √ 2 1−r n−2 = 0.50) 8 = 0.t critica ( gl=8. b) Interpreta el significado del coeficiente de correlación calculado. una interpretación más adecuada para la población es que no puede suponerse ninguna asociación entre la varianza en Y y cambios en X .50 podríamos r 2=0. Esto es cierto en relación con los datos muestrales.6 0. dado que la hipótesis nula del inciso a). Con base en el coeficiente de correlación inclinarnos a concluir que puesto que de r =+0. la hipótesis nula no puede rechazarse. inmediatamente anterior no fue rechazada. Sin embargo. aproximadamente el 25% de la varianza en la deuda a corto plazo es explicado estadísticamente por el monto de ingreso doméstico. La relación muestral observada puede atribuirse al azar con un nivel de significancia de 5%.634 no se encuentra en una región de rechazo.05)± 2. α =0.50 √ 2 1−(0. . de modo que se acepta el supuesto de que no exista relación entre las dos variables.50 =+1.306 Dado que la estadística t calculada de +1.25 .

H 0 : ρ=0 H 1 : ρ≠ 0 t critica ( gl=8.7449≅ 0.34. aprovechando los b0 b1 valores de y para la ecuación de regresión calculados en el problema 14.19. α =0. 14.Calcule el coeficiente de determinación y el coeficiente de correlación de los datos de la tabla 14.Problemas complementarios 14.25.5(15032)−8(5776) 660 = = =0.86 14.En referencia al valor de correlación de muestral determinado en el problema 14. los cuales fueron analizados en los problemas 14. r 2= bo ΣY + b1 ΣXY −n Y´ 2 40(608)+1.33.18 a 14. Se rechaza H0 y se concluye que existe una relación significativa positiva.74=+ 0.35.5: a) Calcule la covarianza muestral Estudian tes muestre ados 1 Horas de estudios (X) Calificación examen (Y) 20 64 X − X´ -4 Y −Y´ (X − X´ )(Y −Y´ ) -12 48 .-En referencia a los datos de la tabla 14..74 47094−8(5776) 886 Σ Y 2−n Y´ 2 r= √ r 2 =√ 0.33.863≅+0. Interprete los coeficientes calculados. con un nivel de insignificancia de 1% respectivamente en cada prueba. pruebe la hipótesis nula de que ρ=0 y b) ρ≤0.05)± 2.. Interprete sus resultados.5.306 Se rechaza H0 y se concluye que existe una relación significativa.

57=11.8622≅ 0.48)(11. Compare su respuesta en el inciso b) con el coeficiente de correlación obtenido en el problema 14.9 donde : S X= √ SY = √ 4902−8 (576) ∑ X 2−n X´ 2 294 = = = √ 42=6.6 y analizados en los problemas 14.25) 72.25 7 7 14.Y ) 62.Y )= 61 84 70 88 92 72 77 -8 10 -1 3 8 -6 -2 -15 8 -6 12 16 -4 1 120 80 6 36 128 24 -2 440 Σ [(X− X´ )(Y −Y´ )] 440 = =62.857 ≅+62. determine el valor del coeficiente de correlación con la fórmula que no se basa en el uso b0 b1 de los valores de y de la línea de regresión estimada.2 3 4 5 6 7 8 Total 16 34 23 27 32 18 22 cov ( X .. r= cov ( X . .86 = = =+0.32.Respecto de los datos muestrales reportados en la tabla 14.36. Interprete el significado de este valor calculando el coeficiente de determinación.86 62.86 SX SY (6.48 n−1 7 7 √∑Y 2 −n Y´ 2 = n−1 √ √ √ 47094−8 (5776) 886 = = √ 126.33.26 a 14.86 n−1 7 b) Convierta el valor de la covarianza al coeficiente de correlación.

84 ≈ 0.8441≅ 0.53 ) Σ Y −n Y´ 2 2 r= ¿ 2 334.908 ≅−0.r= ¿ nΣXY −ΣXΣY √ nΣ X −( ΣX ) √ nΣ Y −( ΣY ) 2 2 2 = 12 ( 2048 ) −( 92 )( 298 ) √12 ( 876 ) −8464 √ 12 ( 7798 )−88804 24576−27416 −2840 −2840 = = =−0.19 bo ΣY + b1 ΣXY −n Y´ 35.53 ) = 2 2 7798−12 ( 616.82 396.08) 3126.04 .3 =0.91 √2048 √ 4772 (45.40 ) ( 2048 )−12 ( 616.25)(69.57 ( 298 )+ (−1.