Ejercicios

PROBABILIDADES.
Ejemplo: Hallar la probabilidad de sacar una suma de 8 puntos al lanzar dos dados.

1,1 1,2 1,3 1,4 1,5 1,6 2,1 2,2 2,3 2,4 2,5 2,6 3,1 3,2 3,3 3,4 3,5 3,6 4,1 4,2 4,3 4,4 4,5 4,6 5,1 5,2 5,3 5,4 5,5 5,6 6,1 6,2 6,3 6,4 6,5 6,6 P = 5/36 = 0.1389
Ejemplo: Cual es la probabilidad de la siguiente valuación cualitativa:

Calificación Muy deficiente Deficiente Bueno Muy bueno Total LA DISTRIBUCIÓN BINOMIAL.

ni 30 20 16 14 80

pi Pi = ni/total

1.0000

Se aplica cuando se realizan un número "n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo:

Ejemplo: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " k " es el número de aciertos, k = 6, " n" es el número de ensayos, n = 10, " p " es la probabilidad de éxito, salga "cara" p = 0,5

P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces? " k " número de aciertos = 4, " n" toma el valor 8, " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 = 0,1666 GEOESTADISTICA-I Página 1

P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces. LA DISTRIBUCIÓN DE POISSON. Es parte de la distribución binomial, cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson. Se tiene que cumplir que: " p " < 0,10 y " p * n " < 10

"e" es 2,71828 "λ "=n*p " k " es el número de éxito cuya probabilidad se está calculando Ejemplo: La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes? Probabilidad "p" < que 0,1, “n*p” < 10, aplicamos el modelo de distribución de Poisson.

P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9% Ejemplo: La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos?

P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%. DISTRIBUCIONES NORMAL Es el modelo de distribución más utilizado en la práctica, X  N (µ , σ
2

)

Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal estandarizada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. Z= (X - µ )/σ Z  N (0, 1) Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10 y varianza 4, para una variable X distribuida entre 15 y 20. Transformarla en una normal estandarizada. X  N (10, 4) P [ 15 ≤ x ≤ 20] GEOESTADISTICA-I Página 2

P [ (15-10)/2 ≤ (X-10)/2 ≤ (20-10)/2 ] P [ 2.5 ≤ Z ≤ 5 ] P = 0.5 - 0.4938 = 0.0062 Ejemplo: una variable aleatoria sigue el modelo de una distribución con las siguientes características, transformarla en una normal estandarizada. X  N (20.5, 52) P [ 44.5 ≤ x ≤ 60.3] P = 0.3849 + 0.4750 = 0.8599 = 85.99% Ejemplo: El diámetro interno de un aro de pistón esta distribuido normalmente con media de 4.5 cm. y una desviación estándar de 0.005 cm. ¿Qué porcentaje de aros tendrán un diámetro que exceda a 4.51 cm.? µ = 4.5 cm. σ = 0.005 cm. > 4.51 cm. %? X  N (4.5 cm.,0.0052cm2.) P [ x ≥ 4.51] P = 0.5 – 0.4772 = 0.0228 = 2.28 % Ejemplo: el salario medio de los empleados de una empresa se distribuye según una distribución normal, con una media 5 mil $. y desviación típica de mil $. Calcular el porcentaje de empleados con un sueldo inferior a 7 mil $. X  N (5000 $,10002$2) P [ x ≤ 7000 $] P [ z ≤ 2] P = 0.5 + 0.47725 = 0.97725 Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 mil $ es del 97,725%. Ejemplo: La renta media de los habitantes de un país es de 4 millones de ptas/año, con una varianza de 1,5. Se supone que se distribuye según una distribución normal. Calcular: a) Porcentaje de la población con una renta inferior a 3 millones de ptas. b) Renta a partir de la cual se sitúa el 10% de la población con mayores ingresos. c) Ingresos mínimo y máximo que engloba al 80% de la población con renta media. µ = 4 millones σ
2

= 1.5

X  N (4 , 1.5) a) Porcentaje de la población con una renta inferior a 3 millones de ptas. P [ x ≤ 3] P [ z ≤ -0.82] P = 0.5 - 0.29389 = 0.20611 Luego, el 20,61% de la población tiene una renta inferior a 3 millones ptas. GEOESTADISTICA-I Página 3

b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más elevada. Según el área es el 90% de probabilidad acumulada, lo que quiere decir que por encima se sitúa el 10% superior. P = 90% de 0.5 (área total) = 0.45 (se ubica en la tabla de cómo área de probabilidad) Z para 0.45 es = 1.65 Despejando X de Z = (X - µ )/σ X = 6.02 Por lo tanto, aquellas personas con ingresos superiores a 6.02 millones de ptas. constituyen el 10% de la población con renta más elevada. c) Nivel de ingresos mínimo y máximo que engloba al 80% de la población con renta media Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). P = 80% de 0.5 = 0.4 (se ubica en la tabla como área) Z para 0.40 es = 1.28 Despejando X de Z = (X - µ )/σ X = 5.567 es el valor mayor, y el valor menor es: 4 – (5.567 - 4) = 2.433 Por lo tanto, las personas con ingresos superiores a 2,433 millones de ptas. e inferiores a 5,567 millones de ptas. constituyen el 80% de la población con un nivel medio de renta. Ejemplo: La vida media de los habitantes de un país es de 68 años, con una varianza de 25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes: a) ¿Cuántas personas superarán previsiblemente los 75 años? b) ¿Cuántos vivirán menos de 60 años? a) Personas que vivirán (previsiblemente) más de 75 años Calculamos el valor de la normal tipificada equivalente a 75 años X  N ( 68 años , 25 años) P [ x ≥ 75] P [ Z ≥ 1.4 ] P = 0.5 – 0.41924 = 0.08076 = 8.1 % Luego, el 8,076% de la población de 10,000 es 808 habitantes que vivirán más de 75 años. b) Personas que vivirán (previsiblemente) menos de 60 años P [ x ≤ 60] P [ z ≤ -1.6] P = 0.5 – 0.44520 = 0.0548 Luego, el 5,48% de la población es 548 habitantes que no llegarán probablemente a esta edad. Ejercicio: El consumo medio anual de cerveza de los habitantes de un país es de 58 litros, con una varianza de 36. Se supone que se distribuye según una distribución normal. a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año para pertenecer al 5% de la población que más bebe? b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría argumentar en su defensa? GEOESTADISTICA-I Página 4 Limites de control Max y Min (+ y -)

a) 5% de la población que más bebe. Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estaría el 5% restante. Área = 0.5*0.95 = 0.475 Tabla al revés = para 0.475 se tiene Z = 1.96 Z= (X - µ )/σ X = 69.76 Por lo tanto, tendría usted que beber más de 69,76 litros al año para pertenecer a ese "selecto" club de grandes bebedores de cerveza. b) Usted bebe 45 litros de cerveza al año. ¿Es usted un borracho? P [ X ≤ 45 ] P [ Z ≤ -2.17 ] P [ Z ≥ 2.17 ] P = 0.4850 Pero para no ser borracho tiene que ser menor (6to. Caso): P = 0.5 – 0.4850 = 0.015 Por lo tanto, sólo un 1,5% de la población bebe menos que usted. Parece un argumento de suficiente peso para que dejen de catalogarle de "enamorado de la bebida" P = 0.5 – 0.475 = 0.025 X  N (20.5, 52) P [ 44.5 ≤ x ≤ 60.3] P = 0.3849 + 0.4750 = 0.8599 = 85.99% Ejercicio: Un estudio de la DGT estima que el número de horas prácticas necesarias para la obtención del permiso de conducir sigue una distribución normal con N(24, 32). (a) ¿Qué probabilidad hay de obtener el permiso de conducir con 20 horas de prácticas o menos? (b) ¿Cuántas horas de prácticas ha necesitado un conductor para obtener el permiso si el 68% de los conductores ha necesitado más horas de prácticas que él? La autoescuela D’spacio tiene un ingreso por alumno una parte fija de 250 euros, más 23 euros por hora de práctica. (c) Calcular el ingreso por alumno esperado. (d) Calcular la desviación típica del ingreso por alumno. Solución: X ~ N(24, 32). μ = 24 σ=3 a) P[ X ≤ 20 ] P [ Z ≤ -1.33 ] P [ Z ≥ 1.33 ] P = 0.5 – 0.4082 = 0.0918 = 9.18% GEOESTADISTICA-I Página 5  1.96 = ( X – 58 ) / 6 X = ( 1.96 * 6 ) + 58

b) Sea x0 el número de horas prácticas que buscamos. P(X ≥ x0) = 0.68 Para la probabilidad de 0.68 en la tabla Z es: 0.5 – 0.68 = 0.18  el área de 0.18 nos da Z = 0.47 Z= (X - µ )/σ X = 25.41 c) Como X ~ N(24, 32), el número de horas de práctica necesarias para obtener el permiso de conducir es de 24. El ingreso de la autoescuela por las prácticas de un alumno es 23X. El ingreso por alumno es I = 250 + 23X. I = 250 + (23 × 24) = 802 euros d) Aplicando que Var(I) = Var(23X) = 232Var(X). Como X ~ N(24, 32), sabemos que Var(X) = 32. Var(I) = 232x32 La desviación típica del ingreso es: dtI=Var(I)=23x3=69 TEOREMA DEL LÍMITE CENTRAL El teorema del límite central dice que si una muestra es lo bastante grande (n > 30), sea cual sea la distribución de la variable de interés, la distribución de la media muestral será aproximadamente una normal. Además, la media será igual a μ y la varianza será igual a σ2/n. Ejemplo: Una empresa de mensajería que opera en la ciudad tarda una media de 35 minutos en llevar un paquete, con una desviación típica de 8 minutos. Supongamos que durante el día de hoy han repartido doscientos paquetes. a) ¿Cuál es la probabilidad de que la media de los tiempos de entrega de hoy esté entre 35 y 36 minutos? b) ¿Cuál es la probabilidad de que, en total, para los doscientos paquetes hayan estado más de 115 horas? Solución: µ = 35 σ=8 n = 200 a). Consideremos la variable X = “Tiempo de entrega del paquete”. Sabemos que su media es 35 minutos y su desviación típica, 8. Pero no sabemos si esta variable sigue una distribución normal. Durante el día de hoy se han entregado n = 200 paquetes. Es decir, tenemos una muestra x1, x2, ..., xn de nuestra variable. Por el teorema del límite central sabemos que la media muestral se comporta como una normal de esperanza 35 y desviación típica: S=σ2n=σn=8200=0.5656 P [ 35 ≤ X ≤ 36 ] P [ 0 ≤ Z ≤ 1.768 ] GEOESTADISTICA-I Página 6  0.47 = ( X – 24 ) / 3 X = ( 0.47 * 3 ) + 24

P = 0.4616 Tenemos una probabilidad del 0,4616 de que la media del tiempo de entrega de hoy haya estado entre 35 y 36 minutos. b). Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a minutos, ya que ésta es la unidad con la que nos viene dada la variable. Observa que 115 horas por 60 minutos nos dan 6.900 minutos. Se nos pide que calculemos la probabilidad siguiente: P [ X ≥ 6900/200 ] P [ X ≥ 34.5 ] P [ Z ≥ -0.884 ] P [ Z ≤ 0.884 ] P = 0.5 + 0.3106 = 0.8106 Ejemplo: Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres maestros universitarios de matemáticas: Maestro de matemáticas A B C Antiguedad 6 4 2

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la desviación estándar de la distribución muestral. Solución: Se pueden tener 3C2 =3 muestras posibles y significativas. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales. Muestras A,B A,C B,C Antigüedad (6,4) (6,2) (4,2) Media Muestral 5 4 3

La media poblacional es: μ=2+4+63=4

La media de la distribución muestral es:
μ=5+4+33=4

La desviación estándar de la población es:
σ=(6-4)2+(4-4)2+(2-4)23=1.63

El error estándar o la desviación estándar de la distribución muestral es:
σ=(5-4)2+(4-4)2+(3-4)23=0.816

Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:
σX=σ2n=σn=1.632=1.152

Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección obtendremos el valor correcto:
σX=σnN-nN-1=1.6323-23-1=0.816 Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. GEOESTADISTICA-I Página 7

Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solución: Z = X- μσ2n=775- 8004016=-2.5 P [X ≤ 775 ] P [ Z ≤ -2.5 ] P [ Z ≥ 2.5 ] P = 0.5 – 0.4938 = 0.0062 La interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062. Ejemplo: Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine: a) El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros. b) El número de medias muestrales que caen por debajo de 172 centímetros. Solución: Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso. σX=σnN-nN-1=6.9251000-251000-1=1.36 a). P [ 172.5 ≤ X ≤ 175.8 ] Z1 = X- μσX=172.5-174.51.36=-1.47 Z2 = X- μσX=175.8-174.51.36=-0.96 P [ -1.47 ≤ Z ≤ 0.96 ] P = 0.4292 + 0.3365 = 0.7657 El numero de medias muestrales = (0.7657)(200) = 153.14 = 153 b). P [ X ≤ 172 ] Z3 = X- μσX=172-174.51.36=-1.83 P [ Z ≤ -1.83 ] P [ Z ≥ 1.83 ] P = 0.5 - 0.4664 = 0.0336 El numero de medias muestrales = (0.0336)(200) = 6.72 = 7 INTERVALOS DE CONFIANZA. Un intervalo de confianza es un intervalo estimador de un parámetro, cuyos extremos, el límite inferior (LI) y límite superior (LS) son funciones de la muestra, es decir depende solamente de valores muestrales.

GEOESTADISTICA-I

Página 8

Un intervalo de confianza del parámetro θ cierto grado de incertidumbre establecido. CUANDO LA VARIANZA POBLACIONAL

es un intervalo [LI , LS], que incluye al parámetro con

σ

2

ES CONOCIDA

Si x es la media de una muestra aleatoria de tamaño n obtenida de una población normal con varianza poblacional σ 2 conocida, entonces: Para tamaños de muestra >30

Ejercicio: La duración media de los neumáticos de un camión fue de veinte días. Se toma una muestra de cien neumáticos este año y se obtiene una media de dieciocho días con una desviación estándar de 8.1 días. Construir un intervalo de confianza para la duración media de los neumáticos del 99%. El tamaño muestral, n = 100, es grande (>30), Media = 20 días (población) Media = 18 días (muestra) Deviación estándar = 8.1 Con un nivel de confianza del 99%,  0.99/2 = 0.495 esta área se busca en la tabla el valor de Z Z =2.58 X ±Z Sn =18 ±2.58 8.1100=18 ±2.090 LS = 18 + 2.090 = 20.090 LI = 18 – 2.090 = 15.91 15.91 < µ < 20.090 Ejercicio: Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3. Solución: La estimación puntual de m es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto: n = 36 Concentración media = 2.6 Intervalos de confianza = ? de 95% y 99% Deviación estándar = 0.3 a). Con un nivel de confianza del 95%,  0.95/2 = 0.475 esta área se busca en la tabla el valor de Z Z =1.96 X ±Z Sn =2.6 ±1.96 0.336=2.6 ±0.098 LS = 2.6 + 0.098 = 2.698 LI = 2.6 – 0.098 = 2.502 2.502 < µ < 2.698 b). Para un nivel de confianza de 99% el valor de Z es de 2.58. GEOESTADISTICA-I Página 9

X ±Z Sn =2.6 ±2.58 0.336=2.6 ±0.129 LS = 2.6 + 0.129 = 2.729 LI = 2.6 – 0.129 = 2.471 2.471 < µ < 2.729 Como se puede observar en los resultados del ejercicio se tiene un error de estimación mayor cuando el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de confianza del 95%. Ejercicio: La prueba de corte sesgado es el procedimiento más aceptado para evaluar la calidad de una unión entre un material de reparación y su sustrato de concreto. El artículo “Testing the Bond Between Repair Materials and Concrete Substrate” informa que, en cierta investigación, se obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48 observaciones de resistencia al corte, y la desviación estándar muestral fue 3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al corte. Solución: Resistencia promedio = 17.17 N/mm2 n = 48 Desviación estándar = 3.28 N/mm2 Nivel de confianza = 95% Piden un intervalo de confianza unilateral. Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un solo lado como sigue:

Z = 1.96 X-Z Sn =17.17-1.96 3.2848=17.17-0.9279 LI = 16.242 Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está en el intervalo 16.242 < µ < ∞ CUANDO LA VARIANZA POBLACIONAL, σ 2 , SE DESCONOCE Si x es la media de una muestra aleatoria de tamaño n obtenida de una población normal con varianza poblacional σ 2 desconocida, entonces: Para muestras de menor tamaño. X ±t Sn para la media Ejercicio: Dadas las siguientes resistencias a la tensión: 28.7, 27.9, 29.2 y 26.5 psi, y con un nivel de confianza del 95% Estimar la media puntual X media = (28.7 + 27.9 + 29.2 + 26.5) / 4 = 112.3 / 4 = 28.075 S2 = ((28.7 – 28.08)2 + (27.9 – 28.08)2 + (29.2 – 28.08)2 + (26.5 – 28.08)2) / 4 = 4.1675 / 4 S2 = 1.041875 GEOESTADISTICA-I Página 10

S = 1.02 Estimar el intervalo de confianza para un nivel de confianza del 95% α = 1-0.95 = 0.05 y g.l. = (n – 1) = (4 – 1) 3 g.l.  t (0.05, 3 g.l.) a dos colas = 3.1824 X ±t Sn=28.075 ±3.1824 1.024=28.075±1.623 LS = 28.075 + 1.623 = 29.698 LI = 28.075 - 1.623 = 26.452 26.452 < µ < 29.698 Ejercicio: Se ha recogido una muestra aleatoria para prever la inflación en el ano, en siete países. Las previsiones han sido: 1.5 2.1 1.9 2.3 2.5 3.2 3.0 a). Utilizando estos datos, construye un intervalo de confianza al 99% para la media de la previsión de inflación, en estos siete países. Indica los supuestos que necesitas hacer b). Los expertos opinan que el intervalo de confianza calculado para la media es demasiado amplio, y desean que su longitud total sea de 1.0 puntos. Hallar el nivel de confianza para este nuevo intervalo. Solución: a). n = 7 Media de la muestra = (1.5 + 2.1 + 1.9 + 2.3 + 2.5 + 3.2 + 3.0) / 7 = 2.357 Desviación estándar de la muestra: S2=[(1.5-2.357)2+(2.1-2.357)2+(1.9-2.357)2+(2.3-2.357)2+(2.5-2.357)2+(3.2-2.357)2+(3.0-2.357)2] / 7 S2 = 0.30816  S = 0.555 Calculo de t para (n – 1) g.l. = (7-1) = 6 g.l. t ( 0.01, 6 g.l.) a dos colas = 3.7074 X ±t Sn=2.357 ±3.7074 0.5557=2.357±0.7777 LS = 2.357 + 0.7777 = 3.1347 LI = 2.357 – 0.7777 = 1.5793 1.5793 < µ < 3.1347 b). L = 1.0 L=2t Sn t= Ln2S=1.0 x 72 x 0.555=2.3836 El valor de t se ubica en la tabla en sentido contrario: Para 6 g.l. y un área de 2.3836 se tiene un alfa de ≈ 0.05 para una t = 2.4469 El nuevo nivel de confianza del nuevo intervalo es: 1 – 0.05 = 0.95 = 95% PARA ESTIMAR LA PROPORCIÓN DE UNA POBLACIONAL π BINOMIAL DE UNA POBLACIÓN

Si p es una proporción de una muestra aleatoria n (grande) obtenida de una población binomial con parámetro π , entonces:

GEOESTADISTICA-I

Página 11

Ejercicio: Se aplica un test que mide la actitud hacia la autoevaluación de su conducta y comportamiento hacia sus compañeros de trabajo, a una muestra aleatoria de trabajadores de la empresa “Gardilcic”. De un total de 364 trabajadores, 247 evidencian actitud positiva hacia la autoevaluación. Se solicita que estime la proporción de trabajadores de la empresa con actitud positiva hacia la autoevaluación de su conducta y comportamiento para un nivel de confianza del 90%. N = 364 n = 247 P = ni / N = 247 / 364 = 0.6786 Para una confianza del 90%  0.90/2 = 0.45 esta área se ubica en la tabla de Z, se tiene: Z = 1.65 p±Zp(1-p)n=0.6786±1.650.6786(1-0.6786)364=0.6786±0.040389 LS = 0.6786 + 0.040389 = 0.718989 LI = 0.6786 – 0.040389 = 0.638211

0.638211 < π < 0.718989 63.82% < π < 71.89%
Ejercicio: En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales. Solución: N = 300 n = 60 Confianza = 90% P= 60/300 = 0.20 Z0.90 = 1.65 p±Zp(1-p)n=0.2±1.650.2(1-0.2)300=0.2±0.0381 LS = 0.2 + 0.0381 LI = 0.2 – 0.0381

0.1619 < π < 0.2381 16.19% < π < 23.81%
TAMAÑO DE MUESTRA.

Ejemplo: Un biólogo quiere estimar el peso promedio de los sólidos contenidos en las muestras de agua contaminada de su localidad. Un estudio anterior de diez nuestras mostró que la desviación estándar de sus pesos es de 12.2 gramos. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 gramos? Solución: Z para 95% de confianza es: 0.95/2 = 0.475  esta área en la tabla de Z se tiene Z = 1.96 σ = 12.2 E=4
GEOESTADISTICA-I Página 12

n=Z . σE2=1.96 x 12.242= 35.736 = 36

Ejemplo: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. a). ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real? Solución: σ = 40
Confianza = 96% E = 10

Z para 96% de confianza es: 0.96/2 = 0.48  esta área en la tabla de Z se tiene Z = 2.06
n=Z . σE2=2.06 x 40102= 67.89 = 68

Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas. b). ¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?
n=Z . σE2=2.06 x 4052= 271.59 = 272

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta. c). Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se desea saber de que tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo. Solución: Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de corrección.
n= Z2σ2NE2N-1+σ2Z2=2.0624023001023001+4022.062=203692836689.76=55.5176=56

Si se tiene una población finita de 300 focos sólo se tiene que extraer de la población una muestra sin reemplazo de 56 focos para poder estimar la duración media de los focos restantes con un error máximo de 10 horas. Ejemplo: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02? Solución: P = 340 / 500 = 0.68 Confianza = 95% E = 0.02 Z para 95% de confianza es: 0.95/2 = 0.475  esta área en la tabla de Z se tiene Z = 1.96
n=p1-pZE2=0.681-0.681.960.022=2089.83=2090

Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
GEOESTADISTICA-I Página 13

Ejemplo: Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10? Solución: En este problema, se desconoce totalmente la proporción de residentes que conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p. Confianza = 95% E = 0.10 Z para 95% de confianza es: 0.95/2 = 0.475  esta área en la tabla de Z se tiene Z = 1.96
n=p1-pZE2=0.51-0.51.960.102=96.04=97

Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10
PRUEBAS DE HIPÓTESIS. PRUEBAS DE HIPÓTESIS PARA MUESTRAS GRANDES

Ejercicio: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de significancia del 0.04 Solución: 1. Supuestos Se trata de una distribución muestral de medias con desviación estándar conocida. Datos: µ=800 horas σ = 40 horas X = 788 horas n = 30 α = 0.04 Nivel de confianza = 96% 2. Ensayo de hipótesis H0: µ = 800 horas H1: µ ≠ 800 horas 3. Estadístico de contraste Z=X-μσ/n 4. Definir la región α = 1 – NC = 1 – 0.96 = 0.04; α/2 = 0.04/2 = 0.02 p = 0.96/2 = 0.48 Tabla de Distribución Normal  Z0.48 = 2.06 Contraste bilateral, luego

Z < −α z

/2

ó Z > zα

/2

= ± 2.06

GEOESTADISTICA-I

Página 14

Z = -2.06 5. Cálculo estadístico

µ=800

Z = +2.06

H0 se rechaza si z < - 2.06 ó z > 2.06 Z=X-μσ/n=788-80040/30=-127.30296=-1.643 6. La regla de decisión

Región de rechazo

Región de aceptación

Región de rechazo

- 2.06 Z calc < Z teor - 1.643 < 2.06

- 1.643 - 2.06 < - 1.643 < 2.06

+ 2.06

Como - 2.06 < - 1.643 < 2.06 por lo tanto, se acepta H0, y se concluye con un nivel de significancia del 0.04 que la duración media de los focos no ha cambiado. Ejercicio: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10 Solución: 1. Supuestos Se trata de una distribución muestral de proporciones. Datos: P= 0.70 n = 15 Tienen bombas = 8 Nivel de significancia α = 0.10 p = 8/15 = 0.5333 2. Ensayo de hipótesis GEOESTADISTICA-I Página 15

H0: P = 0.70 H1: P ≠ 0.70 3. Estadístico de contraste Z=p-PPqn 4. Definir la región Nivel de confianza = 1 – 0.1 = 0.9 = 90% α = 1 – NC = 1 – 0.90 = 0.1; α/2 = 0.1/2 = 0.05 p = 0.90/2 = 0.45 Tabla de Distribución Normal  Z0.45 = 1.65 Contraste bilateral, luego

Z < −α z

/2

ó Z > zα

/2

= ± 1.65

Z = -1.65 5. Cálculo estadístico

P=0.70

Z = +1.65

H0 se rechaza si z < - 1.65 ó z > 1.65 Z=p-PPqn=0.5333-0.700.70 x 0.3015=-1.40887 6. La regla de decisión

Región de rechazo

Región de aceptación

Región de rechazo

- 1.65 Z calc < Z teor - 1.41 < 1.65

- 1.41 - 1.65 < - 1.41 < 1.65

+ 1.65

Como - 1.65 < - 1.41 < 1.65 por lo tanto, se acepta H0, y se concluye con un nivel de significancia del 0.01 que la afirmación del constructor es cierta. Ejercicio: Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando α = 0.1. El fabricante de semiconductores toma una muestra aleatoria de 200 GEOESTADISTICA-I Página 16

dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso? Solución: 1. Supuestos Se trata de una distribución muestral de proporciones. Datos: P= 0.05 n = 200 Defectuosos = 4 Nivel de significancia α = 0.1 p = 4/200 = 0.02 2. Ensayo de hipótesis H0: P = 0.05 H1: P < 0.05 3. Estadístico de contraste Z=p-PPqn 4. Definir la región Nivel de confianza = 1 – 0.1 = 0.90 = 90% α = 1 – NC = 1 – 0.90 = 0.1; p = 0.90/2 = 0.45 Tabla de Distribución Normal  Z0.45 = 1.65 Contraste unilateral, luego

Z < zα  1.65 se rechaza H0 Z > zα  1.65 se acepta H0

Z = -1.65 H0 se rechaza si Z < - 1.65 5. Cálculo estadístico

P=0.05

Z=p-PPqn=0.02-0.050.05 x 0.95200=-1.9466 6. La regla de decisión

0.1

GEOESTADISTICA-I

Página 17

Región de rechazo

Región de aceptación

- 1.65 - 1.9466 < - 1.65 Z calc < Z teor - 1.95 < 1.65

+ 1.65

Como - 1.95 < - 1.65 por lo tanto, se rechaza H1, y se concluye con un nivel de significancia del 0.1 que la fracción de artículos defectuosos es menor que 0.05. Ejercicio: Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes electrónicos. La tensión de ruptura de ese plástico es un parámetro importante. Se sabe que σ1=σ2= 1.0 psi. De una muestra aleatoria de tamaño 10 y 12 para cada plástico respectivamente, se tiene una media de 162.5 para el plástico 1 y de 155 para el plástico 2. La compañía no adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a la del plástico 2 al menos por 10 psi. Con base a la información contenida en la muestra, ¿la compañía deberá utilizar el plástico 1? Utilice α = 0.05 para llegar a una decisión. Solución: 1. Supuestos Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida. Datos: Tensión de ruptura Plástico 1 Plástico 2 1.0 psi 1.0 psi 10 12 162.5 155.0 Tensión exceda al plástico 2 al menos por 10 psi

σi n X

α = 0.05
2. Ensayo de hipótesis H0: µ 1-µ H1: µ 1-µ
2

= 10 10

2>

Se desea rechazar Ho si la media del plástico 1 supera a la media del plástico 2 en por lo menos 10 psi. 3. Estadístico de contraste Z=(X1-X2)-(μ1-μ2)S12n1+S22n2 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; p = 0.95/2 = 0.475 GEOESTADISTICA-I Página 18

Tabla de Distribución Normal  Z0.475 = 1.96 Contraste unilateral, luego

Z > zα  1.96 se rechaza H0 Z < zα  1.96 se acepta H0

µ 1-µ
5. Cálculo estadístico

2

= 10

Z=1.96

H0 se rechaza si Z > 1.96 Z=(X1-X2)-(μ1-μ2)S12n1+S22n2=(162.5-155.0)-101210+1212=-5.8387 6. La regla de decisión

Región de aceptación

Región de rechazo

1.96 - 5.8387 < 1.96 Z calc < Z teor - 5.8387 < 1.96

+ 1.96

No existe evidencia suficiente para apoyar el uso del plástico 1 ya que – 5.8387 < 1.96 por lo tanto, se acepta H0. Ejercicio: Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de pulido en la fabricación de brocas saca testigos. Se pulen 300 brocas con la primera solución y, de éstos, 253 no presentaron defectos inducidos por el pulido. Después se pulen otras 300 brocas con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son diferentes? Utilice α = 0.01 Solución: 1. Supuestos Se trata de una distribución muestral de diferencia de proporciones. Datos: Solución de pulido Solución 1 Solución 2 300 300 253 196 Página 19

ni No defectos GEOESTADISTICA-I

p1= 253/300= 0.8433 p2 = 196/300= 0.6533 n1=n2 = 300

α = 0.01
2. Ensayo de hipótesis Ho: P1-P2 = 0 H1: P1-P2 ≠ 0 3. Estadístico de contraste Z=(p1-p2)Pq1n1+1n2 4. Definir la región Nivel de confianza = 1 – 0.01 = 0.99 = 99% α = 1 – NC = 1 – 0.99 = 0.01 α/2 = 0.01/2 = 0.005 p = 0.99/2 = 0.495 Tabla de Distribución Normal  Z0.495 = 2.58 Contraste bilateral, luego

Z < −α z

/2

ó Z > zα

/2

= ± 2.58

Z = -2.58 5. Cálculo estadístico

P1-P2=0.0

Z = +2.58

H0 se rechaza si z < - 2.58 ó z > 2.58 P=x1+x2n1+n2=253+196300+300=0.7483 Z=(p1-p2)Pq1n1+1n2=(0.8433-0.6533)0.7483(0.2517)1300+1300=5.3619 6. La regla de decisión

GEOESTADISTICA-I

Página 20

Región de rechazo - 2.58 Z calc > Z teor 5.36 > 2.58

Región de aceptación P1-P2=0.0

Región de rechazo + 2.58 5.36 5.36 > 2.58

Puesto que 5.36 > 2.58, se rechaza la hipótesis nula H0 y se concluye con un nivel de significancia de 0.01 que los dos fluidos para pulir son diferentes. PRUEBAS DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS. Ejercicio: Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada espécimen falla es la siguiente en MPa: 19.8 15.4 11.4 19.5 10.1 18.5 14.1 8.8 14.9 7.9 17.6 13.6 7.5 12.7 16.7 11.9 15.4 11.9 15.8 11.4 15.4 11.4

¿Sugieren los datos que la carga promedio de falla es mayor que 10 Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilícese α = 0.05. Calcule el valor de la Prueba de hipótesis. Solución: 1. Supuestos Datos: µ = 10 S = 3.4718 (calcular) X = 13.7136 (calcular) n = 22

α = 0.05
2. Ensayo de hipótesis 3. Ensayo de hipótesis Ho: µ = 10 H1: µ > 10 Se rechaza si Ho es mayor que 10 Mpa. 3. Estadístico de contraste t=X-μS/n 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; 1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad = (n-1) = (22-1) = 21 g.l. Tabla de Distribución t para una cola  t(10, 21) = 1.7207 GEOESTADISTICA-I Página 21

Contraste unilateral, luego t > tcal  1.7207 se rechaza H0 t < tcal  1.7207 se acepta H0

µ = 10 H0 se rechaza si t > 1.7207 5. Cálculo estadístico

t=1.7207

t=X-μS/n=13.7136-103.471822=5.017 6. La regla de decisión

Región de aceptación 1.7207 t calc > t teor 5.017 > 1.7207

Región de rechazo + 1.7207 5.017 > 1.7207

Como 5.017 > 1.7207 se rechaza H0 y se concluye con un nivel de significancia del 0.05 que la carga de falla promedio es mayor que 10 Mpa. Ejercicio: Para encontrar si un compuesto químico detiene el deterioro del puntal en el sostenimiento de la caída de roca, se seleccionan nueve puntales, todos preparados para su aplicación en el sostenimiento. Cinco puntales reciben el tratamiento y cuatro no. Los tiempos de duración en años, a partir del momento en que comienza el experimento son los siguientes: Con tratamiento 2.1 5.3 1.4 4.6 0.9 Sin tratamiento 1.9 0.5 2.8 3.1 ¿Se puede decir en el nivel de significancia del 0.05 que el compuesto químico es efectivo? Suponga que las dos poblaciones se distribuyen normalmente con varianzas iguales. Solución: 1. Supuestos Datos: GEOESTADISTICA-I Página 22

X Si n S12 = S22

Tratamiento de puntales con compuesto químico Con tratamiento Sin tratamiento 2.86 (calcular) 2.075 (calcular) 1.7625 (calcular) 1.011 (calcular) 5 4

Las poblaciones se distribuyen normalmente

α = 0.05
2. Ensayo de hipótesis Ho: µCT - µST = 0 H1: µCT - µST > 0 Se rechaza si Ho es mayor que 0 3. Estadístico de contraste t=(X1-X2)-(μ1-μ2)Sm1n1+1n2 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; 1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad = (n1 + n2 - 2) = (5 + 4 - 2) = 7 g.l. Tabla de Distribución t para una cola  t(10, 7) = 1.8946 Contraste unilateral, luego t > tcal  1.8946 se rechaza H0 t < tcal  1.8946 se acepta H0

µCT - µST = 0 H0 se rechaza si t > 1.8946 5. Cálculo estadístico

t = 1.8946

Sm2=n1-1S12+n2-1S22n1+n2-2=5-11.76252+4-11.01125+4-2=2.213
Sm = 1.4876

t=(X1-X2)-(μ1-μ2)Sm1n1+1n2=(2.86-2.075)-01.487615+14=0.7866 6. La regla de decisión

GEOESTADISTICA-I

Página 23

Región de aceptación 1.8946 0.7866 < 1.8946 t calc < t teor 0.7866 < 1.8946

Región de rechazo + 1.8946

Como 0.7866 < 1.8946 se acepta H0 y se concluye con un nivel de significancia del 0.05 que no existe suficiente evidencia para decir que el compuesto químico detiene el deterioro del puntal. Ejercicio: Dos proveedores fabrican un engranaje de acero utilizado en un equipo de bajo perfil. Una característica importante de estos engranajes es la resistencia al impacto la cual se mide en pies-libras. Una muestra aleatoria de 10 engranajes suministrados por el primer proveedor arroja los siguientes resultados: X1 = 321 y S1 = 12. Del segundo proveedor se toma una muestra aleatoria de 16 engranajes, donde los resultados son: X2 = 290 y S2 = 45. ¿Existe evidencia que apoye la afirmación de que los engranajes del proveedor 2 tienen una mayor resistencia promedio al impacto. Use un nivel de significancia de 0.05. Solución: 1. Supuestos Datos: Proveedor de engranajes Proveedor 1 Proveedor 2 321 290 12 45 10 16

X Si n

Las poblaciones se distribuyen normalmente Varianzas de las poblaciones desconocidas y diferentes

α = 0.05
2. Ensayo de hipótesis Ho: µ2 - µ1 = 0 H1: µ2 - µ1 > 0 Se rechaza si Ho es mayor que 0 3. Estadístico de contraste t=(X1-X2)-(μ1-μ2)S12n1+S22n2 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; GEOESTADISTICA-I Página 24

1/α = 1/0.05 = 20 para una cola = 20/2 = 10 Grados de libertad es igual a: v= S12n1+S22n22S12n12n1-1+S22n22n2-1=12210+45216212210210-1+452162161=18.2145 Grados de libertad v = 18 g.l. Tabla de Distribución t para una cola  t(10, 18) = 1.7341 Contraste unilateral, luego t > tcal  1.7341 se rechaza H0 t < tcal  1.7341 se acepta H0

µ2 - µ 1 = 0 H0 se rechaza si t > 1.7341 5. Cálculo estadístico

t = 1.7341

t=(X1-X2)-(μ1-μ2)S12n1+S22n2=(321-290)-012210+45216=2.611 6. La regla de decisión

Región de aceptación 1.7341 t calc > t teor 2.611 > 1.7341

Región de rechazo + 1.7341 2.611 > 1.7341

Como 2.611 > 1.7341 se rechaza H0 y se concluye con un nivel de significancia del 0.05, que existe suficiente evidencia para decir que el promedio de resistencia de los engranajes del proveedor 2 es mayor al promedio de resistencia de los engranajes del proveedor 1. Ejercicio: El rendimiento de los carros de transporte de mineral se ven afectadas por el sobre peso de los operadores, para ello diez hombres se sometieron a una dieta especial registrando sus pesos antes de comenzarla y después de un mes de estar en ella. Los resultados de los pesos, en libras, se muestran a continuación: GEOESTADISTICA-I Página 25

Hombre A B C D E F G H I J Antes 181 172 190 186 210 202 166 173 183 184 Después 178 175 185 184 207 201 160 168 180 189 Haga una prueba con a = 0.05 para determinar si la dieta logró alguna diferencia, ya sea positiva o negativa. Solución: 1. Supuestos Datos: Las muestras son independientes y no están relacionadas Muestras independientes pareadas o relacionadas Hombre A B C D E F G H I J Antes 181 172 190 186 210 202 166 173 183 184 Después 178 175 185 184 207 201 160 168 180 189 Diferencia 3 -3 5 2 3 1 6 5 3 -5 Promedio 2 Varianza 14.4 Desviación estándar 3.7947

α = 0.05
2. Ensayo de hipótesis Ho: µA - µD = 0 H1: µA - µD ≠ 0 Se rechaza si Ho es diferente que 0 3. Estadístico de contraste t=dSd/n 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; Grados de libertad es igual a: (n-1) = (10-1) = 9 g.l. Tabla de Distribución t para dos cola  t(0.05, 9) = 2.2622 Contraste bilateral, luego -2.2622 < tcal < 2.622  se acepta H0

t = 2.2622 5. Cálculo estadístico GEOESTADISTICA-I

µA-µD=0

t = 2.2622

H0 se rechaza si t > 2.2622

Página 26

t=dSd/n=23.794710=1.6667 6. La regla de decisión

Región de rechazo - 2.2622 t teor < t calc < t teor

Región de aceptación -2.2622 < 1.6667 < 2.622

Región de rechazo + 2.2622

-2.2622 < 1.6667 < 2.622 Como 1.6667 está entre los dos valores críticos de –2.2622 y 2.2622, por lo tanto no se rechaza H0, y se concluye con un α = 0.05 que no existe evidencia estadística que apoye la efectividad de la dieta para variar el peso. PRUEBA DE JI CUADRADO Y ANÁLISIS DE VARIANCIA La prueba de Ji cuadrado nos permite trabajar con más de dos proporciones y ANOVA (análisis de varianzas) nos permitirá probar si más de dos medias de poblaciones pueden considerarse iguales. Ejercicio: En un procesos de llenado, la tolerancia para el peso de los recipientes es de 8 gramos, para reunir este requisito la desviación estándar en el peso debe ser de 2 gramos, los pesos de 25 recipientes seleccionados al azar dieron como resultado una desviación estándar de 2.8 gramos; si los pesos se encuentran normalmente distribuidos, determinar si la varianza de esta muestra es diferente del valor necesario al 2.5% de nivel de significancia. Solución: 1. Supuestos Datos: Tolerancia = 8 gr. S1 = 2 gr. n = 25 S2 = 2.8 gr. S12 ≠ S22 = ?

α = 0.025
2. Ensayo de hipótesis Ho: σ2 = 22 = 4 H1: σ2 > 22 = 4 Se rechaza si Ho es mayor que 4 3. Estadístico de contraste X2=(n-1)S2σ02 GEOESTADISTICA-I Página 27

4. Definir la región Nivel de confianza = 1 – 0.025 = 0.975 = 97.5% α = 1 – NC = 1 – 0.975 = 0.025; Grados de libertad es igual a: (n-1) = (25-1) = 24 g.l. Tabla de X2 para una cola  t(0.025, 24) = 39.3641 Contraste unilateral, luego X2cal < 39.3641  se acepta H0

X2(0.025, 24) = 39.3641 H0 se rechaza si X2 > 39.3641 5. Cálculo estadístico X2=n-1S2σ02=25-12.8222=47.04 6. La regla de decisión

Región de aceptación < 39.3641 X2 calc > X2 teor 47.04 > 39.3641

Región de rechazo + 39.3641 47.04 > 39.3641

Como 47.04 está en la región de rechazo, por lo tanto se rechaza H0 σ2 = 4 y se acepta que σ2 > 4. Ejercicio: Un inversionista desea comparar los riesgos asociados con dos diferentes mercados A y B; el riesgo de un mercado se mide por la variación en los cambios diarios de precio. El inversionista piensa que el riesgo asociado con el mercado B es mayor que del mercado A. Se obtienen muestras aleatorias de precios de 21 días para el mercado A y de 17 días para el mercado B siendo estas las siguientes características: Comparación de riesgos de mercado Mercado A Mercado B 0.3 0.4 0.25 0.45 21 17 Página 28

X Si n

GEOESTADISTICA-I

Si se dispone que las muestras provienen de dos poblaciones normales e independientes a un nivel del 5% ¿encuentra apoyo la creencia del inversionista? Solución: 1. Supuestos Datos: Riesgo A > B σA > σB ?

α = 0.05
2. Ensayo de hipótesis Ho: σB2 = σA 2 Ho: σB2 > σA 2 Se rechaza Ho si el mercado A es mayor que el mercado B 3. Estadístico de contraste F=S12S22 >1 4. Definir la región Nivel de confianza = 1 – 0.05 = 0.95 = 95% α = 1 – NC = 1 – 0.95 = 0.05; Grados de libertad: Mercado A = (nA-1) = (21-1) = 20 g.l. Mercado B = (nB-1) = (17-1) = 16 g.l. Por la condición de la formula la relación de nB y nA Tabla de F para una cola  F(0.05; 16, 20) = 2.18 Contraste unilateral, luego Fcal < 2.18  se acepta H0

F(0.05; 16,20) = 2.18 H0 se rechaza si F > 2.18 5. Cálculo estadístico F=SB2SA2 = 0.4520.252=3.24 6. La regla de decisión

GEOESTADISTICA-I

Página 29

Región de aceptación < 2.18 F calc > F teor 3.24 > 2.18

Región de rechazo + 2.18 3.24 > 2.18

Como 3.24 está en la región de rechazo, por lo tanto se rechaza H0 σB2 = σA 2 y se acepta que σB2 > σA 2. REGRESIÓN LINEAL Y CORRELACIÓN Su propósito es determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X), del mismo modo el coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables. Ejemplo: El volumen de ahorro y la renta del sector familias en billones de ptas. constantes de 1.977, para el período 77-86 fueron: Año 77 78 79 80 81 82 83 84 85 86 Ahorro (X) 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0 Renta (Y) 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5

a). Recta de regresión del ahorro sobre la renta. b). Recta de regresión de la renta sobre el ahorro. c). Para el año 87 se supone una renta de 24.1 billones de ptas. ¿Cuál será el ahorro esperado para el año 87? d). Cual es el grado de relación entre el ahorro y la renta. Solución: a). Recta de regresión del ahorro sobre la renta. Año 77 78 79 80 Ahorro (X) 1.9 1.8 2 2.1 Renta (Y) 20.5 20.8 21.2 21.7 X2 3.61 3.24 4 4.41 Y2 420.25 432.64 449.44 470.89 Página 30 XY 38.95 37.44 42.4 45.57

GEOESTADISTICA-I

81 82 83 84 85 86 ∑

1.9 2 2.2 2.3 2.7 3 21.9

22.1 22.3 22.2 22.6 23.1 23.5 220

3.61 4 4.84 5.29 7.29 9 49.29

488.41 497.29 492.84 510.76 533.61 552.25 4848.38

41.99 44.6 48.84 51.98 62.37 70.5 484.64

b=nXY-XYnX2-X2=10484.64-21.9(220)1049.29-(21.9)2=2.1369 a=Yn-bXn=22010-2.136921.910=17.32 Y = a + bX Y = 17.32 + 2.1369X b). Recta de regresión de la renta sobre el ahorro. c). Para el año 87 se supone una renta de 24.1 billones de ptas. ¿Cuál será el ahorro esperado para el año 87? Y = 17.32 + 2.1369X 24.1 = 17.32 + 2.1369 X X = (24.1 – 17.32) / 2.1369 = 3.1728 d). Cual es el grado de relación entre: Sxy = n∑XY - ∑X∑Y = 28.4 Sx = n∑X2 – (∑X)2 = 13.29 Sy = n∑Y2 – (∑Y)2 = 83.8

r=SxySx Sy=28.413.29 x 83.8=0.851
r = 0.851 se le considera como excelente

r2 = 0.7242 = 72.42 explica la renta sobre el ahorro
Ejemplo: Las siguientes cifras son mediciones de la velocidad del aire y del coeficiente de evaporación de gotitas de combustible en la cámara de combustión de un motor de impulsión: Nuestra 1 2 3 4 5 6 7 8 9 10 GEOESTADISTICA-I Velocidad del aire (cm/s) (X) 20 60 100 140 180 220 260 300 340 380 Página 31 Coeficiente de evaporación (mm2/s) (Y) 0.18 0.37 0.35 0.78 0.56 0.75 1.18 1.36 1.17 1.65

Solución:
Nuestra 1 2 3 4 5 6 7 8 9 10 Suma Prom. Velocidad del aire (cm/s) (X) 20 60 100 140 180 220 260 300 340 380 2000 200 Coeficiente de evaporación (mm2/s) (Y) 0.18 0.37 0.35 0.78 0.56 0.75 1.18 1.36 1.17 1.65 8.35 0.835 X2 400 3600 10000 19600 32400 48400 67600 90000 11560 0 14440 0 53200 0 Y2 0.03 24 0.13 69 0.12 25 0.60 84 0.31 36 0.56 25 1.39 24 1.84 96 1.36 89 2.72 25 9.10 97 XY 3.6 22.2 35 109.2 100.8 165 306.8 408 397.8 627 2175. 4 217.5 4

Sxy = n∑XY - ∑X∑Y = 5054 Sxx = n∑X2 – (∑X)2 = 1320000 Syy = n∑Y2 – (∑Y)2 = 21.3745

b=SxySxx=50541320000=0.003829
a=y-bx=0.835-0.003829200=0.0692

Y = 0.0692 + 0.003829X
r=SxySx Sy=50541320000 x 21.3745=0.95

r = excelente r2 = 0.9053 = 90.53% la velocidad explica al coeficiente.

GEOESTADISTICA-I

Página 32

Sign up to vote on this title
UsefulNot useful