You are on page 1of 93
390 Estadistica 9.3 Estimacién de parametros por intervalos 9.3.1 Intervalo de confianza Una estimacién de punto no nos dice cudn préximo esta la estimacién al pardmetro que se estima, por lo tanto, no es muy significativa, sin no se ticne alguna medida del error que se comete en la estimacién. Es deseable pues tener cierto grado de confianza de que ta estimacién de punto se halle dentro de cierta variacién La estimacién por intervalo (propuesto por J. Neyman en 1937), es la estimacién de un parémetro @ dentro de un intervalo de extremos cerrados [a,b], donde los ntimeros a y b se obtienen a partir de la distribucién de la estadistica que estima puntualmente el parémetro; y a partir de los valores de la muestra Sea X,,X2...X, una muestra aleatoria de tamafio n escogida de una poblacién fix, 0), cuyos valores experimentales (o datos) respectivos son Xy.Xaue%y~ Sea ademds, la variable aleatoria ©=H(X,,X>....X,) una estadfstica para estimar el parémetro @ cuya distribucién de probabilidad sea conocida. Si dado el nimero 1—a, y sia partir de la distribucién de © se pueden encontrar las variables aleatorias = A=H(XyX2e0Xq)s B=H(X,,X..,X,) tales que: P[A<0 2). Si la poblacién no es normal, pero tiene media 1 y varianza o° finitas. entonces, siempre que el tamafio n de la muestra sea suficientemente grande. (n2 30), por el teorema del limite central, ta distribucion de X es aproximadamente normal N(qu, o° /n). Por tanto, segiin sea el caso, la distribucin de la variable aleatoria: X-p Z o/vn es exactamente (0 aproximadamente) normal N(O,1). Luego, dado el valor 1-a (o en %), en la distribuci6n de Z, se pueden determinar los valores #2, g/2 (figura 9.1) tales que: Plz SZ S$ z-enl=1-o. Sustituyendo Z =(X —p)o/Vn, se tiene, De donde resulta, PIAS sB)= donde A=X-zg20/V¥n y B=X+%g26/Vn son variables aleatorias Esto es, si X es estimador de 1, se tiene la probabilidad 1—c de que el intervalo (aleatorio 0 estimador) (A, B] contenga al parémetro y. Luego, Estimacién de pardmetros 393 Si ¥ es el valor de la media X para una muestra aleatoria de tamajio n escogida de una poblacién con varianza 6? supuesta conocida, el intervalo de confianza del (1a) x100% para 1 es: 7 o Z o Pape a El valor z,_g/2 se busca en la tabla normal N(0,1), tal que P[Z < Z,-ap]=1-a/2. gop ofvn y b=*+%y.0/Vn son los limites de confianza de 1, inferior y superior, respectivamente. La ilustraci6n, es la figura 9.1, en la que los valores a a a, Se Fran a ¥ 4 | imtervalodep | ¥ Figura 9.1: Intervalo de estimaci6n para 1 (con estadistica Z.) Interpretacién. Si se seleccionan _repetidamente 100 muestras de tamaiio n, y calculamos las medias de cada una de ellas, tendremos 100 intervals semejantes al intervalo [a,b], y se confia que 95 de estos 100 intervalos contengan cl pardmetro 1. y 5 de los 100 no lo contengan como se muestra en la figura 9.1b. Los puntos circulares en el centro de cada intervalo indican la estimacién puntual de p. Notar que todos los intervalos son del mismo ancho, ya que este dltimo solo depende de z)-¢/2 una vez que se determina ¥. En la figura 9.1b los intervalos correspondientes a las medias %; ,%, no contienen al parémetro 1, mientras que cl resto de los intervalos si contienen al pardmetro. 304 Estadistica . muestra 1 — + mestra2 + muestra 3 ! muestra 4 : muestra S 7 ruestra 6 : muestra 7 Fig. 9.16 NOTA. (Poblacién finita, muestreo sin reemplazo) Si la muestra aleatoria de tamafio n es escogida sin reposicién de una poblaci6n finita de tamano N, entonces, sin 30, la variable aleatoria: tiene distribuci6n aproximadamente normal N(0.1). Utilizando la distribuci6n de Z* se determina el intervalo de confianza de 1. Luego, si ¥ es un valor de la media X para una muestra aleatoria de tamafio n escogida de una poblacién finita de tamafio N con varianza o” supuesta conocida, el intervalo de confianza del (I—c)x100% para pes: = s *-2op - NOTA. (Error esténdar) Se denomina error estindar de un estimador a la desviacién estandar del estimador. A su valor numérico se denomina error estindar estimado. Por ejemplo, el error estandar (E.S.) de la media de una muestra de una poblacién infinita (0 poblaci6n finita con sustitucién) es s o Estimacién de pardmetros 395 Si la poblacién es finita de tamafio Ny el muestreo es sin reposicién el error estandar (E.S.) de la media muestral es: s vn Luego, el intervalo de confianza del (1-1) x 100% para se puede obtener a partir de los limites de tolerancia o confianza: N FF 2 gnES. EJEMPLO 9.7, Una muestra aleatoria de 100 hogares de una ciudad indica que el_promedio de los ingresos mensuales es de $500. Encuentre un intervalo de confianza del 95% para la media poblacional de los ingresos de todos los hogares de esa ciudad Suponga o = $100. SOLUCION. Sea X el ingreso familiar mensual de esa ciudad, cuyo promedio 1 se quiere estimar a partir de una muestra aleatoria de tamafio n= 100. La estimacién puntual de 1 es ¥=500. Para el nivel de confianza 1-0 =0.95, en la tabla normal estdndar se encuentra: %_g/2 = Zo975 = 1.96. I oe vn 100 El error estandar de lamedia X es oy 10. Los Ifmites de tolerancia de 1 son: EF % g2Gz =500 F 1.96(10) =500 F 19.6 Luego. el intervalo de confianza del 95% para 1 es: (480.4, 519.6] Esto es, se tiene una confianza del 95% que el promedio del ingreso familiar 1 de esa ciudad, est en el intervalo [$480.4, $519.6]. NOTA. Muestras diferentes dardn diferentes valores de ¥, y por tanto dardn diferentes intervalos de estimacién de 1. Decir que el intervalo de estimacién contiene al pardmetro con confianza 95%, equivale a decir que 95 por 100 de los intervalos contienen ala media 1 y que s6lo el'5 por 100 no lo contienen. EJEMPLO 9.8. Un analista de investigacién de mercados escoge una muestra alcatoria de 100 clientes de un conjunto de 500 clientes de una gran tienda que declararan ingresos mayores a $5,000. El encuentra que los clientes de la muestra gastaron en la tienda 396 Estadistica un promedio de $2500. Si con este valor de la muestra se estima que el gasto promedio de 1a poblacién finita varia de 2446 a 2554, ;qué nivel de confianza se utiliz6?. Suponga que la desviacién estandar de la poblacién es 6 = $300. SOLUCION. El intervalo de confianza del | - a en % para la media yp, €s la expresidn: De He [2446, 2554], se obtiene 2554 = 2,500 + 2)_g 2 (26.8597). Luego, Z-a/2= 2.01, a = 0.0444, 1-a =0.9556. NOTA. (Error de estimacién) Si ¥ estima a ji, entonces, el error de la estimacién es el valor numérico [=n] (ver figura que sigue). ee a a a BL b A=F-Aenty Y b=F+AapS~ El valor mfnimo del error de estimaciGn es igual a cero, esto ocurre, cuando ¥ estima exactamente a [1. El valor méximo del error de estimacién es igual a zg. ya que del intervalo de estimaci6n de jt resulta: fF-H]s zapox- Luego, Si X estima ap, entonces, s del (1—ct)x100% de que el error naci6n no ser Gz es el error estindar de la Estimacién de parémetros 397 Por ejemplo, en cl ejemplo 9.7 se tiene una confianza del 95% de que al estimar 1 por $500 el error de la estimacién no sera superior a $19.6. Mientras que en el ejemplo 9,8 se tiene una confianza del 95.56% de que al estimar }L como $2500 el error de la estimacién no seré superior a $54. NOTA. (Taman de la muestra). Se puede determinar que tan grande debe ser el tamafio de la muestra, n, de manera que sip! se¢ estima por ¥, el error de estimacién no sea mayor que un valor dado ¢. Encfecto, el valor de n se obtiene de AapFz Se Entonces, Si ¥ estima a 1, entonces, se tiene una confianza del (1—o.)x100% de que el error no ser mayor que el valor dado ¢ cuando el tamafio de la muestra sea _ repo)? ad 2 e Si la poblaci6n es finita de tamaiio Ny el muestreo es sin sustituciGn, el error (lta low —n(N=1) y el valor de n se calcula por: ano? N N=1) estindar es oz ps apes Bap + Por ejemplo: a) Enel ejemplo 9.7, se tiene una confianza del 95% de que al estimar la media de la poblaci6n, el error de la estimacién no sera mayor de $18 cuando el tamafio n de la muestra es: (Z.a29)” _ (1.96)?(100)? e (1g) 18.5679 =119. b) En el ejemplo 9.8, se tiene una confianza del 97% de que al estimar la media de la poblacién, el error de la estimaci6n no seré mayor de $50 cuando el tamano n de la muestra es: HapoN ——___(2.17)?(300)7(500) ———— lsees. Gaps? +e™(N=1) (2.17)(300)? +(50)? (500-1) n= 398 Estadistica NOTA. (Estimaci6n del total de la poblacién) Si la muestra aleatoria de tamaiio n, se escoge de una poblacién finita de tamafio N, entonces, » total de la poblacién: ° X, = Np i La estimacién puntual del total Nu es NE El intervalo de confianza del ( (1 — o)100% ) para p es: F~ Zaz SUSE + 2g Fz Luego, el intervalo de confianza del ( (1— @)100% ) para Nu es: N(X~ 29/28) SNPS N(X + 2@20x)- donde og =(6/vn\V—m[(N=1) esl error esténdar Para dar un ejemplo, en el ejemplo 9.8, Ia estimacién puntual del total de gastos de la poblacién Nyt es Nx =500($2500) = $1.250.000 Ademéas, los limites de confianza al 95% para el total Nu son: N(XF 21 g/28 x ) = 500( 2500 F 1.96 26.8597) = 1.250,000F 26322.506 Luego, Np €[1,223,677.494, 1,276,322.506] con confianza 95%. Consecuentemente, si el total de la poblacién Nj se estima en $1,250,000. se tiene una confianza del 95% de que cl error de la estimaci6n no sera superior a $26322.506. 9.4.2 Intervalo de confianza para la media |: Varianza 6? supuesta desconocida A) Poblacién no normal Si la poblacién no es normal pero el tamaiio de la muestra es suficientemente grande (230), se utiliza la desviacién estindar $ de la muestra, como estimacién puntual de la desviacién estindar 6 de la poblaciGn. Entonces, utilizando Estimacién de pardmetros 399 el teorema central del limite, se concluye que el intervalo de confianza del (1~a)x100% para es aproximadamente: F- Zan Oz SHSE+2-opSz- donde, el error estindar oz =o/Vn se sustituye por el error esténdar estimado 6 =8/Vni si el muestreo es con o sin sustitucién en una poblacién infinita (con sustitucién en una poblacién finita de tamafio N), y se sustituye por 6; =(/vh) ov —n(N—1) si el muestreo es sin sustitucién en una poblacién finita de tamafio N. B) Poblacién normal Sea X,,Xoy0X, una muestra aleatoria de tamafio n escogida de una poblacién normal (07) donde la varianza o” es supuesta desconocida y sean Ja media y la varianza muestrales respectivas: > De -x" x w olvn” tienen distribuciones respectivas, normal N(0,1) y_chi-cuadrado con n—1 grados de libertad . Ademas Z y V son variables aleatorias independientes. Entonces, la variable aleatoria: Z _X-n as vn tiene distribucién t-student con n—1 grados de libertad, esto es, T ~ t(n - 1). Por tanto, dado el niimero 1~o., en la distribucién de probabilidad de T se encuentran los ntimeros +Hygj2.n-1 (Figura 9.2) tales que: Ptapant ST Strap nt)=1- a 400 Estadistica Al sustituir la expresi6n de T se obtiene: heen Xan Stap2.n- H Sn . PUX teagan S/n Sis X +tyapa.na §/Vn]=1-c. Luego, Si ¥ y § son la media y Ia desviaci6n estandar respectivamente para un valor Particular 2,,.,,..%% de la muestra aleatoria de tamafio n escogida de la poblacién normal con varianza o” desconocida, entonces, cl intervalo de confianza de (1—c.) x 100% para ft es Fa teapans In spsk+ta ns s/vn El valor fy-qy2,n-1 S€ encuentra en la tabla t-student con n—1 grados de libertad tal que PIT $t-gj2.n11=1-a/2. La ilustracién es la figura 9.2, donde, a=F—tganisfVn y b=F+h eran ifn son los limites de confianza de j inferior y superior respectivamente A, a, Fane 0 fami x a x b | intervalodep | Figura 9.2: Intervalo de estimacién para 1 (con estadistica 1). EJEMPLO 9.9. Los contenidos de una muestra aleatoria de 5 latas de café instanténeo de un productor han dado los siguientes pesos netos en gramos: 280, 290, 285, 275, 284. Estimacién de parimetros 401 a) Encuentre un intervalo de confianza del 95% para la media de los contenidos de todas las latas de café del productor. b) {Con que grado de confianza se estima que el contenido promedio de café tenga Jos limites de confianza 277.432 y 288.1687. Suponga una distribucién normal. SOLUCION. a) Sea X el peso de los contenidos de café por lata.. cuyo promedio . se quiere estimar a partir de una muestra aleatoria de tamafio n=5.. Se supone que la distribucién de X es normal con desviacidn esténdar 6 no conocida. Para 1-a =0.95 y n-1=4 de libertad en la tabla t-student se encuentra f1-a/2.n-1 = !0975.4 = 2.716. De la muestra se obtiene X=2828 y #=5.63. El error estandar de la media X es §/V5 =5.63/2.236=2.518. Los limites de tolerancia inferior y superior para ft son: FF tons ifvn = 282.8 2.776x 2.518 = 282.8 F 6.99 Luego, el intervalo de confianza del 95% para }t_ es: (275.81, 289.79] b) 1 €[277.432, 288.168] con confianza Io. . La tolerancia superior es: Katy gpa nea S/n = 2828-40 ayr4 X 2.518 = 288.168 de donde resulta: fa/24 = 2.132, 1-a/2=0.95,a=0.10 y 1~a=0.90. 9.5 Intervalo de confianza para la varianza Sea X,,X2..Xm una muestra aleatoria de tamafio n, escogida de una poblacién normal con varianza 6”, pardmetro desconocido. 2 Un estimador puntual de la varianza o° es la varianza muestral be -#F §? = ____ n-t cuyo valor $? es la estimacién puntual de 6? 402 Estadistica Para determinar el intervalo de confianza para la varianza_o? la estadistica: se puede utilizar cuya distribucién es chi-cuadrado con n—1 grados de libertad, esto es. X ~x2(n-1) para n22. Dado el grado de confianza 1a, en la distribucién y7(n—1) se pueden encontrar los valores X2/2.n-1 Y Xi-o/2.n-1 tales que (figura 9.3). Plant SX SXigrnil=t-o 0 Kar. mt Korn Figura. 9.3 Intervalo de confianza de la varianza 6” Sustituyendo X =(n—1)S?/o? resulta: (n=? © ec Xref 1 Xen. nal Luego, si §? es Ja varianza de una muesira aleatoria de tamafio n seleccionada de ODE ogg MDE ae eae Los valores, %2/2..-1 Y Xica/2.n-1 S€ hallan en la tabla chi-cuadrado con n—1 grados de libertad y con areas acumuladas respectivas de a/2 y 1—a/2. Estimacién de parimetros 403 EJEMPLO 9.10. Una méquina produce piezas metilicas en forma cilfndrica. Para estimar la variabilidad de los didmetros, se toma una muestra aleatoria de 10 piezas producidas por la maquina encontrando los siguientes didmetros en centimetros: 10.1, 9.7, 10.3, 10.4, 9.9, 9.8, 9.9, 10.1, 10.3, 9.9. Encuentre un intervalo de confianza del 95% para la varianza de los didmetros de todas las piezas producidos por la mdquina. Suponga que los didmetros de las piezas se distribuyen segin la normal. SOLUCION. Con 0 =0.05,n=10 y r=n se encuentran: 9 grados de libertad, en la tabla chi-cuadrado Kepner = 6025.9 = 270 Y Xrasnn-t = Xas1s.9 = 19.02. De los datos de la muestra resulta §? = 0.056. Los Ifmites de confianza inferior y superior del 95% para la varianza G” son respectivamente: (n= 18? _ 90.056) _ woes 1s? _ (9)(0.056) oan Xan. mt 19.02 Xap. nd 2.70 Por lo tanto, el intervalo de confianza del 95% para la varianza 0” es: 0.0265 <” Observar que. el intervalo de confianza del 95% para la desviacién estandar o es: 0.1628 <0 < 0.432. 9.6 Intervalo de confianza para la raz6n de dos varianzas Sean S? y $2 tas varianzas de dos muestras aleatorias independientes de tamafios m yn seleccionadas de dos poblaciones normales respectivas con varianzas 0? y o2. Un estimador puntual de la raz6n_ de las varianzas 67/63 es la estadistica 57/83 404 Estadistica Para determinar el intervalo de confianza de o?/o} se puede utilizar la estadistica F definida por: psilsi 83/03 que tiene distribucién de probabilidad F con grados de libertad =m -1 y r= 1-1.Estoes, F~ F(r,r). En efecto, las variables aleatorias: tienen distribuciones respectivas chi-cuadrado con n-1 y n,—1 grados de libertad. Entonces, la variable aleatos lita Mi. Uf, -) §3/63 tiene distribucién F con grados de libertad =n, —1 y m=z —1 Observar que para obtener tal estadistica F , no se requiere asumir que las dos poblaciones tengan igual promedi Dado el grado de confianza 1—c, en la distribucién F ~ F(r,.r),) se pueden encontrar los valores fayo.4., Y i-a/2.n.n (figura 9.4) tales que: Plfaprnn SF S frepnn fa . Sass Figura. 9.4. Intervalo de confianza de la varianza 0? /o? Estimacién de parémetros 405 Sustituyendo F =($?/a?)/($?/03) y dado que: 1 ——— ¥ fare Fi-citan pales Fopr.n.n resulta, Luego, Si 5? y $3 son fas varianzas de dos muestras aleatorias independientes de lamafios nm y "2 seleccionadas respectivamente de dos poblaciones normales, entonces, el intervalo de confianza de (I a) x100% para o?/o3 es: EJEMPLO 9.11. Se quiere comparar la variabilidad de todas las ventas mensuales de una compaiifa A con la Variabilidad de su competidora la compaiiia B. Se sabe que todas las ventas de A y de B se distribuyen normalmente. Se han tomado dos muestras aleatorias de ventas; una de 8 meses de A y otra de 6 meses de B_obteniéndose las siguientes ventas: Muestra de A: 17, 23, 21, 18, 22, 20, 21, 19. Muestra de B: 13, 16, 14, 12, 15, 14. Mediante un intervalo de confianza del 95% para o?/c3 . {Se puede concluir que son iguales las varianzas de todas las ventas de las compaiifas A y B?. SOLUCION. Sean X, Y las variables aleatorias que representan las ventas de Ay de B respectivamente. Se supone que las distribuciones de X, ¥ son normales. Con @=0.05, y grados de libertad 4 =n, -1=7 y =m tabla F se encuentran: Sen la Fi-afan.n = 0915.15 = 6-85, ¥. frajz.n.n = fo97s.s2 =5.29, entonces, foy2.nin = WV fr-altn.n =Yfosrs.1s =Y6.85=0.146 De los datos de la muestra resultan $2 =4.13 y 53 =2. 406 Estadistica Los Iimites de confianza del 95% para o?/o3 inferior y superior son respectivamente: 32 Ei _ 4.13 _ Fe Satan. =~ O-146) = 0.30149. % (5.29) = 10.9239. Ag, 32 Sian. 2 n Por lo tanto, el intervalo de confianza del 95% para la varianza of /o3 es: 0.30149 <6? /o3 < 10.9239. Dado que el cociente o?7/63 =1¢[0.30149, 10.9239], se’ concluye que no hay diferencias significativas entre las varianzas de todas las ventas de A y B 9.7 Intervalo de confianza para la diferencia entre dos medias 9.7.1 Intervalo de confianza para la diferencia entre dos medias: Varianzas o} y 6; supuestas conocidas Sean X,; y X> las medias de dos muestras aleatorias independientes de tamafios m, y mz seleccionadas respectivamente de dos poblaciones con medias Hy Y M2 y varianzas a} y 63 supuestas conocidas. Un estimador puntual de la diferencia de medias p1,—p2 es Ia estadistica X,-X, cuyo valor X,—X, es laestimacién puntual. Si las dos poblaciones son normales, entonces, X, y X» tienen distribuciones respectivas normal N(j,07/m) y N(112,03/n2) (para n, 22, y my >2). En consecuencia, la estadistica. X,-X, tiene distribucién normal N(y - 2.67 /m +.03/n2). Esumacién de pardmerros 407 Si las dos poblaciones no son normales pero n, y nz son suficientemente grandes (7,230 yn, 230), entonces, la estadistica X,-X, es aproximadamente normal N(uy - 112,07 /m +03 /np). Por tanto, segiin sea el caso, a variable aleatoria: Yo? /n, +03]. tiene distribucién exactamente 0 aproximadamente normal N(0.1). han 0 Zan Xi x a. 5% 5 | intervalo de p,-H, | Figura 9.5: Intervalo de estimacién de 1, - 4 Dado el grado de confianza 1 — a, en la distribucién de Z se puede encontrar el valor Zo = Z-g/2 talque Pl-zp $Z< zq]=1-a. (fig. 9.5) Sustituyendo Z=(X,-X> yo ¥,-x, donde o y operando, resulta, PX, ~X1)-2903, Luego, % ¥ % son las medias que resultan de dos muestras independientes de tamavios ny y nz escogidas respectivamente de dos poblaciones con varianzas 0? y 3 Supuestas conocidas, entonces, el intervalo de confianza del (1-a)l00% de Hy ~ He es: G -%)-zo ot /m +03] St ~ 2 SG ~%)+ color /m + 03/my 408 Estadistica El valor z= Z1-j se obtiene de la tabla normal M(O,1) de manera que PIZ Sz g2l=1-o/2 . La ilustraciGn es la figura 9.5, donde, a=(%-¥)-zoyot/m, +03], y b= (%—%)+ 2907 /n, +0 son los limites de confianza de [, ~ j1p.. inferior y superior respectivamente EJEMPLO 9.12. Un agente de compras de una compaiifa esté tratando de decidir si comparar la marca A 0 la maraca B de cierto tipo de focos ahorradores de energia. Para estimar Ja diferencia entre las dos marcas se leva a cabo un experimento con dos muestras aleatorias independientes de 10 focos de cada marca resultando las medias de vida 1itil respectivas de 1,230 horas y 1,190 horas Estimar la verdadera diferencia de las dos medias de vida «til, mediante un intervalo de confianza del 95%. ;Es acertada la decisién del agente si adquiere cualquiera de las dos marcas? Suponga que las dos poblaciones tienen distribucién normal con desviaciones estindares respectivas de 120 y 60 horas, SOLUCION. Laestimacién puntual de 1; —12 es la diferencia de las medias muestrales 5 ~¥, =1230-1190=40. 7 z fay 20s, MOONE odes toy Fd Para el grado de confianza del 95% se encuentra Zo = z, Error esténdar : -a/2 = Zoas = 1.96 Los Ifmites de confianza inferior y superior respectivamente de 1, ~ 1, son Luego, el intervalo de confianza aproximado del 95% para 1, —}1) es SF = 40 F 1.96(42.43) = 40 F 83.1628, Xp) F 26: ~43.16 las poblaciones de porcentajes de granos quebrados por kilo. Se supone que las poblaciones son normales con varianzas desconocidas supuestas iguales De las muestras (utilizando el paquete MCEST) se obtiene: ny =10, %) =7:3, 1.49, 9(1.35)? + 9(1.49)? 10+10-2 = 2.0213. El error estandar de la diferencia de medias es: eR — 52, SE _ [20213 , 2.0213 _ 9 oacg my 10 10 : .95 y 18 grados de libertad se halla: fq.975.13 = 2.101 Los limites de confianza inferior y superior del 95% para 1 — 14, Son: Para l-a (ey -¥ 1) Fly ay2.nyony-20%-%, = (73-54) F 2.101(0.6358) = 1.9F 1.336. Luego, el intervalo de confianza del 95% para [1 — Hy es 0.564

las variables aleatorias que representan los tiempos empleados por los hombres y las mujeres respectivamente. De las muestras dadas (utilizando el paquete MCEST) se obtiene: ny, =9, ¥ = 21.111, 5, =7.4237, ny =8, ¥) =17.625, 8, = 2.326. La diferencia de las medias muestrales es 5 —¥, = 21.111 17.625 =3.486. El error estandar de la diferencia de medias es SE fc7.ay? | (2.33) _ 6 5 9 8 ” El ntimero de grados de libertad es __ [razr +3 anil lasa7/sh 9-1 8-1 Para 1a =0.95 y r=10 grados de libertad se tiene 19 975, 9 = 2.228 Los limites de confianza inferior y superior aproximados de 1, ~ p12 son (%) F f-cyo.,85,-2, = 3.486 F 2228%2.61= 3.486 F 5.815. Luego, el intervalo de confianza del 95 por 100 para 41, — > es 2.329 p>. Estimacién de pardmetros 417 9.9 Intervalo de confianza para una proporcién Sea X,,X2..X, una muestra aleatoria de tamafio n escogida de una poblacién de Bernoullf B(1, p). cuyo pardmetro pes) lal proporci6n de éxitos en la poblacién. En la muestra cada Xj = 1, si hay éxito con probabilidad p, y cada _X,=0, sino hay éxito con probabilidad | ~ p. El estimador puntual del parémetro p es la estadistica P, proporcidn de éxitos MTA MUESTFA definida por: me x donde la variable aleatoria X = J"" X, es el niimero de éxitos en la muestra y cuya distribucién es Binomial B(n, p). El valor P=x/n que se obtiene de P para una muestra especifica, es la estimacién puntual del pardmetro p. Laestadistica P tiene: media bp y varianza 6} =Var(P)= p(l—p)/n, Ademés, si el tamafio n de la muestra, es suficientemente grande (n> 30), por el teorema central del limite, la distribucién de probabilidad de Ia proporcién muestral P es aproximadamente Ia normal, con media p, varianza p(1 — p)/n. Luego, Ia variable aleatoria estandarizada tiene distribucién aproximadamente N(0,1). Se puede usar la distribucién de Z para determinar un intervalo de confianza del pardmetro p. Dado el grado de confianza 1- a, podemos encontrar en Ia distribucin de Z el valor za tal que (figura9.7) Pl-z-2 $ZSzp]=1-0.. Sustituyendo la expresién de Z resulta: 4 Estadistica Elerror estindar o = yp(— p)/n_ se estima por 6; = Jp — p/n Luego, Si es la proporcién de éxitos en una muestra aleatoria de tamaiio n, entonces, el intervalo de confianza del (l= c2)x100% para p es: < a ma PP) P~A-oay ie i 5 PSP titepyo El valor 2, gj: se halla en la tabla normal N(0,1), de manera que PIZ $ 2-g2)=1-0/2. La ilustraci6n es la figura 9.7, donde a=P-2epVPd~P)/n y b=P+2%-onVPU-p)/n son los limites de confianza de p, inferior y superior respectivamente. Zz er 0 Zen = a BP 6 a | intervalodep | Figura 9.7: Intervalo de estimacién del (1 0.) x 100% para p EJEMPLO 9.16. Una encuestadora utiliz6 una muestra aleatoria de 600 electores que acaban de votar y encontré que 240 votaron a favor del candidato A. Estimacién de parametros 419. a) Estimar el porcentaje de electores a favor de A en toda la poblacién, utilizando un intervalo de confianza del 95%. b) Si la proporcién a favor del candidato A se estima en 40%, {cuanto es el error maximo de la estimaci6n, si se quiere tener una confianza del 98%? ©) Sicon la misma muestra la proporci6n a favor de B se estima en 38% con una confianza del 98% que el error no es mayor a 4.62%, Se puede proclamar a A como ganador de las elecciones?. 4) {Qué tan grande se requiere que sea la muestra si se desea tener una confianza del 94% de que el error de estimaci6n de p no sea superior a 2%? SOLUCION. a) La estimacién puntual de la proporcién p a favor de A en la poblacién, es la Proporcién a su favor en la muestra de n=600 electores; esto es. P = 240/600 = 0.40 La estimacion del error estandar es: bp =f PLRD - [O40N0.60) _ 99, n 600 Para 1c. =0.95 se tiene z1-9/2 = Zog7s = 1.96. Los limites de confianza de p, inferior y superior, son respectivamente . PF app = 0.40F 1.96(0.02) = 0.40F 0.0392 Luego. el intervalo de confianza del 95% para p es de 0.3608 2 0.4392, Es decir, p €[36.08%, 43.92%] con confianza del 95%. b) Sip se estima por se tiene una confianza del (1— ot) x 100% que el error de la estimacién no ser4 mayor que a-apVPC -pyn. Para una confianza del 98%, z1-a/2 = Zo99 = 2-33. 21-2 VPA p)/n = 2.33{(0.40)(0.60)/600 = 0.0466. Luego, si con n=600, p se estima en 0.40, se tiene una confianza del 98% de que el error de la estimacién a favor de A no sera mayor a 4.66%. ©) El intervalo de confianza del 98% a favor de A es [35.34%, 44.66%]. El intervalo de confianza del 98% a favor de B es [33.38%, 42.62%]. Dado que la interseccién de los intervalos no es vacio, no se puede proclamar a A como ganador. En este caso se dice que hay un empate técnico 420 Estadistica d) Dado el error maximo e de la estimacién de p con confianza de (1 — a) x 100% el tamafio m de la muestra, se puede determinar en dos formas: dl) Si se tiene el valor de B (de una muestra preliminar o piloto). el error maximo de estimacién de p es: €=%a/2V PU - P)/n _ rer) PA de donde resulta; n .60. Para el nivel de confianza |-a =0.94, se obtiene z)_4/2 = Zoo7 = 1.88. Luego, se tiene una confianza del 94% que el error al estimar p no seré mayor que 0,02 si el tamafio de la muestra es En nuestro ejemplo p= 1 = (1.88)? (0.6)(0.4)/(0.02)? = 2120.64 = 2121 2) Si no se tiene ef valor J, entonces, se puede usar el valor maximo p=q=/2. Enefecto, pxq = p(l- p)=—(P-1/2)? +4 < 1/4 1-ai2¥ PU P)/n. resulta, Para 1-0 =0.94, =.4/2 94% que el error al cstimar p no ser mayor de 0.02 si el tama muestra es, Luego, de ¢ = 97 = 1.88. Luego, se ticne una confianza de de la n= (1.88)? /(4x(0.02)7) = 2209. NOTA. Si el muestreo es sin reemplazo en una _poblacién (Bernoulli de valores 0 y 1) finita de tamaio N. entonces el error esténdar de P es o5 =(pq/va) {OV —=m/(N —1) . El error esténdar estimado de P es y el valor de n se calcula por Si se desconoce , B, se puede utilizar el valor B=0.5. Estimacién de pardmetros 421 EJEMPLO 9.17. Una empresa va a hacer un estudio de mercado antes de lanzar un nuevo producto hacia una poblacién de 30,000 consumidores a) {Qué tamafo de muestra deberd escoger si quiere tener una confianza del 95% de que error de la estimacién de la proporcién a favor del producto no sea superior al 4%?. Si con el tamafio de la muestra calculado en a) se utiliza b) =0.7 como estimacién de la proporcién de todos los consumidores que prefieren su producto. {Qué grado de confianza utiliz6 si estimé de 19,783 a 22,217 el total de consumidores de la poblacién que prefieren su producto? SOLUCION. a) Para 1a =0.95, resulta 2)-4/2 = Zoo75 = 1.96. Utilizando el valor BI p)=1/4 y N= 30,000 se tiene: af2PGN (1.96)? (30,000) Ss > > = 588.49 = 589 Zing2PQ+e*(N—1) (1.96)? +4(0.04)’ (30.000-1) b) El intervalo 19,783< Np <22.217, resulta de N(DFZ-ap0p), donde Para n= 589, N =30,000 y p = 0.70, se obtiene a5 = 0.0187. De 22.2I7=MP+i-o26p) resulta: zg =217, 1-0/2=0.985. 4 =0.03, y 1-0 =0.97 9.10 Intervalo de confianza para la diferencia entre dos proporciones Sean Fy Py las proporciones de éxitos de dos muestras. aleatorias independientes de tamafios n, ym seleccionadas respectivamente de dos poblaciones de Bernoullf BU, p,) y BQ. p2), donde p, y pz son los respectivos pardmetros proporciones de éxitos. La estimacién puntual de p,-p, es la estadistica Fj -P, cuyo valor es P\-Pr- 422 Estadistica Sin, y nz son suficientemente grandes. FP, y P, tienen distribuciones aproximadamente normales respectivas N(pr. P= pr)/m) y N(p2. p2(1~ p2)/n2). Por tanto, por la propiedad reproductiva de la normal la estadistica P, — P, tendré distribucién aproximadamente normal con media: =E(P -P,)= py - Pr Ma-R y con varianza os a =Var(P, —P)= py py)/m + p2— p)/n2- Por consiguiente, Vpvasimy + P2da/n tendré distribucién aproximadamente normal N(0,1), siendo q,=1—p, 92 =1— pz . Esta distribucién se utiliza para determinar el intervalo de confianza de Pi Po- Dado el grado de confianza 1 — at, en la distribucién de Z, se puede encontrar el valor Z = z1-a/2 tal que Pl-z SZ Pr 424 Estadistica IEJERCICIOS| Una media 1. Una maquina Iena un determinado producto en bolsas cuyo peso medio es 1. gramos. Suponga que la poblacién de los pesos es normal con desviacin estndar 20 gramos a) Estime 1. de manera que el 99.38% de las bolsas tengan pesos no superiores 2 550 gramos. b) Estime 1 mediante un intervalo de confianza del 95%, si una muestra aleatoria de 16 bolsas ha dado una media de 495 gramos Rp. a) 500 b) 495 ¥ 98, 2. Se decide estimar la media 1 del nivel de ansiedad de todos los estudiantes preuniversitarios. Se supone que la poblacién de los puntajes de la prueba para medir la ansiedad se distribuye normalmente con desviaci6n estindar igual a 10 puntos. a) Determinar el intervalo para [1 con confianza del 95%, si una muestra aleatoria de tamafio 100 ha dado una media de 70 punt b) Si }1 se estima en 70 puntos con el nivel de confianza del 98%, jes el error de Ia estimaci6n puntual superior a 5 puntos? ©) Si Ud. considera que el intervalo encontrado en a) no es muy preciso, {qué acci6n deberia tomar para que el intervalo de estimacin al 95% sea més preciso?. Rp.a)70¥ 196 b) No, es =233,c) aumentar el tamaiiode la muestra 3. El tiempo en minutos que utilizan los clientes en sus distintas operaciones en un banco local es una variable aleatoria cuya distribucién se supone normal con una desviacién estindar de 3 minutos. Se han registrado los tiempos de las operaciones de 9 clientes del banco resultando una media igual a 9 minutos: a) Hallar el nivel de confianza si la estimacién de 11 es el intervalo de 7 a 11 minutos. b) Si ptse estima por ¥, calcular la probabilidad de que la media de los tiempos de todas las muestras de tamafio 9 esté entre 6.5 y 11-5 minutos. Rp. a) 0.9544. b) 0.9876 4. Un fabricante afirma que el peso promedio de las latas de fruta en conserva que saca al mercado es 19 onzas. Para verificar esta afirmaci6n se escogen al azar 20 latas de la fruta y se encuentra que el peso promedio es 18.5 onzas Suponga que Ja poblaci6n de los pesos es normal con una desviaci6n estindar de 2 onzas. a) Utilizando un intervato de confianza de! 98% para 1, se puede aceptar la afirmacion del fabricante? Estimacién de parémetros 425, b) {Qué tamafio de muestra se debe escoger para estimar 1 si se quiere un error no superior a 0.98 onzas con confianza del 95%?. Rp. a) 18.5 ¥ 0.932 si. b). 6. Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los nifios ven televisién. Por estudios anteriores se sabe que la desviacin estindar de dicho tiempo es de 3 horas. Con el nivel de confianza de! 99%. a) {Qué tamaiio de muestra se deberfa elegir si el error de la estimacién puntual no es superior a media hora? b) {Qué costo se debe presupuestar para hacer la encuesta si ésta tiene un costo fijo de $5000 més un costo variable de $2 por cada entrevista,? Rp.a) Un fabricante produce focos cuya duraciGn tiene distribucién normal . Si una muestra aleatoria de 9 focos da las siguientes vidas titiles en horas 775, 780, 800, 795, 790, 785, 795, 780, 810 a) Estimar la duracién media de todos los focos del fabricante mediante un intervalo de confianza del 95%. b) Si la media poblacional se estima en 790 horas con una confianza del 98%, {cuanto es el error maximo de la estimacién si se quiere una confianza del 98%? Rp. Utilizando el paquete MCEST se tiene, a) 790 # 8.59. b) 1079. Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tom6 una muestra aleatoria de 49 de tales valores encontrando una media de 8.71% y una desviaci6n esténdar § = 2.1% . a) Estime el verdadero rendimiento anual promedio de tales valores mediante un intervalo de confianza del 96%. b) Calcule el riesgo o: si el rendimiento anual promedio de todos los valores se estima entre 7.96% y 9.46%. Rp. a) 8.71 £0615. b) 00124 La duracién de cierto tipo de bateria es una variable aleatoria cuya distribucién se supone normal. Inicialmente se estima que la duracién media es de 500 horas y que el 95% duran entre 480.4 y 519.6 horas. Si se eligen 9 baterias al azar y se encuentra que la duracién media es 480 horas. Utilizando un intervalo de confianza del 95% para la media 1, se deberia inferir que la duracién media es diferente de 500 horas?, Rp. o= 10, 48046.53, st Encontrar el tamafio de muestra que se debe tomar para estimar la media de las Iongitudes de los tornillos que produce una fabrica con un error no mayor de 0.0233 cm. al nivel de confianza del 98%, si; ademds se indica que la longitud 426 Estadistica de los tornillos tiene distribucién normal _y si la longitud se desvia de la media ena lo més 0,08 cm. con probabilidad 0.9544. Rp o=004.n= 16 10. Las cajas de un cereal producidos por una fabrica deben tener un contenido promedio de 160 gramos. Un inspector de INDECOPI tomé una muestra aleatoria de 10 cajas para calcular los pesos X; en gramos. Si de la muestra resultan las siguientes sumas: 10 10 Dx, =1590, x? = 252,858 a Mediante un intervalo de confianza del 98% para 1, jes razonable que el inspector multe al fabricante?. Suponga que el peso de las cajas del cereal tiene distribucién normal. Rp. F=159, #=2309, BS-0.73. 159 2.06, No. 11. El ingreso mensual de cada una de las 500 microempresas de servicios de una ciudad, es una variable aleatoria con media 1 desconocida. Con el fin de simplificar la recaudacién de impuestos, la Sunat ha dispuesto que a estas empresas se las grave mensualmente con un 10% de sus ingresos. De una muestra al azar de 50 microempresas se obtuvo un ingreso mensual promedio de $1000 con una desviacién estindar de $80. a) Estime el monto medio de los ingresos de las microempresas de la ciudad con un intervalo de confianza del 95% b) Estime el monto promedio de la recaudaci6n a estas microempresas con un intervalo de confianza del 95% ©) Sil propésito de Ia Sunat es lograr mensualmente una recaudaci6n total de al menos $52,000 a estas microempresas, jes factible que se cumplan sus metas?, por qué? Rp. a) IC de ingresos pt: 1000221.06. b) R=0.1X. IC de px:[97-894, 102.106} c) IC del total: (48,947, 51,053], 52,000 no esta en el IC. No es posible 12. Un auditor escoge una muestra aleatoria de 15 cuentas por cobrar de un total de 400 cuentas de una compaiifa y encuentra las siguientes cuentas en délares 730, 759, 725, 740, 754, 745, 750, 753, 730, 780, 725, 790, 719, 775, 700 Utilizando un intervalo de confianza del 95%, estime a) El monto promedio por cuentas por cobrar. b) El monto total de todas las cuentas por cobrar ‘Suponga que las 400 cuentas se distribuyen aproximadamente normal. Rp. ¥ =745, §=24.6287. poblacién finita, ES=6.247, gl=14, a) 745% 13.4, b) 4004745 13.4) Estimacion de parimetros 4a 13. Para la campaita de Navidad una fabrica debe manufacturar 2000 juguetes de cierto tipo. Si una muestra aleatoria de 36 tiempos de fabricacién en horas. 2). Xp vue Xyp de tales juguetes ha dado, Lx, =108 . D x7 = 325.4 a) Estime el tiempo promedio por juguete mediante un intervalo de confianza del 97% b) Estime el tiempo total que se requiere para fabricar los 2000 juguetes mediante un intervalo de confianza del 97% Rp. ¥=3. § =0.2, ES=0.033. a) 370.072, b) 6000714322 14. Un comerciante estima en $55,000 el costo total de 3000 unidades de mercaderia de diverso tipo que posee. Para verificar esta estimacién va a escoger una muestra aleatoria de n unidades para hacer una estimacién del costo total. Suponga que la poblacién de los costos es normal con G= $2.5 por articulo, Calcular el valor de n si se requiere con confianza del 95%. un error de la estimacién no superior a 0.6844 Rp. Poblacién finita, n=50.4=51 Una proporcién 1S. En un estudio sociceconémico se tomé una muestra aleatoria de 100 comerciantes informales y se encontré entre otros datos los siguientes: un ingreso medio de $600, una desviacién estindar de $50 y sdlo el 30% tienen ingresos superiores a $800. a) Estimar la proporcién de todos los comerciantes con ingresos superiores a ‘$800, mediante un intervalo de confianza del 98%. b) Si la proporcién de todos los comerciantes con ingresos superiores a $800 se estima entre 20.06% y 39.94% qué grado de confianza se utiliz6? Rp. a) 0.3 ¥ 0.10677, b) 1-a=0.97, 16. Una muestra aleatoria de 400 menores de 16 afios revela que 220 consumen licor. a) Estimar la proporcién de menores de 16 afios que consumen licor en toda la poblacién mediante una intervalo de confianza del 99% ) (Qué se puede afirmar con confianza del 99% acerca de la posible magnitud del error si se estima que e] porcentaje de menores de 16 afios que consumen alcohol es 0.55? Rp. a) 0.55 ¥ 0.064, b) 0.064 17. Un fabricante afirma que es 5% el porcentaje de piezas con algiin tipo de defecto que resulta del total de Ia produccién, Para verificar tal afirmacién se toma una muestra aleatoria de 100 piezas y se encuentra que 10% ellos tienen 428 Estadistica algin tipo de defecto. Mediante un intervalo de confianza del 95% para la proporcién de piezas defectuosas de toda la produccién. jes aceptable la afirmacién del fabricante?. Rp. 0.1 F 0.0588, 0.5€1.C. se acepta la afirmacién del fabricante. 18. Dos candidatos Ay B compiten como favoritos en las préximas elecciones. En la Ultima encuesta a partir de una muestra grande de electores se estima,con una misma confianza que A tendria 40% de los votos con un error méximo de 3%, mientras que B tendria entre 31% y 39% de los votos. a) En base a esta encuesta . ,cudl de los dos candidatos serfa el ganador absoluto?. b) {Qué tamaiio de muestra se debe elegir si se quicre tener una confianza det 98% de que el error de estimaci6n de todos los electores a favor de A no sea superior al 2% Rp. a) Cualquiera, pues hay empate técnico, ¢) 3258 o 3394 (sin usar proporcién). 19. La oficina de planificacién familiar de cierta provi porcentaje de familias con mAs de 4 hijos. a) {Qué tamafio de muestra se requiere para asegurar con una confianza del 95% que el error de la estimaci6n de tal porcentaje no sea superior a 0.05? b) Si en una muestra alcatoria de 385 familias se encuentra que 154 de ellas tienen més de 4 hijos, estime el porcentaje de familias con més de 4 hijos en toda la provincia, mediante un intervalo de confianza del 98% Rp. a) 385. b) 0.4 F 0.058 ia quiere estimar el 20. Se desea realizar un estudio de mercado para determinar la proporcién de amas de casa que prefieren una nueva pasta dental. a) Si la encuesta tiene un costo fijo de $500 més un costo variable de $5 por cada entrevista, gcudnto deberfa costar la encuesta si se desea que el error al estimar la proporcién verdadera no sea mayor que 2%, con un nivel de confianza del 97%?. b) Si para el tamafio de muestra hatlado en a) se encuentra que 736 prefieren Ia nueva pasta dental, estimar la proporcién verdadera con un coeficiente de confianza de 99%? Rp. a) n=2944, costo total = 2944x5$+500S=15,220S, b) 0.2570.01859 21. Para estimar el porcentaje de todos los electores a favor de un candidato, una encuestadora debe determinar el tamafio n de la muestra alcatoria para escoger de una poblacién de 10,000 electores, ;qué tan grande deberia ser la muestra si se quiere tener una confianza del 95% que el error de estimaci6n no sea superior al 4.8%?. Rp. 400.1982401. Estimacién de pardmetros 429 22. Un auditor toma una muestra aleatoria de 400 cuentas por cobrar_y encuentra que 320 de ellas tienen deudas de al menos $700. Determine el nivel de confianza a) Si el porcentaje de todas las cuentas por cobrar de al menos $700 se estima de 75.76% a 84.24%. b) Si todas las cuentas por cobrar de al menos $700 de un total de 10,000 cuentas por cobrar se estima en el intervalo (7543. 8457] Rp. a) 0.966, by 0.98 23. Un fabricante estima en 5% Ia proporci6n de piezas defectuosos de los 5,000 producidos. a) Para confirmar tal estimacién primero se debe escoger una muestra aleatoria, {cudntas piezas debe tener la muestra si se quiere tener una confianza del 95% que el error de la estimacin no sera superior a 0.047? b) Se escoge una muestra aleatoria del tamafio calculado en a) , si en ella se encuentran 40 piezas defectuosos, mediante un intervalo de confianza del 95%, se puede inferir que la estimacién del fabricante es coherente con la estimacién efectuada a partir de la muestra aleatoria? Rp. a) 2400 b) 0.170.0282, No, p59 no pertenece al LC 24, Se quiere estimar p con un error maximo de estimacién e = 0.05, hallar el tamafio de la muestra necesaria si la poblacién es de tamaio N=2000, Rp. p05. 133, 56=334, Diferencia de dos medias y de dos proporciones 25, Para comparar dos métodos de la ensefianza de las matemsticas, se aplicaron a 200 alumnos elegidos al azar el método tradicional y a otra muestra de 250 alumnos el método nuevo resultando las calificaciones promedios respectivos de 13 y 15. Suponga que la varianzas poblacionales respectivas son 9 y 16. a) Determine un intervalo de confianza del 95% para la diferencia de las medias, b) {Podemos afirmar que el método nuevo es superior al método antiguo? Rp -2¥ 0.65, pi-10=0¢ IC ademas, j2)-}1-<0, el método nuevo es mejor. 26. Se quiere estimar la diferencia entre los promedios de tiempos (en minutos) que utilizan los hombres y las mujeres para realizar un test de aptitud. Se aplica el test a 20 hombres y 25 mujeres dando las medias respectivas de 110 y 100 puntos. Suponga que as dos poblaciones son normales con varianzas respectivas iguales a 100 y 64. a) Determine un intervalo de confianza del 98% para a diferencia de las medias, b) GEs valida la af 3? Rp. 10 5.967. ju-ti-Oe IC ademds, 1)—H2=13EIC. naci6n fy—jlo= 430 Estadistica 27. Se quiere estimar la diferencia entre los promedios de tiempos (en minutos) que utilizan dos operarios para realizar determinada tarea, Suponga que las poblaciones de los dos tiempos se distribuyen normalmente con varianva comtin. Estime la diferencia entre los dos promedios poblacionales mediante un intervalo de confianza del 95% si el registro de 16 tiempos de cada operario han dado: % = 38, §, =6,y ¥, =35, § Rp. ES=1.8028, gl-30, 33.68, ws-po€[-0.68, 6 68) 28. Un inversionista hace un estudio para elegir una de dos ciudades del interior del pais para abrir un centro comercial. Escoge 21 hogares de la ciudad 1 determinando: ¥, =$400, §,=$120 y escoge 16 hogares de la ciudad 2 calculando: X, = $350, §, = $60. Suponga poblaciones normales con varianzas diferentes. Mediante un intervalo de confianza del 95%, {se puede afirmar que son iguales los ingresos promedios de las dos ciudades?. Rp. ES=30.178, gl=31, 207 61.08, wr-ps=EIC se acepta. y1y-p 29. Para comparar los gastos promedios mensuales de los alumnos de 2 universidades particulares se escogen dos muesiras aleatorias de 10 y 9 alumnos respectivamente resultando los siguientes gastos en délares: Muestra 1: 400, 410, 420, 380, 390, 410, 400, 405, 405, 400. Muestra 2: 390, 395, 380, 390. 400, 380, 370, 390, 380. Mediante un intervalo de confianza del 95% para la diferencia de los promedios de los gastos mensuales, ¢se puede inferir que los gastos promedios son iguales?. Suponga que ambas poblaciones son normales, independientes, con varianzas desconocidas supuestas iguales . Rp Utilizando el MCEST se tiene: gl=17, ES=4.726, LC: 15.89 ¥ 9.97, No. 30. Una agencia de publicidad realiz6 un estudio para comparar la efectividad de un anuncio en la radio en dos distritos. Después de difundir el aviso. se realiz6 una encuesta con 900 personas seleccionadas al azar, en cada uno de los distritos, resultando las proporciones 20% y 18% respectivamente. Si de los datos muestrales se infiere que p,— pz €[~0.0162, 0.0562], ,qué nivel de confianza se utiliz6?. Rp. 1-0=095 31. Dos muestras aleatorias de 250 mujeres y 200 hombres indican que 75 mujeres y 80 hombres consumirfan un nuevo producto unisex que acaba de salir al mercado. Utilizando un intervalo de confianza del 95%, se puede aceptar que es igual la proporcién de preferencias de mujeres y hombres en toda la poblacidn?, si no es asf, ,cual es la relacion? Rp. -0.1F1.96(0.0452), [-0.199, -0.011]. przpsademas es pps Estimacién de parimetros 431 Varianzas 32. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de Ja semana de un determinado producto de consumo popular tiene una desviaci6n esténdar $=$6. Se supone que las ventas del producto tienen una distribucién normal, Estimar a) la varianza y b) la desviacién est4ndar poblacional mediante un intervalo de confianza del 95%. Rp. (432/23.34)500, entonces, la hipétesis referente a la media es una hipotesis compuesta, pues, no especifica la media de la distribucién de la poblacién de los ingresos. Hipétesis nula y alternativa Definicién. Se denomina hipétesis nula y se representa por H.. a la hipétesis que es aceptada provisionalmente como verdadera y cuya validez seré sometida a comprobacién experimental. Los resultados experimentales nos permitiran seguir aceptandola como verdadera o si, por el contrario, debemos rechazarla como tal. Toda hipotesis nula va acompajiada de otra hipdtesis alternativa. Definicién. Sc denomina hipétesis alternativa y se representa por Hy 0 por H,. a la hipétesis que se acepta en caso de que la hipétesis nula Hg sea rechazada. La hipdtesis alternativa H,, es pues una suposicidn contraria a la hipotesis nula. Por ejemplo, si se asume que @, es un valor del pardmetro desconocido © de una poblacién cuya distribucién se supone conocida, entonces son hipdtesis nulas y alternativas respectivamente las siguientes afirmaciones: 1) Hy:0=0y, y H,:0#0, 2) Ho: 0, y Hy:0>, 3) Hy:020, y Hy:0Q9 se denomina proeba unilateral de cola a Ia derecha. La prueba de hipstesis. Hg unilateral de cola ala izquierda :0=8p contra H,:670. Dado que X es un buen estimador de pt utilizaremos esta estadistica para determinar a regién critica ‘y la regla de decisién de esta prueba. Puesto que estamos interesados en la discriminacién entre 4. =70 y valores de 1. >70 parece razonable que debamos rechazar Hy si X ~70 es muy grande, esto es si X > K ,siendo K un valor critico que vamos a determinar. Si se supone verdadera la hipétesis H 9:1 = 70 , entonces, la distribucién de la media X es normal con media = 70 y desviaciOn estandar o = En consecuencia la distribucién de X-70 3ivn es normal N(0,1). Para una muestra aleatoria de tamafio_n = 40 y la probabilidad de error tipo I, =05 se tiene (ver figura 10.1). 0.05 = Prechazar Hy cuando Ho es veradera]= P[X > Kf = 70) X¥-70_ K-70 0.05 = da S| -e> Prueba de hipétesis 437 De la tabla normal N(0,1 ) se obtiene: K=70 _ 1 645, luego K =70+1.645x0.474 = 70.78 0.474 Por tanto, la region critica en el rango de variacin de X es el intervalo RC.=I70.78, + of La regla de decisién es: si es el valor de X obtenido a partir de una muestra aleatoria de tamafio 40, se rechazaraé Hp si X > 70.78. — 70 K Figura 10.1: Regién eritica cola a la derecha en la variable X Procedimiento de la prueba de hipétesi Previamente debe formularse el problema estadistico, determinar la variable en estudio y el método estadistico adecuado para la solucién del problema. El procedimiento general de la prueba de_una hipétesis de pardmetro 0 se resume en los siguientes pasos; 1) Formular la hipétesis nula Ho :0=0o y 1a hipétesis alternativa adecuada H,:0#0, 6 Hy:0>0) 6 H,:0Zaal=a/2. En consecuencia, la regién critica en el rango de variacién de Z es: RC.={Z<-2gp 0 Z> Y-a))- Por otto lado, la probabilidad de aceptar Hg cuando se supone verdadera es: Prueba de hipétesis 439 Plittan $ZS t-ap]=1-a. Resultando la regién de aceptacin: R.A.={-2) a2 SZS2-ap)- A a, Fa 0 Zan a Ho 6 Rechazar H,| Aceptar Hy | Rechazar Hy ca Figura 10.2: Regi6n critica bilateral en escalas z y ¥ 5 Regla de decision es: Si z, =(%-)/(6/ Vn) es un valor de Z obtenido de la muestra, entonces, se rechazaré Hg con riesgo igual a a, si FERC. (0 si FeRA.), No se rechazaré Hp encaso contrario (figura 10.2). Si se rechaza Ho se dice que el valor z es significative con un riesgo cuyo valores a. NOTA, (Regién critica en X ) Si se sustituye Z=(K—po)/(o/Vn) en RC resulta la region critica en el rango de variacién de X : RC.=(X d}. donde a= po -Z-an(olVn), y b=Ho +Z1-an(o/vn) La regién de aceptacién es el intervalo en X : RA=[asX o, dado el nivel de significacin i, en la distribucién de Z=(X-po)/(o/vn) que es normal N(O,1), se determina el valor z1_q tal que (figura 10:3), PIZ > 2-4 H:M=Ho verdaderal =a 0 z; x Ho 5 Aceptar Hy | Rechazar Hy Figura 10.3: Regidn critica cola ala derecha en escalas z y © En consecuencia, la regién critica en el rango de variacién de Zes: RC.={Z> a4) La regién de aceptacién es: RA=(ZS2_g)- =po)/(o/¥n) es un valor de Z obtenido a partir de una muestra, se rechazaré Hy si zy €RC. (0si 4, @RA) La regla de decision es: Siz, = No se rechazaré Hy encaso contrario (figura 10.3). NOTA. (Regién critica en X ) Si se sustituye Z=(X-po)/(o/Vn) en RC resulta la regién critica en el rango de variaci6n de ¥ : RC.={X >) donde, by =p +a (o/Vn) La regién de aceptacisn es el imervalo: Prueba de hipétesis 44 La regla de decision es: Siendo ¥ el valor de X obtenido a partir de una muestra aleatoria de tamafio n, se rechazaré Hgcon un riesgo a, si FERC. (0 si FERA.). No serechazaré Hyen caso contrario.(figura 10.3). 3) Prueba unilateral de cola a la izquierda Si se prueba Ho :H=Ho contra Hy: 1.96} 5. Cdlculos: De los datos se tiene: Prueba de hipotesis 443 n= 100, ¥ =395,0=20, %=Ho _ 395-400 Solin 6. Decisin: Puesto que zy = ~2.5 € R.C, debemos rechazar Hy y concluir con un riesgo de 5%, que el proceso de empaquetar no est4 controlado. NOTA. En el rango de variacién de X , la regién critica es: X <400-1.96x2 0 X >400+1.96x2} RC.={X <396.08 0 X >403.92} El hecho que ¥=395 € R.C,, se debe rechazar Hy y concluir con un riesgo de 5%, que el proceso de empaquetar no est controlado. NOTA. (Regla de decisién en Intervalo de confianza) La prueba bilateral de la hip6tesis nula Hy:1=}19 contra Hy:)1# 41g aun nivel de significaci6n dado «, equivale a caleular el intervalo de confianza (J.C.) de (I-ca)x100% para el pardmetro jt y luego rechazar la hipétesis nula Ho:b=Ho sies que ty LC. En efecto, si ¥ es un valor de X , no se rechazar Ho: =o siel valor % ERA =[-Z ey Z-aj2], donde zy =(F—po)/(o/ Vn) 0, si = Zo * Stop an Esto es, no se rechazara Hg: =p si es o o FeRA=bo~ ton Fs Wo + Zw i © equivalentemente si [1g se encuentra dentro del_intervalo de confianza (I.C.) del —a)x100% para jt: < o +22 ie In Ho €1.C.=1% ~ 21-9 z in 444 Estadistica Por tanto, se rechazaré Ho con riesgo © si, FERA 0 si po elC Por ejemplo, en el ejemplo 10.1, para a = 0.05 se tiene: [391.08. 398.92] 7 che a 1c. -[ Fea fetta In n 396.08, 403.92}. s RA. [re-seee Yq tot trea | In Dado que po =400¢ 1.C.(0 que ¥=395ER.A.) se debe rechazar Ho con un riesgo del 5%. NOTA. (Método del valor P en la prueba) Otra forma de establecer la regla de decisiOn, en estadistica aplicada, es calculando el valor P, a partir del valor absoluto de z, = (%—Wo)/(o! Vn) . (que se obtiene de la muestra), de manera que a) P=PIZ<-%]+AZ>z,]=2FIZ> 2%] (para dos colas). b) P=P{Z>z%,] (cola la derecha). c) P=PIZ <-z,] (colaala izquierda). Sicl valor de P z,)=2P{Z > 2.5] = 2(0.0062) = 0.0124 Dado que P=0.0124 —————_ |= P[Z = 2.86) a ma 4 s0/ioo pea & B= P[z =2.86]=0.0021 EJEMPLO 10.3. (Tamaiio de la muestra) Suponga que X es una poblacién normal con media 4 (desconocida) y con varianza o” conocida. Dadas las probabilidades « y B de cometer errores tipo I y tipo Il respectivamente, determinar el tamafio n de la muestra requerida para probar las hip6tesis simples Ho :f=Ho contra H,:p=p, donde py K/j.=1500]= P| Z > ———— [ | sold K -1500 2.1750 de donde resulta, “== 42.17, K =1500+ == so/vn vn También, si se supone verdadera la hipétesis altemnativa H, :4 1523. X -1500 so/Vn Luego, para f = 0.0075 = P[Error tipo II}, en esta distribucién se tiene entonces, la distribuci6n de Z = es normal M(O,1). 0.0075 = Placeptar Hy / Hy: = 1523] Rt K -1523 0.0075 = P|X < K/p =1523}= P| Z << ———— fee mte=isel=r a] K -1523 2.4350 AS =-2.43, KK =1523- : 50/dn vn Prueba de hipotesis 449 2.1750 2.43x50 Luego de: K =1500+=—-—y de K =1523— » Se obtiene vn vn=10, n=100 Con el valor de n=100., se obtiene el critico de la prueba: K =1510.85. Si ¥ es un valor de media de la muestra de n=100 casos, se rechazaré la hip6tesis nula Hg si ¥>1510.85.. En caso contrario, no se debe rechazar Ho 10.3 Pruebas de hipétesis acerca de la media p: Varianza o? supuesta desconocida A) Poblacién no normal Sila poblaci6n no tiene distribucién normal y si la varianza es desconocida, para probar hipétesis acerca de la media 11, s6lo si, el tamafio de la muestra es grande (230), sesuele utilizar Ia estadistica X-Ho ofvn cuya distribuci6n es aproximadamente M(0.1). La desviaci6n estindar G se estima puntualmente por § Luego, las regiones criticas de la pruebas de Hg :}1= 1g contra cualquiera de las Zz tres alternativas Hy:2>Ho 6 Hy:ntopns1l=O/2 Luego, la regién critica en el rango de variacién de T es: idad de rechazar Hy cuando se supone verdaderi ROT <-tapnr 0 T>bha2n-1) La region de aceptacién es el intervalo RA= (Hg nt ST Shap nal Regla de decisin: Se rechazaré Hg con riesgo a. si ty ERC. (0, si ty ERA), No se rechazaré Hy en caso contrario. “| "fa rane 0 Natt @ Yo 3 RechazarHH,| AceptarH, | Rechazar H, Figura 10.6: Regin critica bilateral en escalas ry X x NOTA. Sise sustituye T =(X—po)/(8/ Vn) en R.C se obtiene:

You might also like