You are on page 1of 45
capitulo Aprender cémo hacer estimaciones de ciertas caracteristicas de una pobla- cién a partir de muestras Aprender las fortalezas y limitaciones de las estima~ ciones puntuales y las estimaciones de intervalo Calcular qué tan precisas ESTIMACION Aprender a utilizar la distribucién t para hacer estimaciones de intervalo en algunos casos en los que la distribucién normal no se puede utilizar Calcular el tamario de muestra requerido para cualquier nivel deseado de precisién en la son en realidad nuestras estimacion estimaciones 7.1 Introduccion 274 7.8 Determinacién del tamafio de 7.2 Estimaciones puntuales 277 muestra para la estimacién 7.3 Estimaciones de intervalo: 303 conceptos basicos 281 Estadistica en el trabajo 309 7.4 Estimaciones de intervalo e Ejercicio de base de datos intervalos de confianza_ 285 computacional 309 7.5 Calculo de estimaciones de Del libro de texto al mundo intervalo de la media a partir real 311 de muestras grandes 288 Términos introducidos en el 7.6 Calculo de estimaciones de capitulo 7 312 intervalo de la proporcién a Ecuaciones introducidas en el partir de muestras grandes capitulo 7 313 293 Ejercicios de repaso 313 7.7 Estimaciones de intervalos con la distribucién t 297 273 ‘omo parte del proceso de asignar el presupuesto del afio siguiente, ( el administrador de la planta generadora de energia eléctrica Far Point debe estimar la cantidad de carbén que requerirs para este afio. El afo anterior, la planta casi se quedé sin combustible, de modo que el administrador esta reticente a solicitar el mismo presupuesto de ‘nuevo. Sin embargo, el administrador de la planta siente que el uso de los datos registrados le ayudard para estimar el nimero de toneladas de carbén que debe pedir. Una muestra aleatoria de 10 semanas de ‘operacién de la planta seleccionadas de los diltimos cinco afios produjo ‘un consumo medio de 11,400 toneladas semanales, con una desviacién estndar de la muestra de 700 toneladas por semana. Con los datos que tiene a su disposicién y los métodos que se estudian en este capitulo, el administrador de la planta puede hacer una buena estimacién de la ‘cantidad que debe pedir este afo, ¢ incluso tener una idea de qué tan precisa es la estimacién, I 7.1 Introduccion Razones para hacer, estimadones Elaboracn de estadstcas Uso de muestas Todo el mundo hace estimaciones. Cuando esté por cruzar una calle, hace una estimacién de la velocidad del automévil que se acerca, de la distancia que hay entre usted y el auto y de su propia ve- locidad. Habiendo hecho répidamente todas estas estimaciones, usted decide si espera, camina o corre. Los administradores también deben hacer estimaciones répidas. El resultado de estas estimaciones, puede afectar sus otganizaciones de manera tan seria como el resultado de su decisién de cruzar la calle. Los jefes de departamento de una universidad hacen estimaciones acerca de las inseripciones para el semestre siguiente en las materias. Los directores de crédito estiman si un cliente pagaré 0 no sus débitos. Los futuros compradores de casa hacen estimaciones concemientes al comportamien- to de las tasas de interés de los préstamos hipotecarios. Todas estas personas hacen estimaciones sin preocuparse de si son cientificas o no, pero con la esperanza de que las estimaciones tengan una se- ‘mejanza razonable con el resultado. Los administradores utilizan estimaciones porque, hasta en los asuntos més triviales, deben to- ‘mar decisiones racionales sin contar con la informacién pertinente completa y con una gran incerti- dumbre de lo que el futuro pueda deparar. Como ciudadanos instruidos y profesionales, podremos hacer estimaciones més tities si aplicamos las técnicas descritas en este capitulo y los que le siguen. El material sobre teoria de probabilidad que se presenté en los capitulos 4, 5 y 6 constituye la base de la inferencia estadistica, rama de la estadistica que se ocupa del uso de los conceptos de probabi- lidad para manejar la incertidumbre en la toma de decisiones. La inferencia estadistica esté basada en. la estimacién, concepto que se introduce en este capitulo, y en las pruebas de hipatesis, que es el tema de los capitulos 8, 9 y 10, Tanto en Ia estimacién como en las prucbas de hipdtesis, haremos in- ferencias acerca de las caracteristicas de las poblaciones a partir de la informacién proporcionada por las muestra. {De qué manera los administradores utilizan estadisticas para estimar los parimetros de una po- blacién? El jefe de departamento de alguna universidad intenta estimar el niimero de inscripciones ue tendrel siguiente semestre a partir de las inscripeiones actuales en los mismos cursos. El direc- tor de un departamento de crédito intentard estimar el valor ctediticio de los futuros clientes a partir de una muestra de sus habitos de pago. El comprador de una casa intenta estimar el curso futuro de las tasas de interés mediante la observacién de su comportamiento actual. En cada caso, alguien tra- ta de infer algo acerca de una poblacién a partir de la informacién adquirida de una muestra 274 capitulo 7 estimacion Estinacsn de patametros Destin de estnacin punta! Ins eximaciones punuales Denia de Destin de esimador En este capitulo introducimos métodos que nos permiten estimar con precisién razonable la proporcién de la poblacién (Ia fraccién de la poblacién que posee una caracteristica dada) y la me dia de la poblacidn, Calcular la proporcién exacta 0 la media exacta seria una meta imposible. Pe- 10, a pesar de ello, seremos capaces de hacer una estimacién, establecer una afirmacién respecto al error que tal vez acompaftard a esta estimacién, y poner en marcha algunos controles para evi- tar dicho error en la medida de lo posible, Como tomadores de decisiones, nos veremos forzados, en ocasiones, a confiar en nuestros presentimientos. Sin embargo, en otras situaciones, en las que dispongamos de informacién y podamos aplicar los conceptos de estadistica, tendremos mejores resultados. Tipos de estimaciones Podemos hacer dos tipos de estimaciones concernientes a una poblacién: una estimacion puntual y ‘una estimacin de intervalo, Una estimacién puntual es un solo nimero que se utiliza para esti- ‘mar un pardmetro de poblacidn desconocido. Si, mientras observa al primer integrante de un equipo de fitbol americano salir al campo de juego, se dice: “jCaramba! Apuesto a que el peso promedio de los jugadores defensivos es de 125 Kilogramos”, usted ha hecho una estimacién puntual. Fl jefe de departamento de una universidad estaria haciendo una estimacién puntual si afirmara: “Nuestros datos actuales indican que en esta materia tendremos 350 estudiantes el siguiente semestre. ‘A menudo, una estimacién puntual es insuficiente debido a que sélo tienen dos opciones: es correcta o esté equivocada, Si le dicen solamente que la afirmacién sobre la inseripeién esti equivo- cada, no sabe qué tanto esté mal y no puede tener la certeza de que Ia estimacién es confiable. Si se centera de que s6lo esté errada por 10 estudiantes, podria aceptar a 350 estudiantes como una buena cstimacién de la inscripeién futura, Pero si esta equivocada en 90 estudiantes, la rechazaria como es- timacién de la inscripeién futura, Entonces, una estimacién puntual es mucho mds itil pafiada por una estimacin del error que podria estar implicado. Una estimacién de intervalo es un rango de valores que se utiliza para estimar un paréme- tro de Ia poblacién, Una estimacién de este tipo indica el error de dos maneras: por la extensién del intervalo y por la probabilidad de que el verdadero parémetro poblacional se encuentre dentro del in- tervalo, En este caso, el jefe de departamento diria algo como lo siguiente: “Estimo que la inserip- cin real de este curso para el proximo semestre estard entre 330 y 380, y es muy probable que la inscripeién exacta caiga dentro de este intervalo.” Con esto tiene una mejor idea de la confiabilidad de su estimacién. Si el curso se imparte en grupos de 100 estudiantes cada uno y si, tentativamente, se han programado cinco cursos, entonces, de acuerdo con la estimacién, puede cancelar uno de los ‘etupos y abrir uno optativo. Estimador y estimaciones Cualquier estadistico de la muestra que se utilice para estimar un parémetro poblacional se conoce como estimador, es decir, un estimador es un estadistico de la muestra utilizado para estimar un pardmetro poblacional, La media de la muestra ¥ puede ser un estimador de la media de la po- blacién 4, y la proporcidn de la muestra se puede utilizar como un estimador de la proporcién de la poblacién. También es posible emplear el rango de la muestra como un estimador del rango de la po- blacién. Cuando hemos observado un valor numérico especifico de nuestro estimador, nos referimos a ese valor como una estimacién, En otras palabras, una estimacién es un valor especifico observado de un estadistico. Hacemos una estimacién si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra. Suponga que calculamos la lectura media de un odémetto (kilo- ‘metraje) a partir de una muestra de taxis en servicio y encontramos que es 156,000 kilémetros. Si utilizamos este valor especifico para estimar el kilometraje de la flotilla de taxis completa, el valor obtenido de 156,000 kilémetros seria una estimacién, En la tabla 7-1 ilustramos varias poblaciones, parimetros, estimadores y estimaciones. 74 Introduccion = 275 el Poblaciones, parametros, estimadores preriererred Cualdades de un buen estinader Poblacién Pardmetros Estadistico cena que de poblacion dela muestra Estimacion ‘estamos que deseamos ‘que utilizaremos que interesados cestimar ‘como estimador realizamos Empleados de una Rotaciin meade Rotacin media de 8.9% de roaciin fibrica de muebles ‘empleados por aio templeados en un mes Por ao Candidates a gerente Fuses formal Fucacisn formal media de 179 aos de educacén la ciudad de Chapel Hill media (aos) ‘cada quinto solictante forma Adolescents de ura Proporcién que tiene Proporcién de una mest 0.02, 02%, tienen comunidad dada antecedentespenales de SO adolescentes que ___antecedentes penales tiene antecedents panales Criterios para seleccionar un buen estimador Algunos estadisticos son mejores estimadores que otros. Afortunadamente, podemos evaluar la ca- lidad de un estadistico como estimador mediante el uso de cuatro criterios: 1, Insesgado. Fista es una propiedad descable para un buen estimador, El término insesgado se re- fiere al hecho de que una media de la muestra es un estimador no sesgado de una media de la poblacién porque la media de la distribucién muestral de las medias de las muestras toma- das de la misma poblacién es igual a la media de la poblacién misma. Podemos decir que ‘un estadistico es un estimador insesgado (0 no sesgado) si, en promedio, tiende a tomar valo- res que estén arriba del parémetro de la poblacién que se esta estimando con la misma frecuen- cia y la misma extensién con la que tiende a asumir valores abajo del parémetro poblacional que se esté estimando. 2. Eficiencia, Otra propiedad deseable de un buen estimador es que sea eficiente, La eficiencia se refiere al tamaio del error estindar del estadistico, Si comparamos dos estadisticos de una muestra del mismo tamafo y tratamos de decidir cudl de ellas es un estimador mas eficiente, escogeriamos la estadistica que tuviera el menor error estindar o la menor desviacién estindar de la distribucién muestral. Suponga que escogemos una muestra de un tamafio determinado y debemos decidir si utilizamos la media de la muestra o la mediana de la muestra para estimar la media de la poblacién. Si calculamos el ertor esténdar de la media de la muestra y encontra- mos que ¢s 1.05, y luego calculamos el error estindar de la mediana de la muestra y tenemos que éste es 1.6, diriamos que la media de la muestra es un estimador més eficiente de la media poblacional ya que su error estindar es menor. Tiene sentido pensar que un estimador con un error estindar menor (con menos variacién) tendra mayor oportunidad de producit una estima- cién més cercana al parimetro poblacional que se esti considerando. 3. Consistencia. Una estadistica es un estimador consistente de un pardmetro de poblacién si al ‘aumentar el tamaio de la muestra, Se tiene casi la certeza de que el valor de la estadistica se ‘aproxima bastante al valor del pardmetro poblacional. Si un estimador es consistente, se vuel- ve mas confiable al tener tamafios de muestra mis grandes. Si usted se pregunta acerca de la posibilidad de aumentar el tamafio de la muestra para obtener més informacion sobre un pard- metro poblacional, averigiie primero si su estadistico es un estimador consistente 0 no. Sino lo es, desperdiciaré tiempo y dinero al tomar muestras mas grandes. 4, Suficieneia. Un estimador es suficiente si utiliza tanta informacién de la muestra que ningan otro estimador puede extraer informacién adicional acerca del parmetro de poblacién que se est estimando, Presentamos estos criterios con anticipacién para que no pierda de vista el cuidado que los especi listas en estadistica deben tener al elegir un estimador. 276 capitulo? Estacion Bisquedadelmejor Un estadistico de la muestra dado no siempre es e1 mejor estimador de su parimetro poblacional estimador correspondiente. Considere una poblacin con distribucién simétrica, en la que los valores de la me- diana y de la media coinciden, En este caso, la media de la muestra seria un estimador imparcial de la mediana de la poblacién. También, la media de la muestra seria un estimador consistente de la me- diana de la poblacién puesto que, al aumentar el tamafio de la muestra, el valor de la media de la ‘muestra tenderd a acercarse bastante a la mediana de la poblacién. ¥ la media de la muestra seria un estimador mas eficiente de la mediana de la poblacién que la mediana de la muestra misma, ya que ‘en muestras grandes, la media de la muestra tiene un error estindar menor que la de la mediana de la muestra, Al mismo tiempo, la mediana de la muestra de una poblacién con distribucién simé- trica seria um estimador imparcial y consistente de la media de la poblacién, pero no el mas eficien- te, porque en muestras grandes su error estindar es mayor que el de la media de la muestra. 7-1 ,Cuales son las dos hertamientas bisicas que se utilizan al hacer inferencias estadisticas?? 7-2 {Por qué los que toman decisiones a menudo miden muestras en lugar de medir poblaciones completas? Cuil es la desventaja? 7-3 Explique una limitacién que se presenta al hacer una estimacién puntual, pero que no se presenta al ha- ccor una estimacién de intervalo, 7-4 {Qué cs un estimador? ;En qué se diferencia un estimador de una estimacién? 7-5 Déuna lista de los eriterios de un buen estimador y describalos brevemente, 7-6 ,Qué papel juega la consistencia en la determinacion del tama de la muestra? 7.2 Estimaciones puntuales \sodelameda La media de la muestra ¥ es el mejor estimador de la media de la poblacién j. Es insesgada, consis- dela muests pare tente, el estimador mis eficiente y, siempre y cuando la muestra sea suficientemente grande, su dis- inerbire'2yibucibn muestra puede ser aproximada por medio de la dstibuei6n normal. ps Si conocemos la distribucién muestral de ¥, podemos obtener conclusiones respecto a cualquier cestimacién que podamos hacer a partir de la informacién muestral. Considere el caso de una com- paiia de suministros clinicos que produce jeringas descchables. Cada jeringa esté cubierta por una envoltura estéril que a su ver. se empaca en grandes cajas de cartén corrugado. Debido al proceso de ‘empaque, las cajas de cart6n contienen distintas cantidades de jeringas. Como las jeringas se venden por pieza, la compaaia necesita una estimacién del nimero de piezas que hay por caja, para propd- sitos de facturacién, Tomamos una muestra aleatoria de 35 cajas y registramos el nimero de jeringas contenidas en cada caja. La tabla 7-2 ilustra los resultados. Utilizando los conceptos del capitulo 3, Sisqueda dele podemos obtener la media de la muestra, ¥, sumando todos los resultados, Sx, y dividiendo esta su- mmeda dela nuesta ma entre n, el niimero de cajas muestreadas: Se [3-2] Utilizando esta ecuacién para resolver el problema, tenemos: S70 35 = 102 jeringas Asi, al usar la media de la muestra, X como estimador, la estimacién puntual de la media de la po- blacién, 4, ¢s 102 jeringas por caja, El precio de fabricacién de cada jeringa hipodérmica desecha- 72 Estimaciones puntuales. 277 re 101 103 m2. 102 98 97 98 105100 97 107 3 98 97 eclpaaeattid 97100 110 106 110 103 99 Parichat) Pea 93 98 106 100 12 105 100 m4 7 110 102 98 im 39 pre Uso de a desinibn estndar dea muestra para estinar Iadesviacén estindar del poblacin Por qué el disor ena dela muesta pata stim Is proporién dela poblacién ble es bastante bajo (alrededor de 25 centavos), de modo que tanto el comprador como el vendedor aceptarian esta estimacién puntual como base para la facturacién, y el fabricante puede ahorrarse el tiempo y el gasto de contar las jeringas contenidas en las caja. Estimacién puntual de la varianza y la desviacion estandar de la poblacién ‘Suponga que la administracién de la compaiiia de suministros clinicos desea estimar la varianza y/o la desviacién estindar de la distribucién del mimero de jeringas empacadas por caja. El estimador ‘mis utilizado para estimar la desviacién estindar de la poblacién ar, es Ia desviacién estindar de la muestra, s. Podemos calcular la desviacién esténdar de la muestra como lo hicimos en la tabla 7-3 y descubrir que es 6.01 jeringas. Sin lugar de considerar n=1 ‘como nuestra varianza de la muestra, hubiéramos usado la ecuacién: Xo = 5? el resultado habria tenido algo de sesgo como estimador de la varianza de la poblacién; especifica- ‘mente, hubiera tendido a ser demasiado bajo. Utilizar en el divisor n — 1, nos da un estimador im- parcial de o. En consecuencia, usaremos s* (segin se define en la ecuacién 3-17) y s (ecuacién 3-18) para estimar oy 2. Estimacién puntual de la proporcién de la poblacién La proporeién de unidades de una poblacién dada que tiene una caracteristica particular se denota por p. Si conovemos la proporcién de unidades de una muestra que tiene la misma caracteristica (de- notada por p, podemos utilizar esta como estimador de p. Se puede demostrar que A tiene todas las caracteristicas descables anatizadas; es insesgado (no sesgado), consistente, eficiente y suficiente. Continuando con nuestro ejemplo del fabricante de suministros médicos, intentaremos hacer una estimacién de la proporcién de la poblacién a partir de la proporcién de la muestra. Suponga que la ad- ministracién de la empresa desea estimar el némero de cajas que llegardn datiadas a su destino por ‘mal manejo en el traslado, Podemos verificar una muestra de 50 cajas a partir del punto de embar- que hasta su arribo al punto de destino, y Inego registrar la presencia o ausencia de daiios. En este «aso, si encontramos que la proporcién de cajas dafiadas en la muestra es 0.08, diriamos que: PH 0.08 — roercin dla ues dads Y, debido a que la proporcién de Ia muestra f es un estimador conveniente de la proporeién de la poblacién p, podemos estimar que la proporeién de cajas dafiadas de toda la poblacién sera tam- ign 0.08, 278 capitulo 7 Estimacion a er ty PEAT Pere ter) Peat eee Valores de x eringas por caja) Media de la muestra X fu} @) ia 1@ 105 12 2 : ” 102 s % 2 102 -9 8 14 10 2 14 103 10 1 1 100 v0 - 4 100 102 = 4 38 10 m4 16 7 102 -s 8 1 102 10 100 7 102 -s 5 110 102 * a 106 10 4 16 0 10 s ee 10 102 ° o 107 102 5 25 106 10 4 % 10 102 2 4 12 102 ° 0 8 12 -4 6 2 102 -9 8 10 10 * “ nm 102 10 10 38 102 -4 16 37 102 5 5 3 10 = a 12 102 1 1 105 102 2 ° 12 102 10 100 2 102 -2 8 7 10 5 2% *° 10 a3 3 100 10 = 4 a) 1 3 2 3,570 ‘Suma de los cuadrados E(x-¥ > 1,228 we de todas as ferns Ba ‘Suma de los cuadrados . deta cterendas enve — 365368, _35itah 34, enmero de uo # piers dela muestra ne = varianz dela ~ 8 muestra) =3612 _ Bas seve Desviacin estindar BUT 6.0 jeingas - Van deta esta s = 601 jeringas 72 Estimaciones puntuales 279 SUGERENCIAS —Dejando de lado todas las definiciones, las ideas de este capitulo, podemos decirselo, Los estadis- Y Ja raz6n para estudiar los estimadores es ticos pueden establecer como se comporta el error estinndar SUPOSICIONES aprender acerca de las poblaciones me- _conforme aumenta o disminuye el tamafio de la muestra y [EEE diante el muestreo, sin contar cada ele- los investigadores de mercados pueden determinar el costo mento de la poblacién, Por supuesto, tampoco en este caso de tomar mas muestras o de hacerlas més grandes; pero de- cl viaje es gratis, yal decidir no contar todo, se pierde cier- beri usar su propio juicio para combinar estos dos datos y ta cxactitud. Los administradores descarfan saber la exacti--_ tomar una decisiones gerencial correcta, tud que se logra cuando se hace un muestreo, y si usamos Ejercicios de autoevaluacion EA 71 El Greensboro Coliscum estudia le posibilidad de ampliar su capacidad de asientos y necesita conocer tanto el nimero promedio de personas que asisten a los eventos como la variabilidad de este mimero, Los datos se refieren a la asistencia (en miles) a nueve eventos deportivos seleccionados al azar, Encuentre las «estimaciones puntuales de la media y la varianza de la poblacién de la que se tomé la muestra. a8 0378S UK a1 Bo EA 7-2 La Autotidad para Distribucién de Pizzas (ADP) ha desarrollado un buen negocio en Carrboro entregan- do drdenes de pizzas con prontitud. La ADP garantiza que sus pizzas se entregarin en 30 minutos o me- nos a partir del momento en que se toma el pedido si la entrega se retrasa, la pizza es gratis. El tiempo de entrega de cada pedido se registra en el “libro oficial de tiempo de pizza” (LOTP); el tiempo de entre- ‘ga con retraso se registra como “30 minutos” en LOTP. Se enumeran 12 registros aleatorios del LOTP. 153 295 3001300196 tos 122 148 3008 a) Encuentre la media de la muestra b) (De qué poblacién se obtuvo esta muestra? (©) (Puede usarse esta muestra para estimar el tiempo promedio que toma a ADP entregar una pizza? Ex- plique. Aplicaciones 747A Joe Jackson, un meteordlogo que trabaja para la estacidn de televisién WDUL, le gustaria informar sobre la precipitacién pluvial promedio para ese dia en el noticiero de la tarde. Los datos siguientes correspon- den a las mediciones de precipitacién pluvial (en centimetros) para 16 alfos en la misma fecha, tomados al azar. Determine la precipitacién pluvial media de la muestra. oar 027 0130540008 0.00 105 034026 at? ok SD 7-8 EL National Bank of Lincoln quiere determinar el némero de cajeros disponibles durante les horas pico ‘del almuerz0 los viemes. El banco ha recolectado datos del nimero de personas que entraron al banco los viernes de los tltimos 3 meses entre las 11 A.M. y la I PM. Utilice los siguientes datos para encontrar las estimaciones puntuales de la media y la desviacién estandar de la poblacién de donde se tomé la muestra, 2m «7S 288306342 B8S_ 7728526] BSB 7-9 _Laempresa Blectric Pizza esti considerando 1a distribucién a nivel nacional de su producto que ha teni- do éxito a nivel local y para ello recabé datos de venta pro forma. Las ventas mensuales promedio (en mi- les de délares) de sus 30 distribuidores actuales se listan a continuacién. Tratando estos datos como a) una muestra y b) como una poblacién, caleule la desviacién estindar, 280 capitulo 7 Estacion = 710 mova Soluciones a los ejer EA 7-1 EA 72 730 38045 BS 28 38 SS. 6777 5B BOD 693766 STS 210 50S SB BAD En una muestra de 400 trabajadores textiles, 184 de ellos expresaron gran insatisfaccién con el plan pro- puesto para modificar las condiciones de trabajo. Como el descontento de este grupo fue lo suficientemen te fuerte para hacer que la administracién de la fabrica considerara la reaccién al plan como altamente né zgativa, tienen curiosidad de conocer Ia proporeién del total de trabajadores en contra. Dé una estimacién puntual de esta proporcién, Lared Amigos de los Videntes cobra $3 por minuto para conocer los secretos que pueden cambiar su vida, La red s6lo cobra por minutos completos y redondea hacia arriba para beneficiar @ la compadia, Asi, una Ila- ‘mada de 2 minutos 10 segundos cuesta $9, Se da una lista de 15 cobros seleccionados al azar 309 6 2m @ % 6 8 6 5% 2m mM BR 8 BW 4) Encuentre la media de la muestra. >) Encuentre una estimacién puntual de la varianza de la poblacién. ©) @Puede esta muestra usarse para estimar la duracién promedio de una llamada? Si es asi, jeudl es la estimacién? Si no, gqué se puede estimar con esta muestra? s de autoevaluacion 2003.65 Ex = 128.5 = _ 2x _ 1285 ” 9 9 = 14.2778 miles de personas 2003.65 — 9(14.2778)" 8 2 1 2 = ee = 21.119 (miles de personas)? Be _ 2407 © BE = ATT _ 99.295 minutos a) E ) La poblacién de tiempos registrados en el LOTP. ©) No, no se puede. Debido a que el tiempo de entrega mayor que 30 minutos se registra como 30 minu- tos, usar estos datos subestimara en forma consistente el promedio del tiempo de entrega. 7.3 Estimaciones de intervalo: conceptos basicos Iritamos con fa estimacén punta El propésito de tomar muestras es conocer més acerca de una poblacién. Podemos calcular esta ine formacién a partir de las muestras como estimaciones puntuales, que acabamos de analizar, 0 como estimaciones de intervalo, que son el tema del resto de este capitulo, Una estimacién de intervalo describe un rango de valores dentro del cual es posible que esté un pardmetro de la poblacién. Suponga que el director de estudios de mercado de una fabrica de refacciones automotrices ne- cesita hacer una estimacién de la vida promedio de las baterias para autom6vil que produce su com- paiia, Seleccionamos una muestra aleatoria de 200 baterias, registramos el nombre y direecién de los propietarios de los automéviles, como estén en los registros de ventas, y entrevistamos a estas personas con respecto a la duracin de la baterfa de su automévil. Nuestra muestra de 200 usuarios tiene una vida media de las baterias de 36 meses. Si utilizamos la estimacién puntual de la media de 73 Estimaciones de intervao:conceptosbisies 281 Bisqueda dl eer probable de esta stimacén (btencén de a estimadén deintervalo FIGURA7-1 Distroueién muestra de la media para mmuestras de 200 bateras Ja muestra ¥ como el mejor estimador de la media de la poblacién 4, informariamos que la vida me- dia de las baterias de la empresa es 36 meses. Pero el director también pide una conclusién acerca de la incertidumbre que acompafard a esta estimacién; es decir, una afirmacién acerca del intervalo dentro del cual es probable que esté la me- dia de la poblacién desconocida. Para proporcionar tal afirmacién, necesitamos encontrar el error estindar de la media. En el capitulo 6 aprendimos que si seleccionamos y graficamos un nimero grande de medias de muestras de una poblacién, la distribucién de estas medias se aproximaré a la curva normal. Ade- ‘més, la media de las medias muestrales sera la misma que la media de la poblacién, Nuestro tama- fio de muestra de 200 baterfas es suficientemente grande para poder aplicar el teorema central de! li- rite; como se hizo de manera gréfica en la figura 7-1. Para medir la extensién, o dispersién, de muestra, distribucién de medias muestrales, podemos utilizar la siguiente formula* y calcular el error estan- dar de la media: ror extndarde a media denn tind parsunapolscén init ————— = ‘ea polscan (6-1) Suponga que ya se estimé la desviacién estindar de la poblacién de baterias y se informé que es 10 meses, Con esta desviacién esténdar y la primera ecuacién del capitulo 6, podemos calcular el error andar de la media: (61) ~ 7414 0.707 meses. © Unerereindr frase Ahora, podemos informar al director que nuestra estimacién de la vida ttl de las baterias de la compatiia es 36 meses y que el error estindar que acompatia a esta estimacién es 0.707. En otras palabras, la vida ditil real para todas las baterias puede estar en alguna parte de la estimacién de ine tervalo comprendida entre 35.293 y 36.707 meses. Esto es ditil pero no es suficiente informacién para el director. Necesitamos calcular la posibilidad de que la duracién real de las baterias esté en este intervalo o en otros intervalos de diferentes anchos que podamos escoger, +20 (2 X 0.707), +3o (3 X 0.707), y asi sucesivamente. + No se us6 cl mukiplcador de poblacién fnta para caleular el error estindar dela media porque la poblacién de bateras es To suicientemente grande para consderaria init 282 capitulo 7 Estacion Bisqueda de la probabildad de que Ta media caiga en festa estmacén del renal FIGURA 7-2 Gierto nero de intervalos constridos alrededor de las medias muestrales; todos, excepto uno, incluyen ala media de la poblacén Probabilidad de que el verdadero parametro poblacional caiga dentro de la estimacién del intervalo Para empezar a resolver este problema, debemos repasar las partes importantes del capitulo S. Traba- jamos con la distribucién normal de probabilidad y aprendimos que porciones especificas del rea rio la curva normal estén localizadas entre més-menos cierto mimero de desviaciones estindar partir de la media, En la figura 5-12 vimos cémo relacionar estas porciones con probabilidades espe- cificas Afortunadamente, podemos aplicar estas propiedades al error estindar de la media y afirmar lo siguiente acerca del rango de valores que se utilizaron para hacer una estimacién de intervalo en nuestro problema de las baterias. La probabilidad es 0.955 de que la media de una muestra de 200 baterias esté dentro de =2 errores estindar de la media de la poblacién, Dicho de manera diferente, el 95.5% de todas las medias mues- trales esté dentro de +2 errores estindar de je y, en consecuencia, 4 esté dentro de “+2 errores es- tandar del 95.5% de todas las medias muestrales. Teéricamente, si seleccionamos 1,000 mues- tras al azar de una poblacién dada y luego construimos un intervalo de +2 errores estindar alrededor de la media de cada una de esas muestras, cerea de 955 de estos intervalos incluirin a la media de la poblacién, De manera parecida, la probabilidad de que la media de la muestra esté dentro de +1 error cestindar de la media de la poblacién es 0.683, y asi sucesivamente. Este concepto teérico es funda- ‘mental para nuestro estudio sobre la construccién de intervalos y la inferencia estadistica, La figura 7-2 ilustra el concepto de manera grfica e indica cinco de esos intervalos. Unicamente el intervalo construido alrededor de la media de la muestra %, no contiene a la media de la poblacién, En pala- bras, los estadisticos describirian as estimaciones de intervalos representadas en la figura 7-2 como si- ‘gue: “La media de la poblacién y, estaré localizada dentro de +2 errores esténdar de la media mues- tal el 95,5% de las veces.” ‘En lo que concierne a cualquier intervalo particular de la figura 7-2, éste contiene a la me- dia de la poblacién o no la contiene, pues la media de la poblacidn es un parémetro fijo. Como sabemos que el 95.5% de todas las muestras el intervalo contendra a la media de la poblacién, deci- mos que hay 95.5% de confianza de que el intervalo contenga a la media de la poblacién. de; itenlesaal ii | Tem natosael -7—|]-——$-— Sto; umastaty | i aap t : temstes iat ! {tera para} | ee, {Wma i eve para i emotes z 73 Estimaciones de intervalo:conceptosbisices 283 Una esiracén mis Stl de a vida de Tas baeras Con la aplicacién de lo anterior al ejemplo de las baterias, podemos dar un informe al director. ‘Nuestra mejor estimacién de la vida itil de las baterias de la compaitia es 36 meses, y tenemos 68.3% de confianza de que la vida itil se encuentra en el intervalo que abarca de 35.293 a 36.707 meses (36 + log). Similarmente, tenemos 95.5% de confianza de que la duracién caiga dentro del intervalo comprendido entre 34.586 y 37.414 meses (36 + 205), y tenemos el 99.7% de confianza de que la vi- da atl de una bateria estard dentro del intervalo que va de 33.879 a 38.121 meses (36 + 305) SUGERENCIAS Y ‘SUPOSICIONES Cada vez que se hace una estimacién exis- te un error implicito en ella, Para que las personas Jo entiendan, es una prictica vat cientos de miles de conjuntos de Hlantas hasta que se desgastaran, y después calcular cudnto duraron en prome- dio, Advertencia: incluso en este caso estatia haciendo un EEE comin deseribirlo con una afirmacién como “nuestra mejor estimacién de la vida de estas llantas es 40,000 millas y tenemos una seguridad del 90% de que Ja vida estaré entre 35,000 y 45,000 millas”. Pero si su jefe guiere saber cudl es la vida promedio exacta de un conjun- to de llantas, y no supiera de muestreo, tendria que obser- miuestreo porque es imposible observar y medi todos los Jjuegos de Ilantas que estan en uso. Es mucho menos costo- so y mas réipido usar el muestreo para encontrar la respues- ta. Sientiende las estimaciones, puede decirle a su jefe qué riesgos implica usar una muestra para estimar la vida util real de la lanta. FA 7-3. Para una poblacién con una vatianza conocida de 185, una muestra de 64 individuos Hleva a 217 como es- timacién de ta media. a) Encuentre el error estindar de la media, }) Establezca una estimacién de intervalo que ineluya la media de la poblacién el 68.3% del tiempo. EA 7-4 Eunice Gunterwal es una ahorradora estudiante de licenciatura de la universidad del estado que esta inte- resada en comprar un auto usado. Selecciona al azar 125 anuncios y ve que el precio promedio de un au- ton esta muestra es $3,250, Eunice sabe que la desviacién estindar de los precios de los autos usados en esta ciudad es $615. a) Establezca una estimacién de intervalo para el precio promedio de un automévil de manera que Eu- nice tenga una seguridad del 68.3% de que la media de la poblacién esta dentro de este intrvalo ') Establezca una estimacion de intervalo para el precio promedio de un auto de modo que la seforita ‘Gunterwal tenga el 95.5% de eerteza de que la media de la poblacin esté dentro de este intervalo, Conceptos basicos [7-12 Deuna poblacién que se sabe tiene una desviacién esténdar de 1.4, se toma una muestra de 60 individuos. ‘Se encuentra que la media de esta muestra es 6.2 a) Encuentre el error estindar de la media, b) Construya una estimacién de intervalo alrededor de la media de la muestra, utilizando un error estin- dar de la media, 7-13 De una poblacién con desviacién estindar conocida de 1.65, una muestra de 32 elementos dio como re- sultado 34.8 como estimacién de la media, a) Encuentre el error estindar de la media, ) Calcule un intervalo estimado que incluya la media de la poblacién el 99.7% del tiempo. Aplicaciones M_ 7-14 La Universidad de Carolina del Norte esta llevando a cabo un estudio sobre el peso promedio de los ado- quines que conforman los andadores del campus. Se envia a algunos trabajadores a desenterrar y pesar 284 Capitulo 7 Estimacién 71S 78 una muestra de 421 adoquines, y el peso promedio de la muestra resulta ser 14.2 libras. Todo mundo sa~ bbe que la desviacién esténdar del peso de un adoquin es 0.8 libras, 1) Encuentee el error estindar de la media 'b) {Cual es el intervalo alrededor de la media de la muestra que incluird la poblacién de la media el 95.5% de las veces? Debido a que cl ducfio del restaurante recientemente abierto, El Refugio del Bardo ha tenido dificultades alestimar la cantidad de comida que debe preparar cada tarde, ha decidido determinar cl nirmero medio de clientes a los que atiende cada noche. Seleccioné una muestra de 30 noches que le arrojaron una me- dia de 71 clientes, Se legé a la conclusin de que la desviacion estindar de la poblacion es 3.76. 4) Déuna estimacién de intervalo que tenga el 68.3% de probabilidad de incluir ala media de la poblacién. +) Déuna estimacién de intervalo que tenga el 99.7% de probabilidad de incluir ala media de la poblacién. La administradora del puente Neuse River esta preocupada averca de la cantidad de automéviles que pasan sin pagar por las easetas de cobro automatics del puente, y esta considerando cambiar la manera de co- brar, si el cambio permite solucionar el problema. Muestreé al azar 75 horas para determinar la tasa de vio- lacién, El nimero promedio de violaciones por hora fue 7. Si se sabe que la desviacién estindar de la poblacién es 0.9, estime un intervalo que tenga el 95.5% de probabilidad de contener a la media verdadera Gwen Taylor, administradora de los departamentos WilowWood, desea informar a los residentes poten- ciales cudnta energia eléctrica pueden esperar usar durante el mes de agosto, Selecciona 61 residentes aleatorios y descubre que su consumo promedio en agosto es 894 kilowatts hora (kwh). Gwen piensa que la varianza del consumo es alrededor de 131 (kwh) 1). Establezca una estimacién de intervalo para el consumo promedio de energia eléctrica en el mes de agosto para que Gwen pueda tener una seguridad del 68.3% de que la media verdadera de la pobla- cidn esté dentro de este intervalo ’b)_Repita la parte a) para una certeza del 99.7%. ©). Sil precio por kilowatt es $0.12, ;dentro de qué intervalo puede Gwen estar 68.3% segura que cac~ ri el costo promedio de agosto por consumo de clectricidad? La Junta Directiva de Escuelas Estatales del condado Pesimismo considera que su tarea més importante <5 mantener el tamafio promedio de los grupos de sus escuelas menor que el tamafio promedio de los gru- pos de Optimismo, el condado veeino. Dee Marks, la superintendente de escuelas de Pesimismo, acaba de recibir informacién contfiable que indica que el tamafio del grapo promedio en Optimismo este aio es 30.3 estudiantes. Todavia no tiene los datos correspondientes de los 621 grupos de su propio sistema es- colar, de modo que Dee se ve forzada a basar sus célculos en los 76 grupos que han informado acerca 4ée su tamaio de grupo, que producen un promedio de 29.8 estudiantes. Dee sabe que el tamatio de grupo de las escuclas de Pesimismo tiene una distribucién con media desconocide y una desviacién estindar de 8.3 estudiantes. Suponiendo que la muestra de 76 estudiantes que tiene Ia seforita Marks es una muestra alea- toria de la poblacién de los grupos del condado Pesimismo’ 4) Eneuentre un intervalo en el cual Dee Marks pueda tener el 95.5% de certeza de que contendré a la media real b)_ {Usted cree que la sefiora Dee ha conseguido su objetivo? Soluciones a lo ejercicios de autoevaluacion EA EA 13 14 P=185 = VIBS= 1360 n= 64 217 a) o/ Vn = 13.60/V64 = 1,70 b) F# og= 217 * 1.70 = 2153, 218.7) o= 615 125 ¥=3,250 a) Vn = 615/V 125 = 55.01 (83,194.99, $3,305.01) = 5,250 = 2(55.01) = 3,250 * 110.02 = ($3,139.98, $3,360.02) a) F+ oy = 3,250 = $5.01 by) E42 7.4 Estimaciones de intervalo e intervalos de confianza Alutilizar estimaciones de intervalo no nos estamos limitando a +1, 2 3 errores estandar. De acuet~ do con la tabla I del apéndice, * 1.64 errores esténdar, por ejemplo, incluyen aproximadamente el 7.4 Estimaciones de intervalo e intervalos de confiamza = 285, Defcon de nivel de confines Estimacgn a parte de una sla muestra 90% del érea bajo la curva y, as, 0.4495 del drea a ambos lados de la media en una distribucién nor- mal, De manera parecida, +2.58 errores estindar incluyen alrededor de 99% del érea 0 el 49.51% a cada lado de la media, En estadistica, la probabilidad que asociamos con una estimacién de intervalo se conoce ¢o- mo nivel de confianza. Esta probabilidad indica qué tanta confianza tenemos de que la estimacién de intervalo ineluya al parmetro de poblacién. Una probabilidad més alta implica una mayor con- fianza, En la estimacién, los niveles de confianza que se utilizan con mas frecuencia son 90, 95 y 99%, pero somos libres de aplicar cualguier nivel de confianza. En la figura 7-2, por ejemplo, utili- zamos un nivel de confianza del 95.5%. El intervato de confianza es el rango de la estimacién que estamos haciendo. Si informamos que tenemos el 90% de confianza de que la media de la poblacién de ingresos de las personas que viven en una cierta comunidad esta entre $8,000 y $24,000, entonces el rango $8,000-824,000 es nuestro intervalo de confianza. A menudo, sin embargo, expresaremos el intervalo de confianza en términos de errores estindar, més que con valores numéricos. Asi, expresaremos los intervalos de confianza de esta forma: ¥ + 1.6405, donde: Entonces, los limites de confianza son los limites superior e inferior del intervalo de confianza. En este caso, ¥ + 1.640; se conoce como limite superior de confianza (LSC) y ¥— 1.640% es el limite inferior de confianza (LIC). Relacidn entre nivel de confianza e intervalo de confianza Podria pensarse que deberiamos utilizar un alto nivel de confianza, como 99%, en todos los prable- ‘mas sobre estimaciones, Después de todo, parece ser que un alto nivel de confianza significa un al- to grado de precision en lo que a la estimacién concieme. En la préctica, sin embargo, altos niveles de confianza producen intervalos de confianza grandes, y éstos, de hecho, dan estimaciones bastan- te imprecisas. Considere, por ejemplo, el easo de un cliente de una tienda de electrodomésticos que pregunta s0- bre la entrega de una nueva lavadora de ropa. En la tabla 7-4 presentamos varias preguntas que el cliente podria hacer y las respuestas probables. Esta tabla indica la relacién directa que existe en- {re el nivel de confianza y el intervalo de confianza de cualquier estimacién. A medida que el cliente va estableciendo un intervalo de confianza cada vez mas estrecho, el administrador de la tienda con- siente en un nivel de confianza cada vez més bajo. Note, también, que cuando el intervalo de con- fianza es demasiado amplio, como en el caso en que la entrega tarda un affo, la estimacién puede tomar un valor real muy pequefio, a pesar, incluso, de que el administrador le da un nivel de confianza del 99% a dicha estimacién. De manera parecida, si el intervalo de confianza es muy reducido (Lle- gard la nueva lavadora @ mi casa antes que yo?), la estimacién esté asociada a un nivel de confianza tan bajo (1%) que cuestionamos su valor. Uso de muestreo y estimacién de intervalos de confianza En nuestro anilisis de los conceptos basicos de la estimacién de intervalos, particularmente en la fi- ura 7-2, deseribimos muestras de una poblacién tomadas de manera repetida con el fin de estimar un pardmetro, Mencionamos, también, la seleccién de un gran nimero de medias muestrales de una poblacién. En la practica, sin embargo, a menudo resulta dificil o costoso tomar més de una mues- ‘ra de una poblacién, Con base en una sola muestra estimamos el pardmetro de la poblacién, Debe- ‘mos tener cuidado, entonces, en la interpretacién de los resultados de este proceso. Suponga que calculamos, en el ejemplo de las baterias y a partir de una sola muestra, el interva- 0 de confianza y el nivel de confianza: “Tenemos el 95% de confianza de que la vida media de 286 capitulo Estacion pe Respuesta del Inervalo Pregunta instead Wve de confianza de cofianza eee del cliente a ied implied impliade RAMU P SAI Liga ie mado Tengo bolt Mayor qe 98% Unafo antes de un af? center del. {Me enegerinalavadora Estoy sepia que Alene 95% Unmes ates dun mes larch en esters {Meeriegerinlaavadora——Esoybasante seg de que Abededor del 80% Una semana antes de na sarana? ‘sen a semana len lalavdoraenmi No tenglacertera de Aadedor de 0% Unda cata mafia? poder ace. {Ug lanuevalovdora ——ayuna peut posbidad, Cano 1% Unatora ami casa antes que yo? baterias de la poblacién se encuentra entre 30 y 42 meses.” Esta afirmacién no significa que se tiene 0.95 de probabilidad de que la vida media de todas las baterias caiga dentro del intervalo esta- blecido para esta muestra, Mas bien, indica que si seleccionamos muchas muestras aleatorias del mismo tamaio y calculamos un intervalo de confianza para cada una de esas muestras, entonces en alrededor del 95% de los casos Ia media de la poblacién caer dentro de dicho in- tervalo, SUGERENCIAS Nada es gratis en lo que respecta anive- intervalo de confianza y aceptar una promese amplia de Y lese intervalos deconfianza, Cuando ob- tiempo de entrega (“en algin momento del ao”). Por oto SUPOSICIONES tiene mas de uno, deberé tener_menos del lado, sino le preocupa la exacttud de a estimacin, su per- MEEEEIEEEES otro, Es recomendable, para comprender sonal de entrega podria decir “tengo una seguridad del 1% esta importante relacién, que regrese ala tabla 7-4. Side- de que podemas entregarle en menos de | hora”. Nose pue- sea que la estimacién del tiempo de entrega tenga una exac- de tener las das cosas al mismo tiempo. titud perfecta del (100%), deberd sacrificar precisién en el Ejercicios de autoevaluacion EA 1-8 Dados los siguientes niveles de confianza, expresc los limites inferior y superior del intervalo de confian- za para estos niveles en términos de ¥ y oy. a) 54%. b) 75%. ©) 94%, ) 98%, Conceptos basicos 719 Defina el nivel de confianza para una estimacién de intervalo, 7-20. Defina el intervalo de confianza 7-21 Suponga que desea utilizar un nivel de confianza del 80%. Dé el limite superior del intervalo de eonfian- za en términos de la media de la muestra, ¥, y del erorestindar, 0 7-22 {De qué forma podria una estimacién ser menos significativa debido a 2) unalto nivel de confianza? um estrecho nivel de confianza? 7.4 Estimaciones de intervalo e intervalos de confianza = 287 7-23 Suponga que se toma una muestra de 50 elementos de una poblacién con desviacién estindar de27, y que Ia media de la muestra es 86. a) Establezca una estimacién de intervalo para la media de la poblacién que tenga el 95.5% de certeza de incluir a la media verdadera de la poblacién. ) Suponga, ahora, quo el tamafio de la muestra es 5,000 elementos. Establezca un intervalo para la me- ia de la poblacién que tenga cl 95.5% de certeza de incluir a la media verdadera de la poblacién, ©) {Por qué la estimacién del inciso a) seria preferible a la del inciso b)? Por qué la estimacién del in- ciso b) seria mejor que la del inciso a)? 7-24 Elnivel de confianza para una estimacidn, {esta basado en el intervalo obtenido a partir de una sola muestra? 7-25 Dados los siguientes niveles de confianza, exprese los limites inferior y superior del intervalo de confian- za.en términos de¥ y de a) 60%, b) 70%, ©) 92%, a) 9 Aplicaciones 7-26 Steve Klippers, duetio de la peluqueria Steve's, se ha formado una buena reputacién entre los residentes de Cullowhee. Cuando un cliente entra a su establecimiento, Steve grita los minutos que el cliente debe- 14 esperar antes de que se le atienda. El dnico estadistico del pueblo, después de frustrarse por las poco precisas estimaciones puntuales de Steve, ha determinado que el tiempo de espera real de cualquier clien- te esta distribuido normalmente con una media igual a la estimacién de Steve en minutos y una desvia- cin estindar igual a 5 minutos divididos entre la posicién del cliente en la fila de espera. Ayude a los clientes de Steve's a establecer intervalos con el 95% de probabilidad para las situaciones siguientes: a) Elcliente es el segundo en la fila y la estimacién de Steve es 25 minutos. b) El cliente es el tereero y la estimacidn de Steve es 15 minutos. ©) Elcliente es el quinto de la fila, y la estimacion de Steve es 38 minutos. 4) El clicnte es el primero de la fila y la estimacion de Steve es 20 minutos, {Qué diferencia existe en- tre estos intervalos y los intervalos de confianza? Soluciones a los ejercicios de autoevaluacion EFA 75 a) T2070; bE 1 MS0z JT =18VOZ T= 2330, 7.5 Calculo de estimaciones de intervalo de la media a partir de muestras grandes Bisqueda de Un mayorista de refacciones automotrices necesita una estimacién de la vida media que puede es- we perar de los limpiadores de parabrisas en condiciones normales de manejo, La administracién de la ‘empresa ya ha determinado que la desviacién esténdar de la vida itil de la poblacién es 6 meses. Su- sete ponga que seleccionamos una sola muestra aleatoria de 100 limpiadores, tomamos los datos referen- tes a su vida itil y obtenemos los siguientes resultados: 1m = 100 = Tanai deta musta Desisciin F = 21 meses & Maca cela ruesa estindar de 6 meses < Desi estar dea plein lapotacién Como el distribuidor utiliza decenas de miles de limpiadores al afio, nos pide que encontremos una estimacién de intervalo con un nivel de confianza del 95%. El tamafio de la muestra es mayor que 30, de modo que el teorema central del limite nos permite usar la distribucién normal como distri- 288 capitulo Estacion Célula de es ites de confanea Nuesta concusign Bdsqueda 6e un intealo de cenvianza el 90% bucién de muestreo, aun cuando nuestra poblacién no tenga distribucién normal. Calculamos el error cestindar de la media con la ecuacién 6-1 = (6-1] = 0.6 meses + érarestinis dela mesa gra un poten nina ‘A continuacién consideraremos el nivel de confianza con el cual estamos trabajando, Como un nivel Vo0 +b) F + 2,056, = 6.2 + 2.05(0.167) = 6.2 = 0.342 = (5.86, 6.54) Capitulo 7 Estimacién EA 77 n=0 2a psi b) p= G/Va = 21 VE = 0.267 psi ©) F 4 1.9665 = 24 1,96(0.267) = 24 + 0.523 23.48, 24.52) psi 7.6 Calculo de estimaciones de intervalo de la proporcion a partir de muestras grandes Repaso de le dtr Limitaciones de a Atribucn binomial Bisqueda de lo media dela propocén de Fa muesta Los especialistas en estadistica, a menudo, utilizan una muestra para estimar la proporcién de ocu- rrencias de un evento en una poblacién. Por ejemplo, el gobiemo estima, mediante un procedimien- to de muestreo, el indice de desempleo o la proporcién de personas sin trabajo de la fuerza laboral el pais. Enel capitulo 5 introdujimos la distribucién binomial, una distribucién de datos discretos, no con- tinuos. Presentamos, también, las dos f6rmulas para derivar la media y la desviacién esténdar de la istribucién binomial: Hemp 15:2] (npg 53] donde, + n= mimero de ensayos o intentos * p= probabilidad de éxito + q=1—p = probabilidad de falla ‘Teéricamente, la distribucién binomial es la distribucién correcta a utilizar en la construccién de in- tervalos de confianza para estimar una proporcién de poblacién, Debido a que el edlculo de probabilidades binomiales es demasiado tedioso (recuerde que la pro- babilidad de obtener r éxitos en n ensayos es [n! /r!(n— 7)!][p"g"~"), uso de la distribucién bino- ial para elaborar estimaciones de intervalo de la proporcién de una poblacién es una proposicién complicada. Afortunadamente, conforme aumenta el tamafio de la muestra, la distribucién binomial puede aproximarse por una distribucién normal apropiada, que podemos utilizar para aproximar la distribucién muestral. Los estadisticos recomiendan que en la estimacién, n sea lo suficientemente ‘grande para que tanto np como ng sean al menos 5 cuando se utiliza la distribucién normal como sustituto de la binomial, Expresemos en simbolos la proporcién de éxites en una muestra con p (se lee p gorro). Luego. ‘modifiquemos la ecuacién 5-2 de manera que podamos utilizarla para derivar la media de la distri- bucién de muestreo de la proporcién de éxitos. En palabras, 4. = np muestra que la media de la dis- tribucién binomial es igual al producto del nimero de ensayos, n, por la probabilidad de obtener un éxito, ps esto es, np es igual al niimero medio de éxitos. Para cambiar este mimero de éxitos ala pro- porcién de éxitos, dividimos np entre n y obtenemos s6lo el valor de p. La media, que se encuentra al lado izquierdo de la ecuacién se convierte en iz, es decir, en la media de la distribucién de mues- treo de la proporeién de éxitos Media de la distribucion muestral de la proporcion My? (73) 116 Chleo de estimaciomes ce intervalo de la proporcion a partir de muestras grandes 293 Busqueda dela desiacin estandar dela proporcin de fa muesva Estinacgn de la proporcén de ‘una poblcén ode los Utes de confiaea De forma parecida podemos modificar la formula para la desviacién estindar de ta distribucién bino- mial, Vnpq, que mide la desviacién estindar del nimero de éxitos. Para cambiar el mimero de éxi- tos a la proporcién de éxitos, dividimos Vipa, entre n y obtenemos Vipq /n. En términos estadi cos, la desviacién estindar de la proporcién de éxitos en una muestra se expresa en simbolos como: Error estandar de la proporcién eine det poping, =P 17-4 V y se conoce como el error estindar de la proporcién Podemos ilustrar cémo utilizar estas formulas si, para una organizacién muy grande, hacemos la cestimacién de qué proporcién de sus empleados prefieren planificar su propios beneficios de retiro en lugar de seguir un plan patrocinado por la compaiifa. Primero, tomamos una pequefia muestra aleatoria de 75 empleados y encontramos que el 0.4 de ellos estén interesados en seguir sus propios planes de retito, Nuestros resultados son: = 75 Tena ce muna B= 04 Proportin de himaesta a oer = 0.6 — Propo dea mans en cone A continuacién, la administracién solicita que utilicemos esta muestra para encontrar un intervalo en el que puedan tener e1 99% de confianza de que contiene a la proporcién verdadera de la poblacién. Pero, para la poblacidn, ,qué son py 4? Podemos estimar los parametros de la poblacién median- te la sustitucién de los estadisticos correspondientes de la muestra, py 4 (p gorro y q gorro) en la formula del error estandar de la proporeién.* Al hacer esto obtenemos Error estandar estimado de la proporcién Simodo que inden qu st esinanto eleror estes deb paren brat dela mesa (7-5) = 0.057 tor etd etna db proatén Ahora estamos en posibilidades de proporcionar la estimacién que la administracién necesita, usando el mismo procedimiento que seguimos con anterioridad. Un nivel de confianza del 99% inctuiria 49.5% del érea que se encuentra a cualquier lado de la media de la distribucién de muestreo. El cuerpo de la tabla I del apéndice nos dice que 0.495 del érea bajo la curva normal esta localizada centre la media y un punto que se encuentra a 2.58 etrores estindar de la media, En consecuencia, 99% del dea esta contenida entre mas y menos 2.58 errores estindar de la media, Nuestros limites de con- fianza entonces son: * Note que no uilizamos el multilicador de poblacién fina, debido a que nuestra poblacién es muy grande en comparaciin con el mado de la muestea 294 capitulo 7 estimacion B+ 258 dy = 04 + 2.58(0.057) =04 +0147 = 0.547 = rite super de cntaca 2.58 dy = 0.4 = 2,58(0.057) = 04-0147 = 0.253 < snes contanan ~ Nuesraconduson _Entonces, estimamos a partir de nuestra muestra de 75 empleados que, con el 99% de confianza, ‘ereemos que la proporcién de la poblacién total de empleados que desean establecer sus propios pla- nes de retiro esté entre 0.253 y 0.547. SUGERENCIAS Las mismas suposiciones, sugerencias y al menos 5, se puede usat la distribucién normal para apro- y advertencias establecidas en la pagina ximar la binomial. Si éstees el caso, se procede justo como SUPOSICIONES 293 se aplican en este caso. La imica di- se hizo con las estimaciones de intervalo de la media. Ad- MNENENEEEEEENE ferencia es que ahora, como se trata de _vertencia: como el error estindar exacto de la proporcién tuna proporcién, la distribucién binomial es la distribucién _depende de la proporcién desconocida de la poblacién (p), ‘muestral correcta. Recuerde, del capitulo 5, que mientras n debe estimar p mediante f, y usar fen la ecuacién 7.5 pa- sea suficientemente grande para que tanto np como ng sean ra estimar el error estindar de la proporcién, Ejercicios 7.6 Ejercicios de autoevaluacion EA 7-8 Cuando se sonde6 una muestra de 70 ejecutivos de ventas respecto al bajo desempefio durante noviembre en la industria de ventas al menudeo, el 66% pens6 que la disminucién en las ventas se debia a las tem- peraturas inusualmente altas, haciendo que los consumidores retrasaran sus compras de articulos de ine a) Estime el error estindar de la proporcién de ejecutives de ventas que culpan al clima caliente de las bajas ventas. bb). Eneuentre tos limites de confianza superior ¢ inferior para esta proporcién dado un 95% de nivel de confianza EA 7-9 _ El doctor Benjamin Shockley, un psicdlogo social reconocido, entrevist6 a 150 ejecutivos de alto nivel y encontré que 42% de ellos no podia sumar fracciones correctamente, a) Estime el error estandar de la proporcién. ). Construya un intervalo de confianza del 99% para la proporcién verdadera de ejecutivos de alto nivel que no puede sumar fracciones correctamente. Aplicaciones 7-35 Pascal Inc., una tienda de computacién que compra al mayoreo chips sin probar para computadora, esté considerando cambiar a su proveedor por otto que se los offece probados y con garantia, a un precio ‘ms alto. Con el fin de determinar si éste es un plan costeable, Pascal debe determinar la proparcién de chips defectuosos que le entrega el proveedor actual. Se probé una muestra de 200 chips y 5% tenia defectos. a). Estime el ertor estandar de la proporcién de chips defectuosos. 'b) Construya un intervalo de confianza del 98% para la proporcién de chips defectuosos adquiridos. 7-36 General Cinema obtuvo una muestra de 55 personas que vieron Caza Fantasmas 8 y les preguntaron si planeaban verla de nuevo, Sélo 10 de ellos pensaron que valia la pena ver la pelicula por segunda vez. a) Estime el error estdndar de la proporcidn de asistentes al cine que verdn la pelicula por segunda vez, b) Construya un intervalo de confianza del 90% para esta proporcién. 26 Chlelode estimaciomes de intervalo de la proporcion a partir de muestras andes 295 739 7-40 TAL 742 743 La encargada de publicidad para el nuevo postre garapifiado de lima-limén de los productos Clear‘n Light esti intranquila por el mal desempeno del postre en el mercado y por su futuro en la empresa. Preocupa- dda porque su estrategia de comercializacién no ha producido una identificacion apropiada de las caracte- risticas del producto, tomé una muestra de 1,500 consumidores y encontré que 956 de éstos pensaban que l producto era una cera para pulir pisos. a) Estime cl errar estindar de la proporcién de personas que tuvo esta grave interpretacién errénea del postr b)_Construya un intervalo de confianza del 96% para la proporcién verdadera de la poblacion, Michael Gordon, un jugador profesional de basquetbol, lanz6 200 tiros de castigo y encest6 174 de ellos. a). Estime el error esténdar de la proporeién de todos los tiros que Michae! fall, ) Construya un intervalo de confianza del 98% para la proporcién de todos los tiros de castigo que Mi- cchael fala, Hace poco SnackMore encuest6 a 95 consumidores y encontré que el 80% compraba galletas sin grasa de SnackMore cada mes. a) Estime el error estandar de la proporcién, b) Construya un intervalo del 95% de confianza para la proporcién verdadera de personas que compran las galletas cada mes, EL duefio de la empresa Home Loan Company investigé aleatoriamente 150 de las 3,000 cuentas de la compaiia y determin6 que el 60% estaba en una posicién excelente a) Encuentte un intervalo de confianza del 95% para la proporcién de cuentas que estén en posicidn ex- celente, b) Con base en el inciso anterior, zqué tipo de estimacién de intervalo podria dar para el nimero abso- Iuto de cuentas que cumplen con el requisito de excelencia, manteniendo el mismo nivel de confian- za del 95%? Durante un aiio y medio las ventas han estado disminuyendo de manera consistente en las 1,500 sucursa- les de una cadena de comida répida. Una empresa de asesores ha determinado que el 31% de una mues- ira de 95 sucursales tiene claros signos de una mala administracién. Construya un intervalo de confianza del 98% para esta proporcién. El eonsejo estudiantl de una universidad tomé una muestra de 45 libros de texto de la librerfa universita- ria y determind que de ellos, 60% se vendia en més del 50% arriba de su costo al mayoreo, Dé un inter- valo de confianza del 96% para la proporeién de libros cuyo precio sea més del 0% mayor que el costo al mayoreo, Barry Tumbull, el famoso analista de Wall Street, esta interesado en conocer Ia proporcién de accionistas individuales que plancan vender al menos un cuarto del total de sus valores el mes préximo. Barry ha cfec- tuado una inspeeeién aleatoria de 800 individuos que poseen acciones y ha establecido que el 25% de st ‘muestra planea vender al menos la cuarta parte de sus acciones el mes siguiente. Barry esté a punto de pu- blicar su esperado informe mensual, “Pulso de Wall Street: indicador de cotizaciones”, y le gustaria po- der dar un intervalo de confianza a sus leetores. Esta més preoeupado por estar en lo correeto que por el ancho del intervalo. Construya un intervalo de confianza del 90% para la proporcién verdadera de accio- nistas individuales que planean vender al menos un cuarto de sus acciones durante el siguiente mes, Soluciones a los ejercicios de autoevaluacion 296 19 = 0.0566 b) pH 1.966, = 0.66 = 1.96(0.0566) = 0.66 = 0.111 = (0.549, 0.771) 150 p= 042 CHAOS «99903 0.42 + 2,58(0.0403) = 0.42 + 0.104 = (0.316, 0.524) Capitulo 7 Estimacién 7.7 Estimaciones de intervalos con la distribucion t Aveces Adsibucion normal no es apropada Amocedentes| histrios de la ddsvibuen¢ Condon para srl dstroucén ¢ La detibudén compsrada con ddr bveibnnermal Dein de grads de Tere En los tres ejemplos anteriores, los tamaiios de la muestra eran todos mayores a 30, Muestreamos 100 limpiadores de parabrisas, 50 familias residentes de una drea de cuatro manzanas de una comu- nidad y 75 empleados de una empresa grande. En cada ejemplo, la distribucién normal era la distri- bucién de muestreo adecuada para determinar intervalos de confianza, Sin embargo, no siempre es éste el caso. ;Cémo podriamos tratar estimaciones en las que la dis- tribucién normal no es la distribucién de muestreo adecuada, es decir, cuando se estima la desvia- cin estindar de la poblacién y el tamafio de muestra es 30 0 menos? Por ejemplo, en el problema con que abrimos el capitulo, referente al uso del carbén, tenemos datos que sélo comprenden 10 sema- . Afortunadamente, existe otra distribucién que si es apropiada para estos casos. Se conoce como distribucién t Los primeros trabajos tedricos sobre la distribucién f fueron realizados por W. S. Gosset, a prin- cipios del siglo xx. Gosset era empleado de la Cerveceria Guinness en Dublin, Irlanda; la empresa no permitia que los empleados publicaran sus hallazgos de investigacién con su propio nombre. De modo que Gosset adopté el seudénimo de Student para publicar. En consecuencia, la distribucién ¢ se conoce como distribucién t de Student o simplemente distribucién de Student Debido a que se usa cuando el tamatio de la muestra es 30 o menos, los especialistas en estadis- tica, suelen asociar la distribucidn £ con estadisticas de muestras pequefias. Esto es una mala inter~ pretacién porque el tamafio de la muestra es sélo una de las condiciones que nos llevan a utilizar la Aistribucién f; la segunda es que la desviacién esténdar de la poblacién debe ser desconocida. El uso de Ia distribucién ¢ para hacer estimaciones se requiere siempre que el tamafio de la muestra sea menor o igual que 30 y Ia desviacién estindar de la poblacién no se conozca. Ademés, al utilizar la distribucién ¢, suponemos que la poblacién es normal o aproximadamente normal. Caracteristicas de la distribucién t Sin derivar la distribucién t de manera matemitica, podemos entender en forma intuitiva la relacién que existe entre la distribucién f y la distribucién normal. Ambas son simétricas. En general, la dis tribucién es més plana que la distribucién normal y hay una distribucién ¢ diferente para cada ta ‘mafio posible de muestra, Aiin asi, conforme el tamaiio de muestra se hace més grande, la forma de istribucin ¢ deja de ser plana y se aproxima mas a la distribucién normal, De hecho, para tama- fios de muestra mayores que 30, la distribucién ¢ se asemeja tanto a la normal que utilizaremos la normal para aproximar a la distribueién t Le figura 7-3 compara una distribucién normal con dos distribuciones t para tamafios de muestra diferentes. En esta figura se muestran dos caracteristicas de las distribuciones ¢. Una distribucién ¢ ‘es menor en Ia media y mayor en las colas que una distribucién normal. La figura también mues- tra cOmo la distribucién de Student tiene, proporcionalmente, una parte mayor de su drea en las co- las que la distribucién normal; por esto serd necesario alejarse mas de la media de una distribucién ¢ para poder ineluir la misma dea bajo la curva, Entonces, los anchos de intervalo de una distribucién de Student son mayores que los basados en la distribucién normal Grados de libertad Se afirmé que existe una distribucién «diferente para cada tamafio de muestra, En un lenguaje esta- Aistico apropiado, ditfamos: “existe una distribucién ¢ distinta para cada uno de los grados de liber- tad posibles”. ;Qué son los grados de libertad? Podemos definirlos como el niimero de valores que podemos escoger libremente, 7.7 Estimaciones de intervalos con la distribucin t = 297 FIGURA 7-3 Distribucién normal y distrbucién t para una muestra ay distribution tpare una muestra de tamatoa= 2 tre ejemplo Funcin de os aces de Poet 298 Capitulo 7 | isto nat Dieitustn¢ pares emaeera n= 15 Suponga que se manejan dos valores de muestra, a y b, y sabemos que tienen una media de 18, En simbolos, la situacién es: {,Cémo podemos encontrar los valores que a y b pueden tomar en esta situacién? La respuesta es que ay b pueden ser cualesquiera dos valores cuya suma sea 36, ya que 36 + 2 = 18. Suponga que sabemos que el valor de a es 10. Ahora b ya no es libre de tomar cualquier valor, si- no que debe ser 26, ya que: Si a=10 entonees. demodo que 10+ 5 por tanto b= 26 Este ejemplo nos muestra que cuando hay dos elementos en una muestra y conocemos la media muestral de esos dos elementos, entonces somos libres de especificar sélo uno de los elementos, por- que el otro estara determinado por el hecho de que los dos elementos suman el doble de la media de Ia muestra, En un lenguaje estadistico decimos que “tenemos un grado de libertad”. ‘Veamos otro ejemplo, Existen siete elementos en nuestra muestra y sabemos que la media de es- tos elementos es 16. En simbolos tenemos la siguiente situacién: En este caso, los grados de libertad o el niimero de variables que podemos especificar libremente es 7 = 1 = 6, Tenemos la libertad de asignar valores a seis variables, y luego ya no tenemos libertad de especificar el valor de la séptima variable; ésta queda determinada automaticamente, Con dos valores de muestra tenemos un grado de libertad (2 — 1 = 1), y con siete valores de muestra tenemos seis grados de libertad (7 — 1 = 6). Entonces, en cada uno de estos dos ejemplos tenemos n ~ I grados de libertad, si es el tamafio de la muestra. Similarmente, una muestra de 23 elementos nos daria 22 grados de libertad. Utilizaremos los grados de libertad cuando elijamos una distribucién ¢ para estimar una media de poblacién, y utilizaremos n ~ 1 grados de libertad, cuando n es igual al tamafio de la muestra. Por ejemplo, siutilizamos una muestra de 20 para estimar una media de poblacién, usaremos 19 grados de libertad para elegir la distribucién 1 apropiada Estimacion

You might also like