You are on page 1of 23
258 Copitvle 7 Muesteo y dstibuciones muesrles PY Ee MEADWESTVACO CORPORATION* STAMFORD, CONNECTICUT ‘MeadWestvaco Corporation, lider mundial en la produc- «ign de embalajes y papeles especiales, productos de const ‘mo y de oficinay de sustancias quimicas especiales, emplea ‘amis de 30 000 personas. Opera anivel mundial en 29 pat ses y atiende a clientes localizados en 100 paises. Mead- Westvaco tiene una posicién lider en la produccién de papel, con una capacidad de 1.8 millones de toneladas anuales, Entre los productos de In empresa se encuentran papel para libros de texto, papel para revistas, sistemas de cembalaje para bebidas y productos de oficina. Los consul- tores intemnos de MeadWestvaco usan el muestreo para ob- tener diversas informaciones que permiten a la empresa ‘ganar productividad y seguir siendo competitiva Por ejemplo, MeadWestvaco posee bosques que le pro- pporcionan los érboles, ola materia prima, para muchos de los productos de Ia empresa, Los directivos necesitan informa- ign confiable y precisa acerca de los bosques maderables para evaluar las posiblidades de satisfaccién de las futuras nevesidades de materia prima. {Cu‘l es el volumen actual de los bosques? {Cusl ha sido el crecimiento de los bosques? {Cuil es el crecimiento proyectado de los bosques? Las res- DPusstas a estas preguntas permiten a los drectivos de Ia em- presa elaborar los planes para el futuro, tales como planes a largo plazo y calendarios para la poda de Arboles. {sCémo recolecta MeadWestvaco la informacién que nevesita acerca de los amplios bosques que requiere? Los datos que obtiene de puntos muestrales en los bosques son. la base para contar con informacién acerca de Ia poblacién de drboles propiedad de la empresa, Para localizar estos puntos muestrales, primero se dividen los bosques en tres secciones de acuerdo con la localizacién y tipo de érboles Mediante mapas y niimeros aleatorios los analistas de MeadWestvaco identifican puntos muestrales aleatorios de 1/5 8 1/7 acres en cada seccién del bosque. Los ingenic- os ators agradcen a doctor Edged. Winkohiky por proporionar la informocin pare la etadinea ee prctcs El muestreo aleatorio de sus bosques permite a MeadWestvaco satisfacer necesidades futuras de ‘materia prima, © Walter Hodges/Corbis. ros forestales de MeadWestvaco recogen los datos de estos puntor muestrales para obtener informacién acerca de la poblacién forestal ‘También participan en el proceso de campo de Ia reco- leceién de datos. Con periodicidad, en equipos de dos per- sonas, recolectan a informacién de eada ébol en todos los puntos muestrales. Los datos muestrales se ingresan en el sistema computacional de inventario forestal continuo IEC) de Ia empresa, Los informes obtenidos del sistema IFC contienen informacién de distribuciones de frecuencia con estadisticas sobre los tipos de drboles, volumen de los bosques, tasas de crecimiento anteriores y crecimiento y volumen proyectados para el futuro. EI muestreo y las co- rrespondientes informaciones estadisticas de los datos smuestrales proporcionan la informacién esencial para la adecuada administraci6n de los bosques de MeadWestvaco. En este capitulo se estudiaré el muestteo aleatorio sim ple y el proceso de seleceién de muestras. Se vers también ccémo se usan estadisticos como la media muestal y la pro- porcién muestrl para estimar Ia media de la poblacién y la proporcién de la poblacién En el capstulo 1 se definieron los términos poblacisn y muestra, Estas definiciones se retoman aqut. 1. Una poblacién es el conjunto de todos los elementos que interesan en un estudio. 2. Una muestra es un subconjunto de la poblacién Alas caracteristicas numéricas de una poblacién, como Ia media y Ia desviacién estindar, se les lama pardmetros. El principal propésito de la inferencia estadistica es hacer estimaciones y prucbas de hipétesis acerca de los parémettos poblacionales usando la informaciGn que propor- Una media muetral suministra una etimacin de la media pobiacional y tua proporcién maertal de a proporciin poblacional. Con dichas titimaciones puede esperarse un cierto error de tetmacion Ete capitulo nscale bases para fstimar cua grande puede ) Een cmc 7,1. &l problema de muesireo de Electronics Associates 259 ciona una muestra, Para empezar, se presentan dos situaciones en las que a partir de muestras se obtienen estimaciones de pardmetros poblacionales 1. Un fabricante de neumsticos elabora un nuevo modelo que tendré mayor duracién que los actuales neumaticos de la empresa. Para estimar la duraci6n media, en millas, el fabrican- te selecciona una muestra de 120 neumticos nuevos para probarlos. De los resultados de cesta prueba se obtiene una duracién media de 36 500 millas. Por tanto, una estimacién de Ia duracién media, en millas, de a poblacién de nuevos neumiéticos es 36 500 millas. 2. Los miembros de un partido politico deseaban apoyar a un determinado candidato para se- nador, y los dirigentes del partido deseaban tener una estimacién de Ia proporcién de vo- tantes registrados que podfan estar a favor del candidato. El tiempo y el costo de preguntar cada uno de los individuos de la poblacién de votantes registrados eran prohibitivos. Por tanto, se seleccioné una muestra de 400 votantes registrados: 160 de los 400 votantes in- dicaron estar a favor del candidato, Una estimacién de la proporeiéa de la poblacién de votantes registrados a favor del candidato es 160/400 = 0.40, Estos dos ejemplos ilustran algunas de las razones por las que se usan muestras, Observe que en el ejemplo de los neumaticos, obtener datos sobre su tiempo de duracién implica usarlos hasta que se acaben. Es claro que no es posible probar toda la poblaci6n de neumsticos; una muestra es Ia tinica manera factible de obtener los datos de duracién deseados. En el ejemplo del candidato, preguntar a cada uno de los votantes registrados es, en teorfa, posible, pero el tiempo y el costo ppara hacerlo son prohibitivos; de manera que se prefiere una muestra de los votantes registrados, Es importante darse cuenta de que los resultados muestrales s6lo proporcionan una estima- cién de los valores de las caracteristicas de la poblacién. No se espera que la media muestral de 36 500 millas sea exactamente igual al millaje medio de todos los neumticos de la poblacién, tampoco que 0.40, © 40% de la poblacidn de los votantes registrados esté a favor del candidato. La razén es simple, la muestra s6lo contiene una parte de la poblacién. Con métodos de mues- tueo adecuados, los resultados muestrales proposcionarén estimaciones “buenas” de los pardme- ros poblacionales, Pero {cus buenos puede esperarse que sean los resultados muestrales? Por fortuna, existen procedimientos estadisticos para responder esta pregunta, En este capitulo se enseiia cémo emplear el muestreo aleatorio simple para seleccionar una ‘muestra de una poblacién, Después, cémo usar una muestra aleatoria simple para calcular estima- ciones de una media poblacional, de una desviacién estndar poblacional y de una proporcién po- Dlacional. Ademis, también se presenta el importante concepto de distribucién muestral. Como vers, el conocimiento de la distribucién muestral adecuada permite decir qué tan cerca se encuen- tran las estimaciones muestrales de los correspondientes parmetros poblacionales, En la ultima seccién se estudian alternativas al mucstrco aleatorio simple, usadas con frecuencia en la préctica, El problema de muestreo de Electronics Associates Al director de personal de Electronics Associates, Inc. (EAD, se le ha encargado Ia tarea de ela Dorar un perfil de los 2500 administradores de la empresa. Las caracteristicas a determinar son el sueldo medio anual de los administradores y la proporcidn de administradores que ha termi- nado el programa de capacitacién de la empresa, Con los 2500 administradores de la empresa como la poblacidn para este estudio, es posible hhallarel sueldo anual y la situacién respecto al programa de capacitacién de cada persona al con- sultar los archivos del personal. El archivo con los datos que contiene esta informacién para ca- da uno de los 2500 administradores que forman la poblacidn se encuentra en el disco compacto gue se distribuye con el libro. on los datos de EAI y las férmulas presentadas en el capstulo 3, se calcula la media pobla- cional y Ia desviaci6n estindar poblacional de los salarios anuales, Media poblacional: x = $51 800 Desviacién esténdar poblacional:_¢ = $4000 260 Alamos de los cortor de ecopilar informacisn eu masta on "ustanciabmente menos aque hacero de wna Doblatén; especialmente ‘ado re deben realizar centrevistas personales para ecopilar la informactn. @) Los nimerosaleatorios enerados por omputadora también Lirven para realizar el rocero de relecion de una snuettraaleatoria. Excel ropociona una fncisn ara generar nimmeros letorog en cus hojas de elo Los nimerotaleatries en la table aparecenen grupos de cinco para failitar su tectra Copitvle 7 Muesteo y dstibuciones muesrles Los datos sobre la situacién del programa de capacitacién muestran que 1500 de los 2500 admi- nistradores han terminado el programa de capacitacién. Si p denota la proporcisn de la poblaciéa que ha terminado el programa de capacitacidn, se tiene que p = 1500/2500 = 0.60. La media po- blacional de los sueldos anuales (1 = $51 800), la desviaci6n estindar poblacional de los suel- dos anuales (9 = $4000) y Ia proporcién poblacional de quienes han terminado cl programa de ccapacitacién (p = 0.60) son parémetros de la poblacién de administradores de EAT. Ahora suponga que la informacién necesaria sobre todos los administradores de BAI no es- t disponible en la base de datos de la empresa. La pregunta que se considera ahora es: jcémo puede obtener el ditector de personal de la empresa, estimaciones de los pardmettos poblaciona- les usando una muestra de los administradores, en lugar de usar a los 2500 administradores de la poblacién, Asuma que se va a emplear una muestra de 30 administradores, Es obvio que el tiempo y el costo de la elaboracién de un perfil sera mucho menor usando 30 administradores que la poblacién entera, Si el director de personal tuviera la certeza de que una muestra de 30 ad- ‘ministradores proporciona la informacién adecuada acerca de la poblaci6n de los 2500 adminis- twadores, preferiria uabajar con una muestra que hacerlo con toda la poblacién. Para explora la posibilidad de usar una muestra para el estudio de EAL, primero se considerard cémo determinar ‘una muestra de 30 administradores, Muestreo aleatorio simple Para seleccionar una muestra de una poblacién hay diversos métodos; uno de los més comunes cs el muestreo aleatorio simple. La definicién de muestreo aleatorio simple y del proceso de se- leccionar una muestra aleatoria simple dependen de si la poblacién es finisa 0 infinita. Como el problema de muestreo de EAI tiene una poblacién finita de 2500 administradores, primero se considera el muestreo de una poblaci6n finita Muestreo de una poblacién finita ‘Una muestra aleatoria simple de tamao n de una poblaci6n finita de tama NY se define como sigue MUESTREO ALEATORIO SIMPLE (POBLACION FINITA), ‘Una muestra aleatoria simple de tamafo n de una poblacién finita de tamafio N es una mues- tra seleccionada de manera que cada posible muestra de tamafio n tenga la misma probabili- dad de ser seleccionada. Un procedimiento para seleccionar una muestra aleatoria simple de una poblacién finita es elegir los elementos para la muestra de uno en uno, de manera que, en cada paso, cada uno de los elementos que quedan en la poblacién tenga la misma probabilidad de ser seleccionado. Al seleccionar n elementos de esta manera, sera satisfecha la definicién de muestra aleatoria simple seleccionada de una poblacién finita, ara seleccionar una muestra aleatoria simple de la poblacién finita de administradores de EAT, primero se le asigna a cada administrador un niimero, Por ejemplo, se les asignan los nt- ‘meros del al 2500 en el orden en que aparecen sus nombres en el archivo de personal de EAL A continuacién se consulta la tabla de digitos aleatorios que se muestran en Ja tabla 7.1. Al con- sultar el primer renglén de la tabla se da cuenta que cada digito, 6, 3, 2, ... es un digito aleatorio con la misma oportunidad de aparecer que cualquier otro, Como el nimero mayor en la lista de la poblacién de administradores de EAT, 2500, tiene cuatro digitos, se seleccionarén nimeros aleatorios de Ia tabla en conjuntos o grupos de cuatro digitos, Aun cuando para la seleccién de nimeros aleatorios se puede empezar en cualquier lugar de la tabla y avanzar sistematicamente cen una de las cuatro direcciones, aqui se usaré el primer rengl6n de la tabla 7.1 y se avanzard de inguierda a derecha. Los primeros 7 mimeros aleatorios de cuatro digitos son 63271599 86717445102 SI4—«1807 Los mimeros aleatorios en Ia tabla aparecen en grupos de cinco para facilitar su lectura Bala prtia, ta poblacion tn cstudio se considera Proceso continuo en el que {ea imposible contar 0 snumerar cada uno dels Clementos dela poblacin 7.2. Mucsireo alestoro simple 261 TABLA7.1 NUMEROS ALEATORIOS 63271 59985 71744 © S1102 S41 80714 5868393108. 13554 79945 38547 09895 95436 79115 0830301041 20030-63754 08459 28364, 55957 5724383865 0991119761 66535 4010226646 6014715702, 46276 8745344790 67122. «4557384358 21625 1699913385 22782 55363 07449 3483515200 76616 67191 1277721861 6868903263 69393 92785 49902 S847 42048 3037887618 2693340540 16281, 13186 2943188190 04588. 3873381290 89541 70290 4011308243, 17726 28652 56836 7835147327 «18518 92222 5520127340 10893 3652064465 05550 30157 $2242 29520 6975372602. 23756 $4935 81628 36100 39254 683537635 0242198063 $9611 6495399337 84649 4896875215 75498 49532 74040 03466 49292 3640145525 63291 1161812613 7505543915 26488 4111664531 $6827 30825 70502 5322503655 0591S 37140 57051 4839391322 2565306543 05426 24771 $9935 4980111082 6676294477 02494 $8215 27191 207 55609 29430 70165 45405 78484 31639 5200918873 96927 41990 70538 77191-25860 $5204 73417-83920 69468 7497238712 72452 36618 76298 26678 89334-33938 95567 29380 75906 91807 37042 40318 5709910528 0992589773 41335 96244 2900246453 53766 5287S 15987 46962 67342 77592 57651 95508 $0033 69828 90585 $8955 53122 1602584299 53310 67380 84249 25348 04332 32001 96293 37203 64516 51530 37069 4026161374 OSBIS 6714 62606 64324 46354 72157 6724820135 49804 09226 6441929457 10078 28073 85389 50324 1450015562 64165 06125 7135377669 91561 46145 24177 1529410061 98124 75732 OOS15-BB452__97355 1309198112 53959 79607 52244 6330310413. 63839-74762 50289 Como los niimeros de la tabla son aleatorios, estos miimeros de cuatro digitos son todos igual- ‘mente posibles. Ahora se pueden usar estos niimeros aleatorios de cuatro digitos para darle a cada tuno de los administradores que constituyen la poblacién la misma oportunidad de ser incluido en Ja muestra aleatoria. El primer mimero, 6327, es mayor que 2500. No corresponde a ninguno de los administradores numerados que forman la poblacién y por tanto se descarta, El segundo nii- mero, 1599, esté entre I y 2500. Por tanto, el primer administrador seleccionado para la muestra aleatoria es el administrador que tiene el nimero 1599 en la lista de los administradores de EAL Siguiendo este proceso, se ignoran los ntimeros 8671 y 7445 antes de identificar a los adminis ttadores con los nimeros 1102, 1514 y 1807 e incluirlos en Ia muestra aleatoria, Este proceso si- gue hasta que se tiene la muestra aleatoria de 30 administrativos de EAL Al realizar este proceso para la seleccién de una muestra aleatoria simple, es posible que un -imero que ya haya sido usado se encuentze de nuevo en la tabla antes de completar la muestra de los 30 administradores de EAI. Como no se quiere seleccionar a un administrador més de una vez, cualquier nimero aleatorio que ya ha sido usado se ignora, porque el administrador corres- ppondiente ya se ha incluido en Ia muestra, A este tipo de seleccisn se le conoce como muestreo sin reempiazo, Cuando se selecciona una muestra en la que se acepten mimeros aleatorios ya usa- dos y los administradores correspondicntcs sean incluidos dos o mas veces, se est muestreando con reemplazo. Muestrear con Feemplazo es una forma vilida de identificar una muestra aleato- ra simple. Sin embargo, el muestreo sin reemplazo es el procedimiento de muestreo més usado. Cuando se habla de muestreo aleatorio simple, se asumir4 que el muestreo es sin reemplazo, Muestreo de una poblacién infinita En algunas situaciones la poblacién o bien es infinita o tan grande que, para fines practicos, se considera infinita. Por ejemplo, suponga que un restaurante de comida rpida desea obtener el 262 Er poblacionesinfinias un procedimienta parala delecciin de wna muestra debe ser concebide ‘opecalmente para cada ‘iimacibn de manera qe ermia seleccionar os Clementos de manera Independiente y evita at an sesgo em a seleccién ‘nue dé mavoree robabildader de seleccn 1 certo tpos de ements. Copitvle 7 Muesteo y dstibuciones muesrles perfil de su clientela seleccionando una muestra aleatoria de los mismos y pidiéndole a cada cliente que lene un breve cuestionario. En tales situaciones, el proceso continuo de clientes que visitan el restaurante puede verse como que los clientes provienen de una poblaciéa infinita. La definicién de muestra aleatoria simple tomada de una poblacién infinita es la siguiente MUESTRA ALEATORIA SIMPLE (POBLACION INFINITA) ‘Una muestra aleatoria simple de una poblacién infinita es una muestra seleccionada de ‘manera que se satisfagan las condiciones siguientes. 1. Cada uno de los elementos seleccionados proviene de la poblacién, 2. Cada elemento se selecciona independientemente. En poblaciones infinitas un procedimiento para la seleccin de una muestra debe ser con- cebido especialmente para cada situacién, de manera que permita seleccionar los elementos de ‘manera independiente y evitar asi un sesgo en la seleccisn que dé mayores probabilidades de se- leccién a ciertos tipos de elementos. En el ejemplo de la seleccién de una muestra aleatoria sim- ple entte los clientes de un restaurante de comida répida, el primer requerimiento es satisfecho por cualquier cliente que entra en el restaurante. Bl segundo requerimiento es satisfecho selec~ cionando a los clientes de manera independiente, El objetivo del segundo requerimiento es evi- (ar sesgos de seleccién, Habria un sesgo de seleccién, por ejemplo, si cinco clientes consecutivos que se seleccionaran fueran amigos. Es de esperar que estos clientes tengan perfiles semejantes. Dichos sesgos se evitan haciendo que la seleccién de un cliente no influya en la seleccién de cualquier otto cliente, En otras palabras, los clientes deben ser seleccionados de manera indepen- dient, ‘McDonald’, el restaurante lider en comida répida, realiz6 un muestrco aleatorio simple pre- cisamente en una situacién asi. El procedimiento de muestreo se basé en el hecho de que algu- nos clientes presentaban cupones de descuento, Cada vez que un cliente presentaba un cups descuento, al siguiente cliente que se atendia se le pedia que Ilenara un cuestionario sobre el per- fil del cliente, Como los clientes que legaban al restaurante presentaban cupones de descuento aleatoria ¢ independientemente, este plan de muestreo garantizaba que los clientes fueran selec~ cionados de manera independiente. Por tanto, los dos requerimientos para un muestreo aleatorio simple de una poblaci6n infinita fueron satisfechos, ‘Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo lar- {0 del tiempo. Por ejemplo, partes fabricadas en una linea de produccin, transacciones en un banco, llamadas que legan a un centro de asesoria técnica y clientes que entran cn las tiendas son considerados como provenientes de una poblacisn infinita. En tales casos un procedimiento dde muestreo creativo garantiza que no haya sesgos de seleccién y que los elementos de Ia mues- twa sean seleccionados en forma independiente. Brithaccn ead datos del problema de EAI, en el que N = 2500 1. El ntimero de muestras aleatorias simples dis- tintas de tama n que pueden seleccionarse de tuna poblacién finita de tamaiio N es Nt may = Wi En esta férmula N! y n! son factoriales, vistos en el capitulo 4, Al usar esta expresién con los y n= 30, se ve que se pueden tomar 2.75 x 10® muestras aleatorias simples distintas de 30 administradores de EAL, . Para tomar una muestea aleatoria pueden em- plearse paquetes de software, En los apéndices el capitulo se muestra cémo usar Minitab y Exeel para seleccionar una muestra aleatoria simple de una poblacién finita 7.2. Mucsireo alestoro simple 263 Método 1, Dada una poblacién finita que tiene cinco elementos A, B, C, D y E seleceione 10 muestras alea- torias simples de tamafio 2 a. Enumere las 10 muestras empezando con AB, AC y asf en lo sucesivo, b. Usando el muestreo aleatorio simple, jcual es la probabilidad que tiene cada muestra de ta- ‘mafio 2 de ser seleccionada? ‘e. Siel miimero alestorio 1 corresponde @ A, el nmero 2.corresponde a B y asf en lo sucesi- vo. Enliste la muestra aleatoria de tamatio 2 que seré seleccionada al usar los nmeros alea- totios 8 0575 32. 2. Suponga que una poblaciGn finita tiene 350 elementos. A partir de los limos tres digitos de ea- ‘da uno de los siguientes aimeros aleatorios de cinco digitos (por ejemplo: 601, 022, 48,..), de termine los primeros cuatro elementos que se seleccionarén pars una muestra aleatoria simple 98601 73022 83448 02147 34229 27953 84147 93289 14209 Aplicaciones Fortune publicé datos sobre ventas, valor del activo, valor de mercado y ganancias por acciéa de Las 500 cosporaciones industrales més grandes de Estados Unidos (Fortune 500, 2003). Su- pponga que usted desea seleccionar una muestra aleatoria simple de 10 corporaciones de Ia lista Fortune 500. Use los tres sitimos digitos de la columna 9 de Ia tabla 7.1, empezando con 554 Leyendo hacia abajo por esa columna, identifique los nimeros de las 10 corporaciones que se tomardn para la muestra 4. Acontinuacién se presentan las 10 acciones més activas en la Bolsa de Nueva York del 6 de mar- 120 del 2006 (The Wall Street Journal, 7 de marzo, 2006), AT&T — Lucent Nortel Qwest Bell South Plizer Texas Instruments Gen, Elect. iShMSIpn_—_LSI Logic Las autoridades decidieson investigar las précticas de negociacién usando una muestra de wes de ‘estas acciones. a Empezando en el primer digito aleatorio de la columna seis de Ia tabla 7.1, lea Ios niéimeros descendiendo por esa columna para seleccionar una muestra aleatoria simple de tes accio- nes para las autoridades. b. Con la informacién dada en la primera nota y comentario, determine cusntas muestras alea- torias simples diferentes de tamafio 3 pueden seleccionarse de una lista de 10 acciones, 5. Una organizacién de estudiantes desean estimar la proporcién de estudiantes que estan a favor de ‘una disposicién de la escuela, Se cuenta con una lista con los nombres y direcciones de los 645, ‘estudiantes inseritos el presente timestre. Tomando niimeros aleatorios de tres digitos del ren- ‘én 10 de la tabla 7.1 y avanzando por ese renglén de izquiesda a derecha, determine los 10 pri ‘eros estudiantes que serin seleccionados usando un muestteo aleatorio simple, Los nimeros aleatorios de tres digitos empiczan con 816, 283 y 610 6. El County and City Data Book del Census Bureau cuenta con informacién de los 3139 condados de Estados Unidos. Suponga que para un estudio nacional se recogeran datos de 30 condados se- leccionados alestoriamente. De la ltima columna de la tabla 7.1 extraiga niimeros aleatorios de ‘cuatro digitos para determinat los primeros cinco condados seleccionados para la muestra Tgno- 1 los primetos digitos y empieve con los nimeros aleatorios de cuatro digitos 9945, 8364, 5702 yy asi sucesivamente 7. Suponga que se va‘ tomar una muestra aleatoria simple de 12 de los 372 médicas de una deter- ‘minada ciudad. Una organizacién médica le proporciona los nombres de los médias. De la tabla 264 Copitvle 7 Muesteo y dstibuciones muesrles 7.1 use la columna ocho de nsimeros aleatarios de cinco dfgitos para determinar cusles serén los 12 médicos para la muestra, Ignore los primeros dos digitos de cada grupo de cinco digitos de ni eros aleatorios. Este proceso empieza con el nimero aleatorio 108 y contina descendiendo por la colunana de niimeros aleatories. 8, La lista siguiente proporciona los 25 mejores equipos de futbol de Ia NCAA en Ja temporada del 2002 (NCAA News, 4 de enero de 2003). De la tabla 7.1 use la novena columna que empieza con 13 554, para seleccionar una muestra aleatoria simple de seis equipos de futbol. Empiece con cl equipo 13 y use los primeros dos digitos de cada renglén de Ia novena columna para el proce- s0 de seleccidn, ¢Cusles son los seis equipos de futbol seleccionados para la muestra aleatoria simple? 1. Ohio State 14, Virginia Tech, 2. Miami 15, Pena State 3. Georgia 16, Aubura 4, Southern California 17. Notte Dame 5, Oklahoma| 18, Pitsburgh 6. Kansas State 19, Marshall 7. Texas 20, West Virginia 8.owa, 21, Colorado 9, Michigan 22,TCU 10, Washington State 23, Florida State U1, North Carolina State 24, Florida 12, Boise State 25. Virginia 13. Maryland 9. The Wall Street Journal proporciona el valor de activo neto, el rendimiento porcentual en lo que vva del af y el rendimienco porcentual en tes alos de 55S fondos mutualistas (The Wall Street Journal, 25 de abril de 2003). Suponga que se va a usar una muestra aleatoria simple de 12 de estos 555 fondos mutualistas para un estudio acerca de su tamafo y desempeso, Use la cuarta columna de nmeros aleatorios en la tabla 7.1 empezando con el nimero 51102, para selecci nat la muestra aleatoria simple de 12 fondos mutuaistas. Empiece con el fondo 102 y use los timos tes digitos de cada renglén de la cuarta colunsna para el proceso de selecci6n. ;Cusles son los niimeros de los 12 fondos mutualistas en esta muestra aleatoria simple? 10. Indique si las poblaciones siguientes se consideraa finitas o infnitas. Todos los votantes registrados en el estado de California, b. Todos los equipos de televisién que pueden ser producidos en una determinads fabrica ©, Todas las érdenes que pueden ser procesadas por Allentown, Pensilvania, planta de TV-M Company. 4. Todas las amadas de emergencia que pueden ser recibidas en una estacién de policia ©, Todas las piezas producidas por Fibercon, Inc., en el segundo tumo el 17 de mayo. @) Estimacion puntual Una vez descrito cémo seleccionar una muestra aleatoria simple, se vuelve al problema de EAL En la tabla 7.2 se presenta una muestra aleatoria simple de 30 administradores con sus respecti- vos datos de sueldo anual y de participacisn en el programa de capacitacién, La notacién x, x, etc., se usa para denotar el sueldo anual del primer administrador de la muestra, del segundo, y asf sucesivamente. La participacién en el programa de capacitacién se indica por un Sfen la co- Tumna programa de entrenamiento. Para estimar el valor de un pardmetro poblacional, la caracteristica correspondiente se caleu- Ja con Ios datos de la muestra, a lo que se le conoce como estadistico muestral. Por ejem- plo, para estimar la media poblacional sy la desviacién esténdar poblacional ¢ de los salarios anuales de los administradores de EAI, se emplean los datos de la tabla 7.2 y se caleulan los es- 7.3. Esiimaci6n punial 265 TABLA 7.2. SALARIOS ANUALES Y SITUACION RESPECTO AL PROGRAMA DE CAPACITACION DE LOS ADMINISTRADORES PERTENECIENTES A UNA. MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES DE EAL Salario Programa de Salario Programa de capacitacién anual ($) capacitacion Si 51 766.00 Sf si 5254130 No si 4498000 si si = 51 932.60 Si No 52973.00 Sf si 45 12090 Si Si 51753.00 sé Si $4391.80 No Si 50 164.20 No Si 52973.60 No Si = 50 241.30 No No 52793.90 No si 50.979.40 St No 55 860.90 Si No 2 = 57 309.10 No ladisticos muestrales correspondlientes; media muestral ¥ y desviaci6n estindar muestral s, Con las formulas para la media muestral y Ia desviaci6n estndar muestral presentadas en el capitulo 3 se obtiene que la media muestral es Para estimar p, Ia proporcién de administradores que han terminado el programa de capaci- tacién, se usa la proporcién muestral correspondiente p. Sea.x el nimero de administradores de Ja muestra que han terminado el programa de capacitacién. De acuerdo con la tabla 7.2, x = 19. Por tanto, como el tamafio de la muestra es n = 30, la proporcién muestral es x 19 2-2 063 n 30 O° Al hacer los eélculos anteriores, se leva a cabo el proceso estadistico conocido como esti- ‘macién puntual. A la media muestra ¥ se le conoce como el estimador puntual de la media po- blacional ju, a la desviacién esténdar muestral s como el estimador puntual de la desviacién estindar poblacional 0 y a la proporeién muestral p como el estimador puntual de la propor- cién poblacional p. Al valor numérico obtenido de f, s, 0 se les conoce como estimaciones puntuales. Asi, en la muestra aleatoria simple de 30 administradores de EAI que se presenta en Ia tabla 7.2, $51 814 es la estimacién puntual de 1, $3 348 es la estimacin puntual de oy 0.63 es la estimacién puntual de p. En la tabla 7.3 se resumen los resultados muestrales y se compa- ran las estimaciones puntuales con los valores de los parimetros poblacionales 266 Copitvle 7 Muesteo y dstibuciones muesrles TABLA 7.3. INFORMACION DE LAS ESTIMACIONES PUNTUALES OBTENIDAS DE UNA MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES DE EAI Valor del Estimacién Pardmetro poblacional parimetro Estimador puntual puntual = Media poblacional de los $51 800 fedia muestra de los S51814 salarios anvales tant salarios anuales eon 0 = Desviacisn estindar = Desviacién estindar mues- poblacional de los salarios eet teal de los salrios anvales net amzales P= Proporcién muestra que ha _p = Proporcién poblacional que ha \erminado el programa de terminado el programa de capacitacién ‘capacitacién ‘Como se observa en la tabla 7.3, las estimaciones puntuales differen un poco de los corres- pondientes parémetros poblacionales. Estas diferencias son de esperarse ya que para elaborar las estimaciones muestrales se usa una muestra, y no un censo de toda la poblacién. En el capitulo siguiente se ver cémo claborar un intervalo de estimacién para tener informaci6n acerca de qué tan cerca est la estimacién muestral del parémetro poblacional Métodos 1. Los datos siguientes provienen de una muestra sleatora simple 5 8 0 7 10 14 4, \Cual es Ia estimacién puntual de Ia medi poblacional? b. {Cua es la esimacign puntual de Ta desvicién estindar poblacional? 12, Como respuestas a una pregunta de una encuesta a 150 individuos de una muestra se obtuvieron 75 Si, 85 No y 20 individuos no dieron su opinién, {Cuil es la estimacién puntual de la proporcisn de la poblacién que responde Si? ', {Cual es la estimacién puntual de Ia proporcién de la poblacién que responde No? Aplicaciones 1B. La siguiente informacién son datos cheidos en una muestra leatora dels vetas dS meses Mes 123 45 Unidadesvendidas: 94 100 85 94 92 4 Caeule una estima puntua dela media poblacionl de nimero medio de unidaes ven Aida por mes '. Calule una esimacion puntal del desvicion esténdar del nimero de mnidades venidas pormes 14, BusinessWeek publicé informacién sobre 283 fondos mutualistas (BusinessWeek 26 de enero de 2004 ). En el conjunto de datos MutualFunds se encuentra una muestra de 40 de estos fondos. Use este conjunto de datos para hacer lo que se pide en los inisos siguientes. a, Caleule una estimacién puntual de la proporcién de fondos de inversin de BusinessWeek {que son fondos de cargo. bb. Calcule una estimacién puntual de la proporcién de fondos clasificados como de alto riesgo. . Caleule una estimacién puntual de la proporcin de fondas con una puntuacién abajo del pro- ‘medio para el riesgo. 15, Muchos de los medicamentos erapleados en el tratamiento del cAncer son costosos. BusinessWeek informé de los costos de los tratamientos con Herceptin, un medicamento para tratar el cncer de Poder entender e material ‘eos captuossguiemes Adepende de entender 9 wsar lar dieribuciones mvestrales queso presenta en ete cape 7.4. Introduccién alas dstbuciones muesrales 267 mama (BusinessWeek, 30 de enero de 2006). Los siguientes son los costos de tratamientos con Herceptin en una muestra aleatoria de 10 pacientes. 4376 578 2017 4920 4495 4798 6446 4119 4237 3814 Caleule una estimacién puntual del costo medio de un tratamiento con Herceptin 'b. Caleule una estimacién puntual de la desviaciGn esténdar en los costos de los tratamientos con Herceptin, 16. En una muestra de 50 empresas de Fortune 500, § se encontraban en Nueva York, 6 en Califor- nia, 2 en Minesota y 1 en Wisconsin, a, Dé una estimacién de la proporcién de empresas de Fortune 500 que se encuentran en Nue- va York. Dé una estimacién del mimero de empresas de Fortune $00 que se encuentran en Minesota ‘c. Dé una estimacién de la proporcién de empresas de Fortune 500 que no se encuentran en ninguno de estos estados. 17. La American Association of Individuals Investors (AATD hace sondeos semanales entre sus sus- criplores para determinar cuéntos se muestran eplimistas, pesimistas o indiferentes respecto al ‘mercado de acciones a corto plazo. Sus hallazgos en Ia semana que tenmin6 el 2 de marzo de 2006 son consistentes con los resultados muestrales siguientes (www aai.com). Optimistas 409 Indiferentes 299 Pesimistas 291 [Dé una estimacién puntual de los parimetros poblacionales siguientes. &. Proporcién de suscriptores de AAI optimistas respecto al mercado de acciones. b. Proporcién de suscriptores de AAI indiferentes respecto al mercado de acciones. ©. Proporcién de suscriptores de AAII pesimistas respecto al mercado de acciones. Introduccién a las distribuciones muestrales En la seccién anterior se dijo que la media muestral ¥ es el estimador puntual de Ia media pobla- cional j y que la proporcién muestral p es el estimador puntual de la proporcisn poblacional p. En Ja muestra aleatoria simple de los 30 administradores de EAI que se presenta en la tabla 7.2, In estimacién puntual de w es T = $51 814 y la estimacin puntual de p es p = 0.63. Suponga gue se selecciona otra muestra aleatoria simple de 30 administradores de EAI y se obtienen las estimaciones puntuales siguientes: Media muestral: ¥ = $52,670 Proporcién muestral: 5 = 0.70 Observe que se obtuvieron valores diferentes de X y de p. En efecto, otra muestra aleatoria sim- ple de 30 administradores de EAI no se puede esperar que dé las mismas estimaciones puntuales gue la primera muestra, ‘Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30 administrado- res se tepite una y otra y otra vez y que cada vez se calculan los valores de & y de . En la tabla 7.4 se muestra una parte de los resultados obtenidos en 500 muestras aleatorias simples y en Ia tabla 75 las distibuciones de frecuencias y distribuciones de frecuencias telativas de los valores de las, 500. &, En la figura 7.1 se muestra el histograma de las frecuencias de los valores de , En el capitulo 5 se definié una variable aleatoria como una descripcién numérica del resul- lado de un experiment, Si el proceso de seleccionar una muestra aleatoria simple se considera como un experimento, la media muestral £ es el valor numérico del resultado de ese experimen- to, Por tanto, la media muestral es una variable aleatoria. Entonces, como ocurre con otras varia- bles aleatorias, ¥ tiene una media o valor esperado, una desviaciGn estindar y una distribucién 268 Copitvle 7 Muesteo y dstibuciones muesrles TABLA7.4 VALORES DEY DE p OBTENIDOS EN 500 MUESTRAS ALEATORIAS. SIMPLES DE 30 ADMINISTRADORES DE EAI CADA UNA Muestra ‘Media muestral Proporcién muestral nfimero @ @ 1 sisis 063 2 52670 070 3 51780 067 4 51588 053 500 51782 050 de probabilidad, Como los distintos valores que toma ¥ son resultado de distintas muestras alea- torias simples, a la distibucidn de probabilidad de Z se le conoce como distribucién muestral de &. Conocer esta distribucién muestral y sus propiedades permitiré hacer declaraciones de pro- babilidad de qué tan cerca esta la media muestral ¥ de la media poblacional J. De regreso a la figura 7.1, se necesitarfa enumerar todas las muestras posibles de 30 admi- aistradores y calcular cada una de las medias muestrales para determinar totalmente la distribu- ciGn muestral de £. Sin embargo, el histograma de 500 valores ¥ da una aproximacidn a esta distribucién muestral, En esta aproximacién se observa la apariencia de curva de campana de esta distribucién. Ademés, la mayor concentracién de valores de 5 y la media de los 500 valores de ¥ se encuentran cerca de Ia media poblacional = $51 800, En la seccién siguiente se describiran sms detalladamente las propiedades de la distribucién muestral de ¥. ‘Los 500 valores de las proporciones muestrales se resumen en el histograma de frecuen- cigs relativas de la figura 7.2. Como ocurte con f, p es una variable aleatoria. Si se tomara cada muestra posible de tamafo 30 y para cada muestra se calculara el valor p, la distribucién de pro- babilidad que se obtuviera seria la distribucién muestral de p. En la figura 7.2, el histograma de frecuencias relativas de los 500 valores muestrales da na idea general de la apariencia de la dis- tribucisn muestral de p. En la préctica s6lo se selecciona una muestra aleatoria simple de la poblacién, En esta sec- cidn el proceso de muestreo se repitié 500 veces pata ilustrar que es posible tomar muchas mues- TABLA 7.5. DISTRIBUCION DE FRECUENCIAS DE # EN 500 MUESTRAS ALEATORIAS SIMPLES DE 30 ADMINISTRADORES DE EAI CADA UNA Salario anual medio ($) Frecuencia Frecuencia relativa 49 500.0049 999.99 2 0.004 '50.000,00-50 499.99 16 0.032 50 500,00-50 999.99 32 0.104 51 000,00-81 499.99 101 0.202 $51 500,00-S1 999.99, 13 0.266 $52.000,00-82.499.99 no 0220 52 500,00-52 999.99 34 0.108 +53 000,00-53 499.99 26 0.052 $53 500,00-53 999.99 6 0012 Totales 500 1,000 7.4. Introduccién alas dstbuciones muesrales 269 FIGURA 7.1. HISTOGRAMA DE LAS FRECUENCIAS RELATIVAS DE LOS VALORES DE ¥ OBTENIDOS 100 MU STRAS AL ADMINISTRADORES CADA UNA \TORIAS SIMPLE DE 30 030 ee Frecuencia relativa 0.05 50 000 51000 52.000 Valores de 53000, $4000 FIGURA 7.2 HISTOGRAMA DE LAS FRECUENCIAS RELATIVAS DE LOS VALORES DE p OBTENIDOS EN 500 MUESTRAS AL ADMINISTRADORES CADA UNA ZATORIAS SIMPLES DE 30 Frecuencia relativa 040 03s 030 025 020 ous 010 ons 032 040 0a 0560.64 Valores de 072 270 (@) Ww Elvalor esperade de ual ata media dela poblacin de la que se toms Tamuesra Copitvle 7 Muesteo y dstibuciones muesrles tuas diferentes y que diferentes muestras darn valores distintos de los estadisticos muestrales ¥ y P. Ala distribucién muestral de cualquier estadistico determinado se le lama distribuciéa ‘muestral del estadistico, En la seccién 7.5 se presentan las caracteristicas de la distribucidn mues- wal de ¥. En la seccién 7.6 se muestran las caracteristicas de la distribucién muestral de p. Distribucion muestral de ¥ En la seccién anterior se dijo que Ia media muestral Z es una variable aleatoria y que a su distei- bucién de probabilidad se le Hams distribucién muestral de 5. DISTRIBUCION MUESTRAL DE La distribucién muestral de 7 es la distribucién de probabilidad de todos los valores de la ‘media muestral & En esta seecién se deseriben las propiedades de la distribucién muestral de %. Como ocurre con otras distribuciones de probabilidad estudiadas, la distribucién muestral de X tiene un va lor esperado, una desviacién estindar y una forma caracterfstica. Para empezar se consideraré la ‘media de todos los valores de ¥ , ala que se conoce como valor esperado de F. Valor esperade de x En el problema de muestreo de EAI se vio que en distintas muestras aleatorias simples se obtie- nen valores diferentes para la media muestral %, Como la variable aleatoria % puede tener muchos valores diferentes, suele ser de interés conocer la media de todos los valores de ¥ que se obtie- nen con diferentes muestras aleatorias simples. La media de la variable aleatoria ¥ es el valor esperado de ¥, Sea E(3) el valor esperado de ¥ y w Ia media de la poblacién de la que se selec- ciona una muestra aleatoria simple. Se puede demostrar que cuando se emplea el muestreo alea- Corio simple, ER) y 1 son iguales. VALOR ESPERADODE + Bw =H (7.1) donde E(B) = valor esperado de = = media poblacional Esto ensefia que usando el muestreo aleatorio simple, el valor esperado © media de la distribu- cién muestral de ¥es igual ala media de la poblacidn. En la seccién 7.1 se vio que el sueldo anual medio de los administradores de EATes « = $51 800. Por tanto, de acuerdo con la ecuacién (7.1), Ja media de todas las medias muestrales en el estudio de EAI es también $51 800. ‘Cuando el valor esperado de un estimador puntual es igual al parémetro poblacional, se dice que cl estimador puntual cs insesgado. Por tanto, la ecuaci6n (7.1) muestra que ¥ es un estima dor insesgado de la media poblacional j. Enel problema 21 se muestra que cuando IN = 005, el factor de poblacisn fina ene poco ‘fecto endl valor deo, 7.5. Dishibucién muestra de = 21 Desviacion estandar de Ahora se definird la desviacién estindar de la distribucién muestral de ¥. Se emplearé la nota- cign siguiente, desviacisn esténdar de = = desviacisn estindar de la poblacién n= tamafo de la muestra N= tamaiio de la poblacién Es posible demostrar que usando el muestreo aleatorio simple, Ia desviacisn estindar de ¥ de- ppende de si la poblacién es finita 0 infinita, Las dos férmulas para la desviacién estindar son las siguientes. DESVIACION ESTANDAR DE Poblacién finita Poblacién infinita (7.2) AA compara las dos formulas se ve que el factor QV = my/OV = 1) se requiere cuando la pobla- cid es finita, pero no cvando es infnit, A este factor se Te conoce como factor de correccién para una poblacién finta, En muchas dela stuaciones précticas de muestreo, se encuentra que aunque la poblacién sea finita, es “grande”, mientras que el tamafio de Ia muestra es “pequefio En estos caso el factor de comreccién para una poblacién finita yOV— mV — 1) es cai igual 211. Por tanto, la diferencia ente el valor de la desviacin estindar de & en cl caso de poblacio- nes finitao infinitas se vuelve despreciable. Entonces, 0; = 0/7 es un buena aproximacisn a Ia desviacinestindar de Z, aun cuando I poblacin sea finita. Esta observacidn leva al siguien- tc lineamiento, o reg general, para caleular la desviaein estindar de USO DE LA EXPRESION SIGUIENTE PARA CALCULAR LA DESVIACION ESTANDAR DE ¥ (7.3) siempre que 1, La poblacién sea infinita; 0 2. La poblacién sea finita y el tamafio de la muestra sea menor o igual a 5% del tamafio de Ia poblacién; es decir, n/V = 0.05, En los casos en que rN > 0.05, para calcular s,, deberd usarse la versiGn para poblaciones fini- tas de la fSrmula (7.2). En este libro, a menos que se indique otra cosa, se supondré que el tama- fio de la poblacién es “grande”, n/V = 0.05, y se usard la expresi6n (7.3) para calcular 0, 272 Et tdrminn error estindar se usa on la infevencia cstadnca para refertsea Ia desviacin etindar de ti etimador punta Copitvle 7 Muesteo y dstibuciones muesrles Para calcular 6; se necesita conocer 0, la desviacién esténdar de la poblacién. Para subrayar, atin més, la diferencia entre o, y 0, ala desviacién estandar de Z, 6, se le lama error estindar de la media, En general, el término error estindar se refiere a la desviaci6n estindar de un esti- ‘mador puntual, Més adelante se vera que el valor del error estndar de la media ayuda a deter- ‘minar qué tan lejos puede estar la media muestral de la media poblacional. Ahora, de nuevo con cl ejemplo de EAT se calcula el error esténdar de Ia media correspondiente a las muestras aleato- tas simples de 30 administradotes de EAL. En Ia seccién 7.1 se hall6 que la desviacién estindar de los sueldos anuales en la poblacién de los 2500 administradores de EAI era o = 4000. En este caso la poblacién es finita, N = 2500, Sin embargo, como el tamaiio de la muestra es 30, se tiene n/N = 30/2500 = 0.012. Como el ta- mafio de la muestra es menor que 5% del tamaio de la poblaci6n, se puede ignorar el factor de corteceisa para una poblacién finita y usar la ecuacisn (7.3) para calcular el error estndat. o _ 4000 6; = 7303 “vn V30 Forma de la distribucién muestral de = Los resultados anteriores respecto al valor esperado y a la desviaci6n estindar en la distribucién muestral de £ son aplicables a cualquier poblacién. El paso final en la identificaci6n de las ca racterfsticas de la distribucién muestral de ¥ es determinar la forma de la distzibucién muestra ‘Se considerardn dos casos: 1, La poblacién tiene distribucién normal, y 2. La poblacién no tiene distribucién normal. La poblacién tiene distribucién normal. En muchas situaciones es razonable suponer que Ja poblacién de la que se seleccioné la muestra aleatora simple tenga distribucién normal o casi normal. Cuando la poblacién tiene distribucién normal, la distribucién muestral de ¥ esté distr- bbuida normalmente sea cual sea el tamafo de la muestra. La peblacién ne tiene distribucién normal. Cuando la poblacién de la que se toms la mues- tra aleatoria simple no tiene distribucién normal, el teorema del Limite central ayuda a determi- nar la formsa de la distribucién muestral de % El enunciado del teorema del limite central aplicado ala distribucién muestral de ¥ dice lo siguiente ‘TEOREMA DEL LIMITE CENTRAL ‘Cuando se seleccionan muestras aleatorias simples de tamafio n de una poblacién, Ia dis- tribucién muestral de la media muestral ¥ puede aproximarse mediante una distribucién normal a medida que el tamafo de Ia muestra se hace grande. En Ia figura 7.3 se muestra cmo funciona el teorema del Iimite central en tres poblaciones diferentes; cada columna se refiere a una de las poblaciones. En cl primer renglén de la figura se ‘muestra que ninguna de las tres poblaciones esté distribuida normalmente, La poblacién I tiene tuna distribucién uniforme. A la poblacién II se le conoce como distribucién en forma de orejas de conejo. Esta distribuci6n es simétrica, pero los valores més probables se encuentran en las co- las de la disteibuci6n, La forma de la poblacién III se parece a una distribuci6n exponencial; es sesgada a la derecha. En los tres renglones siguientes de la figura 7.3 se muestran las formas de las distribuciones :muestrales para tamafios de muestras n = 2, n = 5 yn = 30, Cuando el tamatio de la muestra es 2, se observa que cada distribuciSn muestra tiene una forma diferente a la distribucién poblacio- nal correspondiente. Con muestras de tamaio 5, se observa que las formas de las distrbuciones smuestrales en los casos de las poblaciones I y Hl empiezan a patecerse a la forma de una distzi- bucién normal, En el caso de Ia poblacisn II, aun cuando la forma de la distribucién muestral empieza a ser parecida a una distribucién normal, todavia se observa cierto sesgo a Ia derecha 7.5. Dishibucién muestra de = 273 FIGURA 7.3 ILUSTRACION DEL TEOREMA DEL LIMITE CENTRAL CON TRES POBLACION Poblacisn I Poblacién I Poblacion IIT Valor dex Valor de x Valor de x Distribucion rmuestral de dex (n=2) Valor de = Valor de® Valor de = Distribucion i fi fl Valor de = Valor de = Valor de = Valor de = Valor de = Valor de = Por ditimo, para muestras de tamaiio 30, las formas de cada una de las tres distribuciones mues- tales es aproximadamente normal, Desde el punto de vista de la préctica, ser conveniente saber qué tan grande necesita ser el tamaio de la muestra para que aplique el teorema del Iimite central y pueda suponer que la for- ma de la distribucisn muestral es aproximadamente normal, En las investigaciones estadisticas se ha estudiado este problema en distribuciones muestrales de ¥ de muy diversas poblaciones y para muy diversos tamafios de muestras. Lo que se acostumbra hacer en Ia préctica es suponcr gue, en la mayor parte de las aplicaciones, la distribucién muestral de & se puede aproximar me- diante una distribucién normal siempre que la nuestra sea de tamaio 30 0 mayor. En los casos en que la poblacidn es muy sesgada o existen observaciones atipicas, pueden necesitarse mues- tras de tamaio 50, Por dtimo, si la poblacién es disereta, el tamatio de muestra necesario para la aproximacién normal suele depender de la proporeién poblacional, Mas acerca de este tema se dird cuando se estudie la distribucién muestral de en la secci6n 7.6 274 Copitvle 7 Muesteo y dstibuciones muesrles Distribucién muestral de x en el problema EAI En el problema de EAI, para el que ya previamente se mostr6 que E() = $51 800 y o,= 730.3, ‘no se cuenta con ninguna informacién acerca de la distribucién de la poblacién; puede estar o no distribuida normalmente. Si la poblacién tiene una distribucién normal, la distribucién muestral de F estard distribuida normalmente. Si la poblacién no tiene una distribucién normal, la mues- ra aleatoria simple de 30 administradores y el teorema del limite central permiten concluir que Ja distribucién muestral de % puede aproximarse mediante una distribucién normal, En cualquie- ra de los casos, se concluye que la distribucién muestral de ¥ se describe mediante una distribu- cin normal como Ia que se muestra en la figura 7.4 Valor practico de la distribucion muestral de = Siempre que se seleccione una muestra aleatoria simple y se use el valor de 1a media muestral para estimar el valor de la media poblacional 1, no se podré esperar que la media muestral sea exactamente igual a la media poblacional. La razén préetica por la que interesa la distribucién muestral de es que se puede usar para proporcionar informacién probabilistica acerca de la di- ferencia entte Ja media muestral y la media poblacional. Para demostrar este uso, se retomaré el problema de BAT Suponga que el director de personal cree que la media muestral seré una estimacién acepta- ble de la media poblacional si la primera esté a més 0 menos de $500 de la media poblacional, ‘Sin embargo, no es posible garantizar que la media muestral esté a mAs o menos de $500 de Ia ‘media poblacional. En efecto, en la tabla 7.5 y en la figura 7.1 se observa que algunas de las 500 medias muestrales difieren en més de $2000 de 1a media poblacional. Entonces hay que pen- sar en el requerimiento del director de personal en términos de probabilidad. Es decir, al direc tor de personal le interesa la interrogante siguiente: “{Cual es la probabilidad de que la media ‘muestral obtonida usando una muestra aleatoria simple de 30 administradores de BAI, se encuen- {re a més o menos de $500 de la media poblacional?” ‘Como ya se han identificado las propiedades de Ia distribucién muestral de ¥ (véase figura 7.4), se usaré esta distribucién para contestar esta interrogante probabilistica. Observe la distri- bucién muestral de £ que se muestra nuevamente en Ia figura 7.5. Como la media poblacional es $51 800, el director de personal desea saber cudl es Ia probabilidad de que ¥ esté entre $51 300 y $52 300, Esta probabilidad corresponde al drea sombreada de la distribuci6n muestral que apa- FIGURA 7.4. DISTRIBUCION MUESTRAL DE ¥ PARAEL SUELDO ANUALEN UNA MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES Distibucién muestal der La dlarlbuciin muetral de 4 sews para obtener Informacién probabiltica acerca de qué ta cerca se encuentra la media Iestral de la media poblacional 7.5. Dishibucién muestra de = 275 FIGURA 7.5 PROBABILIDAD DE QUE UNA MEDIA MUESTRAL DE UNA MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES DE EAI SE ENCUENTRE ENTRE LOS $500 DE LA MEDIA POBLACIONAL Distibucién muestal aa o,=73030 (51 300: 52300) PG <51 300) 31300 51800 52300 rece en la figura 7.5. Como la distribucién muestral est distribuida normalmente y su media es $51 800 y el error estindar de Ia media es 730.3, se usa Ia tabla de probabilidad normal estindar ‘para hallar el drea o probabilidad. Primero se calcula el valor de z en el extremo superior de este intervalo (52 300) y se usa la tabla para hallar cl érea bajo la curva a la izquierda de ese punto (érea hacia la cola izquierda), Después se calcula el valor de z en el extremo inferior de este intervalo (51 300) y se usa la ta- bla para hallar el rea bajo la curva a la izquierda de este punto (otra 4rea hacia la cola izquier- a). Al estar la segunda area de la primera, se obtiene la probabilidad buscada. En ¥ = 52 300, se tiene 52.300 — 51.800 730.30 En la tabla de probabilidad normal esténdar la probabilidad acumulada (ézea a la izquierda de 0.68) es 0.7517. En X= 51 300, se tiene _ 51300 — 51800 _ 730.30 0.68 El fea bajo la curva a la izquierda de z = —0.68 cs 0.2483. Por tanto, P(S1 300 = 5= 52 300) = Pls = 0.68) — Pe < —0.68) = 0.7517 — 0.2483 = 0.5034, ‘0s céleulos indican que hay una probabilidad de 0.5034 de que con una muestra aleatoria simple de 30 administradores de EAI se obtenga una media muestral ¥ que esté a més o menos de $500 de la media poblacional. Por tanto, la probabilidad de que la diferencia entre ¥ y $51,800 sea superior a $500 es | ~ 0.5034 = 0.4966, En otras palabras, una muestra alea- ‘oria simple de 30 administradores de EAI tiene aproximadamente 50/50 oportunidades de tener ‘una media muestral que no difiera de 1a media poblacional en més de los aceptables $500. Qui- 24 deba pensarse en una muestra de tamaiio mayor. Se exploraré esta posibilidad considerando larelaciGn entze el tamafo de la muestra y la distibucién muestral de 5, 276 Copitvle 7 Muesteo y dstibuciones muesrles Relacién entre el tamajio de la muestra y la distribucién muestral de = ‘Suponga que en el problema de muestreo de EAI se toma una muestza aleatoria simple de 100 ad- :ministradores en lugar de los 30 considerados. La intuicién indica que teniendo més datos propor- cionados por una muestra mayor, la media muestral basada en n ~ 100 proporcionaré una mejor estimacién de la media poblacional que una media muestral basada enn = 30. Para ver eusnto es mejor, se consideraré la relaci6n entre el amaio de la muestra y la distribucién muestral de. Primero observe que E(8) = 1 independientemente del tamaiio de la muestra. Entonces, 1a ‘media de todos los valores posibles de ¥ es igual a la media poblacional j« independientemente del tamato n de la muestra. Pero, el error estndar de la media, o, = 0 /yM, esté relacionado con la raf cuadrada del tamafio de la muestra. Siempre que el tamafio de Ia muestra aumente, el ertor esténdar de la media o, disminuirs, Con n = 30, el error estndar de I media en el problema de EAT es 730.3. Sin embargo, aumentando el tamafo de la muestra n = 100, el error estindar de la media disminuye a @ _ 4000 vn Vi00 = 400 En [a figura 7.6 se muestran las distribuciones muestrales de £ correspondiientes an = 30 y a n= 100. Como la distribucién muestral con n = 100 tiene un error estandar més pequeto, ha- br menos variacién entre los valores de £ y éstos tendern a estar mas cerca de la media pobla- cional que los valores de ¥ con n = 30. La distribucién muestral de 5, en el caso n = 100, puede emplearse para caleular la probabi- lidad de que una muestra aleatoria simple de 100 administradores de BAT dé una media muestral que no difiera de los $500 de la media poblacional. Como la distribucién muestral es normal y su media es $51 800 y el error estindar de Ia media es 400, se emplea la tabla de probabilidad normal estindar para hallar el érea o la probabilidad. Para ¥ = 52 300 (véase figura 7.7) se tiene 52.300 ~ 51 800 p= EON = 1.25 400 FIGURA 7.6 COMPARACION ENTRE LAS DISTRIBUCIONES MUESTRALES: DE’ ¥ CON MUESTRAS ALEATORIAS SIMPLES DE TAMANO n = 30 ADMINISTRADORES DE EAI Y CON MUESTRAS DE TAMANO, n= 100 ADMINISTRADORES 31800 7.5. Dishibucién muestra de = a7 FIGURA 7.7 PROBABILIDAD DE QUE LA MEDIA MUESTRAL NO DIFIERA EN MAS DE $500 DE LA MEDIA POBLACIONAL USANDO UNA MUESTRA ALEATORIA SIMPLE DE 100 ADMINISTRADORES DE EAL Distribucign muestral dee POS] 3005 F <52 300) = 0.7888 52300 En Ia tabla de probabilidad normal estandar se encuentra que la probabilidad acumulada corres- pondiente az = 1.25 es 0.8944, Para ¥= 51 300, se tiene 51.300 ~ 51.800 re a = 1.25 La probabilidad acumulada correspondiente a z = ~1.25 es 0.1056. Por tanto, P(S1 300 F = 52300) = P(e = 1.25) — P(e = 1.25) = 0.8944 — 0.1056 = 0.7888. Entonces, aumen- tando el tamafio de a muestra de 30 @ 100 administradores de EAI, la probabilidad de obtener ‘una muestra aleatoria simple que esté entre los $500 de la media poblacional aumenta de 0.5034 0.7888, ‘Agui, el punto importante es que cuando aumenta el tamatio de la muestra, el error estindar de Ja media disminuye. Asf, una muestra de mayor tamafio proporciona mayor probabilidad de que la ‘media muestral esté dentro de una distancia determinada de Ia media poblacional Priae ued 4, Al presentar la distribucin muestral de % para 2, La demostracisn del eorema del limite central ‘el problema de BAI, se aproveché que se cono- fan Ia media poblacional = 51 800 y la des- viacién estindar poblacional 0 = 4000, Sin ‘embargo, lo usual es que los valores de la me- dia poblacional yy de la desviacién estindar poblacional g, que se necesitan para determina Ia distibuci6n muestral de ¥, no se conozcan, En el capitulo 8 se verd eémo se usan la media muestra y la desviacin esténdar muestral ¢ ‘cuandlo no se conocen 1. 6. requiere observaciones independientes en Ia muestra, Esta condicién se satisface cuando se trata de poblaciones infinitas y cuando se trata de poblaciones fintas, si el muestreo se hace ‘con reemplazo. Aunque el teoremsa del Limite central no se refiere ditectamente & muestyeos sin reemplazo de poblaciones finitas, se aplican los hallazgos del teorema del limite central ‘caando la poblacién es de tamao grande, 278 Copitvle 7 Muesteo y dstibuciones muesrles Métodos 18, La media de una poblacién es 200 y su desviacién estindar es 50, Se va a tomar una muestra aleatoria simple de tamaio 100 y se usard la media muestral para estimar la media poblacional a. [Cuil es el valor esperado de 3? '. [Cuil es la desviaci6n estindar de £7 © Muestre la distribucién muestral de = 4. (Qué muestra la distibucién muestral de £? 19, La media de una poblacién et 200 y su desviacisn estindar es 50. Suponga que se selecciona una variable aleatoria simple de tamaiio 100 y se usa € para estimar a. {Cual es la probabilidad de que la diferencia entre la media muestral y 1a media poblacio- nal no sea mayor que +57 bb. {De que la diferencia entre la media muestral y la media poblacional no sea mayor que 07 20, Suponga que la desviacién esténdar poblacional es o = 25. Caleule el error estindar de la media, @,, con muestras de tamaiio 50, 100, 150 y 200. ;Qué puede decir acerca del error estindar de la media conforme el tamaio de la muestra aumenta? 21, Suponga que de una poblacién en la que o = 10 se toma una muestra aleatoria simple de tama- fio 50. Halle el valor del error estindar de la media en cada uno de los casos siguientes (si es ne- ccesario use el factor de eorreeciéa para una poblaciéa finita). a, Eltamato de la poblaciéa es infinite, b. Eltamatio de la poblacién es N = 50 000, ©. Eltamafo de la poblacién es N = 5000, El tamafio de la poblacién es V = 500. Aplicaciones 22, Regrese al problema de los administradores de EAI. Suponga que se usa una muestra aleatoria simple de 60 administradores a, Dibuje la distribucién muestral de ¥ si se emplean muestras aleatorias simples de tamaiio 60. {Qué pasa con la distribucién muestra de ¥ si se usan muestra aleatorias simples de tama- fio 1207 ©. UQué puede decir acerca de lo que le pasa a la distribuciéa muestra de © conforme el tama- fio de la muestra aumenta? ;Parece ser l6gica esta generalizacién? Explique. En el problema de EAI (véase figura 7.5), se mostré que con n = 30, la probabilidad de que la ‘media muestral no difiiera més de $500 de la media poblacional era 0.5034 a. {Cuil es la probabilidad de que Ia media muestral no difiera més de $500 de la media po- Dlacional si se usa una muestra de tamaiio 60? bb. Responda el inciso a si el tamatio de la muestra es 120. 24, El costo medio de la colegiatura en una universidad estatal de Estados Unidos es $4260 anuales Considere este valor como media poblacional y asuna que la desviaciGn estindar poblacional es = $900, Suponga que selecciona una muestra aleatoria de SO universidades. a, Presente la distribucién muestral de ¥ como media muestra de la colegiatura en las 50 uni- versidades bb. {Cuil es la probabilidad de que Ia muestra aleatoria simple proporcione una media muestral que no difiera de 1a media poblacional en mis de $250? © {Cual es Ia probabilidad de que Ia muestra aleatoria simple proporcione wna media muestral {que no difiera de Ia media poblacional en mas de $100? 25, El College Board American College Testing Program informa que en el examen de admisign a las Uuniversidades, a nivel nacional, Ia media poblacional de las puntuaciones que se obtienen es y= 1020 (The World Almanac 2003). Suponga que la desviaci6n esténdar poblacional es « = 100, 7.5. Dishibucién muestra de = 279 26, 21, 28, 29, 30, a ¢Cusl es la probabilidad de que en una muestra aleatoria de 75 estudiantes la media mues- tual de las puntuaciones no difiera més de 10 puntos de la media poblacional? >. {Cul es la probabilidad de que en una muestra aleatoria de 75 estudiantes la media mues- tral de las puntuaciones no difiera més de 20 puntos de Ia media poblacional? El costo medio anual de un seguro para automévil es de $939 (CNBC, 23 de febrero de 2006) Suponga que la desviacisn esténdar es o {Cuél es Ia probabilidad de que una mvestra aleatoria simple de pélizas de seguros de auto- ‘mévil la media muestral no difiera mis de $25 de Ia media poblacional si el tamaio de la muestra es 30, 50, 100 y 400? 1b. {Qué ventaja tiene una muestra grande cuando se quiere estimar la media poblacional? BusinessWeek realiz6 una encuesta entre los estudiantes que terminaban sus estudios en los 30 programas de una maestrfa (BusinessWeek, 22 de septiembre de 2003). De acuerdo con esta en- cesta el salario medio anual de una mujer y de un hombre 10 afios después de terminar sus ¢s- tudios es $117 000 y $168 000, respectivamente. Suponga que la desviacién estindar entre los salarios de las mujeres es $25 000 y entre los salarios de los hombres es $40 000. a Cuél es la probabilidad de que en una muestra aleatoria simple de 40 hombres 1a media ‘muestral no difiera més de $10 000 de la media poblacional de $168 000? b. ;Cuél es Ia probabilidad de que en una muestra aleatoria simple de 40 mujeres 1a media ‘muestral no difiera més de $10 000 de la media poblacional de $117 0007 ©. Bn cual de los dos casos, inciso a 9 inciso b, hay més probabilidad de obtener una media auestal que no difiera en ms de $10 000 de la media poblacional? ;Por qué? 4d. {Cua es la probabilidad de que en una muestra aleatoria simple de 100 hombres, la media :muestral no difiera en més de $4000 de la media poblacional? Un hombre golfista tiene una puntuacién promedio de 95 y una mujer de 106 (Golf Digest, abril ‘de 2006). Considere estos valores como medias poblacionales de los hombres y de las mujeres y suponga que la desviacién esténdar poblacional es o = 14 golpes en ambos casos. Se tomaré una ‘muestra aleatoria simple de 40 golfistas hombres y otra de 45 mujeres golfistas a, Dé la distribucién muestral de £ correspondiente a los hombres golfistas, b. ;Cuél es la probabilidad de que, en el caso de los hombres golfistas, Ia media muestral no difiera en més de 3 golpes de la media poblacional? ‘©. {Cul es la probabilidad de que, en el caso de las mujeres golfistas, Ia media muestral no di- fiera en més de 3 golpes de la media poblacional? 4. Gn cual de los casos, ineiso a o inciso b, es mayor la probabilidad de que Ia media mues- tral no difiera en més de 3 golpes de la media poblacional? {Por qué? En el norte de Kentucky (The Cincinnati Enquirer, 21 de eneto de 2006) el precio promedio de Ia gasolina sin plomo era $2.34. Use este precio como media poblacional y suponga que la des- ‘viacién estindar poblacional es $0.20. f& {Cudl es la probabilidad de que el precio medio en una muestra de 30 gasolineras no difie- ra en més de $0.30 de la media poblacional? b. {Cua es la probabilidad de que el precio medio en una muestra de SO gasolineras no difie- ra en mas de $0.30 de la media poblacional? ‘c. {Cual es la probabilidad de que el precio medio en una muestra de 100 gasolineras no difie- a en mis de $0.30 de la media poblacional? 4. GRecomendaria usted alguno de los tamaiios muestrales de los incisos a, b 0 © para que la probabilidad de que el precio muestral no difirera en més de $0.30 de la media muestral fuera $0.95? Para estimar Ia edad media de una poblacién de 4000 empleados se toma una muestra de 40 em- pleades. a, (Usted usarfa el factor de correccién para una poblacién finita en el edleulo del error estén- dar de la media? Explique. 280 Copitvle 7 Muesteo y dstibuciones muesrles bb. Sila desviacién esténdar poblacional es o = 8.2 ails, calcule el error esténdar con y sin el factor de correccién para una poblacién finita, ;Cudl es la base para ignorar el factor de co- rreceién para la poblacién finita, i n/N’ 0,05? ©. {Cuil es la probabilidad de que la media muestra de las edades de los empleados no difie- 1a en més de +2 afos de la media poblacional de las edades? Distribucion muestral de p La proporcién muestral p es el estimador puntual de la proporcién poblacional p. La f6rmula para calcular la proporcién muestral es donde x = mimero de elementos de la muestra que poseen la caracteristica de interés n= (amafo de la muestra ‘Como se indicé en la seccién 7.4, la proporcién muestral p es una variable aleatoria y su distri- bucién de probabilidad se conoce como distribucién muestral de pi. DISTRIBUCION MUESTRAL DE p La distribucién muestral de p es 1a distribucién de probabilidad de todos los posibles valores de la proporcién muestral p. Para deerminar qué tan ostea st In proporciém muestra j de Ia proporcin poblacional p. se necesta entender las propiedades de la disbucidn muestra de fel valor esperado de fl Gesviaidn estindar de py la forma de la dstrbucién muestal dep Valor esperade de 7 El valor esperado de p, la media de todos los posibles valores de p, es igual a la proporci6n po- blacional p. VALOR ESPERADO DE p E() =p (7.4) donde E(p) = valor esperado de f = proporcién poblacional

You might also like