You are on page 1of 213
5m Cayetano Capriglioni E stadtstica TOMO It 3C EDITORES ‘ \ 1 INDICE 1.1. DEFINICIONES BASICAS 11 1.1.1, UNIVERSO, POBLACION ¥ MUESTR' 1.INTRODUCCION AL MUESTREQ 1 u 1.1.2. INFERENCIA ESTADISTICA 13 :\ 1.1.3, MUESTREO Bb a 1.1.3.1, MUESTREO PROBABILISTICO 14 4\, 1.1.3.2. MUESTREO (ONAL 14, 1.13.3. MUBSTREO SIN NORMA 4 1.1.4. METODOS DE OBTENCION DE MUESTRIAS 14 1.1.4.1. MUESTREO SIMPLE AL AZAR (SINREBMPLAZO) 15 1.1.4.2, MUESTREO ESTRATIFICADO AL AZAR ‘, 16 1.1.4.3, MUESTREO POR CONGLOMERADOS POLYETAPICO 18! 1.1.44. MUESTREO SISTEMATICO AL AZAR 19 1.2. CARACTERISTICAS POBLACIONALES Y MUESTRALES 19 1.2.1. PARAMETRO ESTADISTICO 19. 1.2.1.1. UNIVERSO FINITID Y PEQUENO. 20 1.2.12, UNIVERSO FINITID Y GRANDE © UNIVERSO INFINITO 23 1.2.2. ESTADIGRAFO Y ETIMADOR = 23 1.2.3.ESTIMACION 23 1.2.4. DISTRIBUCION DE LOS ESTIMADORES 24 1.2.5, SESGO 0 25 1.2.6. ERROR MEDIO CUADIRATICO 25 . PROPIEDADES DE LOS ‘BUENOS ESTIMADORES 26 1.3.1, ESTIMADOR INSESG. 26 1.3.2. CONSISTENCIA 27 | 3.3, 28 13.4, SUFICIENCIA 29 1.4-GRADOS DE LIBERTAD | 30 . 1.5. ALGUNOS ESTIMADORES IMPORTANTES 32 1.5.1, MEDIA ARITMETICA M 32 .5.2. VARIANZA MUESTRAI PROPORCION MUESTR 33 ESPERANZA Y VARIANZ.A'DELOSESTIMADORES 36. MEDIA MUESTRAL } 36 PROPORCION MUESTRAL\, 36 VARIANZA MUESTRIAL37 © 1.6, DISTRIBUCION DE ALGUNOS ESTIMADORES 37 1.6.1, DISTRIBUCION DELA MEDIA MUESTRAL DE POBLACIONES NORMALES 37 1.6.3. DISTRIBUCION DE LA MEDIA ARITMETICA MUESTRAL CUANDO LA VARIANZA POBLACIONAL ES DESCONOCIDA 39 1.6.4. DISTRIBUCION DE-LA PROPORCION MUESTRAL 40 1.7, APLICACION DE LA FRACCION DE MUESTREO 41 1.8. PROBLEMAS RESUELTOS 4} 1.8.1. DISTRIBUCION DELA MEDJA MUESTRAL 41 1. POBLACIONES NORMALES INFINITAS 41 1.2, POBLACIONES NORMALES|FINITAS 42 1.3. POBLACIONES NO NORMALES, MUESTRAS ORANDES 43 18.2, DISTRIBUCION DE LA PROPORCION MUESTRAL 44 1.8.2.1, UNIVERSOS INFINITOS 44 1.8.2.2. UNIVERSOS FINITOS 44 1.8.3. PROBLEMAS VARIOS 45 2, INTERVALO DE CONFIANZA 35 2.1, DEFINICION 3: 2.2. INTERVALOS DE CONFIANZA ADITIVOS 56 2.2.1. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES NORMALES. 56 2.2.1.1. VARIANZA POBLAGIONAL CONOCIDA. POBLACIONES INFINITAS. 57 2.2.1.2. VARIANZA POBLAGIONAL CONOCIDA. POBLACIONES FINITAS. 57 2.2.1.3, VARIANZA POBLAGIONAL DESCONOCIDA. POBLACIONES INFINITAS. 58 2.2.1.4. VARIANZA POBLACIONAL DESCONOCIDA. POBLACIONESFINITAS. 59 2.2.2, INTERVALO DE CONHIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES CUYA DISTRIBUCION DE PROBABILIDAD ES SSCONOCIDA. 60 2.2.2.1. MUESTRAS GRANDES 61 2.2.22. MUESTRAS CHICAS, 61 2.2.3, INTERVALO DE CONFIANZA PARA LA vropoRciOn DE ELEMENTOS QUE TIENEN UN DETERMINADO ATRIBUTO EN LA POBLACION. 62 2.2.3.1. POBLACIONES INFINITAS. 62°; 2.2.3.1. PROPORCION POBLACIONAL DESCONOCIDA. POBLACIONES FINITAS. 63 INZA PARA LA VARIANZA POBLACIONAL. 64 64 65 ‘A PARA ESTIMAR LA MEDIA POBLACIONAL. 65 ONAL CONOCIDA 65 HONAL DESCONOCIDA 66 A PARA ESTIMAR LA PROPORCION POBLACIONAL. 67 68 LLINFINITA. VARIANZA POBLACIONAL CONOCIDA 68 25. 1.2, POBLACION NORMAL FINITA, VARIANZA POBLACIONAL CONOCIDA, 69 2.5.13. POBLACION NORMAL INFINITA. VARIANZA POBLACIONAL DESCONOCIDA.70 2.5.1.4. POBLACION NORMAL FINITA. VARIANZA POBLACIONAL DESCONOCIDA 71 2.5.1.5. POBLACION NO NORMAL. MUESTRAS GRANDES. 72 2.5.1.6. POBLACIONES NO NORMALES. MUESTRAS CHICAS. 73 2.5.2. ESTIMACION DE LA PROPORCION POBLACIONAL. 73 2.5.2.1. POBLACIONES INFINITAS. B 2.5.2.2, POBLACIONES FINITAS 74 2.5.3. ESTIMACION DE LA VARIANZA 75 2.5.3.1. POBLACIONES NORMALES 75 2.5.4, DETERMINACION DEL TAMANO DE LA MUESTRA PARA ESTIMAR LA MEDIA. POBLACIONAL. 16 2.5.4.1. POBLACIONES NORMALES INFINITAS CON VARIANZA POBLACIONAL CONOCIDA 76 2.5.42. POBLACIONES NORMALES INFINITAS CON VARIANZA POBLACIONAL DESCONOCIDA 7 2.5.4.3. POBLACIONES NORMALES FINITAS CON VARIANZA POBLACIONAL CONOCIDA. 78 | 2.5.4.4. POBLACIONES NO! IALES FINITAS CON VARIANZA POBLACIONAL ‘TAMANO DE LA MUESTRA PARA ESTIMAR LA PROPORCION 3. PRUEBA DE HIPOTESIS 3.1, INTRODUCCION _ 103 3.2. DEFINICIONES BASI 3.3, ESTADIGRAFOS DE PRUEBA PARA LA PRUEBA DE HIPOTESIS DE PARAMETROS ESPECIFICOS DE UNA POBLACION — 111 3.3.1. ESTADIGRAFO DE PRUEBA PARA LA PRUEBA DE HIPOTESIS DE LA MEDIA POBLACIONAL DE POBLAGIONES NORMALES. ua 3.3.2. ESTADIGRAFO DE PRUEBA PARA LA PRUEBA DE HIPOTESIS DE LA MEDIA POBLACIONAL DE POBLAGIONES NO NORMALFS 117 3.3.3. ESTADIGRAFO DE PRUEBA PARA LA PRUEBA DE HIPOTESIS DE LA PROPORCION DE ELEMENTOS CON UN DETERMINADO ATRIBUTO 120 | 7 3.3.4. ESTADIGRAFO DE PRUEBA PARA LA PRUEBA DE HIPOTESIS DE LA VARIANZA POBLACIONAL DE POBLACIONES NORMALES 123, 3.4, ESTADIGRAFOS DE PRUEBA PARA LA PRUEBA DE HIPOTESIS REFERIDA ALA COMPARACION DE PARAMETROS ESPECIFICOS DE DOS POBLACIONES 125 3.4.1, ESTADIGRAFO DE PRUEBA PARA COMPARAR LAS VARIANZAS POBLACIONALES DE DOS POBLACIONES NORMALES 126 3.4.2. ESTADIGRAFO DE PRUEBA PARA COMPARAR LAS MEDIAS 127 POBLACIONALES DE DOS POBLACIONES NORMALES 122 3.43. ESTADIGRAFO DE PRUEBA PARA COMPARAR {AS PROPORCIONES POBLACIONALES DE DOS POBLACIONES 133 3.5. PROBLEMAS DE PRUEBA DE HIPOTESIS 135 4, ANALISIS DE REGRESION Y CORRELACION 14g 4.1. INTRODUCCION 1 1 4.2, ANALISIS DE REGRESION 143 | i SUPUESTOS BASICOS DELA REGRESION 144 42.1, ANALISIS DE REGRESION SIMPLE 144 \ 4.2.2. ESTIMADORES DE LOS PARAMETROS DE REGRESION 147 4.2.2.1, VARIACION INDIVIDUAL Y VARIACION CONJUNTA 148 42.22. DIAGRAMA DE PUNTOS MUESTRAL 149 42.23. ESTIMADORES 149 42.3. MEDIDAS DE VARIABILIDAD EN LA REGRESION 155 4233.1, SUMA DE CUADRADOS TOTAL 152 4.2.3.2. SUMA DE CU.ADRADOS EXPLICADA POR LA REGRESION, 153 4233. SUMA DE CUADRADOS RESIDUAL 153 4.2.3.4, COBFICIENTE DE DETERMINACION 154 42.3.5, VARIANZA RESID!'AL, MUESTRAL 154 42.4, DISTRIBUCION DE LOS caT!MADORES 154 42.4.1. DISTRIBUCION DEL ESTIMADUR DE LA ORDENADA AL ORIGEN DE LA RECTA DE REGRESION 154 | 4.2.4.2, DISTRIBUCION DBL ESTIMADOR DE LA PENDIENTE DE LA RECTA DE REGRESION 156 \ 4.2.43. DISTRIBUCION DBL ESTIMADOR DE LA PREDICCION DE UN VALOR DE LA VARIABLE EXPLICADA PARA UN VALOR DADO DE LA VARIABLE EXPLICATIVA. 158 42.5. INTERVALOS DE CONFIANZA 159 4.2.5.1, INTERVALO DE CONFIANZA PARA EL PARAMETRO: ORDENADA AL ORIGEN DE LA RECTADEREGRESION | 159 4.2.5.2, INTERVALO DE CONFIANZA PARA EL PARAMETRO: PENDIENTE DE LA RECTA DE REGRESION 160 . 4.2.5.3, INTERVALO DE CONFIANZA PARA LA PREDICCION DE UN VALOR DE LA ‘VARIABLE EXPLICADA CORRESPONDIENTE A UN VALOR DADO DE LA VARIABLE. EXPLICATIVA. 160 4.2.6 PRUEBA DE HIPOTESIS PARA LOS PARAMETROS DE LA RECTA DE REGRESION 160 | > 43. ANALISIS DE CORREILACION 165 * 43.1. ANALISIS DE CORRELACION LINEAL SIMPLE 165 43.1.1. COBFICIENTE DE CORRELACION LINEAL POBLACIONAL| — 165 43.1.2, COBFICIENTE DE (ORRELACION LINEAL MUESTRAL 167, 43.1.3. PRUEBA DE SIGNIFICACION _ 167 43.1.4, PRUEBA PARA EL COEFICIENTE DE CORRELACION LINEAL CUANDO SE SABE QUE ESSIGNIFICATIVO 168 4.4. PROBLEMAS DE ANALISIS DE REGRESION Y CORRELACION 170 5. SERIES CRONOLOGICAS = 173 5.1. DEFINICION 173 5.2. COMPONENTES 174 5.2.1, MOVIMIENTO DE TENDENCIA 177 5.2.1.1, DETERMINACION IDE LA TENDENCIA LINEAL 178 5.2.1.2. PROMEDIOS MOVILES 182 5.2.2, MOVIMIENTO ESTACIONAL 187 5.2.2.1, METODO DE RELACION A LOS PROMEDIOS MOVILES187 5.2.3. MOVIMIENTO CICLICO 192 | 4 52.4. COMPONENTE RESIDUAL, O ALEATORIA 14 5.2.4.1, VARIANZA RESIDUAL #94 } 5.2.5. INTERVALO DE ome 195 6, NUMEROS INDICES... 6.1. CONCEPTOS BASICOS 6.1.1. DEFINICIONES 6.1.2. GLASIFICACION DE LOS NOMER(OS INDICES... 62. CONSTRUCCION DI DE NUMEROS Ipice 6.2.1. NOMENCLATUI 6.2.2. INDICES DE Paci 6.2.3, INDICES DE CANTIDAL .2.4. INDICE DEL VALOR 6.3. METODO PARA LA CONETRUCCIC)N DE NUMEROS INDICES. 6.3.1. CONSTRUCCION DEL INDICE DE FPRECIOS DE LASPEYRES.. | 8.4. APLICACION. 9.4.1, DEFLACTACION ESTADISTICA 6.4.2. CAMBIO DE BASE. 6.4.3. EMPALME DE SERI 6.6. PROBLEMAS DE APLICACION. 6.6.1. PROBLEMAS RESUEL TOS ... 1. INTRODUCCION AL MUESTREO 1.1. DEFINICIONES BASICAS En la tarea estadistica cotidiana, raramente se conocen exactamente cuales son las distin- tas funciones que describen probabilisticamente el comportamiento de la, o las variables, que representan las caracteristicas de aquello que se esta investigando: veces, deacuerd a determinadas experiencias, se esta en condiciones de suponer algu- nas formas funcionales de as distribuciones de probabilidad. Aun asi, cominmente se ignoran los valores de los parametiios de dichas distribuciones. Uno de los propésitos de la disciplina Estadistica es poder inferir las distribuciones de probabilidad, sus propiedaties y sus parametros. Para ello, la técnica’ basica que se utiliza, y de la queen este capituio se analizaran aspec- tos elementales, es el Muestreo. Por ello, se hace nécesario recordar y profundizar algunas de las definiciones que ya fueron’ formuladas en'la parte introductoria del Analisis Estadistico desarro- Nada en el Tomo 1 de este|trabajo. 1.1.1. UNIVERSO, POBLACION ¥Y MUESTRA ‘Se ama UNIVERSO al conjunto de Unidades Expertmentales que po- seen caracteristicas comunes observables, » que se utilizan para obtener informacion sobre un hecho particular. El UNIVERSO queda determinacic cuando se defirien los objetivos del trabajo que se lleva- 14a cabo, como asi también las UNIDADES EXPERIMENTALES sobre las que se realizaran las observaciones. Se Hama POBLACION a cualquier variable particular que se estudia a un UNIVERSO. | De acuerdo con esta definicion, se puede colegir que cada UNIVERSO puede generar va- rias POBLACIONES. Una por cada una de las variables cuya medicion sea de interés paraalcanzar Jos objetivos fijados. En otras palabras, al establecer cudles seran las variables que se observarin en cada una de las UNIDADES EXPERIMENTA LES que confornian el UNIVERSO, quedan determi- nadas las distintas POBLACTONES “, Se Hama CENSO a ta medicidn, en fa totalidad de las UNIDADES EXPE- RIMENTALES fa conforman ef URIVERSO, de todas las variables que previamente ido declaradas relevantes, para la investigacion a evar a cabo. La nomenclatura: que se utilizard en este trabajo para designar al tamajio del UNIVERSO, 0 al tamaiio de la POBLACION, que necesariamente es el mismo, es: | N: Tamafio del UNIVERSO © tamaiio de la POBLACION (cuando corresponda) Los UNIVERSOS pueden ser finitos 0 infinitos, dependienda de la cantidad de elementos que los conforman y, consécuentemente, las POBLACIONES seran finitas o infinitas. Bjempto 1.1 Dadas las siguientes situacipnes, identificar alos Universos y a las correspondientes Poblaciones: | Como es costumbre, a las poblaciones se Ia representan con las ultimas letras del aifabeto latino V; ESTADISTICA = C. Capriglioni | LIntroduccién al Muestieo T a) Se desea tener informacion acerca de la rentabilidad de un monte de 2000 plantas de manzanas, para ello, se deberé determinar la cantidad y el peso total de los frutos que tiene cada planta. b) Se desea tener informacion sobre las condiciones de vida de las 380 familias que viven en un determinado barrio de la ciudad, para ello, acada familia se la consultaré acerca de la cantidad de personas que integran el grupo familiar, el ingreso mensual del grupo y el gasto mensual del gru- po en alimentacién. 1 c) Se desea analizar el conjporaaer de las ventas, para ello, de cada factura emitida se regis- trara la cantidad de unidades y ef monto correspondiente. 4) Se quieren analizar determinadas caracteristicas de los recién nacidos cuyas madres presentan una determinada patologia, para ello, a cada uno se le mediré la talla, el peso y Ja frecuencia car- diaca. SOLUCION a) El Universo esta for por la totalidad de plantas de manzanas del monte. Dado que se co- noce la cantidad total de plantas que contiene el monte (2000 plantas), el Universo es finito. Las variables a estudiar, de acuerdo al objetivo fijado son dos, por Io tanto hay dos poblaciones, a saber: POBLACION 1. X: CAN IDAD DE MANZANAS POR PLANTA. {X/X20AX € No} POBLACION 2. Y: PESO TOTAL DE 1.AS MANZANAS DE CADA PLANTA. {Y/Y >OAY € R} b) El Universo esta formado por la totalidad de familias del bartio. Dado que se conoce la canti- dad de familias que viven en el barrio, el Universo es finito (380-familias) Las variables a estudiar, de acuerdo al objetivo fijado son tres, por fo tanto, hay tres poblaciones, a saber: POBLACION 1. X: CANTIDAD DEPERSONAS QUE INTEGRAN EL GRUPO FAMILIAR. (X/X>0A XeN} POBLACION 2. Y: INGRESO MENSUAL DEL GRUPO FAMILIAR. {Y/Y >0¥ € N} POBLACION 3. Z: GASTO MENSUAL DEL GRUPO EN ALIMENTOS, {Z/Z>0AZ € It} c) El Universo esta formado por la totalidad de facturas confeccidnadas como consecuencia de las ventas. Dado que no se hace referencia a Ja cantidad total de facturas existentes, el Universo es considerado infinito. . Las variables a estudiar, de acuerdo al objetive fijade son dos, por lo tanto hay dos poblaciones, a saber: { : POBLACION 1. X: CANTIDAD DE UNIDADES VENDIDASEN CADA VENTA. {X/X>0AX € N) POBLACION 2. Y: MONTO DE CADA VENTA. {¥/¥> OA Y eR} d) EI Universo esta formado por la totalidad de personas recién nacidas cuyas madres presentan una determinada patologia. Dado que.no se hace referencia a Ja cantidad total de nacimientos, el Universo es considerado infinito. Las variables. estudiar, de.acuerdo al objetivo fijado son tres, luego, por definicion, hay tres poblaciones, a saber: POBLACION I. X; PESO DEL RECIEN NACIDO, {X/X>0vX.0 it} POBLACION 2. TALLA DEL RECIEN'NACIDO- {¥/¥>0r ¥ eR} POBLACION 3. ECUENCIA CARDIACA DEL RECIEN NACIDO, {Z/Z>0AZ € N} Si fuese necesario informacion precisa sobre la totalidad de los elementos que for- man el UNIVERSO, entoncds se deberia realizar un CENSO. Si el tamiafio del UNIVERSO es dema- siado grande, la tarea censual resulta muy onerosa y, consecuentemente, impracticable. Por otro lado, la ejecucién de un CENSO es imposible en aquellos casos donde hay que enfrentar a un UNIVERSO infinito, o cuantio el proceso de medida o investigacién de las caracteristicas de cada elemento es destructivo. Por estas motivas, hay que utilizar otras técnicas estadisticas a los efec- tos de obtener datos iitiles y confiables, necesarios para tener informacion acerca de la POBLA- CION. ‘ PAGINA 12 | ESTADISTICA~C. Caprigitont I | 1. Introducctén al Muestreg Una de esas técnicas, como se ha dicho, y cuya definicion precisa se brindaré masadelan- te, es el Muestreo. El Muestreo consiste en observar y medir a algunos elementos del universo y con ellos, obtener la informacion necesaria para cumplir con los objetivos fijados para concretar el trabajo. ‘Se llama MUESTRA a wn subconjunto o parte de una POBLACION 10- mada de forms tal, que con ella se pueda hacer un juicio acerca de esa POBLACION completa. La nomenclatura que se utilizara en este trabajo para designar al tamafio de la MUESTRA es: n: Tamaiio de la MUESTRA Se Hama. FRACCION DE MUESTREO a cociente entre el tamaftode fa MUESTRA J ¢f tamaito de la POBLACION. | Fm=" N 1.1.2, INFERENCIA lestapistica Uno de los problemjas cruciales que debe resolver el Estadistico es Ia obtencién de infor- macién acerca de una determinada poblaci6n. Si, por algunas de las razones ya expuestas, no es. posible practicar un censo, éste debe recurrir a los datos de una muestra y con ellos realizar las correspondientes afirmaciones. ‘Se llama INFERENCIA ESTADISTICA a cualquier afirmacion que se realiza sobre una determmada poblacin, bastindose en los datos obte- nnidos con una tmuestra, pudiéndose obtener, a partir del cdileuto de pro- babilidlad, una determinadia medida de'la incertidumbre que se genera. Esto significa que s¢ INFIERE la poblacién a partir de la muestra. De esta manera, las con- clusiones a que se llegan, por estar basadas en “ignorancias pareiales", producen un cierto grado de duda, el cual podria ser controlado probabilisticamente, sila muestra se toma utilizando méto- dos que garanticen aleatoriedad. 1.1.3. MUESTREO Para obtener una MUESTRA que permita INFERIR adecuadamente la poblacion en estudio, es necesario tener en cuenta algunas reglas y operaciones, las cuales dependeran de los objetivos fijados. Las siguientes defy iciones ponen de manifiesto, someramente, algunas de ellas. ‘Se Hama MUESTREO al procedimiemo medianie el cual se obtienen una o mas STRAS de unt POBLACION dada. ‘Se Hama UNIDAD DE MUESTREO a cada wnidad experimenial, 0 ‘grupo de unidddes experimentales, que son tomadas para obtener unet MUESTRA. ‘Se Hama DISENO MUESTRAL a un plan de MUESTREO especifico donde se establece cudles serdn los procedimigntos a seguir para tomar una o més MURSTRAS. ESTADISTICA — C. Caprigtioni PAGINA 13 LIntroduccign al Muestreo Las unidades experimentales que intervienen en una muestra, pueden ser tomadas con mayor o menor grado de subjetividad por parte del sujeto que se encarga de realizarda muestra. De esta manera, se originan distintos tipos de MUESTREO. Algunos de ellos se detallan en los parigrafos siguientes. | 1.1.3.1, MUESTREO PROBABILISTICO. Un muestreo.es PROBABILISTICO cuando las Unidades Experitnentales que componen la muestra son tomadas al azar, pudiéndose caloular a priori, la probabilidad que tiene cada mues- tray, como consecuencia, cada Unidad Experimental, de ser la obtenida. Esto significa que el proceso de obtencidn de cada uno de los elementos que integraré la muestra, es un experimento aleatorio. EI MUESTREO PROBABILISTICO es un tipo de muestreo objetivo porque, como la obten- cién de las Unidades Experimentales es realizada al azar. la inclusion de’ cada una de ellas en la muestra, no depende del syjeto que se encarge de tomar Ia muestra. 1.1.3.2, MUESTREO INTENCIONAL Un muestreo es INFENCIONAL, cuando las Unidades Experimentales que componen la muestra son obtenidas siguiendo una regla o norma préestablecida. Esto significa que cada elemento que integrara la muestra, sera “elegido" por el "sujeto” que realiza el trabajo, de acuerdo a un criterio que se fija previamente. El MUESTREG INTENCIONAL es un tipo de muestreo subjetivo y carece de una base tedri- ca satisfactoria. La representatividad de la muestra depende de fa intencion del “sujeto” quetoma Ja muestra, y la composicign de ésta puede estar influenciade por sus preferencias o tendencias. 1.1.3.3. MUESTREO SIN NORMA Un muestreo es SIN NORMA cuando, por razones de comadidad, costo, o cualquier otra circunstancia, Ja obtencién|de las Unidades Experimentales que componen la muestra se realiza sin una norma, o regla o criteria definido, Esto significa que cada elemento que integraré la muestra es elegido porel sujeto, pero sin un criterio fijado. Por tal motivo se considera que fa obtencidn es cuasi-aleatoria, luego, el mues- treo es cuasi-objetivo. EL MUESTREO SIN NORMA se puede utilizar cuando hay elementos de juicio suficientes como para suponer que la poblacién es homogénea. Si este supuesto es cierto, la representatividad de la muestra puede ser satisfactoria. 1.1.4, METODOS DE OBTENCION DE MUESTRAS En este trabajo se estudiard la aplicacién de los Métodos Estadisticos en el Muestreo Pro- babilistico, por lo tanto, se supone que cada elemento que interviene en la muestra es tomado al azar. Para garantizar que la obtencion de cada uno de ellos sea realmente aleatoria, es conveniente Ja utilizacién de un bolillerp o de una TABLA DE DIGITOS AL AZAR. ~ Una muestra de tamaiio n, cuyos elementos se obtienen al azar de una poblacién con fun- cidn de densidad de probabjlidad f{X), o funcién de probabilidad 7X), segun corresponda, esun conjunto formado por Nt variables aleatorias que tienen fa misma distribucién de probabilidad. MUESTRA: { X35 Xz5...;Xn} SKA) = f\X2) = ++ = f\Xa) o PAX) = (X2) = +++ = plXn) PAGINA 14 ESTADISTICA-C, Capriglioni 4, Introduccién al Muestreo segiin corresponda. Ejemplo 1.2 En un bosque formado por 500 ejemplares de pinos se desea estudiar el diametro del tronco al- canzado luego de un determinade tiempo de ser plantado, para ello se decide utilizar una muestra de 20 ejemplares. Se pide, identificar a la poblacion y a la muestra. SOLUCION Poblacion - X: Diametro del tronco: Acada arbol que pertenecerfi a la muestra le correspondera un vator de la variable "Diametro del tronco", El valor correspondiente al arbol 1, puede ser cualquiera, por lo tanto es variable y, hasta que no haya sido medido, el|diametro es desconacido, por !o tanto, es aleatorio. Lo mismo ocurre con el ejemplar 2, el ejemplar 3, etcétera, por to tanto, la muestra es el conjunto {X15 X25 X33... 5 Xo} Lanaturaleza de las Poblaciones que seran objeto del muestreo puede ser de lo mas varia- da. Por ejemplo, puede tratarse de una poblacion homogénea o de una poblacién heterogénea; las unidades experimentales pueden presentarse sistematicamente con una determinada periodicidad, o pueden estar agrupadas formando conglomerados, etostera, Estas particularidades que presentan las poblaciones dan origen a tos Métodos de obtencion de las muestras que resulten mas adecua- dos, algunos de los cuales se describiran brevemente en los proximos acépites. 1.1.4.1. MUESTREO SIMPLE AL AZAR (SIN REEMPLAZO) El método MUESTREO SIMPLE AL AZAR (Sin reemplazo) consiste en obtener al azar, una muestra de n elementos, de entre los N que constituyen el Universo. Hay que tener en cuenta que todas las muestras posibles de tamafio mf deben tener fa misma probabilidad de ser tomadas, como asi también, que todos los ¢lementos que integraran ta muestra tengan, en el momento de cada extraccién, la misma probabilidad de ser obtenidas. Considérese, a modo de ejemplo, un Universo finito de tamaiio N. Como a cadauna de las unidades que se extraen no se las repone, 1a cantidad de muestras distintas, igualmente posibles, de tamafio n que pueden obtenerse de dicho Universo, es una combinacién de N elementos to- mados de a n. Esta combinacién se puede calcular con ef numero combinatorio (9) n Por lo tanto, la probabilidad de que una muestra particular sea la obtenida es, de acuerdoa la definicion clasica, 1 () n _ Sobre la base de esto, por ser equiprobables todas las muestras de tamafio n, la probabili- dad de que un elemento cualquiera de la poblacién forme parte de 1a muestra, se puede calcular haciendo : ~ i Von por lo tanto, todos los elementos tienen la misma probabilidad de ser extraidos. Sila poblaci6n es infinita y fas variables muestrales son independientes, la probabilidad Cantidad de muestras Cantidad de muestras posibles ESTADISTICA - C. Capriglianl PAGINA 15 Lintroduccion al Muestreo de que una de ellas asuma jin determinado valor, es la misma que para cualquier valor que asu- man las otras. Caso contratio, si hay dependencia estadistica, dicha probabilidad depender4 del valor de las que ya fueron obtenidas, Enel método de MUESTREO SIMPLE AL AZAR, las Unidadds Experimentales son tomadas al azar, cualquiera sea la posicion que ocupen en el universo, Por lo tanto, para que se cumpla la condicién de igualdad de probabilidad para todas ellas, este método deberia ser utilizado sola- mente, cuando se tiene reallevidencia de la homogeneidad de la poblacién de la cual se tomaré la muestra. Ejemplo 1.3 | : Dado el Universo de! Ejemiplo 1.2, si las condiciones det suelo son las mismas en todo el predio que ocupa el bosque, entonces puede suponerse que la poblacion "Diametro del tronco" es homo- ’ génea. Determinar el método de mwestreo adecuado para tomar una muestra de tamafio 20. SOLUCION Le poblaci6n es X: Diametro del tronco Poblacién finita: N= 500 Tamaifio de la muestra: n 5 20 Bajo el supuesto de homogeneidad de ta poblacién, cualquiera de los 500 ejemplares puede brin- dar datos similares, por lo tanto, el método de muestreo adecuado es e] Muestreo Simple al Azar. 1.1.4.2, MUESTREO ESTRATIFICADO AL AZAR { En aquellos casos en tos cuales la poblacién presenta una gran variabilidad, o sea, una po- blacién heterogénea, la utillzacin del Muestreo Simple al Azar puede proporcionar muestras no Tepresentativas y las concsiones que surjan del analisis ellas no seran del todo confiables. Cuando se presentan estas situaciones, el método de muestreo mas adecuado a utilizar es el MUESTREO ESTRATIFICADO AL AZAR, Este método consiste en particionar al Universo en estra- tos (0 clases o subpoblaciones), dentro de los cuales si la variable debe presentar homogeneidad. De cada uno de Jos estratog sé obtiene una muestra Simple al Azar, Los simbolos a utilizar en.este trabajo son: N: tamafio del Universo . h: captidad de estratos Ny: tamafio del j-ésimo estrato Se debe cumplir que DSN-N Si el tamafio de la muestra es n, y de cada uno de los estratos se toma una muestra de ta- mafig Mj, entonces se debe fumplir que: Una cuestién importante a resolver es cuanto del total n debera asignarse a cada uno de | los estratos. Laasignacién del tamaito de la muestraa cada uno de las distintos estratos se llama AFI- JACION, y puede realizarse de alguna de las siguientes formas: a. Afijacién igual 9 uniforme: El tamafio de muestra que le corresponde a cada es- PAGINA 16 ESTADISTICA~C. Caprigliont 1 introduccion af Muestreo | . trato es igual para todos, Este tamafo se calcula, entonces, haciendo el cociente entre el tam@fio de la muestra, n, y ta cantidad de estratos, h. i A | ny =n ny i b. Afijaci6n preporcional’ El tamafio de la muestra que le corresponde a cada estrato es proporcional al tamaiio del estrato. Se calcula haciendo el producto entre la fraceién de muestreo y el tamafio de cada estrato. ~ =P Ny = y= m= Z-N an “Ny 3 Mp wes) = % no . tima: El tamadio de la muestra para cada estrato es proporcional al tamajio del estrato y al desvio estandar correspondiente. De esta manerase tiene en cuenta la falta de homogeneidad entre las subpoblaciones. nN, oO nN) -O n-Nn-O my = NEO og, = ON O> | gy = Nn On NiOj NG: UNG i= ist Ejemplo 1.4 En una ciudad de 28000 hogares se desea estudiar, utilizando una muestra de 210 hogares, el ni- vel de ingreso por cada hogar. Investigaciones previas permitieron comprobar que, en dicha ciu- dad, en general, las personas fienden a vivir en barrios con otras personas cuyos niveles de ingre- so son similares. Se detectaron cuatro barrios, 2 suber Norte (barrio 1), con 12000 hogares, Sur (barrio 2), con 8000 hogares; Este (barrio 3), con 1600 hogares y Oeste (barrio 4),'con 6400 hogares Tambien se ha detectado que fa variabilidad de los ingresos dentro de cada uno de los barrios es casi la misma. Determinar | Método de Muestreo mas adecuado para seleccionar la muestra. SOLUCION La poblacion es, hs X : Nivel de ingreso j Tamafio.del Universo : N= 28000 a Tamafio de la muestra 10 Dado que las personas estén agrupadas en barrios dentro de los cuales las familias presentan ca- racteristicas similares y casi ho hay variabilidad entre Jos ingresos, el método de muestreo mas adecuado es el Método Estratificado'al Azar, con afijacién proporcional, donde cada barrio puede considerarse un estrato Los tamajfios de cada estrato son, entonces Nr=12000 ; N2=8i 4 N3=1600 | Na= 6400 El tamafio de la muestra proporcional para cada estrato se calcula haciendo n 210 n 210 f, = —-N, = ——~- 12000 = 90 =—-N, = ——-8000=60 , N *"28000) 6m NN? = 28000 210 n 210 = 210 1600-12 =", = 2° 64o0- ws Seo0 100=12 sy = ANy = 55 -6400= 48 Los tamafios de muestra para cada estrato, utilizande afijacion proporcional, son: y= 90 ; n2=60 ; ny=12 , m= 48 ESTADISTICA ~ C, Capriglioni PAGINA 17 LIntroduccién al Muestreo 1.1.4.3. MUESTREO POR CONGLOMERADOS POLIETAPICO ‘Cuando se toman muestras, utilizando el método de Muestreo Simple al Azar o el método de Muestreo Estratificado al Azar, las unidades de muestreo coinciden con las unidades experi- mentales. Ei método que s¢ presenta en este pardgrafo, es un caso més general que tiene como particularidad, que la unidad de muestreo esta formada por un grupo de unidades experimentales, Elmétodo de MUESTREO POR CONGLOMERADOS POLIETAPICO consiste cn agrupar los elementos que conforman et Universo en conglomerados, de modo tal que entre ellos haya la su- ficiente homogeneidad, como para representar a la poblacién. El proceso de obtencién de la muestra se hace sobre la base de estos conglomerados, que constituyen las unidades de muestreo, y no sobre la base de las unidades fisicas, con excepcién de la iltima ctapa. Este método es adecuado para utilizarlo cuando las unidades experimentales, naturalmen- te, estan agrupadas en conglomerados y cada una de ellas puede ser, a su vez, considerada como unidad de muestreo, Generalmente los conglomerados son superficies o areas en que se ha dividido el émbito ocupado por el Universo. Si es auna etapa, se toma una muestra simple al azar de conglomerados, y en cada uno de ellos se miden todos los elementos que constituyen el conglomerade. Si se trata de dos ctapas de muestreo o bietépico, se toma una muestra simple al azar de conglomerados (primera etapa de muestreo), y de cada uno de estos conglomerados, se toma una muestra de unidades experimentales (segunda etapa de muestreo). Si se trata de tres etapas de muestreo o trietapico, primero se constituyen los conglomera- dos y, dentro de cada uno de ellos se forman los subconglomerados, luego, se toma una muestra simple al azar de conglomerados (primera etapa de muestreo), de cada uno de ellos una muestra simple al azar de subconglomerados (segunda etapa de muestreo) y, por Ultimo, de cada subcon- glomerado una muestra simple al azar de unidades fisicas (tercera ctapa de muestreo). Este procedimiento, puede generalizarse obteniéndose un muestreo con varias etapas 0 Muestreo Polietipicos. Ejemplo 1.5 1 Se desea estudiar, mediante el uso del muestreo, el coeficiente intelectual de los alumnos que cursan el séptimo grado de] nivel primario en todo el pais. Investigaciones previas permiten su- poner que hay homogeneidad entre los coeficientes intelectuales. Describir el procedimiento para aplicar el Método de Muesireo por Conglomerado Polietapico, hasta tres elapas de muestreo, SOLUCION - Una etapa de muestreo Cada provincia se considera un conglomerado. Se toma una muestra de provincias, y se mide el coeficiente intelectual a cada uno de los alumnos de séptimo grado, que cursan en las escuelas de las provincias que pertenecen a la muestra. - Dos etapas de muestreo Cada provincia se considera un conglomerado, y cada departamento provincial, un subconglome- rado, Se toma una muestra de provincias (primera etapa de muestreo}, De cada una de las provin- cias que pertenecen a la muestra, se toma una muestra de departamentos (segunda etapa de mues- treo). Se mide el coeficiente intelectual a cada uno de los alumnos de séptimo grado que cursan en las escuelas de los partidos o departamentos que pertenecen a la muestra. ~ Tres etapas de muestreo / Cada provincia se considera un conglomerado; cada departamento provincial un subconglomera- doy cada escucla un sub-subconglomerado. Se toma una muestra de provincias (primera etapa de muestreo). De cada una dellas provincias que pertenecen a la muestra, se toma una muestra de departamentos (segunda etapa de muestreo), De cada uno de los departamentos que pertenecen a PAGINA 18 "“Charlar y hacer son cosas diferentes, mAs bi tagé a 8 bien antagénicas Kart Marx 1, Introduccion al Muesireo Ja muestra, se toma una muestra de escuelas (tercera etapa de muestreo). Se mide el cocficiente intelectual a cada uno de los alumnos de séptimo grado que cursan en las escuelas que pertenecen a la muestra. 1.1.4.4. MUESTREO SISTEMATICO AL AZAR EIMUESTREO SISTEMATICO AL AZAR consiste en ordenar a las N Unidades Ex- perimentales que conforman el Universo, de acuerdo a como se fueron presentando, y obtener la muestra eligiendo, sistematicamente (de aqui fa denominacién del método), un elemento cada c unidades, tomado el primerp de ello en forma aleatoria. Siel universo es finito, el ntimero ¢ es la parte entera del cociente entre el tamafio del uni- verso y el tamafio de la muestra. | () c= ent|— n Siel universo es infinito, el niimero ¢ se elige arbitrariamente, sobre la base def buen sa- ber y entender del Estadistico que realiza el trabajo. Este método es adecirado para ser utilizado en aquellos casos en los cuales las Unidades Experimentales que forman el Universo se presentan con una determinada periodicidad. En este caso, hay que evitar que el ntimero ¢ sea igual al periodo con que se presentan las unidades expe- rimentales en el universo, porque, si ello ocurriese se perderia representatividad en la muestra. Ejemplo 1.6 Enuna empresa que trabaja Jos 365 dias del afio, se desea estudiar, mediante la utilizacion de una muestra de tamafio 10, el comportamiento del monto diario de las ventas realizadas en el afio an- terior, utilizando como ‘fieme los partes diarios remitides por el correspondiente departamento. Estos partes estén numerados de | a 365. Calcule el niimero & correspondiente si se quiere aplicar el método de Muestreo Sistematico y determinar el numero de orden correspondiente para cada parte diario. SOLUCION N=365 ; n=10 El valor ¢ se calcula haciendo (“) (8 ceent| — /=ent|—— n 10 Mediante ia utilizacién de una tabla de digitos al azar o de.un bolillero, se toma al azar un niimero entre 1 y 36 . : Alls efectos de la solucion ¢e este problema, se supondra.que el namero desinsaculado ha sido el 21, Este es el niimero de orden del primer parte diario de la muestra. A partir de él se elige uno cada 36. Luego, los partes diarios que forman la muestra seran los identificados con los nimeros 21 57; 93 , 129; 165 ; 201 ; 237 , 273 ; 309; 345 / 1.2-CARACTERISTICAS POBLACIONALES Y MUESTRALES Los conceptos que s¢ desarrollaran en el resto de este trabajo, estaran referidos solamente a las muestras que se obti mediante el métode de Muestreo Simple al Azar. = ent (36,5) = 36 1.2.14. PARAMETRO ESTADISTICO De acuerdo con lo mor oportunamente, toda poblacién es una variable aleatoria; por tal motivo, su comportamier{to probabilistico esta explicado por una funci6n de probabilidad, sila variable es discreta, o'por uha funcién de densidad de probabilidad, si se trata de una variable continua. i ESTADISTICA — C, Caprigiion! PAGINA 19 1 Introduccion al Muest En cualquier caso, cbmo ya se ha estudiado ampliamente, existen medidas que caracteri- zan a estas funciones, como) las de tendencia central, variabilidad, etcétera. Estas medidas cum- plen un importante papel enfel andlisis inferencial y, por ese motivo, se las define especialmente, distinguiendo dos tipos de universos. 1.2.1.1, UNIVERSO FINITO Y PEQUENO Si se tiene un universe finito, y lo suficientemente pequeito, como para que el comporta- miento probabilistico de las, poblaciones no esté explicado por un modelo teérico especifico, se define | ‘Se Hama PARAMETRO ESTADISTICO a toda medida que resume informacion calculada con las variables poblacionates. : las v Sino hay posibilidad de una equivocada interpretacién, a las PARAMETROS ESTADISTI- Cos se los denominara simplemente PARAMETROS, y seran simbolizados con letras griegas. Son ejemplos de parametros: E] total de elementos que presenta un determinado atributo, la proporcién de elementos que presentan un determinado atributo, la media aritmética, la varian- za, el desvio estandar, etcétera. Enel presente trabajo se utilizar la siguiente nomenclatura, para simbolizar alos parame- tros: * Cuando se quiera representar a un parametro indefinido se utilizara la letra griega Theta, 8 © Pararepresentar ala media de la poblacién o media poblacional, se utilizara la letra griega Mu, HL, indicando en el subindice a qué poblacién corresponde. oN ou is a © Para representar a la varianza de la poblacién o varianza poblacional, se utilizar la letra griega sigma, G, con el supra indice 2 (Sigma cuadrado), indicando en el subindice a qué poblacién corresponde N De - wy? | ox = * Sea X una poblacién dicot6mica finita de tamafto N, quién puede asumir s6lo dos valores X= 1 si la unjdad experimental medida tiene un determinado atributo A. X=0 sila unidad experimental medida no tiene un determinads atributo A. Para representar el total de elementos que tienen un determinado atributo en el universo, se utilizaré fa letra # N | ReDX | ist + Para representar a la proporcién de elementos que tienen un determinado atributo en el: universo, se utilizara la letra griega Pi, x | T=— N PAGINA.20 ESTADISTICA — C. Caprigiiani 1. Introduccién al Muestrea Ejemplo 1.7 En un taller de expresion gorporai, estan interesados en estudiar determinadas caracteristicas de las personas que se inscriben, como por ejemplo Ia edad, y si slcanzan o no la mayoria de edad. Las edades de las ocho personas que se inscribieron, en aitos cumplidos, son las que se detallan a continuacién, de menor almayor: 15; 16 ; 19; 22; 23527, 36 38 Se pide: a) Identifique el Universo b) Identifique a las Ppblaciones ¢) Calcule el valor dq los Parametros SOLUCION ' a) El universo es la totalidad de personas inscriptas en el taller y su tamafio es N=8 Una de las variables en estudio es la edad de las personas, entonces se define la poblacién X: Edad de las personas cuyos valores son {15, 16: 19,22, 23; 27; 36, 38) -El valor del parametro Media Poblacional en la Poblacion edad es: 15416419422 423427436438 _ 24,5 8 px =24,5 | -El valor del parametro Varianza Poblacional en la Poblacion edad es: N 2 N > Dew-w? Ex? = =f _ Oe nH _ 157 +16? +19? +22? +237 +27? +36? +38? 8 7 — 24,5? = 65,25 | ox = 65,25 Otra de las caracteristicas que se quiere estudiar al universo es la cantidad de personas mayores de edad. -Bl valor del parametro Total de personas mayores de edad en el Universo es: = 5 -Bl valor del parmetro Proporcién de personas mayores de edad en el Universo es: 5 1.2.1.2, UNIVERSO FINITO Y GRANDE 0 UNIVERSO INFINITO Sila poblacién es finita y Ip suficientemente grande, o infinita, como para que su comportamiento probabilistico esté explicaco por una funcién de probabilidad, si la variable es discreta; o poruna funcién de densidad de probabilidad, si se trata de una variable continua, entonces se define ‘Se llama PARAMETRO ESTA DISTICO a toda pardmetro matemdii- ca de una funcién de probabilidad o de densidad de probabilidad, que brinda informacion acerca de unit POBLACION. ESTADISTICA ~ C. Caprigitoni PAGINA 21 LIntroduccién al Muestreo La expresion X~f(X/0) se lee “La poblacion X se distribuye con funcion de densidad de probabilidad f(X) y PARAMETRO 6". Los PARAMETROS no son constantes matemiaticas, son nimerosreales que pueden asumir cualquier valor que se encuentre dentro de un conjunto especitico. Este conjunto de nameros re- ales se llama ESPACIO PARAMETRICO y su simbolo es la letra griega omega 2. Ejemplo 1.8 -Sea X una poblacién cuya funcién de densidad de probabilidad f(X) es ta funcién normal, Esta funcién tiene dos pardmetros matematicos pudiéndose demostrar que también representan los PARAMET ‘RUS ESTADISTICOS: Media poblacional o Esperanza Matematica de la poblacién: [lx = E(X) Varianza de la poblaciow O% = V(X)= E(X- p? # Desvig Estandar de la poblacion Gy |W(X) -Sea Ja distribucion Binomial | pe) (F)r*e ~ my) Esta funcién tiene dos parametros matematicos nyt enno + un parameiro estadistico © Es in parémeiro estadistico. Es la proporeién poblacional PROPOSICION 1 Las operaciones algebraicus reatizadas con PARAMETROS, tambiénson Pi 'TROS A manera de ejemplo de la PROPOSICION 1 se puede enunciar lo siguiente: Sea X; una poblacién con funcidn de densidad #(X1) cuya media poblacional es 1, y Xz otra po- blacion con fiancién de “nai de probabilidad f(Xz) cuya media poblacional es plz, entonces, (Hi - Pa) esun PARAMETRO, Este se fama PARAMETRO DIFERENCIA DE MEDIAS POBLACIO- NALES. Sea ™ la cantidad de elementos con atributo que pertenecen a un universo de tamafio Na y Rela cantidad de elementos con atribute que pertenecen a un universo de tamaiio Ne, entonces, (Ti - M2) esun PARAMETRO. Este se llama PARAMETRO DIFERENCIA DE PROPORCIONES PO- BLACIONALES. Eluso del muestreo se justifica porque, como ya ha side explicado oportunamente, es fac~ tible que no sea mucho lo que se sepa acerca de las pobiaciones, Si fuese posible realizar un censo, entonces, se podrian conocer los verdaderos valores de PAGINA 22 AGTADISTICA—C. Coprigiiont L Introduccién af Muestreo los parametros correspondientes a las poblaciones que son objeto de fa investigacion, pero, si por alguna razén el censo es impracticable, estos valores seran desconocidos. En estos casos, a los parametros se los puede inferir, utilizando determinadas funciones que se generan con las variables muestrales y cuyas definiciones formales se presentan en el si- guiente punto. i 1.2.2. ESTADIGRAFO Y ESTIMADOR Oportunamente se definié a una muestra aleatoria de tamafio , como un conjunto forma- do por n variables aleatorias, todas con la misma distribucion de probabilidad. | MUESTRA: { Xq;X25-- 2 Xn} Se Hama ESTADIGRA FO a toda funeién escatar, fi( Xa ;Xe: generada con las variables muestrates “3X, Dado que los ESTADIGRAFOS son funciones generadas por variables aleatorias, también son variables aleatorias, luego, existira una funcion de densidad de probabilidad, o una fincin de probabilidad, lo que comespbda que describa su comportamiento probabilistico, como asi tam- bién es posible que tengan una Esperanza Matematica finita y una Varianza finita. Los ESTADIGRAFOS cumplen distintos roles dentro del andlisis inferencial, algunos de los cuales se estudiaran en capitulos posteriores, no obstante, a continuacion se definira un tipo espe- cial de ESTADIGRAFO que se utiliza para inferir concretamente a los parametros. Se Hama ESTIMADOR DE UN PARAMETRO 6.4 todo ES- TADIGRAFO que proporcione informacién acerca de dicho pa- rémeiro. estadigrafo que permite transformar al estimador, en una variable deerminada distribucién de probabilidad. ‘Se Hama fe DE TRANSFORMACION a aquel que tenga u Para tener una: adecudda informacion acerca de un parametro desconocido 8, perteneciente aun poblacién X, finita o iffinita, se deberia obtener una muestra aleatoria de tamafio n i {Xai Xp) Xn} y con ella generar un ESTADIGRAFO especifica Bg (Xi Xai Xn)? Si este ESTADIGRAFO puede proporcionar informacion acerca del Parémetro @, entonces, @ es un ESTIMADOR DEL PARAMETRO 0. 1.2.3. ESTIMACION ~ Dado que en [a mayotia de los trabajos en donde se aplica el andlisis estadistico, los paré- metros de las poblaciones sn desconocidos, hay que llevar a cabo el proceso de inferir 0 sacar conclusiones acerca de éstos a través de las variables muestrales Los métodos que se utijizan para ello son dos, que generalente se complementan, a saber: = ESTIMACION PUNTUAL = ESTIMACION POR INTERVALO 2 Bl simbolo ® sobre Ia letra que simboliza a un PARAMETRO signifies: ESTIMADOR de dicho PARAMETRO. ESTADISTICA — C. Caprigtioni PAGINA 23 1. Introducciin al Mues Sea una poblacién X fuya distribucién de probabilidad tiene un parametro estadistico des- conocido 6. X ~A(X/0); sea una muestra de tamaito M {X13 Xzi-- 5 Xn}; sea 6 =g(X1;Xz;-+: Xn) un estimador de dicho parémetro cuya esperanza matematica, E(6), sea finita y su varianza, V(6), también sea finite; y sean { X; ; Xz ; ~~ ; %n }los correspondientes valores que asumen cada una de las variables luego de tomar la muestra y realizar las correspondientes mediciones. Se lama ESTIMACION PUNTUAL del pardmetro 0, a un método de estimacién que consiste en calcular ef valor numérico tinico que asume el estimador, Inego de tomar la muestra y realizar las mediciones co- rrespondientes. . Este valor numérico se llama PUNTO DE ESTIMACION. Opeg(mixein im) Se lama ESTIMACION POR INTERVALO de/ pardmetro Ba un mé- fodo de estimaeion que consiste en calcular, con los datos de la muestra, os limites de un conjunto cerrado y acotado de mimeros reales. Este conjunto $e lena INTERVALO DE ESTIMACION. | Lildp) << LslOp) T ‘Nétese que los limites del INTERV ALO DE ESTIMACION dependen de la ESTIMACION PUNTUAL. Enel proximo capitulo se desarrollara ampliamente el método de estimacién por intervalo. | 1.2.4, DISTRIBUGION DE LOS ESTIMADORES Por lo ya definido, 4 toda variable aleatoria le correspondera una funcion de probabilidad, © una funcién de densidad tte probabilidad, seguir rata de una variable aleatoria continua o discreta, que explique su cqmportamiento probabilistico. £1 conocimiento de estas funciones har posible el calculo de fa esperanza matematica, o promedic esperado de la variable, y dela varian- zade la variable. | . Recordando que por definicién, todo ESTIMADOR es una variable aleatoria, se define for- malmente lo siguiente: | Sea una poblacién X puya distribucién de probabilidad tiene un parémetro estadistico des- conocido 0. X~(X/0); | * sea una muestra de tamafio n {X1; Xe: Xabi sea 6=g(X1;X2;-+; Xn) un estimador de dicho parimetro cuya esperanza matemitica, (6), sea finita y su varianza, VG), también sea tinita; - [Se Hama DISTRIBUCION DE PROBABILIDAD DEL ESTIMA- DORO, a aquella funcién de densidad de probabilidad, o funcién de probabilidad, seein carresponda, que describe su comportamiento pro- babilistico. —— _ En otras palabras, sj sc considera al muestreo probabilistica como un experimento aleato- rio, como fue puntualizado anteriormente y, si para cada muestra posible se calculase el valor numérico del ESTIMADOR, estos valores, acompafiados del correspondiente valor de probabili- dad, o densidad de probabjlidad, constituyen la DISTRIBUCION DE PROBABILIDAD DEL ESTI- PAGINA24 “Siganme, no los voy a defraudar | Carlos Menen| | L. Introduccion al Muestreo MADOR. Dada una poblacién Jinita de tamafia N, si se pudiese tomar todas las muestras posibles de tamafio ny se calculase el yator numérico del estimador para cada una de ellas, entonces las funciones que representan a las DISTRIBUCIONES DE LOS ESTIMADORES podtian ser generadas empiricamente. Esto es casi imposible en situaciones reales, por ello, a cada estimador se le asocia un de- terminado modelo teérico, algunos de ellos ya fiteron estudiados oportunamente, y otros se pre- sentardn en pardgrafos postériores. Siel estimador 6 os una variable aleatoria discreta y p(@ )es su fiuncidn de probabilidad, entonces, la Esperanza Matematica y ta Varianza del estimador son, respectivamente, £@)= 26, p@) v@)=Eb- EOF = rf,-e@ 04) Siel estimador 6 es una variable aleatoria continua y (6) ¢s su funcion de densidad de probabilidad, entonces, la E: Speranza Matematica y la Varianza del estimador son, respectivamen- te, EO)= fo fad veo)= £8 ef = fB-e«yp £06) 48 1.2.5. SESGO © Sea una poblacién X chiya distribucién de probabilidad tiene un parametro estadistico des- conocido 6. X ~{X/8); | sea una muestra de tamaito n, {X43 X25- 5 Xn}, sea 6=g(X1;X2;-~; Xn) un estimador de dicho pardmetip aye esperanza matematica, E(6), sea finita y su varianza, (6), también sea finita: Je llama SESGO ala diferencia entre, la esperanza matemdtica defes- limador y el parfimetro a estimar SESGO = E(6)-0 1.2.6. ERROR MEDIO CUADRATICO : Sea una poblacién X chya distribucién de probabilidad tiene un pardmetro estadistico des- conocido @.X~{(X/8); | sea una muestra de tamafio m {X43 X25 -- 3 Xn}: “sea O=g(X1;X2;-~ } Xn) un estimador de dicho parametro cuya esperanza matematica, E(6), sea finita y su varianza, V(6), también sea finita, ‘Se Hama ERROR MEDIO CUADRATICO, a (a esperanza matemdti- ca del cuadrado de la diferencia entre et estimador 6 y el pardmetro 0 Ewe (8) = €(6-0)" 3 Segam el Diccionario Eaciclopéyicu lustrado Sopena, SESGO: Torcido, cortado oblicuamente ESTADISTICA — C. Caprigtion! PAGINA 25 1.Introduccion al Muestvo ELERROR MEDIO CUADRATICO mide la variabilidad del estimador con respecto al para- metro que esta estimando/ | 1.3. PROPIEDADES DE LOS BUENOS ESTIMADORES De todos los estimadares que se pueden construir para inferir aun determinado parametro, los mejores, son aquellos que cumplen con ciertas condiciones.generales 0 propiedades, con las cuales es posible garantizar la buena informacion que puedan proporcionar, acerca del parémetro a estimar. : Intuitivamente, se puede pensar que un “duen” estimador, deberia tener su funcion de den- sidad de probabilidad (o funcidn de probabilidad, segiin corresponda), concentrada lo mejor posi- ble alrededor del pardmetro que se pretende estimar. Ademas. deberia brindar toda la informacion que contiene la muestra, y a medida que aumente ef tamafio de la muestra, disminuya la diferen- cia entre la estimacién y el parimetro. Las propiedades mas importantes que debe tener un estimador 6 , para ser considerado un "buen" estimador del parajnctro @ son las siguientes: ¥ INSESGAMIENTO ¥ EFICIENCIA v CONSISTENCIA Y SUFICIENCIA. Estas propiedades fern definidas y explicadas brevemente en los proximos paragrafos. 1.3.1. ESTIMADOR INSESGADO Sea una poblacion X cuya distribucion de probabilidad tiene un parametro estadistico des- conocido 8. X ~f(X/8); sea una muestra de tamafio n 4X4; X23-- 3 Xn} sea 6 =g(X1; X2;~+ Xn) unestimador de dicho parametro, cuya esperanza matemitica, E(6), sea finita y su varianza, V(6 ), también sea finita; Elestimador @ es un ESTIMADOR INSESGADO del pardmetro® si, y s6lo sé la esperanza matemdtica del estimador 6 es igual al pardme- iro. | | Ed) =6 En otras palabras, él estimador es INSESGADO si su sesgo es igual a cero. | SESGO = E(4)~0 =0 Esto significa que, si se toman todas la muestras posibles de tamafio n, de una poblacion de tamafio N, se calcula el yalor numérico deun determinado estimador én cada una de las mues- tras, y se calcula el promedio aritmético entre todos ellos, si dicho promedio resultase igual al valor del parametro, entonces et estimador es INSESGADO, en caso contrario el estimador es SES- GADO. En algunas ocasiones, esta propiedad puede no cumplirse directamente. Sin embargo, si podria cumplirse si se hici¢se crecer indefinidamente al tamaiia de la muestra. En este caso, para establecer la PROPIEDAD DE INSESGAMIENTO, se utiliza un concepto limite. Hay que pasar al limite la esperanza matemética del estimador. PAGINA 26 ESTADISTICA — C. Caprigtion | 1. Introduccién al Muestreo Elestimadior & es un estimador ASINTOTICAMENTE INSESGADO , y sélo si el limite de la esperanza matemdtica del es- fimador 6 ,cugndo el tamaiiade la muestra 1 tiende a infinito, es igual al pardmeiro 8. | Lim E(8)=0 A>o Siel estimador 6, del parametro Q, es INSESGADO, o ASINTOTICAMENTE INSESGADO, el ERROR MEDIO CUADRATICO es igual ala varianza del estimador, directamente 0 en el limite, cuando n tiende a infinito. Recordando que el|ERROR MEDIO CUADRATICO es. E.M.C. (6) = E(6-0)° y que la VARIANZA DEL ESTIMADOR es v6) =Ef-E6)] si ' E(8)=0 entonces | jE(@-0)*= [6 - |= v@ 0, si | | Lim E(6)=8 entonces | we LimE (6-0)? = E| é - time @) |?- v@ cin Ea 1.3.2. CONSISTENCIA Esrazonable desear que un estimador del parametro 0 proporcione mas informacion acer ca de éste, cuanto mayor sea e} tamafio de la muestra. . Si se tomase una muestra de tamafio tin grande como el tamafio de la poblacién, cabria es- perar, en un buen estimador, que la estimacién puntual resultase igual al parametro. Sea una poblacién X, cuya distribucién de probabilidad tiene un pardmetro estadistico des- conocido 8.X~{(X/8); | . sea una muestra de tamaiio m {Xa ; X25-- i Xn}; sea 0=g(X4;X2;~+! ; Xn) unestimador INSESGADO de dicho pardmetro cuya esperanza matematica, E (6), sea finita y su varianza, V(6), también sea finita; Elestimador 6 es un ESTIMADOR CONSISTENTE del parémeiro ® sty sdlo, si se cumple que ef estimador 6 converge en probabilidad al Parémetro®, cuando ef tamaiio de la muestra 11 iende a infinito, Lin P([b-0]<5)=1 para toro 8 pasitiva, nts En otras palabras, un ESTIMADOR es CONSISTENTE si, a medida que el tamafio de la muestra crece indefinidamente (tiende a infinito), la probabilidad de que la diferencia entre el ESTADISTICA ~ C. Capriglioni PAGINA 27 Lintroducciin af Muestreo estimador y el valor del parametro pueda hacerse tan pequefia como se quiera, tiende alvunidad, TEOREMA SOBRE LA VERIFICACION DE LA CONSISTENCIA (? Sea una poblacién X cuya distribucion de probabilidad tiene un pardmetro estadistico des- conocido 0. X ~f(X/6); sea una muestra de tamafio n {X13 X25 ---3 Xn}; sea 6=g(X1 X25 ++; Xn) un estimador INSESGADO de dicho parémetro cuya esperanza matemética, E (6), sea finita y su varianza, V(6), también sea finita; si la varianza del estimador 6 tiende a cero cuando el tamatio de la muestra tiende a infinito, en caso de poblaciones infinitas: o tiende al amaiio de la poblacion en caso de poblaciones finitas, entonces el estimador 8 es un ESTIMADOR CONSISTENTE del pardmeiro 8. Simbolicamente se puede expresar Si ‘ &(6)=0 y Lim V(8)=0 encase de POBLACION INFINITA nse E(6)=0 y Lim V(8}=0 en caso de POBLACION FINITA non entonces 6 es un ESTIMADOR CONSISTENTE de 0. 1.3.3. EFICIENCIA Otra de las condi con las que deberia cumplir un estimador, para que pueda ser con- siderado un BUEN ESTIMADOR, es que.su VARIABILIDAD con respecto al parémetro, que como. ya fue explicado, se mide cpn el error medio cuadrético, deberia ser MINIMA. Siel estimador es insesgado, esta variabilidad esta expresada en Ja varianza del estimador. Por este motivo, seria impartante que un estimador, ademés del insesgamiento, tenga la menor varianza que pueda tener cualquier estimador insesgado de! mismo parametro. La importancia de ello radica en el hecho de que ésta es, quiza, la medida mas importante para decidir acerca de su bondad para proporcionar informacion sobre el parametro. . Sea una poblacién X quya distribucién de probabilidad tiene un parametro estadistico des- conocido 0. X ~(X/8); sea una muestra de tamajio m {X13 Xz 5-5 Xnh sea 6=g(X1; Xz; |; Xn) un estimador INSESGADO de dicho parémetro cuya esperanza matematica, E(6), sea fit y su varianza, V'(6),, también sea finita; te Elestimador'@ es un ESTIMADOR EFICIENTE del pardmetro 8 sé, y sdlo silse cumple que el estimador 6 tiene la menor varian- Za que puede tener us estimador del parémetro 0. La busqueda de un gstimador que posea esta cualidad se facilita con la aplicacién de un teorema denominado TEOREMA DE CRAMER-RAO en él que se demuestra que la VARIANZA DEL ESTIMADOR @ necesariamente debe satisfacer la siguiente desigualdad: 4 La demostracién de este teorema esi fuera del aleunce de este trabajo PAGINA 28 ESTADISTICA -C. Caprigliont | v@2—_1__, ne [ens a Esta desigualdad recibe el nombre de COTA DE CRAMER-RAO, ¢ indica cual es la menor varianza que puede tener un estimador. TEOREMA SOBRE LA VARIANZA DE LOS ESTIMADORES (®) Sea una poblacién X cuya distribucién de probabilidad tiene un parametro estadistico des- conocido 9. X ~AX/0); sea una muestra de tmafio m {X+ 3X25 ~*5 Xn}; sea 0=g( X15 Xe5-+|; Xn) un estimador INSESGADO de dicho parémetro cuya esperanza matemitica, E(6), sea finita y su varianza, V(6), también sea finita; un estimador es EFICIENTE, si el valor numérico de su varianza coincide con la cota inferior de Ja desigualdad de CRAMER-RAO. Simbélicamente se puede ¢xpresar St | v(6) = 1 | AE af) I “ 20 entonces el gstimador6 es un ESTIMADOR EFICIENTE, | EFICIENGIA RELATIVA En caso de que hayé més de un estimador para un mismo parimetro, en la realizacién de determinados tipos de trabajos, es posible que al Estadistico no le interese demasiado la EFI- CIENCIA de uno de ellos en especial, sino que desee utilizar aquel que tenga la menor Varianza. Por ello se incorpora el concepto de EFICIENCIA RELATIVA. Dado dos estimadores de un mismo pardmetro ®. Oy = fr (X45 Xess Xn) 5 Bg= ge (X15 Xe Xn) el estimador 4, hiene una EFICIENCIA RELATIV A mayor que el esti- madorby si, y sdlo st la varianza del estimador 6, es menor que la va- rianza del estimador 6 Silos estimadores son sesgados, entonces la EFICIENCIA RELATIVA entre los estimadores se establece comparando el ERROR MEDIO CUADRATICO de cada uno de ellos. 1.3.4. SUFICIENCIA Cuando es necesarib-construir un estimador para un determinado pardmetro @, en algunos casos se lo hard utilizando todas y cada una de las n variables muestrales, y en otros el estimador estard basado solamente et algunas dc las variables de la muestra. Intuitivamente, se puede apreciar que ta cantidad de informacién acerca del parimetro 0, que brinda aquel estimador que utiliza a todos los datos de la muestra, serd superior a la cantidad de informacién proporcionada por aquellos estimadores que utilizan sélo a algunos de ellos. t 5 La demostracién de woe woba esti fuera del alcance de este trabajo. ' | PAGINA 29 | 1 Introducetn al Muestre Sea una poblacion x cuya distribucién de probabilidad tiene un parametro estadistico des- conocido 8. X ~(X/8); | sea una muestra de tamafio m {Xs ; X25 --3Xn}s sea 6=g( X41; X2;- ; Xn) un estimador INSESGADO de dicho parmetro cuya esperanza matematica, E (6), sea finita y su varianza, V(6), también sea finita; Elestimador § es un ESTIMADOR SUFICIENTE del pardmetro 0, si, y sélo si se cumple que ef estimador 6 utitiza toda la informacion re- levante acerca det pardmetro 0, contenida en la muestra aleatoria. Se enuncia, sin demostrar la siguiente PROPOSICION PROPOSICION 2 | Si un ESTIMADOR INSESGADO de/ pardmetro®, es ui ESTIMADOR SU- FICIENTE, entonces su varianza serd menor que ta varianza de aquel ESTIMADOR INSESGADO pero que no sea un ESTIMADOR SUFICIENTE de dicho pardmetro. Los criterios para determinar si un estimador es suficiente estén fuera del alcance de este trabajo. 1.4, GRADOS DE LIBERTAD El concepto que se’introduce ahora, esta presente en la definicion de algunos estimadores de parametros especificos'y es utilizado asiduamente en toda la tarea inferencial, cuando es me- nester la.utilizacion de “eee distribuciones de probabilidad asociadas al proceso de mues- treo. Se Hama GRADOS DE LIBERTAD a /a cantidatd de variables libres, o estadisticamente independientes, que intervienen en un problema o en tna distribucitin asoctada a iat problema, Ejemplo 1.9 Dada una Tabla de Contingencia de 2 Filas x 2 Columnas donde ya estan fijados los correspon- dientes Totales Marginalep (Total de las Filas y Total de las Columnas) = | Totales de aA iA Filas 8 40 LB Zz (no Totales de 80 70 Columnas | Si se considera a cada intersecci6n de Filas y Columnas como una variable, entonces esta tabla. tiene cuatro variables, a saber: X= (AB); X2= (AB): X3= (AB), Xa= (AB) Si se elige una variable cualquiera, libremente, y se le asigna un valor numérico, entonces el va- lor numérico de las otras tres variables queda determinado. Por ejemplo, si ala variable X1 se Je asigna el valor 10, entonces el valor numérico de las otras tres ser, necesariamente: X2= 70. Xs =30: X= 40 PAGINA 30 “Al perro que tiene dinero se le llama sefior perro.” Proverbio Srabe 1. Introduccién af Muestreo rm | Totales de _ A { _|. Filas |B X= 10 40 + B X3=70 no Totales de i Columnas| _*° 7 | . 7 Esto quiere decir que, de las cuatro variables, sdlo una es independiente. Entonces, la Tabla de Contingencia 2 x 2 tiene 1 grado de libertad (1 gl.) Ejemplo 1.10 | Sea una poblacién X con Media Poblacional j1 y Varianza Poblacional 6”, sea { Xa: X25..5 Xn) una muestra aleatoria independiente de tamaiio n proveniente de dicha poblacién y sean | (G-X).0@-X) (GX) 1 variables aleatorias que indican las desviaciones entre cada valor de la muestra y la media arit- meética muestral, Dado que la suma de las desviaciones con respecto a la media aritmética debe ser nula | j DG-xX)= 0 solamente se podran asignar libremente valores a (n ~ 1) variables. En efecto, suponiendo una muestra de tamafio 5, se tendran 5 desviaciones: La primera desviacién puede ser cualquier namero real, por ejemplo: (X4—X) = (39) La segunda desviacion pueite ser cualquier ntimero real, por ejemplo: (X2~X La tercera desviacion puede ser cualquier numero real, por ejemplo: (Xs—X) = La cuarta desviacion puede ser cualquier numero real, por ejemplo: (%G-X La quinta desviacion no pyede ser cualquier numero real. Solamente podra ser el numero que haga cero la suma de las désviaciones. Bn este caso el unico numeroes: (Xs—X)=(16) YK -X) =E9) + 15) + (30) + (10) + (16) = 0 Esto quiere decir que hay 4 yrados Ye libertad ((n-1) gab] Consecuentemente, la Sump del Cuadrado de los desvios, S.C.x, también tiene 4 grados de liber- tad [(n-1) gl.) | DYiO% -X)? = 697? + 615)? +630) + Cio? + oy Como se hadicho, e! iltimg valor no puede ser cualquiera porque se debe cumplir que la summa de las desviaciones debe ser cero Teniendo en cuenta ta propiedad referida a la suma de las desviaciones con respecto ala media aritmética | | YX -XH= 0 | y lo mostrado en el Ejemplp 1.10, se pueden enunciar, sin demostrar, las siguientes PROPOSI- CLONES: 6 Ver Estadistics Tomol ©. APRIGLION), Primer Kulicitn, Capitulo 3. ESTADISTICA — C. Caprigli | PAGINA 31 @ LJntroduccién al Muestreo PROPOSICION 3 La cantidad dé GRADOS DE LIBERTAD que tiene la.suma del cuadrado de las desviaciones con respecto ala media aritmética muestral es igual al tamaiio de la muestra menos.uno {(n-1) g.L.}°. | YoG-x)? > (n-Negut. isl PROPOSICION 4 Si en un estadigrafo intervieneu K estimadores de otras tantos parame- tros, los GRADOS DE LIBERTAD correspondientes a la suma del cuadra- do de las desviaciones con respecto a dicho estadigrafo, es igual al ta- inatto de la muestra menos la cantidad de cantidad de pardmetros a es- fimar |(n —k) gh] En la generaci6n de los distintos estadigratos, es frecuente que, por alguna circunstancia, no todas las variables muestrales que intervienen en él, sean estadisticamente independientes. Los GRADOS DE LIBERTAD, entonces, seran inferiores al tamaiio de la muestra Oportunamente se pstudiara como se determinan los GRABOS DE LIBERTAD correspon- diente a las distintas funcipnes que se utilizan para Ja estimacién de algynos parametros 1.5. ALGUNOS ESTIMADORES IMPORTANTES 1.5.4. MEDIA ARITMETICA MUESTRAL Sea una poblacin X con Esperanza Matematica, o Media Poblacional Finita, py Varianza Poblacional Finita 7 y sea | {X4.Xa. Xa} una muestra aleatoria de tamafio n proveniente de dicha poblacién. Se Hama MEDIA ARITMETICA MUESTRAL (0, simplemonie ME- DIA MUESTRAL) a wi estimador de la MEDIA POBLACIONAL, que se genera haciendo el éociente entre ta suma de las variables muestrales y el tamafio de Ia muestra \ 1.5.2. VARIANZA MUESTRAL Sea una poblacién X con Esperanza Matematica, o Media Poblacional Finita, py Varian- za Poblacional Finita O° y sea . (X1, Xa yn Mn] una muestra aleatoria de tamafio 1 proveniente de dicha poblacion, i ESTADISTICA~C. Capriglioni ___7 Bata demustracin exh fut dat ateance de este trabajo PAGINA 32 L. Introduccién al Muestreo Se Hama V. NZA MUESTRAL a wn estimador de la VARIANZA POBLACIONAL que se yenera haciendo ef cocienie entre la Suma del Cuadrado de las desviaciones con respecio a la media aritmética mues- tral y los corre udientes grados de libertad. 1.5.3. PROPORCION MUESTRAL Cuando el objetivo Hel trabajo inferencial es tener informacién sobre [a presencia o no de un determinado atributo enjun universo, entonces la poblacién X es dicotémica. Esto significa que los valores de la variable slo pueden asumir Jos valores 0 0 t Si el elemento observado no tiene el atributo, entonces X = 0 Si el elemento observado si tiene el atributo, entonces X= 1 Sea una muestra aleatoria de tamafio n EXas Xa Xnd yuna variable aleatoria, F , que representa la cantidad de elementos que si poscen un determina- do atributo, dentro de la muestra de tamaiio n. n F=y)x | tr Se ama PROPORCION DE ELEMENTOS QUE TIENEN UN DE- TERMINADO ATRIBUTO EN LA MUESTRA 9, simplemente, PROPORCION MUESTRAL, a un estimacdor de la PROPORCION POBLACIONAL,. que se gencra mediante ef covieme entre la cantidad de elementos que : ‘poseen un determinado atributo en la muestra y el ta- matio de la muestra. Ejempio 1.11 Dado el universo del Ejemplo 1.7, referido a fas ocho personas que concurren a un taller de ex- presion corporal, cuyas edddes se transcriben a continuacion, | {15165 19, 22 23,27, 36: 38} se pide: a) Determine todas las muestras posibles de tamaiio 5. b) Calcute la media muestral y Ja varianza muestral de cada una de las muestras. ¢) Calcule la proporcion de personas mayores de edad de cada una de las muestras. ) Calcule la Esperanza Matematica y la Varianza de cada uno de los estimadores. SOLUCION El universo es finito y de tmafio ocha (N= 8) {15 ; 16; 19: 22523 27:36:38} a) La cantidad de muestras posibles de tamaiic cinco (n = 5) que se pueden obtener de dicho uni- verso es } | NY (8) _ i (h)=(3)-s6 A continuacién se presentan tas 56 muestras pysibles de tamafio 5 que pueden tomarse de un uni~ verso de tamajio 8 ESTADISTICA ~C. Caprigtioni PAGINA 33 Muestra 29: {15: 19523 : 36:38 Muestra 30: {15 , 19,27, 36; 38) Mucvira 3h: (5 12223273 36) Muestca, Muestra 33: (15:22; 23, 36; 38} Muesira 34: {15.225 27, 36; 38} Muestea 35: {15 523527; Muestra {NGS Wy 22 Muesira 3 Mucsirs Mostra 39° {165 19122 Muestra 40: {16.1922 ,. Muesira 41: £16.19 ,22 Muestra Mucsira Muesira Muicstra Mocstrn Muvestra Mostra Muestra Moston Musica Muestioa Muesira 33: 319 12223536; 38} Muesira 54: {19222277 36; 38} Muestra 25:27536:38) Mucstra £23427; 36,38} para cada una de las muestras, se presentan en el cuadro de la‘pagina 35. El valor de la varianza muestral si= Led para cada una de las muestras, se presentan en el cuadro de la pagina 35. ©) El valor de la proporcién muestral de personas mayores de edad, _ ¥ B= 5 oo para cada una de las muestras, se presentan en el cuadro de la pagina 35. €) Los valores de la esperanza matemitica (promedio) y la varianza de cada uno de lo estimado- res, calculados con los datos de las 56 muestras presentadas en la pigina 35, son: Sx, 566 ~ 24, Fe =245 > VX)= PAGINA 34 ESTADISTICA — C. Capriglioni 1. Introduccién af Muestreo MEDIA MUESTRAL, PROPORCION MUESTRAL Y VARIANZA MUESTRAL CORRESPONDIENTE ACADA UNA DE LAS 56 MUESTRAS QUE SE OBTUVIERON EN EL EJEMPLO 1.14 3 es ESTADISTICA = C. Capriglioni 4] 00.4 si | si35| a raf 9h. | soc] "A caballo regalado no le mires el diente." Refraén anénimo 1.5.4. ESPERANZA|Y VARIANZA DE LOS ESTIMADORES 1.5.4.1. MEDIA MUESTRAL Aplicando las propiedades de la esperanza matemética y la varianza de la suma de variables aleatorias indepehdientes, se puede demostrar que: > Laesperanza matematica de la MEDIA MUESTRAL siempre es la MEDIA POBLACIONAL | E(X}=nx Por lo tanto, la MEDIA MUESTRAL es un estimador INSESGADO de la MEDIA POBLACIONAL > La varianza de la sa MUESTRAL de wniversos infinitos es VR) = oh Por lo tanto, si lL universo es infinito, la MEDIA MURSTRAL es un estimador CONSISTENTE de la MEDIA POBLACIONAL » La varianza de la MEDIA MUESTRAL dt universos finitos es 2 exit) n \N-I Por lo tanto, si ef universo es finito, la MEDIA MUESTRAL es un estimador CONSISTENTE de la MEDIA POBLACIONAL Estas demostracionés estén fuera del alcance de este trabajo. No obstante, se puede verificar empiricamente con los datos de los Ejemptos 1.7 y 1.11 que: VX Hx = 24,5 y E(X) = 24,5 entonces E(X) =x" =| < - a= 65,25 V(X) = 5,59 y VX) = O28 (4) 5,59 5. 8-t 2 Ox /(N-n ent VX) = sx(en) jonces V(X) ANI 1.5.4.2. PROPORCION MUESTRAL . Aplicando las propiedades de la esperanza matematica y la varianza de la suma de variables aleatorias indeperdientes, se puede demostrar que > La esperanza matemdticy de la PROPORCION MUESTRAL siempre es Ja PROPORCION POBLACIONAL Ep) = Por lo tanto la PROPORCION MUESTRAL es un estimador INSESGADO de la PROPORCION POBLACIONAL > Ja varianza de la PROPORCION MUESTRAL de universos ifinitos bs v@e me im) Por Io tanto, si el universo es infinito, la PROFORCION MUESTRAL es un estimador CONSISTENTE de la PROPORCION POBLACIONAL > Lavarianza de la PROPORCION MUESTRAL de universos finitos es | V@)= mas *) N-} PAGINA 36 ESTADISTICA ~ C. Capciglioni 1 Introduccién al Muestreo Por lo tanto, si el universo es finito, la PROPORCION MUESTRAL es un estimador CONSISTENTE de la PROPORCION POBLACIONAL Estas demostraciones estan fuera del alcance de este trabajo, no obstante, se puede verificar empiricamente con los datos de los Ejemplos 1.7 y 1.11 que: ™=0,625 y E(p) = 0,625 entonces E(p) = 2 V(P) = 0,0201 y V(p) = 625° e oe) (2) = 0,0201 8— entonees V(B) n-n)(¥-0) n N-I 1.5.4.2, VARIANZA MUESTRAL Se puede demostrar que: > La esperanza matemdtica de la VARIANZA MUESTRAL, ev! universos infinitos, siempre es Ja VARIANZA POBLACIONAL E(s3) = 05 Por lo tanto la vaRIANZA MUESTRAL es un estimador INSESGADO de la VARIANZA I POBLACIONAL > La varianza de la VARJANZA MUESTRAL ce wiiversos infinitos es Las demostraciones|analiticas estan fuera del alcance de este trabajo. La comprobacion empirica no se puede realizar dado que el universo utilizado en los Ejemplos 1.7 y 1.11 es finito. i 1.6. DISTRIBUCION DE ALGUNOS ESTIMADORES 4.6.1. DISTRIBUCION DE LA MEDIA MUESTRAL DE POBLACIONES NORMALES En este punto se establecerd, utilizando definiciones y propiedades estudiados en secciones anteriores, la disttibucién de la media aritmética muestral correspondiente a muestras tomadas de poblaciones con distribucién normal cuando 'a varianza poblacional es conocida, Sea una poblacién X cuya distribucién es normal con Esperanza Matematica, o Media Poblacional, Wx. y varianza jpoblacional oX y sea {X, 2X7 22. FX} una muestra aleatoria de tamaiio n proveniente de dicha poblacién EI estimador MEDIA ARITMETICA MUESTRAL, por eslar originado en una suma de variables normales, es una combinacion lineal de variables aleatorias normates, por lo tanto, también tiene distribucion normal. 8 Ver Estadistica — Tomo IC. Capriglioni - Primera edicién. Capitulo 5 ESTADISTICA ~ C.’ Caprigtion| PAGINA 37 Lintroduccibn al Muestreo . Como ya se ha estudiado- en el punto anterior, la ESPERANZA MATEMATICA de la media aritmética muestral E(X)=— y la VARIANZA de la media aritmética muestral, si la poblacién cs FLNITA, es: 2 x, _o fN-n veo =F (4-1) y la VARIANZA de [a medi aritmética muestral, si la poblacion cs INFINITA, es: 2 =)_ 9 V(X) =— O=— por lo tanto, la VARIABLE] ESTANDARIZADA, 0 ESTADIGRAFO DE TRANSFORMACION de la media aritmética muestral, para POBLACIONES FINITAS ¢s: X-p ofl vin VN=T Ze- y para POBLACIONES INFINITAS es: vn fprafo. para algunas demostraciones que se harén en secciones posteriores, también puede|se eserita como: | n(x - Hl z= nk) s Esto significa que, para el célculo de probabilidad, y para toda la tarea inferencial donde se utilice la media aritmética muestral, de muestras obtenidas de poblaciones normales cuya varianza sea conocida, hay que utilizar Ja distribucién normal. 1.6.2. DISTRIBUCION DE LA VARIANZA MUESTRAL . En este punto se establecerd, ‘utilizando definiciones y propiedades estudiados on secciones anteriores, la distribucion de Ja varianza muestral correspondiente. a muestras tomadas de poblaciones con distribucion normal ”. Sea una poblacién X cufa Wistribucién ¢s normal con esperanza matemética o media poblacional jt y varianza pqblacional 6”, sea | { X15 Xo5 0. | Xnb una muestra aleatoria de tamaiio N praveniente de dicha poblacion , sea. n ‘ SCx = S04 - XP >} la suma del cuadrado de Jas}desyiaciones con respecto a la media aritmética muestral, y sea, i a | ye -x)? g2-i4 x a-i 9 Las demnostraciones estén fuera del alcance de este trabajo PAGINA 38 ESTADISTICA — ©, Caprigtion! 4. Introduccién al Muestreo la varianza muestral de dicha muestra, El estadigrafo | n XG -w* ist 7 s tiene distribucién ji-cuadrado con ng.l. (grados de libertad) por ser la suma del cuadrado de N variables normales independientes, y el estadigrafo | n-(X~p)* of tiene distribucién ji-cuadrado con | gL. por ser el cuadrado de una variable con distribucién normal, luego, su diferencit n } xP eww tel . . i na | es un estadigrafo que tiene istribucién ji-cuadrado con (n - 1) gl. n | YG - XP | 1s Gover Si en el numerador ide este estadigrafo se multiplica y divide por los grados de libertad se tiene el ESTADIGRAFO DE TRANSFORMACION de la varianza muestral @-)-S | 2 Kener Esto significa que, para el calculo de probabilidad, y para toda Ja tarea inferencial referida a la varianza muestral, de muestras obtenidas de poblaciones normales, hay que utilizar la distribucién ji-cuadrado. . 1.6.3. DISTRIBUCION DE LA MEDIA ARITMETICA MUESTRAL CUANDO LA VARIANZA POBLACIONAL ES DESCONOCIDA En la mayoria de los trabajos donde hay que aplicar ia inferencia estadistica, el valor de la varianza poblacional o* ¢s desconocido, por lo tanto, cuando esto ocurre, se hace necesario obtener una distribucién de probabilidad para la media aritmética muestral que contemple esta situacién. EI cociente entre ula variable normal estandarizada y la raiz cuadrada de una variable Ji-cuadrado divida por sus correspondientes grados de libertad, es una variable aleatoria cuya distribucién de probabilidad se lama “t” de Student y tiene como pardmetro matematico los grados de libertad de la F-epndrado empleada. ‘i’. Sea una poblacién x cuya distribucién es normal con esperanza matematica o media poblacional p y varianza poplacional O°” sea {XE Xai wes Xn} una muestra aleatoria de tamnafio n proveniente de dicha poblacién, sea PAGINA 39 10 Las demostraciones estén fuerp del alcance de este trabajo ESTADISTICA — C, Caprigil LIntroducetén al Muestreo la varianza muestral de dicha muestra. Si se hace el caciente entre! vn se obtiene el siguiente ESTADIGRAFO DE TRANSFORMACION para la media muestral de poblaciones infinitas cuando no se conoce la varianza poblacional y en su lugar hay que utilizar una estimacién de ella X-p "s vn Este estadigrafo tiene distribucion t de Student con (n-1) grados de libertad por ser el cociente entre una variable con distribucién normal y la raiz cuadrada de una variable con distribuci6n ji-cuadrado dividida por sus correspondientes grados de libertad. Bajo ciertas condiciones, si la poblacién es finita, cl estadigrafo el ESTADIGRAFO DE TRANSFORMACION para la media muestral es r- XH S IN-n . vn VN-1 y también tiene distribucién t de Student con (1-1) grados de libertad t= = Wie ~ bats - in ¥N- Esto significa que, para el célculo de probabilidad, y para toda la tarea inferencial referida a la media muestral, de muestras obtenidas de poblaciones normales, cuya varianza sea desconocida, hay que utilizar la distribucion t de Student. 1.6.4. DISTRIBUCION DE LA PROPORCION MUESTRAL Sea una muestra aleatoria de tamajio n, Lomada de un universe infinito {Xai X23 ny ‘ "E1 dia que 1a mierda tenga algin valor, los PAGINA 40 pobres nacer4n sin culo.” Gabriel Garcia Marquea| 1. Introduccién af Muestreo y una variable aleatoria, ¥), que representa la cantidad de elementos que si poseen un determi- nado atributo, dentro de la'muestra de tamafo N, y sea, _F P n la proporcion de elementos con un determinado atributo en In muestra de tamafio n, entonces, si el tamafio de la jmvuestra cs suficientemente grande, el ESTADIGRAFO DE ‘TRANSFORMACION para ih proporcién muestral de universos infinitos es y tiene distribucion asintéticamente normal estandarizada, dado que la variable ¥ tiene distri- bucion binomial con esperanza matemitica E(¥ )=n- 7 y varianea V(F) =n +m - (1-70) Si el universo eg finito, bajo determinadas condiciones, el ESTADIGRAFO DE TRANSFORMACION para lz proporcion muestral de universos finitos es % por In -(1— 0) {N— ny) q n (N ") y también tiene distribucion asintoticamente normal estandarizada | 1.7. APLICACION DE LA FRACCION DE MUESTREO Se recuerda que la FRACCION DE MUESTREO es el cociente entre el tamafio de la muestra y el tamafio de la poblacién n Fm N y mide la proporci6n del tamaiio de la muestra con respecto al tamafio de la poblaci6n. A los fines practicos, si el tamafio de la muestra es, a lo sumo el diez por ciento del tamaiio de la poblacién, o| sea, si la FRACCION DE MUESTREO es menor 0, igual a 0,10, la -1 ’ la varianza de la media muestral y en le varianza de la proporcién muestral, se puede considerar que tiende a 1 ae . seni N-n we poblacion puede considerarse infinitn y, consecuentemente, e! factor ( Ni que se uiliza en SiFm <0,10 N50 =(N) >1 N-1) 1.8: PROBLEMAS RESUELTOS 1.8.1. DISTRIBUCION DE LA MEDIA MUESTRAL 1.8.1.1. POBLACIONES NORMALES INFINITAS. {Cual es la probabilidad de que la media de una muestra de tamafio 25 esté entre 397 y 401, si proviene de una poblacién normal con media 400 y varianza 100 ? SOLUCION | Si la poblacion es normal Ja media de la muestra tiene distribucion normal con 1 Ver Estadistica — Tomo 1 C. Capriglioni — Primera edicion — Capitulo 5 ESTADISTICA — C. Capriglioni PAGINA 41 ee por ser combinacion lineal de variables aleatorias normales. 2 x no(e | >Z= X=# -No(os1) | vo El célculo de probabilidad, entonces, se realiza utilizando la distribucién normal u = 400 a= 100 > o= 1b n=25 | P(397< X <401} =4...? | 397-400 5 ap WIW400_1 gg 10 0 2 NB 35 Pro(397 5X = 401/p.= 400; -2) = Pwo (-1,5 $Z50,5/0;1) = = F(0.5)— F(-1.5) = 0,69146 - 0,06681 = 0,62465 pay aS = La probabilidad de que la media de la muestra esté entre 397 y 401 es 0,62465. 4.8.1.2. POBLACIONES NORMALES FINITAS De una poblacién normal de 150 elementos, cuya media es 3847 y desvio tipico 247, se sacé una muestra de tamatio 25. {Cual es la probabilidad de que fa media muestral sea superior a 3950? SOLUCION E] tamaito de la poblacién es conocido, por lo-tanto se trata de una poblacién finita, (N=150 ; =3847 ; o= 247 . n=25 P(X>3950) = La variable estandarizada PAGINA 42 ESTADISTICA ~ C. Capriglioni a ites Yas V 150-1 WN Pyo (X>3950/ p= 3847; —- MTs 45,2469) = P(Z > 2,28/0;1)= | = 1 -F(2,28) = 0,0113 Er 380 La probabilidad de que la media de la muestra sea superior a 3950 es 0,0113. 1.8.1.3. POBLACIONES NO NORMALES, MUESTRAS GRANDES éCual es la probabilidad dg que la media de una muestra de tamafio 100 sea superior a 1238, si proviene de una poblacién con media 1194 y desvio tipico 305? i SOLUCION ] Como no se conoce Ia distribucién de la poblacidn, pero el tamaiio de la muestra es suficiente- mente grande (n>30), por el Teorema Central del Limite (T.C.L.), el estadigrafo X-p 6 n tiene distribucién asintéticamente normal estandarizada, cualquiera fuese la distribucién de la poblacién. Luego, el célculo de probabilidad se realiza con la distribucién normal. - H=1194 5; o=305 ; n=100 P(X > 1238) =z...2! z= Xoh ee = 1,44 Pwo( X>1238/ = 1194; © =30,5) = Pyo(Z> 1,44/05 1) = i n =1 - F(1,44) = 0,07493 Tea 38 1. Introduccién af Muestreo \ La probabilidad de que la media de la muestra supere 1238 es de 0,07493. | 1.8.2, DISTRIBUCIGN DE LA PROPORCION MUESTRAL 1 UNIVERSOS INFINITOS Se sacé una muesira de tamaiia 2500 de una poblacion que tiene un 55% de elementos con un determinado atributo. ;Cual es la probabilidad de que la proporcion de ta muestra sea inferior a 0,537 SOLUCION ¥: cantidad de elementos con un determinado atributo en una muestra de tamaiio n, proveniente de una poblacion con proporcion x Si la muestra es independiente ¥ es una variable discreta con distribucion binomial. =_f «| . p= ae Proporcién de elementos con atributo en la muestra. Si el tamafio de la muestra es lo suficientemente grande, entonces En este problema se tiene } n=2500 ; ©=055 5 (1-m)=0,45 P(p < 0,53) =4...2 I by 7y Pwo (p< 0,53 / n= 0,55 La probabilidad de que la proporcidn de in muestra sea inferior a 0,53 es de 0,02222 1.8.2.2, UNIVERSOS FINITOS En una poblacién de 8340 elementos hay 2919 que tienen cierto atributo, Se saca una muestra de 950 elementos| ;,Cudl es la probabilidad de que la proporcién de elementos con atributo de la muestra sea ipferior a.0,33 9 SOLUCION El tamafio de la poblaci6n ¢s conocido, por fo tanto se trata de una poblacion finita n=950 N=8340 > | R~2919 PAGINA 44 ESTADISTICA — C. Capriglioni LIntroduccién al Muestreo PCP <0,33) =4...7 | | La variable estandarizada és | L ze 033-035, a7 (0,35-0,65 8340 95 950 8340-1 f Pwo ($< 0,33/ m= 0.35: i O33 2.38 ae F”—~C La probabilidad de que la proporcién de la muestra sea inferior al 33% es de 0,0853. | 1.8.3. PROBLEMAS VARIOS PROBLEMA 1 La resistencia a la rotura de ciertos cables de acero producidos por una empresa es una varia- ble aleatoria distribuida ngrmalmente con media 15800 kg/m. Y desvio tipfeo 2600 kg/m. ¢Cual es la probabilidad de que una muestra de 16 cables de la misma longitud, proporcione una media superior a 17360 kg./m? SOLUCION . n= 15800 ; 6=2600 . “n= 16 P(X > 17360) = z - Xxm _ 17300 ~ 15800 who Pyo(X > 17360/ p= 15800; 7 = 650) = Pyo(Z > 2,4) + yn | = 1 - F(2,4) = 1 - 0,9918 = 0,0082 ESTADISTICA ~ Cc. Ccaprilions | PAGINA a5 Introduccion at mee 15800, 7360 | 3 ma ‘ | La probabilidad de que la resistencia media de una muestra de 16 cables supere a 17600 kg./m es 0,0082. | PROBLEMA 2 | Se sabe que en un lote de 700 lépices'hay un 5% que presentan defectos de fabricacién {CuAl es la probabilidad de que en una muestra de 80 lapices provenientes de dicho lote se encuen- tren a lo sumo 5 lapices con defectos? SOLUCION | N=700 H =0,05 : n=80 Calcular la probabilidad de encontrar alo sumo cinco lapices defectuosos (F < 5) en una muestra de ochenta lépices equivale a calcular la probabilidad de que la proporcion muestral p sea inferiora £4 5. = ,0625 n | 80 P(p < 0,0625) = 2.1.7 Ne ") = 0,02295 ) = = PZ < 0,54/0;1) = F(0,54)=0,7054 La probabilidad de encontrar a lo sume 5 lépices defectuosos en la muestra es 0,7054. PAGINA 46 ESTADISTICA ~ c, Capriglion Lintroduccién al Muestreo PROBLEMA 3 : Una empresa tiene 478 clientes. En promedio, cada uno, compra mensualmente por valor de $ 935.460, con un desvio tipico de $ 38.274. ,Cual es la probabilidad de que el promedio de una muestra de 70 clientes esté entre $ 930.000 y 940.0007 SOLUCION | N=478 ; | n=70 ; p= 935.460 3 = 38.274 = | P(930.000 < X < 940.000) = E97 X-p z o |N- vn VN z= —230000= 94540 _ jag, y, . 340000-935460. _ 14, 38742 fare 38274 | 478-70 ¥70 V 478-1 470 Y 478-1 - IK Pwo (930000 < X <940000/.= 935460, % N=". ga30,83)= i in YN-1 La probabilidad de que la media de la muestra esté entre $.930.000 y $ 940.000 es 0,75916. PROBLEMA 4 E] 25% de los clientes que desean renovar su crédito, en cierta financiera, no requiere codeu- dor en razén de sus antecedentes. Se sacd una muestra de 160 solicitudes de renovacién, cual es la probabilidad de que Ip proportién de clientes que no necesitan codeudor esté entre el 20% y el 28% ? SOLUCION | n=160 ; E=O28 5 (1-%)=0,75 _ P(0,20 < p < 0,28) fe ” go PoE tye a mica) * (0,28-0,75 nd n 160 Puo(0,20 < p< 0,28) /R= 0,25 : fey = 0,0342) = = PEIAG Z < 0,88}- F(0,88) - F(-1,46) = 0,81057 - 0,07215 = 0,73842 ESTADISTICA~C. Capriglions PAGINA 47 1 Introduccion al Muestreo La probabilidad de que la proporcién de clientes que no necesitan codeudor esté entre 20% y 28% es de 0,73842. | PROBLEMA 5 Se sabe que las ventas efectuadas por una empresa tiene distribucién normal con media $343,200 y desvio tipico $48.152. De las ventas realizadas en el mes, se saca una muestra de 16 facturas. a){Cual es la probabilidad de que ta media de fa muestra differa de In media poblacional en mis de $20.000? b){Cual es el valor de la media muesiral que sera superado con probabilidad 0,05? SOLUCION | B= 343.200 3 o= 48.152 : n=16 a) Pno (x =n >20 ovo z-XoH g | ki 323200 - 348200 . _ 363200 - 343200 ™ aisz} NOS R= ggg = 186 4 | 4 | : . Pyro (jx-n) >20.000/ w= 343200; - = 12038) = A in = 1 + Pwo (323200 < X < 363200/ w= 343200; ©. = 12038.) = yn = 1 - Pro (-1,66 < Z < 1,66) = 1 - [F(1,66) - F(-1,66)] = : =I - (0,95154 - 0,04846) = 0,09692 % 3000 % OF ibs 155 z PAGINA 48 "Los malos siempre ganan" Refrén anénimo| Lintroduccién af Muestreo La probabilidad de que la media de In muestra dificra de la media poblacional en mas de $ 20.000, es de 0,09692 'b) El valor de la media muestral que sera superado con probabilidad 0,05 es el percen- ti 95 Pro (X>X.) = 0,04 => Pro (X< Xo) = 0,95 Primero hay que buscar el percentil 95 correspondiente 2 la variable Z en la tabla de fractiles 0 percentiles de la distribucion normal estandarizada F (20) = 0,95 => za = 1,645 Sabiendo que entonces por lo tanto 48152 Xq = 343200 +1,645 = 363002,51 El valor de la media muestra] que seré superado, con probabilidad 0,05 es de $ 363.002,51 PROBLEMA 6 La antiguedad media de los beudores por ventas de una empresa es 75 dias con un desvio es- tandar de 15 dias. Se toman al azar 90 fichas. ,Cual es la probabilidad de que la media de la muestra sea inferior a 72 dias? SOLUCION w=75 o=15 5 n=90 Pyro (X <72/ p= 75} 7 = 1,58) = Pug (Z <-1,90) = vo = F{-1,90) = 0,02872 ESTADISTICA ~ ¢. Capriglioni PAGINA 49 { L Introduccion al Muestreo La probabilidad de que la media de la muestra sea inferior a 72 dias es de 0,02872. PROBLEMA 7 Se sabe que el 24% de los clientes de una empresa de servicios tienen cuenta corriente. Se saca una muestra de 120 clientes. a) gCual es la probabilidad de encontrar a lo sumo que el 30% de Jos clientes tengan cuenta corriente? b) {Cual es la proporcién de clientes que tienen cuenta corriente en la muestra, que sera supe- rado con probabilidad de 0,87? SOLUCION | 1=024 ; n=120 a)P(p <0,30)=4...? Puo (p< 0,30 /740,24; = ue ®) 0039) = P(Z < 1,54 ) = F(1,54) = 0,93822 La probabilidad de que la proporcion no supere cl 30% es de 0.93822, b) La proporcion de clientes que tienen cuenta corriente en la muestra, que sera superado con probabilidad de 0,87 es el percentil 13 Pyro (P>Po) = 0,87 => Pro(P 205-1126 Sabiendo que entonces fuego 8 = 0,1961 B, =0,24-1,126- Pe ¥ 120 La proporcién de clientes que tienen cuenta corriente en la muestra, que serd superado con probabilidad de 0,87 es 0,1961 PROBLEMA 8 | Se sabe que el rendimiento'por parcela para cierta variedad de trigo se distribuye normalmen- te con media 383 kg. y desvio estandar 76 kg. a)zCual es la probabilidad de que, en una muestra de 10 parcelas ,el rendimiento medio esté entre 350 kg. y 400 kg,? b);Cual es el rendimiento medio de una muestra de 30 parcelas, que no seré superado, con probabilidad 0,20? SOLUCION n=383 ; o=76 - ayn=10 P(350 < X< 400) =4...? _ 350-383 _ v6 5 vio f10 T1377 \ | Pro (350 < x <400/ = 383 ; % = 24) = P(-137< 250,71) = | in = F(0,71) - FG1,37) = 0,67581 ESTADISTICA ~ C. Capriglioni PAGINA 51 i Introducciin al Muestreo La probabilidad de que la media de la muestra esté entre 350 kg. y 400 kg. es de 0,67581. b)n=30 P(X Xy=q...? Pwo(Z < za) = 0,20 => F (ze) = 0,20 => zy = -0,842 X-n _ x0 ~ 383 > 16 _ ta G WORDT Hy = 383 -0842- = 971532 EI rendimiento medio por parccla que no sera * superado con probabilidad de 0,20, en una muestra de 30 parcelas es de 371,32 | PROBLEMA 9 | En la fabricaci6n de cojinetes para motores, se sabe que el diametro promedio es 5 om y el desvio estandar es 0,006. El proceso se controla periédicamente. mediante una muestra al azar de 64 cojinetes midiendo los correspondientes didmetros. El proceso se detiene si la media de la muestra se encuentra fuera de un intervalo cuyos limites equidistan de la media y contiene una probabilidad igual a 0,99. Determinar los limites de dicho intervalo. SOLUCION | En el enunciado del problema ho se indica cual es la distribucién de la poblacion pero, como el tamafio de la muestra es suficientemente grande, por el teorema central del limite, se utiliza la distribucién normal prs sohucién de este problema n=64— ; y= 5| = 0,006 P(x < X< ¥2)=0,99 Mey 2 5 Ke BE? EI lector puede comprobar que los valores X 1 y 2 son los fractiles 0,005 y 0,995 respectiva- mente, por lo tanto, si PAGINA 52 ESTADISTICA ~ C, Capriglioni Si el diémetro medio de un muestra de 64 cojinetes esté fuera del intervalo [4,998 ; 5,002] se detiene el proceso. PROBLEMA 10 \ En una empresa que cuenta von 2356 clientes en cuenta corriente se controlard el saldo mediante una muestra de tamafio 45(). Sabiendo que los saldos se distribuyen normalmente con media $1322 y desvio esténdar sil 2, calcular la probabilidad de que el saldo promedio de la muestra sea superior a $1329,79. SOLUCION | =2356 a 4530: pei322 o= 112 P(X > 1329,79)= 4.9 1329,79—1322 = 164 112, 2356-450 vaso V 2356-1 Pwo (X >/ p= 1322: = 47498) = =P (Z> 1,64/0; 1)= 1 - F(1,64) = 1 ~ 0,94950 = 0,05050 ! 0.05 \ 1322 1338,79_*| z j 3 14 ESTADISTICA~C. Capriglion! PAGINA 53 LIntroduccién al Muestreo La probabilidad de que el saldo promedio de ta muestra de 450 clientes sea superior a 1329,79 es 0,0505 PROBLEMA 11 Se sabe que el costo por unidad fabricada de una ‘empresa tiene distribucion normal con media $3,43 y desvio tipico $0,48. iDe qué tamatio debe ser la\muestra si se quiere que la, probabilidad de que la media muestral difiera de la media poblacional en menos de $0,19 sea de 0,95? SOLUCION n= 3,43 ; o=0,48) : aA vn = Puo (\x-p} <0,19) = 2 Zo i-a n >on Pho (|X| < 0,19) = 0.95 ( 1,96- 0,48 = 24,518 => n= 25 O19 } > Si se quiere que la probabilidad de que la media muestral difiera de la media poblacional en menos de 0,19 sea de 0,95, el tamafio de la muestra debe ser de 25 unidades. PAGINA 54 CHISTES de ESTADISTICAS El 33 § de los accidentes mortales involucran a alguien que ha bebido. For tanto, el 7 % restante ha sido cau- gado por alguien que no habia bebido. A la vista de esto, esta claro que la forma mas segura de conducir @s ir borracho y a toda velocidad. ba inmensa mayoria de las personas tiene un nimero de piernas superior al promedio. eSabeq que Cristina Kirchner prometié antes de salir elegida que iba a subir todos los sucldos, de forma que nadie cobrase por debajo de la media nacional? Uno de cada diez estudiantes de estadisticas no enten- di6 esos dos chistes. Andé a estudiar, burro. Mueve de cada diez licenciadog piensan que uno de cada diez licenciados es un idiota ESTADISTICA — C. Caprigtioni 2. INTERVALO DE CONFIANZA 2.1. DEFINICION | Anteriormente se ha ¢studiado que para tener informacién sobre una determinada poblacién, cuando no es posible hacer un censo, hay que recurrir al muestreo. Se obtiene una muestra aleato- tia de tamafio n, y con ella|se construyen los distintos estadigrafos a través de los que se puede inferir la poblacién. La estimaci6n puntual consiste en generar una funcidn de las variables muestrales que pro- porcione la mojor informaci6n acerca del parametro a estimar, y con ella, una vez que se obtienc la muestra, calcular un tinico valor del estimador. La principal desventaja que presenta este método radica en el hecho de no poder establecer, probabilisticamente, cudn proximo del verdadero valor del par4metro se encuentra‘el punto de estimacion Por tal motivo es necesario desarrollar un métodb que posibilite tener un cierto grado de confianza de que el verdadero valor del paraémetro se encuentra dentro de una determinada varia- cién alrededor del valor obtenido con fa estimacién puntual. Sea f(X/®) la funci6n de densidad que describe probabilisticamente a una poblacion X con Parametro 0; sea, | 1X3 Xapes Xn} una muestra aleatoria de tarpaito n proveniente de dicha poblacién; y sea el estadigrafo | O= 9 (Xs Xs in) un estimador del parémetro!® Se Hama INTERVALO DE CONFIANZA PARA EL PARAMETRO 0, aun méiodo de estimacion que consiste en determinar un conjunio cerrado y acotatio de posibles valores del parémutro, euyos limites, infe- rior y superior, sun funciones del estimador; y la correspondiente pro- babilidad de dicho imervalo cubra al verdadero valor del pardme- fro. P| ci (6) ss £5(6)| = 1-€ Se Hama N) DE CONFIANZA 0 PROBABILIDAD FIDUCIAL, ala probabilidad de que el NTERVALO DE CONFIANZA cubra al verda- dera valor del pardmetro Se hace notar que tos limites det intervalo son variables aleatorias, por ser funciones de va- riables aleatorias, Por ese motivo, el INTERVALO DE CONFIANZA ¢s un intervalo aleatorio; se desplaza aleatoriamente porjel eje de nomeros reales. Luego de obtener la Iruestra y asignar los correspondientes valores numéricos a las varia- bles, el intervalo dejaré de ser variable. Los limites asumiran un determinado valor. El intervalo posiblemente cubrira al verdpdero valor del parametro. Esta posibilidad se mide con el NIVELDE ‘CONFIANZA. | 1-; Nivel de Confianza, Probabilidad de que el intervalo cubra al verdadero valor del pardmétro. : Nivel de Riesgo. Probabilidad de que et intervalo no cubra al verdadero valor del parimbtro. ESTADISTICA — C. Capriglioni PAGINA 55 SATETUALO Ge CONfanZ | 2.2, INTERVALOS DE CONFIANZA ADITIVOS ‘Se llama INTERVALO DE CONFIANZA ADITIVO a aguel intervalo que permite que la probabilidad de que fa estimacion difiera del paré- metro ena lo sito h veces el desvio esténdar del estimador, sea igual al nivel de confianea Simbolicamente | Pf16.8) s) de la distribucion t de Student con (n - 1) g. L 2.2.1.4, VARIANZA POBLACIONAL DESCONOCIDA. POBLACIONES FINITAS. Sea X una poblacin finita de tamajio N, distribuida normalmente con varianza desconoci- dao y media desconocida py ; sea {X15 Xo5 05 %h una muestra de tamafio M tomada de dicha poblacion normal; | ex seal estadigrafo X = ay —, la Media Aritmética Muestral, estimador del parametro Me- dia Aritmética Poblacional By ; Aa | Yb-xF y sea el estadigrafo| $2 = a la Varianza Muestral, estimador del parametro Varianza Poblacional La varianza estimada del estimador Media Muestral es WX) = = a (N-s) y el estadigrafo de transformacién de la Media Muestral es ESTADISTICA — C, Capriglion! PAGINA 59 2.Intervalo de Confianza cuya distribucién, bajo ciertas condiciones, es t de Student’con (n ~ 1) g. 1. Por otro lado, considerando que la probabilidad de encontrar un valor de la variable es- tandarizada entre dos fractiles equidistantes del origen sea (1-€). PlturzStStaen)=1-€ remplazando por el estadigrafo de transformacién Plters x S$ tun) = I+ vn VN-1 despejando convenientemente, se tiene Ia expresién del intervalo | donde ty es el FACTOR DE GONFIANZA y es el fractil'de orden (1 ~ ) de la distribucion t de Student con (n - 1) g. 1. 2.2.2. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES CUYA DISTRIBUCION DE PROBABILIDAD ES DESCONOCIDA. Las distribuciones dg las poblaciones no siempre son conocidas, En estos casos, para po- der construir INTERVALOS DE CONFIANZA para estimar el parimetro Media Poblacional, hay que recurrir a la aplicacion de algunos teoremas ya estudiados. Con el Teorema Central del Limite se demuestra que los estadigrafos | > : ' z=Xoh o vn X-p IN-n Fen tienen distribuci6n asint6tic{mente Normal Estandarizada cuando el tamafio de la muestra tiende a infinito. Por otro lado, con el|Teorema de Tchebycheff” se puede demostrar que Z= M1 X-nl sk. JVG@D}21 2 1 Vor Estadlsticn Tomo 1. C, CAPRIGLSONI Primera. ? Ver Estadisticn Tomo I. C, CAPRIGLIONI Primera jo le pongas parches, la estructura PAGINA 60 est& podrida.” Proclama del Mayo Francés * Con estos dos teoremas se construyen los intervalos de confianza para estimar el parametro Media Poblacional 2. Intervalo de a ' 2.2.2.1. MUESTRAS GRANDES Si la distribucion de probabilidad de lapoblaciém’no es conocida, y el tamafio dela muestra es lo suficientemente grande camo para que se cumpla el Teorema Central del Limite, entonces, para poblaciones infinitas o finitas, respectivamente o, sila Varianza Poblacional es desconocida, bajo ciertas condiciones, para poblaciones infinitas 0 finitas, respectivamente P(x-2® eps Kaz, ¥ ) = 1-8 va vn) x Sy [IN-n x P(x r\q SOS vn YN-1 donde Zo es el FACTOR DE|CONFIANZA y es el fracti] de orden ( - 5) de la distribucién Nor- I mal Estandarizada 2.2.2.2, MUESTRAS CHICAS . Sila distribucién de probabilidad de la poblacion no es conocida, y el tamafio de la muestra no es lo suficientemente le como para que se cumpla el Teorema Central del Limite, entonces el nivel de confianza del i ‘alo de estimacion es la cota inferior de probabilidad que surge dela aplicacién del teorema de Tehebycheff. Entonces, para poblaciones con varianza poblacional conocida, infinitas o finitas, los inter- valos de confianzas son, respectivamente P [: efx. 6 EN sus X+k% a x *) 21-8 ©, sila varianza poblacionall es desconocida, para poblaciones infinitas o finitas son, respectiva- mente ESTADISTICA — C. Caprighion} PAGINA 61 2.Jntervalo de confianza | ¢ S, P/X-k,-X

1+ E = 0975 Se busca en la tabla de fractiles 0 percentiles de la distribucion normal estandarizada el valor deZo, tal que Fe) = 0,975 = %= 1,960 [So oe el miedo al rojo para los aninales PAGINA 68 con cuernos." Proclama del Mayo Francés 2. Intervalo de Confianza El intervalo es entonces: 33 - 1,960. 4) SHxS 35+ 1.960: 4 32.387 < px < 37,613 Elintervalo [32,387 : 37,613] cubre el verdadero valor de la media poblacional, con una confianza del 95%. 2.5.1.2, POBLACION NORMAL FINITA. VARIANZA POBLACIONAL CONOCIDA De una poblacién normal de 150 elementos se sacé una muestra de tamafio 25 la cuél pro- porcioné una media de 348,3. Sabiendo, que la varianza de la poblacidn es de 16, estimar me- diante un intervalo del 95% la media poblacional. SOLUCION La expresi6n genética del intervalo de confianza para estimar el parimetro media poblacional, si Ja poblacién es normal, finifa y cuya varianza poblacional sea conocida, es: efx Zo° 5 \ 7" 1 Sis $ EX4+Zy-% Non -6 n n N-L donde: N; tamafio de la poblacién o del universo. Hx : media poblacional. Parametro a estimar. © : varianza poblacional. i: tamafio de la muestra. xx -o 1 - &: Nivel de confianza, 2: Factor de Confianza. Esl fractil de orden 0 - §) de la distribucién Normal Estandarizada + media muestrd Estimador insesgado de la media poblacional [Ly. En este problema se tiene: xy N=150 ; n=25 |: ox=16 ; xed) = 483 1-6=095 > 1-3 =095 Sc busca en la tabla de fraction © percentiles de la distribucién normal estandarizada el valor de Zo, tal que F(2) = 0,975 => x ~ 1,960 E1 intervalo es entonces: 4 190-25 4 /150-25 348,3-1,960- | Spx $3483 +1,960- | “_ jos 150-1 SPE E® 5 | 150-1 346,86 < px < 349,74 E] intervalo [346,86 ; 349,74] cubre cl verdadero valor de la media poblacional, con una confian- za del 95%. ESTADESTICA - C. Caprigiiont PAGINA 69 2Intervalo de Con 2.5.1.3. POBLACION NORMAL INFINITA. VARIANZA POBLACIONAL DESCONO- CIDA. Los siguientes datos:corresponden a una muestra de tamafio 9 tomados al azar de una po- blacién distribuida normalmente: 84; 88 5 83 ; 90; 87: 87 ; 85 ; 8B; 82 Estimar, mediante uh intervalo de confianza de! 95% el valor de la media poblacional. SOLUCION | La expresion genérica del intervalo de confianza para la media poblacional, si la poblacién es normal, infinita y no se a su varianda es: S, PiX-t,- sp, sX+t, I vn donde: | 4x : media poblacional (Parametro a estimar) Nv: tamafio de la muestra x X= ux + media muestral. Estimador insesgado de la media poblacional pix. ¥% -X)? =S.C.x: Suma de Cundrados (suma del cuadrado de las desviaciones con respecto ala media aritmética) ni— 1: Grados de libertad de la Suma de Cuadrados > (x, -x)? | Ac] Vaviahea muestra. Estimador insesgado de Ta varianza poblacional ox. 1 - €: Nivel de confianza. | Sx = | to: Factor de Confianza. Fractil de orden. (i - 5 de la distribucién t de Student con (n-1) g.1. Con los datos de la muestra, y utilizando las correspondientes férmulas, hay que calcular el valor de la media muestral y de 14 varianza muestral. Para facilitar los cilculos, es convenienie utilizar la siguiente tabla: x (a- x) ba xy | 2 _ 2 i | 3 9 | 4 16 | T t _16 t TOTALES i 0 56 1 l 774 2 _ 56 n=9 = 286; 8% = 27 an) 8 PAGINA 70 ESTADISTICA — C. Caprigitont 2. Intervalo de Confianza l-e= 095 = 1-* = 97S gl. =9-1=8 El valor de la tabla t de Student con 8 grados de libertad hasta donde se acumula una probabili- dad igual a 0,975 es ty = 2,306 | El intervalo es entonces: | ae 2,306 - AO sx 86+ 2306. *e 1 s3.963 SxS 88,037 El verdadero valor de la media poblacional estaria entre 83,96 y 88,04 con una confianza del 95 %. 2.5.1.4, POBLACION NORMAL FINITA. VARIANZA POBLACIONAL DESCONOCIDA Deuna poblacién normal de 250 clerentos se sacé una muestra de tamafio 36 la cual pro- Pporcioné una media de 480. Sabiendo, que la varianza de la muestra es igual a 625, estimar con una confianza del 95% la media poblacional. SOLUCION | Se conoce el tamaiio de Ja ppblacién, pero no la varianza de la poblaci6n. La expresi6n genérica del intervalo de confianza para estimar el parimetro media poblacional, si la poblacién es normal, finita y cuya varianza poblacional sca desconocida, es: > S, N-n Pht e a "cu. sX+to- a Napeie donde: N: tamafio de la poblacién d del universo. Hx: media poblacional. Pargmetro a estimar. 1: tamafio de la muestra, XX -X)? =S.C.x: Suma de Cuadrados (suma del cuadrado de las desviaciones con respecto a la media aritmética) . n— 1: Grados de libertad de la Suma de Cuadrados Sax st = 2 eo ~~: varianza muestral. Estimador insesgado de la varianza poblacional 67x. 1 - & Nivel de confianza. tg: Factor de Confianza. Fractil de orden (: - ) de la distribucién t de Student con (n- 1) g. 7 — =X X= » " + media muestral. Estimador insesgado de la media poblacional [l. En este problema se tiene: | N=250 ; m=36 |; x=480 ; S%=625 | ESTADISTICA - C. Caprigilon! PAGINA 71. 2.Intervalo de Confianza GL.=36-1=35 ; 1-8=095 > [5] =0975 => ty=2,030 El intervalo ¢s entonces: 480 — 2,030 - 5 250-36 << 480 + 2,030 25 |250-36 36 250-1 36 250-1 472,16 < wx < 487,84 Elintervalo [472,16 ; 487,84] cubre el verdadero valor de la media poblacional, con una confian- za del 95%, 2.5.1.5. POBLACION NO NORMAL. MUESTRAS GRANDES. Se seleccionan 150 elementos al azar, obteniéndose un promedio (muestral) igual a472_y ‘una varianza (muestral) igual a 64: Estimar, mediante un intervalo de confianza del 96% el valor de la media poblacional. SOLUCION Si el tamafio de la muestra es suficientemente grande (n> 30) el Teorema Central del Limite asegura que el estadigrafo (X-p) n o tiene distribucién asintéticamente normal estandarizada, cualquiera fuese la distribucion de la poblacién, por lo tanto, en estos casos, el cocficiente de confianza se obtiene de la distribucion Normal. Por lo tanto, en caso de trabajar con muestras de gran tamaiio (n> 30), 1a expresién genérica del intervalo de confianza para estimar el pardmetro media poblacional es, si se conoce la varianza poblacional | {x -2- 5X s x 2X2, 55 =1-6 | in vi y sino se conoce Ja varianza poblacional PLR 2y: sug s Xray Shh 1-6 Donde: Zo: Factor de Confianza. Es ¢} fracti] de orden (1 -£) de la distribucién Normal Estandarizada aunque la distribucién de la poblacién no sea normal, En este problema se tiene, n=150 ; X=472 ; S3=64 ; Sy=8 & | TOSS => 79=2,054 1-8=0,96 => I- el intervalo es: PAGINA 72 ° ESTADISTICA — C. Capriglioni 472, 2. Intervalo de Confianza -2084- * cnyca72 +2054. 8 150 150 470,66 < wx < 473.34 Con una confianza del 96% la media poblacional se encontraria entre 470,66 y 473,34. 2.5.1.6. POBLACIONES NO NORMALES. MUESTRAS CHICAS. ‘Los siguientes datos corresponden a una muestra de 10 clementos provenientes de una poblacién con una varianza 25. 131 ; 144 ; 140 ; 132; 133; 143 ; 138 ; 139 ; 138 ; 132 Estimar, mediante un inter} SOLUCION yalo de confianza del 90%, cl valor de la media poblacional. Sino se conoce la distribucién de la poblacion y la muestra es chica, hay que recurrir a la des- igualdad de Tchebychetff. de donde PI of xa seas ' n oO xO cay ex ak OF fort n Ke luego el intervalo de confianza cs n Pik PX eux exon | sine n En este caso, el nivel de confianza es una cota minima, Para obtener el coeficiente de confianza, hay que hacer l-e=t ! . € En este problema se tiene n=10 ; X=137 § ox=5 l-e=09>e-0l0ak= | =31062 0,10 el intervalo es 13/7 — 3,162 - 5 Spx S 137 + 3,162 - B 10 /10 132 < px< 142 Con una confianza minima del 90% la media poblacional estaria entre 132 y 142. 2.5.2. ESTIMACION DE LA PROPORCION POBLACIONAL. 2.5.2.1. POBLACIONES INFINITAS Se tomé una muestra de 800 elementos de una poblacién, encontrando que 320 tienen un ESTADISTICA-C. Capri PAGINA 73 ZJntervalo de Confianza determinado atributo A. Estimar, con una confianza del 95%, el valor de la proporcién de elementos con el atributo A en la poblacion. SOLUCION La expresién genérica del intervalo de confianza para estimar la proporcién poblacional de uni- versos infinitos, cuando el tamajio de la muestra es suficientemente grande, es Pip: ea SHsp+2,-sP4 =l-e donde; TE :Proporcién de elementos con atributo en la poblacién. (Parametro a estimar). n: Tamafio de la muestra. | ¥ : Cantidad de elementos con atributo en la muestra de tamafio n. ¥ Pp proporcién de clementos con atributo en ta muestra, Estimador insesgado de 71. 4-1-5 Zq: Factor de Confianza. Es el fractil de orden (-8) de la distribucién Normal Estandarizada En este problema se tiene: n=800 ; ¥4320 ; P= pop = 040 5 q=0,60 1-8=0,95 > 1-5 = 9,975 = m=1,960 el intervalo es: 0,40- 0,60 0,40-0,60 + 1,960- 800 $7 <0,40+ 1; 300 | 0,366 < 10 < 0,434 0,40 — 1,960- Con una confianza del 95% 1a proporcién de elementos con el atributo A en la poblacién estaria entre 0,366 y 0,434. Dado que las properciones se pueden expresar en porcentajes, la respuesta des este problema pue- de ser: Con una confianza del 95%, el porcentaje de elementos con el atributo A en la poblacion estaria entre el 36,6% y el 43.4%. 2 2. POBLACIONES FINITAS Deun total de 12345'elementos se sacd una muestra de 4800, ‘encontrandose que 1680 po- seen el atributo A. Estimar, con una confianza del 95% la proporcién de elementos en la pobla- cién, que poseen el atributolA. SOLUCION La expresi6n genérica del intervalo de confianza para estiniar la proporcién poblacional de uni- versos finitos, cuando el ‘tamafio de la muestra es suficientemente grande, es _, Ba, Nen < , Pa, Nen _ ofp Zo 1 ‘a N-1 SUEPtZ n Nor =1-€ donde: ® : Cantidad de elementos ¢on atributo en la poblacién. N.:: Tamajio de Ja poblacicn PAGINA 74 ESTADISTICA — C. Caprigiioni | 2. Intervalo de Confianza T - :Proporcién de elementos con atributo en la poblacion. (Pardmetro a estimar). Nn: Tamafio de la muestra. : ¥ : Cantidad de elementos con atributo en la muestra de tamaiio n. proporcién de elementos con atributo en Ja muestra. Estimador insesgado de 70. =1-7 { Zp: Factor de Confianza. Es el fracti] de orden (1 - 8) de la distribucién Normal Estandarizada En este problema se tiene: __ 1680 =. 3 = 0,65 goo O85 3 1= 0s N=12345 ; n=4800 ; F= 1680 ; p 1-6=095 = 1-5 £0,975 => 2 =1,960 ” el intervalo es: 72038 +190. 25-065 12345-4800 sosad £2345 — 4800 0, 3 4800 12345-1 4800 |) 12345-1 0,35 — 1,960-,| 0,3395 < TE < 0,3605 Con una confianza del 95% la proporcién de elementos con el atributo A en la poblacién estaria ontre 0,3395 y 0,3605. Dado que las proporciones ge pueden expresar en porcentajes, la respuesta de este problema pue- de ser: Con una confianza di-1 95%, et porcentaje de elementos con el atributo A en la poblacion estaria entre el 33,95% y ¢l/36,05%. 1 2.5.3. ESTIMACION DE LA VARIANZA 2.5.3.1. POBLACIONES|NORMALES. . De una poblacién normal s¢ tomaron al azar | | elementos cuyos valores son los siguientes: 384 ; 391 ; 388; 394 ; 381 ; 385 ; 384 ; 391 ; 383 ; 389 ; 387. Estimar, mediante un intervilo de confianza del 95%, el verdadero valor de la varianza poblacio- nal. | SOLUCION La expresién genérica del intervalo de confianza para la varianza de poblaciones normales es: 2 donde : Nn: Tamafio de la muestra, SX : Varianza muestral. 1-&=Nivel de confianza, | & a: Bs el fractil de orden (;) de la distribucién ji - cuadrado con (n - 1) grados de libertad ESTADESTICA ~ C. Caprigion! PAGINA 75 2Intervalo de Confianza | b: Es el fractil de orden (: + ;] de la distribucién ji - cuadrado con (n- 1) grados de libertad. En este problema se tiene | n=l; gl=(n-1)=10 Aplicando la correspondiente formula a tos datos de Ia nuestra, se obtiene el valor de la varianza muestral 8% =16 1-8=0,95 5 = 0025 => a=3,25, & 1-5 = 0975 > b~20,48 el intervalo es: 10-16 ¢ ga, 10-16 20,48 3,25 | 78125 S$ 0°x $ 49,23 Con una confianza del oe la varianza poblacional se encontraria entre 7,8125 y 49,23. 2.5.4. DETERMINACION DEL TAMANO DE LA MUESTRA PARA ESTI- MAR LA MEDIA POBLACIONAL. 2.5.4.1. POBLACIONES NORMALES INFINITAS CON VARIANZA POBLACIONAL CONOCIDA | Se desea estimar la media de una poblacién normal con varianza igual a 75, {Cuél deberé sex ¢1 tamafio de la muestra si se quiere que el error de muestreo no sea superior 3,4 con una confian- za del 95% ? \ SOLUCION | El tamafio de la muestra para estimar la media pobl jacional de poblaciones normales infinitas se calcula con la formula: | 2 2 % OX n= e donde : Zo: Factor de Confianza. Egel fractil de orden (i - £) de la distribucién Normal Estandarizada 6 : Varianza poblacional e: Error de muestreo (diferencia entre estimador y parimetro). La unidad de medida de la magnitud del error de muestreo debe ser la misma que la de la variable en estudio, Si el resultado no fucse un mlimero entero, entonces hay que utilizar ¢l préximo numero entero, cualquiera fuese la parte decimal En este problema se tiene: 2 OX=75 5 e384 x “La barricada cierra una calle, pero PAGINA 76 abre una via." Proclama del Mayo Francés 2. Intervalo de Confianza | 1€=0,95 => 1-5 +0975 > 71,960 1,960? -75 ne 60" 7 3,4 Senecesitan como minimo 25 elementos para estimar la media poblacional con error de muestreo no superior a 3,4 y con una confianza del 95%. | = 2492 => n=25 2.5.4.2, POBLACIONES NORMALES INFINITAS CON VARIANZA POBLACIONAL DESCONOCIDA Se desea estimar la media de una poblacién normal con una confianza del 99% y un error de muestreo a lo sumo de 4. Commo no se tiene informacién de la varianza poblacional se realiz6 una estimacién de la misma con na muestra piloto de 10 clementos y results igual a 70. ;Cual deberd ser el tamafio minimo de la {nuestra necesario? SOLUCION En este problema se utilizari el metodo iterativo. Los datos son n= 10 ; Sk=70 ; e=4 GL=m-1=9 ; 16=099 => 15 =0,995 => )=3,250 entonces, el tamafio de muestra inicial es 2. ny = 32250270 oot eo =47 2 Para calcular el segundo tamiaiio de la muestra se trabaja con el valor de t-Student con 46 grados de libertad t= 2,687 ' _ 2,687? -70 n, 2 = 31,6 => m=32 Para calcular cl tercer tamajio de fa muestra se trabaja con el valor de t-Student con 31 grados de libertad | t= 2,744 | 2 | ny = 2744-70. =32,9 = ny=33 a | Para calcular el cuarto tamaiio de la muestra se trabaja con el valor de t-Student con 32 grados de libertad t= 2,738 2 = 2738 408 > m= 33 4a Como el tercer y el cuarto tafnaiio de la muestra son iguales, entonces, el tamafio de muestra ne- cesario para estimar la media poblacional en las condiciones fijadas es n = 33 elementos. 2.5.4.3, POBLACIONES NORMALES FINITAS CON VARIANZA POBLACIONAL CO- NOCIDA De una poblacién normal de 452 elcmentos, se desea seleccionar una muestra para estimar la me- dia con un error no mayor dé 12. ;Cual deberd ser el tamaiio si la poblacién tiene un desvio es- ESTADISTICA — C. Capriglion| PAGINA 77 2.Intervalo de Confianza | tandar de 53 2. Nivel de confianza 95%. SOLUCION El tamaiio de 1a muestra parq estimar la media poblacional de poblaciones normales finitas, cuan- do se conoce la varianza poblacional se calcula.con la siguiente formula: | z79-G7.N ad e? .(N-1)+z7o-0? donde : 9: Factor de Confianza. Esel fractil de orden ( - 2) de la distribucién Normal Estandarizada aX: Varianza poblacional | N: Tamafio de la poblacién| e: Error de muestreo (diferencia entre estimador y pardmetro). En este problema se tiene: | Ox=57 5 a= 12 : N= 452 1-095 = 1-5-0975 => m= 1,960 1,960? -53? -452| + (452-1) +1,96? (53? Se necesitan como minimo 4S elementos para estimar la media poblacional con un error de mues- treo no superior a 12 y con tma confianza det 95%, = 644 > n=65 2.5.4.4. POBLACIONES| NORMALES FINITAS CON VARIANZA POBLACIONAL DESCONOCIDA | De una poblacién normal de 1053 elementos se desea estimar la média con un error de muestreo inferior al 1,1 y una confianga del 98%. Como no se conoce el desvio poblacional se selecciona una muestra piloto de 10 elementos, obteniéndose una varianza de 16,34, Determinar el tamafio de muestra minimo necesarjo para realizar la estimacion. SOLUCION : . El tamafio de la muestra parg estimar la media poblacional de poblaciones normales finitas, cuan- dono se conace la varianza poblacional, se calcula mediante el uso del proceso iterativo ya expli- cade oportunamente en el 0 2.5.4.2. a partir de una muestra piloto de tamafio Mo. El tamaiio de la muestra initial se calcula con ta formula t2-S2x-N m= 2 2 2 e? -(N-1)+t7, 87x donde | N : Tamafio de la poblacién. SX : Varianza muestral calculada con la muestra piloto. e: Error de muestreo. ‘to: Factor de Confianza. Fractil de orden (1 ~ s) de ta distribucién t de Student con (n - 1) g. L ‘ Los datos de este problema son No = 10 3 SX = 1634; e=LL 5 N= 1053 PAGINA 78 ESTADISTICA — C, Caprigliont 2, Intervalo de Confianza | & gl=nm-1=9 3 e=098 => 1-5=099 = t=2821 El tamaiio inicial de la muestra es Pi-S’x-N- ? - 16,34 - 1053 nyaaq PSION _ 2821 1634-1055 og yng 7 (N=) +04 -S% | L1?-10524-2,821°-16,34 | Para calcular el siguiente valor del amatio de muestra hay que utilizar & Bl=m-1=97 5 J-e=098 5 1-5-0997 = 8=2,365 Bl valor del segundo tamafig de muestra es t?2-S?x-N i. 2,365? -16,34-1052 e? -(N-1)+t?2-S7x 1? -1052 +2,3657 -16,34 nz = = 7047 => m=71 Para calcular el siguiente valor del tamafio de muestra hay que utilizar gl=m-1=70 ; }-e=098 ; 1-5 =099 = t=2381 E] valor del tercer tamafio de muestra es £75 -S?x-N — 23817 -16,34-1052 ny == 3 ; 2736 > m=72 e? -(N-1)+t73-S?x 1,1? -1052+2,381? -16,34 Para calcular el siguiente valor del tamaito de muestra hay que utilizar ” GLeom-t-71 5 |i-e-098 5 1-5-0099 => u=2,380 El valor del cuarto tamafio de muestra es 24 6G2x. 2, . n= P4-S' xN = 73807 1634-1052 ag nye e?(N-1)+t74-S?x 1,1? +1052 +2,3807 -16,34 . Como el tercer y el cuarto de la muestra son iguales, entonces, el tamafio de muestra ne- cesario para estimar la medi poblacional en las condiciones fijadas es n = 72 elementos. ' 2.5.5. DETERMINACION DEL TAMANO DE LA MUESTRA PARA ESTI- MAR LA PROPORCION POBLACIONAL. 2.5.5.1. POBLACIONES INFINITAS Sc desea estimar la proporcién de elementos con cierto atributo que hay en una determinada po- blacién. ,Cual deberd ser el tamatio de la muestra necesario para que el error de muestreo no su- pere el 3%, con una confianza del 95%, si éxperiencias anteriores indican que la proporcion es del 43%?. SOLUCION El tamatio de la muestra para estimar proporci6n poblacional de universos infinitos se calcula con Ja formula : 2o-B4 2 donde : ESTADESTICA — C. Capriglior PAGINA 79 2.Intervalo de Cor Zq: Factor de Confianza. Es el fracti} de orden fi -£) de ia distribucién Normal Estandarizada C2 P :Proporcién que surge { experiencias anteriores o estimada mediante una prueba piloto o, si Pane de estos recursos np pudiesen ser utilizados, directamente el valor que se toma es 0,50. =1-p | e = error de muestréo (diferencia entre cstimador y parémetro). El error de muestreo debe estar expresado, al igual que p . en tanto por 1. Si el resultado no fuese un r\imero entero, entonces hay que utilizar el proximo miimero entero, cualquiera fuese la parte décimal En este problema se tiene: | p=043 ; q-lp=057 : e= 0.03 1-6 =0,95 > 1-5 $0975 = z= 1,960 _2’o-p-q _ 1,960? -0,43-0,57 e? 0,037 Es necesario una muestra de 1047 elementos para estimar la proporcién poblacional con un error de muestreo no mayor al 3%. = 1046,1957 => n= 1047 2.5.5.2. POBLACIONES FINITAS Se desea estimar la proporcién de elementos quc tienen ciert6 atributo A en una poblacién de 87452 elementos. ,Cudl deberd ser el tamafio de fa muestra si se quiere que el error de muestreo sea inferior al 1%, con una ¢onfianza del 95%, si una muestra piloto proporcioné un 27% de ele- mentos con dicho atributo? SOLUCION El tamafio de la muestra para estimar la proporeién poblacional de universos finitos se calcula con fa formula : | ne FRAN (Ne D+z70 pg donde: | N: Tamafo del universo. = Zo: Factor de Confianza. Ee el fractil de orden (- 2) de la distribucién Normal Estandarizada P :proporcion que surge de experiencias anteriores o estimada mediante una prucba piloto o, si a de estos recursos no pudiesen ser utilizados, directamente el valor que se toma es 0,50. q=1p e =crror de muestreo (diffrencia entre estimador y arémetro), El error de muestreo debe dstar expresado, al igual que P- en tante por 1. Siel resultado no fuese un nimnero entero, entonces hay que utilizar el préximo numero entero, cualquiera fuese la parte ddcimal En este problema se tiene: | N= 87452 | p-027 ; 4q PAGINA 80 ESTADESTICA — C. Caprigilon! 2. Intervato de Cony e=0,01 | 1-6=0,95 > 1-5-0975 > 2= 1,960 27o-p-q-N 2 .0,27-0,73-87452 _ OPN 1,960° -0,27-0,73-8745 =6968,52 = e? (NT) +270-P gq 0,017 «(87452 —1)41,9607 -0,27 0,73 => n= 6969 Esnecesario una muestra de 6969 elementos para estimar la proporcién poblacional con un error de muestreo no mayor al 1%. 2.5.6. PROBLEMAS VARIOS. 2.5.6.1. POBLACIONES NORMALES Y NO NORMALES. PROBLEMA 1 Una muestra de 30 parcels srnbrodas con algodén, determiné un rendimiento medio de 950 kg./ha. Sabiendo que los rendimicntos ticnen distribucién normal con desvio estindar 25kg./ha., estimar el verdadero rendimiento medio. mediante un intervalo de confianza del 98%. SOLUCION De acuerdo con las caracteristicas del problema, hay que estimar la media poblacional de una poblacién normal cuando se conoce la varianza poblacional. fx ay. Spy eXa9:% baie | n n Datos i} n=30 3 Ox=25 ‘ x — 950 1-&=0,98 > 1-5 =0,99 = zo = 2.326 Ef intervalo es entonces: | , 5 950/-2.326. > a=989 15 = 0.995 = b=45,56 el intervalo es: 24-2743,26 2 24-2743,26 | | 45,56 <°*5 9.89 | | 1445,09 < 67x < 657,05 Con una confianza del 99% el verdadero valor de la varianza poblacional del contenido de coles- terol en la sangre de los conejos de 2,5 kilos se encontraria entre 1445,09 y 6657,05. | PROBLEMA 3 | Se desea estimar el peso medio de las cajas de dulces envasados por una maquina automiatica. Se sabe que los pesos se distribuyen normalmente con desvio estandar igual a 35,7 g. ;Cual debera ser el tamaiio de la muestra hecesario si se desea que el error de musstreo no sea superior a 10 g, con una confianza del 99%? SOLUCION De acuerdo con el enunciado del problema, ta poblacién es normal, no se conoce su tamaiio, lue- go se lo considera infinito y se conoce la varianza (esté el valor de! desvio esténdar), por lo tanto Ja formula a utilizar es: | net? s °x e En este problema se tiene: | ox=357 ;—e=10 1-=099 > 1-5 =0.995 = %=2,596 2 2 n= 2576" 35.7" _ 94.5723 => n= 88 10? | Se necesitan como minimo 85 cajas para estimar cl peso medio con un error de muestreo no supe- riot a 10 gramos y una confianza del 99%. PROBLEMA 4 | De un rodeo de 500 vacunos se Seleccioné una muestra de 15 animales con similares caracteristi- cas y se les suministré una determinada dieta. Al cabo de un determinado tiempo se comprobé que en promedio, el aumento de peso en ese periodo fue de 22,5 Kg por animal.-Por experiencias anteriores se sabe que la ganancia de peso por animal se distribuye normalmente con desvio es- tandar igual a 3 Kg. Estimar, mediante un intervalo de confianza del 97%, la ganancia de peso promedio de los animales del rodeo, sujetos a la misma dieta y en el perfodo de tiempo conside- rado. | SOLUCION ‘De acuerdo con el enunciadp del problema, la poblacién es normal y finita, su tamafio es 500, y se conoce la varianza poblational, por lo tanto el intervalo de confianza es. Pfx—r-® Oy. wt n n Datos del problema N=500 3 n=15 : Ox=3 : x +22,5 PAGINA 82 | ESTADISTICA — C. Caprigiion! N-n N-1 SH, SX4z5- | 2, Intervalo de Confianza 1-8=097 = 125 = 0985 => my=2,170 El intervalo es entonces: (3 500-15 3. [500-15 22,5 -2,170- ['-§} 00 => t9=2,797 | reemplazando \ | 3,1 3 233 -2.797 SpxS233+2,797. ~ 28 (25 21,57 < px < 25,03 Con una confianza del 99% la longitud media de las mazorcas se encontraria entre 21,57 cm y 25,03 om. | | PROBLEMA 7 | En Ia siguiente tabla se presentan los montos de las dcudas de 80 clientes que poseen cuenta co- rriente en una empresa, selgccionados en muestra simple al azar. || MONTODE | CANTIDAD DE | LA DEUDA CLIENTES | 1000 — 1500 9 i 1500-2000 [17 | | 2000 — 2500 __28 | 2500 - 3000 * 20 3000-3500; 6 . Estimar con una confianza {icl 95%, el monto promedio de los deudores en cuenta comicnte. SOLUCION Hay que construir un intervalo para e] monto promedio de los deadores. El tamatio de la muestra es suficientemente grande, por lo tanto. por aplicacién del Teorema Central del Limite, el coefi- ciente de confianza se obtiene de la distribucién Normal aunque no se conozca la distribucién de la poblacién. efi -20-% Spy 2x2 She —& n n . La media aritmética y el degvio estandar de la muestra se calculan usando las correspondientes formulas X= 203125; Sx=S$3,72 : 1-€=0,95 ; 1-" = 0.975 = 20= 1,960 entonces { “ | 553,72 553,72 2231,25+ 1,96 - = < ps 2231.25 + 196. —2= Ro. "0 2109.91 < pb < 2352,59 PAGINA 84 ESTADISTICA — C. Capriglioni 2. Interval de Confianza El monto promedio de los deudores en cuenta corriente estaria entre $2109,91 y $2352,59 con una confianza del 95%. PROBLEMA 8 | Se debe calcular el tamafio de muestra minimo necesario para estimar el costo medio de fabrica- . cién de las lapiceras, Para cllo se establecié un nivel de confianza del 95% y un error de muestreo no superior a $3. Como no.se contaba con informacién de la varianza de los costos, se tomé una muestra piloto de 16 lapiceras y se obtuvo un desvio estandar de 6$. Se supone que el costo tiene distribucién normal. SOLUCION De acuerdo con el enunciado del problema, la pablacion es normal, no se conoce su tamaflo, luego se lo considera infinito y no'se conoce la varianza poblacional, por lo tanto hay que utilizar el mé- todo iterativo \ Los datos del problema so e=3 3 My =116 (tamafio de la muestra piloto) ; Sx = 6 (Desvio estandar muestral calculado con la muestra piloto) GL=m-1-15 ; l-e=095 ; 1. F <0975 > &=2,131 | E] valor del tamaiio de muestra inicial es 1S? 2g ne * _ 2B © Logie m=19 e 3? Para calcular el siguiente valor del tamafio de muestra hay que utilizar GL=n,-1-18 ; |i-e-095 -F 20975 = &=2,101 El valor del segundo tamafip de muestra . ths: s 2g? n= {22% . —8" 1765 > m=18 e 3 Para calcular el siguiente valor del tamafto de muestra hay que utilizar Gl=m-1=17 ; |t-e-095 ; - 5 0975 > &=2110 EI valor del tercer tamafio de muestra . * th, Sts 2g? maf Fe 208 agi > mais e? 37 Como el segundo y el terce} necesario para estimar el co} n= 18 lapiceras. PROBLEMA 9 Alos efectos de estimar el agropecuario, se tomé una Peso total de las 20 bolsas: sto medio de produccin de las lapiceras en las condiciones fijadas es eso medio de fas bolsas de semillas recibidas en un establecimiento wuestra al azar de 20 bolsas con la que se calculé lo siguiente: Din =345Kg Suma de cuadrados: 7 (x, —x)? = 304 Estimar, mediante un interval de confianza del 90% el peso medio de las bolsas, admitiendo que los pesos se distribuyen nor}nalmente SOLUCION ESTADISTICA - C, Caprigiton i PAGINA 85 tamafio de la muestra son iguales, entonces, e] tamafio de muestra 2.Intervalo de confianza Dado que la varianza se es desconocida, ef intervalo es Pix n5: SUy SX+hy Scheie vn vin Peso total de las 20 bolsas =X x) =345 n=20 36 304 x sets = =4 Keay TINS n-1 19 Sx GL=20-1=19 ; 1-e=090 > (1-$)} -00s => &=1,729 reemplazando: | 17,25 -1,729- sap SBN 1728 ting. AL 20 15,70 < x < 18,80 Con una confianza de 90% el peso medio de las bolsas estaria entre 15,7 Kg y 18,8 Kg PROBLEMA 10 | Se quiere controlar, mediante el muestreo, si el diémetro de los cafios cumplen con la especifica- cién dada por una norma, Los didmetros tienen distribucion normal con desvio estandar igual a 0,9 mm. | {Cual deberd ser el tamafio de muestra necesario para que el error de muestreo no supere 0,3 mm, con una confianza del 99%? SOLUCION Hay que calcular el tamafio de la muestra para estimar la media pobtacional de poblaciones norma- les infinita cuando se conoce ta varianza poblacional En este problema se tiene; . O=09 ; e=03 162099 => 1 $0.95 > m»=2576 ” 5071 3 n= 60. Se necesita una muestra de tamafio 60 para estimar el diémetro medio de los cafios con un error de muestreo no superior a 0,3 mm | PROBLEMA 11 Se desea estimar el peso medio de los paquetes de carametos envasados por una méquina. De la produccién del dia, 1473 pages se Saco una muestra de 25 paquetes obteniéndose un peso me- dio de 853 gr y un desvio estandar de 47 gr. Realizar la estimacion con una confianza del 95% sabiendo que el peso de los|paquetes se distribuye normatmente SOLUCION De acuerdo al enunciado a problema, la poblacién es normal, finita y no se conoce la varianza poblacional, por lo tanto al intervalo es PAGINA 86 “Seamos realistas, pidamos lo imposibl: @ del Mayo Franc 2.Intervalo de Confianza Yn YN-1 Los datos de este problems son: N=1473 ; : Sx=47 5 ¥= 853 eft $s [N=n GL=25-1=24 ; i-0-095 = [+-§)-o005-5 t= 2,064 ‘Aunque la fraccién de muestreo sea inferior a 0,10 igualmente se utilizara el intervalo para pobla- ciones finitas. El intervalo és éntonces: 4? 47 853 —2,064- —#? syns 853 +2,064- SE 2 os Vara SP * 25 ' 833,76 < px $ 872,24 El peso medio de los paquetes estaria entre 833,76 g y 872.24 g, con una confianza del 95%, 1 i PROBLEMA 12 En un depésito hay 753 bolsas de semillas. Se desea estimar el peso medio de ellas sobre la base de una muestra al azar, de mankra tal, que el error de muestfeo no sea superior a 1,5 Kg con unacon- fianza del 98%, {Cua debefa ser el tamaiio de la muestra si se sabe que los pesos se distribuyen normalmente con desvio estindar 4,8 Ky? SOLUCION De acuerdo con el enunciado del problema, ta poblacién es normal, su tamafio es finito, hay 753 bolsas, y se conoce la varianza (estA el valor del desvio estindar), pot fo tanto la formula auutilizar es: j En este problema se tiene: | O*x= 4,8 3 e=15 : N=753 1-£=0,98 > 1-5 -0.99° => %y=2,326 2,326? -4,87-753__ 1,5? «(753 —1) + 2,326? - 4,8? = 51,668 => n=52 Se necesitan como minimo $2 bolsas de semillas para estimar su peso medio, con un error de muesireo no superior a 1,5 y una confianza del 98%. PROBLEMA 13 Los siguientes datos Corresponden al peso, en gramos, de 25 zapallos, seleccionados al azar. ESTADISTICA~ c, capriglloni PAGINA 87 | Intervalo de con; PESO DE LOS CANTIDAD DE ZAPALLOS ZAPALLOS 400 — 420 420-440 440 - 460 460 - 480 480-500 ola fa fe fo Sabiendo que el peso de Ids zapallos se distribuye normalmente, estimar con una confianza det 99%, el peso medio y la varianza. SOLUCION | Del enunciado se desprendé que la poblacién es normal e infinita. El desvio estandar se calcula con la muestra, por lo tanto, se considera que la varianza poblacional es desconocida, luego, el interva- loes i p{x-t.%

(1-3) -ooes =>) =2,797 reemplazando 277 2 PAORTT cu Asa.a+ 2,707. 20277 J25 | 438,96 < bx < 465,84 Hay que estimar la varianza poblacional 2 2 P f-s"s a-989 oy 15 = 0995 = b~ 45,56 reemplazando 24-577,33 "2,898 El valor del tamafio de muestra inicial es 2-8? 2 935. . ‘Sx ne =~, 2898 235:500_ aa.g90 > mi =45 e? Gi +e). 2? - (500-1) -+2,8987 - 23,5 { Para calcular el iene lor del tamafio de muestra hay que utilizar & GL=m-1=44 5 ‘1-8-0099, 1-5 =0,995 => )=2,692 El valor del segundo tamafio de muestra a Sx-N | 2,692” . 23,5-500 e?-(N-1)+t72-S%x7?- -(500 — 1) +.2,692? -23,5 Para calcular el siguiente valor del tamatio de muestra hey que utilizar = 39307 => m=40 & G.L.=m-1=39 ; |1-8=0,99 5 1-5 = 0,995 > t= 2,708 E] valor del tercer tamafio de muestra 2st N | ty) +S?x-N_ | ___ 27087 -23,5-500 ag 3g 5 y= 40 e? -(N-1)+ts -S?x 2? (500-1) + 2,708? -23,5 Como nz y Ns son iguales, el tamafio de la muestra es n = 40 cuentas. ny = PROBLEMA 15 Deun lote de 200 pilas secas, fabricadas en un turno, se sacé una muestra de 20 pilas para estimar la duracién media, en minutps. De la muestra se obtiene una duracion media de 780 minutos y un desvio estandar de 28 minutos. Admitiendo que la duraci6n tiene una distribucion normal, estimar la duracion media del lote con una confianza del 98%. SOLUCION De acuerdo al enunciado del problema, la poblacién es normal, finita y no se conoce la varianza poblacional, por lo tanto el intervalo es Ss, |N-n Ss PYX-to) Spy SX 4g + 2% { oy a Yue SP Th Los datos de este problema|son: N=200 ; n=20|; Sx=28 ; 780 GL.=20-1=19 ; 1-e=0,98 > (1-$}-200 ty = 2,539 El intervalo es entonces: | PSTOESTION~€. comin | PAGINA 89 los FOOTaD |28_ (200-20 <1, < 780-+2,539- 780 ~ 2,539 + >. {2s 3 V 200-1 ie | 164,88 Ss 0995 => m=2576 el intervalo es: 0,2038 — 2,576 - (me 265 0,1401 <1 < 0,2675 Con una confianza del 99% el porcentaje de manzanas no comerciatizables estaria entre el 14,01% y el 26,75%. i 5 1E <0,2038 + 2,576. PROBLEMA 17 Se desea estudiar el peso de las emillas de lino. Una muestra de 272 semills proporcioné un peso medio por semilla de 0,053 gramos y un desvia esténdar de 0.0011 gramos, Estimar, mediante un intervalo de confianza del qr et peso medio de las semillas de lino. SOLUCION El tamafio de la muestra es suficientemente grande, por lo tanto, por aplicacion del Teorema Cen- tral del Limite, el cocficiente de confianza se obtiene de la distribucion Normal. peice vi a = S, < POX -zo-~ SH, SX+ oA B n=272 x =0,0083 ; Sx=0,001) 1-6-0097 ; 1-5 0/985=> 29 = 2,170 el intervalo es i PAGINA 90 ESTADISTICA — C, Caprigtion! . 2. Intervalo de a 0,0053 — 2,170 G,0011 Hx S$ 0,0053 + 2,170- 0,001 i272 V2 0,00515 < py < 0,00545 El peso medio de las semillns de lino estaria entre 0,00515 gramos y 0,00545 gramos, con una confianza del 97%. ! PROBLEMA 18 | Se realizé un experimento Para estudiar el poder germinativo de ciertas semillas. De las 1943 semi- llas que se sembraron germino el 85%, Estimar, mediante un intervalo de confianza del 96% el porcentaje de semillas con poder germinativo. SOLUCION Se trata de un problema de estimaci6n de la proporcién poblacional de universos infinitos, no se conoce su tamafio, aun cuando Jo solicitado sea en porcentaje. elpiny 24 sts p+te =1-8 En este problema se tiene: =1943 5 p=085 , q= 15 1-8=0,96 3 joo 098 => m= 2,054 el intervalo es: ! - 0,85 - 0,15 0,85 ~2,054- [°° << 085 +2056. | ° > y 1943 0,8334 < TE < 0,866 lel poder germinativo de las semillas estatin entre 83,34% y el 86,66%. Con una confianza del 99%, | PROBLEMA 19 ; Se desea estimar la produccion media diaria de leche, por vaca, cuando son aliméntadas con una dieta especial. Para ello se midié la produccién de 5 vacas de similares caracteristicas, alimentadas con la dieta especial en un dia determinado, obteniéndose los siguientes resultados, en litros. 14,3; 18,1 5 14,2 : 15,2 ; 16,7, Realizar Ia estimaci6n con una confianza de 95%, SOLUCION Notese que no hay informaci6n acerca de la distribucion de la poblacién produccién diaria de leche por vaca y dado que la muestra es chica. hay que utilizar el intervato que surge dela aplicacién de la desigualdad de Tchebych PAX—k- SX “p=030 y q=0,70 entonces, tomando el limite inferior ! (0,30-0,70_ | 0,30 - 29 - 02874 => -m=2,57 8740, Buscando en la tabla de Ja funcion de distribucion normal |, 8 FQ,57)=0,99492 => | 1-7 = 0.99492 => 1-€ = 0,98984 = 0,99 La proporcion de viviendas desocupadas se estima entre‘e! 28,74% yel 31,26% con una confianza del 99%, PROBLEMA 21 | El total de clientes que asiste ‘a un supermercado, un dia lunes es de 2700. El tiempo que tardan en realizar sus compras sigue una distribucién normal, con desvio tipico 15 minutos. Se desea estimar el tiempo meflio que se tarda en realizar las compras, a) {De que tamatio debe ser la muestra si se quiere que el error de muestreo no supere los 5 minu- . Pa@INA 92 i ESTADISTICA — €, Capriglion: 2, Intervato de Confianza tos, con una confianza del 97%? ; b) Con la muestra, cuyo tamtafio fue calculado en el punto anterior.se obtuvo un tiempo medio de 47 minutos. Estimar, con una confianza del 97% e) tiempo medio que tardan los clientes en efec- tuar sus compras, SOLUCION De acuerdo con el enunciad> del problema, la poblacion es normal, su tamafio es finito y se conoce la varianza (esta el valor del desvio estindar), por 0 tanto la formula a utilizar es bone z79-G? .N e2-(N-1)+2%y -0? En este problema se tiene: ox = 15? 3 e 1-6=0,97 = 1-=b0985 3 xm=2,170 3 N= 2700 2,170? - 15? -2700 = 41,74 => m=42 (2700-1) +2,170° “4s? b) Como la poblacion es nor zaes. efx Zo i Datos del problema N= 2700 3 n=42 3 OxHI5 , x =47 1-€=0,97 => 1-5 =0,985 => Za = 2,170 Aunque la fraccion de muestreo sea inferior a 0, 10 igualmente se utilizaré el intervalo para pobla- ciones finitas. El intervalo es entonces: 1s [2700-42 47 -2,170- Suxs47+ : 7 2, faa | 3700-1 Spx <474+2,170 | + 4Bcpxs52 El tiempo medio que tardan Jos clientes del supermercado en efectuar sus compras estaria entre 42 minutos y 52 minutos con una confianza del 97%. PROBLEMA 22 De acuerdo con el resultadg del tltimo.censo, en la ciudad COURIER hay 37904 matrimonios (oficiales 0 no). De éstos selsacé una muestra de 10900 encontrandase que el 38% de la muestra no tienen hijos. Estimar, con una confianza del 97%, el porcentaje de matrimonios sin hijos en la poblacion. 1 SOLUCION | Se trata de un problema de ¢stimacién de ta proporcién poblacional aun cuando lo solicitado sea en porcentaje. Se conove el tamafio del universo, luego ef imervala.a utilizar es fee ep. Zq- a Bet et spen PF eth ae ESTADISTICA ~ C. Caprialiont La denocracia es una forma de gobierno que cada cuatro ailos se cambia de tirano' la Lenin. 2.Intervalo de con, | En este problema se tiene N=37904 ; m=10900 ; p=038 . q=0,62 | 1-8€=097 > J oss => w%=2,170 el intervalo es 10,38 -0,62 aa 37904 — 10900 10,38-0,62 0,62 — STs 0,38 + 2,170.) -—— 0.38 - 2170 ~yo900 37904—1 ™ | 10900 0,3715 < TE < 0,3885 Con una confianza del 97%, la proporcion de matrimonios, oficiales 0 no, con hijos en fa ciudad COURIER estaria entre 0,3715 y 0,3885, O, con una confianza del 97%, la proporcién de matri- monios, oficiales o no, con hijos en la ciudad COURIER estaria entre el 37,15% y el 38,85%, PROBLEMA 23 Los siguientes datos corresponden a una muestra de 390 facturas de ventas tomadas al azar de las 4804 realizadas en el mes. PESOS 800 - 850 850 - 900 900 — 950 950 - 1.000 11000 - 1,050 1,050 - 1.100 1,100 - 1.150 |2s 1/150 - 1,200 li CANTIDAD DE CLIENTES a)Estimar el monto medio por ventas, en el mes, b)Estimar la proporcién de|ventas con monto superior a $1000, Nivel de confianza 95%. SOLUCION Hay que construir un intervglo para el monto medio de las ventas. El universe es finito y el tamafio de la muestra es suficientenjente grande, por lo tanto, por apticacion del Teorema Central del Li- mite, el coeficiente de confianza se obtiene de la distribucién Normal aunque no se conozca la dis- tribucién de la poblacion. = ci-e >. S PIX -z,- x, {x Zoli YNa N=4804 ; n=390 | La media aritmética y el desvio estindar de la muestra se caloulan usando las correspondientes formulas %= 982,31 > Sx=7857,77 => Sx= 88,64 PAGINA 94 ESTADISTICA — C. Caprigiioni 2. Intervalo de Confianza 1-e=095 ; 1-5 = 01975 = zy 1,960 entonces 4804 —390 < Ws 982,31 + 1,96- pasa # 50 4804-1 973,88 < p< 990,74 El monto pramedio de los deudores en cuenta cortiente estaria entre $973,88 y $990,74 con una confianza de! 95%. b) Se trata de un problema de estimacion de la proporcion poblacional de universos finitos ya que se conoce el tamafio del ui verso, luego et intervalo a utilizar es es res En este problema se tiene N=4804 ; =390) El atributo cuya proporci6y se quiere estimar es monto de la venta superior a $1000, La canti- dad de ventas con monto superior a $1000 es 147, luego F=47 => pa 0377 => 9-063 982,31 — 1,96 - 1-8=0,95 ; 1-$ = 0975 2 T= 1,960 et intervalo es 148 10377-0.6a3 0377 - 1,960: 4804 = 390 ap 9.377 + 1,960. eros 0,377 -0,623 ¥ 4804-1 390 0,331 << 0,423 | La proporcién de las ventas con monto superior a $1000 estaria entre el 33,1% y el 42,3% con una confianza del 95%. PROBLEMA 24 | . El costo medio se estimo entre $268,3 y $294,3. Este intervalo fue calculado con una muestra de 16 unidades la que propor 9 una varianza igual a 400. Calcular la confianza de la estimacion -sabiendo que los costos se distribuyen normalmente. SOLUCION La poblaciér-es normal, infinita, pero no se conoce la varianza (el dato del problema es la varianza muestral), luego el intervalg es: ofx-to-$ SM, SX+ty Se}-1- vn vn Para calcular la confianza de la estimacién, dado que ésta es un valor de probabilidad, hay que conocer el valor de ts y con l, mediante el uso de la tabla de la “t” de Student hay que determinar el valor de probabilidad. De acuerdo al enunciado, el intervalo es 268.3 < 1 <.294,3 luego | ESTADISTICA ~ C. Caprigitoni PAGINA 95, 2JIntervalo de confianza | y X4 1 3s = 294,3 vn De cualquiera de las dos expresiones hay que calcalar el valor de ty y con él, en la tabla de la fun- cién de distribucién t de Sthident, se determina el valor de probabilidad. n=16 ; S%x=400 > Sx = 20 La media muestral se calcula haciendo la semisuma de los limites del intervalo X= Boosts Es) _ 283 294,3 entonces, tomando el limitd inferior 281,3 - ty - 2. 2683 > = 2,6 v16 Buscando‘en la tabla de la funcion de distribucion t de Student con'15 grados de libertad =281,3 F@2,6)=0,99 => 1-5 =0,99 => 1-6=0,98 La estimacion fue realizada|con una confianza del 98% PROBLEMA 25 | Se desea estimar la proporcjén de personas adultas que consumen café en el desayuno. {Cual de- bera ser el tamafio de la muéstra nécesaric si se desea que el error de muestreo sea inferior al 2% con una confianza de! 98%7. Mediante una prueba piloto se estimé que la proporcién puede ser del 60%. | SOLUCION | No se cénoce el tamafio del universo, por fo tanto se lo considera infinito, luego, la formula a utili- zar es: En este problema se tiene p-060 =; q= 1-6=0,98 > 1-5 =0,99'=> my =2,326 * : SO = 3246,1656- > n +3247 Se necesita una muestra de 4247 personas para estimar la proporcién de consumidores de café en el desayuno en las condiciones establecidas. PROBLEMA 26 Se tomo al azar una muestra de 5 latas y se determind el contenido en gramos de cada una de ellas, obteniéndose: t | 220 ; 225 ; 240 , 225 . 235 Estimar, con una confianza del 90% el peso medio y la varianza de las latas, sabiendo que el peso de las latas tiene distribuciér normal. SOLUCION Utilizando las formulas corrtspondientes se calculan la media aritmética y fa varianza dela muestra X=229 ; S*x= 67,5 => Sx = 8,216 PAGINA 96 ESTADISTICA — C. Capriglioni / . 2 Intervalo de Confianza La poblacién es normal, infihita y no se conoce la varianza pablacional, luego, el interval de con- fianza para la media es PAX —t)- 5 GbL=4 |; Le-09 = 1-5-0098 => t= 2,132 ' Reemplazando se obtiene | 221,166 GL=4 ; 1-8 =0,90 > 5 70.05 = a=O7ily | 1-5 95 => b=9,49 Reemplazando se obtiene 28,45} <0? < 379,747 El peso medio estaria entre 221,17 gr. y 236,83 gr. y la vatianza estaria entre 28,451 y 379,747 con una confianza del 90%, PROBLEMA 27 Una empresa desea jmplementar un sistema de control de tiempos de realizacion de cierta tarea a fin de disminuir costs. No tiene ningiin tipo de informacion previa respecto a dichos tiem- pos y necesita determinar la(cantidad minima de operarios que deberén ser observados para estimar el tiempo medio en forma permanente. Se ha establecido una confianza del 95% y un error de muestreo no thayor a 1,5 minutos. Pero, para lograr una estimacién de la varianza se selecciond tuna muestra piloto de 5 operarios, obteniéndose los siguientes tiempos (se supone distribucion normal) : 33.4 > 312 5 28.8 ; 29,5 ; 32,1 Determinar el tamafio de mpestra para contral permanente. SOLUCION Hay que utilizar el método {terativo. El tamafio de muestra inicial se caleula con fa formula W)-S72 > . n= 683 e Con los datos de la muestra piloto se calcula ta varianza muestral para iniciar el método iterativo MW =5- 3 Sy= 3,525 L e=15 . G.L.=m-1= 4 3 1e=095 > 1 => h=2,776 entonces, el tamafio de muestra inicial es ny = 2S 28 0m > m=13 1,57 & GL.=n, 2 5) 1e=095 => 1550975 > &=2,179 ESTADISTICA - C. Copriglion! PAGINA 97 | 2 | : 5 ny = 279-3525 _ 7.438 => m=8 15 GL=m-1=7 ; 1e=0,95 = 1-§ =0,975 > b=2,365 | 1 2 5; ny = 7365" 3525 3763 => m=9 1,57 GL=nm-1=8 ; | 16-095 =» 1-5-0975 => &=2,306 Como el tercery el cuarto tamafio de !a muestra son iguales, entonces, el tamafio de muestra nece- sario para el control permanente es n = 9 operarios. PROBLEMA 28 La resistencia de cierto tipo de conductores se distribuye normalmente con un desvio es- tandar igual a 0,003Q. Con una muestra de 20 conductores se estimé la resistencia media entre 0,1437Q.y 0,1463Q. con una confianza de 99%, {Cuantos conductores mas deberian seleccionarse si se quiere reducir la amplitud del intervalo anterior en un 10% manteniendo el mismo nivel de eonfianza? SOLUCION El intervalo calculado correpponde a.un intervalo para la media poblacional de poblaciones norma- {es infinitas ! efx-n Oe cn sX+2,)-5 } wn vn con | n=20 ; Ox =0,003 ; I-e = 0.99 > 1-5 =0.995 => Zo = 2,576 * se calculé el intervalo | 0,1437 s p< 0.1463 luego, la amplitud totales = — = | A= Ls(X) — Li(X) = 0,1463 ~ 0.1437 = 0,0026 y el error de muestreo es enAe Ls(X)~Li(X) _ 0,026 27 2 “| 2 Si se quiere reducir la amplitud del intervalo el 10% entonces habré que multiplicarla por 0,90. La amplitud modificada es = 0,0013 A’=0,90- A = 0,90 - 0,0026 = 0,00234 y el nuevo error de muestreo es PAGINA 98 ESTADISTICA — C. Caprigliont \ 2. Intervalo de Confianza = Ae 000234 _ 6 og 147 2 2 ' por lo tanto, el nuevo tamajio de la muestra es e 2g? 2 2 pis Z 0-8 _ 245767 10,003" _ 43 69 o> nh ad e? 0,001 17? El nuevo tamafio de la mudstra para reducir la amplitud del intervalo en 10% es 44, por lo tan- to, se necesitan 24 conductores mas PROBLEMA 29 De experiencias anteriores, |sesabe, que un empleado calificado, que realiza 4000 registros diarios, comete un 8% de errores. $e desea estimar el porcentaje de errores en un dia determinado. ;De qué tamafio deberd ser la muestra si se quiere que el error de muestreo no supere el 2%, con una confianza del 97% ? SOLUCION De acuerdo con el enunciadh del problema, el universo es finito, son 4000 registros, por lo tanto la formula a utilizar es: 25 .B-q:N ec? -(N-I+z79-p-q En este problema se tiene P=008 ; q-}-p~092 5 e=0,02 124097 > MS =0,985 => 2) =2,170 wo-p-q-N 2,170? - 0,08 -0,92- 4000 =71232 > n=73 N-Dizte pa 0,027 - -(4000 = 1) + 2,1702 - 0,08 -0,92 n= Se necesita una muestra de 713 registros para estimar la proporcién de errores diarios en las con- diciones establecidas. PROBLEMA 30 | En cierta region del pais se estimd, ‘con una muestra de 9740 viviendas, el porcentaje de viviendas desocupadas entre el 28,80% y el 31,20% con una confianza del 99%, ,Cual debera ser el tamafio de la muestra si se quiere reducir la amplitud del intervalo en un 15% manteniendo el mismo nivel de confianza? SOLUCION El intervalo calculado corresponde a un intervalo para la proporcion poblacional de universos infi- nitos con . n=9740 ; 1-6 = 0,99 => ue =0,995 —> z=2,576 se calculé el intervalo ESTADISTICA — C. Caprigiioni PAGINA 99 2.Interval de confianza ' 0,2880 < % <0,3120 luego la estimacién puntual es 9:3120 _ 930 =» q = 0,70 380+ 2 2 luego, la amplitud total es | | A=Ls(X) —Li(X) = 0,3120 - 0,2880 = 0,0240 y el error de muestreo es | go A BHR) =LIG) | 020 _ 4 o19 2 2 2 Si se quiere reducir la amplitud del intervaloe] 15% entonces habra que multiplicarla por 0,85. La amplitud modificada es A‘=0,85 - A =0,85 - 0,0240= 0,0204 1 y el nuevo error de muestreo es At 0,0204 f= ES = 0,0102 2° 2 , por lo tanto, el nuevo tamaijo de la muestra es e’ = 13394,0)153 => mn’ = 13395 El nuevo tamaiio de la muestra para reducir la amplitud del intervalo en 15% es 13395. PROBLEMA 31 | Se desca realizar un estudia con respecto a la eficiencia, medida con un determinado indice, delos 500 empleados de una emptesa. Hay clementos de juicio suficientes para suponer que el indice de eficiencia se distribuye nonnalmente pero no se tiene informacién de la varjanza, por lo tanto se tomé una muestra piloto de|10 empleados obteniéndose un desvio estandar igual a 17. Se ha deci- dido utilizar una muestra. ;Cudl deberd ser el tamafio de la muestra, si se quiere estimar Ia eficien- cia media con una confianzp del 98% y un error de muestreo no superior a 5? SOLUCION ~ El tamafio de la muestra injcial se calcula con la formula t,?-S*x.N ny =-- v Ve? (N= 1) +7) 82x Los datos de este problema son My = 10 ; S’x = 289 : e=5 . N=500 GL=nm-1=9 ; 16-098 => 1-5 =0.99 => t=2,821 E] tamaiio inicial de la muestra es 2 ' ny = E789 500 783 > m= 78 5* 499 +2,8217 - 289 PAGINA 100 ESTADISTICA - C. Caprighioni 2. Intervato de Confianza 1-6 = 0,98 ‘1-5 0.99 ‘> &=2376 G.L.=n, 7; 2,376? - 289-500) 5? .499+2,376? - = 57828 > m= 58 2 & GL=m-1=57 ; | 1-8-6098; 1.5099 => &=2,394 2,394? -289-500 _ = $8,608 => m=59 +499+2,3947 269 G.L.=m-1=58 ; 1-8 =0.98 1 1+ F = 0.99 > ty = 2,392 ___ 2,392? -289- 500) =a z = 58518 => m= 59 5° -499+2,392° - 289 4 Como el tercer y el cuarto tamafio de ia muestra son iguales, entonces, el tamafio de muestra nece- sario para estimar la eficiencia media cn las condiciones fijadas es n= 59 empleados. PROBLEMA 32 El tiempo que tarda|un operario en armar un sistema electronico fue estimado entre 10,8 y 11,2 minutos mediante una muestra de tamafio 25. Calcular la confianza de la estimacién sabiendo que los tiempos se distribuyen normalmente con desvio estandar igual a 0,5 minutos. SOLUCION Se trata de un intervalo de confianza para la media poblacional de poblaciones normales infinitas cuando se conoce la varianza poblacional PX —2,- te %e baie . vn Para caloular la confianza de la estimacién, dado que ésta es un valor de probabilidad, hay que conocer el valor de zo y con{ él, mediante el uso de la tabla de la Funcion de Distribuci6n de la dis- tribucién normal hay que determindr el valor de probabilidad, De acuerdo al enunciado, el intervalo es ' 10,8< p< 11,2 luego zo Ox a XZ -—E = 108 | X4aq-—X = 112 0 Vn Y a in Con cualquiera de las dos expresiones hay que calcutar el valor de #9 . n=25 ; Ox=0,5 | La media muestral, en este caso, se calcula haciendo la semisuma de los limites del intervalo ESTADESTICA - C. Capriglion! PAGINA 101 2.Intervalo de confianza x - HX) +L9(X) sH2_,, 2 "2 entonces, tomando el limite inferior 0,5 1M -Z- =10,8 5 y= 25 . Buscando en la tabla de Ia funcion de distribucion normal F(2)=0,97725 = |l~ ; =097725 = 1-€=0,9545 i La estimacién fue rae con una contianza del 95,45%. PAGINA 102 Clelos™ “es was f4cil que un camello pase por el ojo de una aguja, que un rico entre en el Reino de los Jesus (ate 19:24) 3. PRUEBA DE HIPOTESIS 3.1. INTRODUCCION En este capitulo se ¢studiaré el proceso para decidir si una determinada afirmacién acerca de una poblacién (0 de varias poblaciones) esta sustentada por una evidencia experimental obte- nida a través de una o mas fnuestras extraidas de dichas pobiaciones bajo estudio. En forma general, las afirmaciones se refieren al valor numeético desconocido de los para- metros estadisticos, o formas funcionales desconocidas. Dado que el tipo de muestreo que se uti- liza es el Probabilistico, la decisién — acerca de silos datos muesirales apoyan estadisticamente las afirmaciones correspondientes - se toma basandose en el valor de la probabilidad de cometer erro- res en dicha decisién y consecuentemente, en la accion que se realice. El enfoque de este capitulo, asi como el de! resto del trabajo, seré més intuitivo que tedtico ya que se considera que, desde este punto de vista, el lector puede obtener una mejor idea de los fundamentos de la prueba de hipotesis. 3.2. DEFINICIONES BASICAS . HUIPOTESIS ESTADISTICA = Se llama HIPGTESIS ESTADISTICA a cualquier afirmacién o aseveracién.que se formula acerca de ciciquier caracteristicapo- blacional (ef vaior numérien de un pardmetro, la,forma funcional de una poblavién, etcétera). = HIPOTESIS PARAMETRICA Se ama HIPOTESIS. PARAMETRICA a aquella HIPOTESIS ES- TADISTICA planteada para controlar o verificar el valor numérico de un pardmetra. El resto de este trabajo estara referido a HIPOTESIS PARAMETRICASy, a los efectos de es- te capitulo, se consideran s6lo tres posibles situaciones del valor numérico del parametro, a saber: 1. El valor numérico del parimetro @ es exactamente igual a un determinado valor postulado O» | - 2, El valor numérico del parametro @ es menor a un determinado valor postulado 8) 3. Bl valor numérica del parametro @ es mayor a un determinado valor postulado Oy De acuerdo con la situacion que se trate, 0 sea, de acuerdo al 0 a los posibles valores del parametro, la persona que ha encomendado una tarea estadistica realizara yna determinada accion. = CURSO DE AC Se llama CURSO DE ACCION a la accidn que se levaria a cabo, si se conociése ef verdadero valor det parémetro @. = DESIGUALDAD EQUIVALENTE A LA IGUALDAD | Se Hama DESIGUALDAD EQUIVALENTE A LA IGUALDAD a aquella desigualdad entre el parametro ® y el valor postulado %, que provoca el mismo CURSO DE ACCION que se Hevaria a cabo con la igualdad entre el valor del parémetro @ y el valor postulado Q. | ESTADISTICA — C, Capriglion!! PAGINA 103 3. Prueba de Hipotests " DESIGUALDAD NO EQUIVALENTE A LA IGUALDAD Se llama DESIGUALDAD NO EQUIVALENTE A LAIGUALDAD a aquella desigualdad emre el parémetro @ y ef valor postulado Qo, que, sprovaca to CURSO DE ACCION distinto af que se llevariaa cabo con la igualdad entre el vator del parimetro Qy el valor pos- tulado @o. Ejemplo 3.1 Los paquetes de yerba mate que se producen en Ia empresa yerbatera MATE Y MATE, de acuer- do con una norma, deben tener un peso medio de 1050 g. El proceso de llenado de los paquetes se realiza con una maquina automitica. Si el pesa medio es igual a 1050 g el proceso no se detiene. Siel peso medio de la produccién resultara inferior o superior a 1050 g, se debe detener el proce- 80 y revisarlo. a) {Cuél es el parimetro que se quiere controlar? b) Establezca los cursos de accién a seguir. c) Indique si hay desigualded equivatente «la igualdad. SOLUCION a) El pardmetro que se quiete controlar es la Media Poblacional. b) Los posibles cursos de accién son: Si [1= 1050, entonces, NO SE DETIENE EL PROCESO Si p< 1050, entonces, SE DETIENE EL PROCESO Y SE LO REVISA Si p.> 1050, entonces, SE DETIENE EL PROCESO Y SE LO REVISA ¢) No hay desigualdad equivalente porque ninguna de las desigualdades provoca el mismo curso de accién que la igualdad. Ejemplo 3.2 La proporcién de consumidores de yerba que utilizan la marca MATE Y MATE, de acuerdo con Jas tltimas mediciones, es del 28%. Se imptementé una eampatia publicitaria para tratar de au- mentar dicha proporcién, Si esto se lograse, significaria que la campafia ha dado resultado y se continuaria con ella, caso contrario si la proporeién de consumidores continua siendo del 28% o ha disminuido, la campaiia publicitaria ser suspendida. a) {Cual es el parametro que se quiere controlar? b) Establezca los cursos de accion a seguir. ¢) Indique si hay desigualdad equivalente a le igualdad. SOLUCION a) El parémetro que se quiere controlar es la Proporcién Poblacional. b) Los posibles cursos de accién son: Si =0,28, entonces, NOSE CONTINUA CON LA CAMPANA PUBLICITARIA Si7<0,28, entonces, NOSE CONTINUA CON LA CAMPANA PUBLICITARIA Sit> 0,28, entonces, Si SE CONTINUA CON LA CAMPANA PUBLICITARIA c) La desigualdad menor es|una desigualdad equivatente a la igualdad, porque si el parametro Tt es menor al valor postulddo 0,28 se lleva a caho el mismo curso de accién que si es igual a 0,28. En ambos casos no se{ contintia con la campafia publicitaria. PAGINA 104 ' ESTADESTICA — C. Capriglion!

You might also like