You are on page 1of 310
Cayetano Capriglioni -Estadistica TOMO II EDITORES © 2003 por 3C- EDITORES T.1 -LS.B.N. : 950-797-006-1 T.2 -L.S.B.N. ; 950-797-007-2 0.C. -.S.B.N. : 950-797-005 3 DE ACUERDO A LO ESTABLECIDO POR LA LEY 11.723 ESTE TRABAJO NOSE PODRA REPRODUCIR POR NINGUN METODO. GRAFICO ; ELECTRONIC, © CUALQUIER OTRO, INCLUYENDO SISTEMAS DE FOTOCOPIADO, FOTODUPLICACION, REGISTRO MAGNETOFONICO , ETCETERA. LOS INFRACTORES SERAN REPRIMIDOS CON LAS PENAS DE LOS. ARTICULOS 172 Y CONCORDANTES DEL CODIGO PENAL ( ARTICULOS 2, 9, 10, 71 Y 72 DE LA LEY 11.723). QUEDA HECHO EL DEPOSITO QUE INDICA LA MENCIONADA LEY. 1L INTRODUCCION AL MUESTREO. 1.1. DEFINICIONES BASICAS... : . 11.1.1 UNIVERSO, POBLACION Y MUESTRA 11.1.2, INFERENCIA ESTADISTICA, 1.1.3, MUESTREO. : 11.4, METODOS DE OBTENCION DE MUESTRAS... 1.2. CARACTERISTICAS POBLACIONALES Y MUESTRALES... 1.2.1. PARAMETRO ESTADISTICO. 1.2.2. ESTADIGRAFO Y ESTIMADOR 1.23. ESTIMACION. 11.2.4 DISTRIBUCION DE LOS ESTIMADORES. 1.25, SESGO 1.2.6. ERROR MEDIO CUADRATICO.... 1.3. PROPIEDADES DE LOS BUENOS ESTIMADORES 1.3.1. ESTIMADOR INSESGADO. 1.3.2. CONSISTENCIA.. 1.3.3. EFICIENCIA. 1.34, SUFICIENCIA, 11.4, GRADOS DE LIBERTAD.... 115, ALGUNOS ESTIMADORES IMPORTANT... 41.5.1. MEDIA ARITMETICA MUESTRA. 1.5.2. VARIANZA MUESTRAL 1.5.3. PROPORCION MUESTRAI 154. ESPERANZA Y VARIANZA DE LOS ESTIMADORES. 7 1.6, DISTRIBUCION DE ALGUNOS ESTIMADORES. POBLACIONES NORMALES.. 37 1L6.1 DISTRIBUCION DE LA MEDIA MUESTRAL CUANDO LA VARIANZA POBLACIONAL ES ‘CONOCIDA... 38 1L6.2. DISTRIBUCION DE LA VARIANZA MUESTRAL. Al 1.6.3. DISTRIBUCION DE LA MEDIA ARITMETICA MUESTRAL CUANDO LA VARIANZA POBLACIONAL ES DESCONOCIDA. a2 1.7. DISTRIBUCION DE ALGUNOS ESTIMADORES. POBLACIONES NO NORMALES. 43 1.7.1, DISTRIBUCION DE LA MEDIA MUESTRAL DE POBLACIONES NO NORMALES. [MUESTRAS GRANDES... 7 43 1L7.2. DISTRIBUCION DE LA PROPORCION MUESTRA. — 45 1.8. PROBLEMAS. 2. INTERVALO DE CONFIANZA.. 2.1. DEFINICION.. 2.2, INTERVALOS DE CONFIANZA ADITIVOS : 72.2.4, INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES NORMALES. 2.2.2. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES NO NORMALES. 66 2.2.3. INTERVALO DE CONFIANZA PARA LA PROPORCION DE ELEMENTOS QUE TIENEN LUN DETERMINADO ATRIBUTO EN LA POBLACION 2.3, INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL.. 2.3.1. POBLACION INFINITA. 2.4, TAMAR DE MUESTRA.. 2.4.1. TAMARO DE MUESTRA PARA ESTIMAR EL PARAMETRO MEDIA POBLACIONAL.. 75. 24.2, TAMARIO DE MUESTRA PARA ESTIMAR LA PROPORCION POBLACIONAL. . 2.5. PROBLEMAS. 3. PRUEBA DE HIPOTESIS 3.1. INTRODUCCION .. DEFINICIONES BASICAS..... 3.3, PRUEBA DE HIPOTESIS PARA PARAMETROS ESPECIFICOS DE UNA POBLACION. 3.3.1. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL DE POBLACIONES NORMALES.. 3.3.2. PRUEBA DE HIPOTESIS PARA A MEDIA POBLACIONAL DE POBLACIONES NO NORMALES ws 119 43.3.3, PRUEBA DE HIPOTESIS PARA LA PROPORCION DE ELEMENTOS CON UN DETERMINADO ATRIBUTO 43.3.4, PRUEBA DE HIPOTESIS PARA LA VARIANZA POBLACIONAL DE POBLACIONES NORMALES. 13.4, COMPARACION DE DOS POBLACIONES INDEPENDIENTES A TRAVES OE LOS PARAMETROS. en 27 3.4.1. COMPARACION DE DOS VARIANZAS POBLACIONALES. . 127 3.4.2. COMPARACION DE DOS MEDIAS POBLACIONALES... 130 3.5. COMPARACION DE 00S PROPORCIONES ... 137 3.6. COMPARACION DE LAS MEDIAS DE DOS POBLACIONES NORMALES DEPENDIENTES. 139 3.7. PROBLEMAS. sn 4, ANALISIS DE LA VARIANZA... 4.1. INTRODUCCION 4.2. LOS MODELOS. 4.2.1. NOMENCLATURA y DEFINICIONES... 4.2.2. AS HIPOTESIS corns 4.2.3, EL METODO. 43, MODELO A UN CRITERIO DE CLASIFICACION ‘4.3.1. PRESENTACION DEL MODEL. 14.3.2. FORMULAS DE TRABAJO. : 43.3, PROCEDIMIENTO PARA LA REALIZACION DE LAS PRUEBAS.. ‘4.4, MODELO A DOS CRITERIOS DE CLASIFICACION 4.4.1. PRESENTACION DEL MODELO. 4.4.2. FORMULAS DE TRABAIO evo : 44.3, PROCEDIMIENTO PARA LA REALIZACION DE LAS PRUEBAS. 45. PRUEBAS DE COMPARACIONES MULTIPLES. 4.5.4. PRUEBA DE TUKEY sn 4.5.2, PRUEBA DE DUNNETT. 4.6, PROBLEMAS. 5. PRUEBA DE HOMOGENEIDAD. 5.1. CONCEPTOS GENERALES... 5.2. EL METODO.. : 5.3, INTERVALOS PARA DETECTAR LAS DIFERENCIAS DE A PARES. 5.4. PROBLEMAS... 66. PRUEBA DE INDEPENDENCIA vsernnsnsn 113 122 125 6.1. CONCEPTOS... 6.2. TABLA DE CONTINGENCIA 6.3. METODO... 6.4, COEFICIENTES DE CONTINGENCIA 6.4.1. COEFICIENTE DE CONTINGENCIA DE PEARSON... 6.4.2. COEFICIENTE DE CONTINGENCIA DE TSCHUPROW. 6.4.3, COEFICIENTE DE CONTINGENCIA DE CRAMER. 6.4.4, SIGNIFICATIVIDAD DE LOS COEFICIENTES Ty 6.4.5, PROBLEMAS. 7. ANAUSIS DE REGRESION Y CORRELACION. 7.L.INTRODUCCION 7.2. ANALISIS DE REGRESION ws : 7.2.1. ANAUSIS DE REGRESION LINEAL SIMPLE 7.2.2. ESTIMADORES DE LOS PARAMETROS DE REGRESION 7.2.3. MEDIDAS DE VARIABILIDAD EN LA REGRESION. ns 7.2.4, DISTRIBUCION DE LOS ESTIMADORES DE LA REGRESION... 7.2.5. INTERVALOS DE CONFIANZA. 7.2.6 PRUEBA DE HIPOTESIS PARA LOS PARAMETROS DE LA RECTA DE REGRESION...225 7.3. ANAUISIS DE CORRELACION ENTRE VARIABLES CUANTITATIVAS, 7.3.1. ANAUSIS DE CORRELACION LINEAL SIMPLE. 7.4. PROBLEMAS.. : 8, PRUEBAS NO PARAMETRICAS... 8.1. CONCEPTOS BASICOS.... 8.2. PRUEBADE ALEATORIEDAD. 237 8.3. PRUEBA DE BONDAD DE AJUSTE....... sv sere 240 8.4, PRUEBA BINOMIAL... 243 8.5, PRUEBA DE LOS SIGNOS. 246 8.6, PRUEBA DE SUMA DE RANGOS... 8.7. PRUEBA DE RANGOS CON SIGNO. ' 8.8. PRUEBA DE SUMA DE RANGOS PARA x MUESTRAS ALEATORIAS INDEPENDIENTES 252 18.9. PRUEBA DE SUMA DE RANGOS PARA x MUESTRAS ALEATORIAS ASOCIADAS. 255 £8.10. COEFICIENTE DE CORRELACION DE RANGOS. 257 ‘8.11. PROBLEMAS. ‘9. SERIES CRONOLOGICAS. 9.1. DEFINICION, 9.2. COMPONENTES. '92.1. MOVIMIENTO DE TENDENCIA 9.2.2, MOVIMIENTO ESTACIONAL.. 9.2.3, MOVIMIENTO CICLICO... 9.2.4, COMPONENTE RESIDUAL O ALEATORIA . 19.2.5, INTERVALO DE PREDICCIO 9.3. PROBLEMAS., 10, NUMEROS INDICE 10.1, CONCEPTOS BASICOS 10.1.1. DEFINICIONES, 10.1.2. CLASIFICACION DE LOS NUMEROS INDICES... 10.2. CONSTRUCCION DE NUMEROS [NDICES. 10.2.1. NOMENCLATURA... 10.2.2. INDICES DE PRECIOS. 10.2.3. INDICES DE CANTIDAD. 10.2.4, INDICE DEL VALOR... . : 10.3, METODO PARA LA CONSTRUCCION DE NUMEROS INDICES.. 10.3.1. CONSTRUCCION DEL INDICE DE PRECIOS DE LASPEYRES, 10.4. APLICACIONES worn 10.4.1. DEFLACTACION ESTADISTICA... 10.4.2. CAMBIO DE BASE. 10.4.3. EMPALME DE SERIES DE INDICES. 110.5. PROPIEDADES DE UN BUEN NUMERO NDICE 10.6. PROBLEMAS, BIBLIOGRAFIA CONSULTADA - AGRESTI, ALAN (1990).Categorical Data Analysis. John Wiley & Sons. New York. - AGRESTI, ALAN (1996).An Introduction to Categorical Data Analysis. John Wiley & Sons. New York. - AGRESTI, ALAN (2002).Categorical Data Analysis (2da. Edicién) John Wiley & Sons. New York. - AGRESTI, ALAN (2010).Analysis of Ordinal Categorical Data. (2da. Edicién) John Wiley & Sons. New York. - ANDERSON, D. , SWEENEY, D., WILLIAMS, T. (2004). Métodos Cuantitativos para los negocios. International Thomsom Editores. Méjico - AZORIN POCH, F. (1969). Curso de Muestreo y Aplicaciones. Aguilar, S.A. de Ediciones. Madrid. - BAGUI, S., BHAUMIK, D., MEHRA,K. (2013). A Few Counter Examples Useful in Teaching Central Limits Theorems. The American Statistician. Vol. 67, Nro. 1.,pp 49-56. American Statistical Association - Taylor & Francis Group. Philadelphia - BERENSON, M.L Y LEVINE, D.M. (1991). Estadistica Para Administracién y Economia. Conceptos y Aplicaciones. McGraw-Hill / Interamericana de México. Méjico. BERENSON, M.L, LEVINE, D.M. y KREHBIEL, T. (2001). Estadistica Para Administracion. Pearson - BOX G., HUNTER W., HUNTER J.S. (2002). Estadistica Para Investigadores. (2da. reimpresion). Reverté Ediciones. Méjico. - BUSH, VANNEVAR: As We May Think: The Atlantic. Magazine, July, 1945, Disponible en linea: URL:http:/vww.theatlantic.com/magazine/archive/1945/07/as-we-may-think/3881/ (version en espaol: Revista de Occidente , nro 239, marzo 2001, dedicado a “EI saber en el universo digital” y preparado por José Antonio Millan. Traduccién: Emesto Arbolea). - CAPRIGLIONI, C. (2010). Estadistica. Tomo 1. 3C Editores. Ciudad Autonoma de Buenos Aires. - CANAVOS, G. (1988). Probabilidad y Estadistica. Aplicaciones y Métodos. Mc Graw-Hil / Interamericana. México. - CASELLA, G. Y BERGER, R. (1990). Statistical Inference. Duxbury Press. Belmont. - COCHRAN, W. Y COX,G.M, (1965). Disefios Experimentales, Editorial Trilas. Méjico. - CRAMER.H. (1953). Métodos Mateméticos de la Estadistica. Aguilar, S.A. de Ediciones. Madrid. = CHING CHUN LI, (1969). Introduccién a la Estadistica Experimental. Ediciones Omega, S.A. Barcelona - DAVIES, O. (1966). Métodos Estadisticos aplicados a la Investigacién y a la Producci6n. Aguilar, SA. de Ediciones. Madrid. - De GROOT, M. (1988). Probabiidad y Estadistica. Addison-Wesley Iberoamericana. Méjico. - DEMING, W.E.(1952). Sobre Teoria del Muestreo. Comision de Educacién Estadistica del Instituto Interamericano de Estadistica. Rosario. - DIXON, W. ¥ MASSEY(JR).F. (1970). Introducci6n Al Anéiisis Estadistico. McGraw-Hill. Méjico - DRAPER, N. Y SMITH,H. (1981): Applied Regression Analysis. John Wiley & Sons. New York. - FITZMAURICE, G., DAVIDIAN, M., VERBEKE, G., MOLENBERGHS,G. (2009). Longitudinal Data Analysis. Chapman & Hall / CRC. New York. - FRANSES, P.H.(1999). Time Series Models For Bussines And Economic Forecasting. Cambridge University Press. Cambridge. - FREEMAN, H. (1970). Introduccién a la Inferencia Estadistica. Editorial Trillas. Méjico. - FREUND, J, MILLER, , MILLER, M. (2000). Estadistica Matemética con Aplicaciones. Pearson Educacién. Méjico - GUERRERO GUZMAN, V.M. (2003). Analisis Estadistico de series de tiempo econémicas. International Thomson Editores. Méjico - HAIR, J., ANDERSON, R., TATHAM, R., BLACK,W. (1999). Andlisis Muttivariante. Prentice Hall Iberia. Madrid. -HANKE, J. , WICHWERN, D. (2006). Pronésticos en los Negocios. Pearson Educacién . Méjico. - HARVEY, A. (1996). Forecasting, structural time series models and the Kalman fitter, Cambridge University Press. Cambridge. - HOSMER D.W., LEMESHOW S. (1989). Applied Logistic Regression. John Willey & Sons. New York. - JOHNSON D. (2000).Métodos Muttivariantes Aplicados al Andilsis de Datos. International Thomson Editores. Méjico - JOHNSON, R. ¥ WICHERN, D.(1998) . Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey. - KLEINBAUM, D. Y KUPPER, |. (1978). Applied Regression Analysis and Other Multivariable ‘Methods. Duxbury Press. Belmont. - KREYSZIG, E. (1974). introducci6n a la Estadistica Matemética. Principios y Métodos. Editorial Limusa. Méjico - LEVIN, R. (1988). Estadistica Para Administradores. Prentice-Hall Hispanoamericana, S.A. Méjico. = LIND, D., MARCHAL, W. , MASON, R. (2004). Estadistica para Administraciin y Economia. ‘Alfamega. Méjico. -MC CULLAGH, P. y NELDER, J.A.(1992). Generalized Lineal Models. Chapman & Hall. Londres. - MARONNA, R., MARTIN, D. Y YOHAI,V. (2006). Robust Statistics. Theory and Methods. John Wiley & Sons. Londres. - MEEKER, W., ESCOBAR.L. (1998). Statistical Methods for Reliability Data. John Wiley & Sons. New York. - MEYER, P. (1973). Probabilidad y Aplicaciones Estadisticas. Fondo Educativo Interamericano, S.A. Méjico. - MOLENBERGHS, G. , VERBEKE,G. (2005). Models for Discrete Longitudinal Data. Springer. New York. - MOOD, A. Y GRAYBILL, F. (1969). Introduccién a la Teoria de la Estadistica. Aguilar, S.A. de Ediciones. Madrid. - OSTLE,B (1963). Statistics in Research. The lowa State University Press. Ames. - PARZEN, E. (1971). Teoria Modema de Probabilidades y sus aplicaciones. Editorial Limusa. Méjico. = PAULINO, C., TURKMAN, A., MURTEIRA,B.(2003). Estatistica Bayesiana. Fundacéo Calouste Gulbekian. Lisboa. - PENA D. (2002) . Anélisis de Datos Multivariantes. Mc Graw Hill Interamericana de Espafia. Madrid. -RIOS, S. (1967). Métodos Estadisticos. McGraw-Hill, Madrid - RUIZ-MAYA L., MARTIN PLIEGO F.J., MONTERO J.M., TOME URIZ P. (1995). Analisis estadistico de encuestas: datos cualitativos. Editorial AC. Madrid. - SAMAJA, J. (2004). Parte Ill de Disefio, Proceso y Proyecto. Editorial JVE. Buenos Aires. - SIEGEL, S. Y CASTELLAN, N.J. (2001). Estadistica No Paramétrica. Editorial Trilas. Méjico. - SKRONDAL, A. , RABE-HESKETH, S. (2004). Generalized Latent Variable Modeling. Chapman & Hall / CRC. New York. - SNEDECOR, G. Y COCHRAN, W. (1971). Métodos Estadisticos. C.E.C.S.A. Buenos Aires. - STEEL R. Y TORRIE J. (1988). Bioestadistica . Mc Graw-Hill, Bogoté. - TILLE, Y., LANGEL, M. (2012). Histogram-Based Interpolation of the Lorenz Curve and Gini Index for Grouped Data. The American Statistician. Vol. 66, Nro. 4.,pp 225-231. American Statistical ‘Association - Taylor & Francis Group. Philadelphia - URIEL, E. y ALDAS, J. (2008). Anélisis Multivariante Aplicado. Intemational Thomson Editores Spain. Madrid. - WALPOLE, R. Y MYERS, R. (1992). Probabilidad y Estadistica. McGraw-Hill / Interamericana de México. Méjico. - WALPOLE WALPOLE, R., MYERS, R,, MYERS, S. (1999). Probabilidad y Estadistica para ingenieros. Prentice-Hall Hispanoamericana. Méjico. - WEI, W.W.S. (1994). Time Series Analysis. Addison-Wesley-Publishing Company, Inc. New York. - WISNIEWSKI, P. Y VELASCO SOTOMAYOR,G.(2001). Problemario de Probabilidad. International Thomsom Editores. Méjico = YA-LUN CHOU (1972). Andlisis Estadistico. Nueva Editorial interamericana. Méjico. - YULE, U.G. Y KENDALL M.G. (1954). Introduccién a la Estadistica Matemdtica. Aguilar, S.A. de Ediciones. Madrid 1. INTRODUCCION AL MUESTREO 1.1. DEFINICIONES BASICAS En la tarca estadistica cotidiana, raramente se conocen exactamente cudles son las distin- tas funciones que describen probabilisticamente el comportamiento de la, o las variables, que representan las caracteristicas de aquello que se esta investigando. A veces, de acuerdo a determinadas experiencias, se est en condiciones de suponer algu- nas formas funcionales de las distribuciones de probabilidad. Atin asi, comiinmente se ignoran los valores de los parémetros de dichas distribuciones. Uno de los propésitos de la disciplina Estadistica es poder inferir las distribuciones de probabilidad, sus propiedades y sus pardmetros. Para ello, Ia técnica basica que se utiliza, y de la que en este capitulo se analizarén aspec- tos elementales, es el Muestreo. Por ello, se hace necesario recordar y profundizar algunas de las definiciones que ya fueron formuladas en la parte introduetoria del Andlisis Estadistico desarro- ada en el Tomo 1 de este trabajo. 1.1.1. UNIVERSO, POBLACION Y MUESTRA ‘Se Hama UNIVERSO al conjunto de Unidades Experimentales que po- seen caracteristicas comunes observables, y que se utilizan para obtener informacién sobre un hecho particular. El UNIVERSO queda determinado cuando se definen los objetivos del trabajo que se Ile- vara a cabo, como asi también las UNIDADES EXPERIMENTALES sobre las que se realizardn las observaciones. Se llama POBLACION a cualquier variable particular que se estudia a un UNIVERSO. De acuerdo con esta definicién, se puede colegir que cada UNIVERSO puede generar va- rias POBLACIONES. Una por cada una de las variables cuya medicién sea de interés para alcanzar los objetivos fijados. En otras palabras, al establecer cudles serdn las variables que se observardn en cada una de las UNIDADES EXPERIMENTALES que conforman el UNIVERSO, quedan determi- nadas las distintas POBLACIONES . Se llama CENSO a la medicin, en la totalidad de las UNIDADES EXPE- RIMENTALES que conforman el UNIVERSO, de todas las variables que previamente hayan sido declaradas relevantes, para la investigacién a Uevar a cabo. Lanomenclatura que se utilizard en este trabajo para designar al tamafio del UNIVERSO, 0 al tamafio de la POBLACION, que necesariamente es el mismo, es: N: Tamafio del UNIVERSO 0 tamaiio de la POBLACION (cuando corresponda) Los UNIVERSOS pueden ser finitos o infinitos, dependiendo de la cantidad de elementos que los conforman y, consecuentemente, las POBLACIONES seran finitas 0 infinitas. Ejemplo 1.1 Dadas las siguientes situaciones, identificar a los Universos ya las correspondientes Poblaciones: 1 Como es costumbre, las poblaciones se representan con las tltimas letras del alfabeto latino V; W; X; Y;Z ESTADISTICA ~ C. Capriglioni PAGINA 11 1.Introduccién al Muestreo a) Se desea tener informacién acerca de la rentabilidad de un monte de 2000 plantas de manzanas, para ello, se deberd determinar la cantidad y el peso total de los frutos que tiene cada planta. b) Se desea tener informacién sobre las condiciones de vida de las 380 familias que viven en un determinado barrio de la ciudad, para ello, a cada familia se la consultard acerca de la cantidad de personas que integran el grupo familiar, el ingreso mensual del grupo y el gasto mensual del gru- po en alimentacién. ©) Se desea analizar el comportamiento de las ventas, para ello, de cada factura emitida se regis- trard la cantidad de unidades y el monto correspondiente. 4) Se quieren analizar determinadas caracteristicas de los recién nacidos cuyas madres presentan una determinada patologia, para ello, a cada uno se le medira la talla, el peso y la frecuencia car- diaca, SOLUCION a) El Universo esta formado por la totalidad de plantas de manzanas de! monte. Dado que se co- noce la cantidad total de plantas que contiene el monte (2000 plantas), el Universo es finito. Las variables a estudiar, de acuerdo al objetivo fijado son dos, por lo tanto hay dos poblaciones, a saber: POBLACION 1. X: CANTIDAD DE MANZANAS POR PLANTA. {X/ X20 X € No} POBLACION 2, Y: PESO TOTAL DE LAS MANZANAS DE CADAPLANTA. {¥/Y>0AY € I} +b) El Universo esta formado por la totalidad de familias del barrio. Dado que se conoce la canti- dad de familias que viven en el barrio, el Universo es finito (380 familias). Las variables a estudiar, de acuerdo al objetivo fijado son tres, por lo tanto, hay tres poblaciones, a saber: POBLACION 1. X: CANTIDAD DE PERSONAS QUE INTEGRAN EL GRUPO FAMILIAR. {X/X>0.0 XeN} POBLACION 2. Y: INGRESO MENSUAL DEL GRUPO FAMILIAR. {¥/Y¥>0A¥ € N} POBLACION 3. Z: GASTO MENSUAL DEL GRUPO EN ALIMENTOS. {Z/Z>0AZ€ R} ¢) El Universo esté formado por la totalidad de facturas confeccionadas como consecuencia de las ventas. Dado que no se hace referencia a la cantidad total de facturas existentes, el Universo es considerado infinito. Las variables a estudiar, de acuerdo al objetivo fijado son dos, por lo tanto hay dos poblaciones, a saber: POBLACION I. X: CANTIDAD DE UNIDADES VENDIDAS EN CADA VENTA. {X/X>0.AX € N} POBLACION 2. Y: MONTODECADA VENTA. {¥/¥>OAY €R} 4) El Universo esté formado por la totalidad de personas recién nacidas cuyas madres presentan una determinada patologia. Dado que no sc hace referencia a la cantidad total de nacimientos, el Universo es considerado infinito. Las variables a estudiar, de acuerdo al objetivo fijado son tres, luego, por definicién, hay tres poblaciones, a saber: POBLACION 1. X: PESO DEL RECIEN NACIDO. {X/X>0v X 0 } POBLACION 2. ¥: TALLA DEL RECIEN NACIDO. {Y/¥>0 AY € R} POBLACION 3. Z: FRECUENCIA CARDIACA DEL RECIEN NACIDO. {Z/Z>0AZ € N} Si fuese necesario tener informacién precisa sobre la totalidad de los elementos que for- ‘man el UNIVERSO, entonces se deberia realizar un CENSO. Si el tamafio del UNIVERSO es dema- siado grande, latarea censual resulta muy onerosa y, consecuentemente, impracticable. Por otro lado, la ejecucién de un CENSO es imposible en aquellos casos donde hay que enfrentar a un UNIVERSO infinito, o cuando el proceso de medida o investigacién de las caracteristicas de cada elemento es destructivo. Por estos motivos, hay que utilizar otras técnicas estadisticas alos efec~ tos de obtener datos titiles y confiables, necesarios para tener informacién acerca de la POBLA- CION. PAGINA 12 ESTADISTICA~C. Caprigiion! 1, Introduccién al Muestreo Una de esas técnicas, como se ha dicho, y cuya definicién precisa se brindari mas adelan- te, es el Muestreo, El Muestreo consiste en observar y medir a algunos elementos del universo y con ellos, obtener la informacién necesaria para cumplir con los objetivos fijados para concretar ‘Se llama MUESTRA a un subconjunto o parte de una POBLACION to- ‘mada de forma tal, que con ella se pueda hacer un juicio acerca de esa POBLACION completa. Lanomenclatura que se utilizar en este trabajo para designar al tamafio de la MUESTRA es: n: Tamafio de la MUESTRA. ‘Se llama FRACCION DE MUESTREO al cociente enire el tamaio de Ja MUESTRA y el tamafo de la POBLACION. Fm == N 4.1.2. INFERENCIA ESTADISTICA ‘Uno de los problemas cruciales que debe resolver el Estadistico es la obtencién de infor- macién acerca de una determinada poblacién. Si, por algunas de las razones ya expuestas, no es posible practicar un censo, éste debe recurrir a los datos de una muestra y con ellos realizar las correspondientes afirmaciones. Se Hama INFERENCIA ESTADISTICA a cualquier afirmacion que se realiza sobre una determinada poblacién, basdndose en los datos obte~ nidos con una muestra, pudiéndose obtener, a partir del cdleulo de pro- | babitidad, una determinada medida de la incertidumbre que se genera. Esto significa que se INFIERE la poblacién a partir de la muestra. De esta manera, las con- clusiones a que se llegan, por estar basadas en "ignorancias parciales", producen un cierto grado de duda, el cual podria ser controlado probabilisticamente, si la muestra se toma utilizando méto- dos que garanticen aleatoriedad. 1.1.3. MUESTREO Para obtener una MUESTRA que permita INFERIR adecuadamente la poblacién en estudio, es necesario tener en cuenta algunas reglas y operaciones, las cuales dependerin de los objetivos fijados. Las siguientes definiciones ponen de manifiesto, someramente, algunas de ellas. ‘Se llama MUESTREO al procedimiento mediante el cual se obtienen una 0 més MUESTRAS de una POBLACION dada. ‘Se llama UNIDAD DE MUESTREO a cada unidad experimental, 0 grupo de unidades experimentales, que son tomadas para obtener una | MUESTRA. ‘Se llama DISENO MUESTRAL a un plan de MUESTREO especifico donde se establece cuéles serén los procedimientos a seguir para tomar una o mas MUESTRAS. ESTADISTICA-C. Capriglion! PAGINA 13 LIntroduccién al Muestreo Las unidades experimentales que intervienen en una muestra, pueden ser tomadas con mayor o menor grado de subjetividad por parte del sujeto que se encarga de realizar la muestra. De esta manera, se originan distintos tipos de MUESTREO. Algunos de ellos se detallan en los pargrafos siguientes. 1.1.3.1. MUESTREO PROBABILISTICO Un muestreo es PROBABILISTICO cuando las Unidades Experimentales que componen la muestra son tomadas al azar, pudiéndose calcular a priori, la probabilidad que tiene cada mues- tra y, como consecuencia, cada Unidad Experimental, de ser la obtenida Esto significa que el proceso de obtencién de cada uno de los elementos que integrara la muestra, es un experimento aleatorio. EI MUESTREO PROBABILISTICO es un tipo de muestreo objetivo porque, como la obten- ccién de las Unidades Experimentales es realizada al azar, la inclusién de cada una de ellas en la muestra, no depende del sujeto que se encarga de tomar la muestra, 1.1.3.2. MUESTREO INTENCIONAL Un muestreo es INTENCIONAL., cuando las Unidades Experimentales que componen la ‘muestra son obtenidas siguiendo una regla o norma preestablecida, Esto significa que cada elemento que integrard la muestra, sera “elegido" por el "sujeto” que realiza el trabajo, de acuerdo a un criterio que se fija previamente. EIMUESTREO INTENCIONAL es un tipo de muestreo subjetivo y carece de una base teéri- ca satisfactoria. La representatividad de la muestra depende de la intencién del “sujeto” que toma la muestra, y la composicién de ésta puede estar influenciada por sus preferencias 0 tendencias. 1.1.3.3. MUESTREO SIN NORMA Un muestreo es SIN NORMA cuando, por razones de comodidad, costo, o cualquier otra cireunstancia, la obtencién de las Unidades Experimentales que componen la muestra se realiza sin una norma, o regla o criterio definido. Esto significa que cada elemento que integrard la muestra es elegido por el sujeto, pero sin un criterio fijado. Por tal motivo se considera que la obtencién es cuasi-aleatoria, luego, el mues- treo es cuasi-objetivo. EI MUESTREO SIN NORMA se puede utilizar cuando hay elementos de juicio suficientes ‘como para suponer que la poblacién es homogénea, Si este supuesto es cierto, la representatividad de la muestra puede ser satisfactoria, 1.1.4, METODOS DE OBTENCION DE MUESTRAS En este trabajo se estudiard la aplicacién de los Métodos Estadisticos en el Muestreo Pro- babilistico, por lo tanto, se supone que cada elemento que interviene en la muestra es tomado al azar. Para garantizar que la obtencién de cada uno de ellos sea realmente aleatoria, ¢s conveniente la utilizacién de un bolillero o de una TABLA DE D{GITOS AL AZAR. Una muestra de tamafio n, cuyos elementos se obtienen al azar de una poblacién con fun- ccién de densidad de probabilidad {X), 0 funcién de probabilidad p(X), segiin corresponda, es un conjunto formado por n variables aleatorias que tienen la misma distribucién de probabilidad. MUESTRA: { X4 ; X25 ...;Xn} AX) = JOG) = +++ = J\%) ° AX) = 1X) AX) segiin corresponda, PAGINA14 [ESTADISTICA-C. Caprigion! 1, Introduccién al Muestreo Ejemplo 1.2 En un bosque formado por 500 ejemplares de pinos se desea estudiar el didmetro del tronco al- canzado luego de un determinado tiempo de ser plantado, para ello se decide utilizar una muestra de 20 ejemplares. Se pide, identificar a la poblacién y a la muestra, SOLUCION Poblacién - X: Diémetro del tronco A cada rbol que pertenecerd a la muestra le corresponderé un valor de la variable "Diametro de! tronco". El valor correspondiente al arbol 1, puede ser cualquiera, por lo tanto es variable y, hasta que no haya sido medido, el diametro es desconocido, por lo tanto, es aleatorio. Lo mismo ocurre con el ejemplar 2, el ejemplar 3, etcétera, por lo tanto, la muestra es el conjunto {X15 X23 Xa jn 5 X20} La naturaleza de las Poblaciones que seran objeto del muestreo puede ser de lo més varia- da, Por ejemplo, puede tratarse de una poblacién homogénea o de una poblacién heterogénea; las uunidades experimentales pueden presentarse sisteméticamente con una determinada periodicidad, ‘ pueden estar agrupadas formando conglomerados; eteétera, Estas particularidades que presentan las poblaciones dan origen a los Métodos de obtencién de las muestras que resulten més adecua~ dos, algunos de los cudles se describiran brevemente en los proximos acdpites. 1.1.4.1, MUESTREO SIMPLE AL AZAR (SIN REEMPLAZO) El método MUESTREO SIMPLE AL AZAR (Sin reemplazo) consiste en obtener al azar, unia muestra de n elementos, de entre los N que constituyen el Universo. Hay que tener en cuenta que todas las muestras posibles de tamafio n deben tener la mis- ma probabilidad de ser tomadas, como asi también, que todos los elementos que integrarén la ‘muestra tengan, en el momento de cada extracci6n, la misma probabilidad de ser obtenidas. ‘Considérese, a modo de ejemplo, un Universo finito de tamafio N. Dado que las unidades {que se extraen para la muestra no se reponen, la cantidad de muestras distintas, igualmente posi- bles, de tamafio n que pueden obtenerse de dicho Universo, es una combinacién de N elementos tomados dean. . Cin se puede calcular con el ntimero combinatorio N n Porlo tanto, la probabilidad de que una muestra particular sea la obtenida.es, de acuerdoa la definicién clasica, Esta combit 1 (*) n Sobre la base de esto, por ser equiprobables todas las muestras de tamaiio n, la probabili- dad de que un elemento cualquiera de la poblacién forme parte de la muestra, se puede calcular haciendo N-! Cantidad de muestrasfavorables _ (nz) a ‘Cantidadde muestrasposibles (8) por lo tanto, todos los elementos tienen la misma probabilidad de ser extraidos. ESTADISTICA ~ C. Caprigtloni PAGINA 15, LIntroduccién al Muestreo Si la poblacién es infinita y las variables muestrales son independientes, 1a probabilidad de que una de ellas asuma un determinado valor, es la misma que para cualquier valor que asu- man las otras. Caso contrario, si hay dependencia estadistica, dicha probabilidad dependerd del valor de las que ya fueron obtenidas, En el método de MUESTREO SIMPLE AL AZAR, las Unidades Experimentales son tomadas al azar, cualquiera sea la posicién que ocupen en el universo. Por lo tanto, para que se cumpla la condicién de igualdad de probabilidad para todas ellas, este método deberia ser utilizado sola- mente, cuando se tiene real evidencia de la homogeneidad de la poblacién de la cual se tomara la muestra, Ejemplo 1.3 Dado el Universo del Ejemplo 1.2, si las condiciones del suelo son las mismas en todo el predio que ocupa el bosque, entonces puede suponerse que la poblacién "Didmetro del tronco" es homogénea. Determinar el método de muestreo adecuado para tomar una muestra de tamatio 20. SOLUCION La poblacién es X: Diémetro del tronco Poblacién finita: N= 500 Tamafio de la muestra: n= 20 Bajo el supuesto de homogencidad de la poblacién, cualquiera de los 500 ejemplares puede brin- dar datos similares, por lo tanto, el método de muestreo adecuado es el Muestreo Simple al Azar. 1.1.4.2, MUESTREO ESTRATIFICADO AL AZAR En aquellos casos en los cuales la poblacién presenta una gran variabilidad, o sea, una po- blacién heterogénea, la utilizacién del Muestreo Simple al Azar puede proporcionar muestras no representativas y las conclusiones que surjan del andlisis ellas no seran del todo confiables. Cuando se presentan estas situaciones, el método de muestreo mis adecuado a utilizar es el MUESTREO ESTRATIFICADO AL AZAR. Este método consiste en particionar al Universo en estra- tos (o clases o subpoblaciones), dentro de los cuales sila variable debe presentar homogeneidad. De cada uno de los estratos se obtiene una muestra Simple al Azar, Los simbolos a utilizar en este trabajo son: N: tamaiio del Universo h: cantidad de estratos Nj: tamafio del j-ésimo estrato Se debe cumplir que =n N A Si el tamafio de la muestra es n, y de cada uno de los estratos se toma una muestra de ta- mafio nj, entonces se debe cumplir que: Una cuestién importante a resolver es cuanto del total n deberd asignarse a cada uno de os estratos. La asignacién del tamaiio de la muestra a cada uno de los distintos estratos se llama AFI- JACION, y puede realizarse de alguna de las siguientes formas: a. Afijacién igual o uniforme: El tamafio de muestra que le corresponde a cada es- PAGINA 16 ESTADISTICA~C. Caprigiton! 1, Introduccién al Muestreo trato es igual para todos. Este tamaiio se calcula, entonces, haciendo el cociente entre el tamafio de la muestra, n, y la cantidad de estratos, h. nm =n , Afijacién proporcional: El tamaio de la muestra que le corresponde a cada strato es proporcional al tamaiio del estrato. Se calcula haciendo el producto centre la fraecién de muestreo y el tamatio de cada estrato. a =2.N, n= Nn ny =2-Ny jn = N c. Afijacién Optima: El tamafio de la muestra para cada estrato es proporcional al tamaiio del estrato y al desvio estindar correspondiente. De esta manera se tiene en cuenta la falta de homogeneidad entre las subpoblaciones. 1-Nn On Ejemplo 1.4 En una ciudad de 28000 hogares se desea estudiar, utilizando una muestra de 210 hogares, el ni- vel de ingreso por cada hogar. Investigaciones previas permitieron comprobar que, en dicha ciu- dad, en general, las personas tienden a vivir en barrios con otras personas cuyos niveles de ingre- so son similares. Se detectaron cuatro barrios, a saber: Norte (barrio 1), con 12000 hogares; Sur (barrio 2), con 8000 hogares; Este (barrio 3), con 1600 hogares y Oeste (barrio 4), con 6400 hogares. También se ha detectado que la variabilidad de los ingresos dentro de cada uno de los barrios es casi la misma. Determinar el Método de Muestreo mas adecuado para seleccionar la muestra, SOLUCION La poblacién es, X : Nivel de ingreso ‘Tamatio del Universo : N = 28000 Tamafio de la muestra : n= 210 Dado que las personas estin agrupadas en barrios dentro de los cuales las familias presentan ca- racteristicas similares y casi no hay variabilidad entre las ingresos, el método de muestreo mas adecuado es el Método Estratificado al Azar, con afijacién proporcional, donde cada barrio puede considerarse un estrato. Los tamatios de cada estrato son, entonces Ni= 12000 ; N2=8000 ; Ns=1600 ; Ng 6400 El tamaiio de la muestra proporcional para cada estrato se calcula haciendo n 210 a 210 ny =S-N) = 12000290; np = Ny = 8000 = 60 TN 28000 2 WN? 28000 _n 210 210 N3 =——.1600=12; ——- 6400 = 48 28000 28000 Los tamafios de muestra para cada estrato, utilizando afijacién proporcional, son: y= 90 | m= 60 ; my=12 ; y= 48 ESTADISTICA C, Caprigion! PAGINA 17 1. Introduccién al Muestreo 1.1.4.3. MUESTREO POR CONGLOMERADOS POLIETAPICO Cuando se toman muestras, utilizando el método de Muestreo Simple al Azar oel método de Muestreo Estratificado al Azar, las unidades de muestreo coinciden con las unidades experi- mentales. El método que se presenta en este parégrafo, es un caso mAs general que tiene como particularidad, que la unidad de muestreo est formada por un grupo de unidades experimentales. El método de MUESTREO POR CONGLOMERADOS POLIETAPICO consiste en agrupat los elementos que conforman el Universo en conglomerados, de modo tal que entre ellos haya la su- ficiente homogeneidad, como para representar a la poblacién. El proceso de obtencién de la muestra se hace sobre la base de estos conglomerados, que constituyen las unidades de muestreo, y no sobre la base de las unidades fisicas, con excepcién de Ja dltima etapa. Este método es adecuado para utilizarlo cuando las unidades experimentales, naturalmen- te, estin agrupadas en conglomerados y cada una de ellas puede ser, a su vez, considerada como unidad de muestreo. Generalmente los conglomerados son superficies o reas en que se ha dividido el ambito ‘ocupado por el Universo. Siesauna etapa, se toma una muestra simple al azar de conglomerados, y en cada uno de ellos se miden todos los elementos que constituyen el conglomerado. Si se trata de dos etapas de muestreo o bietApico, se toma una muestra simple al azar de conglomerados (primera etapa de muestreo), y de cada uno de estos conglomerados, se toma una muestra de unidades experimentales (segunda etapa de muestreo). Si se trata de tres etapas de muestreo o trietapico, primero se constituyen los conglomera- dos y, dentro de cada uno de ellos se forman los subconglomerados, luego, se toma una muestra simple al azar de conglomerados (primera etapa de muestreo), de cada uno de ellos una muestra simple al azar de subconglomerados (segunda etapa de muestreo) y, por tiltimo, de cada subcon- glomerado una muestra simple al azar de unidades fisicas (tercera etapa de muestreo). Este procedimiento, puede generalizarse obteniéndose un muestreo con varias etapas 0 Muestreo Polietipicos. Ejemplo 1.5 Se desea estudiar, mediante el uso del muestreo, el coeficiente intelectual de los alunos que cursan el séptimo grado del nivel primario en todo el pais. Investigaciones previas permiten su- poner que hay homogeneidad entre los coeficientes intelectuales. Describir el procedimiento para aplicar el Método de Muestreo por Conglomerado Polietépico, hasta tres etapas de muestreo. SOLUCION - Una etapa de muestreo Cada provincia se considera un conglomerado. Se toma una muestra de provincias, y se mide el Coeficiente intelectual a cada uno de los alumnos de séptimo grado, que cursan en las escuelas de las provincias que pertenecen a la muestra. ~ Dos etapas de muestreo Cada provincia se considera un conglomerado, y cada departamento provincial, un subconglome- rado. Se toma una muestra de provincias (primera etapa de muestreo). De cada una de las provin- cias que pertenecen a la muestra, se toma una muestra de departamentos (segunda etapa de mues- treo). Se mide el coeficiente intelectual a cada uno de los alumnos de séptimo grado que cursan en las escuelas de los partidos o departamentos que pertenecen a la muestra, ~ Tres etapas de muestreo Cada provincia se considera un conglomerado; cada departamento provincial un subconglomera- do y cada escuela un sub-subconglomerado, Se toma una muestra de provincias (primera etapa de muestreo). De cada una de las provincias que pertenecen a la muestra, se toma una muestra de Laesperanza matemdtica de la MEDIA MUESTRAL siempre es la MEDIA POBLACIONAL. EX) =p Por lo tanto, la MEDIA MUESTRAL es un estimador INSESGADO de la MEDIA POBLACIO- NAL > Lavarianza de la MEDIA MUESTRAL de universos infinitos es 2 vi)= n Por lo tanto, si el universo es infinito, la MEDIA MUESTRAL es un estimador CONSISTEN- TE de la MEDIA POBLACIONAL > Lavarianza de la MEDIA MUESTRAL de universos finitos es Por lo tanto, si el universo es finito, la MEDIA MUESTRAL es un estimador CONSISTENTE de la MEDIA POBLACIONAL. Estas demostraciones estén fuera del alcance de este trabajo. No obstante, se puede verifi- car empiricamente con los datos de los Ejemplos 1.7 y 1.11 que: Hx = 24,5 y E(X) = 24,5 entonces E(X)=px 9,25 (: ‘) eer 2 entonces VOX s(n) n \N-1 X= 65,25 ; V(X) = 5,59 y V(X) = 1.5.4.2. PROPORCION MUESTRAL Aplicando las propiedades de la esperanza matemiética y la varianza de la suma de varia- bles aleatorias independientes, se puede demostrar que: > Laesperanza matematica de la PROPORCION MUESTRAL siempre es la PROPORCION POBLACIONAL E@)=" Por lo tanto la PROPORCION MUESTRAL es un estimador INSESGADO de la PROPORCION POBLACIONAL > La varianza de la PROPORCION MUESTRAL de universos infinitos es n(I-n) v@- Por lo tanto, si el universo es infinito, la PROPORCION MUESTRAL es un estimador CON- SISTENTE de la PROPORCION POBLACIONAL > La varianza de la PROPORCION MUESTRAL de universos finitos es PAGINA 36 ESTADISTICA~C. Capriglion! 1. Introduccic al Muestreo Por lo tanto, si el universo es finito, la PROPORCION MUESTRAL es un estimador CON- SISTENTE de la PROPORCION POBLACIONAL Estas demostraciones estén fuera del alcance de este trabajo, no obstante, se puede verifi- car empiricamente, con los datos de los Ejemplos 1.7 y 1.11, que %=0,625 y E(p) = 0,625 entonces E(p) = = 0,625-(1-0,625) (=) V(p)=0,0201 y V(p) = (P) yW(Pp) 5 =a ,0201 entonces V(B) = Heat) 1.5.4.3. VARIANZA MUESTRAL Se puede demostrar que: > Laesperanza matemdtica de la VARIANZA MUESTRAL, en universos infinitos, siempre es Ja VARIANZA POBLACIONAL Es) =o Por lo tanto la VARIANZA MUESTRAL es un estimador INSESGADO de la VARIANZA PO- BLACIONAL > La varianza de la VARIANZA MUESTRAL de universos infinitos es 2 ° V(SZ)= (S3)= Las demostraciones analiticas estén fuera del alcance de este trabajo. La comprobacién. empirica no se puede realizar dado que el universo utilizado en los Ejemplos 1.7 y 1.11 es finito. 1.6. DISTRIBUCION DE ALGUNOS ESTIMADORES. POBLA- CIONES NORMALES. Para estudiar la distribucién de los estimadores es necesario recordar las siguientes defini- ciones: © Lasuma del cuadrado V variables normales estandarizadas independientes tiene distribu- ci6n ji-cuadrado con V grados de libertad. Zi~No (0;1) i=1,V independientes S72 227i ~ Xvew fl * Elcociente entre una variable normal estandarizada y la raiz cuadrada de una variable ji-cuadrada con V grados de libertad, dividida por V, tiene distribucién t de Student con V grados de libertad. Sean Z~NOGI) y X~Xver entonces ESTADISTICA ~ C. Capriglioni PAGINA37 L Introd. al Muestreo ‘© Elcociente entre una variables ji-cuadrado con V; grados de libertad, dividida por Vs, y otra variable ji-euadrado pero con V2 grados de libertad, dividida por Va, tiene distribu- cién F de Snedecor con V; grados de libertad en el numerador y Ve grados de libertad en el denominador. Sean Mi ~Xv,eu Y X2~Xvyew entonces: M vy —t ~ Fis) ry V2 1.6.1. DISTRIBUCION DE LA MEDIA MUESTRAL CUANDO LA VA- RIANZA POBLACIONAL ES CONOCIDA En este punto se establecerd, utilizando definiciones y propiedades estudiados en secci nes anteriores, la distribucién de la media aritmética muestral correspondiente a muestras toma- das de poblaciones con distribucién normal cuando la varianza poblacional es conocida, Sea una poblacién X cuya distribucién es normal con Esperanza Matematica, o Media Poblacional, 1x y varianza poblacional 6X yoca DG AX i oe Xa una muestra aleatoria de tamaiio n proveniente de dicha poblacién. Elestimador MEDIA ARITMETICA MUESTRAL, por estar originado en una sumaa de variables normales, es una combinacién lineal de variables aleatorias normales, por lo tanto, también tiene distribucién normal. n = LX X= ~No® n Como ya se ha estudiado en el punto anterior, la ESPERANZA MATEMATICA de la media aritmética muestral es: E(X)=n y la VARIANZA de la media aritmética muestral, sila poblacién es FINITA, es: ve) 5() y la VARIANZA de la media aritmética muestral, si la poblacién es INFINITA, eS: v= por lo tanto, la VARIABLE ESTANDARIZADA, 0 ESTAD{GRAFO DE TRANSFORMACION de la me- dia aritmética muestral, para POBLACIONES FINITAS ¢s: 8 Ver Estadistica — Tomo 1 C. Capriglioni. Capitulo 6. PAGINA 38 ESTADISTICA™C. Capriglion! 1. Introduccién al Muestreo y para POBLACIONES INFINITAS es: Este ultimo estadigrafo, para algunas demostraciones que se haran en secciones posterio- res, también puede se escrito como: z= fk) o Esto significa que, para el cdlculo de probabilidad, y para toda la tarea inferencial donde se utilice la media aritmética muestral, de muestras obtenidas de poblaciones normales cuya varianza sea conocida, hay que utilizar la distribucién Normal Estandarizada. ‘Se recuerda que la FRACCION DE MUESTREO ¢s el cociente entre el tamafio de la muestra y el tamajio de la poblacién. Fm == N y mide la proporcién del tamafio de la muestra con respecto al tamafio de la poblacién. Si el tamafio del universo tiende a infinito, entonces el factor (=) tiende a 1. Noo (ER) No A\los fines précticos, si el tamafio de la muestra es, alo sumo el diez por ciento del tama- fio de la poblacién, o sea, si la FRACCION DE MUESTREO es menor o igual a 0,10, la poblacién storeresintes N- . j puede considerarse infinita y, consecuentemente, el sao (1 *) se puede considerar que tien- deal. Si Fm <0,102N30 =( entonces Zz -s_ [Nan An ¥N-1 Ejemplo 1.12 {Cual es la probabilidad de que la media de una muestra de tamafio 25 esté entre 397 y 401, si proviene de una poblacién normal con media 400 y varianza 100 ? SOLUCION Si la poblacién es normal la media de la muestra tiene distribucién normal con 2 EX)=» ; v&k)=- (i= i ESTADISTICA - C. Capriglion! PAGINA 39 LIntroduccién al Muestreo por ser combinacién lineal de variables aleatorias normales. 2 X-to [i] AS ~No (051) In El célculo de probabilidad, entonces, se realiza utilizando la distribucién normal p =400 ; o7=100 > o=10 n=25 w5 ) = Pwo(-1,5 <$Z<0,5/0;1) = s dn Pre(397 3950) = j...? La variable estandarizada es 5 n=25 PAGINA 40 ESTADISTICA~C. Capriglion! 1, Introduccién al Muestreo Fe ° Po (X>3950 / = 3847; No ( Wi al 45,2469) = P(Z > 2,28/0; 1)= =1-F(2,28) La probabilidad de que la media de la muestra sea superior a 3950 es 0,0113. 1.6.2. DISTRIBUCION DE LA VARIANZA MUESTRAL En este punto se establecera, utilizando definiciones y propiedades estudiados en seccio- nes anteriores, la distribucién de la varianza muestral comespondiente a muestras tomadas de po- blaciones con distribucién normal ©, Sean tuna poblacién X cuya distribucién es normal con esperanza matematica o media poblacional jt y varianza poblacional o”, sea {X15 Xa5 oe § Xn} una muestra aleatoria de tamatio n proveniente de dicha poblacién, sea x2 0G = XY la suma del cuadrado de las desviaciones con respecto a la media aritmética mues- y sea, n a Bo -x) $3-H n=l Ja varianza muestral de dicha muestra. entonces, el estadigrafo n D%G-w* ‘ tiene distribucién ji-cuadrado con n G.L. (grados de libertad) por ser la suma del cuadra- do de n variables normales independientes, Elestadigrafo 9 Las demostraciones estén fuera del alcance de este trabajo ESTADISTICA C. Capriglion! PAGINA 41 LIntroduccién al Muestreo tiene distribucién ji-cuadrado con 1 G.L. por ser el cuadrado de una variable con distri- bucién normal, luego, su diferencia X,-XP LY-w? os y : 2 ' & ° es un estadigrafo que tiene distribucién ji-cuadrado con (n - 1) G.L. a = De%-X? HL Yona au 3 Si en el numerador de este estadigrafo se multiplica y divide por los grados de libertad se tiene el ESTADIGRAFO DE TRANSFORMACION de la varianza muestral Or)-8 ye a * Kone o Esto significa que, para el cdlculo de probabilidad, y para toda la tarea inferencial referida ala varianza muestral, de muestras obtenidas de poblaciones normales, hay que utilizar la distri- bucién ji-cuadrado con (N-1) G.L.. 1.6.3. DISTRIBUCION DE LA MEDIA ARITMETICA MUESTRAL CUAN- DO LA VARIANZA POBLACIONAL ES DESCONOCIDA En la mayoria de los trabajos donde hay que aplicar la inferencia estadistica, el valor dela varianza poblacional 6” es desconocido, por lo tanto, cuando esto ocurre, se hace necesario obte- ner una distribucién de probabilidad para la media aritmética muestral que contemple esta situa- cién. Elcociente entre una variable normal estandarizada y la raiz.cuadrada de una variable ji cuadrado divida por sus correspondientes grados de libertad, es una variable aleatoria cuya distri- bucién de probabilidad se llama “t” de Student y tiene como parimetro matemitico los grados de libertad de la ji-cuadrado empleada.{10”. Sea una poblacién X cuya distribucién es normal con esperanza matematica o media po- blacional py varianza poblacional 0”, sea {X13 Xap a 3 Xa} ‘una muestra aleatoria de tamafio n proveniente de dicha poblacién, sea >, Xo n la media muestral de dicha muestra, y-sea n 2 DG -%) s2 = x n-1 10 Las demostraciones estén fuera del alcance de este trabajo PAGINA 42 ESTADISTICA~C. Caprigiton! 1, Introduccién al Muestreo Ja varianza muestral de dicha muestra. Entonces el cociente entre n-1 es el ESTAD{GRAFO DE TRANSFORMACION para la media muestral de poblaciones infinitas cuando no se conoce la varianza poblacional y en su lugar hay que utilizar una estimacion de ella X-n s an Esie estadigrafo tiene distribucién t de Student con (n-1) grados de libertad por ser el cociente entre una variable con distribucién normal y la raiz cuadrada de una variable con distri- bucién ji-cuadrado dividida por sus correspondientes grados de libertad. X-p = ae mw tnnen LE vn Bajo condiciones especiales, si la poblacién es finita, el estadigrafo el ESTADIGRAFO DE ‘TRANSFORMACION para la media muestral es 5 Jan Esto significa que, para el célculo de probabilidad, y para toda la tarea inferencial referida ala media muestral, de muestras obtenidas de poblaciones normales, cuya varianza sea descono- cida, hay que utilizar la distribucién t de Student. 1.7. DISTRIBUCION DE ALGUNOS ESTIMADORES. POBLA- CIONES NO NORMALES. 4.7.1, DISTRIBUCION DE LA MEDIA MUESTRAL DE POBLACIONES NO NORMALES. MUESTRAS GRANDES. ‘Ya se ha estudiado que, por el Teorema Central del Limite (TCL), la variable estandariza- da de la suma de n variables aleatorias independientes a oR tiene distribucién asint6ticamente normal cuando la cantidad de sumandos tiende a infinito, cual- quiera que sea la distribucién de las variables que se suman. ESTADISTICA ~ C. Capriglion! PAGINA 43 LIntroduccién al Muestreo Sea {X5%, una muestra de tamafio n. yssea =I n Ja media muestral de dicha muestra. Multiplicando y dividiendo, en (1) por n se obtiene un estadigrafo de transformacién para la media muestral. X= xl id Z= || Jn Cuando el tamaiio de la muestra tiende a infinito, por aplicacién del Teorema Central del Limite, el estadigrafo de transformacién tiende asintdticamente ala distribucién Normal Estanda- rizada. X- now => Z= = Noo: an Esto significa que, para el célculo de probabilidad, y para toda la tarea inferencial referida ala media muestral, de muestras obtenidas de poblaciones no Normales, hay que utilizar la distri- bucién Normal Estandarizada. Eneeste trabajo se considera que el tamaiio de la muestra tiende a infinito cuando n > 30 Ejemplo 1.14 {Cual es la probabilidad de que la media de una muestra de tamafio 100 sea superior a 1238, si proviene de una poblacién con media 1194 y desvio tipico 305? SOLUCION No se conoce la distribucién de 1a poblacién, pero el tamafio de la muestra es suficientemente grande (n>30), entonces, por aplicacién del Teorema Central del Limite, el estadigrafo X-4 o vn tiene distribucién asintéticamente Normal Estandarizada, cualquiera fuese la distribucién de la poblacién, por lo tanto, el célculo de probabilidad se realiza con la distribucién normal. n=1194 ; o=305 ; n=100 P(X > 1238) =4...? X=p_ 1238-1194 _ Z Sa = 1,44 Jn A100 Pwo X>1238 / p= 119: 0,5) = Pro(Z > 1,44/0;1)= =I - F(1,44) = 0,07493 PAGINA 44 ESTADISTICA~C. Caprigiton! 1. Introduccion al Muestreo ist me * 1a La probabilidad de que la media de la muestra supere 1238 es de 0,07493, 1.7.2. DISTRIBUCION DE LA PROPORCION MUESTRAL ‘Sea una muestra aleatoria de tamafio n, tomada de un universo infinito {X13 X25 5 Xn} yuna variable aleatoria, ¥ , que representa la cantidad de elementos que s{ poseen un determina- do atributo, dentro de la muestra de tamafio n, y sea, =_i P n a proporcién de elementos con un determinado atributo en la muestra de tamaiio n, entonces, si el tamafio de la muestra es suficientemente grande, el ESTADIGRAFO DE TRANSFORMACION para la proporeién muestral de universos infinitos es z= fr-o-®) n y tiene distribuci6n asintoticamente normal estandarizada, dado que la variable ¥ tiene distribu- cin binomial con esperanza matematica E(F )=n- 7% y varianza V(F)=n- 1 - (1-0) Si el universo es finito, bajo determinadas condiciones, e] ESTADIGRAFO DE TRANS- FORMACION para la proporcién muestral de universos finitos es Z= P y también tiene distribucién asintéticamente normal estandarizada. Esto significa que, para el célculo de probabilidad, y para toda la tarea inferencial referida a la proporcién muestral, hay que utilizar la distribucién Normal Estandarizada. Ejemplo 1.14 Se sacé una muestra de tamafio 2500 de una poblacién que tiene un 55% de elementos con un determinado atributo. {Cul es la probabilidad de que la proporcién de la muestra sea inferior a 0,53? SOLUCION ¥ : cantidad de elementos con un determinado atributo en una muestra de tamafio n, pro- veniente de una poblacién con proporcién ™. n=2500 ; m=0,55 ; (1-m)=0,45 P(p <0,53) =4...? 11 Ver Estadistica — Tomo 1 C. Capriglion. ESTADISTICA ~C. Capritioni PAGINA 45 1. Introduccin al Muestreo 0,53-0,55 10,55 + 0,45, 2500 0,02222 La probabilidad de que la proporcién de la muestra sea inferior a 0,53 es de 0,022 Ejemplo 1.15 En una poblacién de 8340 elementos hay 2919 que tienen cierto atributo. Se saca una muestra de 950 elementos. ,Cual es la probabilidad de que la proporcién de elementos con atributo de la muestra sea inferior a 0,33 ? SOLUCION El tamafio de la poblacién es conocido, por lo tanto se trata de una poblacién finita. N= 8340 3 R=2919 PCF <0,33) =,...? La variable estandarizada es n=950 0,33-0,35 950 Puo( F< 0,33 /1= 0,35; r=) =0,0146) = = P(Z<-1,37) = F(-1,37) = 0,0853 8340-1 03508 3 17 Zz La probabilidad de que la proporcién de la muestra sea inferior al 33% es de 0,0853. PAGINA 46 ESTADISTICA~C. Capriglion! 1, Introduccién al Muestreo 1.8. PROBLEMAS PROBLEMA 1 La resistencia a la rotura de ciertos cables de acero producidos por una empresa es una variable aleatoria distribuida normalmente con media 15800 kg./m. Y desvio tipico 2600 kg/m. {Cual es la probabilidad de que una muestra de 16 cables de la misma longitud, proporcione una media superior a 17360 kg/m? SOLUCION p= 15800 ; o=2600 ; n=16 P(X > 17360) = X-p _ 17360-15800 “e260 4 dn ie Pyo(X > 17360 / p= 15800 ; -& = 650) = Pyo(Z > 2,4) = vn =1-F(2,4) = 1 - 0,9918 = 0,0082 La probabilidad de que la resistencia media de una muestra de 16 cables supere a 17600 kg./m es 0,0082. PROBLEMA 2 Se sabe que en un lote de 700 lépices hay un 5% que presentan defectos de fabricacién {Cual es a probabilidad de que en una muestra de 80 lépices provenientes de dicho lote se encuentren alo sumo 5 lépices con defectos? SOLUCION N=700 3 m=005 5 n=80 Calcule la probabilidad de encontrar a lo sumo cinco lépices defectuosos (7 <5) en una muestra de ochenta lépices equivale a calcular la probabilidad de que la proporcién muestral P sea inferior a £ => =0,0625 n 80 P(p <0,0625) =<... ESTADISTICA — C. Caprigiloni PAGINA 47 1.Introduccién al Muestreo Puol F <0,0625 / = 0,05; fe = (en) =0,02295) = =P(Z < 0,54/ 031) = F(0,54) = 0,7054 La probabilidad de encontrar a lo sumo 5 lépices defectuosos en la muestra es 0,7054. PROBLEMA 3 ‘Una empresa tiene 478 clientes. En promedio, cada uno, compra mensualmente por valor de $ 935.460, con un desvio tipico de $ 38.274. {Cual es la probabilidad de que el promedio de una muestra de 70 clientes esté entre $ 930.000 y 940.000? SOLUCION N=478 ; n=70 5 = 935.460; = 38.274 (930.000 < X <940,000)=;..2 X= o [N-n Ja VN 4 _40000=935460__ 9g 38274 feemt To Wa78-1 Pyio (930000 < X < 940000 / p= 935460; x = 4230,83) = = P(-1,29 < Z < 1,07) = F(1,07) - F(-1,29) = 0,85769 - 0,09853 = 0,75916 La probabilidad de que la media de la muestra esté entre $ 930.000 y $ 940.000 es 0,75916. PAGINA 48, ESTADISTICA~C. Caprigiton! 1, Introduccién al Muestreo PROBLEMA 4 E1 25% de los clientes que desean renovar su crédito, en cierta financiera, no requiere codeudor en razén de sus antecedentes. Se sacé una muestra de 160 solicitudes de renovacién, {cul es la probabilidad de que la proporcién de clientes que no necesitan codeudor esté entre el 20% y el 28%? SOLUCION n=160 ; ™=0,25 ; (1-m)=0,75 P(0,20< p <0,28) =j...? Pyo(0,20 < p< 0,28) /m=0,25 ; i = (-1,46< Z < 0,88)= F(0,88) - F(-1,46) = 0,81057 - 0,07215 = 0,73842 0,0342) = La probabilidad de que la proporcién de clientes que no necesitan codeudor esté entre 20% y 28% es de 0,73842. PROBLEMA 5 ‘Se sabe que las ventas efectuadas por una empresa tiene distribucion normal con media $343.200 y desvio tipico $48.152. De las ventas realizadas en el mes, se saca una muestra de 16 facturas. )zCuél es la probabilidad de que la media de la muestra difiera de la media poblacional en mas de $20,000? +b) Cual es el valor de la media muestral que sera superado con probabilidad 0,05? SOLUCION p= 343.200 : = 48.152 3 n=16 2) Pno ([X—n >20.000) = zenut as dn 323200-343200 363200- 343200 m= Saray 0s 2 = ga 4 4 ° Pro ([K—n) >20.000 / y= 343200 ; aia 2038) = ESTADISTICA~ C. Caprigtton! PAGINA 49 L Introduccién al Muestreo = 1- Pwo (323200 < X < 363200 / p= 343200 ; - 12038) = In = 1 - Pro (-1,66 X 0) =0,05 => Pro (X 29= 1,645 Sabiendo que zaXrk as vn entonces = ° X=p+Z-— eth por lo tanto X = 343200 + 1,645- s2 = 363002,51 ose cs Fase x z ea El valor de la media muestral que sera superado, con probabilidad 0,05 es de $ 363.002,51 PROBLEMA 6 La antigiiedad media de los deudores por ventas de una empresa es 75 dias con un desvio estindar de 15 dias. Se toman al azar 90 fichas. {Cul es la probabilidad de que la media de la muestra sea inferior a 72 dias? SOLUCION PAGINA 50 ESTADISTICA-C. Caprigtton! 1. Introduccién af Muestreo = F(-1,90) = 0,02872 T 5 % —. ._TCTrCOOON La probabilidad de que la media de la muestra sea inferior a 72 dias es de 0,02872. PROBLEMA 7 Se sabe que el 24% de los clientes de una empresa de servicios tienen cuenta corriente. Se saca una muestra de 120 clientes. a) gCudl es la probabilidad de encontrar a lo sumo que el 30% de los clientes tengan cuenta co- rriente? b) {ual es la proporcién de clientes que tienen cuenta corriente en la muestra, que scrd superado con probabilidad de 0,87? SOLUCION T=024 ; n=120 a) P (p <0,30)=4 Pwo (6 <0,30/ 7-0,24 Von ESTADISTICA ~ C. Caprigiion! PAGINA 51 1. Introduccion al Muestreo La probabilidad de que la proporcién no supere el 30% es de 0,93822. b) La proporcién de clientes que tienen cuenta corriente en la muestra, que serd superado con probabilidad de 0,87 es el percentil 13 Pwo (P>P 0) =0,87 => Puo(P zo=-1,126 Sabiendo que entonces - , Laproporeién de clientes que tienen cuenta corriente en 1a muestra, que sera superado con proba- bilidad de 0,87 es 0,1961 PROBLEMA 8 Se sabe que el rendimiento por parcela para cierta variedad de trigo se distribuye normalmente con media 383 kg. y desvio estindar 76 kg. );Cuél es la probabilidad de que, en una muestra de 10 parcelas ,el rendimiento medio esté entre 350 kg. y 400 kg? b);Cual es el rendimiento medio de una muestra de 30 parcelas, que no seré superado, con proba- bilidad 0,207 SOLUCION H=383 ; o=76 a)n=10 (350 < X< 400) and al PAGINA 52, 1. Introduccién al Muestreo Pyo (350 < x < 400 / p= 383 ; ZL = 24) = P(-137< 250,71) = = F(0,71) - F(-1,37) = 0,67581 17 om be La probabilidad de que la media de la muestra esté entre 350 kg. y 400 kg. es de 0,67581. b)n=30 P(X Xo Pyo(Z < Zo) = 0,20 = F (zo) Elrendimiento medio por parcela que no sera superado con probabilidad de 0,20, en una muestra de 30 parcelas es de 371,32. PROBLEMA 9 En a fabricacién de cojinetes para motores, se sabe que el diémetro promedio es 5 cm y el desvio estndar es 0,006. El proceso se controla periédicamente mediante una muestra al azar de 64 co- jinetes midiendo los correspondientes didmetros. El proceso se detiene si la media de la muestra sse encuentra fuera de un intervalo cuyos limites equidistan de la media y contiene una probabili- dad igual a 0,99. Determinar los limites de dicho intervalo. SOLUCION En cl enunciado del problema no se indica cual es la distribucién de la poblacién pero, como el tamafio de la muestra es suficientemente grande, por el teorema central del limite, se utiliza la distribucién normal para la solucién de este problema. n=64 5 B=5 3 6=0,006 P(X1< X< X2)=0,99 be? 3 HaH% El lector puede comprobar que los valores x i y 2 som los fractiles 0,005 y 0,995 respectivamen- te, por lo tanto, si ESTADISTICA - C. Capriglion! PAGINA 53 1 Introduccién al Muestreo entonces los valores solicitados son Xi =p+2y-S =5-2,576- da a= p+ ar 257% 3 2376 Si el didmetro medio de una muestra de 64 cojinetes esté fuera del intervalo [4,998 ; 5,002] se detiene el proceso. PROBLEMA 10 En una empresa que cuenta con 2356 clientes en cuenta corriente se controlaré el saldo mediante una muestra de tamafio 450. Sabiendo que los saldos se distribuyen normalmente con media $1322 y desvio esténdar $112, calcular la probabilidad de que el saldo promedio de la muestra sea superior a $1329.79. SOLUCION N=2356 5 n=450 ; p= 1322 3 o=112 P(X > 1329,79) = ,..? 1450 Puo (X >/ p= 1322; dn =P (Z>1,64/0; 1)=1-F(1,64) 0,94950 = 0,05050 PAGINAS4 ESTADISTICA-C. Caprigon! 1, Introduccién af Muestreo 0.05, 132 132079 ° ea La probabilidad de que el saldo promedio de la muestra de 450 clientes sea superior a 1329,79 es 0,0505 PROBLEMA 11 Se sabe que el costo por unidad fabricada de una empresa tiene distribucién normal con media $3,43 y desvio tipico $0,48. {De qué tamafio debe ser la muestra si se quiere que la probabilidad de que la media muestral difiera de la media poblacional en menos de $0,19 sea de 0,95? SOLUCION H=3,43 ; = 048; Pwo (PR-v] <0,19)=0,95 2 efi Po (XH) <0,19) = 0,95 => Izl=1,96 2 = o- (228) = 24,518 => n=25 “en Si se quiere que la probabilidad de que la media muestral difiera de la media poblacional en me- nos de 0,19 sea de 0,95, el tamafio de la muestra debe ser de 25 unidades. & PROBLEMA 12 El tiempo de reposicién de un determinado componente electrénico tiene media 3,8 afios y desvio estindar 0,8 afios. Se toma una muestra de 70 componentes, cual el valor de la media muestral que serd superado con probabilidad igual 0,15? SOLUCION n=70 ; 1=385 ; o=08 Hay que calcular el percentil 85 P(X >X «) = 0,15 => P(X < Xo) =0,85 > Xo=y...? El tamafio de la muestra es suficientemente grande, por lo tanto se utiliza la distribucién normal estandarizada. En la tabla de fractiles y percentiles de la distribucién normal estandarizada se obtiene el fractil de orden 0,85 de la variable Z Pyo(Z < zo) = 0,85 => F (20) = 0,85 => Zo = 1,036 ESTADISTICA - C. Capriglion! PAGINASS: L.Introduccién al Muestreo Entonces, si 0,80 = Fy =3.85+1036-7— 3,949 El valor de la media muestral que seré superado con probabilidad igual 0,15 es 3,949. PROBLEMA 13 De acuerdo a una informacién oficial, el 38% de las personas que conducen automéviles usan el celular mientras manejan. De qué tamaiio deberfa ser una muestra para que la diferencia entre el estimador y el pardmetro sea inferior al 2% con probabilidad 0,98. SOLUCION El parémetro es la proporcién poblacional, y el estimador es la proporcién muestral, luego, se utiliza la distribucién normal para la solucién de este problema. %=0,38 ; 1-2=0,62 ; [p—x] =0,02 P(|[p—n] < 0,02) =0,98 = P( -0,02< p => P(0,36 < B <0,40)=0,98 n=y~? El lector puede comprobar que los valores 0,36 y 0,40 son los fractiles 0,01 y 0,99 respectivamen- te, entonces | z.| = 2,326 por lo tanto, si entonces 2 -n-(I-m) @ El tamafio de la muestra deberia ser 3187. 2,326? -0,38-0,62 =P 0,027 = 3186,65= 3187 PAGINAS6 ESTADISTICA~C. Capriglloni 2. INTERVALO DE CONFIANZA 2.1. DEFINICION Anteriormente se ha estudiado que para tener informacién sobre una determinada pobla- cién, cuando no es posible hacer un censo, hay que recurrir al muestreo. Se obtiene una muestra aleatoria de tamaiio n, y con ella se construyen los distintos estadigrafos a través de los que se puede inferir la poblacién. La estimacién puntual consiste en generar una funcién de las variables muestrales que pro- porcione la mejor informacién acerca de! pardmetro a estimar, y con ella, una vez que se obtiene Ja muestra, calcular un tnico valor del estimador. La principal desventaja que presenta este méto- do radica en el hecho de no poder establecer, probabilisticamente, cudn préximo del verdadero valor del parametro se encuentra el punto de estimacién, Por tal motivo es necesario desarrollar un método que posibilite tener un cierto grado de confianza de que el verdadero valor del parametro se encuentra dentro de una determinada varia- ci6n alrededor del valor obtenido con la estimacién puntual. Sea,f(X/O) la funcién de densidad que describe probabilisticamente a una poblacién X con Pardmetro @; sea {X15 X25e 5 Xn} ‘una muestra aleatoria de tamafio n proveniente de dicha poblacién; y sea el estadigrafo un estimador del parametro @ Se llama INTERV ALO DE CONFIANZA PARA EL PARAMETRO , aun método de estimacién que consiste en determinar un conjunto ce- rrado y acotado de posibles valores del pardmetro y la correspondiente probabilidad de que dicho intervalo cubra al verdadero valor del paré- ‘metro. P[ci (6) <0 < £s(6)] = 1-€ Los limites, inferior y superior, de un intervalo de confianza son funciones del estimador ‘Se lama NIVEL DE CONFIANZA 0 PROBABILIDAD FIDUCIAL, a la probabilidad de que el NTERVALO DE CONFIANZA cubra al verda- dero valor del pardmetro. Se hace notar que los limites del intervalo son variables aleatorias, por ser funciones de variables aleatorias. Por ese motivo, el INTERVALO DE CONFIANZA es un intervalo aleatorio; se desplaza aleatoriamente por el eje de nimeros reales. Luego de obtener la muestra y asignar los correspondientes valores numéricos a las varia- bles, el intervalo dejard de ser variable. Los limites asumirén un determinado valor. El intervalo posiblemente cubriré al verdadero valor del parimetro. Esta posibilidad se mide con el NIVELDE CONFIANZA. 1- : Nivel de Confianza, Probabilidad de que el intervalo cubra al verdadero valor del parimetro. : Nivel de Riesgo. Probat del parémetro. ESTADISTICA™C. Capriglion| PAGINAST idad de que el intervalo no cubra al verdadero valor 2.2. INTERVALOS DE CONFIANZA ADITIVOS Se llama INTERV ALO DE CONFIANZA ADITIVO a aquel intervalo que permite que la probabilidad de que la estimacién difiera del pardme- tro ena lo sumo h veces el desvio estindar del estimador, sea igual al nivel de confianza, Simbélicamente P{ 16-01 sh. WG }=1-8 0, expresado como intervalo P{é -hWv@s <6 thWv® }-t-6 Donde, el factor h se llama FACTOR DE CONFIANZA y ¢s el valor del fractil de orden (-) de la distribucién de probabilidad del estadigrafo de transformacién del estimador é. Si se conocen los limites de un INTERVALO ADITIVO, la estimacién puntual se puede cal- cular haciendo la semisuma de los limites del intervalo Li(0)+ £8) 2 Cémo el valor del parametro es desconocido, es necesario poder medir la precisién con que se realiza la estimacién, 6 Se llama ERROR DE MUESTREO a /a maxima diferencia que se esta dispuesto a tolerar entre el estimador y el parémetro 6-8 El] ERROR DE MUESTREO mide la precisién de la estimacién. En los INTERVALOS ADI- ‘TIVOS, es la cantidad que se suma y se resta al estimador puntual, e=h.Jv@) E]. ERROR DE MUESTREO se puede calcular haciendo la semidiferencia de los limites del intervalo £s(6)-ci(6) 2 2.2.1. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES NORMALES. De acuerdo a los conceptos vertidos en los parégrafos anteriores, para construir intervalos de confianza, hay que tener en cuenta cual es el estadigrafo de transformacién de! estimador del parimetro que se desea estimar, y qué distribucién de probabilidad tiene. Tal como se ha estudiado, las poblaciones pueden ser infinitas o finitas, como asi también, es posible que se conozca el valor de la Varianza de la Poblacién 0”, ono, en cuyo caso hay que utilizar el estimador de dicha varianza, o sea la Varianza Muestral $*. Esto da origen a distintas expresiones del INTERVALO DE CONFIANZA para el parimetro Media Poblacional. PAGINA SB: ESTADISTICA ~ C. Caprigiton! Intervalo de Confianza 2.2.1.1. VARIANZA POBLACIONAL CONOCIDA. POBLACIONES INFINITAS. ‘Sea X una poblacién infinita distribuida normalmente con Varianza conocida 0% y Media desconocida py ; sea {X15 X25. y sea el estadigrafo una muestra de tamafio n tomada de dicha poblacién normal; Ja Media Aritmética Muestral, estimador del parimetro Media Aritmética Poblacional p. La Varianza del estimador Media Muestral es yeel estadigrafo de transformacién de la Media Muestral es x z=a=k © Jn cuya distribucién es Normal Estandarizada. Por otro lado, considerando que la probabilidad de encontrar un valor de la variable estan- darizada entre dos fractiles equidistantes del origen sea (1-8). P(2un S$ ZS Zum) = 1-8 remplazando Z por el estadigrafo de transformacién se tiene x- Pons < run) 1-8 da despejando convenientemente, se tiene la expresién del intervalo =. 6, =. s. P| X-z, sp s X+z, =1-€ (Rass ) Jn donde 2» es el FACTOR DE CONFIANZA y es el fractil de orden (-§) de la distribucién Normal Estandarizada Ejemplo 2.1 De una poblacién normal con varianza igual a 16 se extrajo una muestra de tamaito 9, la cual pro- porcioné una media igual a 35. Estime, mediante un intervalo de confianza del 95%, la media poblacional. SOLUCION Laexpresién genérica del intervalo de confianza para estimar el parametro media poblacional, si la poblacién es normal con varianza conocida, es: <. G, = P[R-ay-Sesn, see donde: ESTADISTICA—C. Caprigilon! PAGINA 59 2Intervalo de Confianza 4x: Media Poblacional, Parémetro a estimar. 6%: Varianza Poblacional 1: tamaiio de la muestra 2X X=4+: media muestral. Estimador insesgado de la media poblacional py. n 1 -&: Nivel de confianza. Zo: Factor de Confianza. Es el fractil de orden (-2) de la distribucién Normal Estandarizada En este problema se tiene: -n=9 ; Se busca en la tabla de fractiles 0 percentiles de la distribucién normal estandarizada el valor de Zs, tal que F(zq) = 0,975 => z0= 1,960 El intervalo es entonces: 4 4 35 1,960- TS < px $35 + 1,960: io io 32,387 < px $37,613 El intervalo [32,387 ; 37,613] cubre el verdadero valor de la media poblacional, con una confianza del 95%, 2.2.4.2. VARIANZA POBLACIONAL CONOCIDA. POBLACIONES FINITAS. Sea X una poblacién finita de tamafio N, distribuida normalmente con varianza conoci- da, y media desconocida pty ; sea {X13 X25... } Xn} una muestra de tamafio n tomada de dicha poblacién normal; y sea el estadigrafo 2% a n la Media Aritmética Muestral, estimador del parametro Media Aritmética Poblacional [Ly Entonces, la varianza del estimador Media Muestral es 2 =,_ of (N-n viX)= sx(fen) = Na y el estadigrafo de transformacién de la Media Muestral es cuya distribuci6n es normal estandarizada. PAGINA 60 ESTADISTICA ~ C. Caprigliont Intervalo de Confianza Por otro lado, considerando que la probabilidad de encontrar un valor de la variable estan- darizada entre dos fractiles equidistantes del origen sea (1-€). P(.2S ZS 24m) = 1-8 remplazando Z por el estadigrafo de transformacién se tiene X=p Plans SZq0n) = 1-8 In despejando convenientemente, se tiene la expresién del intervalo donde Zo es el FACTOR DE CONFIANZA y es el fractil de orden (+3) de la distribucién Normal Estandarizada Ejemplo 2.2 De una poblacién normal de 150 elementos se sacé una muestra de tamafio 25 la cudl proporcioné una media de 348,3. Sabiendo, que la varianza de la poblacin es de 16, estimar mediante un in- tervalo del 95% la media poblacional. SOLUCION La expresién genérica del intervalo de confianza para estimar el parémetro media poblacional, si la poblacién es normal, finita y cuya varianza poblacional sea conocida, es: donde: N: tamafio de la poblacién o del universo. 4x: Media Poblacional. Parametro a estimar. 3: Varianza Poblacional ln : tamafio de la muestra. <= Ex, X= zx : media muestral. Estimador insesgado de la media poblacional p1. n 1 =&: Nivel de confianza. Zp: Factor de Confianza. Es el fractil de orden (-8) de la distribucién Normal Estandarizada_ En este problema se tiene: N= 150 3 M=25 5 Gx=16 3483 l-e= 95 > 1-£=0,975 2 Se busca en la tabla de fractiles o percentiles de la distribucién normal estandarizada el valor de Zo, tal que F(z) = 0,975 = 20 = 1,960 ESTADISTICA — C. Caprigtiont PAGINA 61. 2.Intervalo de Confianza El intervalo es entonces: px<348,3 + 1,960- [25 346,86 < px < 349,74 El intervalo [346,86 ; 349,74] cubre el verdadero valor de la media poblacional, con una confian- za del 95%. 348,3 — 1,960- 2.2.1.3. VARIANZA POBLACIONAL DESCONOCIDA. POBLACIONES INFINITAS. Sea X una poblacién infinita distribuida normalmente con varianza desconocidao% yme- dia desconocidapty ; sea {Xi 3 X; . 3 «+» 3 Xn} una muestra de tamafio n tomada de dicha poblacién normal; sea el estadigrafo a Media Aritmética Muestral, estimador del parimetro Media Aritmética Poblacional py ; y sea el estadigrafo Di-xP n-1 Ja Varianza Muestral, estimador del parametro Varianza Poblacional Entonces, la varianza estimada del estimador Media Muestral es 2 0%) = n y el estadigrafo de transformacién de la Media Muestral es t-Xoh S dn cuya distribucién es t de Student con (n- 1) g. 1 La expresion Pltan StS tue) = 1-8 significa que la probabilidad de encontrar un valor de la variable t, entre dos fractiles equidistan- tes del origen, es (1-€). Remplazando t por el estadigrafo de transformacién se tiene X- Plters ~S* stun) = 1-8 Ja despejando convenientemente, se tiene la expresién del intervalo = =, § P/X-t, Xs ps X+t, [evdgs ns ho] PAGINA 62 ESTADISTICA — C. Capriglioni Intervalo de Confianza donde t es el FACTOR DE CONFIANZA y corresponde al fractil de orden S de la distribucién t de Student con (n - 1) g. 1. Ejemplo 2.3 Los siguientes datos corresponden a una muestra de tamafio 9 tomados al azar de una poblacién distribuida normalmente: 84; 88 ; 83 ; 90 ; 87 ; 87 ; 85 ; 88 ; 82 Estimar, mediante un intervalo de confianza del 95% el valor de la media poblacional SOLUCION La expresién genérica del intervalo de confianza para la media poblacional, si la poblacién es normal, infinita y no se conoce su varianza es: s. & 5 {Rt Sesm, to=2,030 E] intervalo es entonces: xs 480+2,030- 2, 36 480 — 2,030 - 472,16 < Wx < 487,84 El intervalo [472,16 ; 487,84] cubre el verdadero valor de la media poblacional, con una confian- za del 95%. ESTADISTICA — C. Caprigilon! PAGINA 65 2.Intervalo de Confianza 2.2.2. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL DE POBLACIONES NO NORMALES. Las distribuciones de las poblaciones no siempre son conocidas. En estos casos, para po- der construir INTERVALOS DE CONFIANZA para estimar el parametro Media Poblacional, hay que recurrir a la aplicacién de algunos teoremas ya estudiados. Con el Teorema Central del Limite se demuestra que los estadigrafos tienen distribucién asintéticamente Normal Estandarizada cuando el tamafio de la muestra tiende a infinito. Por otro lado, con el Teorema de Tchebycheff se puede demostrar que P{IX-nl sk. WG far Con estos dos teoremas se construyen los intervalos de confianza para estimar el paréme- tro Media Poblacional. 2.2.2.1, MUESTRAS GRANDES Si la distribucién de probabilidad de la poblacién no es conocida, y el tamafio de la mues- tra es lo suficientemente grande como para que se cumpla el Teorema Central del Limite, enton- ces, para poblaciones infinitas o finitas, respectivamente P(X-z,%< < X+z, =1-€ ( “ia ‘F) IN=n [N=n of 2S rsh s Koz, =). 1-8 6, sila Varianza Poblacional es ie ajo ciertas condiciones, para poblaciones infinitas © finitas, los intervalos son, respectivamente > Sy o{X- 1 Gisu s Kon, F Je -& donde Zo es el FACTOR DE CONFIANZA y corresponde al fractil de orden & (: - §) de la distribucién Normal Estandarizada. PAGINA 66 ESTADISTICA - C. Capriglioni 2. Intervalo de Confianza Se recuerda que para este trabajo se considera una muestra grande cuando su tamaiio es mayor a 30. Ejemplo 2.5 Se seleccionan 150 elementos al azar, obteniéndose un promedio (muestral) igual a 472. y una varianza (muestral) igual a 64. Estimar, mediante un intervalo de confianza del 96% el valor dela media poblacional. SOLUCION El tamafio de la muestra es suficientemente grande (n> 30), entonces, por el Teorema Central del Limite el estadigrafo win s tiene distribucién asintéticamente normal estandarizada, cualquiera fuese la distribucién de la poblacién, por lo tanto, en estos casos, el coeficiente de confianza se obtiene de la distribucién ‘Normal. La expresién genérica del intervalo de confianza para estimar el pardmetro media pobla- cional es, si no se conoce la varianza poblacional es = S, = P)X—z,-—X< py $X+z, fin Sem eRer Donde: Zp: Factor de Confianza. Es el fractil de orden ( - 5) de Ja distribucién Normal Estandarizada aunque la distribucién de la poblacién no sea normal. En este problema se tiene, n=150 ; X=472 ; Sx =64 1-€=09 = Me 0,98 => 2 =2,054 el intervalo es 8 8 472 -2,054 - =< px < 472 +2,054- = i350 Ji50 470,66 < wx $473.34 Con una confianza del 96% la media poblacional se encontraria entre 470,66 y 473,34. 2.2.2.2, MUESTRAS CHICAS Si la distribucién de probabilidad de la poblacién no es conocida, y el tamafio de la mues- tra no es lo suficientemente grande como para que se cumpla el Teorema Central del Limite, en- tonces el nivel de confianza del intervalo de estimacién, es la cota inferior de probabilidad que surge de la aplicacién del teorema de Tchebycheff. Entonces, para poblaciones con varianza poblacional conocida, infinitas o finitas, los in- tervalos de confianzas son, respectivamente ~. S =. 4G; P| X-k,—A

e=010=>k= el intervalo es 137 -3,162- oc ps 13743102. oe 132 < pxs 142 Con una confianza minima del 90% la media poblacional estaria entre 132 y 142. PAGINA 68 ESTADISTICA — C. Capriglioni 2. Intervalo de Confianza 2.2.3. INTERVALO DE CONFIANZA PARA LA PROPORCION DE ELE- MENTOS QUE TIENEN UN DETERMINADO ATRIBUTO EN LA POBLACION. 2.2.3.1. POBLACIONES INFINITAS. Sea X una poblacién dicotémica infinita quien puede asumir sélo dos valores X= 1 sila unidad experimental medida tiene un atributo A. X= 0 si la unidad experimental medida no tiene un atributo A. sea 7 un parimetro desconocido que representa la proporcién de elementos que tienen el atributo A en una Poblacién infinita sea {X13 X23... ;Xn} una muestra de tamafio n suficientemente grande, tomada de dicha Poblacién (en este trabajo, n> 50) sea el estadigrafo n F=D% isl cantidad de elementos con el atributo A en la muestra de tamaiio n sea el estadigrafo la proporcién de elementos con el atributo A, en la muestra; Notese que ¥ es una variable aleatoria discreta con distribucién Binomial(n ; ™), luego, por el teorema de Moivre-Laplace, cuando n —» «la variable estandarizada r-nt tiende asint6ticamente'a una distribucién Normal Estandarizada. Dividiendo numerador y denominador por el tamafio de la muestra, y reemplazando el parimetro desconocido por su estimador, se tiene el estadigrafo de transformacién para la Proporcién Mues- tral en universos infinitos. p-t ccuya distribuci6n es asintéticamente Normal Estandarizada, Por lo explicado en los puntos anteriores, Pin ZS 20%) = 1-6 Remplazando Z por el estadigrafo de transformacién, se tiene despejando convenientemente, se tiene la expresién del intervalo de confianza. = IP = pq Pl p- Sns p+z, J— |=1-€ (F 2% i a P+z, i 7 ESTADISTICA — C. Caprigtioni PAGINA 69 2.Intervalo de Confianza donde 29 ¢s el FACTOR DE CONFIANZA y corresponde al fractil de orden de la distribucién Normal Estandarizada. Ejemplo 2.7 Se tomé una muestra de 800 elementos de una poblacién, encontrando que 320 tienen un deter- ‘minado atributo A. Estimar, con una confianza del 95%, el valor de la proporcién de elementos con el atributo A en la poblacién SOLUCION Laexpresién genética del intervalo de confianza para estimar la proporcién poblacional de uni- versos infinitos, cuando el tamaiio de la muestra es suficientemente grande, es off», PA smsp+2,- 1-4 donde: 1 :Proporcién de elementos con atributo en la poblacién. (Parametro a estimar). : Tamafio de la muestra, ‘antidad de elementos con atributo en la muestra de tamajio n. Zp: Factor de Confianza. Es el fractil de orden ( = ) de la distribucién Normal Estandarizada_ En este problema se tiene n=800 ; 1=320 ; 0,40 => q=0,60 1-8=0,95 > el intervalo es: 0,40 ~ 1,960- ose <1 <0,40 + 1,960- | 240-060 800 800 0,366 < TE < 0,434 La proporcién de elementos con el atributo A en la poblacién estaria entre 0,366 y 0,434 con una confianza del 95% Dado que las proporciones se pueden expresar en porcentajes, la respuesta de este problema pue- de ser: El porcentaje de elementos con el atributo A en la poblacién estaria entre el 36,6% y el 43,4% con una confianza del 95%. 2.2.3.2. POBLACIONES FINITAS. Sea X una poblacién dicotémica finita de tamafio N, quien puede asumir sélo dos valores X= I si la unidad experimental medida tiene un determinado atributo A. X= 0 si la unidad experimental medida no tiene un determinado atributo A. PAGINA 70 EsTADISTICA — C. Caprigiloni 2. Intervalo de Confianza Sea N R=yX,, il el total de elementos con un atributo A en la Poblacién de tamajio N. Sea R TN un parametro desconocido que representa la proporcién de elementos que tienen el atributo Aen una Poblacién finita de tamafio N. Sea {X; 3X25... 5 Xq} una muestra de tamatio n tomada de dicha Poblacién. Sea el estadigrafo e n zx ia que representa el total de elementos con el atributo A en la muestra de tamafio n yelestadigrafo =_f n la proporcién de elementos con el atributo A, en la muestra. Proporcién Muestral. Entonces P: Estimador del pardmetro Proporcién Poblacional Tf; Notese que ¥ es una variable aleatoria discreta cuya distribucién es Hipergeométrica con parimetros mateméticos (N;; 1). Pasando al limite, la variable estandarizada cuando n -» «, tiende asintéticamente a una distribucién Normal Estandarizada. Dividiendo el numerador y el denominador por el tamafio de la muestra se tiene el estadi- grafo de transformacién para la Proporcién Muestral es, p-t cuya distribucién es asintéticamente normal estandarizada. P Peas S200) P-4 (Non n \N-1 despejando convenientemente, se tiene la expresién del intervalo ESTADESTICA ~ C. Capriglion! PAGINA 71. =) donde Zp es el FACTOR DE CONFIANZA y corresponde al fractil de orden (5 de la distribucién Normal Estandarizada_ Ejemplo 2.8 De un total de 12345 elementos se sacé una muestra de 4800, encontrindose que 1680 poseen el atributo A. Estimar, con una confianza del 95% la proporcién de elementos en la poblacién, que poseen el atributo A. SOLUCION La expresi6n genérica del intervalo de confianza para estimar la proporcién poblacional de uni- versos finitos, cuando el tamafio de la muestra es suficientemente grande, es - iP-q n - pq n ofpafe NTS TSB +2 P fe |. -e donde: ® : Cantidad de elementos con atributo en la poblacién. N : Tamafio de la poblacién. R =7y Proporcién de clementos con atributo en la poblacién. (Parémetro a estimar). : Tamaiio de la muestra. : Cantidad de elementos con atributo en la muestra de tamafio n. z n a-l-p n t = proporcién de elementos con atributo en la muestra. Estimador insesgado de TC. . & a Zp: Factor de Confianza. Es el fractil de orden (! -2) de la distribucién Normal Estandarizada En este problema se tiene: N=12345 ; n=4800 ; f=1680 ; p=-82-035 ; g=0,65 4800 1-8=0,95 => =0975 => m= 1,960 el intervalo es: 035 ~ 1,960. [035-065 [I23S= A800 - op <9 35 « 1960. (as 12345— 4800 4800 W 12345-1 4800 W 12345-1 0,3395 < TE < 0,3605 ‘Con una confianza del 95% la proporcién de elementos con el atributo A en la poblacién estaria entre 0,3395 y 0,3605. Dado que las proporciones se pueden expresar en porcentajes, la respuesta de este problema pue- de ser: Con una confianza del 95%, el porcentaje de elementos con el atributo A en la poblacién estaria entre el 33,95% y el 36,05%. PAGINA 72 ESTADISTICA--C. Caprigion! 2. Intervalo de Confianza 2.3. INTERVALO DE CONFIANZA PARA LA VARIANZA PO- BLACIONAL. 2.3.1. POBLACION INFINITA Sea X una poblacién infinita distribuida normalmente con varianza desconocida oy ; sea {X15 Xo 5... § Xn} una muestra de tamafio n tomada de dicha poblacién normal; y sea el estadigrafo a XOi-xF ob x n-1 la Varianza Muestral, estimador del parametro Varianza Poblacional Por lo estudiado en el capitulo 1, el estadigrafo de transformacién de la Varianza Muestral es Este estadigrafo tiene distribucién Ji-cuadrado con (n-1) g.l. La probabilidad de encontrar un valor de la variable Ji-cuadrado con (n-1) g.1. entre los fractiles ( ) 2) UF 2 PCte2SX ont $ Hi-e2) = 1-8 es reemplazando por el estadigrafo de transformacién 2 in-1)-S" Plxins leads SXien)= 1-8 ° despejando convenientemente, s¢ tiene la expresién del intervalo (eye < o <8) -€ b donde: a: esl fractil de orden (3) de la distribucién de la distribucidn ji-cuadrado con (n-1) g.l. b: esl fractil de orden ( - ) de la distribucién de la distribucién ji-cuadrado con (n-1) g.l. Ejemplo 2.9 De una poblacién normal se tomaron al azar 11 elementos cuyos valores son los siguientes: 384 ; 391 ; 388; 394 ; 381 ; 385 ; 384 ; 391 ; 383 ; 389 ; 387, Estimar, mediante un intervalo de confianza del 95%, el valor de la varianza poblacional ESTADISTICA - C. Capriglion! PAGINA 73 2.Intervalo de Confianza SOLUCION La expresién genérica del intervalo de confianza para la varianza de poblaciones normales es: -1)s2 o-Ps DSX < gy b donde : 1: Tamatio de la muestra, S? : Varianza muestral. 1-€=Nivel de confianza. a: Es el fractil de orden (5) de la distribucién ji - cwadrado con (n - 1) grados de libertad b: Esel fractil de orden (- 5] de la distribucién ji - cuadrado con (n - 1) grados de libertad. En este problema se tiene n=11 ; gl=(n-1)=10 Aplicando la correspondiente f6rmula a los datos de la muestra, se obtiene el valor de la varianza muestral 8? =16 1-€=0,95 ; & 77 0025 => en la tabla de fractiles de la distribucién ji -cuadrado a= 3,25 Ws = 0,975 = en la tabla de fractiles de la distribucién ji - cuadrado b= 20,48 el intervalo es: 10-16 10-16 5 SOxS 20,48? ** 3,25 78125 < Ox $ 49,23 Con una confianza del 95% la varianza poblacional se encontraria entre 7,8125 y 49,23. 2.4. TAMANO DE MUESTRA ‘Una vez que se decide estimar un determinado pardmetro realizando un trabajo de mues- treo, hay que establecer cudntas unidades experimentales formarén parte de la muestra, O sea, cual debera ser el tamaiio de 1a muestra de modo tal que se pueda optimizar el procedimiento para que no sea excesivamente costoso, ni presente grandes imprecisiones. Para proceder al cdlculo del tamafio de la muestra, hay que tener en cuenta las siguientes caracteristicas: © Definir cual es el pardmetro a estimar El grado de precisién, medido con el error de muestreo Elnivel de confianza requerido o probabilidad de que el intervalo contenga al pardmetro. Variabilidad de la poblacién eee PAGINA 74 ESTADISTICA— C. Caprigiloni 2. Intervalo de Confianza 2.4.1, TAMANO DE MUESTRA PARA ESTIMAR EL PARAMETRO MEDIA POBLACIONAL. 2.4.1.1. VARIANZA POBLACIONAL CONOCIDA Por lo expuesto, para calcular el tamaiio de la muestra hay que conocer las siguientes me- didas: v ELERROR DE MUESTREO: Este factor es proporcionado por el usuario de la muestra. El debe indicar cual es la maxima diferencia entre la Media Muestral y Ja Media Poblacional esta dispuesto a aceptar. El error de muestreo debe estar expresado en la misma unidad de medida de la variable. v LACONFIANZA EN LA ESTIMACION: Este factor es proporcionado por el usuario de la muestra. El debe indicar cudl es la probabilidad deseada de que el intervalo de confianza cubra al verdadero valor de la Media Poblacional. * v LAVARIANZA DE LA POBLACION: Este factor indica el grado de variabili- dad de la Poblacién. v ELTAMANO DE LA POBLACION: En caso de Poblaciones finitas, este factor es una restriccién para el tamafio de la muestra. Cémo se ha estudiado oportunamente, el error de muestreo se obtiene haciendo la semidi- ferencia entre los limites del intervalo de confianza. £5(X)-£i(X) 2 POBLACION INFINITA Si la poblacién es infinita, el error de muestreo es luego por lo tanto, 2 Zq° n=|—2 e Sinn fuese un nimero con decimales, el tamafio de la muestra siempre serd el préximo miimero entero. Ejemplo 2.10 Se desea estimar la media de una poblacién normal con varianza igual a 75. {Cuél deberé ser el tamafio de la muestra si se quiere que el error de muestreo no sea superior 23,4 con una confianza del 95% ? SOLUCION El tamafio de la muestra para estimar la media poblacional de poblaciones normales infinitas se calcula con la formula : 2-0 z e donde : ESTADISTICA ~ C. Caprigtion! PAGINA 75 Intervalo de Confianza Z: Factor de Confianza. Es el fractil de orden ( 5) de la distribucién Normal Estandarizada 6X: Varianza poblacional e: Error de muestreo (diferencia entre estimador y pardmetro) La unidad de medida de la magnitud del error de muestreo debe ser la misma que la de la variable en estudio. En este problema se tiene: OY=75 se 4 Le 0,95 => 1-5-0975 => 71,960 1,960? +75, n= 296075 3,47 Se necesitan como minimo 25 elementos para estimar la media poblacional con error de muestreo no superior a 3,4 y con una confianza del 95%, POBLACION FINITA Si la poblacién es finita, el error de muestreo es = 24,92 > n=25 luego nz) 2 Nn °TnYN-1 por lo tanto, Sin fuese un niimero con decimales, el tamafio de la muestra, siempre seré el préximo numero entero. Ejemplo 2.11 De una poblacién normal de 452 elementos, se desea seleccionar una muestra para estimar la me- dia con un error no mayor de 12. {Cual deberd ser el tamafio si la poblacién tiene un desvio estindar de 53 ?. Nivel de confianza 95%. SOLUCION El tamaiio de la muestra para estimar la media poblacional de poblaciones normales finitas, cuan- do se conoce la varianza poblacional se calcula con la siguiente formula: na 20 o ON e? -(N-1)+270 -0? donde : 2g: Factor de Confianza. Es el fractil de orden (- de la distribucién Normal Estandarizada PAGINA 76 ESTADISTICA—C. Caprigtion! 2. Intervalo de Confianza ‘0X : Varianza poblacional N: Tamatio de la poblacién e: Error de muestreo (diferencia entre estimador y pardmetro). En este problema se tiene: ox=53 5 e= 12 N=452 18=0,95 => => m= 1,960 2 6532 n= 19607537452 ggg ngs 12? «(452—1) + 1,96? +53? Se necesitan como minimo 65 elementos para estimar la media poblacional con un error de mues- treo no superior a 12 y con una confianza del 95%. 2.4.1.2. VARIANZA POBLACIONAL DESCONOCIDA El tamafio de la muestra para estimar la media poblacional de poblaciones normales infini- tas, cuando no se conoce la varianza poblacional, se calcula mediante el uso de un proceso iterati- vo. Este proceso consiste en los siguientes pasos: 1) Se toma una muestra piloto de tamafio arbitrario No (generalmente este tamatio es igual a 10) y con ella se calcula el valor de la varianza muestral utilizando la formula ya explicada, s nt 2) Se calcula un tamatio de muestra inicial, utiizando la siguiente formula: ts? aT e donde ti: Es el fractil de orden (9 de la distribucién t de Student con (Mg - 1) g. L S*: Varianza muestral calculada con la muestra piloto de tamajio No. e: error de muestreo. Se recuerda que si n fuese un namero con decimales, el tamafio de la muestra, siempre seré el préximo niimero entero. Se obtiene un segundo tamatio de muestra, cambiando el valor ty utilizado anteriormente por th, otro fractil de orden (5) re 2 de la distribucién t de Student pero usando (M, - 1) g. 1. 262 _ bs eter e n, 3) Se obtiene un tercer tamafio de muestra, cambiando el valor t, utilizado anteriormente ESTADESTICA - C. Capriglioni PAGINA 77 2.Jntervalo de Confianza por ts, otro fractil de orden 4) _ Este proceso iterativo se repite tantas veces hasta que dos tamafios de muestra conse- cutivos sean iguales My = Nosy entonces ese es el tamaito de la muestra N= N= Ni) Ejemplo 2.12 Se desea estimar la media de una poblacién normal con una confianza del 99% y un error de muestreo a lo sumo de 4. Como no se tiene informacién de la varianza poblacional se realiz6 una estimacién de la misma con una muestra piloto de 10 elementos y result igual a 70. ,Cudl deber ser el tamafio minimo de la muestra necesario? SOLUCION En este problema se utilizara el método iterativo. Los datos son y= 10 I SX=70 ; e=4 Gl=m-1=9 5 16=0,99 => 1-2=0,995 = t=3,250 entonces, el tamafio de muestra inicial es 3,250°-70 a 4 = 4621 3 m=47 Para calcular el segundo tamajio de la muestra se trabaja con el valor de t-Student con 46 grados de libertad t= 2,687 2,687" -70 =316 > m=32 4 Para calcular el tercer tamafio de la muestra se trabaja con el valor de t-Student con 31 grados de libertad ts = 2,744 =32,9 => m=33 ara calcular el cuarto tamafio de la muestra se trabaja con el valor de t-Student con 32 grados de libertad t,=2,738 2,738°-70 5 e =328 > m=33 PAGINA 78 ESTADESTICA — C. Caprigtion! Intervalo de nza Como el terceryy el cuarto tamafio de la muestra son iguales, entonces, el tamaiio de muestra ne- cesario para estimar la media poblacional en las condiciones fijadas es n = 33 elementos. Ejemplo 2.13 De una poblacién normal de 1053 elementos se desea estimar la media con un error de muestreo inferior al 1,1 y una confianza del 98%. Como no se conoce el desvio poblacional se selecciona ‘una muestra piloto de 10 elementos, obteniéndose una varianza de 16,34. Determinar el tamafio. de muestra minimo necesario para realizar la estimacién. SOLUCION El tamafio de la muestra para estimar la media poblacional de poblaciones normales finitas, cuan- dono se conoce la varianza poblacional, se calcula mediante el uso del proceso iterativo explica- do oportunamente, a partir de una muestra piloto de tamaiio No. El tamafio de la muestra inicial se calcula con la formula 2 S*x.N e?-(N-1)+t71-S*x n, donde N : Tamaiio de la poblacién, ‘SX : Varianza muestral calculada con la muestra piloto. e: Error de muestreo. to: Factor de Confianza. Fractil de orden (1 -$) de la distribucién t de Student con (n= 1) g.1. Los datos de este problema son N= 10 | Sx = 16,34 3 N=1053 Bl. = No - 9; 18-098 = => t1=2,821 El tamaiio inicial de la muestra es BS?x-N 2,821° +16,34-1053 ee (N-DFt Sx 117 -1052+2,821" -16,34 Para calcular el siguiente valor del tamafio de muestra hay que utilizar n, =975 => m=98 gl=-m-1-97 ; 1-8=09 ; 1-5 =099 => h=2,365 El valor del segundo tamaiio de muestra es P2-SxON 2,365 +16,34 +1052 1052+ 2,365" +16,34 Para calcular el siguiente valor del tamatio de muestra hay que utilizar = 70,47 => m=71 gl=m-1=70 ; 1-8=098 ; 1-5 =09 => th =2,381 El valor del tercer tamafio de muestra es 3-S?x-N 2,381" -16,34-1052 oe = = 7136 => m=72 e”-(N=I) +t -S'x 1052 + 2,381" -16,34 Para calcular el siguiente valor del tamafio de muestra hay que utilizar ESTADISTICA — C. Caprigtlont PAGINA 79 Intervalo de Confianza GL.=n-1=71 ; 1-8=098 5 15 =099 => &=2,380 El valor del cuarto tamajio de muestra es 2, .g2. 2 nye SN 2,380° 1634-1052 5) ern e° (N=1)+t'4-S?x 117 -1052+42,380" -16,34 Como el tercer y el cuarto tamajio de la muestra son iguales, entonces, el tamafio de muestra ne- cesario para estimar la media poblacional en las condiciones fijadas es n = 72 elementos. 2.4.2. TAMANO DE MUESTRA PARA ESTIMAR LA PROPORCION PO- BLACIONAL. 2.4.2.1, UNIVERSOS INFINITOS: El calculo del tamafio de la muestra se realiza teniendo en cuenta los siguientes factores: v ELERROR DE MUESTREO: Este factor es proporcionado por el usuario de la muestra. El debe indicar cual es la maxima diferencia entre la Proporcién Mues- tral y la Proporcién Poblacional que esta dispuesto a aceptar. El error de mues- treo debe estar expresado en tanto por uno. v LACONFIANZA EN LA ESTIMACION: Este factor es proporcionado por el usuario de la muestra. El debe indicar cual es la probabilidad deseada de que el intervalo de confianza cubra al verdadero valor de la Proporcidn Poblacional. ¥ LAPROPORCION: Este factor proporciona informacién sobre el grado de con- centracién de los elementos que tienen el atributo A v ELTAMANO DELA POBLACION: En caso de Poblaciones finitas, este factor ‘es una restriccion para el tamafio de la muestra. El error de muestreo se obtiene haciendo la semidiferencia entre los limites del intervalo de confianza. oa £5t6)-£4 8) 7 Si la poblacién es infinita, el error de muestreo es Iuego Dado que el valor de es desconocido porque se calcula con la muestra, no puede formar parte de la formula utilizada para calcular el tamafio de la muestra, por lo tanto, se utiliza un valor alternativo al que se simboliza p 3h eb n a2 El valor de podré obtenerse de alguna de las siguientes formas: ¥ Utilizando datos que surjan de trabajos anteriores, ¥ Utilizando una muestra piloto (generalmente de tamaiio 50), PAGINA 80 ESTADISTICA — C. Caprigloni Intervalo de Confianza ¥ Sies imposible o impracticable alguna de las formas citadas, entonces, se utiliza directamente el valor 0,50, dado que, cuando hay dicotomia, dos grupos, la ma- yor dispersion se alcanza si cada grupo tiene el 50%, Si n fuese un mimero con decimales, el tamafio de la muestra, siempre serd el préximo niimero entero. Ejemplo 2.14 Se desea estimar la proporcién de elementos con cierto atributo que hay en una determinada po- blacién, ,Cudl debera ser el tamaiio de la muestra necesario para que el error de muestreo no su- pere el 3%, con una confianza del 95%, si experiencias anteriores indican que la proporcién es del 43%?. SOLUCION El tamafio de la muestra para estimar proporcién poblacional de universos infinitos se calcula con la formula : donde : Zo: Factor de Confianza. Es el fractil de orden (1-2) de la distribucion Normal Estandarizada P : Proporcién que surge de experiencias anteriores o estimada mediante una prueba piloto o, si algunos de estos recursos no pudiesen ser utilizados, directamente el valor que se toma es 0,50. e = error de muestreo (diferencia entre estimador y parametro). Elerror de muestreo debe estar expresado, al igual que p , en tanto por 1. Sicl resultado no fuese un niimero entero, entonces hay que utilizar el préximo nimero entero, cualquiera fuese la parte decimal En este problema se tiene: P=043 ; q=1-p =057 ; e=0,03 e 1-8=0,95 => 1- eh 975 => z= 1,960 1,960° -0,43-0,57 0,037 Es necesario una muestra de 1047 elementos para estimar la proporcién poblacional con un error de muestreo no mayor al 3%. = 1046,1957 => n= 1047 2.4.2.2, UNIVERSOS FINITOS Si la poblacién es finita, el error de muestreo es (Fen: ma Juego ESTADISTICA — C. Caprigitoni PAGINA 81 por lo tanto, Ejemplo 2.15 Se desea estimar la proporcién de elementos que tienen cierto atributo A en una poblacién de 87452 elementos. ;Cuél debers ser el tamatio de la muestra si se quiere que el error de muestreo sea inferior al 1%, con una confianza del 95%, si una muestra piloto proporcioné un 27% de ele- ‘mentos con dicho atributo? SOLUCION El tamafio de la muestra para estimar la proporcién poblacional de universos finitos se calcula con Ja formula : donde: N: Tamaiio del universo. 2q: Factor de Confianza. Es el fractil de orden (i -8) de la distribucién Normal Estandarizada P : proporcién que surge de experiencias anteriores o estimada mediante una prueba piloto o, si algunos de estos recursos no pudiesen ser utilizados, directamente el valor que se toma es 0,50. q=l-p e =crror de muestreo (diferencia entre estimador y pardmetro). El error de muestreo debe estar expresado, al igual que p , en tanto por 1. Si el resultado no fuese un namero entero, entonces hay que utilizar el préximo mimero entero, cualquiera fuese la parte decimal. En este problema se tiene: = 87452 p=027 ; e=0,01 1-6=0,95 > Wt 0,975 => z= 1,960 1,960" 0,73-87452 668,52 => 173 ee N-D+zo-p-q 0,01" => n= 6969 Es necesario una muestra de 6969 elementos para estimar la proporcién poblacional con un error de muestreo no mayor al 1%. PAGINA 82 ESTADESTICA - C. Caprigiiont 2. Intervalo de Confianza 2.5. PROBLEMAS PROBLEMA 1 Una muestra de 30 parcelas sembradas con algodén, determiné un rendimiento medio de 950 kg./ha, Sabiendo que los rendimientos tienen distribucién normal con desvio esténdar 25kg./ha., estimar el verdadero rendimiento medio, mediante un intervalo de confianza del 98%. SOLUCION De acuerdo con las caracteristicas del problema, hay que estimar la media poblacional de una po- blacién normal cuando se conoce la varianza poblacional. =< 9, = P\X—z,- Esp, sX+z, Fok Datos n=30 ° 5 Gx=25 5 =950 1-€=0,98 => 1-$ =099 = t= 2,326 El intervalo es entonces: 950 ~ 2,326 - ee a=989 1-5 = 0,995 = b= 45,56 5 1-8=0,99 el intervalo es: 24+2743,26 24-2743,26 SS = 45,56 9,89 1445,09 < 0x < 6657,05 Con una confianza del 99% el verdadero valor de la varianza poblacional del contenido de coles- terol en la sangre de los conejos de 2,5 kilos se encontraria entre 1445,09 y 657,05. ESTADISTICA - C. Caprigtion! PAGINA 83 2.Intervalo de Confianza PROBLEMA 3 Se desea estimar el peso medio de las cajas de dulces envasados por una maquina automatica. Se sabe que los pesos se distribuyen normalmente con desvio estindar igual a 35,7 g. ,Cudl debera ser el tamaiio de la muestra necesario si se desea que el error de muestreo no sea superior a 10g, con una confianza del 99%? SOLUCION De acuerdo con el enunciado del problema, la poblacién es normal, no se conoce su tamafio, lue- go se lo considera infinito y se conoce la varianza (esta el valor del desvio esténdar), por lo tanto {a formula a utilizar es: En este problema se tiene: Ox-357 =; e=10 12=0,99 => 1-5 =0,995 > w=2,576 2,576" +35,7° 10° Se necesitan como minimo 85 cajas para estimar el peso medio con un error de muestreo no supe- rior a 10 gramos y una confianza del 99%, = 84,5723 > n=85 PROBLEMA 4 De un rodeo de 500 vacunos se seleccioné una muestra de 15 animales con similares caracteristi- cas y se les suministré una determinada dieta. Al cabo de un determinado tiempo se comprobé que en promedio, el aumento de peso en ese periodo fue de 22,5 Kg por animal. Por experiencias anteriores se sabe que la ganancia de peso por animal se distribuye normalmente con desvio estdndar igual a 3 Kg. Estimar, mediante un intervalo de confianza del 97%, la ganancia de peso promedio de los animales del rodeo, sujetos a la misma dieta y en el periodo de tiempo considera- do SOLUCION De acuerdo con el enunciado del problema, la poblacién es normal y finita, su tamafio es 500, yse conoce la varianza poblacional, por lo tanto el intervalo de confianza es. ef-s aS 1, sX+2,-55 al ° dn * ° Un N-1 Datos del problema N=500 n=15 05 Ox=3 5 = 225 1-€=097 => ©0985 = Z= 2,170 El intervalo es entonces: 3 [500-15 22,5 -2,170 - =, s 22,5 +2,170- TeV so0-1 ** 20,84 < px < 24,16 La ganancia de pesos promedio del rodeo estaria entre 20,84 Kg y 24,16 Kg, con una confianza del 97%. PAGINA 84 ESTADISTICA— C. Caprigilont 2. Intervalo de Confianza PROBLEMA 5 {Con qué confianza, el parametro varianza, fue estimado entre 209,08 y 883,23 sil intervalo fue calculado con una muestra de 23 elementos provenientes de una poblacién normal, la cual dio como resultado una varianza de 383 ?. SOLUCION A partir de los limites del intervalo para la varianza hay que calcular el nivel de confianza. > 2 rfe=ps cox st2} b a “e Hay que calcular los valores de a y de b y con ellos determinar, en la tabla de la distribucién ji — cuadrado con 22, (N-1), grados de libertad, los valores de probabilidad entonces 2 1): : =)" _ 50908 = 2% - 209,08 => b=403 > ('-4) =0,99 2 QDS _ 595.23 = 22:38 - 93235 a-954 3 (§)- 001 a a si(£)= 0 y (! 5) 099 => (1-8) =098 El parémetro varianza perteneceria al intervalo [209,08 ; 883,23] con una confianza de! 98%. PROBLEMA 6 Se requiere estimar la longitud media de las mazoreas de cierta variedad de maiz. Se sacé una muestra de 25 mazoreas la cual proporcioné una longitud media de 23,3 cm y un desvio estindar de 3,1 cm. Admitiendo que la longitud de las mazorcas sigue una ley normal, realizar la estima- cién con una confianza del 99%, SOLUCION Del enunciado se desprende que la poblacién es normal e infinita y quien proporciona el desvio estandar es la muestra, por lo tanto, se considera que la varianza poblacional es desconocida, lue- g0, el intervalo es donde n=25 5 B=B3 B Sx=3, G.L.=25-1=24 ; 1-€=099 => ( 5}=09%5 => t)=2,797 reemplazando 23,3 2,797 a xs 233 +2797 2 21,57 Spx $ 25,03 Con una confianza del 99% la longitud media de las mazorcas se encontraria entre 21,57 em y 25,03 cm. ESTADESTICA - C. Caprigllon! PAGINA 85 2.Intervalo de Confianza PROBLEMA 7 En la siguiente tabla se presentan los montos de las deudas de 80 clientes que poseen cuenta co- rriente en una empresa, seleccionados en muestra simple al azar. MONTODE CANTIDAD DE LADEUDA _|CLIENTES 1000 - 1500 o 1500-2000 17 2000-2500 [28 2500— 3000 20 3000-3500 6 Estimar con una confianza del 95%, el monto promedio de los deudores en cuenta corriente. SOLUCION Hay que construir un intervalo para el monto promedio de los deudores. El tamafio de la muestra ¢s suficientemente grande, por lo tanto, por aplicacién del Teorema Central del Limite, el coefi- ciente de confianza se obtiene de la distribucién Normal aunque no se conozca la distribucién de la poblacién. plX—z,-Se 4 =2,131 ESTADISTICA—C. Caprigilont 2. Intervalo de Confianza El valor del tamafio de muestra inicial es 2 2 2 tS: re n= ABs. ABE ig16 > m=19 e 3 Para calcular el siguiente valor del tamafio de muestra hay que utilizar GL=n-1=18 ; 1-6-0953 ; 1- ; =0975 => t=2,101 EI valor del segundo tamafio de muestra 2 262 +S: = ON 1765 => m= 18 Para calcular el siguiente valor del tamaiio de muestra hay que utilizar G.L.=n-1 El valor del tercer tamafio de muestra 2 2 t Sy 2,110? -6? == 2 e 3 Como el segundo y el tercer tamafio de la muestra son iguales, entonces, el tamafio de muestra necesario para estimar el costo medio de produccién de las lapiceras en las condiciones fijadas es n= 18 lapiceras, 17; 1-8=095 ; 975 => y= 2,110 = 1781 => n3=18 PROBLEMA 9 A\los efectos de estimar el peso medio de las bolsas de semillas recibidas en un establecimiento agropecuario, se tomé una muestra al azar de 20 bolsas con la que se calculé lo siguiente: Peso total de las 20 bolsas: Dx, =345Ke ; Suma de cuadrados: J* (x, —X)? = 304 Estimar, mediante un intervalo de confianza del 90% el peso medio de las bolsas, admitiendo que los pesos se distribuyen normalmente. SOLUCION Peso total de las 20 bolsas = xi =345 n=20 45 a y% =X) 345 Lay hee spans 3 Sx GL.=20-1=19 ; 1-8=0,90 = ( reemplazando: 4 4 17,25 — 1,729 x $17,25 + 1,729 - = wo" ou 15,70 < px < 18,80 Con una confianza de 90% el peso medio de las bolsas estaria entre 15,7 Kg y 18,8 Kg ESTADISTICA — C. Capriglloni PAGINA 87 itervalo de Confianza PROBLEMA 10 Se quiere controlar, mediante el muestreo, si el diémetro de los cafios cumplen con la especifica- cién dada por una norma. Los didmetros tienen distribucién normal con desvio estindar igual a 0,9 mm. {Cuil deberd ser el tamafio de muestra necesario para que el error de muestreo no supere 0,3 mm, ‘con una confianza del 99%? SOLUCION Hay que calcular el tamaiio de la muestra para estimar la media poblacional de poblaciones nor- males infinita cuando se conoce la varianza poblacional. _Zo-o"x 2 En este problema se tiene: 6x=09 ; e=03 ; 16-099 => 1-5-0995 => %=2,576 Se necesita una muestra de tamaito 60 para estimar el de muestreo no superior a 0,3 mm. metro medio de los cafios con un error PROBLEMA 11 Se desea estimar el peso medio de los paquetes de caramelos envasados por una maquina. De la produccidn del dia, 1473 paquetes, se sacé una muestra de 25 paquetes obteniéndose un peso me- dio de 853 gr y un desvio estindar de 47 gr. Realizar la estimacién con una confianza del 95% sabiendo que el peso de los paquetes se distribuye normalmente. SOLUCION De acuerdo al enunciado del problema, la poblacién es normal, finita y no se conoce la varianza poblacional, por lo tanto el intervalo es of -t Los datos de este problema son: N=14730 0; n=25 ;) Sx=47 ; G.L.=25-1=24 3 1-6 95 => (:-$}-09= ty= 2,064 Aungue la fraccién de muestreo sea inferior a 0,10 igualmente se utilizaré el intervalo para pobla- ciones finitas. El intervalo es entonces: 853 -2,064- 22, Spx s 853 + 2,064 AS 833,76 < px < 872,24 El peso medio de los paquetes estaria entre 833,76 g y 872,24 g, con una confianza del 95%. PAGINA 88 ESTADESTICA — C. Caprigtioni Intervalo de Confianza PROBLEMA 12 En un depésito hay 753 bolsas de semillas. Se desea estimar el peso medio de ellas sobre la base de una muestra al azar, de manera tal, que el error de muestreo no sea superior a 1,5 Kg con una confianza de! 98%. ,Cual deberd ser el tamafio de la muestra si se sabe que los pesos se distribu- yen normalmente con desvio estindar 4,8 Kg? SOLUCION De acuerdo con el enunciado del problema, la poblacién es normal, su tamafio es finito, hay 753 bolsas, y se conoce la varianza (esta el valor del desvio estndar), por lo tanto la formula a utilizar es: zo-0°-N : e*-(N=1)+2z70-07 En este problema se tiene: ox= 48" 5 e=15 5 N=753 16=098 > 1- =099 > m=2,326 2,326" -4,8° +753 15° - (753-1) +2,3267 -4,8° = 51,668 => n=52 Se necesitan como minimo 52 bolsas de semillas para estimar su peso medio, con un error de muestreo no superior a 1,5 y una confianza del 98%. PROBLEMA 13 Los siguientes datos corresponden al peso, en gramos, de 25 zapallos, seleccionados al azar. PESODELOS | CANTIDAD DE ZAPALLOS ZAPALLOS 400 ~ 420 3 420 - 440 4 440 ~ 460 8 460 - 480 1 480 — 500 3 Sabiendo que el peso de los zapallos se distribuye normalmente, estimar con una confianza del 99%, el peso medio y la varianza, SOLUCION Del enunciado se desprende que la poblacién es normal e infinita. El desvio esténdar se calcula con la muestra, por lo tanto, se considera que la varianza poblacional es desconocida, luego, el intervalo es ESTADISTICA — C. Caprigilont PAGINA 89 2.Intervalo de Confianza Utilizando las correspondientes formulas se calculan, el promedio y la varianza de la muestra =452,4 5; $'x=577,33 n=25 ; G. 5—-1=24 ; 1-8=099 => [-g]-o%s => = to=2,797 reemplazando 24,0277 24,0277 452,4 — 2,797 Spx <452,4 + 2,797. — icBee WB 438,96 < px < 465,84 Hay que estimar la varianza poblacional 2 2 {evs X coy < MaS'x a n=25 ; GL.=(n-1)=24 3 1-6=0,99 $= 0005 = a=989 0,995 => b=45,56 reemplazando 24-577,33 «92 <24-577,33 4556S (O89 304,12 < ox < 1401,00 El peso medio de los zapallos se estima entre 438,96 y 465,84 gramos y la varianza se estima en- tre 304,12 y 1401,00 con una confianza del 99%. PROBLEMA 14 En un banco, 500 clientes son titulares en cuenta corriente, Se desea estimar el monto medio de los saldos (en miles de pesos) de dichas cuentas. Se seleccioné una muestra piloto de 18 cuentas y se obtuvo una varianza de 23,5. El error de muestreo se fijé en $2 y la confianza de la estimacién, €n 99%. Sabiendo que el saldo se distribuye normalmente, determinar el tamafio de muestra nece~ sario, SOLUCION De acuerdo con el enunciado del problema, la poblacién es normal y finita, su tamaiio es 500, y no se conoce la varianza poblacional, por lo tanto hay que utilizar el método iterativo. Los datos del problema son: e=2 F No = 18 (tamafio de la muestra piloto) ; N= 500 $?x=23,5 (Varianza muestral calculado con la muestra piloto) Gli-nm-1=17 5 1-8=099 ; 1-5-0995 = =2,898 El valor del tamafio de muestra inicial es 2,8987 -23,5-500 = 44,990 => m=45 e?-(N-1)+#7).8’x 2? -(500—1) + 2,898" - 23,5 Para calcular el siguiente valor del tamafio de muestra hay que utilizar =440; 0 1-8= 99; 1-5-0995 > b=2,692 El valor del segundo tamafio de muestra PAGINA 90 ESTADISTICA - C. Caprigiioni 2. Intervalo de Confianz. 2,692? -23,5-500 e?(N=1)+t72-S*x 2? -(500—1) + 2,692" - 23,5 Para calcular el siguiente valor del tamafio de muestra hay que utilizar = 39307 => m=40 GL.=n-1=39 ; 1-8=099 ; =0,995 => — =2,708 El valor del tercer tamafio de muestra t2-S?x-N 2,708" - 23,5500 = = 09788 m= 40 e° (N=1)4t73-S°x 27 -(500-1) + 2,708" - 23,5 Como nz y Ns son iguales, el tamaiio de la muestra es n = 40 cuentas. PROBLEMA 15, De un lote de 200 pilas secas, fabricadas en un turno, se sacé una muestra de 20 pilas para estimar Ja duracién media, en minutos. De la muestra se obtiene una duracién media de 780 minutos y un desvio estindar de 28 minutos. Admitiendo que la duracién tiene una distribucién normal, estimar Ja duracién media del lote con una confianza del 98%. SOLUCION De acuerdo al enunciado del problema, la poblacidn es normal, finita y no se conoce la varianza poblacional, por lo tanto el intervalo es efi Los datos de este problema soi N=200 ; m=20 ; Sx=28 ; 780 G.L.=20-1=19 ; 1-€=0,98 > (1-5}-0 => to=2,539 El intervalo es entonces: 28 [200-20 28 780 - 2,539 Spx S780 +2,539- =, Ta0¥ 200-1 ~** 420 ¥ 200-1 764,88 < wx < 795,12 La duracién media de las pilas estaria entre 764,88 horas y 795,12 horas, con una confianza del 95%, PROBLEMA 16 Se desea estimar el porcentaje de manzanas que resultan no comercializables cuando se las some- tea un almacenamiento con una temperatura de 5° C durante 20 dias. De una muestra de 265 manzanas, resultaron 54 no comercializables. Realizar la estimacién con una confianza del 99%, SOLUCION Se trata de un problema de estimacién de la proporcién poblacional ain cuando lo solicitado sea en porcentaje. Dado que no se conoce el tamafio del universo, hay que considerarlo infinito, luego cl intervalo es ofr 25+ } =l-8 En este problema se tiene: ESTADISTICA ~ C. Caprigtion! PAGINA S2 ST 0,995 = 9 =2,576 el intervalo es: anno 992 <%<0,2038 +2,576- 58 0,7962 0,1401 < 1 < 0,2675 Con una confianza del 99% el porcentaje de manzanas no comercializables estaria entre el 14,01% y el 26,75%. 0,2038 — 2,576 - PROBLEMA 17 Se desea estudiar el peso de las semillas de lino. Una muestra de 272 semillas proporcioné un peso medio por semilla de 0,0053 gramos y un desvio estindar de 0,0011 gramos. Estimar, me- diante un intervalo de confianza del 97% el peso medio de las semillas de lino. SOLUCION El tamafio de la muestra es suficientemente grande, por lo tanto, por aplicacién del Teorema Cen- tral del Limite, el coeficiente de confianza se obtiene de la distribucién Normal. PlX-z, Se z=2,054 8 2 el intervalo es: 0,85 — 2,054 STS 0,85 + 2,054 0,8334 < TE < 0,866 Con una confianza del 99%, el poder germinativo de las semillas estaria entre 83,34% y el 86,66%. PROBLEMA 19 Se desea estimar la produecién media diaria de leche, por vaca, cuando son alimentadas con una dieta especial. Para ello se midié la produccién de 5 vacas de similares caracteristicas, alimenta- das con la dieta especial en un dia determinado, obteniéndose los siguientes resultados, en litros. 143 5 181 ; 142 ; 15,2 ; 16,7. Realizar la estimacién con una confianza de 95%. SOLUCION Notese que no hay informacién acerca de la distribucién de la poblacién produccién diaria de leche por vaca y dado que la muestra es chica, hay que utilizar el intervalo que surge de la aplica- cidn de la desigualdad de Tehebycheff. =, 9, =, S: P)X-k- sp, sX+k-—Xhoi-e { mm wn pero, dado que la varianza poblacional es desconocida, hay que trabajar con la varianza muestral, luego el intervalo es = S, - P\X-k-—S sp, sX+! 2l-e { int a n=5 5 18=095 e005 k= | = 4472 0,05 Utilizando los datos del problema y aplicando las formulas correspondientes se obtiene lo siguien- te: R=157 3 Sx=1,6748; el intervalo es: 15,7-4,472 « 12,35 < px < 19,05 Con una confianza del 95% la produccién media diaria de leche por vaca estaria entre 12,35 litros y 19,05 litros. PROBLEMA 20 Segiin una investigacién realizada en una ciudad, por una institucién, sobre la base de una mues- tra de 8740 viviendas, se estimé que la proporcién de viviendas desocupadas esté entre e! 28,74% -y31,26%. Sabiendo que la cantidad de viviendas desocupadas en la muestra fue 2622, determinar 1a confianza de la estimacién. SOLUCION Se trata de un problema de estimacién de la proporcién poblacional de universos infinitos. ESTADISTICAC. Caprigtion! PAGINAS3 2.Intervalo de Confianza PfPn: PA smsp+2,- |. -8 de acuerdo al enunciado, el intervalo es 0.2874 << 0,3126 luego P-z,- EA = 02874 y p+z, 03126 n De cualquiera de las dos expresiones hay que calcular el valor de zo y con él, en la tabla de la fun- cidn de distribucién normal, se determina el valor de probabilidad. n=8740 ; F=2622 => p=030 y q=0,70 entonées, tomando el limite inferior 0,30-0,70 0,30 - zo 2874 => my=2,57 8740 Buscando en la tabla de la funcién de distribucién normal F(2,57)=0,99492, => 1- ; =0,99492 => 1-€ = 0,98984 = 0,99 La proporcién de viviendas desocupadas se estima entre el 28,74% y el 31,26% con una confianza del 99%, PROBLEMA 21 El otal de clientes que asiste a un supermercado, un dia lunes es de 2700. El tiempo que tardan en realizar sus compras sigue una distribucién normal, con desvio tipico 15 mimutos. Se desea estimar el tiempo medio que se tarda en realizar las compras. a) De que tamafio debe ser la muestra si se quiere que el error de muestreo no supere los $ minu- tos, con una confianza del 97%? b) Con la muestra, cuyo tamaiio fue calculado en el punto anterior, se obtuvo un tiempo medio de 47 minutos. Estimar, con una confianza del 97% el tiempo medio que tardan los clientes en efec- tuar sus compras. SOLUCION De acuerdo con el enunciado del problema, la poblacién es normal, su tamaiio es finito y se cono- ce la varianza (esta el valor del desvio estindar), por lo tanto la formula a utilizar es: 2 2 z3-0°.N e?-(N-1)+z)-07 En este problema se tiene: Ox=1F 5 e=5 5 N=2700 12=097 > 1-5 0985 => w=2,170 2,170" «15? 2700 5? -(2700~1) + 2,170 -15" Se necesitan como minimo 42 clientes para estimar el tiempo medio de compras, con un error de muestreo no superior a 5 minutos y una confianza del 97%. 41,74 > n=42 PAGINA94 ESTADISTICA ~ C. Caprigtiont 2. Intervalo de Confianza ) Como la poblacién es normal, finita y se conoce la varianza poblacional, el intervalo de con- fianza es. Datos del problema N= 2700 ; n=42 3 Ox=15 1-6=097 > 1-5 =0,985 = 2)=2,170 Aunque la fraccién de muestreo sea inferior a 0,10 igualmente se utilizaré el intervalo para pobla- ciones finitas, El intervalo es entonces: px<47+2,170- 2 Ta 47-2,170 42spxss2 El tiempo medio que tardan los clientes del supermercado en efectuar sus compras estaria entre 42 minutos y 52 minutos con una confianza del 97 %. PROBLEMA 22 De acuerdo con el resultado de! iltimo censo, en la ciudad COURIER hay 37904 matrimonios (oficiales 0 no). De éstos se sacé una muestra de 10900 encontrindose que el 38% de la muestra no tienen hijos. Estimar, con una confianza del 97%, el porcentaje de matrimonios sin hijos en la poblacién, SOLUCION Se trata de un problema de estimacién de la proporcién poblacional aun cuando lo solicitado sea en porcentaje. Se conoce el tamafio del universo, luego el intervalo a utilizar es = p-q_ [N-n 5 IN-n ofp-n PS oy S*SB +2," x FR -- En este problema se tiene N=37904 ; n=10900 ; p=038 ; 470,62 1-8=0,97 > 1-5 = 0,985 => m=2,170 el intervalo es 038-2,170- [os 2 [SPF 10900 << 9.38 + 2,170 oreo [37904-10900 10900 37904—1 10900 37904—1 0,3715 < TE < 0,3885 Con una confianza del 97%, la proporcién de matrimonios, oficiales o no, con hijos en la ciudad COURIER estaria entre 0,3715 y 0,3885. O, con una confianza del 97%, la proporcién de matri- monios, oficiales 0 no, con hijos en la ciudad COURIER estaria entre el 37,15% y el 38,85%. PROBLEMA 23 Los siguientes datos corresponden a una muestra de 390 facturas de ventas tomadas al azar de las ESTADISTICA ~ C. Caprigilont PAGINA 95 2.Intervalo de Confianza 4804 realizadas en el mes. IMPORTE EN CANTIDAD DE PESOS CLIENTES 800-850 23 850-900 48 900-950 74 950 - 1.000 98 1,000 - 1.050 61 1,050 - 1.100 42 1.100 - 1.150 25 1.150 - 1.200 19 a)Estimar el monto medio por ventas, en el mes. )Estimar la proporcién de ventas con monto superior a $1000. Nivel de confianza 95%. SOLUCION Hay que construir un intervalo para el monto medio de las ventas. El universo es finito y el tama- flo de la muestra es suficientemente grande, por lo tanto, por aplicacién del Teorema Central del Limite, el coeficiente de confianza se obtiene de la distribucién Normal aunque no se conozca la. distribucién de la poblacién. N=4804 ; La media aritmética y el desvio estandar de la muestra se calculan usando las correspondientes formulas X=982,31 ; S’x=7857,77 => Sx= 88,64 1-8=0,95 ; 0,975 = zo = 1,960 entonces 982,31 1,96. SBS%, [ASOK— 30 SPS 982,31 + 1,96 4390 VW 4804-1 973,88 < W< 990,74 El monto promedio de los deudores en cuenta corriente estaria entre $973,88 y $990,74 con una confianza del 95%. ») Se trata de un problema de estimacién de la proporcién poblacional de universos finitos ya que se conoce el tamaiio del universo, luego el intervalo a utilizar es En este problema se tiene N=4804 ; n=390 PAGINA 96 ESTADISTICA — C. Caprigiion! Intervalo de mz El atributo cuya proporcién se quiere estimar es monto de la venta superior a $1000. La canti- dad de ventas con monto superior a $1000 es 147, luego =M47 > p 0377 => | =0,623 1-8=095 ; 1-$ = 0975 = 29 1,960 el intervalo es 0377 ~ 1,960. [O377-0.623 [eu=a0 390 «ae <0,3774 1,960. erro 0,623 [4804-390 390 4804-1 4804—1 0,331. < 10 < 0,423 La proporcién de las ventas con monto superior a $1000 estaria entre el 33,1% y el 42,3% con una confianza del 95%, PROBLEMA 24 El costo medio se estimé entre $268,3 y $294,3. Este intervalo fue calculado con una muestra de 16 unidades la que proporcioné una varianza igual a 400, Calcular la confianza de la estimacién sabiendo que los costos se distribuyen normalmente. SOLUCION Lapoblacion es normal, infinita, pero no se conoce la varianza (el dato del problema es la varian- za muestral), luego el intervalo es: lit, een, Sx=20 La media muestral se calcula haciendo la semisuma de los limites del intervalo Li(X)+Ls(X) _ 268,34 2943 = 281. 2 3 entonces, tomando el limite inferior 20 281,3- to == =2683 > =26 iG Buscando en la tabla de la funci6n de distribuci6n t de Student con 15 grados de libertad ESTADISTICA — C. Caprigtloni PAGINA 97 intervalo de Confianza F(2,6)=0,99 => 099 => 1-8=0,98 La estimacién fue realizada con una confianza del 98% PROBLEMA 25 Se desea estimar la proporcién de personas adultas que consumen café en el desayuno. ,Cual de- bberd ser el tamagio de la muestra necesario si se desea que el error de muestreo sea inferior al 2% con una confianza del 98%?. Mediante una prueba piloto se estimé que la proporcién puede ser del 60%. SOLUCION Nose conoce el tamafio del universo, porlo tanto se lo considera infinito, luego, la formula a uti- lizar es: En este problema se tiene P=060 ; q=l-p =0,40 > e=0,02 1-8=0,98 => 1-5 =099 > 2 = 2,326 2,326° -0,60- 0,40 ary 3246,1656 => n= 3247 ‘Se necesita una muestra de 3247 personas para estimar la proporcién de consumidores de café en el desayuno en las condiciones establecidas. PROBLEMA 26 Se tomé al azar una muestra de 5 latas y se determiné el contenido en gramos de cada una de ellas, obteniéndose: 220 ; 225 ; 240 ; 225 ; 235 Estimar, con una confianza del 90% el peso medio y la varianza de las latas, sabiendo que el peso de las latas tiene distribucién normal. SOLUCION Utilizando las formulas correspondientes se calculan la media aritmética y la varianza de la mues- tra X=229 0; S*x=67,5 > Sx = 8,216 La poblacién es normal, infinita y no se conoce la varianza poblacional, luego, el intervalo de confianza para la media es — = S, PiX-t, Sp, SX+t)-pal-e 1. 3%+4, Se} 3 1€=090 => 1-5 =095 => to= 2,132 n=5 => GL Reemplazando se obtiene 221,166 < ps < 236,834 El intervalo para la varianza es PAGINA 98 ESTADISTICA ~ C. Caprigiiont 2. Intervalo de Confianza 2 2 p {ep co's <0 Sie b a n=5 > GL=4 ; Le 90 => ; =0,05 > a= O71 y e =0,95 => b=9,49 2 Reemplazando se obtiene 28,451 < 0? < 379,747 El peso medio estaria entre 221,17 gr. y 236,83 gr. y la varianza estaria entre 28,451 y 379,747 con una confianza del 90%. PROBLEMA 27 ‘Una empresa desea implementar un sistema de control de tiempos de realizacién de cierta tarea a fin de disminuir costos. No tiene ningin tipo de informacién previa respecto a dichos tiempos y necesita determinar la cantidad minima de operarios que deberin ser observados para estimar el tiempo medio en forma permanente. Se ha establecido una confianza del 95% y un error de muestreo no mayor a 1,5 minutos. Pero, para lograr una estimacién de la varianza se se- leccioné una muestra piloto de 5 operarios, obteniéndose los siguientes tiempos (se supone distri- bucién normal) 334 5 31,2 ; 288 ; 29,5 ; 321 Determinar el tamaiio de muestra para control permanente. SOLUCION Hay que utilizar el método iterativo. El tamafio de muestra inicial se calcula con la formula ts? o Con los datos de 1a muestra piloto se calcula la varianza muestral para iniciar el método iterativo no=5 5 S'x=3,525 5 e=15 GL=nm-1=4 ; 18=095 > 1-5 =095 > t=2,776 entonces, el tamafio de muestra inicial es h 2,776? -3,525 2,073 => m=13 3 1e=095 => 1-550975 > =2,179 2 2. n= O38 7438 > m=8 15 ; 18=0,95 = 1-5-0975 = 2,365 2,3657 -3,525 8,763 => 5-9 tervalo de Confianza 2,306 «3,525 1s" =833 > my=9 Como el tercer y el cuarto tamafio de la muestra son iguales, entonees, el tamafio de muestra ne- cesario para el control permanente es n = 9 operarios. PROBLEMA 28 La resistencia de cierto tipo de conductores se distribuye normalmente con un desvio estindar igual a 0,0030. Con una muestra de 20 conductores se estim6 la resistencia media entre 0,14370 y 0,14630 con una confianza de 99%. ; Cudntos conductores mas deberian seleccionarse si se quiere reducir la amplitud del intervalo anterior en un 10% manteniendo el mismo nivel de confianza? SOLUCION El intervalo calculado corresponde a un intervalo para la media poblacional de poblaciones nor- males infinitas of He

ue = 0,995 => 2 = 2,576 se calculé el intervalo 0,1437 << 0,1463 luego, la amplitud total es A=Ls(X)—Li(X) = 0,1463 - 0,1437 = 0,0026 yelerror de muestreo es A_1s(X)-Li(X) 2 2 2 Si se quiere reducir la amplitud del intervalo el 10% entonces habré que multiplicarla por 0,90. La amplitud modificada es 2 0,0013 ,90 + A = 0,90 - 0,0026 = 0,00234 y el nuevo error de muestreo es = AL. 0,00234 2 por lo tanto, e! nuevo tamaiio de la muestra es =0,00117 2o-0°x _ 2,576" -0,0037 e 0,00117° El nuevo tamaito de la muestra para reducir la amplitud del intervalo en 10% es 44, por lo tanto, se necesitan 24 conductores mas =43,62 = n’=44 PROBLEMA 29 De experiencias anteriores, se sabe, que un empleado calificado, que realiza 4000 registros dia- PAGINA100 ESTADISTICA.- C. Caprigliont intervalo de Confianza rios, comete un 8% de errores. Se desea estimar el porcentaje de errores en un dia determinado. {De qué tamafio debera ser la muestra si se quiere que el error de muestreo no supere el 2%, con una confianza del 97% ? SOLUCION De acuerdo con el enunciado del problema, el universo es finito, son 4000 registros, por lo tanto la formula a utilizar es: e?-(N-1) +270 En este problema se tiene P-008 ; q=1-p=092 5 e=0,02 1-€= 0,97 => 1-—=0,985 => z= 2,170 2,170" -0,08-0,92- 4000 e-(N-1)#270-P-q 0,02" -(4000-1)+2,170? - =713 ,08- 0,92 Se necesita una muestra de 713 registros para estimar la proporcién de errores diarios en las con- diciones establecidas. PROBLEMA 30 En cierta regién del pais se estimé, con una muestra de 9740 viviendas, el porcentaje de viviendas desocupadas entre el 28,80% y el 31,20% con una confianza del 99%. ; Cul deberd ser el tamatio de la muestra si se quiere reducir la amplitud del intervalo en un 15% manteniendo el mismo ni- vel de confianza? SOLUCION El intervalo calculado corresponde a un intervalo para la proporcién poblacional de universos infinitos 5. E s EE ef: an SSB 425° ae n=9740 ; 1-€ = 0,99 > Le =0,995 => z= 2,576 con se calculé el intervalo 0,2880 < 7 < 0,3120 luego la estimacién puntual es X) _ 0,2880-+0,3120 = 0,30 => q =0,70 2 ™~s Iuego, 1a amplitud total es A=Ls(X) —Li(X) = 0,3120 - 0,2880 = 0,0240 y el error de muestreo es ESTADISTICA - C. Caprigtioni PAGINA 101 Intervalo de Confianza _A_1sQ%)-Li® _ 0,0240 e aoa") 2 2 2 = 0,0120 Si se quiere reducir la amplitud del intervalo el 15% entonces habré que multiplicarla por 0,85. La amplitud modificada es A‘= 0,85 - A = 0,85 - 0,0240 = 0,0204 yel nuevo error de muestreo es 04 —— =0,0102 2 por lo tanto, el nuevo tamafio de Ia muestra es 2o-P-G _ 2,576" -0,30-0,70 e 60,0102 El nuevo tamajio de la muestra para reducir la amplitud del intervalo en 15% es 13395. nv 13394,01153 => n’ = 13395 PROBLEMA 31 ‘Se desea realizar un estudio con respecto a la eficiencia, medida con un determinado indice, de Jos 500 empleados de una empresa. Hay elementos de juicio suficientes para suponer que el indice de eficiencia se distribuye normalmente pero no se tiene informacién de la varianza, por lo tanto se tomé una muestra piloto de 10 empleados obteniéndose un desvio estindar igual a 17. Se ha decidido utilizar una muestra, {Cul deberd ser el tamafio de la muestra, si se quiere estimar la eficiencia media con una confianza del 98% y un error de muestreo no superior a 5? SOLUCION El tamafio de la muestra inicial se calcula con la formula t2-S°x.N e?(N-1)+t)-S?x Los datos de este problema son y= 10 7 Sx=289 0; e=5 ; N=500 GL=m-1=9 3 18-098 > 1-5 =0.99 => t=2,821 El tamafo inicial de la muestra es 2 ni, = PERE 289500783 > maT 5? -499-+ 2,821" -289 GL=n-1=77 ; 1-6=098 ; -$=099 => =2376 2,376" +289. nny = 2500 = 57998 > m= 58 5*-499+2,376" -289 GL=m-1=57 5 1-8-0988 ; 1-5 =099 = =2,394 PAGINA 102 ESTADISTICA ~C. Caprigliont Intervalo de Confianza 2,394? - 289-500 5” .499+ 2,394? - 289 = 58,605 => my=59 G.L.=n3-1=58 3 1-8=098 | 2,392? -289-500 = —@@§£$$ = 58518 > m=59 5? «4994 2,392 - 289 Como el tercer y el cuarto tamaiio de la muestra son iguales, entonces, el tamafio de muestra ne- cesario para estimar la eficiencia media en las condiciones fijadas es n = 59 empleados. PROBLEMA 32 El tiempo que tarda un operario en armar un sistema electrénico fue estimado entre 10,8 y 11,2 minutos mediante una muestra de tamaifo 25. Calcular la confianza de la estimacién sabien- do que los tiempos se distribuyen normalmente con desvio esténdar igual a 0,5 minutos. SOLUCION Se trata de un intervalo de confianza para la media poblacional de poblaciones normales infinitas cuando se conoce la varianza poblacional P\X—z, S&S, SX+z,-55 -2, = z -e oF By Th Para calcular la confianza de la estimacién, dado que ésta es un valor de probabilidad, hay que conocer el valor de zo y con é1, mediante el uso de la tabla de la Funcién de Distribucién de la distribucién normal hay que determinar el valor de probabilidad. De acuerdo al enunciado, el intervalo es 10,8 m=2 25 Buscando en la tabla de la funcién de distribucién normal F(2)=097725 => I1- ; =097725 => 1-€=0,9545 La estimacién fue realizada con una confianza del 95,45%. ESTADISTICA ~ C. Caprigtion! PAGINA 103, 2.Intervalo de Confianza PROBLEMA 33, Se tomé una muestra de 145 graduados de una determinada carrera universitaria, para estudiar el tiempo que les tomé obtener su titulo de grado. El tiempo medio de la muestra es de 5,8 afios con un desvio esténdar igual a 1,18 afios. Estime, con una confianza del 98% el tiempo medio para graduarse en dicha carrera. SOLUCION n=145 ; X=58 ; Sx=1,18 En este problema no se sabe cual es la distribucién del tiempo para obtener el titulo de grado, pero como el tamafio de la muestra es suficiente grande la media de la muestra se distribuye asintéti- camente normal. Entonces el intervalo correspondiente es =. §, 5 [Ra Sesn,sX+a, + 1-8 =098 = 1-5 =0.99 => m=2,326 Li=5,572 ; Ls = 6,028 El tiempo para graduarse en una carrera universitaria se estima, con una confianza del 98%, entre 5,572 y 6,028aitos. PAGINA 104 ESTADESTICA~ C. Caprigtion! 3. PRUEBA DE HIPOTESIS 3.1. INTRODUCCION Eneste capitulo se estudiaré el proceso para decidir si una determinada afirmacién acerca de una poblacién (0 de varias poblaciones) esté sustentada por una evidencia experimental ob- tenida a través de una o mas muestras extraidas de dichas poblaciones bajo estudio, En forma general, las afirmaciones se refieren al valor numérico desconocido de los pard- cionales desconocidas. Dado que el tipo de muestreo que se utiliza es el Probabilistico, 1a decision, acerca de si los datos muestrales apoyan estadisticamente Jas afirmaciones correspondientes, se toma basindose en el valor de la probabilidad de cometer errores en dicha decisién y consecuentemente, en la accién que se realice. El enfoque de este capitulo, asi como el del resto del trabajo, ser mas intuitivo que teéri- co ya que se considera que, desde este punto de vista, e! lector puede obtener una mejor idea de Jos fundamentos de la prueba de hipétesis. 3.2. DEFINICIONES BASICAS * _ HIPOTESIS ESTADISTICA Se llama HIPOTESIS ESTADISTICA a cualquier afirmacién o | aseveracién que se formula acerca de cualquier caracteristica po- blacional (el valor numérico de un parémetro, la forma funcional de una poblacién, etcétera). . HIPOTESIS PARAMETRICA Se llama HIPOTESIS PARAMETRICA a aquella HIPOTESIS ES- ‘TADISTICA planteada para controlar o verificar el valor numérico de un pardmetro. Elresto de este trabajo estard referido a HIPOTESIS PARAMETRICAS. A los efectos de este capitulo, se postula un determinado valor, Qo, del parémetro a probar, y se consideran s6lo tres posibles situaciones mutuamente excluyentes, a saber: 1. El valor numérico del pardmetro @ es exactamente igual al valor postulado 8) 2. Bl valor numérico del parimetro es menor que el valor postulado ®y 3. El valor numérico del parametro @ es mayor que el valor postulado ®) De acuerdo con la situacién que se trate, o sea, de acuerdo al o a los posibles valores de! parémetro, la persona que ha encomendado una tarea estadistica realizard una determinada accién. = CURSO DE ACCION ‘Se llama CURSO DE ACCION a /a accién que se llevaria a cabo, si se conociese el verdadero valor del pardmetro . + DESIGUALDAD EQUIVALENTE A LA IGUALDAD Se llama DESIGUALDAD EQUIVALENTE A LA IGUALDAD a aquella desigualdad entre el pardmetro @ y el valor postulado Qo, que provoca el mismo CURSO DE ACCION que se llevaria a cabo con la igualdad entre el valor del pardmetro @ y el valor postulado o. ESTADISTICA— C. Caprigllont PAGINA 105 3. Prueba de Hipstesis * DESIGUALDAD NO EQUIVALENTE A LA IGUALDAD Se llama DESIGUALDAD NO EQUIVALENTE A LA IGUALDAD a aquella desigualdad entre el pardmetro @ y el valor postulado @., que provoca un CURSO DE ACCION distinto al quese llevariaa cabo con la igualdad entre el valor del pardmetro @ y el valor pos- tulado ®o. Ejemplo 3.1 Los paquetes de yerba mate que se producen en la empresa yerbatera MATE Y MATE, de acuer- do con una norma, deben tener un peso medio de 1050 g. El proceso de llenado de los paquetes se realiza con una maquina automética. Si el peso medio es igual a 1050 g el proceso no se detiene. Si el peso medio de la produccién resultara inferior o superior a 1050 g, se debe detener el proce- so y revisarlo. a) {Cual es el parametro que se quiere controlar? b) Establezea los cursos de accién a seguir. ) Indique si hay desigualdad equivalente a la igualdad. SOLUCION a) El pardmetro que se quiere controlar es la Media Poblacional. b) Los posibles cursos de accién son: Si f= 1050, entonces, NO SE DETIENE EL PROCESO. Si p< 1050, entonces, SE DETIENE EL PROCESO Y SE LO REVISA Si f1> 1050, entonces, SE DETIENE EL PROCESO Y SE LO REVISA ©) No hay desigualdad equivalente porque ninguna de las desigualdades provoca el mismo curso de accién que la igualdad. Ejemplo 3.2 La proporcién de consumidores de yerba que utilizan la marca MATE Y MATE, de acuerdo con las tltimas mediciones, es del 28%. Se implement6 una campafia publicitaria para tratar de au- mentar dicha proporcién. Si esto se lograse, significaria que la campafia ha dado resultado y se continuaria con ella, caso contrario si la proporcién de consumidores continia siendo del 28% o ha disminuido, la campaiia publicitaria sera suspendida. a) {Cual es el parametro que se quiere controlar? ) Establezea los cursos de accién a seguir. c) Indique si hay desigualdad equivalente a la igualdad, SOLUCION a) El parmetro que se quiere controlar es la Proporcién Poblacional. b) Los posibles cursos de accién son: Si = 0,28, entonces, NO SE CONTINUA CON LA CAMPANA PUBLICITARIA Si 7 <0,28, entonces, NO SE CONTINUA CON LA CAMPANA PUBLICITARIA Si E> 0,28, entonces, $i SE CONTINUA CON LA CAMPANA PUBLICITARIA. c) La desigualdad menor es una desigualdad equivalente a la igualdad, porque si el parametro es menor al valor postulado 0,28 se leva a cabo el mismo curso de accién que si es igual a 0,28. En ambos casos no se continda con la campaiia publicitaria PAGINA 106 ESTADISTICA ~C. Caprigiioni 3.Prueba de Hipstesis * HIPOTESIS NULA ‘Se llama HIPOTESIS NULA a aquella hipétesis que establece que la diferencia entre el verdadero valor del pardmetro ®, y el valor que se postula Qo, es cero. El simbolo habitual de la HIPOTESIS NULA es Ho Porla definicién antedicha, necesariamente, la HIPOTESIS NULA debe plantearse como la igualdad entre el valor de parémetro y el valor postulado. :0=0 Ahora bien, a los fines précticos, esta igualdad puede estar acompafiada o no por alguna de las dos desigualdades, segin sea el CURSO DE ACCION a seguir y la existencia o no de alguna DESIGUALDAD EQUIVALENTES. Sobre la base de esto, se pueden distinguir dos tipos de HIPOTE- SIS NULAS, a saber: ~ HIPOTESIS NULA UNICA: Una HIPOTESIS NULA es UNICA cuando no hay DES- IGUALDAD EQUIVALENTE. Eneste caso, se postula un tinico valor posible para el parémetro @, Si el tnico valor pos- tulado del pardmetro @ se simboliza Q, entonces el planteo de la HIPOTESIS NULA UNICA es Ho:0=0 yse lee “El valor de pardmetro ® es igual al valor postulado @)” ‘También puede expresarse Ho: 6 -6)=0 yse lee: La diferencia entre el verdadero valor del pardmetro @ y el valor postulado, Qo, es cero“? - HIPOTESIS NULA MULTIPLE: Una HIPOTESIS NULA es MULTIPLE cuando hay una DESIGUALDAD EQUIVALENTE. En este caso, se postula un conjunto semicerrado de posibles valores del parametro @. Si hay una desigualdad equivalente, ésta debe acompafiar a la igualdad porque ambas provocan el mismo curso de accién; en este caso, se pueden diferenciar dos planteos de HIPOTESIS NULA MULTIPLE, a saber, 1- Si la DESIGUALDAD EQUIVALENTE es la desigualdad menor, entonces la HIPOTESIS NULA MULTIPLE es Ho:8< yselee El valor de parmetro ® es igual 0 menor al valor postulado ® ‘También puede expresarse Ho:0-0)<0 yse lee: La diferencia entre el verdadero valor del pardmetro @ y el valor postulado, @o, es menor o igual a cero” 2- Si la DESIGUALDAD EQUIVALENTE es la desigualdad mayor, entonces la HIPOTESIS NULA MULTIPLE es Ho: 620 ysselee El valor de pardmetro @ es igual 0 mayor al valor postulado ® ESTADISTICA — C. Capriglioni PAGINA 107 Prueba de Hipstesis También puede expresarse Ho: 8-020 yse lee: La diferencia entre el verdadero valor del parémetro @ y el valor postulado, @, es mayor o igual cero" © Bstos enunciados justifican el nombre de HIPOTESIS NULA *_ HIPOTESIS ALTERNATIVA. ‘Se llama HIPOTESIS ALTERNATIVA a aquella hipotesis que de- beria cumplirse si la HIPOTESIS NULA no es cierta El simbolo habitual de la HIPOTESIS ALTERNATIVA es H1 « Segiin los objetivos del trabajo, la HIPOTESIS ALTERNATIVA puede ser de dos tipos: - HIPOTESIS ALTERNATIVA UNICA: Una HIPOTESIS ALTERNATIVA es UNICA cuan- do hay un solo valor alternativo del parametro @, el @,, que deberia ser en el caso de que la HIPOTESIS NULA no sea cierta. La expresi6n H1:0=6, se lee: “Si la HIPOTESIS NULA no es cierta, entonces, el valor de pardmetro ® deberia ser igual a 8,” - HIPOTESIS ALTERNATIVA MULTIPLE: Una HIPOTESIS ALTERNATIVA es MULTI- PLE cuando hay un conjunto abierto de posibles valores alternativos del parametro 8, en caso de que se rechace la HIPOTESIS NULA. ‘De acuerdo con el tipo de HIPOTESIS NULA que se plantea, se distinguen tres formas mu- tuamente excluyentes de plantear la HIPOTESIS ALTERNATIVA MULTIPLE 1- Si la HIPOTESIS NULA es UNICA, 0 sea, sino hay DESIGUALDAD EQUIVALENTE, Ho:6= 0 entonces se plantea la siguiente HIPOTESIS ALTERNATIVA MULTIPLE H1:04 0. ‘Asta forma de plantear la HIPOTESIS ALTERNATIVA MULTIPLE se la interpreta: “Si la HIPOTESIS NULA no es cierta, entonces, el valor de pardmetro @ es distinto(mayor o me- nor) a ®o” Es un planteo “por distinto” 2.-Si la HIPOTESIS NULA no es UNICA, y si la DESIGUALDAD EQUIVALENTE es la desigualdad menor, Ho: 8 <0 entonces se plantea la siguiente HIPOTESIS ALTERNATIVA MULTIPLE, H1:0> 0 A esta forma de plantear la HIPOTESIS ALTERNATIVA MULTIPLE se la interpreta: “Si la HIPOTESIS NULA no es cierta, entonces, el valor de pardmetro ® es mayor a 8.” Es un planteo “por mayor” 3-Si la HIPOTESIS NULA no es UNICA, y si la DESIGUALDAD EQUIVALENTE es la desigualdad mayor, Ho: 2 PAGINA 108 ESTADESTICA~ C. Caprigilon 3.Pruca de Hipstesis entonces se plantea la siguiente HIPOTESIS ALTERNATIVA MULTIPLE H1:6<0 A esta forma de plantear la HIPOTESIS ALTERNATIVA MULTIPLE se la interpreta: “Si la HIPOTESIS NULA no es cierta, entonces, el valor de pardmetro @ es menor a Qo”. Es un planteo “por menor” . PRUEBA DE LA HIPOTESIS NU! Se llama PRUEBA DE LA HIPOTESIS NULA a un método estadi fico con el cual, a partir de los datos de una muestra aleatoria, se decide acerca de la veracidad o falsedad de la HIPOTESIS NULA formulada, pudiéndose calcular la probabilidad de cometer un error en la decisién tomada. Lahipétesis que se prueba para decidir si debe ser rechazada o no, siempre es la HIPOTE- SIS NULA, por lo tanto, en el resto de este trabajo a la PRUEBA DE LA HIPOTESIS NULA se la llamar simplemente PRUEBA DE HIPOTESIS, * ESTADIGRAFO DE PRUEBA ‘Se Hama ESTADIGRAFO DE PRUEBA, para pruebas paramétri- cas, aun estadigrafo apropiado, &p, con el que se realiza la PRUEBA DE HIPOTESIS, que mida la discrepancia, d, entre el pardmetro a probar y el estimador correspondiente y, ademés, tie- ne una distribucién de probabilidad conocida. Para poder establecer su discrepancia, en el ESTADIGRAFO DE PRUEBA deben estar pre- sentes tanto el parémetro a estimar como su correspondiente estimador. Genéricamente el ES- ‘TADIGRAFO DE PRUEBA se simboliza, = 46:6) y suvalor numérico, después de reemplazar las variables muestrales con el resultado de la mues- tra, se simboliza ep. E] ESTADIGRAFO DE PRUEBA es una variable aleatoria que se genera transformando al estimador8 , por lo tanto su dominio ®, es una transformacién del espacio muestral Ul). * REGION CRITICA Y REGION DE NO RECHAZO. El método para realizar la PRUEBA DE HIPOTESIS consiste en particionar al dominio, D, del ESTADIGRAFO DE PRUEBA, @, en dos subconjuntos o regiones mutuamente excluyentes. Segiin a cual de las dos regiones pertenezca el valor numérico del ESTAD{GRAFO DE PRUEBA, se rechaza 0 no a la HIPOTESIS NULA, Se llama REGION CRITICA, Ral subconjunto del dominio D con el que se rechaza la HIPOTESIS NULA. | Se llama REGION DE NO RECHAZO, Ra=(D- ), al subcon- junto del dominio Don el que no se rechaza la HIPOTESI NULA. 1 Recuerde que el MUESTREO PROBABILISTICO es un EXPERIMENTO ALEATORIO, ESTADISTICA — C. Caprigiioni PAGINA 109 3. Prueba de Hipstesis Si hay una DESIGUALDAD EQUIVALENTE, la REGION CRITICA esta formada por un sub- conjunto semicerrado. En este caso se dice que la prueba es unilateral. Sino hay una DESIGUALDAD EQUIVALENTE, la REGION CRITICA esté formada por dos subconjuntos semicerrados mutuamente excluyentes de igual tamafio. En este caso se dice que la prueba es bilateral, . PUNTO CRITICO Se llama PUNTO CRITICO, pe, a la frontera de la REGION CRITICA __ - Cuando la prieha es unilateral la REGION CRITICA esta formada por un conjunto semice- rrado, por lo tanto, tiay un solo (nico) PUNTO CRITICO. Si la prueba es bilateral, la REGION CRITICA esta ‘ormada por dos conjuntos semicerrados, luego hay dos PUNTOS CRITICOS. En cualquiera de las dos situaciones, los PUNTOS CRITICOS pertenecen a la REGION CRITICA, por Jo tanto, son puntos de rechazo de la HIPOTESIS NULA. . REGLA DE DECISION | Setlama RE IN aaquella regla que establece las pautas ji rechazar la WIPOTESIS NULA y se enuncia: “Si el valor numérico del ESTADIGRAFO DE PRUEBA pertenece a Ia REGION CRITICA, entonces se rechaza la HIPOTESISNULA, en caso contrario, si el valor numérico del ESTADIGRAFO DE PRUE- BA no pertenece a la REGION CRITICA, entonces no se rechaza la HIPOTESIS NULA” Simbolicamente, Si ep © R= se rechaza Ho Si ep € Re=> no se rechaza HO Dada la hipétesis nula Ho: 0 = 0 la regla de decision establece que hay que rechazarla si, luego de obtener la muestra, hacer las mediciones correspondientes y calcular el valor numérico del ESTADIGRAFO DE PRUEBA, ep, éste pertenece a la REGION CRITICA, y que no hay que rechazarla si cl ESTADIGRAFO DE PRUEBA, ep, no pertenece a la REGION CRITICA. = ERROR DE TIPOT Se llama ERROR DE TIPO | al hecho de rechazar la HIPOTESIS NULA cuando la HIPOTESIS NULA es cierta. EL ERROR DE TIPO I se simboliza (ETI) Dada la hipétesis nula Ho:6= 6) la regla de decision establece que hay que rechazarla si, luego de obtener la muestra, hacer las mediciones correspondientes y calcular el valor numérico del ESTADIGRAFO DE PRUEBA, ep, éste pertenece a la REGION CRITICA. Pero puede suceder que a pesar de que ep pertenezca a la REGION CRITICA, la HIPOTESIS NULA sea cierta. En este caso se estaria cometiendo el ERROR DE TIPO 1 ep eR / = 6) = (ETI) PAGINA 110 ESTADISTICA-C. Caprigiiont Prueba de Hipstesis . ERROR DE TIPO I ‘Se llama ERROR DE TIPO Il al hecho de no rechazar la HIPOTE- SIS NULA cuando la HIPOTESIS NULA es falsa, ELERROR DE TIPO Il se_simboliza (ETM) Dada la hipétesis nula Ho: @= 6, la regla de decisidn establece que no hay que rechazarla si, luego de obtener la muestra, hacer Jas mediciones correspondientes y calcular el valor numérico del ESTADIGRAFO DE PRUEBA, ep, éste no pertenece a la REGION CRITICA. Pero puede suceder que a pesar de que ep no pertenezca a la REGION CRITICA, 0 sea, pertenezca a la REGION DE NO RECHAZO, la HIPOTESIS NULA no sea cierta. En este caso se es- taria cometiendo el ERROR DE TIPO IT ep ¢ Re / 040) => (ETI) * NIVEL DE SIGNIFICACION Se llama NIVEL DE SIGNIFICACION a la probabilidad de come- ter el ERROR DE TIPO I, o sea, a la probabilidad de rechazar la HIPOTESIS NULA cuando es cierta, El NIVEL DE SIGNIFICA- CION se simboliza con la letra griega Ot y mide el tamaho de la REGION CRITICA __a=P(ETI) Dada la hipétesis nula Ho:@=6y y utilizando la distribucién de probabilidad del estadigrafo de prueba, es posible calcular la pro- babilidad de que su valor numérico pertenezca a la REGION CRITICA, cuando la HIPOTESIS NULA sea cierta a=P(ETI)=Plep € & / 0=6) * POTENCIA DE LA PRUEBA Se llama POTENCIA DE LA PRUEBA a la probabilidad de no | cometer el ERROR DE TIPO Ui, 0 sea, la probabilidad de rechazar Ja hipétesis nula cuando es falsa, La POTENCIA DE LA PRUEBA se simboliza_con la letra griega T1 Dada la hipétesis nula Ho: 6 = 65 y utilizando la distribucién de probabilidad del estadigrafo de prueba, es posible calcular la pro- babilidad de que el valor numérico de dicho estadigrafo pertenezca ala REGION CRITICA cuando la HIPOTESIS NULA no sea cierta, esto es, calcular la probabilidad de rechazar correctamente la hipétesis nula, TI=P(ep « & / 0 +6) Para poder calcular la potencia de la prueba, es necesario plantear una hipétesis altemativa nica, o sea, establecer un solo valor alternativo para el parémetro. ESTADISTICA — C. Caprigilon! PAGINA 111, 3. Prueba de Hipstesis II=P(ep &¢/ @=61) Si se calculan las potencias correspondientes a todos los valores posibles del parametro y se las representan gréficamente se obtiene la grafica de una funcién llamada CURVA DE POTEN- CIA, simbolizada CP(@) CP) =Ih=P(ep € Rr / 0-0) La POTENCIA DE LA PRUEBA es el complemento de la probabilidad de cometer el ERROR DE TIPOIT TI=1-P(€TI1)=1-P(ep ¢ R¢/ 6 +0) * ACCION DERIVADA - Elrechazo de la HIPOTESIS NULA induciré al investigador a realizar una determinada ac- cidn con respecto al objeto de su investigacién. Si por el contrario, no se rechaza la HIPOTESIS NOLA, entonces el investigador estard también inducido a realizar una accién, pero distinta, Cua- lesquiera de estas dos ACCIONES se DERIVAN del resultado de la prueba de hipétesis. Se llama ACCION DERIVADA a la accién que se Ileva a cabo | seguin el resultado de la decision estadistica que se tome, rechazar ono rechazar la HIPOTESIS NULA. * _ PASOS A SEGUIR PARA REALIZAR UNA PRUEBA DE HIPOTESIS PARAME- TRICA 1. Establecer el Pardmetro a probar. 2. Indicar los Cursos de Accién. 3. Verificar si hay una Desigualdad Equivalente. 4, Plantear la Hipotesis Nula y la Hipétesis Alternativa, 5. Indicar el Estadigrafo de Prueba a utilizar y su correspondiente distribucin de probabilidad, 6. Establecer la Regién Critica y el 0 los Puntos Criticos teniendo en cuenta lo siguiente: 4) Si la desigualdad no equivalente es la desigualdad menor, toda la regién critica esté ala izquierda y el punto critico es el fractil a. ») Sila desigualdad no equivalente es la desigualdad mayor, toda la region critica esté a la derecha y el punto critico es el fractil (1 - a)". c) Sino hay desigualdad equivalente la regién critica se particiona en dos. Una parte ala izquierda cuyo punto critico es el fractil (a/2) y la otra parte a la derecha cuyo punto critico es el fractil [1 - (@/2)]® 7. Plantear la regla de decision estadistica para rechazar o no la hipétesis nula, 8. Calcular el valor numérico del estadigrafo de prueba y verificar a qué regién pertenece. 9. Tomar la decisién estadistica 10. Llevar a cabo la Accién Derivada. 2 Equivale al percentil de orden (0, * 100) 3 Equivale al percentil de orden (1 - ct) + 100 4 Equivalen a los percentiles de orden [( @/2) + 100] y {1 - (c/2) ] + 100} respectivamente PAGINA 112 ESTADISTICA - C. Caprigtioni

You might also like