You are on page 1of 256
TECNICAS DE MUESTREO WILLIAM G. COCHRAN Professor of Statistics, Emeritus-Harvard University COMPARIA EDITORIAL CONTINENTAL, S. A. MEXICO DISTRIBUIDORES: ESPANA-ARGENTINA-CHILE-VENEZUELA-COLOMBIA-PERU ‘alia — Brasil — Costa Rica — Dominicana — Rowador — Hl Salvador — Eetados Unidor CCasiemala Honduras Nicaragua’ Panamd ~" Paraguay — Portugal — Poerto Rich Uraeuey Indice de Materias INTRODUCCION 1.1 Las Ventajas del Método de Muestreo .. 1.2, Algunos Usos de las Encuestas por Muestreo .... 1.3 Etapas Principales en una Encuesta por Muestreo 14 El Papel de la Teoria del Muestreo : 1.5 Muestreo Probabilista ... 1.6 Alternativas al Muestreo Probabilista . 1.7 Uso de a Distribucién Normal . 1.8 El Sesgo y sus Efectos ... 1.9 El Error Cuadrético Medio Ejercicios .. MUESTREO ALEATORIO SIMPLE . +21 Muestreo Aleatorio Simple . +22 Seleccién de una Muestra Aleatoria Simple . +23 Definiciones y Notacién .... 22.4 Propiedades de las Estimaciones . ; 2.5 Varianzas de las Estimaciones . 2.6 La Correccién por Poblacién Finita ..... + 2.7 Estimacion del Error Estindar a Partir de una Muestra. .. +28 Limites de Confianza . + 2.9 Un Método Alternativo de Prue! + 2.10 Muestreo Aleatorio con Restitucién + 2.11 Estimacién de una Razén . . 2.12 Estimaciones de Medias en Subpoblaciones 2.13 Estimaciones de Totales en Subpoblaciones 2.14 Comparacién Entre las Medias de los Dominios 2.15 Validez de la Aproximacién Normal . 2.16 Estimadores Lineales de la Media de Poblacion a Cap. MUESTREO PARA PROPORCIONES ¥ PORCENTAJES 3.1. Caracteristicas Cualitativas ...... 3.2 Varianzas de las Estimaciones Muestrales 3.3 El Efecto de P en los Errores Esténdar 3.4 La Distribucién Binomial ......... 3.5 La Distribucién Hipergeométrica 3.6 Limites de Confianza .... 3.7 Clasificacién en mas de dos Clases . 3.8 Limites de Confianza Cuando Existen mas de dos Clases ... co 3.9. La Distribucién Condicional de p . : 3.10 Proporciones y Totales Sobre Subpoblaciones .. 3.11 Comparaciones Entre Dominios Diferentes . 3.12 Estimacién de Proporciones en el Muestreo por Conglomerados .. Ejercicios .......... LA ESTIMACION DEL TAMARO DE LA MUESTRA 4.1 Un Ejemplo Hipotético.. 42° Anilisis del Problema 4.3 La Especificacién de la Brecision 44 La Formula para nal Hacer un Muestreo para Determinar una Proporcién ..... : 4.5. Atributos Raros-Muestreo Inverso ............ 4.6 La Formula para n con Datos Continuos 4.7 Estimaciones Anticipadas de Varianzas de Po- dlacic 4.8 Tamafo de la Muestra con mas de una Carac- terfstica . 4.9 Tamafio de la Muestra Cuando las aciones se Quieren para Subdivisiones de la Poblacién .. 4.10 El Tamatio de la Muestra en Problemas de De- cision. 5 4.11 El Efecto del Disefio (Deff) . Ejercicios .. MUESTREO ALEATORIO ESTRATIFICADO - 5.1. Descripcion 5.2 Notacién 5.3 Propiedades oe pe 54 La Varianza Estimada y Limites de Confianza . Pag, 9 79 80 83 85 87 91 92 93, 94 95 100 103 103 105 106 107 108 109 110 14 115 117 119 120 125 125 126 197 132 Cap. mvpice DE MareRias 13 5.5 La Asignacién Optima .... 5.6 Precisiones Relativas del Muestreo Aleatorio Estra- tificado y del Muestreo Aleatorio Simple . 5.7 yEn qué Casos Produce la Estratificacién Consi- derables Ganancias de Precision? . 5.8 Asignacién que Requiere més del 100% del ‘Muestreo 5.9 Estimacién del Tamafo de la Muestra con D Continuos ... 5.10 Muestreo Estratificado para Proporciones 5.11 Ganancias en Precisién en el Muestreo Estrati- ficado para Proporciones ........ 5.12 Estimacién del Tamafio de Muestra con Propor ciones Bjercicios . 2... OTROS ASPECTOS DEL MUESTREO ESTRATIFI- CADO ...... 5A.1 Efectos de las Desviaciones a Partir de la Asig- nacién Optima .. 5A.2 Efectos de Errores en los Tamatios de los Es- tratos a Te 5A.3_El Problema de la Asignacién con més de una Caracteristica 0... eee 5A.4 Otros Métodos de Asignacién con mas de un Atributo 5A.5 Estratificacién en dos Direcciones, con Muestras 5A6 Seleccién Controlada 5A.7 La Construccién de los Estratos.. 5A.8 Ntimero de Estratos : 5A.9 Estratificacién Despu Ia Seleccién’ de 1a Muestra (Postestratificacién) 5A.10 Muestreo por Cuota ... 5A.11 Estimacion a Partir de una Muestra de la Ga- nancia Debida a la Estratificacién .. 5A.12 Estimacién de la Varianza con una Unidad por Estrato. ... ooguce 5A.13 Estratos como Dominios de Estudio 5A.14 Estimacién de Totales y Medias Sobre Subp Dlaciones Pag. 133 136 138 142 143 145 a7 149 149 155 155 157 160 161 165 167 169 174 177 178 179 381 a4 186 Cap. Or Pag. 5A.15 Muestreo a Partir de dos Marcos 189 Ejercicios ..... 190 ESTIMADORES DE RAZON ..... 195 6.1 Métodos de Estimacion . 195 62 EI Estimador de Razén . 196 63 Varianza Aproximada de Ja Estimacién de Razén 198 64 Estimacion de la Varianza a Partir de una Muestra 201 6.5 Limites de Confianza . 202 6.6 Comparacién de la Estimacién de Razén con la Media por Unidad . 203 6.7 Condiciones Bajo las Cuales el Estimador de Razin es un Estimador Insesgado Lineal Optimo 204 6.8 Sesgo de la Estimacién de Razin ...... 207 6.9 Exactitud de las Férmulas para la Varianza Es: timada .. 209 6.10 Estimaciones de Razén en Muestreo Aleatorio Estratificado .. . 211 6.11 La Estimacion de Razén Combinada . 212 6.12 Comparacién de las Estimaciones Separadss y Combinada 214 6.13 Célculo Abreviado de la Varianza Estimada .... 217 6.14 Asignacién Optima con una Estimacién de Razin 220 6.15 Estimaciones Insesgadas del Tipo de Razin .... 222 6.16 Comparacién de los Métodos ..... 6.17 Estimacién Mejorada de la Varianza .... 6.18 Comparacién de dos Razones : 6.19 Razén de dos Razones .. 6.20 Estimaciones de Razén Multivariantes 6.21 Estimadores Producto Ejercicios ... ESTIMADORES DE REGRESION ............ 239 La Estimacion de Regresién Lineal 239 7.2 Estimaciones de Regresién con b Preasignada .. 241 7.3 Estimaciones de Regresién Cuando b se Calcula a Partir de la Muestra .... 243 7.4 Estimacion de Muestra de la Varianza 245 7.5 Comparacién en Muestras Grandes con la Esti- macién de Razén y la Media por Unidad ....... 246 Cap. INDICE DE MATERIAS 7.6 Exactitud de las Férmulas de Muestras Grandes Para V(in) y U5») »» 7.7 Sesgo de la Estimacién de Regresién Lineal. 7.8 El Estimador de Regresi6n Lineal en un Modelo de Regresién Lineal . 7.9 Estimaciones de Regresion en Muestreo Estra- tificado ... 7.10 Coeficientes de Regresién Estimados de la Muestra 7.11 Comparacién de los dos Tipos de Estimaciones de Regresién Ejercicios .. MUESTREO SISTEMATICO .. 8.1. Descripcién .. 8.2 Relacién con el Muestreo Conglomerado . 8.3 Varianza dela Media Estimada ..... 84 Comparacién del Muestreo Sistemético con’ el Muestreo Aleatorio Estratificado . : 8.5 Poblaciones en Orden Aleatcrio . 8.6 Poblaciones con Tendencia Lineal . 8.7 Métodos para Poblaciones que Presentan Tenden- clas Lineales i 8.8 Poblaciones con Variacién Periddica ... 8.9 Poblaciones Autocorrelacionadas . 8.10 Poblaciones Naturales .. 8.11 Estimacién de la Varianza a Partir de una sola Muestra . 8.12 Muestreo Sistematico Estratificado . 8.13 Muestreo Sistematico en dos Dimensiones . 8.14 Resumen 5 Ejercicios MUESTREO POR CONGLOMERADOS, DE UNA ETA- PA: CONGLOMERADOS DEL MISMO TAMARO . 9.1 Motivos del Muestreo por Conglomerados 9.2 Una Regla Simple . 9.3 Comparaciones de Precisién, Hechas a Partir de Datos de Encuestas . webs 94 Varianza en Términos de la Correlacién Dentro de Conglomerados 9.5 Funciones de la Varianza . 1s 247 249 250 251 252 254 255 257 257 259 260 265 268 a7 273 276 278 282 283 285 287 289 290 294 298 300 16 mice DE MATERIAS Cap. 9.6 Una Funcién de Costos . 9.7 Muestreo Conglomerado para Proporciones Ejercicios.:.. MUESTREO CONGLOMERADO DE UNA ETAPA: CONGLOMERADOS DE TAMANOS DESIGUALES ... 9A.1 Unidades Conglomerados de Tamafios Desiguales 94.2 Muestreo con Probabilidad Proporcional al Ta- mafio ... 94.3 Seleccién con Probabilidades Desiguales y con Restitucién, 9A.4 La Medida Optima del Tamafio 9A.5 Exactitudes Relativas de las Tres Técnicas .... 9A.6 Muestreo con Probabilidades Desiguales sin Restitucién .. 94.7 El Estimador de Horvitz-Thompson 94.8 El Método de Brewer ... 9A.9 El Método de Murthy . 9A.10 Métodos Relacionados con el Muestreo ‘Siste- miético .-. 94.11 El Método de Rao, Hartley, Cochran . 9A.12 Comparaciones Numéricas . .. 9A.13 Estimaciones Estratificadas y de Razén . Ejercicios SUBMUESTREO CON UNIDADES DE TAMAROS IGUALES . : . 10.1 Muestreo en dos Etapas . 10.2 Determinactén de Medias y Varianzas en Mues- treo de dos Etapas : 10.3 Varianza de la Media Est dos Etapas .........00+ 104 Estimacién Muestral de 1a Varianza . 10.5 La Estimactén de Proporciones ...... : 10.6 Fracciones Optimas de Muestreo y Submuestreo 10.7 Estimacién de mu: de un Reconocimiento Piloto 10.8 Muestreo de Tres Etapas .. 10.9 Muestreo Estratificado de las Unidades 10.10 Asignacién Optima con Muestreo Estratificado Ejercicios . Pag. 302 304 306 309 311 312 316 316 320 321 326 328 329 331 334 336 339 340 342 343 345 349 352 355 356 357 EL SUBMUESTREO CON UNIDADES DE DIFEREN- TES TAMANOS wa 11.2 113 114 115 116 17 118 119 11.10 11.11 11.12 11.13 11.14 11.15 11.16 11.17 11.18 11.19 11.20 11.21 MUESTREO DOBLE .. 12.1 12.2 12.3 12.4 12.5 12.6 12.7 Introduccion ....,.. Métodos de Muestreo Cuando m= 1... Muestreo con Probabilidad Proporcional all Ta- mafio Estimado ...... Resumen de los Métodos para n= 1. Métodos de Muestreo Cuando m > 1 .....++++ Dos Resultados Utiles . Unidades Seleccionadas con Probabilidades Igua- les: Estimador Insesgado . .. Unidades Seleccionadas con Probabilidades Igua- les: Estimacin de la Razén al Tamafio ...... Unidades Seleccionadas con Probabilidades Tgua- les y con Restitucién: Estimador Insesgado . Seleccién de las Unidades sin Restitucién Comparacién de los Métodos Razones a Otra Variable . Bleccién de Fracciones de Muestreo y Submues- treo. Probabilidades Iguales ... Probabilidades de Seleccién Optima y Tasas de Muestreo y Submuestreo ‘Muestreo Estratificado, Estimadores Insesgados . Muestreo Estratificado. Estimactones de Razén . Estimadores no Lineales en Encuestas Complejas Desarrollo en Series de Taylor .. Réplicas Repetidas Equilibradas El Método Jackknife . . Comparacién de los Tres Métodos . Ejercicios .. Descripeién de la Técnica ‘Muestreo Doble para Estratificacién . Asignacién Optima ...... Varianza Estimada en Muestreo Doble para Es- tratificacion ... ‘Muestreo Doble para Comparaciones Analiticas . Estimadores de Regresién ... Asignacién Optima y Comparacién con el Mues- treo Simple . 7 Pag. 372 375 377 379 380 382 386 387 388 389 390 392 393 395 399 400 403 406 408 412 414 18 Cap. 13 12.8 12.9 12.10 12.11 12.12 12.13 FUENTES DE ERROR EN LAS ENCUESTAS . 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9 13.10 13.11 13.12 13.13 13.14 13.15 13.16 13.17 13.18 13.19 Varianza Estimada en Muestreo Doble para Re- gresion ..... Soon : Estimadores de Razén Muestreo Repetido de la Misma Poblacion ..... Muestreo en dos Ocasiones : ‘Muestreo en més de dos Ocasiones . ..- Simplificaciones y Adelantos Ulteriores . Ejercicios ...... +4. Introduccién Efectos de la no-Respuesta .. ‘Tipos de noRespuesta . Revisitas ......... Un Modelo Matemitico Revisitas . oe Fraccién Optima de Muestreo Entre los que no Responden .. a Ajustes por Sesgo sin Revisitas . Un Modelo Matemético para Errores de Medic Efectos del Sesgo Constante . Efectos de Errores no Correlacionados Dent de la Muestra 5 Efectos de la Correlacién Intramuestral Entre Errores de Medicién . ae Resumen de los Efectes de Errores de Medic El Estudio de los Errores de Medicién .. Mediciones Repetidas de Submuestras Submuestras Interpenetrantes \. Combinacién de la Interpenetracion y la Me cin Repetida . oiee : Preguntas Delicadas: Respuestas Aleatorizadas La Segunda Pregunta no Relacionada ‘Resumen Ejercicios. BIBLIOGRAFIA RESPUESTAS A LOS EJERCICIOS . INDICE ALFABETICO . . Pag. 416 417 418 420 423 426 431 435 435 436 440 442 444 448, 452 455 458 460 462 464 464 466 469 472 473 475 478 479 483 497 505 CAPITULO 1 Introduccién 1.1 LAS VENTAJAS DEL METODO DE MUESTREO ‘Nuestros conocimientos, actitudes y-acciones estén basades en gran parte sobre muestras. Esto es verdad real en la vida cotidiana como en la investigacién cientifica. Asi, la opinién que tiene una Persona de una institucién que realiza miles de transacciones diarias, a menudo se basa en uno o dos contactos ocurridos en el transcurso de muchos afios. Es clasico (y cémico) el personaje que después de Pasar diez dias en un pats extranjero, escribe un libro para ensefiar a sus habitantes cémo revitalizar su industria, reformar su sistema Politico, equilibrar su presupuesto y mejorar la comida de sus hote- les. Peto en realidad, la diferencia que existe entre este personaje y el estudioso de ciencias politicas que vive veinte afios en ese pais dedicado a estudiarlo, es que el primero basa sus conclusiones en una muestra mucho mas pequefia y es menos consciente de su gran ignorancia, Tanto en la ciencia como en los asuntos humanos care- ceremos de los recursos necesarios para estudiar mas de un frag- mento de Jos fenémenos que pueden ampliar nuestros conocimientos. En este libro se presenta la teorfa en que se basan los buenos métodos de muestreo. En la mayoria de las aplicaciones para las gue se edificé esta teoria, el conjunto del que se desea obtener infor- macién es finito y bien delimitado como serfa por ejemplo el con- junto de habitantes de una ciudad, las méquinas de una fabrica 0 Jos peces de un Jago. En cfertos casos, puede parecer factible el obtener Ja informacién por medio de una enumeracién completa 0 censo del conjunto. Los administradores acostumbrados a tratar con censos inicialmente desconfiaban de las muestras y se resistian a utilizarlas. Aunque esta actitud ha desaparecido, conviene revisar las ventajas del muestreo en comparacién con la enumeracién completa. 20 THONICAS DE MUESTAEO Costo reducido Si los datos se obtienen tinicamente de una pequefia fraccién del total, los gastos son menores que los que se realizarian si se levara a cabo un censo completo, En poblaciones muy grandes se pueden obtener resultados Jo suficientemente exactos cuando se analizan muestras que representan s6lo una pequefia fraccién de la poblacién. En los Estados Unidos las investigaciones periédicas mas importan- tes las Heva a cabo el Gobierno, que usa muestras de alrededor de 105.000 personas o sea aproximadamente, una persona por cada 1240, Las encuestas realizadas para obtener informacién en cone- xién con las ventas o campafias de publicidad en la investigacién de mercados, pueden emplear muestras de s6lo unos cuantos miles de observaciones. Mayor rapid Por la misma razén, los datos pueden ser recolectados y resu- midos ms répidamente con una muestra que con una enumeracién completa. Esta es una consideracién vital cuando se necesita la informacién con urgencia. Mas posibilidades Para obtener la informacién en ciertos tipos de encuestas, se utilizan los servicios de personal altamente calificado 0 equipo muy especializado de disponibilidad limitada. Por lo tanto, en estos casos el censo-completo es impracticable y como alternativa a la obtencién de datos por muestreo, sélo existe la de no obtenerlos. De ahi que las encuestas basadas en el muestreo tienen més posibilidades y flexibilidad respecto a la informaciGn que puede obtenerse. Por otra Parte, se desea una informacién exacta de muchas subdivisiones de |a poblacién, el tamafio de la muestra requerida es en ocasiones tan ‘grande que la mejor opcién es 1a enumeracién completa, Mayor exactitud Debido a que al reducir el volumen de trabajo se puede emplear Personal més capacitado y someterlo a un entrenamiento intensivo y debido también a que en estas condiciones ser4 factible la super- vision cuidadosa del trabajo de campo y del procesamiento de los resultados, una muestra puede producir resultados més exactos que la enumeracién completa. Eermopuccron 21 12 ALGUNOS USOS DE LAS ENCUESTAS POR MUESTREO Para quien observa el desarrollo del muestreo y sus aplicaciones €n los ultimos 25 afios, lo més sorprendente es él rapido aumento del mimero y tipos de encuestas realizadas por muestreo, La Oficina de Estadistica de las Naciones Unidas publica ocasionalmente ith informe sobre las Encuestas por Muestreo de actualidad (“Sample Surveys of Current Interest”) que levan,a:¢abo los paises miembros. El informe de 1968 incluye una lista de encuestas procedentes de 46 paises. Muchas de ‘ellas contiens ken de gran interés sobre 12 planeacién na¢ional en areas tales como la produccién agri- cola y la utilizacién de la terra, el desemipleo y la fuerza de trabajo disponible, la produccién industrial, los precios al mayoreo y menu- deo, las condiciones de salud de la poblacién, y los ingresos y gastos familiares, Pero también existen estudios més especializados, por ejemplo, los arreglos para vacaciones anuales (Australia), las cau- sas de divorcio (Hungria), la deuda e inversiones rurales (India), el consumo doméstico de agua (Israel), los radioescuchas (Mala- sia), los gastos de vacaciones (Holanda), la estructura de edades en el ganado vacuno (Checoslovaquia), y los empleos vacantes (E. UL AD. EI muestreo ha venido a representar un papel muy importante en los censos nacionales que se levan a cabo cada 10 afios. En los Estados Unidos, se incluyé en el censo de 1940 una muestra del 5%. Que hace preguntas extra sobre la ocupacién, tamaiio de la familia, fertilidad, etc., a todas aquellas personas cuyos nombres estaban en 2 de los 40 renglones de cada pagina de la lista. El uso del muestreo se sumenté grandemente en 1950. De una muestra del 20% (un nombre cada 5 renglones) se obtuvo informacién sobre el {ingreso, la escolaridad, la migraciGn y el. servicio en las fuerzas armadas. Al tomar una de cada 6 personas en la muestra del 20% , Se cre6 otra muestra del 314% para obtener informacién sobre el matrimonio y la fertilidad. Una serie de preguntas, sobre la condi- clén y edad de las viviendas, se dividié en 5 grupos, cada grupo se contesté en una de cada cinco casas. También se empled el muestreo para aumentar Ja rapidez de la publicacién de los resulta- dos. Las tabulaciones preliminares para muchos atributos importan- tes, obtenidas por muestreo, se publicaron un afio y medio antes que los reportes finales. Este proceso se continué en los censos de 1960 y 1970. Salvo cierta informaci6n basica que se necesitaba obtener de cada persona Por razones constitucionales 0 legales, todo el censo se cambi6 a 92 THONICAS DE MUESTREO una base de muestreo. Este cambio acompafiado de un aumento en Ja mecanizacién utilizada para manejar la informacién, dio por re- sultado una publicacién mucho mas rapida y ahorros sustanciales. ‘Ademés de utilizar las muestras continuadas para los censos, las oficinas gubernamentales las emplean para obtener informacién de actualidad requerida. En los E. U. A. se llevan a cabo, por ejemplo, Ja encuesta de poblacién (Current Population Survey), que propor- ciona datos mensuales sobre 1a magnitud y estructura de la fuerza de trabajo y del mimero de desempleados, la Encuesta Nacional de Salud, y la serie de muestras requeridas para el célculo del indice mensual de precios al consumidor. En més pequefia escala, los gobiernos locales —ciudad, estado y ‘condado— tienen uso cada vez més de encuestas por muestreo para obtener Ia informacién requerida para la planeacién y solucién de problemas urgentes. En la planeacién y en la solucién de problemas urgentes. En la mayoria de las ciudades de los E. U. A. existen agen- clas dedicadas a planear y dirigir encuestas por muestreo para sus clientes. La investigacién de mercados depende basicamente del método de muestreo. Hay un escrutinio ininterrumpido de las audiencias de di- ferentes programas de radio y televisi6n, as{ como del mimero de lec- tores de diversas publicaciones periédicas (incluyendo la publici- dad que en ellas aparece). Los fabricantes y distribuidores quieren saber la reaccién del piblico a nuevos productos, empaques 0 pre- sentaciones, as{ como sus quejas, y las razones por las que prefieren tun producto y no otro, Los negocios y las industrias utilizan el muestreo para aumentar la eficiencia de sus operaciones intemnas. Las importantes areas de control de calidad y de muestreo de aceptacién quedan fuera del alcance de este libro. Pero obviamente, las decisiones que se tomen Fespecto al nivel o cambio de calidad, o bien, la aceptacién o rechazo de Jos lotes de produccién, estarén bien fundadas sélo si los resul- tados obtenidos de la muestra son validos para todo el lote (con un. margen Tazonable de tolerancia). El muestreo de los registros de transacciones comerciales (cuentas, néminas, existencias y perso- nal), usualmente mucho més fécil que el muestreo de personas, puede proporcionar informacién de utilidad en forma répida y eco- némica. También, por medio del muestreo se pueden obtener ahorros en la estimacién:de los inventarios, en los estudios de Ia condicién y el tiempo de vida de la maquinaria y el equipo, en la inspeccion de la exactitud y rapidez del trabajo del empleado de oficina, al investiga cémo el personal clave distribuye su tiempo entre diversas tareas y, més generalmente, en el nuevo campo conocido como mermopuccion 23, investigacién de operaciones. Los libros de Deming (1960) y Slonim (1960) contienen muchos ejemplos interesantes que muestran la gama de aplicaciones del método de muestreo en el comercio, Los sondeos de opinién, de actitudes y electorales a los que se debe en gran parte el primer contacto del muestreo con el gran Piiblico, siguen siendo un rasgo popular en los periddicos. En el ‘campo de la cobtabilidad y la auditoria, en donde durante afios se hha usado el muestreo, se palpa un nuevo interés por adaptar los desarrollos modernos a los problemas particulares de dicho campo. Por ejemplo Neter (1972) describe cémo ahorran dinero las com. Pafiias areas y ferroviarias al utilizar muestras de registros para separar los ingresos procedentes del servicio de carga, de los que provienen del servicio de pasajeros. El papel del muestreo en los litigios ha sido objeto de acaloradas discusiones. Gallup (1972) ha recalcado la gran contribucién que las encuestas por muestreo pue- den aportar al proceso de informacién gubernamental, al determinar répidamente la opinién de la gente respecto a los nuevos programas de gobierno y al demostrar su importancia como fuentes de infor- macién en las clencias sociales. * A grandes rasgos, las encuestas por muestreo pueden clasificarse en dos categorias principales — descriptivasy analiticas. En una en- cuesta descriptiva el nico objetivo es obtener cierta informacién respecto a grandes grupos: por ejemplo, el mimero de hombres, mu- Jeres y nifios que acostumbran ver cierto programa de televisién, En una encuesta analitica se hacen comparaciones entre varios sub- ‘grupos de una poblacién, para averiguar si existen ciertas diferencias entre ellos y formular o verificar hipétesis sobre sus causas. La encuesta de fertilidad en Indianapolis, por ejemplo, fue un intento para determinar hasta dénde los matrimonios planean el ntimero y espaciamiento de sus hijos, las actitudes de ambos cényuges a ese especto, las razones de dichas actitudes y el éxito que logran en su planeacién familia (Kiser y Whelpton, 1953). La distincién entre encuestas analiticas y descriptivas no es per- fectamente clara, Muchas encuestas proporcionan datos que sirven Para ambos propésitos (el descriptive y el analitico). Junto con el aumento de] némero de encuestas descriptivas se ha notado un aumento del ntimero de encuestas realizadas con fines analiticos, particularmente, las relacionadas con el estudio del comportamiento humano y la salud. Podemos mencionar entre otras las encuestas sobre el estado de los dientes de los nifios antes y después de la fluorizacién del agua, sobre las tasas de mortalidad y las causas de muerte de fumadores en los diferentes niveles de consumo de tabaco 24 TecNIcas DE auEsTREO y finalmente, la gigantesca encuesta sobre la efectividad de la va- cuna Salk. El estudio que hizo Coleman (1966) sobre la igualdad en Jas oportunidades de educacién, realizado en una muestra nacio- nal de escuelas, contenia numerosos andlisis de regresién que esti- maban las contribuciones relativas de las caracteristicas de la escue- la, el medio familiar, y la actitud del nifio frente a los diferentes resultados en los exémenes. 13 ETAPAS PRINCIPALES EN UNA ENCUESTA POR MUESTREO Como introduccién a una discusién sobre el papel que desempefia Ja teorfa en una encuesta por muestreo, es titil describir brevemente Jos pasos involucrados en fa planeacién y ejecucién de una encuesta. Las encuestas varfan considerablemente en su complejidad. Es una tarea facil el tomar una muestra de 5 000 tarjetas cuidadosamente arregladas y numeradas en un archivo. Pero la situacién es otra si se desea tomar una muestra de los residentes de una region donde se usa un medio de transporte fluvial a través de Ia selva, donde no hay mapas, donde se hablan 15 dialectos diferentes y los habitan- tes desconfian de todo extranjero inquisitive, Problemas que son desconcertantes en una encuesta pueden ser triviales o inexistentes en otra, Los pasos principales en una encuesta estén agrupados més 0 menos arbitrariamente bajo 11 encabezados y se citan a continua- clon. Objetivos de la encuesta Una exposicién clara de los objetivos es lo mas util. Sin esto, es facil olvidarios en una encuesta compleja al preocuparse por los detalles de la planeacién y por lo tanto tomar decisiones que varian de los objetivos. Poblacién bajo muestreo La palabra poblacién se emplea para denominar el conjunto del que se elige la muestra. La definicién de poblacién puede no pre- sentar problema, por ejemplo, cuando se muestrea un grupo de focos de luz eléctrica a fin de estimar su tiempo de vida promedio. Por otra parte, en el muestreo de una poblacién de propiedades agricolas, se deben fijar las reglas para definir lo que es por ejemplo, un rancho © una hacienda, y surgen casos dudosos al ttatar de hacer una de- mermopvccion 25, limitacion exacta. Estas reglas deben ser aplicables a la practica: el enumerador debe ser capaz. de decidir en el campo, sin demasiados titubeos, si un caso dudoso pertenece o no a la poblacién, La poblacién que se muestrea (la poblacién muestreada) debe coincidir con la poblacién sobre la cual se desea informacion (la Poblacién objetivo). En ocasiones, por razones de factibilidad, o sim- ple conveniencia, la poblacién muestreada es més restringida que a poblacién objetivo. De ser asi, debe recordarse que las conclusio- nes extraidas de la muestra son aplicables a la poblacién muestrea- da, y habr4 que recurrir a otras fuentes de informacién para decidir hasta qué grado se aplican estas conclusiones a la poblacién objetivo, Toda informacién que se obtenga respecto a las diferencias entre ambas poblaciones ser4 de utilidad. Los datos recogidos Es conveniente cerciorarse que todos los datos son pertinentes a la encuesta y que no se omiten datos esenciales. Particularmente en Presencia de poblaciones humanas, existe la tendencia a hacer un neimero excesivo de preguntas que no se analizan posteriormente. Un cuestionario demasiado largo produce una baja general de la calidad de las respuestas, tanto a las preguntas importantes como a las otras. Grado de precisién deseado Los resultados de una encuesta por muestreo estén siempre su- jetos a cierta incertidumbre porque s6lo se mide una parte de la Poblacién, y por los errores en las mediciones realizadas. Esta falta de certeza se puede reducir al tomar muestras mis grandes y em- Plear mejores dispositivos de medicién. Pero esto suele costar tiempo y dinero, en consecuencia, la especificacién del grado de precisién deseado, es un paso importante en la preparacién de la encuesta. Este paso es responsabilidad de la persona que va a utilizar los datos y Puede presentar dificultades, porque los administradores no estén acostumbrados a pensar en términos de la magnitud del error tole- Table en las estimaciones, compatible con una buena decisién. El estadistico puede ayudar en esta etapa, Métodos de medicién Puede existir la posibilidad de escoger el método de medicion y el método de inspeccién de la poblacién. Los datos acerca del éstado de salud de una persona se pueden obtener de sus declaraciones, 26 TeoNICAS DE MuxsTEEO o de un examen médico. La encuesta puede emplear un cuestionario autoadministrado, o un proceso de entrevistas en las que los entre- vistadores simplemente leen un cuestionario prescrito, o bien, un Proceso en el que se permite mucha libertad en la forma y el orden de las preguntas. La inspeccién puede ser por correo, por visitas personales, por teléfono 0 por una combinacién de. los tres medios. Se ha estudiado mucho sobre los métodos de entrevista y sus pro- blemas (véase, por ejemplo, Hyman, 1954 y Payne, (1951). Una parte importante del trabajo preliminar es la construccién de las formas de registro donde entrardn las preguntas y las respuestas. En cuestionarios sencillos a veces es posible precodificar las respues- tas, es decir, colocarlas de tal modo que puedan transferirse rutina- riamente a un equipo mecénico, De hecho para la construccién de buenas formas de registro se necesita prever la estructura de las tablas de restimenes finales que se utilizan para obtener las con- clusiones. El marco Antes de seleccionar la muestra, la poblacién debe ser dividida en partes llamadas unidades de muestreo 0 unidades. Estas deben cubrir 1g totalidad de la poblacién y no traslaparse en el sentido de que todo elemento de la poblacién Pertenezca a una y solamente a una unidad. Algunas veces, la unidad apropiada es obvia como en el caso de la poblacién de los focos donde la unidad'es el foco, En otras ocasiones, existe la posibilidad de escoger lo que ser la unidad de muestreo, En el muestreo de los residentes de una ciudad, la unidad puede ser una persona, los miembros de una familia, o las Personas que viven en una manzana. En el muestreo de una to- secha agricola la unidad puede ser un lote, una granja, o una area de terreno cuya forma y dimensiones quedan a nuestra discrecién. Frecuentemente, la construccién de esta lista de unidades de muestreo, Hamada marco, es uno'de los principales problemas préc- ticos. Con base en amargas experiencias, los técnicos han adquirido una actitud critica frente a-las listas que han sido recolectadas en forma rutinaria y con algén propésito especifico. Aunque se asegure Jo contrario estas listas suelen ser incompletas, parcialmente ilegi- bles, o contienen duplicaciones de magnitud desconocida. Seré dificil encontrar un buen marco cuando la poblacién es especializada, como Por ejemplo, la poblacién de editores de libros o de criadores de Pavos. Jessen (1955) presenta un método interesante para cons- ‘truir un marco a partir de las amas de un érbol frutal. mermopuccion 97 Seleccién de la muestra Existe, actualmente, una gran variedad de planes para seleccio- nar una muestra. Por cada plan considerado, se pueden hacer, gros- so modo, estimaciones del tamafio de la muestra, partiendo de un conocimiento del nivel de precisién deseado. Los costos relatives y el tiempo empleado para cada plan también se comparan antes de tomar una decision, La encuesta piloto Es de gran utilidad probar el cuestionario y los métodos de campo en pequefia escala, Esto casi siempre da por resultado mejoras al cuestionario y puede evitar otros problemas que serian serios a ma- yor escala, por ejemplo, que el costo fuera mucho mayor que el esperado. Organizacién del trabajo de campo En encuestas extensas de encuentran muchos problemas de orden administrativo. El personal debe recibir un entrenamiento sobre €l propésito de la encuesta y los métodos de medicién que se em- Plearan. Ademis, se debe supervisar adecuadamente su trabajo. Un Procedimiento de verificacién anticipado sobre la calidad de las res- Puestas es de incalculable valor. Se deben hacer planes para ma- nejar las no-espuestas, es decir, la falla del enumerador para obte- ner la informacién de ciertas unidades de la muestra. Resumen y anilisis de los datos El primer paso después de realizar la encuesta es el editar los cuestionarios obtenidos, con la esperanza de corregir errores 0 cuan- do menos desechar los datos que obviamente estén equivocados. Habré necesidad de tomar ciertas decisiones respecto al procedimien- to de célculo'en los casos de omisién de respuestas de quienes res- Ponden o de eliminacién de datos en el proceso de edicién. Después se realizarén los célculos que conduzcan a Jas estimaciones. Puede haber diferentes métodos de estimacién para los mismos datos. Una préctica aconsejable en la presentacién de los datos es in- formar la magnitud esperada de error en las estimaciones més im- Portantes. Una de las ventajas del muestreo de probabilidad es que ‘se pueden hacer tales enunciados (de error espetado) aunque debe- Tn ser muy calificados si la cantidad de no-respuestas es importante. 28 TECNICAS DE MUESTAtO Informacién conseguida para encuestas futuras Cuanta més informacion de una poblaciGn se tenga inicialmente, mms facil seré el disefio de una muestra que proporcione estimacio. nes exactas. Toda muestra obtenida es una guia potencial de futuros muestreos, por los datos que revela sobre las medias, las desviacio- nes estdndar, y la naturaleza de la variabilidad de las medidas prin- cipales, asi como sobre los costos de obtencién de datos. La practica de muestreo avanzaré més répidamente si se prevé lo necesario para reunir y registrar este tipo de informacién. Hay otro aspecto importante en el que una muestra completa facilita la obtencién de otras posteriores Las cosas nunca resultan como se planearon para la obtencién de una muestra compleja. Un muestreador habjl aprende a reconocer los errores de ejecucién y a evitar que se repitan. 14. EL PAPEL DE LA TEORIA DEL MUESTREO EI objeto de encontrar los pasos para una encuesta por muestreo es recalcar que el muestreo es un negocio practico y exige muchas y diversas habilidades. En algunos pasos, como por ejemplo en la definicién de la poblacién, en la determinacién de los datos a reco- ger y de los métodos de medicién, y en la organizacién del trabajo de campo, poco o nada tiene que ver la teoria del muestreo. Aunque estos asuntos no se discutirén en el resto del libro, hay que tener Presente su importancia. El muestreo requiere atencién en todas las fases de la actividad: un trabajo mediocre en una de ellas puede arruinar toda la encuesta. El propésito de la teoria del muestreo es que éste sea més efi- lente. Su objetivo es desarrollar métodos de seleccién de muestras y de estimacién, que proporcionen, al menor costo posible, estima- Giones con la suficiente exactitud para nuestros propésitos. Este Principio de exactitud especifica a costo minimo aparece una y otra vez en la presentacién de la teoria. Para aplicar este principio, debemos ser capaces de predecir en cualquier método de muestreo que se considere, la precision y el costo esperados, Respecto a la precision, no podremos predecir cual serd el error de una estimacién en una situacién especifica, porque esto implicarfa el conocimiento del verdadero valor de la poblacién. En lugar de ello, la precisién de un procedimiento de muestreo se juzga al examinar la distribucién de frecuencia generada para las estimaciones, suponiendo que el proceso de muestreo se aplica va- tias veces a la misma poblacién. Desde Iuego, ésta es la técnica esténdar con la que se juzga la precision en la teorfa estadistica. Bermopuccion 29 Una simplificacién adicional que podemos hacer, consiste en su- poner, lo que es razonable en la prdctica si se trata de muestras de tamafio comin, que las estimaciones de muestra tienen una dis. tribucién aproximadamente normal. Con una estimacién distribuida en forma normal se conoce la distribucién de frecuencias, si son conocidas la media y la desviacién esténdar o la varianza. Una Parte considerable de la teorfa del muestreo se ocupa de encontrar formulas para estas medias y varianzas. Hay dos diferencias entre la teoria estindar de encuestas por muestreo y la teorfa cldsica del muestreo como aparece en los libros de estadistica matemitica. En la teorfa cldsica, las mediciones he- chas sobre las unidades de muestreo de la poblacién suele suponerse que siguen una distribucién de frecuencia de forma matemédtica co- nocida, como seria la distribucién normal, cuyos parmetros, media y Varianza, por ejemplo, se estimarian a partir de los datos de las muestras. Por otro lado, en la teorfa de las encuestas por muestreo, se supone que sélo se dispone de una informacion muy limitada sobre dicha distribucién, y sobre todo, no se supone conocida su forma matemética, as{ que el enfoque se puede describir como in- dependiente de un modelo o de una distribucién de frecuencia. Esta es una actitud natural para encuestas muy grandes en las que se efectian numerosas mediciones diferentes de las unidades que si- guen diversas distribuciones de frecuencia. Para las encuestas en las que sélo se realizan pocas mediciones en cada unidad, el estudio de sus distribuciones de frecuencia puede justificar la hipétesis de que son de forma matemética conocida, lo que permite la aplicacién de la teorfa clasica, Otra diferencia es que las poblaciones en una encuesta tienen un niimero finito de unidades. Los resultados son ligeramente més complicados cuando el muestreo es de una poblacién finita y no de una infinita. Por razones practicas, a menudo se ignoran estas diferencias en los resultados para poblaciones finitas e infinitas. Los casos en que no se ignoren, los indicaremos. 1.5 MUESTREO PROBABILISTA ‘Los procedimientos de muestreo considerados en este libro com- Parten las siguientes propiedades matemiticas. 1. Podemos definir el conjunto de muestras distintas S,, S:,.... S,, que el procedimiento es capaz de elegir si se aplica a una pobla- cién especifica, Esto significa que podemos decir con precisién cud- es son las unidades de muestreo que pertenecen a S,, S:, etc. 30 TEORICAS DE MUESTREO ‘Supongamos, por ejemplo, que la poblacién consta de seis unidades, numeradas de 1 a 6. Un procedimiento comin para elegir una mues- tra de tamafio 2 oftece tres posibilidades $,~(1, 4); $.~(2. 5); S; ~(3, 6). Nétese que no se incluyen todas las posibles muestras de tamafo 2. 2. Cada muestra posible S; tiene asignada una probabilidad de seleccién 7s. 3. Se selecciona una de las S; por un proceso aleatorio, en el que cada S; tiene una probabilidad =, de ser elegida. En el ejemplo anterior, podriamos asignar la misma probabilidad a cada muestra. Posteriormente, Ja seleccién se podria realizar al elegir un nimero aleatorio entre 1 y 3. Si el nimero es j, se toma la muestra S;. 4, El método para calcular la estimacién a partir de la muestra debe ser definido y debe conducir a una estimacién tinica para cual- quier muestra especifica, Podemos decir, por ejemplo, que la esti- macién es el promedio de las ediciones corresponilientes a las unidades individuales de la muestra. Para todo procedimiento de muestreo que satisfaga estas condi- ciones, podemos calcular la distribucién de frecuencia de las esti- maciones que genera el proceso, si se aplica repetidamente a la misma poblacién. Sabemos la frecuencia con que se elige cualquier muestra S;, y sabemos cémo calcular la estimacién a partir de los datos de S,. Por lo tanto, es claro que se puede desarrollar una teorfa de muestreo para cada procedimiento de este tipo, aunque los. detalles del desarrollo puedan ser intrincados. Un método de esta clase se conoce con el nombre de muestreo probabilista. En la préctica, rara vez se extrae una muestra de probabilidad dando Jas $; y los mimeros =; como se esboz6 anteriormente. Es un trabajo muy laborioso para una gran poblacién, en Ja cual un procedimiento de muestreo puede producir billones de muestras po- sibles. Por lo general, la extraccién se hace al. especificar probabi- lidades de inclusion en la muestra para las unfdades individuales y extraer unidades, una a la vez, 0 en grupos, hasta constituir la muestra del tamafio y tipo deseado. Desde el punto de vista te6rico, basta saber que si quisiéramos, podriamos especificar las subcolec- ciones S; y las =, siempre y cuando tuviéramos tiempo ilimitado para hacerlo. 1.6 ALTERNATIVAS AL MUESTREO PROBABILISTA A continuacién veremos algunos tipos comunes de ‘muestreo no probabilistas, mermopucciON 31 1, La muestra es una parte de la poblacion facilmente accesible. Una muestra de carbén en un vag6n abierto se puede tomar a 15 © 20 cm de la parte superior. 2. La muestra se selecciona a la ventura, Al tomar diez conejos de una jaula en un laboratorio, el investigador puede sacar aquellos que alcance con la mano, sin una planeacién consciente. 3. Con una poblacién pequefia pero heterogénea, el investigador inspecciona la totalidad de ésta y selecciona una pequefia muestra de unidades “tipicas”, es decir, unidades que a su parecer estan cer- canas al promedio de la poblacién. Este método algunas veces es Mamado de juicio o de selecciGn intencional, 4, La muestra consta esencialmente de voluntarios, en estudios en Jos cuales el proceso de medicién es desagradable 0 penoso para la persona que esté siendo investigada. En condiciones adecuadas cualquiera de estos métodos puede dar resultados titiles. Sin embargo, no son los indicados para el desarrollo de una teoria de muestreo, ya que no involucran ningin elemento aleatorio en el procedimiento de seleccién. Casi la vinica manera de examinar qué tan bueno puede ser uno de los métodos es encontrar una situacién en la cual los resultados sean conocidos, ya sea para la poblacién total o para una muestra basada en pro- babilidades y posteriormente hacer una comparaci6n. Pero aun asf, si'un método resulta adecuado en la comparacién, puede ser inade- cuado al variar las condiciones. En relacién con lo anterior (muestreos probabilistas y no pro- babllistas) sefialamos que algunos de los primeros. usos del mues- treo que hicieron los gobiemos a nivel ufbano o nacional, desde 1850, tenfan como finalidad reducir Jos costos de las estimacio- nes de los resultados de un censo. Para los tributos més impor- tantes del censo, se calculaban los totales de la ciudad o el pais, aprovechando completamente la informacién obtenida del censo. Para las mediciones restantes se tomaba una muestra que variaba entre el 15 y el 25% de los formularios devueltos después del censo, con objeto de aligerar el trabajo de estimacién de los totales de la ciudad o el pafs para dichas mediciones. Se usaron dos métodos diferentes para la seleccién de la muestra. El primero, Hamado de seleccién aleatoria es una aplicacién del muestreo de probabilidad segiin el cual cada unidad de la poblacién (cada formulario devuelto después del censo) tiene la misma oportunidad de ser incluido en la muestra, Para este método se constat6 que, como se dijo anterior- mente, con ayuda de la teorfa del muestreo y la distribucién normal es posible predecit, en forma aproximada y con los datos de la muestra, la magnitud del error esperado en las estimaciones hechas 32 TecNICAS DE MUESTREO a partir de la muestra. Més atin, en los {tems més importantes para los que se disponia de los datos completos que suministré el censo, es posible, hasta cierto grado verificar la exactitud de las predic- clones. El segundo método es la seleccién a propésito, Esta no se definia en detalle, pero presentaba dos rasgos comunes, La unidad de mues- treo consistfa en grupos de formularios, a menudo relativamente grandes. Por ejemplo, en el censo italiano de 1921, el pais tenia 8 354 comunas, agrupadas en 214 distritos, Al extraer una muestra del 14%, los estadisticos italianos Gini y Galvani seleccionaron a propésito 29 distritos, en lugar de 1250 comunas. En segundo lugar, los 29 distritos se eligieron de tal modo que la muestra pro- porcionara estimaciones exactas para 7 importantes variables de control, cuyos resultados eran conocidos para todo el pais, y con esto se esperaba que la muestra diera buenas estimaciones de las otras variables altamente correlacionadas con las de control. En la década de los 20, el Instituto Estadistico Internacional nombré una comisién para estudiar las ventajas y desventajas de Jos dos métodos. El informe de Jensen (1926) parecié favorecer el método de seleccién a propésito. Sin embargo, este método se abandoné relativamente pronto como técnica de muestreo para ob- tener estimaciones nacionales en las encuestas que median muchas variables, ya que carecia de la flexibilidad que ofrécian los métodos de muestreo probabilista desarrollados posteriormente, no podia pre- decir a partir de la muestra la exactitud esperada en las estimaciones y usaba unidades de muestreo demasiado grandes. Gini y Galvani concluyeron que el método de muestreo denominado muestreo alea- torio estratificado (Cap. 5) que utiliza la comuna como unidad de muestreo, habria dado mejores resultados.que su método. 1.7 USO DE LA DISTRIBUCION NORMAL En ocasiones es titil usar la palabra estimader para designar la regla por Ja cual se calcula alguna caracteristica » de la poblacién, a partir de los resultados de la muestra, y la palabra estimacién para el valor obtenido de una muestra especffica. Un estimador de » dado por un plan de muestreo se lama insesgado si el valor medio de f, tomado sobre todas las muestras posibles proporcionadas por el plan, es igual a y, En la notacién de la Sec. 1.5, puede es- cribirse esta condicién B= 5 mimw mermopuccion 33 donde is ¢s la estimacién dada por la #-ésima muestr E, que significa “valor esperado de", es de uso comany = Simbolo ‘Como se mencioné en la Sec. 1.4, las muestras en algunas en- evestas son tan grandes que siguen una distribucién aproximada. mente normal. Ademés, con el muestreo probabilista, tenemos formulas que dan la media y la varlanza de las estimaciones. Su- Pongamos que hemos tomado una muestra por un proceso que se sabe que proporciona un estimador insesgado y que hemos caleulado Ja estimacion de muestra f y su desviacién estindar es (que sucle Mamarse su error estdndar). {Qué tan buena es esta estimacién? No podemos conocer el valor exacto del error de estimacién (A ~ ») ero por las propiedades de la curva normal, puede esperarse que 0.32 (en 1 caso de 3) el error absoluto | — | excede op 0.05 (en 1 caso de 20)el error absoluto | — | excede 1.9605 = 2op 0.01 (en 1 caso de 100 el error absoluto | ~ n| excede 2.580 Por ejemplo, si una muestra probabilista de los registros de acumuladores de uso rutinario en una fabrica muestra una vida Promedio j= 394 dias, con error estindar de,~ 4.6 dias; se es era que en 10 casos Ia vida i pera gue en 09 de 20 promedio en la poblacién de = 394-(2.58)(4.6)=382 dias y 394+ (2.58)(4.6)= 406 dias Los limites, 382 dias y 406 dias, se Haman limites de confi Inferior y superior. Con una sola cstimacién’ de uma encscras a afirmacién “p esté entre 382 y 406 dias” no es correcta con certeza, La magnitud “99% de confianza” implica que si se usara el mismo Plan de muestreo muchas veces en una poblacién, haciendo un emunclado de confianza a partir de cada muestra, el 99% (aprox. serian correctas y 1% estarfan equivocados. Cuando el muestra ‘a sido introducido en una operacién en la que previamente se haya uusado un censo completo, una demostracién de esta propiedad algu. nas veces se hace sacando muestras repetidas del tipo propuesto de una poblacién para la cual exista un registro completo, de tal mane- {2 ue sn sea conocido (véase, por ejemplo, Trueblood y Cyert, 1957). 1a Nerifleacion préctica de que aproximadamente la proporcion es ablecida de aseveraciones es correcta, es uitil para educar y tran- gullizar a los administradores respecto a la naturaleza del muesteo. De mado semen Cuando se toma una sola muestra de cada una laciones diferentes, cerca de un 9: veraciones de conflanza al 85% son corrects Sn “8 8% fy 94 TmoNICAS DE MUEsTREO La discusién precedente presupone que oj, segtin se calcula de la muestra, es conocido exactamente, En realidad, tanto 03, como ji, estén sujetos a error de muestreo. Con una variable normalmente distribuida, se usan las tablas de distribucion ¢ de Student, en lugar de las tablas normales para calcular los limites de confianza para cuando la muestra es pequefia. El reemplazo de la tabla normal por la tabla de t casi no hace diferencia si el mimero de grados de li- bertad en 9 excede a 50. Con ciertos tipos de muestreo estratificado ¥ con el método de muestreo repetido (Sec. 11.19) los grados de libertad son pequefios y la tabla t es necesaria. 1.8 EL SESGO Y SUS EFECTOS En la teoria de las encuestas por muestreo es necesatio consi- derar los estimadores sesgados por 2 razones: 1. En algunos de los problemas més comunes, particularmente en la estimacién de razones, se encuentra que los estimadores con- venientes y apropiados son sesgados, 2. Aun con los estimadores que son insesgados en muestreo proba- bilista, los errores de medicién y las novespuestas pueden pro- ducir sesgos en los ntimeros que se calculan a partir de los datos. Esto sucede, por ejemplo, cuando casi todas las personas que se niegan a ser entrevistadas se oponen a cierto gasto de los fondos PUblicos, en tanto que aquellas que han sido entrevistadas se dividen igualmente en pro y en contra. Para examinar el efecto del sesgo, supdngase que la estimacién desta normalmente distribuida alrededor de una media m que esté a una distancia B del verdadero valor » de la poblacién, como se ve en Ia Fig, 1.1. La magnitud del sesgo es B = m — ». Supongamos que desconocemos la existencia del sesgo. Calculamos la desvia- cién estandar « de la distribucién de frecuencias del estimador —esto sera, desde Iuego, la desviacién estdndar respecto a la media ‘m de la distribucién, no respecto a la verdadera media x—. Esta- mos usando ¢ en lugar de ¢;. Como una afirmacién acerca de la exactitud de la estimacién, declaramos que la probabilidad es de 0.05 de que el estimador 2 esté en error por mis de 1.96. Consideraremos ahora cémo la presencia del sesgo distorsiona esta probabilidad. Para hacer esto calculamos la verdadera probabi- Tidad de que la estimaci6n est4 en error por més de 1.96, en donde el error es medido a partir de la vetdadera media ». Ambos lados de la distribucién deben ser examinados separadamente. Para el ex- mermopuecion 35, oa 03 02 on Sere ate eo Qt Fic, 1-1, Efecto del sesgo en los errores de estimacion a 1.960 es el tremo derecho, la probabilidad de un error de mas de + 4rea sombreada a partir de Q en la Fig. 1-1. Esta drea est4 dada por 1 ie amore a —. e ia Wi) asi 966 Sea i — m = ot. El limite inferior del intervalo de integracién para tes 2 1 96=1.96-2 7 o Por lo que el rea es: L iL eA = ere dt Faas ise-taier De manera semejante, el extremo izquierdo, es decir, el érea som- breada a la izquierda a partir de P, tiene una drea de: 1 [-t96ta7e1 Vanl-2 Al observar las integrales, est claro que la perturbacién depende Gnicamente de la raz6n del sesgo a la desviacién estandar. Los re- sultados se muestran en la Tabla 1.1. En el caso de considerar la probabilidad total de cometer un error de més de 1.962, el sesgo tiene poco efecto, siempre y cuando era 36 TecNIcas DE MUESTAEO TABLA 1.1. Erzcto Dr UN sEsco B EN 1A PRosANILIDAD DE CoMETER UN Ennox Mavon aur 1.967 Probabilidad de error Ble <=1960 0.02 0.0238 0.0262 0.04 00228 oor 0.06 00217 0.0287 0.08 00207 0.0301 0.10 00197 0.0314 0.20 015s 0.0392 040 0.0091 0.0594 0.60 0.0052 9.0869 0.80 0.0029 0.1230 1.00 0.0015 o.t68s 1.50 0.0003 03228 Sea menor que una décima de la desviacién estindar. En este punto, la probabilidad total es de 0.0511 en lugar de ser 0.05 que pensa. mos que es. Conforme aumenta més este sesgo, la perturbacién se vuelve més seria. Para B = o, la probabilidad de error es de 0.17, més de 3 veces el valor supuesto. Los dos lados de la-distribucién se afectan de una manera dife- Tente. Con un sesgo positivo, como en el ejemplo, la probabilidad de una sobreestimacién més alld de 1.96e disminuye con rapidez del valor supuesto de 0.025 para volverse despreciable cuando B = @. La Probabilidad de Ja sobreestimacién correspondiente se eleva en for- ma constante. En la mayorfa de las aplicaciones el error total es de interés primordial, pero en ocasiones estamos particularmente inte. Tesados en los errores cometidos en una sola direccién, Como una regla de trabajo, el efecto del sesgo en la exactitud, de un estimador es despreciable si el sesgo es menor que un déci- mo de la desviacién estindar de Ja estimaci6n. Si tenemos un mé- todo de estimacién que produce sesgo para el cual B/o < 0.1, en donde B es el valor absoluto del sesgo, se puede argumentar que el sesgo no es una desventaja del método. Aun con B/e = 0.2, es mo- desta la perturbacién en la probabilidad del error, En el uso de-estos resultados se deben distinguir las dos fuen- tes de sesgo mencionadas al principio de esta seccién. Con sesgos. que surgen en Ja estimacién de proporciones, un limite superior a Ja proporcién B/s se puede determinar mateméticamente. Sila mues- tra es lo bastante grande, podemes tener la confianza de que B/s mermopuccion 37 no excederé a 0.1. Por otro lado, con sesgos causados por errores de medicién o de no-xespuesta, generalmente es imposible encontrar el limite superior para B/r que es pequefio. Este enfadoso proble- ma se discute en el Cap. 13. 1.9 EL ERROR CUADRATICO MEDIO ‘A fin de comparar un estimador sesgado, con un estimador in- sesgado, o bien, dos estimadores que tienen cantidades diferentes de sesgo, un criterio util es el del error cuadratico medio (ECM) del estimador, medido a partir del valor de la poblacién que se est es- timando. Formalmente, ECM(i)= EG —n)*= ELA ~m)+(m—w)P = E(i—m)+2(m— EG —m)+(m—a)? = (variacién de fi) + (sesgo)* El doble producto desaparece, ya que E(fi — m) = 0. El uso del ECM, como un criterio de la exactitud de un estima- dor, equivale a considerar dos estimadores que tienen el mismo ECM como equivalentes. Esto no es estrictamente correcto porque las distribuciones de frecuencia de los errores (ji — »), de tamafios diferentes no serén las mismas para los dos estimadores si tienen cantidades diferentes de sesgo, Sin embargo, ha sido demostrado por Hansen, Hurwitz y Madow (1953) que si B/o es aproximadamente menor" un medio, las dos distribuciones de frecuencia son casi idénticas en relacién con los errores absolutos |ji— »| de magnitu- des diferentes, La Tabla 1.2 flustra este resultado. > TABLA 12, Paonanmmap ox uw Exton Assouvro > 1V/ECM, 1.96/ECM + 2.576, /ECM Probabilidad Bio 1VECM 1.96VECM 2576VECM ° 0317 0.0500 0.0100 02 0317 0.0499 (0.0100 04 0319 0.0495 0.0095 06 0324 = 0.0479 (0.0083 38 THeNICAS DE MUESTREO Aun si B/e = 0.6, los-cambios en las probabilidades al compa- rarlas con los valores obtenidos para B/e = 0 son ligeros, Debido a la dificultad de poder asegurar que ningin sesgo in- sospechado se introduce en las estimaciones, generalmente hablare- mos de la precision de un estimador més que de su exactitud, La exactitud se refiere a la magnitud de las desviaciones respecto a la media verdadera 4 mientras que precision se refiere a la magnitud de las desviaciones respecto a la media m obtenida por la aplicacién repetida del procedimiento de muestreo. EJERCICIOS 41.1, Suponga que usa el muestreo para estimar el mimero total de pala: bbras de un libro que contiene ilustracienes. (a) ¢Hay algin problema para la definicién de la poblacién? (b) ¢Cudles son los pros y los contras de: (1) la pagina, (2) el renglén, como unidad de ‘muestreo? . 1.2 Se va a tomar una muestra de una lista de nombres que estén en tar: ietas Cun nombre por tarjeta) numeradas consecutivamente, las cuales $0 encuentran en un archivo. Cada nombre tendré la misma opo:tunidad de ser {meluldo en 1a muestra. {Qué problemas surgen de las siguientes situaciones comunes? (a) Algunos de los nombres no pertenecen a la poblaciGn-objeto, a Pesar de que este hecho no puede ser verificado para ningiin nombre hasta gue no se seleccione, (b) Algunos nombres aparecen en mas de una tarjeta, Todas las tarjetas con el mismo nombie evan nimeros consccutivos y, por Jo tanto, aparecen juntas en el archive, (c) Algunos nombres aparecen en més de una tarjeta, pero las que evan el mismo nombre pueden estar colo- cadas en cualquier lugar dentro del archivo, 1.3. El problema para encontrar un marco completo que permita 1a obten- cién de una muestra es frecuentemente un obstdculo, .Qué clase de marcos udieran ser convenfentes para las siguientes encuestas? ¢Tienen los marcos alguna deficiencia seria? (a) Una encuesta de tiendas que venden petacas en una gran ciudad. (b) Una encuesta ¢e articulos que se dejan en los trenes subterréneos © autobuses. (c) Una encuesta de las personas mordidas por viboras durante el ultimo afo, 1.4, Un directorio de la ciudad, de hace cuatro afios, enlista las direccio- nes en orden a lo largo de cada calle, y da los nombres de las personas que viven en cada direccién. Para una encuesta que se leva a cabo actualmente por medio de entrevistas a la gente de la cludad, icudles son las deficiencias de este marco? {Pueden ser remediadas por los entrevistadores durante el desarrollo de Ia encuesta? Al usar el directorio, (sacaria usted una lista de direcciones (domicilios) o una lista de personas? 15. En una estimacién para muestreo del valor real de objetos pequefios en el inventario de una gran firma, el valor real y el registrado en los libros ‘se obtuvieron para cada objeto de la muestra. Para la muestra total, la razén del valor real al registrado fue de 1.021; esta estimacién esté distribuida mermopuccion 39 aproximadamente de una manera normal con un error estindar de 0.0082. Si SPOhar A invent segin Toe ltr de relate ee 880000" cleus ov imites de confianza del 95% para el valor real. 1.6. Frecuentemente los datos se deben tratar como una muestra, a pesar de que a primera vista parece que constituyen una enumeracién completa. El propietarlo de un lote de estacionamiento encuentra que el negocio dismi- nuye los domingos por Ia mafiana. Después de 26 domingos de operacién, su Percepeién promedio por domingo es exactamente $10.00. El error estindar de esta cifra, calculado a partir de las variaciones de semana a semana, es de $1.20. Los costos del culdador son de $7.00 cada domingo. El propietario quie- re mantener ablerto el lote lot domingos por Ia mafiana siempre y cuando su lutilidad esperada fuera de $5.00. {Cudl es la probabilidad de que la utilidad a largo plazo sea de, al menos, $5.00? {Qué suposicién se debe hacer para responder a esta pregunta? 1.7. En la Tabla 1.2, cqué pasaria a la probabilidad de excederse 1 VECM, 1.96 VECM y 2.576 YECM cuando B/e tiende a ser infinita, es dectr, cuando el ECM es debido enteramente sesgo? {Concuerdan sus resultados ‘con Ia direceién de los cambios anotados en la Tabla 1.2 conforme B/e varie de 0 a 067 1.8. Cuando es necesario comparar dos estimaciones que tienen diferentes Aistribuciones de frecuencia de errores (ji — n), ocasionalmente es posible, en problemas especializados, calcular el costo 0 la pémtida que resultaria de uun error (fi—*) de cualquier tamafio dado. Se prefiere la estimacién que da la pérdida esperada més pequefia, siendo el resto de las condiciones iguales. Demuestre que si la pérdida es una funcién cuadrética (ji — n)* del error, debemos escoger la estimacién con el error cuadritico medio menor.

You might also like