You are on page 1of 37
Economia de tiempo y recursos, que se utiliza por MUESTRA Generalizar yrequiere resultados Establecer parémetros Subgrupo de {a poblacién * Definir el tamanio que de la muestra * Témbolas * Seleccionar eee eee eae requiere | elementos > _muestral oe Probabilistico —>4 muestrales pormedio | « Procedimiento——»4 _(Stats*} 0 deun tablas * Muestra aleatoria * Seleccién sistematica on simple cies | * Tipos > . Muestra estratificada + Por racimos o clusters + Selecciona participantes Re © casos tipicos las cuales probabilistico ———>4 » No asegura que los casos 0 dirigido sean representativos de la poblacién Seleccién de la muestra a PROCESO DE INVESTIGACION CCUANTITATIVA, Paso7, Seleccionar una muestra apropiada para la investigacién + Defnirlos casos (participantes w otros sees vives, objtos,fenomenos sucesos 0 comun- dads) sobre los cuales se habran de recolec: tar los datos, + Delimitar la poblacién, + legir el método de soleccidn de la muestra: probabilistico © no probabilstico. + Precisar el tamano de la muesta requeido, + Aplca el procedimiento de seleccon, + Obtener la muestra, Sintesis OBJETIVOS DE APRENDIZAJE Alterminar este capitulo, el alumno sera capaz de: * Identificar los diferentes tipos de muestras en la investiga: cién cuantitativa, sus procedi- mientos de seles caracteristicas, las ‘en que es conveniente uti ‘cada uno y sus aplicaciones. + Enunciar los conceptos de muestra, poblacién y procedi- miento de seleccién de la muestra, * Determinar el tamano adecuado de la muestra en distintas situaciones de investigacién, * Obtener muestras representa- tivas de la poblacién estudia- da cuando hay interés por ‘generalizar los resultados de Una investigacion a un Universo més amplio, En el capitulo se analizan los conceptos de muestra, poblacién o universo, tamaiio de la muestra, representatividad de la muestra y procedimiento de seleccién. También se presenta una tipologia de muestras: probabilisticas y no probabilisticas. Se explica como definir a las unidades de andlisis (participantes, otros seres vivos, objetos, sucesos © comunidades), de las cuales se habrén de recolectar los datos. Asimismo, en el capitulo se presenta cémo determinar el tamatio adecuado de una muestra cuando pretendemos generalizar los resultados a una poblacién, y cémo proceder para obtener la muestra, dependiendo del tipo de seleccién elegido, 235 236 SEGUNDA PARTE i proceso de la investigacién cuanttativa éEn una investigacién siempre tenemos una muestra? No siempre, pero en la mayoria de las situaciones sf realizamos el estudio en una muestra, Sdlo cuando queremos realizar un censo debemos incluir en el estudio a todos los sujetos o casos (personas, animales, plantas, objetos) del universo o la poblacidn. Por ejemplo, los estudios mo- tivacionales en empresas suelen abarcar a todos sus empleados para evitar que los excluidos piensen que su opinién no se toma en cuenta. Las muestras se utilizan por economia de tiempo y recursos, Lo primero: jsobre qué o quiénes se recolectaran datos? ‘Aqui el interés se centra en “qué o quiénes”, es decir, en los sujetos, objetos, sucesos o comuni- dades de estudio (las unidades de andlisis), lo cual depende del planteamiento de la investigacion. Asi, en el caso de que el objetivo sea describir el uso que hacen los nifios de la televisién, lo més factible seria interrogar a un _Unidades de andlisis Se grupo de nifios. También serviria entrevistar a los padres de los les denomina también nifios. Escoger entre los nifios o sus padres, o ambos, dependeria #505 0 elementos. no sélo del objetivo de la investigacién, sino del disefio de la mis- ma, En el caso de la investigacién que hemos ejemplificado a lo largo del libro, donde el propé- sito basico del estudio es describir la relacién nifio-televisién, se podria determinar que los sujetos seleccionados para el estudio fueran nifios que respondieran sobre sus conductas y per- cepciones relacionadas con este medio de comunicacion. En otro estudio de Greenberg, Ericson y Vlahos (1972), el objetivo de andlisis era investigar las discrepancias 0 semejanzas en las opiniones de madres ¢ hijos o hijas con respecto al uso de la television por parte de estos tiltimos. Aquila finalidad del estudio supuso la seleccién de mamas Y nifios, para entrevistarlos por separado, correlacionando posteriormente la respuesta de cada par madre-hi Lo anterior quizd parezca muy obvio, pues los objetivos de los dos ejemplos mencionados son claros. En la practica esto no parece ser tan simple para muchos estudiantes, que en propuestas de investigacion y de tesis no logran una coherencia entre los objetivos de la investigacién y la unidad de andlisis de la misma. Algunos errores comunes se encuentran en la tabla 8.1. Por lo tanto, para seleccionar una muestra, lo primero que hay que hacer es definir la unidad de andlisis (personas, organizaciones, periédicos, comunidades, situaciones, eventos, etc.). El sobre qué o quiénes se van a recolectar datos depende del planteamiento del problema a investi- gar y de los alcances del estudio. Estas acciones nos llevarén al siguiente paso, que consiste en delimitar una poblacién. Wu ceamteennonas Para el proceso cuantitativo la muestra es un subgrupo de la _poblacién del cual se poblacién de interés (sobre el cual se recolectardn datos, y que _recolectan los datos y tiene que definirse o delimitarse de antemano con precisién), éste ‘debe ser representativo deberd ser representativo de la poblacién. El investigador preten- 1° dicha poblaci CAPETULO 8 Seleccién de la mmestra 237 de que los resultados encontrados en la muestra logren generalizarse o extrapolarse a la pobla- in (en el sentido de la validez externa que se comenté al hablar de experimentos). El interés es que la muestra sea estadisticamente representativa. La esencia del muestreo cuantitativo podria esquematizarse como se presenta en la figura 8.1 Tabla 8.1 Quiénes van a ser medidos: errores y soluciones Pregunta de investigacién Unidad de andlisis errénea Unidad de andlisis correcta @Discriminan a las mujeres en Jos anuncios de la television? <¢Bstan los obreros del rea ‘metropolitana de la ciudad de Guadalajara satisfechos con st trabajo? (Hay problemas de comunicacién entre padres e hijos? 2Qué sentimientos suelen ‘acomipafiar a las personas que han perdido recientemente a su conyuge en un accidente automovilistico? éCémo es la comunicacién que tienen con sus médicos los pacientes de enfisema pulmonar en fase terminal? ‘Mujeres que aparecen en los anuncios de television. Error: no hay grupo de comparacién. Computar el nsimero de conflictos sindicales registrados en la Junta Local de Conciliacién y Arbitraje del Ministerio del ‘Trabajo durante los tiltimos cinco aos. Error: la pregunta propone indagar sobre actitudes individuales y esta unidad de andlisis denota datos agregados en una estadistica laboral y macrosocial. Grupo de adolescentes, aplicarles cuestionario. Error: se procederia a describir iinicamente cémo perciben los adolescentes la relacién con ‘sus padres. Hombres cuyas parejas hayan fallecido en un accidente automovilistico, Error: no se cubre més que all género masculino y debe definirse qué se entiende por “recientemente”. Pacientes de enfisema pulmonar en estado terminal Error: la comunicacién es un proceso entre dos actores: médicos y pacientes. Mujeres y hombres que aparecen ‘en Jos amuncios de televisién, ‘para comparar si ambos son presentados con la misma frecuencia e igualdad de papeles desempefiados y atributos. ‘Muestra de obreros que trabajan en el drea metropolitana de Guadalajara, cada uno de los cuales contestard a las preguntas de un cuestionario sobre satisfaccién laboral. Grupo de padres e hijos. A amas partes se les aplicard el cuestionario. ‘Hombres y mujeres que hayan perdido a su pareja en un accidente automovilistico en un periodo de seis meses 0 menor. Pacientes de enfisema pulmonar en estado terminal y sus médicos (continia) 238 SEGUNDA PARTE El proceso de la favestigacin cuantitativa Tabla 8.1 Quiénes van a ser medidos: errores y soluciones (continuacién) Pregunta de investigacién Unidad de andlisis errénea Unidad de andlisis correcta 2Qué tan arraig=ta se Contadores piiblicos y Personas fisicas (contribuyentes encuentra la cultura fiscal de coutralores de las empresas que no son empresas de todo Jos contribuyentes de del Departamento de Medellin tipo: profesionales Medeltin? Error: zy el resto de los independientes, trabajadores, contribuyentes? empleados, comerciantes, asesores, consultores) y representantes de empresas (contribuyentes morales) in qué grado se aplica el Alumnos de las escuelas del Modelos curriculares de las ‘modelo constructivista en distrito escolar. escuelas del distrito escolar las escuelas de un distrito Error: se obtendria uma (andlisis de la documentacién escolar? respuesta incompleta a la disponible), directores y pregunta de investigacién y maestros de las escuelas es probable que muchos (entrevistas), y eventos de alumnos ni siquiera sepan bien ensefianza-aprendizaje To que es el modelo (observacién de clases y constructivista de la educacién. tareas en cada escuela). Objetivo central: Seleccionar casos representativos para la generalizacion { Generalizar: * Caracteristicas ‘* Hipotesis Con la finalidad de construir y/o probar teorias que expliquen 2 la poblacién o fenémeno t Mediante una técnica adecuada Figura 8.1 Esencia del muestreo cuantitativo. éComo se delimita una poblacién? Una vez que se ha definido cual seré la unidad de andlisis, se procede a delimitar la poblacién que va a ser estudiada y sobre la cual se pretende generalizar los resultados. Asi, una poblacién es el conjunto de todos Jos casos que concuerdan con wna serie de especificaciones (Selltiz et a, 1980). Una deficiencia que se presenta en algunos trabajos de investigacién es que no describen lo suficiente las caracteristicas de la poblacién o consideran que la muestra la representa de mane- ra automética. Es comin que algunos estudios que sélo se basan en muestras de estudiantes CAPETULO 8 Selecsin dela muestra universitarios (porque es facil aplicar en ellos el instrumento de medicién, pues estan a la mano) hagan generalizaciones temerarias sobre jévenes que tal vez posean otras caracteristicas socia- les. Es preferible entonces establecer con claridad las caracteristicas de la poblaci6n, con la fi- nalidad de delimitar cuales serdn los pardmetros muestrales. Lo anterior puede ilustrarse con el ejemplo de la investigacién sobre el uso de la television por los nifios. Esta claro que en dicha investigacién la unidad de andlisis son los nifios. Pero, gde qué poblacién se trata?, ¢de todos los nifios del mundo?, {de todos los nifios de la Repiiblica Mexicana? Seria muy ambicioso y précticamente imposible referimos a poblaciones tan grandes. Asi, en nuestro ejemplo, la poblacién se delimitaria con base en la figura 8.2. Esta definicién elimina, por lo tanto, a nifios mexicanos que no vivan en el area metropoli- tana de la ciudad de México, a los que no van a la escuela, a los que asisten a clases por la tarde (turno vespertino) y a los infantes més pequeiios. Aunque, por otra parte, permite hacer una investigacién costeable, con cuestionarios que serdn respondidos por nifios que ya saben escribir y con un control sobre la inclusién de nifios de todas las zonas de la metrépoli, al utilizar la ubicacién de las escuelas como puntos de referencia y de seleccidn. En éste y otros casos, la delimitacién de las caracteristicas de 1a poblacién no sélo depende de los objetivos del estudio, sino de otras razones practicas. Un estudio no seré mejor por tener una poblacién mAs grande; la calidad de un trabajo investigativo estriba en delimitar claramente la poblacién con base en el planteamiento del problema. Las poblaciones deben situarse claramente en torno a sus caracteristicas de contenido, de lugar y en el tiempo. Por ejemplo, _ Poblacién 0 universo Baptista (1983) en un estudio sobre los directivos de empresa en Conjunto de todos los México y con base en las consideraciones tedricas del estudio que 2505 due concuerdan con determinadas describe el comportamiento gerencial de los individuos y la rela- specificaciones. cién de éste con otras variables de tipo organizacional, procedié a definir la poblacién de la siguiente manera: ‘Nuestra poblacién comprende a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de ‘pesos y/o con més de 300 personas empleadas. Limites de poblacion Todos los nos del area metropolitans de la ciudad de Mexico, que cursen 4,5" y6" de primaria en escuelas privadas y publicas del tumo matutino. limitaci6n de la muestra. 239 240 SEGUNDA PARTE I proceso de la investigacién euantitativa En este ejemplo se delimita claramente la poblacién, excluyendo a personas que no son di- rectores generales, a empresas que no pertenezcan al giro industrial y comercial. Se establece también, con base en criterios de capital y de recursos humanos, que se trata de empresas me- dianas y grandes. Por tiltimo, se indica que estos criterios operaron en 1983, en México, Al seleccionar la muestra debemos evitar tres errores que pueden presentarse: 1) no elegir a casos que deberian ser parte de la muestra (participantes que deberian estar y no fueron selec- cionados), 2) incluir a casos que no deberian estar porque no forman parte de la poblacién y 3) seleccionar casos que son verdaderamente inelegibles (Mertens, 2005). Por ejemplo, en una en- cuesta o survey sobre preferencias electorales entrevistar a individuos que son menores de edad y no pueden votar legalmente (no deben ser agregados a la muestra, pero sus respuestas se in- cluyeron, esto, evidentemente es un error). Asimismo, imaginemos que realizamos una investiga- cién para determinar el perfil de los clientes-miembros de una tienda departamental y generamos una serie de estadisticas sobre éstos en una muestra obtenida de la base de datos. Podria ocurrir que la base de datos no estuviera actualizada y varias personas ya no fueran clientes de la tien- day, sin embargo, se eligieran para el estudio (por ejemplo, que algunas se hayan mudado a otra ciudad, otras hayan fallecido, unas més ya no utilizan su membresia y hasta hubiera personas que se hayan hecho clientes-miembros de la competencia). El primer paso para evitar tales errores es una adecuada delimitacién del universo o pobla- cién. Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, lo impor- tante es establecerlos de manera muy especifica. Toda investigacién debe ser transparente, asi como estar sujeta a critica y réplica, este ejercicio no es posible si al examinar los resultados el lector no puede referirlos a la poblacién utilizada en un estudio. éCémo seleccionar la muestra? Hasta este momento hemos visto que se debe definir cual seré la unidad de andlisis y cudles son las caracteristicas de la poblacién. En este inciso hablaremos de la muestra, o mejor dicho de los tipos de muestra, con la finalidad de poder elegir la més conveniente para un estudio, La muestra es, en esencia, un subgrupo de la poblacién. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus caracteristicas al que llamamos pobla- cién. Esto se representa en la figura 8.3. Con frecuencia leemos y escuchamos hablar de muestra representativa, muestra al azar, muestra aleatoria, como si con los simples términos se pudiera dar més seriedad a los resultados. En realidad, pocas veces es posible medir a toda la poblacién, por lo que obtenemos o seleccionamos una muestra y, desde luego, se pretende que este subconjunto sea un reflejo fiel del conjunto de la poblacién. Todas las muestras —bajo el enfoque cuantitati vo— deben ser representativas; por lo tanto, el uso de este término resulta por demas intitil. Los ‘términos al azar y aleatorio denotan un tipo de procedimiento mecénico relacionado con la proba- bilidad y con la seleccién de elementos; pero no logran esclarecer tampoco el tipo de muestra y el procedimiento de muestreo. Hablemos entonces de estos conceptos en los siguientes apartados. Tipos de muestra Basicamente categorizamos las muestras en dos grandes ramas: las muestras no probabilisticas y las muestras probabilisticas. En estas tiltimas todos los elementos de la poblacién tienen la Muestra Figura 8.3 Representacién de una muestra como subgrupo. misma posibilidad de ser escogidos y se obtienen definiendo las. caracteristicas de la poblacién y el tamaiio de la muestra, y por medio de una seleccién aleatoria 0 mecénica de las unidades de andlisis. Imaginese el procedimiento para obtener el niimero pre- miado en un sorteo de loteria. Este mimero se va formando en el momento del sorteo. En las loter‘as tradicionales, a partir de las esferas con un digito que se extraen (después de revolverlas me- CAPITULO 8 Seleccin delamuestra 241 Poblacion Elementos 0 unidades de analisis Muestra probabilistica Subgrupo de la poblaci6n en el que todos los elementos de ésta tienen la misma posibilidad de ser elegidos. cénicamente) hasta formar el mimero, de manera que todos los niimeros tienen la misma proba- bilidad de ser elegidos. En las muestras no probabilisticas, la elecci6n de los elementos no depende de la probabi- lidad, sino de causas relacionadas con las caracteristicas de la investigacién o de quien hace la muestra, Aqui el procedimiento no es mecénico, ni con base en formulas de probabilidad, sino que depende del proceso de toma de decisiones de una persona o de un grupo de personas y, desde Inego, las muestras seleccionadas obedecen a otros criterios de investigacién. Elegir entre una muestra probabilistica o una no probabilistica depende de los objetivos del estudio, del esquema de investigacién y de la contribucidn que se piensa hacer con ella. Para ilustrar lo anterior mencionaremos tres ejemplos que toman en cuenta dichas consideraciones. Muestra no probabilistica ida Subgrupo de la poblacion en la que la eleccién de los elemen- tos no depende de la probabilidad sino de las caracteristicas de la investigacién, EJEMPLO En un primer ejemplo tenemos una investigacién sobre inmigrantes extranjeros en México Baptista, 1988). El objetivo de la investigacién era documentar sus experiencias de viaje, de vida y de trabajo. Para cumplir dicho propésito se seleccioné una muestra no probabilistica de personas extranjeras que por diversas razones (econémicas, politicas, fortuitas) hubieran legado a México entre 1900 y 1960. Las personas se seleccionaron por medio de conocidos, 242 SEGUNDA PARTE El proceso de a investigacion cuantitativa de asilos y de referencias. De esta manera se entrevisté a 40 inmigrantes con entrevistas semiestructuradas, que permitieron al participante hablar libremente sobre sus experien- cias. Comentario: En este caso es adecuada una muestra no probabilistica, pues se trata de un estudio con un disefio de investigacién exploratorio y un enfoque fundamentalmente cualita- tivo; es decir, no es concluyente, sino que su objetivo es documentar ciertas experiencias. Este tipo de estudio pretende generar datos e hipétesis que constituyan la materia prima para in- vestigaciones més precisas. EJEMPLO Como segundo caso mencionaremos una investigacién hipotética en un pais, para saber cudn- tos nifios han sido vacunados y cudntos no, y las variables asociadas (nivel socioecondmico, lugar donde viven, educacién) con esta conducta y sus motivaciones. Se haria una muestra probabilistica nacional de —digamos por ahora— 1 600 infantes, y de los datos obtenidos se tomarian decisiones para formular estrategias de vacunacién, asi como mensajes dirigidos a persuadir la pronta y oportuna vacunacién de los nifios. Comentario: Este tipo de estudio, donde se hace una asociacién entre variables y cuyos resultados servirdn de base para tomar decisiones politicas que afectardn a una poblacién, se logra por medio de una investigacién por encuestas y, definitivamente, por medio de una muestra probabilistica, disefiada de tal manera que los datos lleguen a ser generalizados a la poblacién con una estimacién precisa del error que pudiera cometerse al realizar tales gene- ralizaciones. EJEMPLO Se disefié un experimento para determinar si los contenidos violentos de la televisién generan conductas antisociales en los nifios. Para lograr tal objetivo se seleccionaria en un colegio a 60 nifios de cinco afios de edad, de igual nivel sociveconémico y nivel intelectual, y se asigna- rian aleatoriamente a dos grupos o condiciones. Asi, 30 nitios verian caricaturas prosociales y otros 30 observarian caricaturas muy violentas. Inmediatamente después de la exposicién a dichos contenidos, los infantes serian observados en un contexto de grupo y se medirian sus condnctas violentas y prosociales. Comentario: Esta es una muestra no probabilistica. Aunque se asignen los nifios de ma- nera aleatoria a las dos condiciones experimentales, para generalizar a la poblaciGn se nece sitarfan repetidos experimentos. Un estudio asi es valioso en cuanto a que el nivel causa-efecto es més preciso al aislar otras variables; sin embargo, no es posible generalizar los datos a todos los nifios, sino a un grupo de nifios con las mencionadas caracteristicas. Se trata de una muestra dirigida y “clasica” de un estudio de este tipo. La seleccién de la mues tra no es al azar, aunque la asignacién de los nifios a los grupos sf lo es. CAPITULO 8 Seleocén dela muestra éComo se selecciona una muestra probabilistica? Resumiremos diciendo que la eleccién entre la muestra probabilistica y la no probabilistica se determina con base en el planteamiento del problema, las hipétesis, el disefio de investigacién y elalcance de sus contribuciones. Las muestras probabilisticas tienen muchas ventajas, quiz la principal sea que puede medirse el tamafio del error en nuestras predicciones. Se dice incluso que el principal objetivo en el disefio de una muestra probabilistica es reducir al minimo este error, al que se le llama error estandar (Kish, 1995). Las muestras probabilisticas son esenciales en los diseiios de investigacién transeccionales, tanto descriptivos como correlacionales-causales (las encuestas de opinidn o surveys, por ejem- plo), donde se pretende hacer estimaciones de variables en la poblacién, Estas variables se miden yy se analizan con pruebas estadisticas en una muestra, donde se presupone que ésta es probabi listica y todos los elementos de la poblacién tienen una misma probabilidad de ser elegidos. Las unidades o elementos muestrales tendran valores muy parecidos a los de la poblacién, de mane- ra que las mediciones en el subconjunto nos darén estimados precisos del conjunto mayor. La precisién de dichos estimados depende del error en el muestreo, que es posible calcular. Esto se representa en la figura 8.4, Hay ademés otros errores que dependen de la medicién, pero éstos serén tratados en el si guiente capitulo, Para hacer una muestra probabilistica es necesario entender los siguientes términos y sus definiciones: La poblacién, ala que se le suele denominar como W, es un conjunto de elementos. La muestra, a la que se le simboliza como n, es un subconjunto de la poblacién W. En una poblacién WV (previamente delimitada por los objetivos de la investigaci6n), nos interesa establecer valores de las caracteristicas de los elementos de W. Nos interesa conocer valores promedio en la poblacién, lo cual se expresa como: Y = al valor de una variable determinada (Y) que nos interesa conocer, digamos un promedio, También nos interesa conocer: V = la varianza de la poblacién con respecto a determinadas variables (la varianza indica la variabilidad). Poblacion .a generalizacion de las ett ri Eanes rn tettee ee neidiccaiie >| tities Perteet trttee error de muestreo titene pttret va igura 8.4 Esquema de la generalizacién de la muestra a la poblacién. 243 244 SEOUNDA PARTE El proceso de la investigaci6n cuantitativa Como los valores de la poblacién no se conocen, seleccionamos una muestra n ademés, a través de estimados en la muestra, inferimos valores de la poblacién (7 serd la estimacién del valor de ¥, el cual desconocemos). En la muestra, 7 es un estimado promedio que podemos determinar, Sabemos que en muestra estimacién habré una diferencia (Y 2), es decir, un error, el cual dependerd del miimero de elementos muestreados. A dicho error se le conoce como error estandar (se). se = la desviacién estandar de la distribucién muestral y representa la fluctuacién de J. (ce)? = el error esténdar al cuadrado, cuya formula nos serviré para calcular la varianza (V) de la poblacién (), asi como la varianza de la muestra (n) sera la expresién s’. varianza de la muestra, la cual podra determinarse en términos de probabilidad donde s=p(-p) p= porcentaje estimado de la muestra, probabilidad de ocurrencia del fendmeno, la cual se estima sobre marcos de muestreo previos o se define, la certeza total siempre es igual a uno, las posibilidades a partir de esto son “p” de que si ocurra y “g” de que no ocurra (6 +q=1). De aquise deriva 1-p. Como se habré podido observar, cuando hablamos de un término de la muestra se simboliza con una letra mintiscula (n, s, sé). Si se trata de un término de la poblacién, se simboliza con una letra maytiscula WV, S) Para una muestra probabilistica necesitamos principalmente dos cosas: determinar el tamafio de la muestra (n) y seleccionar los elementos mnestrales, de manera que todos tengan la misma posibilidad de ser elegidos. Para lo primero, daremos una formula que contiene las expresiones ya descritas. Para lo segundo, requerimos un marco de seleccién adecuado y un procedimiento que permita la aleatoriedad en la seleccién. Hablaremos de ambas cosas en los siguientes apar- tados. El tamafio de la muestra Cuando se hace una muestra probabilistica, uno debe preguntarse: dado que una poblacién es de NW, joual es el menor niimero de unidades muestrales (personas, organizaciones, capitulos de telenovelas, etc.) que necesito para conformar una muestra (n) que me asegure un determinado nivel de error estandar, digamos menor de 0.01? La respuesta a esta pregunta busca encontrar la probabilidad de ocurrencia de Y, asi como que mi estimado de j se acerque a ¥, el valor real de la poblacién. Si establecemos el error es- téndar y lo fijamos en 0.01, sugerimos que esta fluctuacién promedio de nuestro estimado 7 con respecto a los valores reales de la poblacién ¥ no sea > 0.01, es decir, que de 100 casos, 99 veces mi prediccién sea correcta y que el valor de se sitiie en un intervalo de confianza que comprenda el valor de Y. Resumiendo, para una determinada varianza (V) de Y, ,qué tan grande debe ser mi muestra? Bllo se determina en dos pasos: CAPITULO 8 Seleccién dela muestra 2 Lats i = Tamaiio provisional de la muestra’ = varianza de la muestra/varianza de la poblacién “1 +n Pongamos el siguiente caso: en el ejemplo que ya habiamos mencionado en este capitulo, delimitamos una poblacién para un estudio de directores generales, en el cual consideramos a “todos aquellos directores generales de empresas industriales y comerciales que, en 1983, tenian un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y con més de 300 personas empleadas”. Con estas caracteristicas se precis6 que la pobla- cién era de W = 1176 directores generales, ya que 1176 empresas reunian las mencionadas caracteristicas. {Cudl es entonces el mimero de directores generales (n) que se debe entrevistar, para tener un error esténdar menor de 0.015, y dado que la poblacién total es de 1176? W = tamaiio de la poblacién de 1 176 empresas. 7 = valor promedio de una variable = 1, un director general por empresa, error estandar = 0.015, determinado por nosotros varianza de la poblacién al cuadrado. Su definicién se: cuadrado del error esténdar varianza de la muestra expresada como la probabilidad de ocurrencia de 7 0.9 ‘tamaiio de la muestra sin ajustar n= tamaiio de la muestra Si lo sustituimos, tenemos que: s° = p(l-p) = 0.9(1-0.9) = 0.09 V? = (0.015)? = 0.000225 0.09 0.000225 nt 400 1+ WM) 1+ 400/176) n= 298 casos Es decir, para nuestra investigacién necesitaremos una muestra de 298 directores:generales, Se trata del primer procedimiento para obtener la muestra probabilistica: determinar su ta- maiio con base en estimados de la poblaci6n. El segundo procedimiento estriba en cémo y de dénde seleccionar a esos 298 sujetos. Si el estudiante prefiere, en lugar de aplicar formulas, calcular de manera automética un ta- mafio de muestra aleatoria simple puede utilizar el programa Stats®, que se incluye en el CD anexo,’ el célculo lo realiza con tan sélo teclear cierta informacién. El programa nos solicita que 1 Se cortige con otros datos, austndose si se conoce el tamatio de la poblacién W. *Bl tamaiio de muestra obtenido por las formulas de este capitulo y el conseguido mediante el Stats® puede variar ligeramen te, pero ambos tamafios se encuentran dentro de pardmetros aceptables y con un nivel adecuado de confianza. 246 SEGUNDA PARTE El proceso de la investigaci6n euantitativa determinemos el tamafio del universo o la poblacién (aunque sea . aproximado), sin olvidar que por encima de 99999 casos da lo poe peo incluido: mismo cualquier tamafio del universo (un millén, 200 mil, 54 ©" ©! CD anexo que nos ‘ Y sirve para determinar el nillones, etc.) porlo que si tecleamos un miimero mayor 299999 tarnano de una muestra el programa nos pondré esta cifra por omisidn, pero si es menor _aleatoria simple y generar la respeta. nimeros aleatorios para También nos pide que definamos el error estandar (probabili-__ seleccionar los casos de dad) y el nivel de significancia o margen de error, asi como el de 2 ™uestra de una base Sent ” de datos o listado de la confianza (términos que se explican en el capitulo del proceso Fo tacion, cuantitativo sobre andlisis de los datos). El programa automati camente coloca un nivel de 95% y 5% (confianza y error, respec tivamente), que es el aceptado para ciencias sociales. Con s6lo presionar el botén de “calcul se obtiene el tamafio de muestra apropiado, Veamos el calculo hecho por Stats® con ejemplos. EJEMPLO Problema de investigacién: ‘Supongamos que el gobierno de un estado, provincia o departamento, ha emitido una ley que impide (prohibicidn expresa) a las estaciones de radio transmitir comerciales que utilicen un lenguaje procaz (groserias, malas palabras). Dicho gobierno nos solicita analizar en qué me- dida los anuncios radiofénicos transmitidos en el estado utilizan en su contenido este lengua- je, digamos durante el tltimo mes. Poblacion: Comerciales transmitidos por las estaciones radiofénicas del estado durante el ultimo mes. Tamaito de muestra (n): Lo primero es determinar o conocer WV (recordemos que significa poblacién 0 universo). En este caso N = 20 000 (20 mil comerciales transmitidos). Lo segundo es establecer el error aceptable y el nivel de confianza (que suele ser de 1 0 5% en él caso del error, expresado en Proporcién como 0.01 0 0.05, asi como de 95 y 99% en cuanto al nivel de confianza) Es decir, tener la seguridad de que nuestra muestra sea representativa de la poblacién con 95 0 99% de probabilidades a nuestro favor. En contra, con 5 0 1 por ciento. ‘Tecleamos los datos que Stats® nos pide: Tamaiio de la pobla 20.000 Error maximo aceptable: 5% Nivel de confianza: 95% De manera automética, el programa nos calcula el tamaiio de muestra necesario o reque- ido: n = 376.9386 (cerrando o aproximando: 377), que es el mimero de comerciales radiof6- nicos que necesitamos para representar al universo de 20 000, con un error de 0.05 (5%) y un nivel de confianza de 95 por ciento. CAPITULO 8 Scleccindelamuose 247 Si cambiamos el nivel de error tolerado y el nivel de confianza (0.01 0 1% de error y 99% de confianza, el tamaiio de la muestra serd mucho mayor, en este caso de 6 488.53 comercia- les), E] tamaiio de la muestra es sensible al error y nivel de confianza que definamos, A menor error y mayor nivel de confianza, mayor tamaiio de muestra requerido para representar a la poblacién 0 universo. EJEMPLO Problema de investigacién: Analizar la motivacién intrinseca que tienen los empleados de la cadena de restaurantes “Lucy y Laura Bunny’ Poblacién: = 600 empleados (cocineros, meseros, ayudantes, etcétera) Tamaiio de muestra: Con un error de 0.05 (5%) y un nivel de confianza de 95%, el tamaiio requerido para que la muestra sea representativa es de 234 empleados. Conforme disminuye el tamaiio de la poblacién aumenta la proporcién de casos que nece- sitamos en la muestra. Con W = 4 500 (0.05 0 5% de error y 95% de nivel de confianza), la muestra seria de 354.02 casos (cerrando, 354). A las muestras de los ejemplos (obtenidas por la formula o por Stats®) se les conoce como muestras aleatorias simples (MAS). Su caracteristica esencial, como ya se mencioné, es que todos los casos del universo tienen al inicio la misma probabilidad de ser seleccionados. Muestra probabilistica estratificada En ocasiones el interés del investigador es comparar sus resultados entre segmentos, grupos 0 nichos de la poblaci6n, porque asi lo seiiala el planteamiento del problema. Por ejemplo, efectuar comparaciones por género (entre hombres y mujeres), sila seleccién de la muestra es aleatoria, tendremos unidades o elementos de ambos géneros, no hay problema, la muestra reflejard a la poblacién, Pero a veces, nos interesan grupos que constituyen minorias de la poblacién o universo y entonces si la muestra es aleatoria simple, resultara muy dificil determinar qué elementos o casos de tales grupos serdn selec- Muestra probabilistica cionados. Imaginemos que nos interesan personas de todas las __estratficada Subgrupo religiones para contrastar ciertos datos, pero en la ciudad donde en el que la poblacién se se efectuard el estudio la mayorfa es —por ejemplo— predomi- _dlivide en segmentos y se nantemente catdlica, Con MAS es casi seguro que no elijamos lecciona una muestra individuos de diversas religiones 0 s6lo unos cuantos. No podria. P'@ “909 Sesmento 248 SROUNDA PARTE El proceso do lainvestigacién cuantitativa mos efectuar las comparaciones. Quiza tengamos 300 catélicos y dos o tres de otras religiones, Entonces es cuando preferimos obtener una muestra probabilistica estratificada (el nombre nos dice que seré probabilistica y que se considerardn segmentos o grupos de la poblacidn, o lo que es igual: estratos). Ejemplos de estratos en la variable religion serian: catélicos, protestantes, judios, mahome- tanos, budistas, etc. Y de la variable grado o nivel de estudios: infantil, primaria, secundaria, bachillerato, universidad (0 equivalente) y posgrado. El ejemplo anterior de los directores generales de empresa corresponde a una muestra pro- babilistica simple. Determinamos en este caso que el tamaiio de la muestra seria de n = 298 di- rectivos. Pero supongamos que la situacién se complica y que debemos estratificar esta n con la finalidad de que los elementos muestrales 0 las unidades de andlisis posean un determinado atributo. En nuestro ejemplo, este atributo podria ser el giro de la empresa. Es decir, cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos, sino que ademds es necesario estratificar la muestra en relacién con estratos o categorfas que se presentan en la poblacién, y que ademés son relevantes para los objetivos del estudio, se disefia una muestra probabilistica estratificada. Lo que aqui se hace es dividir a la poblacién en subpo- blaciones o estratos, y se selecciona una muestra para cada estrato. La estratificacién aumenta la precisién de la muestra e implica el uso deliberado de diferentes tamafios de muestra para cada estrato, a fin de lograr reducir la varianza de cada unidad de la media muestral (Kish, 1995). En su libro de muestreo, Kish afirma que, en un niimero determi- nado de elementos muestrales n = ¥ nh, la varianza de la media muestra J puede reducirse al minimo, si el tamafio de la muestra para cada estrato es proporcional a la desviacién esténdar dentro del estrato. Esto es, spp at Z Sh = 5 = ksh En donde la muestra n seré igual a la suma de los elementos muestrales nf, Es decir, el ta- mafio de ny la varianza de pueden minimizarse, si calculamos “submuestras” proporcionales a la desviacidn estandar de cada estrato. Esto es: faa th x sh En donde nh y Nh son muestra y poblacién de cada estrato, y sh es la desviacion estandar de cada elemento en un determinado estrato. Entonces tenemos que: Siguiendo con nuestro ejemplo de los directores de empresa, la poblacién es de 1176 direc- tores de empresa y el tamafio de muestra es n = 298. ;Qué muestra necesitaremos para cada estrato? 2 = 28 _ 92534 ish 1176 CAPITULO 8 Scleccéndelamuestra 249 De manera que el total de la subpoblacién se multiplicaré por esta fraccién constante para obtener el tamaiio de la muestra para el estrato. Al sustituirse, tenemos que (Wh) (fh) = nh (véase tabla 8.2) Tabla 8.2 Muestra probabilistica estratificada de directores de empresa ‘Total poblacién® Estrato Directores generales (fi) = 0.2534 Por giro de empresa del giro Wh (fh) = nh Muestra, fi Extractivo y sidenirgico 53 1B 2 Metal-mecénicas 109 28 3 Alimentos, bebidas y tabaco 215 55 4 Papel y artes gréficas 87 22 5 Textiles 98 6 Eléctricas y electrénicas 110 7 Antomotriz a1 8 ‘Quimico farmacéutica 221 9 Otras empresas de transformacién isi 10 Comerciales 51 N=1176 Por ejemplo; Nh = 53 directores de empresas extractivas corresponden a la poblacién total de este giro. fh = 0.2534 es la fraccién constante, rh = 13 es el mimero redondeado de directores de empresa del giro extractivo y siderirgico que tendré que entrevistarse. "Puente: Indusrdats, 1982, Se just al trcer giro por décimas Muestreo probabilistico por racimos En algunos casos, en que el investigador se ve limitado por recur- . . 44 Racimos Son sinénimos sos financieros, por tiempo, por distancias geogréficas 0 por una Ge\ciyererso conglomerd: combinacién de éstos y otros obstdeulos, se recurre al muestreo do. por racimos o clusters. En este tipo de muestreo se reducen costos, tiempo y energia, al considerar que muchas veces las unidades de andlisis se encuentran encapsuladas o encerradas en determinados Iugares fisicos geograficos, a los que se denomina racimos. Para dar algunos ejemplos tenemos la tabla 8.3. En Ja primera columna se encuentran unidades de andlisis que frecuentemente vamos a estudiar. En Ja segunda, sugerimos posibles racimos donde se encuentran dichos elementos. 250 SEGUNDA PARTE El proceso de la investigacién euantitativa Tabla 8.3. Ejemplo de racimos o clusters Unidad de andlisis Posibles racimos Adolescentes Preparatorias Obreros Industrias Amas de casa Mercados Nifios Colegios Muestrear por racimos implica diferenciar entre la unidad de - andlisis y la unidad muestral. La unidad de andlisis indica quiénes Sear STEE en van a ser medidos, o sea, los participantes 0 casos a quienes en Ef aye las uniciades de iiltima instancia vamos a aplicar el instrumento de medicién. La andlisis se encuentran unidad muestral (en este tipo de muestra) se refiere al racimo por encapsuladas en determi- medio del cual se logra el acceso a la unidad de andlisis. Elmues- dos lugares fisicos. treo por racimos supone una seleccién en dos etapas, ambas con procedimientos probabilisticos. En la primera, se seleccionan los acimos, siguiendo los pasos ya sefialados de una muestra probabilistica simple o estratificada. En la segunda, y dentro de estos racimos, se selecciona a los sujetos u objetos que van a medir- se, Para ello se hace una seleccién que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos. A continuacién daremos un ejemplo que comprenda varios de los procedimientos descritos hasta ahora y que ilustra la manera como frecuentemente se hace una muestra probabilistica en varias etapas. EJEMPLO &Cémo hacer una muestra probabilistica estratificada Y por racimos? Problema de investigacién: Una estacién de radio local necesita saber con precisién, con la finalidad de planear sus es- trategias, c6mo utilizan la radio los adultos de una ciudad de 2 500 000 habitantes. Es decir, qué tanto radio escuchan, a qué horas, qué contenidos prefieren y sus opiniones con respecto a los programas noticiosos. Procedimientos: Se disefiard un cuestionario que indague estas areas sobre el uso de la radio. Los cuestiona- rios se aplicardn por entrevistadores a una muestra de sujetos adultos. Poblacion: Todos aquellos sujetos hombres o mujeres de mas de 21 afios de edad, y que vivan en una casa o un departamento propio o rentado de la ciudad, CAPITULO 8 Scleccién éolamuestra 251 Diseito por racimos: Los directivos de la estacién de radio desconocen el mimero total de personas con las carac- teristicas sefialadas. Sin embargo, nos piden que disefiemos una muestra que abarque a todos. los sujetos adultos de la ciudad, adultos por edad cronolégica y por ser jefes de familia, es decir, se excluye a los adultos dependientes. Se recurre entonces a la estrategia de seleccionar racimos y se considera el uso de un mapa actualizado de la ciudad, el cual indica que en dicha ciudad hay 5 000 cuadras. Las cuadras se utilizardn como racimos, es decir, como unidades muestrales, a partir de las cuales obtendremos en tiltima instancia a nuestros sujetos adultos. Lo primero entonces es determi- nar: gcudntas cuadras necesitaremos muestrear, de una poblacién total de 5 000 cuadras, si queremos que nuestro error esténdar sea no mayor de 0.015 y con una probabilidad de ocu- rrencia de 50 por ciento? 2 ‘Tenemos entonces que n’ a para na muestra probabilistica simple. 2 - - SF _ POP) _ a sténdar - 2501 = 05) = 0.25 vy? 0.015)? 0.000225 n= 111111 f 1111.1 7 ___11tt** = 999.0902 1+ n/N’ 1 + 1111.11/5000 n= 909 Necesitaremos una muestra de 909 cuadras para estimar los valores de la poblacién con una probabilidad de error menor a 0.015. Sabemos que la poblacién W = 5 000 cuadras esta dividida por estudios previos de acuer- do con cuatro estratos socioeconémicos, que categorizan esa poblacién segiin el ingreso mensual promedio de sus habitantes, de manera que se distribuyen como sigue: ESTRATO NUM. DE CUADRAS 1 270 2 1940 3 2.000 4 790 T= 5000 4Cémo distribuiremos los 909 elementos muestrales de n, para optimizar la muestra, de acuerdo con la distribucién de la poblacién en los cuatro estratos socioeconémicos? Estratificacién de la muestra: Sf ksh fh a. ¥ 909 _ F000 ~ 01818 252 SEGUNDA PARTE El proceso de la investigncién cuantitaiva ESTRATO NUM. DECUADRAS fh = 0.1818 nh* 1 270 (0.1818) 49 2 1940 (0.1818) 353 3 2.000 (0.1818) 364 4 790 (0.1818) 143 = 5000 n= 909 * Se ajusté el iltimo valor ala baja (redondeo}, para cuadrar el ejemplo, recordemos que son sujetos y no se pueden fragmentar. En principio tenemos que de 5 000 cuadras se seleccionardn 49 del estrato uno, 353 del estrato dos, 364 del estrato tres, y 143 del estrato 4. Esta selecciGn comprende la seleccién de los racimos, los cuales se pueden numerar y elegir aleatoriamente hasta completar el mimero de cada estrato. En una iiltima etapa, se seleccionan los participantes dentro de cada racimo, Este procedimiento también se hace de manera aleatoria, hasta lograr un mimero de personas (unidades de andlisis) determinados en cada racimo. A continuacién descubriremos dicho procedimiento. NUMERO DE HOGARES TOTAL DE PARTICIPANTES EN HOGARES ESTRATO Nh CUADRAS nh CADA CUADRA POR ESTRATO 1 270 49 20 980 2 1940 353 20 7060 3 2.000 364 20 7280 4 790 143 20 2.860 = 5000 n= 909 18180 éComo se lleva a cabo el procedimiento de seleccién de la muestra? Cuando iniciamos nuestra exposicién sobre la muestra probabilistica, seiialamos que los tipos de muestra dependen de dos cosas: del tamafio de la muestra y del procedimiento de seleccion. De lo primero hemos hablado con todo detalle, de lo segundo trataremos ahora. Se determina el tamafio de la muestra n, pero ge6mo seleccionar los elementos muestrales? Se precisa el mi- mero de racimos necesario y ¢e6mo se seleccionan los sujetos dentro de cada racimo? Hasta el momento s6lo hemos dicho que los elementos se eligen de manera aleatoria, pero gcdmo se hace esto? Las unidades de andlisis 0 los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido. Se utilizan tres procedimientos de seleccisn: CAPTULO 8 Selecciinde Je muesta Témbola Muy simple y no muy répido, consiste en numerar todos los elementos muestrales del uno al niimero n. Hacer fichas o papeles, uno por cada elemento, revolverlos en una caja, e ir sacando n mimero de fichas, segtin el tamafio de la muestra. Los mimeros elegidos al azar conformaran Ja muestra. ‘Asi, en la tabla 8.2, tenemos que, de una poblacién WV = 53 empresas extractivas y siderirgi- cas, se necesita una muestra n = 13 de directivos generales de tales empresas. En una lista se numeran cada una de estas empresas, En fichas aparte se sortea cada uno de los 53 miimeros, hasta obtener los 13 necesarios (pueden ser las 13 primeras fichas que se extraigan). Los mime- ros obtenidos se verifican con los nombres y las direcciones de nuestra lista, para precisar los que serén participantes del estudio. Nimeros random o nimeros aleatorios El uso de niimeros random no significa la seleccién azarosa o fortuita, sino la utilizacién de una tabla de niimeros que implica un mecanismo de probabilidad muy bien disefiado, Los nimeros random de la Corporacién Rand fueron generados con una especie de ruleta electronica. Existe una tabla de un millén de digitos, publicada por esta corporacién, cuyas partes se encuentran en los apéndices de muchos libros de estadistica, incluido el que estd leyendo (ver tabla de niimeros aleatorios en el apéndice 4 del CD anexo). Son como lo muestra la tabla 8.4. Tabla 8.4 Némeros aleatorios o random 26804 -20273««79811«««45610 «22879 «72538-70157 ©1783 6704252886 90720 9621548537 «94756 «—« 18124 «80051-27900 © «BRSI13. «35043. «67200 85027 5020776180 «41416 «48521 «18720 90258-95508 «1082293074 09362 «4967465953 -«—«96702 «20772 ~——«12009 «4990108913. «—=«1510 «64809 64500 04104-16770 ©=«79237 «82158 «04553 ©—«93000««18585 «72279 ©0116. 06432 08525 ««66864~—« 20507-92817 39800-=«98820. «1812081860 68065, 02101 «60119-95836. «88049 «80312 «82716-34708. «12795 S424 09700 19337 96983 60321-62194 «08574 ©1896 00390-7502 +6220 «16404 75277 47880 07952. 35832_—=« 41055-27155. «95189 00400-06649 $3040 59535 7588531648 88202_-«63809-«= 40911 «78138-26376 «6641 (O7201 76310 7938584630 «27804 48889 «80070-64689 © 9031004232 84008 1280565754 96887 «67060-« 88413. «31883 «79233-90603. © 68980 80233 32242 73807 «4832167123 «40637 «14102-55550 80092-80503 64642 1621284700 © 69274 «13252 © 7807410781 43629 36228 «3604275402 75362 «83083 «—««25620 «24828 «50345-40653 «85639 «42613. © 40242«—«43160 34703 «9344582051 «5343753717 48719 «T1858 11230-26076 44018 0155658563. «36828 «85053-30025 «16688 «G9S24 «81885. 3191113008 22211 86468-76205 «16663. «30489 «18400 53155 92087 43042. 9082T O1s3 —70128_-««14111——«77065 «9935828443 «68135 6169655241 1867 09047-32348 «56909 40951-00440 «= «1030S S8160 62235 «8945573005, 97021 -23763-«—«18491 6508695283 92232-86695 78609 79606. BRSTA 25469 © 3708_«=«78718-—««35014 «40387 «15021 $8080 03036-15953 «S658, 40337 48522-11418 «00090 «41779 +5449 © 08623. «49002-65431 ~—«11300 33491 98685.—«92536«=««51626 «8578747841 «9578770130 42383 4187 44704 '14986.-—«16042~—«19429 «1960 ««22883 «8005530851 «=««47350 «70387 ‘Fuonte: Rand Corportion, 253 254 SEGUNDA PARTE El proceso de la investigaci6n cuantitativa Si continuamos con el ejemplo anterior, determinaremos una muestra de 909 manzanas 0 cuadras, y a partir de este mimero se determina una submuestra para cada estrato. Véase que para el estrato uno, la poblacién es de 270 manzanas. Numeramos en nuestro listado o mapa las 270 cuadras y seleccionamos (a partir de la tabla de mimeros random) los 49 casos que consti- tuirdn nuestra muestra. Se eligen aquellos casos que se dictaminen en Ja tabla de mimeros random, hasta completar el tamafio de la muestra. Los niimeros pueden recorrerse hacia arriba, hacia abajo o de manera horizontal. Al final siempre se logra que cada elemento muestral tenga la misma probabilidad de ser escogido. Se eligen aquellos ntimeros que contenga el listado. Si en nuestro ejemplo la pobla- cidn es de 270, se escogen los tres tiltimos digitos y se procede de la siguiente manera a seleccio- nar los casos, hasta completar el miimero de elementos muestrales necesarios (49 manzanas). Tabla 8.5 Seleccién muestral basada en la tabla de numeros aleatorios 78 986 45.961 28 281 82.933 24.786 55.586 83 830 59.025 40 379 99.989 63.822 99974 (1)30 226 19.863 (5)95 039 08 909 (7)48.197 (8)23 270 (2)02 073 (4)59 042 26.440 (16 161 14.496 24.786 (3)05 250 AT 552 95 659 92.356 13.334 23.471 En la tabla 8.5 se eligieron sélo las primeras ocho manzanas (de las 49 requeridas) para no prolongar el ejemplo (las ocho estén numeradas). Una vez seleccionadas las 49 manzanas se ubican en un mapa o directorio y acudimos a los hogares (veinte en cada una de las 49 manzanas) y entrevistamos a los adultos, jefes de familia (en el ejemplo 980). Una excelente alternativa para generar niimeros aleatorios se encuentra en el programa Stats®, que contiene un programa para ello y evita el uso de la tabla de niimeros aleatorios, Es hasta ahora la mejor forma que hemos encontrado para hacerlo. El programa nos pide que le indiquemos icudntos mimeros aleatorios? (requerimos), entonces tecleamos el tamaiio de muestra 0, como en el ejemplo, el mimero de casos necesarios para el estrato (49). Nos solicita que establezcamos el limite inferior (que siempre serd uno, el primer caso de la poblacién, pues la muestra se extrae de ésta) y el limite superior (el iltimo niimero de la poblacién, que es el tamaiio de la poblaci6n o del estrato, en el ejemplo: 270 manzanas). Y nos genera 49 mimeros al azar comprendidos entre uno y 270. Estos mimeros son los casos que pasarian a integrar la muestra. Asi, se logra tener una muestra probabilistica. EJEMPLO Ejercicio con Stats” nrequerida = 307 NW tamafio de la poblacién: 1 548 Limite inferior = 1 (tecordemos que siempre seré uno) Limite superior = 1 548, CAPITULO 8 Scleccin dela muestra Tecleamos “calcular” y nos genera 307 mimeros al azar comprendidos entre uno y 1 548 (600, 512, 2, 78, 1 090, etc.). Estos mimeros son los casos que pasarian a ser parte de la muestra, De esta manera tenemos la forma més sencilla de elegir los casos. Seleccion sistemdtica de elementos muestrales Este procedimiento de seleccién es muy uitil e implica elegir dentro de una poblacién WV un ntimero nde elementos a partir de un intervalo K. Este iiltimo (K) es un intervalo que se va a determinar por el tamafio de la poblacién y el tamafio de la muestra. De manera que tenemos que K = Nin, en donde K = un intervalo de seleccién sistemética, V = la poblacién y n = la muestra, Tlustremos los conceptos anteriores con un ejemplo. Supongamos que se quiere hacer un estudio que pretende medir la calidad de la atencién en los servicios proporcionados por los médicos y enfermeras de un hospital. Para tal efecto consideremos que los investigadores consi- guen grabaciones de todos los servicios efectuados durante un periodo determinado.* Suponga- mos que se hayan filmado 1 548 servicios (NV). Con este dato se procede a determinar qué mimero de servicios necesitamos analizar para generalizar a toda la poblacién nuestros resulta- dos. Con Stats® determinamos que se necesitan 307.9 (308) servicios para evaluar (con un error maximo de 5%, nivel de confianza de 95% y un porcentaje estimado de 50% para la muestra (= 05), Si necesitamos una muestra de n = 308 episodios de servicio filmados, se utiliza para la se- leccién el intervalo K, donde: NW _ 1548 K=— =—— = 5.0259, redondeado = 5 n 308 El intervalo 1/K = 5 indica que cada quinto servicio 1/K se seleccionara hasta completar n= 308. La seleccién sistemética de elementos muestrales 1/K se puede utilizar al elegir los elemen- tos de n para cada estrato o para cada racimo. La regia de probabilidad, seguin la cual cada ele- mento de la poblacién debe tener idéntica probabilidad de ser elegido, se cumple al empezar la selecciGn de 1/K al azar. Siguiendo nuestro ejemplo, no comenzamos a elegir de los 1 548 episo- dios, el 1, 6, 11, 16..., sino que procuramos que el inicio sea determinado por el azar. Asi, en este caso, podemos tirar unos dados y si en sus caras muestran 1, 6, 9, iniciaremos en el servicio 169, y seguiremos 174, 179, 184, 189... 1/K... y volveremos a empezar por los primeros si es nece- sario. Este procedimiento de seleccién es poco complicado y tiene varias ventajas: cualquier tipo de estratos en una poblacién X se verdn reflejados en la muestra. Asimismo, la selecci6n siste- matica logra una muestra proporcionada, ya que, por ejemplo, tenemos que el procedimiento de seleccién 1/K nos dard una muestra con nombres que inician con las letras del abecedario, en forma proporcional a la letra inicial de los nombres de la poblacién, “Se sabe que el nimero de servicios en un hospital es muy variable y depende de diversos factores como el miimero de camas, 4e médicos y paramédicos; el tipo y nivel de atencién (desde consultas simples hasta cirugfa compleja) la época, el nimero de habitantes en la zona donde se encuentra ubicado o el mimero de derechohabientes, etc. Bl ejemplo trata de ser simple para que sea entendido por lectores de diversos campos. 255 256 SEGUNDA PARTE El proceso de la investigacién euantitativa Listados y otros marcos muestrales Las muestras probabilisticas requieren la determinaci6n del tamafio de la muestra y de un proceso de selecci6n aleatoria que asegure que todos los elementos de la poblacién tengan la misma probabilidad de ser elegidos. Todo esto lo hemos visto, aunque nos falta exponer sobre algo esen- cial que precede a la seleccién de una muestra: el marco muestral. Este constituye un marco de referencia que nos permita identificar fisicamente los elementos de la poblacién, la posibilidad de enumerarlos y, por ende, de proceder a la selecci6n de los elementos muestrales (los casos Marco muestral Es un de la muestra). Normalmente se trata de un listado existente 0 arco de referencia que una lista que es necesario confeccionar ad hoc, con los casos de NOS Permite identificar Ia poblacion. fisicamente los elementos . , de la poblacién, asi como Los listados existentes sobre una poblacién son variados: Ja posibilidad de enume~ guias telefonicas, listas de miembros de las asociaciones, direc- _rarlos y seleccionar los torios especializados, listas oficiales de escuelas de la zona, bases _ elementos muestrales. de datos de los alumnos de una universidad o de los clientes de una empresa, registros médicos, catastros, néminas de una orga: nizacién, etc. En todo caso hay que tener en cuenta lo completo de una lista, sn exactitud, su veracidad, su calidad y su nivel de cobertura en relaci6n con el problema a investigar y la pobla- cidn que va a medirse, ya que todos estos aspectos influyen en la seleccién de la muestra. Por ejemplo, para algunas encuestas se considera que el directorio telefnico (0 guia telefé- nica) es muy titil. Sin embargo, hay que tomar en cuenta que muchos mimeros no aparecerén porque son privados o porque hay hogares que no tienen teléfono. La lista de socios de una agru- pacién como la Cémara Nacional de la Industria de la Transformacién (México), la Confederacién Espafiola de la Pequeiia y Mediana Empresa, la Asociacién Dominicana de Exportadores o la Camara Nacional de Comercio, Servicios y Turismo de Chile; nos serviria si el propésito del estu- dio fuera, por ejemplo, conocer la opinién de los asociados con respecto a una medida guberna- mental. Pero si el objetivo de la investigacién es analizar la opinién del sector patronal o empresarial del pais, el listado de una sola asociacién no seria adecuado por varias razones: hay otras sociedades patronales,* las asociaciones son voluntarias y no todo patron o empresa perte: nece a ellas. Lo correcto, en esta situacién, seria construir una nueva base de datos, fundamen- tada en los listados existentes de las asociaciones patronales, eliminando de dicha lista los casos duplicados, suponiendo que una o mas empresas pudieran pertenecer a dos agrupaciones al mis- mo tiempo. Hay listas que proporcionan una gran ayuda al investigador. Por ejemplo: bases de datos lo cales especializadas en las empresas, como Industridata en México;° bases de datos internacio- © En México la Canacintra representa s6lo al sector de la industria de la transformacién, en Espaiia la Cepyme no agrupa a ‘grandes consorcios empresariales, en Repiblica Dominicana la Adoexpo no es la tinica asociacién del Consejo Nacional de la ‘Empresa Privada y en Chile la CNC no incluye a la industria de la construccin y la minerfa, por ejemplo. * Directorio que permite consultar informacién de empresas por giro de actividad: industriales, comerciales, de servicio y constructoras, asi como el mimero de personas empleadas. La base de datos clasifica a dichas compafias en: empresas AAA, con ‘més de 500 personas empleadas; empresas AA que tienen entre 251 y 500 personas empleadas; empresas A, entre 151 y 250 personas, y empresas B, entre 100 y 150 personas empleadas. CAPITULO 8 Selec dela muestra nales de naturaleza empresarial como Kompass; directorios por calles 0 los programas computacionales que tienen a nivel regional 0 mundial tales directorios; guias de medios de co- municacién (que enlistan casas productoras, estaciones de radio y television, periddicos y revis- tas). Este tipo de marcos de referencia construidos por profesionales resultan convenientes para el investigador, pues representan una compilacién (de personas, empresas, instituciones, etc.), resultado de horas de trabajo e inversién de recursos. También en internet descubriremos muchos directorios, a los cuales podemos acceder mediante un motor de biisqueda. Recomendamos, pues, utilizarlos cuando sea pertinente, tomando en cuenta las consideraciones que estos directorios 0 bases de informacién hacen en su introduccién y que revelan el afio a que pertenecen los datos, c6mo se obtuvieron éstos (exhaustivamente, por cuestionarios, por voluntarios) y muy importan- te, quiénes y por qué quedan excluidos del directorio, Con frecuencia es necesario construir listas ad hoc, a partir de las cuales se elegiran los ele- ‘mentos que constituirdn las unidades de andlisis en una determinada investigacién. Por ejemplo, en la investigacién planteada: La televisién y el nifio, se establecerfa una muestra probabilistica estratificada por racimos, donde en una primera etapa se seleccionarian escuelas para, en ultima instancia, legar a los nifios. Pues bien, para tal efecto se podria obtener una base de datos de las escuelas primarias de la ciudad de México en la Secretaria de Educacién Piblica, Cada es- cuela tendria un cédigo identificable por medio del cual se eliminarian las escuelas para nifios atipicos. Este listado contiene ademas informacién sobre cada escuela, su ubicacion y su régimen de propiedad (piiblica o privada). Con ayuda de otro estudio (Fernéndez Collado et al., 1998) que catalogé en diferentes estratos socioecondmicos a las colonias de la ciudad de México, con base en el ingreso promedio de la zona, se elaboraron ocho listas: 1) escuelas piblicas clase A 2) escuelas privadas clase A 3) escuelas priblicas clase B 4) escuelas privadas clase B 5) escuelas puiblicas clase C 6) escuelas privadas clase C 7) escuelas piiblicas clase D 8) escuelas privadas clase D Cada lista representaria un estrato de la poblacién y de cada una de ellas se seleccionaria una muestra de escuelas. A, B, C, D, que representan niveles socioecondmicos. Y después, de cada escuela se elegirian los nifios para conformar la muestra final. No siempre existen listas que permitan identificar a nuestra poblacién. Entonces, seré nece. sario reourrir a otros marcos de referencia que contengan descripciones del material, las organi- zaciones o los casos que serén seleccionados como unidades de andlisis. Ejemplos de algunos de estos marcos de referencia son los archivos, los mapas y los voltimenes de periddicos empastados en una biblioteca. De cada una de estas instancias daremos ejemplos con més detalles y reco- ‘mendaremos soluciones para algunos problemas comunes en el muestreo. 257 258 SEGUNDA PARTE Bl proceso de la investigacin cuantitativa Archivos Un gerente de reclutamiento y seleccién de una empresa quiere precisar si algunos datos que se dan en una solicitud de trabajo estén correlacionados con el ausentismo del empleado. Es decir, sia partir de datos como edad, género, estado civil, nivel educativo y duracién en otro trabajo, es factible predecir la conducta de ausentismo. Para establecer correlaciones se consideraré como poblacién a todas las personas contratadas durante 10 afios. Se relacionan sus datos en la soli- citud de empleo con los registros de faltas. Como no hay una lista elaborada de estos individuos, el investigador decide acudir a los ar- chivos de las solicitudes de empleo. Tales archivos constituyen su marco muestral a partir del cual se obtendré la muestra. Calcula el tamaiio de la poblacién, obtiene el tamaiio de la muestra y selecciona sisteméticamente cada elemento 1/K, cada solicitud que sera analizada. Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y, por lo tanto, no debe considerarse en el estudio, En este caso, y en otros en los que no todos los elementos del marco de referencia o de una lista aparecen (por ejemplo, nombres en el directorio que no corresponden a una persona fisica), los especialistas en muestreo (Kish, 1995; Sudman, 1976) no aconsejan el reemplazo con el si- guiente elemento, sino simplemente no tomar en cuenta ese elemento, es decir, hacer como si no existiera, y continuar con el intervalo de seleccién sistemética. Mapas Los mapas son muy titiles como marco de referencia en muestras de racimos. Por ejemplo, un investigador quiere saber qué motiva a los compradores de las tiendas de autoservicio. A partir de una lista de tiendas de cada cadena competidora, marca sobre un mapa de la ciudad, todas las tiendas de autoservicios, las cuales constituyen una poblacién de racimos, pues en cada tienda seleccionada entrevistard a un niimero de clientes. El mapa le permite ver la poblacion (tiendas de autoservicio) y su situacién geogréfica, de manera que elige zonas donde coexistan diferentes tiendas competidoras, para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas. En la actualidad hay mapas de todo tipo: mercadolégicos, socioculturales, étnicos, maritimos, entre otros. Voltimenes En este caso supongamos que un estudioso del periodismo quiere hacer un andlisis de contenido de los editoriales de los tres principales diarios de la ciudad durante los periodos del porfiriato en México, el gobierno sandinista en Nicaragua 0 el franquismo en Espaiia. El investigador va a la Hemeroteca Nacional y encuentra —por ejemplo— que los diarios son encuadernados por trimestre y aio, lo cual le proporciona un marco de referencia ideal, a partir de donde seleccio- naré n voliimenes para su anélisis. Supongamos, en el caso mexicano, que encuentra que el volumen X, que contiene el periédico El Hijo del Afuizote (enero-marzo, 1899), falta en la heme- roteca. Qué hace? Pues redefine la poblacién, manifestando explicitamente que de W voltimenes tiene 99% de los elementos y, a partir de este nuevo mimero de W, calcula su muestra n y la se- lecciona, CAPITULO 8 Seleccién dela muestra 259 Periodos registrados En la investigaci6n que se vincula con sesiones terapéuticas, entrevistas con pacientes 0 reos, etc., se dispone de los listados de archivos que por lo comtin guardan las instituciones. El investigador debe buscar posibles listados o bases de datos en cualquier parte para que pueda obtener el tamafio de su poblacin. Por ejemplo, para analizar anuncios en los medios electrénicos de comunicacién, hay empresas que tienen un registro de todos los anuncios trans- mitidos; la hora exacta y el canal o frecuencia radial en que fueron difundidos, su duracién, la versién del anuncio de que se trata, etc. El ingenio es el propio limite para ello, Tamafio 6ptimo de una muestra Las muestras probabilisticas requieren dos procedimientos bésicos: 1) la determinacién del ta: mafio de la muestra y 2) la seleccién aleatoria de los elementos muestrales. El primer procedi- miento fue descrito en su modalidad mas simple en la seccién sobre el tamaiio de la muestra. Precisar adecuadamente el tamaiio de la muestra puede tornarse muy complejo, esto depende del problema de investigacién y la poblacién a estudiar. Para el alumno y el lector en general, serd muy itil comparar qué tamafio de muestra han empleado otros investigadores, a la luz de la revisién de la literatura. Para tal efecto, mostramos algunos ejemplos y reproducimos varias tablas (8.6, 8.7 y 8.8), que indican los tamafios de muestra mas utilizados por los investigadores, segiin sus poblaciones (nacionales o regionales) y los subgrupos que quieren estudiarse en alias. Las muestras nacionales, es decir, las que representan a la poblacién de un pais, por lo co- miin son de mas de 1 000 sujetos. La muestra del estudio “Cémo somos los mexicanos?” (Her- néndez Medina, Narro y Rodriguez, 1987), consta de 1 737 sujetos repartidos de la siguiente mane! Frontera y norte 696 Centro (sin la capital nacional o Distrito Federal) 426 Sur-sureste 316 Distrito Federal 299 1737 La muestra de los barémetros de opinién en Espafia es nacional,’ incluye personas de ambos géneros, de 18 afios o més y su tamaiio es alrededor de 2500 casos (Berganza y Garcia, 2005). Su eleccién es por estratos y racimos. Primero, se eligen municipios y luego secciones. Los pun- tos de muestreo son 168 municipios y 49 provincias. Los estratos estén compuestos por siete categorias formadas por el cruce de las 17 comunidades autténomas con | tamaiio del habitat. Son las siguientes: a) menores o iguales a 2 000 habitantes, b) de 2 001 a 10 000, c) de 10 001 a 50 000, d} de 50 001 a 100 000, e} de 100 001 a 400 000, f) de 400 001 a un millén y g) més de un millén de habitantes (Berganza y Garefa, 2005, p. 91) " Los barémetros son surveys 0 encuestas de alcance nacional o continental e incluyen cuestiones politicas, econémicas, so- ciales y de actualidad, 260 SEGUNDA PARTE Ei proceso de la investigacién cuantitativa En cambio, el barémetro del Real Instituto Eleano (BRIE) en Espaiia comprende a 1 200 in- dividnos (Berganza y Garcia, 2005). El eurobarémetro es otra encuesta que abarca a diversos paises de la Unién Europea y su muestra es de aproximadamente 1000 personas por pais, excepto en Alemania donde se consulta al doble y a Reino Unido, donde la n es igual a 1300 (300 encuestas se efectiian en Irlanda). En la tabla 8.6° observamos que el tipo de estudio en poco determina el tamaiio de la muestra. Mas bien, interviene en la decisién de que sean muestras nacionales o regionales. Las muestras regionales (por ejemplo las que representen al 4rea metropolitana de la ciudad de México u otra gran urbe con més de tres millones de habitantes), o de algiin estado, departa- mento o provincia de un pais, o algiin municipio o regién, son tipicamente mas pequeiias, con rangos de 400 a 700 individuos. El tamafio de una muestra depende también del mimero de subgrupos que nos interesan en una poblacién. Por ejemplo, podemos subdividirla en hombres y mujeres de cuatro grupos de edad , atin mas, en hombres y mujeres de cuatro grupos de edad en cada uno de cinco niveles socioeco- némicos. Si éste fuera el caso estarfamos hablando de 40 subgrupos y, por ende, de una muestra mayor. En la tabla 8.7 se describen muestras tipicas de acuerdo con los subgrupos bajo estudio, segiin su cobertura (estudios nacionales o estudios especiales 0 regionales) y seguin su unidad de andlisis; es decir, se trata de sujetos o de organizaciones. En esta tltima instancia el niimero de la muestra se reduce, ya que casi siempre representa una gran fraccién de la poblacién total. Otra tabla que nos ayuda a comprender el tema que estamos analizando es la 8.9, la cual se asa en Mertens (2005, p. 327) y Borg y Gall (1989), de acuerdo con el propésito del estudio. Aqui cada mimero es el minimo sugerido Las tablas 8.6 a 8.8 se construyeron con base en articulos de investigacién publicados en revistas especializadas y nos dan una idea de las muestras que utilizan otros investigadores, de manera que le ayudardn a establecer el tamafio de su muestra. En el caso de los experimentos, la muestra representa el balance entre un mayor niimero de casos y el niimero que podamos manejar. Recordemos que algunas pruebas estadisticas exigen 15 casos como minimo por grupo de comparacién (Mertens, 2005; Hernandez, Fernandez y Baptista, 2003) Repasemos que lo éptimo de una muestra depende de cudnto se aproxima su distribucién a la distribucién de las caracteristicas de la poblaci6n. Esta aproximaci6n mejora al incrementarse el tamafio de la muestra. La ‘normalidad” de la distribucién en muestras grandes no obedece a Tabla 8.6 Muestras utilizadas con frecuencia en investigaciones nacionales y regionales segan area de estu Tipos de estudio ‘Nacionales Regionales Bcondmticos 1.0004 100 Médicos 1000+ 500 Conductas: 1000+ 700-300 Actitudes: 1000+ 700 - 400 Experimentos de laboratorio = 100 ° Las tablas 8.6 y 8.7 fueron adaptadas de Sudman (1976, pp. 8687) CAPITULO 8 Selecciindelamuestra 261 Tabla 8.7 Muestras tipicas de estudios sobre poblaciones humanas y organizaciones Poblacién de sujetos Poblaciones de Niimero de subgrupos uw hogares organizaciones Nacionales Regionales. Nacionales Regionales ‘Ninguno-pocos 10001500 200-500 200-500 50-200 Promedio 15002500 500-1000 500-1 000 200-500, ‘Muchos 2500+ 1000+ 1000+ 500+ Tabla 8.8 Tamafios de muestra minimos en estudios cuantitativos Tipo de estudio ‘Tamaiio minimo de muestra ‘Transeccional descriptivo o correlacional 30 casos por grupo o segmento del universo. Encuesta a gran escala 100 casos para el grupo o sezmento més importante Causal Experimental o cuasiexperimental del universo y de 20 a 50 casos para grupos menos importantes. 15 casos por variable independiente, 15 por grupo. Ja normalidad de la distribucién de una poblacién. La distribucién de diversas variables a veces es “normal” y en ocasiones est lejos de serlo. Sin embargo, la distribucién de muestras de 100 0 mds elementos tiende a ser normal y esto sirve para el propésito de hacer estadistica inferencial, sobre los valores de una pobla- cidn, A lo anterior se le lama teorema del limite central. Distribucién normal: Esta distribucién en forma de campana se logra generalmente con muestras de 100 o mas unidades mues- trales, y es util y necesaria cuando se hacen inferencias de tipo estadistico (ver figura 8.5). Figura 8.5 Distribucién normal con muestras de 100 o mas wi Teorema del limite central Sefiala que una muestra de mas de cien casos serd una muestra con una distribucin normal en sus caracteris- ticas, lo cual sirve para el propésito de hacer estadistica inferencial, 202 SEGUNDA PARTE i proceso de lainvestigaci6n euantitativa éCémo y cuales son las muestras no probabilisticas? Las muestras no probabilisticas, también lamadas muestras dirigidas, suponen un procedimien- to de seleccién informal. Se utilizan en muchas investigaciones cuantitativas y cualitativas. No las revisaremos ahora, sino en el capitulo sobre muestras cualitativas. Por el momento comenta- remos su esentcia y utilidad desde una perspectiva cuantitativa y ejemplificaremos la diferencia con las muestras probabilisticas. La muestra dirigida selecciona sujetos “tipicos” con la vaga esperanza de que sean casos re- presentativos de una poblacién determinada. Por ello, para fines deductivos-cuantitativos, donde la generalizacion o extrapolacién de resultados hacia la poblacién es una finalidad en si misma, as muestras dirigidas en este sentido implican muchas desventajas. La primera es que, al no ser probabilisticas, no es posible calcular con precisién el error estandar, es decir, no podemos calou- lar con qué nivel de confianza hacemos una estimacién. Esto es un grave inconveniente si consi- deramos que la estadistica inferencial se basa en la teoria de la probabilidad, por lo que las pruebas estadisticas en muestras dirigidas tienen un valor limitado a la muestra en si, mas no a la poblacidn. Es decir, los datos no pueden generalizarse a ésta, la cual no se consider en sus pardmetros ni en sus elementos para obtener la muestra. Recordemos que, en las muestras de este tipo, la eleccién de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos, sino de la decisin de un investigador o grupo de personas que recolectan los datos. La tinica ventaja de una muestra no probabilistica —desde la vision cuantitativa— es su utilidad para determinado disefio de estudio que requiere no tanto una representatividad de elementos de una poblacién, sino una cuidadosa y controlada eleccién de sujetos con ciertas caracteristicas especificadas previamente en el planteamiento del problema. Para el enfoque cualitativo, al no interesar tanto la posibilidad de generalizar los resultados, las muestras no probabilisticas o dirigidas son de gran valor, pues logran —si se procede cuida- dosamente y con una profunda inmersién inicial en el campo— obtener los casos (personas, contextos, situaciones) que interesan al investigador y que llegan a ofrecer una gran riqueza para la recoleccién y el andlisis de los datos. En el siguiente ejemplo compararemos, con términos muy sencillos, una muestra probabilis- tica simple con una dirigida. Imaginemos que una investigadora busca conocer en una escuela o facultad de una universi- dad quiénes son el joven y la joven mas populares. Entonces decide realizar una encuesta, para lo cual debe obtener una muestra, Supongamos que la escuela tiene una poblacién de mil alumnos y alumnas. Si obtuviera una muestra aleatoria simple, su procedimiento seria el que se muestra en la figura 8.6. Pero, si en lugar de este procedimiento, la investigadora determinara que requiere 100 alum- nos y seleccionara a los cien primeros que entraran a la cafeteria, su muestra seria no probabi- listica; o bien, si eligiera nada més a los representantes de los grupos (designados por la mesa directiva de alumnos o las autoridades de la escuela), también tendria una muestra de este tipo. En el primer caso, no todos los estudiantes tienen la misma probabilidad de ser seleccionados al inicio, porque no todos asisten a la cafeteria o no todos acuden ese dia; y en el segundo, no todos son representantes (quizds éstos sean los mas populares o aplicados de cada grupo y poseen una cualidad que estd presente sélo en ciertos casos). CAPITULO 8 Seleccinéelamuesta 263 Deterrina el tamario de muestra: Con Stats®, para una poblacién de mil casos, se requlere de Obtiene fa base de datos de los alumnos dela escuela oelabora una muestra de 277.74 = « una com las lists de los grupos de los diferentes aos estudiantes (278 redondeando, ‘Numera la base de datos o el istado del uno al mil 95% de confianza,005 0 5% deerrory p= 05) | secon os 78 ees fai neeeeay ies eset través de Stats”. ere Eoeuieaetis enema feted Pate Sees probabilistica para su — <—— Por ejemplo: Lucia Phillips. yas suceshamente, Blige a 278 estudiantes, peter er aa ead Nota: Cada vez que le Cocos pedimos al programa un conjunto de nimeros aleatoros,éste es diferente. Por o tanto.si usted lo hace, cobtendré otra secuencla de nimeros. Sigue con el segundo y tercermimero que arroj6 el programa: estudio, Figura 8.6 Ejemplo del procedimiento para una muestra aleatoria simple. Muestreo al azar por marcado telefénico (Random Digit Dialing) Esta es una técnica que los investigadores utilizan para seleccionar muestras telefnicas. Invo- lucra identificar 4reas geograficas —para ser muestreadas al azar— y sus correspondientes cé- digos telefénicos e intercambios (los tres digitos del mimero telefénico). Luego, los dems digitos del miimero a marcar pueden ser generados al azar de acuerdo a los casos que requerimos para la muestra (n). Es posible identificar qué intercambios son usados de forma primaria para teléfo- nos residenciales y enfocar el muestreo en ese subgrupo. Para mayores referencias de esta téc- nica recomendamos Fowler (2002). Muestra multietapas o polietapica Este concepto significa que para extraer la muestra hemos utilizado diversos procedimientos. Por ejemplo, en la investigacién sobre la televisién y los nifios de la ciudad de México, el procedi- 264 SEGUNDA PARTE El proceso de la investigacién cuantitativa miento de seleccién implicé estratos y racimos: en una primera etapa se seleccionarfan “escuelas” yen una segunda “nifios”, En un estudio nacional, primero podrian elegirse ciudades, Iuego en cada ciudad, barrios; posteriormente en cada barrio, calles; luego casas y al final personas. En cada etapa el procedi- miento es aleatorio. Una maxima del muestreo y el alcance del estudio ‘Ya sea que se trate de un tipo de muestreo u otro, lo importante es elegir a los informantes (0 casos) adecuiados, de acuerdo con el planteamiento del problema y lograr el acceso a ellos. Los estudios exploratorios regularmente emplean muestras dirigidas 0 no probabilisticas, aunque podrian usarse muestras probabilisticas. Las investigaciones experimentales, la mayoria de las veces utilizan muestras dirigidas, porque como se coments, es dificil manejar grupos gran- des (debido a ello se ha insistido que, en los experimentos, la validez externa se consolida me- diante la repeticién 0 reproduccién del estudio). Los estudios no experimentales descriptivos 0 correlacionales-causales deben emplear muestras probabilisticas si quieren que sus resultados sean generalizados a una poblacién. = Enel capitulo se definid el concepto de muestra. a Ademés, se describié c6mo seleccionar una muestra en el proceso cuantitativo, Lo primero que se debe plantear es sobre qué o quiénes se van a recolectar los datos, lo cual corresponde a la definicién de la unidad de andlisis. Después, se procede a delimitar claramente la poblacién, con base en los objetivos del estudio y en cuan- to a caracteristicas de contenido, de lugar y de tiempo. m La muestra es un subgrupo de la poblacién puede ser probabilistica o no probabi- listica. 1m _Elegir qué tipo de muestra se requiere depende del enfoque y alcances de la inves- tigacién, los objetivos del estudio y el disefio. = Enel enfoque cuantitativo las muestras probabilisticas son esenciales en disefios de investigacién por encuestas, donde se pretenden generalizar los resultados a una poblacién. La caracteristica de este tipo de muestras es que todos los elemen- tos de la poblacién al inicio tienen la misma probabilidad de ser elegidos. Asi, los elementos muestrales tendrén valores muy aproximados a los valores de la pobla- cién, ya que las mediciones del subconjunto seran estimaciones muy precisas del conjunto mayor. Tal precision depende del error de muestreo, amado también error estandar. m= Para una muestra probabilistica necesitamos dos elementos: determinar el tamafio de la muestra y seleccionar los elementos muestrales en forma aleatoria. m= El tamaiio de la muestra se calcula mediante formulas o por medio del programa Stats®, que se encuentra en el CD que acompaiia al libro. m Las muestras probabilisticas son: simples, estratificadas, sisteméticas y por raci- mos. La estratificacién aumenta la precision de la muestra e implica el uso delibe- CAPITULO 8 Selecciindelamuestra 265 rado de submuestras para cada estrato 0 categoria que sea relevante en la poblacién, Muestrear por racimos o conglomerados implica diferencias entre la uni- dad de andlisis y la unidad muestral. En este tipo de muestreo hay una seleccion en dos etapas, ambas con procedimientos probabilisticos. En la primera se selec- cionan los racimos: escuelas, organizaciones, salones de clase; en la segunda y dentro de los racimos, a los participantes que van a ser medidos. m Los elementos muestrales de una muestra probabilistica siempre se eligen aleato- riamente para asegurarnos de que cada elemento tenga la misma probabilidad de ser seleccionado. Es posible utilizar tres procedimientos de seleccién: 1) témbola, 2) cuadro de mimeros aleatorios o el uso del subprograma de mimeros aleatorios del Stats® y 3) seleccién sistemética. Todo procedimiento de seleccién depende de listados o bases de datos, ya sea existentes o construidas ad hoc. Los listados pueden ser: la guia telefonica, listas de asociaciones, listas de escuelas oficiales, etc. Cuando no existen listas de elementos de la poblacién, se recurren a otros maroos de referencia que contengan descripciones de! material, organizaciones 0 participantes seleccionados como unidades de andlisis. Algunos de éstos pueden ser archivos, hemerotecas y mapas, asi como internet, = Las mnestras no probabilisticas, pueden también amarse mnestras dirigidas, pues la elecci6n de sujetos u objetos de estudio depende del criterio del investigador. m Enel teorema del limite central se sefiala que una muestra de mas de cien casos serd una muestra con una distribucidn normal en sus caracteristicas; sin embargo, Ja normalidad no debe confundirse con probabilidad. Mientras lo primero es nece- sario para efectuar pruebas estadisticas, lo segundo es requisito indispensable para hacer inferencias correctas sobre nna poblacién. CONCEPTOS BASICOS Base de datos Representatividad Elementos muestrales Seleccién aleatoria Error esténdar Seleccién sistematica |e Listados ‘Teorema del limite central Muestra Unidad de andlisis Muestra probabilistica Unidad muestral Muestra no probabilistica o dirigida Varianza Poblacion EJERCICIOS 1. Se forman grupos de tres 0 cuatro que conviene aqui es que sea sobre personas. Cada grupo dispone de 15 um tema que realmente inquiete a los minutos para formular una pregunta _estudiantes, algo que ellos conside- de investigacién. El problema puede ren un fenémeno importante. Las ser de cualquier area de estudio. Lo preguntas de investigacién se van 266 ‘SEGUNDA PARTE Bl proceso de la investigaciOn cuantitativa anotando en el pizarrén. Después y junto a cada una de estas preguntas se define quiénes van a ser medidos. Discutir por qué sf y por qué no son correctas las respuestas de los estu- diantes. Como secuencia del ejercicio anterior se proponen los siguientes temas de investigacién. Supongamos que, en otro curso, estudiantes de un taller de investigacién sugirieron los si- guientes temas para investigar. En cada caso sefialar quiénes van a ser medidos, para lograr resultados en las investigaciones propuestas. Tema 1. {Qué efecto tienen los anun- cios de bebidas alcohélicas sobre los jévenes? Tema 2. Hace tres meses que se implanté en una fabrica de motores un programa de cfrculos de calidad. ;Ha te- ido éxito dicho programa? Tema 3. {Los nifios que cursaron la primaria en escuelas laicas y mixtas tienen un mejor desempefio académico en la universidad que los que provienen de escuelas reli- giosas de un solo género? 3. 4. Tema 4, Qué diferencias significati- vas existen entre los co- merciales de la television espafiola, la argentina y la venezolana? Seleccione dos estudios de alguna publicacién cientifica (véase apéndi- ce 1 incluido en el CD) y/o dos tesis. Analice los siguientes aspectos: a) 4Cual es el problema de investiga- cidn? 6) ;Cuél es la muestra? c) 4Cémo fue elegida? d) ;Son adecua- das la muestra y el procedimiento de muestreo para el problema que se investigé? e) {Cudles son los princi- pales resultados 0 conclusiones? /) ¢Dichos resultados son generaliza- bles a una poblacién mayor? 9) Con base en la muestra, ¢pueden tomar- se como serias dichas generalizacio- nes? Evalie la solidez de los cuatro estudios, tomando como criterios los aspectos a, b, c,d, e, fy g. Supongamos que trabaja en un des- pacho que realiza investigaciones y que diversos clientes le solicitan que los asesore en estudios de diferente indole. {Qué tipo de muestra sugeri- ria para cada uno? Fundamente su sugerencia. CLIENTE NECESIDAD TIPO DE MUESTRA 4.1 Clinica de terapias psicoemocionales la terapia. Pacientes con céncer que siguen la terapia reaccionan mejor a los tratamientos médicos usuales que los enfermos de cancer que no toman CAPITULO 8 Seleccién dela muestra CLIENTE NECESIDAD TIPO DE MUESTRA 4.2 Empresa en el giro Definir cuales son quimico nuestros empleados y obreros, anteriores y presentes, que tienen menos ausentismo, es decir, chay un perfil del ausentismo? 4.3 Empresa de cosmetologia 2Qué nociones tienen las jovenes (de 15 a 20 afios) sobre su arreglo personal y el cuidado de su cutis? @Funcionaria crear una linea de productos excln- sivamente para ellas?_| 4.4 Grupo que defiende los derechos del consumidor 2Qué quejas tienen los nifios sobre los juguetes del mercado?, ¢se rom- pen?, ;son peligrosos?, gaburridos?, jcudl es su durabilidad?, etcétera. 4.5 Partidos politicos provincia? ¢Por cual candidato a gobernador votaran los cindadanos de determinado estado 0 5. Supongamos que una asociacién ibe- roamericana de profesionales cuenta con 5 000 miembros, La junta direc- tiva ha decidido hacer una encuesta (00r teléfono o por correo electrénico) a los asociados para indagar, entre otras cosas, lugar de trabajo, puesto que ocupan, salario aproximado, li cenciatura cursada, generacién, estu- dios posteriores, oportunidades de avance percibidas, ete. En resumen, se piensa publicar un perfil profesio- nal actualizado con el propésito de retroalimentar a los asociados. Como seria muy costoso llegar a los 5 000 miembros repartidos en Espafia, América Latina y Estados Unidos, gqué tamafio de muestra se necesita si queremos un error esténdar no mayor de 0.015? Una vez definido el tamaiio de la muestra, gcdmo seria el proceso de seleccién a fin de que los resultados obtenidos con base en la muestra sean generalizables a toda la pobla- cién?. Bs decir, se pretende reportar un perfil certero de los 5 000 socios de dicha asociacién profesional. 267 268 SEGUNDA PARTE i proceso de la investigacin cuantitativa 6. Seleccione un tamafio de muestra adecuado para su institucién, me- diante el Stats®. 7. Con respecto al ejemplo de estudio que ha venido desarrollando en el proceso cuantitativo, piense como seleccionaria la muestra apropiada de acuerdo con su planteamiento, LA TELEVISION Y EL NINO Para el estudio, primero se realizaria un analisis exploratorio y una prueba piloto con 60 nifios de diversos estratos so- cioeconémicos.Con base en ello se corre- giria el cuestionario y se procederia al estudio defini 1) Limites de poblacién: Todos los nifios del 4rea metropolitana de la ciudad de México, que cursen 4°,5°y 6° de primaria en escuelas privadas y publi- cas del turno matutino, 2) Proceso de seleccién: Se estableceria una muestra probabilisti- a estratificada por racimo, donde en una primera etapa se seleccionarian escuelas para, en tiltima instancia,llegara los nifios. La muestra se obtendria de una base de datos de la Secretaria de Educacién Pabli- ca, que contenga listadas e identificadas a todas las escuelas primarias del area me- tropolitana de la ciudad de México. Se excluiria a escuelas del turno ves- pertino y las disenadas para nifos con capacidades diferentes o habilidades es- peciales, La seleccién también estratifica- tia el nivel socioeconémico en cuatro categorias: A, B, C y D (de acuerdo con los criterios del mapa mercadolégico de la ciudad de México, A = ingresos familiares elevados, B= medios, C = medios bajos y D = bajos). Por lo tanto, se elegirian las escuelas de los siguientes estratos: objetivos, hipétesis y disefio. ;Cudl seria el universo o poblacién, la uni- dad de andlisis y el procedimiento de seleccién? y zqué tamafio tendria la muestra? Recuerde ver las respuestas a los ejercicios en el apéndice 3 del CD anexo. 1) escuelas puiblicas clase A 2) escuelas privadas clase A 3) escuelas puiblicas clase B 4) escuelas privadas clase B 5) escuelas puiblicas clase C 6) escuelas privadas clase C 7) escuelas piblicas clase D 8) escuelas privadas clase D Cada lista representaria un estrato de la poblacién y de cada una de ellas se se- leccionaria una muestra de escuelas: A, B, C,D, que representan niveles socioeconé- micos. Posteriormente, de cada escuela se elegirian los niftos para conformar la muestra final, Una vez hechos los calculos, se deter- miné que de cada estrato se selecciona- rén cuatro escuelas (es decir n es igual a 32 escuelas ubicadas en diversas colonias que incluiran a todas las delegaciones (municipatidades). En la segunda etapa se seleccionaran por muestreo aleatorio simple los nifios de cada escuela. En el ejemplo, 264 infantes por escuela de 4°, 5° y 6° grados (88 por cada uno). Una mues- tra total de 2 112 que podria implicar ajustes y reemplazos. EL CLIMA ORGANIZACIONAL ida 0 no probabi se seleccionaran organizaciones de dife- rentes caracteristicas para comenzar a validar el instrumento en el medio laboral mexicano: a) Una empresa transnacional de la industria de la transformacién con 500 0 més empleados, b) una empresa nacional de la industria de la transforma- cién con mds de 500 empleados, c) una institucién de educacién superior con més de cinco mil personas empleadas, d) dos instituciones de educacién media y superior con més de 200 personas traba- jando en ella y e) cinco empresas comer- ciales y de servi con 100 a 200 empleados. De todas ellas se hard un cen- so (es decir, se pretenderé abarcar a todos los empleados), salvo el caso de la institu- cién educativa con cinco mil personas (de la cual se extraerd una muestra aleatoria simple en donde n es igual a 357 casos, con 5% de error). El propésito no es generalizar la valida- cién a todos los individuos que trabajan en el pais, sino comenzar a probar la soli- dez del instrumento para medir el clima ‘organizacional. Ademas debemos recor- dar que los resultados del clima laboral de una empresa son temporales y tinicos de ‘ésta. No existen dos organizaciones igua- les (simplemente, la historia de cada una es distinta). portancia de la investigacién radica en que genera conocimientos, lo cual con- tribuye al desarrollo social. Por consi- guiente,es importante que losestudiantes tengan el gusto e interés profesional por investigar. A partir de la preferencia por determi nado tema, se desprende la orlentaci6n que se le debe dar al proyecto, donde tiene que haber claridad conceptual y exactitud en la aproximacién al problema, CAPITULO 8 Scleccién de la muestra EL ABUSO SEXUAL INFANTIL El estudio es un experimento y la muestra es dirigida. Se reclutaron preescolares de tres centros de desarrollo infantil con una poblacién similar, hijas e hijos de madres que laboran para la Secretaria de Educa- cién Pablica del Estado de Querétaro. Se evaluaran sels grupos escolares que seran asignados a tres grupos experimentales (n; = 49 nifios, n; = 22 nifios y ns = 79 ni- fos). Al inicio del proceso se obtuvo anuen- cia de las autoridades escolares de los centros. En general, se hicieron reuniones previas con los padres de familia para in- formarles del programa. Se efectué una sesién de acercamiento en la cual, la per- sona que aplicé las escalas se presentd con los nifios y las nifias, asimismo, desa- rrollé actividades lédicas para establecer confianza y cercania con los grupos, ade- mas les explicé de forma general el proce- soa llevarse a cabo y su participacién fue de cardcter voluntario (tenian la posibi dad de negarse). Antes de cada evalua- n, se les pidié su consentimiento a todos los infantes. ademas de procurar la comunicacion de los resultados. Alvaro Camacho Medina Docente Facultad de Mercadeo y Publicidad Politécnico Grancolombiano Bogotd, Colombia En nuestra realidad existen investigacio- es serias que aportan indicadores de 269 270 SEGUNDA PARTE El proceso de la investigacién cuantitativa ‘cémo se encuentran, por ejemplo, los ferentes niveles del sistema educativo pe- ruano; sin embargo, no son suficientes en la aplicacién de propuestas metodol6gi- cas, ya sea por la seleccién de la muestra, el empleo de instrumentos adecuados 0 la preparacion del personal que las lleva a cabo. Por tal razén, quienes tenemos la res- ponsabilidad de orientar proyectos debe- mos infundir a nuestros alumnos que la investigaci6n es un proceso que convoca nuestra energia y perseverancia para ob- tener resultados que sean significativos para la sociedad peruana, Para ello se requiere vivir determina- das experiencia. En el caso de la educa- ién, seria recomendable visitar un centro académico que ensaye diferentes y nue- vos enfoques para conocer el medio, dia- logar con los protagonistas y descubrir su problemai Un buen planteamiento del problema nos permitird orientar la investigacién, precisar las variables a analizar, conocer e| grupo con el que se pretende trabajar, determinar los objetivos y, en un momen- to dado, redactar coherentemente los re- sultados. Por tiltimo, considero que los resulta- dos de una investigacién se tornan sig ficativos cuando, ademas de presentar datos cuantitativos, en ella se consideran también datos cualitativos. Una experien- cia de investigacién debe tomar en cuenta ambos enfoques, porque as{ sera posible admirarla y apreciarla de forma integral. Ing. Guillermo Evangelista Benites Docente principal Facultad de Ingenieria Quimica Universidad Nacional de Trujillo. Trujillo, Pert

You might also like