Santo domingo, D. N. Septiembre2009 Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 2 Muestreo y Distribucin Muestral
Objetivo de esta unidad El desarrollo de esta unidad tiene como objetivos fundamentales que los alumnos y alumnas aprendan sobre: 1. La importancia de trabajar con muestra en lugar de trabajar con la poblacin completa. 2. Las diferentes tipos de muestras, as como las ventajas y desventajas de cada una de estas 3. Como seleccionar una muestra a partir de una poblacin determinada 4. La importancia de clasificar la poblacin para reducir variabilidad en la estimacin hecha a partir de los datos muestrales. En el da a da, en las actividades diarias se toman decisiones, esas decisiones, se toman luego de un procesamiento interno de una serie datos, los cuales, en la mayora de los casos, provienen de una muestra y es as, porque rara vez tenemos oportunidad de analizar una poblacin completa, por mltiples razones que se detallaran ms adelante en este captulo. Un ejemplo sencillo es cuando acudimos al mdico para la realizacin una prueba de laboratorio, una vez que nos registramos, nos envan a toma de muestra, donde alguien se encargara de nuestro sufrimiento introduciendo una aguja entre nuestras venas, igual seleccionamos una muestra en un ambiente ms agradable, cuando compramos un perfume, tomamos una pequea porcin y decidimos si el aroma se ajusta a nuestra piel o no, no esperamos a consumir todo el perfume para luego decidir si compramos o no el perfume, cuando cocinamos, tomamos una pequea muestra para saber si se han colocado los condimentos adecuadamente y as sucesivamente.
En un ambiente fuera de los laboratorios, la tienda o el hogar, un ambiente como las organizaciones donde laboramos, nos encontramos en muchas situaciones en las que se hace necesario analizar el comportamiento de una o mltiples variables a partir de los datos de una muestra, por ejemplo cuando se analiza la produccin diaria para fines de control de la calidad, cuando se estudia el comportamiento de los empleados de una empresa, o cuando queremos estudiar la preferencia de los consumidores por un bien o servicio, cuando queremos evaluar la efectividad de un programa de entrenamiento, o de un nuevo mtodo de enseanza en una escuela , entre otros casos.
En todos estos casos se observa que existe una poblacin a partir de la cual seleccionamos una muestra a partir de la cual se analiza un fenmeno y se toman las decisiones que se consideran pertinentes. A ese procedimiento mediante el cual obtenemos una muestra de una poblacin es lo que denominamos muestreo. De tal forma, podemos definir el Muestreo como una herramienta de la investigacin Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 3 mediante el cual se selecciona una muestra y su funcin principal es determinar que parte de la poblacin en estudio se debe examinar a fin de estimar los parmetros de dicha poblacin.
Importancia del Muestreo
Existen mltiples razones por las cuales se analiza una poblacin a partir de una muestra, desde razones de logstica del trabajo de campo, (recoleccin de datos), hasta razones econmicas y de viabilidad y factibilidad de una investigacin. Entre las razones para usar un muestreo y no el anlisis de la poblacin completa se citan:
1. Analizar la poblacin completa no siempre es posible. Realizar un censo resulta muy costoso en trminos de recursos econmicos, tiempo y recursos materiales. Esto imposibilita tener a tiempo informacin acerca del fenmeno que est estudiando y por tanto retraza las acciones necesarias para un mejor resultado.
2. Cuando la poblacin es infinita o tan grande que imposibilita el anlisis completo de dicha poblacin, por ejemplo un proceso de produccin continuo en una empresa, imposibilita analizar la poblacin completa.
3. En muchos casos desconocemos la poblacin total o no se tiene una ubicacin exacta de los elementos que forman dicha poblacin. Por ejemplo un bilogo marino que quiere estudiar el comportamiento de alguna especie marina o un psiclogo que quiere estudiar los factores asociados a la ansiedad, entre otros casos.
4. Cuando las pruebas que se realizan implican la destruccin de las unidades muestrales, (pruebas destructivas), por ejemplo cuando se prueba un perfume, o la comida, o cuando se mide la resistencia de circuito, o la resistencia de los automviles a un choque de fuerza.
5. Los estudios por muestreo pueden proporcionar informacin ms exacta sobre el comportamiento de un fenmeno. Esto se debe a que cuando se realizan estudios por muestreo se pone ms empeo, cuidado y supervisin que cuando se realiza un censo. De igual forma, realizar un estudio por muestreo conlleva contemplar un margen de error, es decir una diferencia entre las estimaciones de la muestra y los parmetros poblacionales, cosa que en el censo no se contempla, sin embargo siempre se cometen errores en estos procesos.
Desventajas del uso del muestreo.
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 4 Si bien es cierto que el uso de la tcnica de muestreo se hace casi imprescindible para la realizacin de investigaciones cientficas, no menos cierto es que su uso presenta tres limitaciones bsicas:
1. Cuando se realiza una investigacin haciendo uso del muestreo no se tiene conocimiento sobre la ubicacin fsica de los elementos de la poblacin. 2. Si el procedimiento de muestreo que se utiliza en una investigacin no es el apropiado o no se sigue un procedimiento riguroso en la seleccin de la muestra, los resultados proporcionados por la investigacin puede que no se correspondan con la realidad del fenmeno estudiado. 3. El desconocimiento sobre una poblacin determinada impide conocer el nivel de confiabilidad de las estimaciones hechas a partir del muestreo.
Algunos conceptos de muestreo
Cuando se habla del muestreo, existen una serie de conceptos asociado a este trmino, por ejemplo, en las lneas anteriores se ha escrito mucho sobre la poblacin, la muestra, los parmetros, los estimadores o estadgrafos entre otros y por ello en la prxima seccin se hace una definicin de estos conceptos a fin de lograr una mayor familiaridad con los mismos.
Poblacin: en el muestreo cuando nos referimos a este concepto se hace referencia a un conjunto de elementos con caractersticas parecidas o similares y que es de inters para realizar un estudio. La poblacin se define en funcin de los aspectos que nos interesa estudiar. Por ejemplo, si quisiramos conocer la preferencia poltica de un grupo de persona, la poblacin estara formada por las personas mayores de edad y con derecho a ejercer el voto, pero si lo que interesa es estudiar la desnutricin infantil de una comunidad, la poblacin estara definida por todos los nios y nias de dicha comunidad.
Muestra: una muestra se define, sencillamente, como un subconjunto de la poblacin. Cuando los elementos que forman la muestra tienen las mismas caractersticas que los elementos de la poblacin de cual se seleccion se dice que la muestra es representativa.
Marco muestral: el marco muestral es el listado que contienen los elementos de la poblacin disponibles para el estudio o la poblacin accesible a la investigacin. Suponga que se desea conocer el nivel de satisfaccin de los clientes de un banco comercial, y se selecciona una muestra de los clientes que asisten durante un tiempo determinado a dicho banco, la poblacin que asiste durante el tiempo de la investigacin es lo que se llama marco muestral, la poblacin est formada, en este caso por todos los clientes del banco.
Procedimiento para establecer el marco muestral
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 5 Una de las dificultades que presenta el muestreo probabilstico es la necesidad de disponer de un marco muestral y para establecer dicho marco muestral podemos hacer una de tres cosas:
1. Obtener un listado de todos los elementos de la poblacin 2. Proveerse de una regla para identificarlos, ya que listar los elementos no siempre es posible, por ejemplo fijar un intervalo de tiempo para la seleccin de los elementos. 3. Hacer un listado con los elementos de la poblacin (si se posee)
Limitaciones que se presentan al elaborar un marco muestral
Al elaborar un marco muestral se presentan algunas limitaciones, las cuales se presentan de acuerdo a la poblacin bajo estudio. Entre las principales limitaciones se encuentran:
1. Elementos perdidos, lo que provoca un marco muestral inadecuado 2. Elementos extraos en la poblacin, lo que dificulta una buena definicin del marco muestral
3. Agrupaciones, no permiten clasificar claramente cuales son las unidades muestrales.
4. Duplicaciones, cuando ocurren, no ofrecen un marco muestral realista. Unidad muestral o unidad de muestro: la unidad de muestreo o unidad muestral es la unidad que se selecciona en el muestreo, es decir, es cada uno de los posibles elementos que forman el marco muestral, que puede ser un elemento o un conjunto de elemento. Todo miembro de la poblacin pertenecer a una y slo una unidad de muestreo. Determinar con claridad la unidad de muestreo es de suma importancia para la investigacin, ya que permite conocer sobre cuales elementos se tendr informacin. Las unidades de muestreo pueden ser personas, viviendas, unidades producidas, grupo de productos, extensiones de tierra, entre otras. Unidad de Anlisis: se refiere a la unidad especfica sobre la cual se toman las mediciones correspondientes para el anlisis. Una unidad muestral puede tener mltiples unidades de anlisis, por ejemplo: Es una encuesta de hogar, se pueden medir diferentes caractersticas, por ejemplo, de la vivienda, de las personas que habitan la vivienda. Otro ejemplo que pude dejar claro este concepto es cuando se hace una encuesta sobre la preferencia electoral, en este caso se puede tomar las viviendas como unidad de muestreo, es decir se seleccionarn viviendas, sin embargo, dentro de la vivienda puede seleccionarse solo una persona que est acto para ejercer el voto.
Parmetro: Es una medida de referencia la cual se calcula a partir de datos de una poblacin completa. El parmetro se refiere a la medida de una variable en la Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 6 poblacin. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el promedio de las calificaciones, esta medida es un parmetro de las calificaciones de los estudiantes.
Estimador o Estadgrafo: Es una medida calculada a partir de los datos obtenidos en una muestra y se utiliza para estimar el valor del parmetro, ya que en la mayora de los casos, se hace difcil y muy costoso conocer el valor real o verdadero de la variable. Por ejemplo cuando se toma una muestra para conocer la preferencia poltica de la poblacin, los porcentajes que se obtienen a partir de la encuesta son estimadores del porcentaje de real de preferencia de todos/as las votantes.
Tipos de Muestra
Existen dos tipos de procedimiento para seleccionar una muestra, el muestreo no probabilstico y el muestreo probabilstico, cada uno de estos procedimientos tiene sus particularidades, rea y momento de aplicacin como se muestra a continuacin:
I - Muestras no probabilsticas: una muestra no probabilstica es aquella en la que los elementos se seleccionan atendiendo a criterios subjetivos o personales, es decir que los elementos que se seleccionan para formar la muestra no se seleccionan atendiendo a un criterio cientfico y por tal razn no se conoce la probabilidad que tiene cada uno de ello de ser incluido en la muestra. Aunque las muestras no probabilsticas no permiten generalizaciones, las mismas tienen las siguientes ventajas:
1. Permite incluir en la muestra a los elementos de poblacin que se desean analizar. Es decir que el investigador selecciona los casos que le interesa estudiar. 2. Resulta de gran utilidad y de bajo costo en estudios exploratorios, que proporcionan informacin para estudios ms profundos o amplios. 3. La muestra no probabilsticas es menos costosa que una muestra probabilsticas. 4. Una muestra no probabilstica es de fcil seleccin ya que no requiere de un marco muestral.
Su principal desventaja es que los resultados que se obtienen a partir de ella no se pueden inferir a la poblacin, es decir, que solo puede utilizar para describir los elementos de la muestra.
Las principales tcnicas para obtener muestras no probabilsticas son:
Muestreo intencional o por conveniencia. Muestreo de juicio o de experto. Muestreo por cuota. Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 7 Muestre por bola de niveles.
1. Muestreo intencional o por conveniencia
Es aquel en el que cada unidad muestral se selecciona de acuerdo a la intencin o a la conveniencia del investigador. Por ejemplo: un psiclogo que utiliza los pacientes para investigar sobre algunas caractersticas de este, el orientador que aprovecha la presencia de un grupo de estudiantes en las aulas para analizar las caractersticas de estos, o un reportero que pregunta a las personas que pasan por una esquina determinada sobre un tema de inters.
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Por ejemplo es frecuente utilizar en sondeos preelectorales, encuestar a las personas de una determinada zonas que en anteriores votaciones han marcado tendencias en la intencin del voto.
2.- Muestreo de juicio o de experto
Es aquel en el que las unidades muestrales son seleccionadas pro una persona experta en el tema que se esta investigando, es decir que la inclusin de una unidad muestral en la muestra depende del nivel de conocimiento que tenga quien selecciona la muestra de cada elemento de la poblacin. Por ejemplo: Un psiclogo puede elegir un grupo determinado de nios y nias para probar un nuevo mtodo de enseanza, o el gerente de recursos humanos que en funcin del conocimiento que tiene sobre sus empleados selecciona un grupo de estos para entrenarlos en una tarea especfica, entre otros.
La principal limitacin de este tipo de muestreo es que depende nica y exclusivamente del nivel de conocimiento del experto que selecciona la muestra, lo que limita el marco muestral del estudio.
3.- Muestreo por cuota
Es aquel en el que se elige una cantidad determinada de elementos para la muestra. Este tipo de muestreo se basa de un buen conocimiento de los estratos de la poblacin o de las unidades muestrales "representativas" o "adecuadas" para los fines de la investigacin. Es muy parecido al muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de este. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de unidades muestrales que renen unas determinadas caractersticas, por ejemplo: 20 personas de 25 a 40 aos, de sexo femenino y residentes en una comunidad.
Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin. En el muestreo por cuota se utiliza la asignacin proporcional, esto es que Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 8 a cada grupo de poblacin se asigna una cuota en la muestra proporcional a su tamao, as por ejemplo si el grupo A representa el 50.0% de la poblacin, en la muestra este grupo debe tener 50.0%.
4.- Muestreo por bola de nieve
Es aquel en que las unidades muestrales se seleccionan de acuerdo a las informaciones suministradas por las dems unidades muestrales. En este tipo de muestreo las primeras unidades se seleccionan de forma aleatoria o de forma intencional por el investigador y las dems unidades se seleccionan por la informacin dada por las primeras. La segunda unidad se selecciona a partir de la primera, tercera unidad se selecciona a partir de la informacin dada por la segunda, y as sucesivamente. El muestreo por bola de nieve se utiliza en poblaciones que son muy pequeas y de la cual se desconoce la ubicacin de sus miembros.
La principal limitacin que presenta este tipo de muestreo es que depende totalmente de la informacin suministrada por los elementos abordados y por tanto del nivel de conocimiento de estos sobre la poblacin.
II - Muestreo probabilstico:
El muestreo probabilstico es aquel en el que las unidades muestrales se seleccionan atendiendo a criterios cientficos y cada elemento de la poblacin, cada unidad muestral tiene una probabilidad determinada de ser incluido en la muestra. En este tipo de muestreo las unidades muestrales que se incluyen en la muestra no dependen del juicio o del criterio de una persona en particular. Este procedimiento le da ciertas ventajas al muestreo probabilstico sobre el no probabilstico. Las principales ventajas que ofrece el muestreo probabilstico estn las siguientes:
1. Permite obtener muestras representativas, ya que la seleccin de las unidades muestrales no se corresponde con criterios personales o subjetivos. 2. Los resultados que se obtienen con este tipo de muestreo permite hacer generalizaciones, (inferir los resultados) sobre la poblacin. 3. Cada unidad muestral tiene una probabilidad mayor que cero de ser incluido en la muestra. 4. No requiere de un conocimiento elevado de la poblacin.
Sin embargo, el muestreo probabilstico presenta algunas limitaciones o desventajas que se deben tomar en consideracin a la hora de seleccionar una muestra a partir de este mtodo. Entre estas limitaciones se pueden citar:
1. El uso del muestreo probabilstico requiere de un marco muestral definido, es decir, que se requiere tener un listado con cada uno de los elementos que forman la poblacin. Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 9 2. El muestreo probabilstico es ms costoso que el muestreo no probabilstico. 3. No permite incluir en la muestra unidades muestrales de inters particular.
Tcnicas de muestreo probabilstico
Existen cuatro procedimientos para obtener muestras probabilsticas:
Para ilustrar el procedimiento para seleccionar una muestra a partir de una de las tcnicas de muestreo probabilstico se parte una poblacin hipottica de 30 estudiantes de los cuales se tiene informacin sobre cinco variables: la edad, el sexo, el nmero de asignaturas cursadas en el semestre, el ndice acadmico del semestre anterior y el gasto en transporte desde la residencia hasta la universidad. Para la ilustracin se tomar una muestra de 10 estudiantes con el objetivo de conocer el rendimiento promedio, as como la proporcin de estudiante de sexo femenino.
Tabla 1: Datos personales de 30 estudiantes de Informtica No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 01 22 M 3 80.0 20 02 24 F 3 77.8 50 03 23 M 4 75.6 60 04 25 M 5 74.6 30 05 21 M 3 82.1 30 06 25 F 3 74.3 50 07 22 M 3 77.7 40 08 21 F 6 80.1 40 09 28 F 3 70.3 40 10 28 F 4 70.3 40 11 29 M 5 73.5 40 12 25 F 3 74.3 20 13 20 M 4 79.8 40 14 30 F 2 73.3 20 15 28 F 3 81.5 40 16 24 F 4 74.4 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 21 35 M 2 75.7 40 Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 10 22 21 F 4 83.0 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 27 25 F 4 71.3 20 28 24 M 5 74.9 80 29 29 M 3 82.6 30 30 25 F 5 80.6 20
1.- Muestreo aleatorio simple Una muestra aleatoria simple es aquella en la que todas las unidades muestrales tienen igual probabilidad de ser incluidas en la muestra. Por la forma de seleccin de la muestra, el muestreo aleatorio simple es el muestreo que le garantiza al investigador una mayor representatividad de la muestra seleccionada. Para obtener una muestra aleatoria simple, cada elemento en la poblacin debe tener la misma probabilidad de ser seleccionado y para ello es necesario utilizar un procedimiento que garantice tal aleatoriedad, siendo el ms comn la tabla de nmeros aleatorios.
Para obtener una muestra a partir del muestreo aleatorio simple se siguen los siguientes pasos.
1. Establecer el marco muestral para la seleccin de la muestra. Se debe tener una numeracin para cada elemento en la poblacin a estudiar.
2. Se determina el tamao de la muestra por la cantidad de unidades a investigar.
3. Una vez establecido el tamao de la muestra y teniendo el marco muestral disponible se generan los nmeros aleatorios que indiquen cuales elementos de la poblacin sern incluidos en la muestra.
Los nmeros aleatorios pueden generarse a partir de diferentes procedimiento, por ejemplo se pueden obtener los nmero de los elementos cortarlo e introducirlo en una bolsa o una tmbola, (esto cuando se tiene una poblacin pequea), se puede obtener a partir de una tabla de nmero aleatorios, como la que se muestra al final del captulo o a partir de un medio electrnico como la calculadora de bolsillo o a partir de un programa de computadora.
Ejemplo: suponga que se desea tomar una muestra de 10 estudiantes a partir de la poblacin hipottica representada en la tabla I. Como la poblacin est numerada del 01 al 30, en la tabla XII de nmero aleatorios se inicia con las dos primeras columnas buscando los nmeros que sean menores de 30 que es el mximo de la poblacin. Si en las dos primeras columnas no se encuentran los Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 11 diez nmeros aleatorios menores de 30 se contina en las dos columnas siguientes y as sucesivamente.
Observando en las dos primeras columnas, (columna uno y dos) de la tabla de nmeros aleatorios, se encuentran que el primer nmero de menor o igual de 30 que aparece es el 17 que esta en la fila uno, luego le siguen el 23, en la fila 19, el 25 en la fila 20, el 18 en la fila 21, el 24 en la fila y el 29 en la fila 40. Como no se puede completar los diez nmeros aleatorios, se sigue con dos columnas ms, en este caso la columna dos y la columna tres y en estas se observa que el primer nmero menor de 30 es el 04 en fila cinco, seguido del 02 en la fila 10, el 15 en la fila 11 y el 26 en la fila 14, con los que se completa la muestra tamao 10. Los nmeros seleccionados en orden ascendente son: 02, 04, 15, 17, 18, 23, 24, 25, 26 y 29. Los datos se muestran en la tabla II.
A partir de los datos obtenidos se obtienen las medidas de inters, como el promedio, desviacin estndar, proporcin, entre otras.
Tabla 2: datos de una muestra de 10 estudiantes No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 02 24 F 3 77.8 50 04 25 M 5 74.6 30 15 28 F 3 81.5 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 29 29 M 3 82.6 30
2.- Muestreo Aleatorio Sistemtico
Es aquel en el que las unidades muestrales se seleccionan sistemticamente a partir de un nmero aleatorio. Una muestra sistemtica es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la seleccin depende del nmero de elementos incluidos en la poblacin y el tamao de la muestra. El nmero de elementos en la poblacin, (N) es dividido por el nmero deseado en la muestra, (n) a este cociente se denomina Coeficiente de Elevacin, (CE). Este cociente indicar cada cuantos elementos en la poblacin va a ser seleccionada la muestra. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemtica puede dar la misma precisin de estimacin acerca de la poblacin que una muestra aleatoria simple cuando los elementos en la poblacin estn ordenados al azar.
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 12 Para obtener una muestra aleatoria sistemtica se siguen los siguientes pasos:
1. Definir el marco austral y determinar el tamao de la muestra y de la poblacin.
2. Calcular el coeficiente de elevacin, 3. Se busca un nmero aleatorio, (en la tabla de nmeros aleatorios, en la calculadora o en la computadora o por otro medio que garantice un nmero totalmente aleatorio) que sea menor al coeficiente de elevacin, y este ser el primer elemento de la muestra o arranque aleatorio.
4. Completar los nmeros aleatorios de forma sistemtica, estos se obtienen sumando el coeficiente de elevacin a cada nmero anterior. Ejemplo: suponga que de la poblacin hipottica mostrada en la tabla I se desea tomar una muestra de 10 estudiantes. Como la poblacin est numerada del 01 al 30, ya se tiene el marco austral y el tamao de la muestra, por lo tanto se procede a calcular el coeficiente de elevacin, el cual se obtiene dividiendo la poblacin entre la muestra, para este caso, N=30 y n=10, por los tanto el coeficiente de elevacin es , 3 10 30
n N CE ahora se obtiene por cualquier mtodo un nmero aleatorio menor que tres. En la tabla de nmeros aleatorios, utilizando la primera columna, el primer nmero menor de tres que se observa es el uno que se encuentra en la fila uno, luego este ser el primer elemento de la muestra o arranque aleatorio. Los dems nmeros a seleccionar son:
Tabl a 3: nmero de muestra a seleccionar segn un muestreo aleatorio sistemtico. Nmero de orden Arranque aleatorio Nmero para la muestra 01 01 01 02 01 + 3 04 03 04 + 3 07 04 07 + 3 10 05 10 + 3 13 06 13 + 3 16 07 16 + 3 19 08 19 + 3 22 09 22 + 3 25 10 25 + 3 28
Con los nmeros aleatorios se acude a la poblacin para hacer la seleccin de la muestra y los datos se muestran en la tabla IV. Al igual que con el muestreo aleatorio simple, con los datos de la muestra se pueden obtener las medidas o indicadores de inters.
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 13 Tabla 4: datos de una muestra de 10 estudiantes No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 01 22 M 3 80.0 20 04 25 M 5 74.6 30 07 22 M 3 77.7 40 10 28 F 4 70.3 40 13 20 M 4 79.8 40 16 24 F 4 74.4 40 19 21 F 4 77.7 20 22 21 F 4 83.0 40 25 21 F 4 80.7 30 28 24 M 5 74.9 80
3.- Muestreo Estratificado En una muestra aleatoria estratificada la poblacin se divide en grupos o estratos que son iguales a lo interno de ellos, pero diferentes entre ellos. El objetivo del muestreo estratificado es lograr una mayor representatividad de los grupos que conforman la poblacin, as como una reduccin en los niveles de variabilidad en las mediciones al analizar grupos que son homogneos. La principal limitante para un muestreo aleatorio estratificado es la disponibilidad de informacin sobre los diferentes grupos que conforman la poblacin y adems no permite la comparacin entre los grupos o estratos ya que estos son diferentes entre ellos. El nmero de elementos seleccionado de cada estrato puede ser proporcionar o desproporcionar al tamao del estrato en relacin con la poblacin. Especficamente, la cantidad de elementos a seleccionar en cada estrato puede obtenerse a partir de una de tres procedimientos: Afijacin simple: A cada estrato le corresponde igual nmero de unidades muestrales.
Afijacin proporcional: La distribucin se hace de acuerdo con el peso o tamao de la poblacin en cada estrato. Por ejemplo, si un estrato representa el 25.0% de la poblacin se le asigna el 25.0% de la muestra.
Afijacin ptima: Se toma en consideracin la variabilidad o dispersin de los resultados que se obtendrn, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin estndar de la variable antes de estudiarla.
Para seleccionar una muestra estratificada se siguen los siguientes pasos:
1. Se divide la poblacin en grupos o estratos.
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 14 2. Determinar el tamao de la muestra a seleccionar en cada uno de los estratos
3. Seleccionar las unidades de cada estrato utilizando para ello el muestreo aleatorio simple o aleatorio sistemtico.
Ejemplo: suponga que de la poblacin hipottica mostrada en la tabla I se desea tomar una muestra estratificada por sexo de 10 estudiantes. Como la muestra es estratificada por sexo se tendr dos estratos y como en la poblacin el 60.0% es de sexo femenino y el 40.0% masculino, si se utiliza una asignacin proporcional, en la muestra el 60.0% debe ser de sexo femenino y el 40.0% de sexo masculino.
Tabl a 5: Asignacin proporcional para la estratificacin de la poblacin por sexo Sexo Poblacin, Ni Fraccin Muestra, ni Femenina 18 0.60 6 Masculino 12 0.40 4 Total 30 1.00 10
Los datos organizados por sexo se muestran en la tabla 6
Tabla 6: Datos personales de 30 estudiantes de Informtica estratificado por sexo Estrato No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 1 24 F 3 77.8 50 2 25 F 3 74.3 50 3 21 F 6 80.1 40 4 28 F 3 70.3 40 5 28 F 4 70.3 40 6 25 F 3 74.3 20 7 30 F 2 73.3 20 8 28 F 3 81.5 40 9 24 F 4 74.4 40 10 28 F 3 78.6 40 11 24 F 6 76.7 40 12 21 F 4 77.7 20 13 21 F 4 83.0 40 14 22 F 3 76.8 60 15 21 F 4 80.7 30 16 26 F 3 70.8 50 17 25 F 4 71.3 20 Uno 18 25 F 5 80.6 20 1 22 M 3 80.0 20 2 23 M 4 75.6 60 Dos 3 25 M 5 74.6 30 Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 15 4 21 M 3 82.1 30 5 22 M 3 77.7 40 6 29 M 5 73.5 40 7 20 M 4 79.8 40 8 24 M 3 79.4 20 9 35 M 2 75.7 40 10 24 M 3 81.2 50 11 24 M 5 74.9 80 12 29 M 3 82.6 30
Para la seleccin de la muestra en cada estrato generan nmeros aleatorios de acuerdo al tamao de la muestra, por ejemplo, en estrato de uno hay que seleccionar seis elementos y como la poblacin de este estrato es de 18 es necesario tomar en cuenta dos columnas, en el caso del estrato dos, la poblacin es de 12 y tambin es necesario tomar en cuenta dos columnas. Para iniciar con el estrato uno tomamos la columna uno y dos de la tabla de nmeros aleatorios. Los nmeros menores o igual a 18 son el 17 en la fila uno, seguido del 18 en la fila 21, como no hay ms nmero menores de 18 en estas dos columna, se sigue con la columna dos y tres y aqu los nmeros menores de 18 son el 04 en la fila cinco, seguido del 02 en la fila 10, el 15 en la fila 11 y el 07 en la fila 33. De forma que los nmeros aleatorios seleccionados son 02, 04, 07, 15, 17 y el 18
Para seleccionar la muestra en el estrato dos se sigue el mismo procedimiento, tomando los primeros nmeros aleatorios menores o igual a 12. Para buscar los nmeros se toman las columnas tres y cuatro los nmeros son 07 en la fila 21, seguido del 06 en la fila 40, el 04 en la fila 50. Como no se completa la muestra se sigue con las columnas cuatro y cinco y el primer nmero que aparece es el 12 en la fila 24. De esta forma los nmeros a incluir en la muestra del estrato dos son 04, 06, 07 y el 12. Los datos de las muestras seleccionadas se muestran en la tabla VII.
Tabla 7: Datos personales de 30 estudiantes de Informtica estratificado por sexo Estrato No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 2 25 F 3 74.3 50 4 28 F 3 70.3 40 7 30 F 2 73.3 20 15 21 F 4 80.7 30 17 25 F 4 71.3 20 Uno 18 25 F 5 80.6 20 4 21 M 3 82.1 30 6 29 M 5 73.5 40 7 20 M 4 79.8 40 Dos 12 29 M 3 82.6 30 Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 16
La seleccin de la muestra en cada estrato se puede hacer mediante un procedimiento de muestreo aleatorio sistemtico, con el cual el proceso de seleccin es ms rpido y sencillo de realizar. En este caso, el coeficiente de elevacin se obtiene dividiendo la poblacin de cada estrato entre la muestra de cada estrato, esto es, i i i n N CE . Cuando la cantidad de elementos en cada estrato se hace mediante una asignacin proporcional, el coeficiente de elevacin es el mismo para cada estrato.
4. Muestreo por conglomerado
En una muestra por conglomerado, la poblacin se divide en grupos o conglomerados que son de igual tamao o que son convenientes para el muestreo, es decir, que son iguales entre ellos, pero diferentes a lo interno de ellos. El muestreo por conglomerado permite hacer comparaciones entre grupos que son de igual tamao y se utilizan principalmente cuando no se tiene informacin acerca de la estructura de la poblacin. Bajo este mtodo, aunque no todos los grupos son muestreados, cada grupo tiene igual probabilidad de ser seleccionado, por lo tanto la muestra es aleatoria. Para ilustrar el proceso se ha dividido la poblacin hipottica en seis conglomerados de cinco elementos cada uno.
Tabl a 8. Datos personales de 30 estudiantes divido por conglomerado Conglomerado No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 1 22 M 3 80.0 20 2 24 F 3 77.8 50 3 23 M 4 75.6 60 4 25 M 5 74.6 30 Uno 5 21 M 3 82.1 30 6 25 M 3 74.3 50 7 22 M 3 77.7 40 8 21 F 6 80.1 40 9 28 F 3 70.3 40 Dos 10 28 F 4 70.3 40 11 29 M 5 73.5 40 12 25 M 3 74.3 20 13 20 M 4 79.8 40 14 30 F 2 73.3 20 Tres 15 28 F 3 81.5 40 16 24 F 4 74.4 40 Cuatro 17 28 F 3 78.6 40 Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 17 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 21 35 M 2 75.7 40 22 21 F 4 83.0 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 Cinco 25 21 F 4 80.7 30 26 26 F 3 70.8 50 27 25 F 4 71.3 20 28 24 M 5 74.9 80 29 29 M 3 82.6 30 Seis 30 25 F 5 80.6 20
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisin de las estimaciones acerca de la poblacin) que una muestra aleatoria simple del mismo tamao. El muestreo por conglomerados es un muestreo polietpico ya que se desarrolla en dos o ms etapas. En este tipo de muestreo la unidad primaria de seleccin es el conglomerado y luego se seleccionan las unidades de anlisis en cada conglomerado. Tanto para la seleccin del conglomerado como de las unidades muestrales en cada grupo o conglomerado se utiliza el muestreo aleatorio simple o el muestreo aleatorio sistemtico.
En el muestreo por conglomerado, una vez que se han seleccionado los conglomerados, en los mismos se selecciona una muestra, utilizando para ello un procedimiento de muestreo aleatorio simple o aleatorio estratificado o se pueden estudiar todos los elementos de dicho conglomerado.
Para la poblacin hipottica de 30 estudiantes se ha divido en seis conglomerados de cinco elementos cada uno, de forma que si se quiere seleccionar una muestra de 10 estudiantes, se deben tomar dos conglomerados. Para la seleccin de los conglomerados se utiliza uno de los procedimientos de muestreo conocido, aleatorio simple y aleatorio sistemtico.
Para el caso de la poblacin que se est estudiando y utilizando la tabla de nmeros aleatorios para la seleccin de los conglomerados, tomando la columna 20, este nmero se elige de manera aleatoria, por ejemplo preguntando a una persona que se encuentre cerca que diga un nmero entre uno y 40 que es el nmero de columnas que tiene la tabla. En este caso, el primer nmero aleatorio menor a seis es el nmero cuatro que est en la fila uno, seguido del nmero seis en la fila dos. Luego los conglomerados a seleccionar para la muestra son el nmero cuatro y nmero seis y los datos se muestran en la tabla siguiente:
Tabl a 9. Datos personales de 30 estudiantes divido por conglomerado Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 18 Conglomerado No. Edad del estudiante Sexo del estudiante Nmero de asignaturas ndice Acadmico Gasto en transporte 16 24 F 4 74.4 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 19 21 F 4 77.7 20 Cuatro 20 24 M 3 79.4 20 26 26 F 3 70.8 50 27 25 F 4 71.3 20 28 24 M 5 74.9 80 29 29 M 3 82.6 30 Seis 30 25 F 5 80.6 20
Tabla 10: Cuadro comparativo de los procedimientos de muestreo probabilstico Ti po de Muestreo Caracter sti cas Ventajas Inconveni entes Aleatorio simple Se selecciona una muestra de tamao n de una poblacin de N unidades, cada elemento, tiene una probabilidad de inclusin igual y conocida de n/N. Sencillo y de fcil comprensin. Clculo rpido de medias y varianzas. Se basa en la teora estadstica, y por tanto existen paquetes informticos para analizar los datos Requiere que se posea de antemano un listado completo de toda la poblacin. Cuando se trabaja con muestras pequeas es posible que no represente a la poblacin adecuadamente. Sistemtico Conseguir un listado de los N elementos de la poblacin Determinar tamao muestral n. Definir Coeficiente de Elevacin, CE= N/n. Elegir un nmero aleatorio k, entre 1 y Fcil de aplicar. No siempre es necesario tener un listado de toda la poblacin. Cuando la poblacin est ordenada siguiendo una Si la constante de muestreo est asociada con el fenmeno de inters, las estimaciones obtenidas a partir de la muestra pueden contener Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 19 CE (k= arranque aleatorio). Seleccionar los elementos de la lista. tendencia conocida, asegura una cobertura de unidades de todos los tipos. sesgo de seleccin Estratificado En ciertas ocasiones resultar conveniente estratificar la muestra segn ciertas variables de inters. Para ello se deben conocer las caractersticas de la poblacin objetivo. Una vez que se establece el tamao de la muestra, se asigna a cada estrato, generalmente, de manera proporcional la cantidad de muestra a seleccionar en cada uno. Tiende a asegurar que la muestra sea representativa de la poblacin en funcin de las variables seleccionadas. Se obtienen estimaciones ms precisas Su objetivo es conseguir una muestra lo ms semejante posible a la poblacin en lo que a la o las variables de estratificacin utilizadas. Es necesario conocer la estructura de la poblacin para poder establecer los estratos en la misma. Conglomerados Se realizan varias fases de muestreo sucesivas (polietpico) La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior. Es muy eficiente cuando la poblacin es muy grande y dispersa. No es preciso tener un listado de toda la poblacin, slo de las unidades primarias de muestreo. El error estndar es mayor que en el muestreo aleatorio simple o estratificado. El clculo del error estndar es complejo.
Apuntes sobreMuestreo Elaboradopor Hctor Medina Disla. Septiembre2009 20 Tabla 11: Tabla de nmero aleatorios 1