You are on page 1of 11

MUESTREO EN POBLACIONES FINITAS

1 Conceptos estadísticos básicos

2 Etapas en el muestreo

3 Tipos de error

4 Métodos de muestreo

5 Tamaño de la muestra e inferencia

6 Muestreo en poblaciones finitas

6.1 Muestreo aleatorio simple

6.2 Muestreo aleatorio estratificado

1
Muestreo en poblaciones finitas

1. Conceptos estadísticos básicos

A lo largo del curso se ha estudiado como hacer inferencia acerca de la población partiendo de la
información suministrada por la muestra. Pero casi nada se ha dicho aún sobre dos aspectos
importantes del proceso de inferencia:
• como seleccionar los elementos u observaciones de una muestra.
• como proceder en esa selección y cuál es su tamaño adecuado, si la población no es tan grande
como se ha venido admitiendo hasta ahora (infinita).

Se ha visto a lo largo de la asignatura como la ciencia estadística es una herramienta fundamental en la


investigación económica y empresarial, dado que permite conocer las características de poblaciones
concretas, contrastar hipótesis sobre ellas o realizar predicciones sobre su evolución. Dentro de este
proceso un componente de gran ayuda para el investigador, que aún no se ha estudiado, es la
realización de encuestas. Este va a ser el objeto básico de la presente lección. No obstante, antes de
meternos en ello, es conveniente recordar algunos conceptos básicos:

a) Población.

Colectivo objeto del estudio formado por un conjunto de elementos con características similares y
sobre el que se pretenden inferir regularidades.

b) Muestra.

Subconjunto de la población o colectivo que se investiga. Debe ser representativa del conjunto de la
población.

c) Individuos.

Cada uno de los elementos que forman la población. Los individuos pueden ser:

- Personas físicas: por ejemplo, un cliente de una empresa.

- Personas jurídicas o sociedades: por ejemplo, una empresa hotelera.

- Unidades familiares: por ejemplo, una familia de turistas.

d) Variables cuantitativas.

Caracteres que se observan en los individuos y que son susceptibles de tener valores numéricos: por
ejemplo, edad y gasto mensual del encuestado.

2
e) Atributos.

Son variables cualitativas, que no son susceptibles de tomar valores y se expresan mediante
modalidades: por ejemplo, sexo del encuestado, medio de transporte al destino, nivel de estudios.

2. Etapas en el muestreo.

Antes de preguntarnos de qué manera se toma una muestra de una población, quizás debíamos de
cuestionarnos sobre la necesidad de trabajar con muestras. La alternativa sería tratar de obtener la
información para todos y cada uno de los elementos de la población, es decir, trabajar con censos más
bien que con encuestas. Pero recordemos que hay, al menos, tres buenas razones para que una muestra
sea generalmente preferida a un censo:

• El coste, ya que un censo será mucho más caro y, a veces, incluso, prohibitivo.

• El tiempo disponible, cuando en muchos casos la información se necesita de forma más o


menos urgente.

• La precisión que presumiblemente se ganaría con un censo no compensa la pérdida en tiempo


y dinero, pudiéndose alcanzar un nivel razonable de precisión con un adecuado método de
muestreo.

Los pasos a seguir dentro de un proceso de muestreo son:

1.-Definir la información que se necesita.


Esto supone en la práctica la búsqueda de un equilibrio entre las preguntas acerca de la cuestión
principal o motivo de la encuesta y lo que puede ser complementario, introducido con afán de
aprovechar el esfuerzo económico y de dedicación que supone una encuesta.

2.-Determinar la población a muestrear y comprobar si existe un listado.

Hay que definir la población de referencia de forma adecuada, pues, aunque el método seguido sea
correcto, las conclusiones no serán válidas si la población no ha sido elegida de forma adecuada. Por
ejemplo, encuestas de opinión entre los turistas procedentes de Holanda, no se pueden extrapolar para
definir la opinión del conjunto de los potenciales turistas de toda la Unión Europea.

Como se ha dicho anteriormente, el paso previo a la realización de cualquier proceso de muestro se


centra en la concreción de los objetivos del estudio, definiendo así, implícitamente, las características
y la naturaleza de la población a analizar. Esta parte de la investigación requiere una definición de las
variables a utilizar en el ámbito poblacional, sus características y su periodo de referencia. Así, por
ejemplo, si se quieren estudiar las características de la demanda turística de las familias procedentes en
un determinado país de la UE, es evidente que la población objeto de estudio es exclusivamente la
formada por las familias residentes en el mismo.

3
De acuerdo con los objetivos establecidos en la investigación, debe obtenerse toda la información
correspondiente a esas familias, así como los movimientos turísticos realizados por ellas. Por tanto, las
variables a las que se referirá el estudio serán una serie de características sociodemográficas,
económicas y culturales relativas a esas familias.

Del mismo modo, se debe definir la cobertura o ámbito de objeto del estudio, tanto temporal (periodo
en que es interesante el estudio), como geográfica (delimitación geográfica del trabajo). Cuando la
población está bien definida es relativamente fácil obtener una muestra representativa. El problema
surge cuando la población no está bien delimitada o no es conocida. Por ejemplo, esto ocurriría si el
objetivo del estudio fuera la población futura de visitantes a un parque temático que se acaba de
construir. En este caso es evidente que se desconoce la posible población, así como las características
que la definen. Por ello, el trabajo de obtención de la muestra resulta más complejo, y sería imposible
de realizar si no fuera con la inclusión de determinados supuestos en el análisis.

La definición de las unidades de estudio es un paso necesario en esta etapa del proceso. Las unidades
de estudio pueden ser los individuos (los turistas que llegan a un balneario) o bien grupos de
individuos con algunas características comunes (las familias u hogares de un determinado país, los
jóvenes, los matrimonios sin hijos...).

El resultado del estudio, como se ha dicho, depende en gran medida de la adecuación de la muestra a
los objetivos y al marco de la investigación. Es por ello que en esta fase se deben recoger
explícitamente todos los posibles casos poblacionales que se pretenden analizar. Por ejemplo, si lo que
se quiere estudiar son las características de la demanda potencial de un determinado destino turístico
es evidente que no se puede obtener una muestra sólo de los turistas que viajan a ese destino. Esto
supondría dejar de lado una parte importante de información que proporcionarían otros turistas que
estarían dispuestos a viajar a ese destino, si las condiciones variaran. Por el contrario, si el objeto del
estudio es analizar las circunstancias que permiten la fidelización de los turistas a un destino concreto,
la muestra debería ser tomada exclusivamente entre aquellos que hayan visitado más de una vez dicho
destino.

3.-Definición del método a seguir para tomar la muestra y su tamaño.

No hay un método óptimo de llevar a cabo la selección de los elementos de la muestra. Dependerá,
generalmente, del problema que nos ocupa y de los recursos disponibles. El más conocido es el
muestreo aleatorio simple, en el que cada uno de los n elementos de la muestra tiene la misma
probabilidad de ser elegido. Sin embargo, hay circunstancias en que pueden ser mas indicados otros
tipos de muestreo. Por ejemplo, si deseamos recabar información acerca de la opinión de los visitantes
de un destino turístico, no sería lógico hacer un muestreo aleatorio simple, sino que lo más razonable
sería hacer un muestreo por estratos, teniendo en cuenta características diferenciadoras como podrían
ser la edad, el país de origen o el nivel de renta.

4
Otro aspecto importante, que veremos más adelante, será el tamaño de la muestra, que dependerá del
grado de fiabilidad requerido y del coste.

4.-Diseño adecuado de la forma de obtener la información (cuestionario).

Los cuestionarios son la serie de preguntas que constituyen el tema de la encuesta. La elaboración de
un cuestionario adecuado resulta fundamental para la obtención de la información necesaria para
llevar a cabo el estudio. Las características de un buen cuestionario han de ser:

- Objetividad: el entrevistador nunca debe influir en la opinión del entrevistado.

- Claridad: es importante utilizar un lenguaje fácilmente asimilable por el entrevistado.

- Precisión: hay que definir bien las cuestiones y evitar ambigüedades para obtener la
información que se busca.

- Corrección: ha que evitar preguntas que por su contenido o su lenguaje puedan molestar al
entrevistado.

- Duración limitada: hay que reducir el tamaño del cuestionario lo máximo posible, evitando
preguntas repetidas o excesivamente largas, para impedir el cansancio y la monotonía en las
respuestas del entrevistado.

Las tipologías de preguntas que nos podemos encontrar son:

- Pregunta abierta: el entrevistado tiene libertad para contestar.

- Pregunta cerrada: el entrevistado debe contestar seleccionando una o varias opciones de las
que se le proponen. La pregunta cerrada facilita la tabulación posterior de las respuestas.

- Pregunta mixta: por ejemplo, una pregunta cerrada donde una de las opciones es una
pregunta abierta de respuesta libre.

Las diferentes formas de realizar la entrevista son:

- Entrevista personal: el entrevistador y el entrevistado mantienen un trato directo.

- Entrevista telefónica.

- Entrevista postal: envío del cuestionario por correo.

- Entrevista virtual (uso de Internet).

Desde el punto de vista de la inferencia estadística, hay que tratar de asegurar dos aspectos claves:

• Que el número de no respuestas no sea alto, para evitar que los cuestionarios de los que
responden dejen de ser representativos del conjunto de la población. El número de preguntas y
la forma en que se realiza la encuesta (entrevista personal, correo, teléfono, etc.) tiene mucho
que ver con la tasa de no respuesta. Conviene analizar la falta de respuesta con objeto de ver la

5
representatividad que podemos seguir adjudicando a la muestra (características o patrón de
comportamiento de los elementos no observados por falta de respuesta).

• Que las respuestas sean honestas y precisas. La técnica (arte) en el diseño del cuestionario y
en la realización de la entrevista, o forma de hacer la pregunta, es esencial en este punto.

5.-Uso de la muestra para hacer inferencia.

Se comienza con la preparación y análisis de los datos: codificación, depuración y análisis descriptivo
inicial. Posteriormente, se entra en la inferencia, de la que ya se han estudiado diversas formas de
realizarla. A lo largo de esta lección, no obstante, trataremos algunos métodos de inferencia para tipos
particulares de muestreo.

6.-Obtención de conclusiones acerca de la población.

Se trata de resumir y presentar la información obtenida: estimación por intervalos, tablas resumen,
presentaciones gráficas, etc. Una vez destacadas las conclusiones del estudio, puede argumentarse
como actuar y, posiblemente, sugerir la obtención posterior de nueva información de interés aparecida
a lo largo del estudio. En este sentido, muchas veces, la aparición de cuestiones importantes no
previstas en el proceso, puede servir de estímulo para posteriores estudios de la población.

3. Tipos de error

Nunca sabremos, ciertamente, cuál es el verdadero valor de cualquier parámetro poblacional. Una
fuente posible de error procede del hecho de que no observamos toda la población, y le llamamos error
de muestreo, de azar o de estimación. Este tipo de error es inevitable, ya que siempre habrá diferencia
entre los valores medios de la muestra y los valores medios de la población. La magnitud de este error
depende del tamaño de la muestra (a mayor tamaño de muestra menor error) y de la dispersión o
desviación estándar del estimador (a mayor dispersión mayor error).La Estadística estudia de qué
forma se puede tratar ese tipo de error o, al menos, cómo se puede incorporar en el proceso de
inferencia (intervalos de confianza, nivel de significación, etc.).

Sin embargo, hay otras posibles fuentes de error que no pueden ser tratadas de la misma forma. Los
llamaremos errores ajenos al muestreo y algunos de ellos son:

• Definición incorrecta de la población de referencia.

• Respuestas imprecisas o falsas. Normalmente proceden de falta de claridad en el cuestionario


y de la formulación de preguntas delicadas para el entrevistado.

• Falta de respuesta. Este hecho puede producir estimaciones sesgadas, ya que los que
respondieron pueden no representar fielmente a la población. Por eso, en este caso, conviene
analizar las características de los que no lo hicieron (posible sesgo) y compararlas con los que
sí lo hicieron, para ver si son homogéneos o no ambos grupos.

6
• Sesgo en la selección de los elementos de la muestra. Por ejemplo, cambio de un vecino por
otro ausente, desatendiendo el proceso de muestreo estipulado.

• Errores de manipulación, tabulación y cálculo.

No existe un procedimiento general para evitar y analizar tales errores. Pero el investigador debe
tenerlos muy presentes para tratar de minimizarlos. Es preciso recabar toda la información disponible.
Puede hacerse una encuesta previa para detectar posibles fallos.

4. Métodos de muestreo

Los métodos de muestreo pueden ser de dos tipos: aleatorios y no aleatorios, dependiendo del método
de obtención de la muestra. En los primeros, la selección de los elementos de la muestra es aleatoria e
independiente de la opinión de cualquier persona (investigador o entrevistador). En los segundos, esta
condición no siempre se cumple. En ambos casos, pueden seleccionarse elementos de la población
(por ejemplo, empleados) o grupos de elementos (por ejemplo, familias). De esta forma, podemos
establecer la siguiente clasificación de los métodos de muestreo:

Figura 1. Principales métodos de muestreo

Muestreos
aleatorios

Unidad Unidad
muestral muestral
elemental grupo

Muestreo Muestreo Muestreo Muestreo por Muestreo


aleatorio aleatorio aleatorio áreas y por
simple sistemático estratificado conglomerados etapas

Muestreos
no
aleatorios

Muestreo Muestreo de Muestreo Muestreo por


por cuotas juicio intencional bola de nieve
u opinión

7
Una clasificación general de estos métodos puede verse en la Figura 1. A continuación, vamos a
realizar un breve recorrido de los mismos, pero centrándonos fundamentalmente en los definidos como
aleatorios.

1) Muestreo aleatorio.

Muestreo aleatorio simple.

Se caracteriza porque cada elemento de la población tiene la misma probabilidad de ser elegido. Si se
dispone de una lista de los elementos de la población, la selección de una muestra aleatoria simple es
muy sencilla. Supongamos que numeramos los elementos de la población de 1 a N, una muestra
aleatoria simple puede obtenerse colocando N bolas numeradas en una caja, mezclándolas, y
extrayendo n de ella, o bien, también puede utilizarse una tabla de números aleatorios, ordenador o
simple calculadora de mano (tecla RANDOM – RND).

Muestreo aleatorio sistemático.

Si existe una lista de los elementos de la población en la que aparecen ordenados y el orden existente
no es un factor distorsionante de la aleatoriedad para el tema bajo estudio (de ser así habría sesgo en la
selección) se utiliza con mayor frecuencia el muestreo sistemático. Se trata de seleccionar un primer
elemento al azar (arranque aleatorio) entre 1 y p, siendo p=N/n, y, si este elemento es el k-ésimo, los
demás se obtienen sumándole p al inmediato anterior: k, k+p, k+2p, .......

El método garantiza que aparezcan elementos de todas las clases, por lo que genera muestras más
representativas que el aleatorio simple. Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno.

El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la población ya
que al elegir a los miembros de la muestra con una periodicidad constante (p) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra
sobre diferentes listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres,
si empleamos un muestreo aleatorio sistemático con p=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos. Otro ejemplo: si seleccionamos una
muestra de ocupación hotelera basada en una serie de datos mensuales para distintos años y p=12,
siempre se obtendría la observación correspondiente al mismo mes, por lo que la muestra estaría
afectada por el sesgo propio del factor estacional encontrado en el arranque aleatorio (al alza en meses
de alta ocupación, a la baja en el resto)

Muestreo estratificado.

Hace referencia a poblaciones con características diferentes, en las que existen estratos (grupos)
homogéneos con respecto al carácter que se investiga y que, por tanto, deben ser analizados de forma
diferente, ya que pueden obtenerse estimaciones más precisas (menos errores) tomando una muestra

8
aleatoria en cada estrato y, además, se garantiza que todos los estratos (subpoblaciones, en definitiva)
estén representados. Cada estrato tiene elementos que son homogéneos entre sí y heterogéneos
respecto a los demás estratos. Por ejemplo, si se quieren estudiar características de los hoteles de una
determinada provincia, se tienen como estratos los hoteles de 5 estrellas, de 4 estrellas, de 3 estrellas,
etc. y se utilizará un muestreo estratificado que nos asegure una adecuada representación de todos los
estratos.

Muestreo por conglomerados y por áreas.


En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que
forman una unidad, a la que llamamos conglomerado (familias, empresas, municipios, etc.). El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) e investigar después todos
los elementos pertenecientes a los conglomerados elegidos.

En el caso particular de que los conglomerados sean áreas geográficas –bastante frecuente-
hablaremos de muestreo por áreas.

Muestreo polietápico o por etapas.


El muestreo polietápico es una generalización del muestreo por conglomerados en el que se intenta
reducir el coste al mínimo. En la primera etapa se selecciona un número determinado de
conglomerados (unidades primarias de muestreo), por ejemplo, provincias. En la segunda se
seleccionan conglomerados más pequeños pertenecientes a los anteriores (unidades secundarias de
muestreo), por ejemplo, municipios. Y así sucesivamente (procedimiento de “embudo”) hasta llegar a
los elementos de la población que van a ser observados (unidades últimas). Sólo necesitamos, por
tanto, contar con un listado de los elementos de esta última etapa.
Como ejemplo práctico, la Encuesta de Población Activa (EPA), una investigación por muestreo de
periodicidad trimestral realizada por el INE desde 1964 dirigida a analizar la actividad laboral, utiliza
un muestreo en dos etapas con estratificación en la primera etapa. El INE selecciona como unidades
muestrales primarias alrededor de 3.000 secciones censales de entre las más de 30.000 en que esta
dividida España2. En cada una de estas secciones censales se entrevistan un promedio de 20 viviendas
familiares (unidades muestrales secundarias), obteniéndose una muestra de aproximadamente 64.000
viviendas para las que se recoge información para todos sus miembros, lo que produce una muestra
final en torno a las 200.000 personas.
Como resumen, en términos generales, las ventajas e inconvenientes de los distintos tipos de muestreo
aleatorio se presentan en la Tabla 1:

9
Tabla 1: Ventajas e inconvenientes de los diferentes tipos de muestreo aleatorio

CARACTERISTICAS VENTAJAS INCONVENIENTES

Se selecciona una muestra de tamaño n de Sencillo y de fácil comprensión. Requiere que se posea de
Aleatorio simple una población de N unidades, cada antemano un listado
elemento tiene una probabilidad de completo de toda la
inclusión igual y conocida de n/N. población. Caro.

Se necesita un listado de los N elementos de Fácil de aplicar. Cuando la Si la constante de muestreo


la población. Tras determinar el tamaño población está ordenada está asociada con el
muestral n, se define un valor p= N/n. Se siguiendo una tendencia fenómeno de interés, las
Sistemático
elige un número aleatorio, k, entre 1 y p conocida, asegura una cobertura estimaciones obtenidas a
(k= arranque aleatorio) y se seleccionan los de unidades de todos los tipos. partir de la muestra pueden
elementos de la lista que ocupan los lugares contener sesgo de selección
k, k+p, k+2p, ....

En ciertas ocasiones resultará conveniente Tiende a asegurar que la muestra Se ha de conocer la


estratificar la muestra según ciertas represente adecuadamente a la distribución en la población
variables de interés. Para ello debemos población en función de las de las variables utilizadas
conocer la composición estratificada de la variables seleccionadas. para la estratificación.
Estratificado
población. Estimaciones más precisas.
Su objetivo es conseguir una
muestra lo más semejante posible
a la población en lo referente a las
variables estratificadoras.

Se seleccionan aleatoriamente cierto Es muy eficiente cuando la El error estándar es mayor


Conglomerados- número de conglomerados y se investigan población es muy grande y que en el muestreo aleatorio
todos los elementos de cada uno de ellos. El dispersa. simple o estratificado.
Etapas muestreo por etapas es una generalización, No es preciso tener un listado de El cálculo del error estándar
que va de más grandes a más pequeños. Se toda la población, sólo de las es complejo.
realizan varias fases de muestreo sucesivas. unidades últimas de muestreo.
Menor coste.

2) Muestreo no aleatorio

A veces, para estudios exploratorios, el muestreo aleatorio resulta excesivamente costoso y se acude a
métodos no aleatorios, aun siendo conscientes de que no son adecuados para realizar generalizaciones,
pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la
población tienen la misma probabilidad de se elegidos. Sólo comentaremos aquí el muestreo por
cuotas y el de opinión.

Muestreo por cuotas.

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen


conocimiento de los estratos de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

10
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen
unas determinadas condiciones (variables de control), por ejemplo: 20 individuos de 25 a 40 años, de
sexo femenino y residentes en Málaga. Siempre que se ajuste a las cuotas fijadas, el entrevistador tiene
libertad para elegir a los entrevistados. Este método se utiliza mucho en las encuestas de opinión.

Muestreo de juicio o de opinión.

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas"
mediante la inclusión en la muestra de grupos supuestamente típicos. Para la obtención de una muestra
mediante este método se puede acudir a criterios específicos de los investigadores o bien requerir las
opiniones de expertos en la materia. Por ejemplo, cuando el interés del estudio se centra en comparar
las características diferenciadoras de los clientes que han presentado cierta insatisfacción en el servicio
respecto a aquellos otros que no, se determina a juicio del investigador un número predeterminado de
encuestas a los clientes satisfechos y otro número de encuestas a clientes insatisfechos.

You might also like