Professional Documents
Culture Documents
2 Etapas en el muestreo
3 Tipos de error
4 Métodos de muestreo
1
Muestreo en poblaciones finitas
A lo largo del curso se ha estudiado como hacer inferencia acerca de la población partiendo de la
información suministrada por la muestra. Pero casi nada se ha dicho aún sobre dos aspectos
importantes del proceso de inferencia:
• como seleccionar los elementos u observaciones de una muestra.
• como proceder en esa selección y cuál es su tamaño adecuado, si la población no es tan grande
como se ha venido admitiendo hasta ahora (infinita).
a) Población.
Colectivo objeto del estudio formado por un conjunto de elementos con características similares y
sobre el que se pretenden inferir regularidades.
b) Muestra.
Subconjunto de la población o colectivo que se investiga. Debe ser representativa del conjunto de la
población.
c) Individuos.
Cada uno de los elementos que forman la población. Los individuos pueden ser:
d) Variables cuantitativas.
Caracteres que se observan en los individuos y que son susceptibles de tener valores numéricos: por
ejemplo, edad y gasto mensual del encuestado.
2
e) Atributos.
Son variables cualitativas, que no son susceptibles de tomar valores y se expresan mediante
modalidades: por ejemplo, sexo del encuestado, medio de transporte al destino, nivel de estudios.
2. Etapas en el muestreo.
Antes de preguntarnos de qué manera se toma una muestra de una población, quizás debíamos de
cuestionarnos sobre la necesidad de trabajar con muestras. La alternativa sería tratar de obtener la
información para todos y cada uno de los elementos de la población, es decir, trabajar con censos más
bien que con encuestas. Pero recordemos que hay, al menos, tres buenas razones para que una muestra
sea generalmente preferida a un censo:
• El coste, ya que un censo será mucho más caro y, a veces, incluso, prohibitivo.
Hay que definir la población de referencia de forma adecuada, pues, aunque el método seguido sea
correcto, las conclusiones no serán válidas si la población no ha sido elegida de forma adecuada. Por
ejemplo, encuestas de opinión entre los turistas procedentes de Holanda, no se pueden extrapolar para
definir la opinión del conjunto de los potenciales turistas de toda la Unión Europea.
3
De acuerdo con los objetivos establecidos en la investigación, debe obtenerse toda la información
correspondiente a esas familias, así como los movimientos turísticos realizados por ellas. Por tanto, las
variables a las que se referirá el estudio serán una serie de características sociodemográficas,
económicas y culturales relativas a esas familias.
Del mismo modo, se debe definir la cobertura o ámbito de objeto del estudio, tanto temporal (periodo
en que es interesante el estudio), como geográfica (delimitación geográfica del trabajo). Cuando la
población está bien definida es relativamente fácil obtener una muestra representativa. El problema
surge cuando la población no está bien delimitada o no es conocida. Por ejemplo, esto ocurriría si el
objetivo del estudio fuera la población futura de visitantes a un parque temático que se acaba de
construir. En este caso es evidente que se desconoce la posible población, así como las características
que la definen. Por ello, el trabajo de obtención de la muestra resulta más complejo, y sería imposible
de realizar si no fuera con la inclusión de determinados supuestos en el análisis.
La definición de las unidades de estudio es un paso necesario en esta etapa del proceso. Las unidades
de estudio pueden ser los individuos (los turistas que llegan a un balneario) o bien grupos de
individuos con algunas características comunes (las familias u hogares de un determinado país, los
jóvenes, los matrimonios sin hijos...).
El resultado del estudio, como se ha dicho, depende en gran medida de la adecuación de la muestra a
los objetivos y al marco de la investigación. Es por ello que en esta fase se deben recoger
explícitamente todos los posibles casos poblacionales que se pretenden analizar. Por ejemplo, si lo que
se quiere estudiar son las características de la demanda potencial de un determinado destino turístico
es evidente que no se puede obtener una muestra sólo de los turistas que viajan a ese destino. Esto
supondría dejar de lado una parte importante de información que proporcionarían otros turistas que
estarían dispuestos a viajar a ese destino, si las condiciones variaran. Por el contrario, si el objeto del
estudio es analizar las circunstancias que permiten la fidelización de los turistas a un destino concreto,
la muestra debería ser tomada exclusivamente entre aquellos que hayan visitado más de una vez dicho
destino.
No hay un método óptimo de llevar a cabo la selección de los elementos de la muestra. Dependerá,
generalmente, del problema que nos ocupa y de los recursos disponibles. El más conocido es el
muestreo aleatorio simple, en el que cada uno de los n elementos de la muestra tiene la misma
probabilidad de ser elegido. Sin embargo, hay circunstancias en que pueden ser mas indicados otros
tipos de muestreo. Por ejemplo, si deseamos recabar información acerca de la opinión de los visitantes
de un destino turístico, no sería lógico hacer un muestreo aleatorio simple, sino que lo más razonable
sería hacer un muestreo por estratos, teniendo en cuenta características diferenciadoras como podrían
ser la edad, el país de origen o el nivel de renta.
4
Otro aspecto importante, que veremos más adelante, será el tamaño de la muestra, que dependerá del
grado de fiabilidad requerido y del coste.
Los cuestionarios son la serie de preguntas que constituyen el tema de la encuesta. La elaboración de
un cuestionario adecuado resulta fundamental para la obtención de la información necesaria para
llevar a cabo el estudio. Las características de un buen cuestionario han de ser:
- Precisión: hay que definir bien las cuestiones y evitar ambigüedades para obtener la
información que se busca.
- Corrección: ha que evitar preguntas que por su contenido o su lenguaje puedan molestar al
entrevistado.
- Duración limitada: hay que reducir el tamaño del cuestionario lo máximo posible, evitando
preguntas repetidas o excesivamente largas, para impedir el cansancio y la monotonía en las
respuestas del entrevistado.
- Pregunta cerrada: el entrevistado debe contestar seleccionando una o varias opciones de las
que se le proponen. La pregunta cerrada facilita la tabulación posterior de las respuestas.
- Pregunta mixta: por ejemplo, una pregunta cerrada donde una de las opciones es una
pregunta abierta de respuesta libre.
- Entrevista telefónica.
Desde el punto de vista de la inferencia estadística, hay que tratar de asegurar dos aspectos claves:
• Que el número de no respuestas no sea alto, para evitar que los cuestionarios de los que
responden dejen de ser representativos del conjunto de la población. El número de preguntas y
la forma en que se realiza la encuesta (entrevista personal, correo, teléfono, etc.) tiene mucho
que ver con la tasa de no respuesta. Conviene analizar la falta de respuesta con objeto de ver la
5
representatividad que podemos seguir adjudicando a la muestra (características o patrón de
comportamiento de los elementos no observados por falta de respuesta).
• Que las respuestas sean honestas y precisas. La técnica (arte) en el diseño del cuestionario y
en la realización de la entrevista, o forma de hacer la pregunta, es esencial en este punto.
Se comienza con la preparación y análisis de los datos: codificación, depuración y análisis descriptivo
inicial. Posteriormente, se entra en la inferencia, de la que ya se han estudiado diversas formas de
realizarla. A lo largo de esta lección, no obstante, trataremos algunos métodos de inferencia para tipos
particulares de muestreo.
Se trata de resumir y presentar la información obtenida: estimación por intervalos, tablas resumen,
presentaciones gráficas, etc. Una vez destacadas las conclusiones del estudio, puede argumentarse
como actuar y, posiblemente, sugerir la obtención posterior de nueva información de interés aparecida
a lo largo del estudio. En este sentido, muchas veces, la aparición de cuestiones importantes no
previstas en el proceso, puede servir de estímulo para posteriores estudios de la población.
3. Tipos de error
Nunca sabremos, ciertamente, cuál es el verdadero valor de cualquier parámetro poblacional. Una
fuente posible de error procede del hecho de que no observamos toda la población, y le llamamos error
de muestreo, de azar o de estimación. Este tipo de error es inevitable, ya que siempre habrá diferencia
entre los valores medios de la muestra y los valores medios de la población. La magnitud de este error
depende del tamaño de la muestra (a mayor tamaño de muestra menor error) y de la dispersión o
desviación estándar del estimador (a mayor dispersión mayor error).La Estadística estudia de qué
forma se puede tratar ese tipo de error o, al menos, cómo se puede incorporar en el proceso de
inferencia (intervalos de confianza, nivel de significación, etc.).
Sin embargo, hay otras posibles fuentes de error que no pueden ser tratadas de la misma forma. Los
llamaremos errores ajenos al muestreo y algunos de ellos son:
• Falta de respuesta. Este hecho puede producir estimaciones sesgadas, ya que los que
respondieron pueden no representar fielmente a la población. Por eso, en este caso, conviene
analizar las características de los que no lo hicieron (posible sesgo) y compararlas con los que
sí lo hicieron, para ver si son homogéneos o no ambos grupos.
6
• Sesgo en la selección de los elementos de la muestra. Por ejemplo, cambio de un vecino por
otro ausente, desatendiendo el proceso de muestreo estipulado.
No existe un procedimiento general para evitar y analizar tales errores. Pero el investigador debe
tenerlos muy presentes para tratar de minimizarlos. Es preciso recabar toda la información disponible.
Puede hacerse una encuesta previa para detectar posibles fallos.
4. Métodos de muestreo
Los métodos de muestreo pueden ser de dos tipos: aleatorios y no aleatorios, dependiendo del método
de obtención de la muestra. En los primeros, la selección de los elementos de la muestra es aleatoria e
independiente de la opinión de cualquier persona (investigador o entrevistador). En los segundos, esta
condición no siempre se cumple. En ambos casos, pueden seleccionarse elementos de la población
(por ejemplo, empleados) o grupos de elementos (por ejemplo, familias). De esta forma, podemos
establecer la siguiente clasificación de los métodos de muestreo:
Muestreos
aleatorios
Unidad Unidad
muestral muestral
elemental grupo
Muestreos
no
aleatorios
7
Una clasificación general de estos métodos puede verse en la Figura 1. A continuación, vamos a
realizar un breve recorrido de los mismos, pero centrándonos fundamentalmente en los definidos como
aleatorios.
1) Muestreo aleatorio.
Se caracteriza porque cada elemento de la población tiene la misma probabilidad de ser elegido. Si se
dispone de una lista de los elementos de la población, la selección de una muestra aleatoria simple es
muy sencilla. Supongamos que numeramos los elementos de la población de 1 a N, una muestra
aleatoria simple puede obtenerse colocando N bolas numeradas en una caja, mezclándolas, y
extrayendo n de ella, o bien, también puede utilizarse una tabla de números aleatorios, ordenador o
simple calculadora de mano (tecla RANDOM – RND).
Si existe una lista de los elementos de la población en la que aparecen ordenados y el orden existente
no es un factor distorsionante de la aleatoriedad para el tema bajo estudio (de ser así habría sesgo en la
selección) se utiliza con mayor frecuencia el muestreo sistemático. Se trata de seleccionar un primer
elemento al azar (arranque aleatorio) entre 1 y p, siendo p=N/n, y, si este elemento es el k-ésimo, los
demás se obtienen sumándole p al inmediato anterior: k, k+p, k+2p, .......
El método garantiza que aparezcan elementos de todas las clases, por lo que genera muestras más
representativas que el aleatorio simple. Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la población ya
que al elegir a los miembros de la muestra con una periodicidad constante (p) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra
sobre diferentes listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres,
si empleamos un muestreo aleatorio sistemático con p=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos. Otro ejemplo: si seleccionamos una
muestra de ocupación hotelera basada en una serie de datos mensuales para distintos años y p=12,
siempre se obtendría la observación correspondiente al mismo mes, por lo que la muestra estaría
afectada por el sesgo propio del factor estacional encontrado en el arranque aleatorio (al alza en meses
de alta ocupación, a la baja en el resto)
Muestreo estratificado.
Hace referencia a poblaciones con características diferentes, en las que existen estratos (grupos)
homogéneos con respecto al carácter que se investiga y que, por tanto, deben ser analizados de forma
diferente, ya que pueden obtenerse estimaciones más precisas (menos errores) tomando una muestra
8
aleatoria en cada estrato y, además, se garantiza que todos los estratos (subpoblaciones, en definitiva)
estén representados. Cada estrato tiene elementos que son homogéneos entre sí y heterogéneos
respecto a los demás estratos. Por ejemplo, si se quieren estudiar características de los hoteles de una
determinada provincia, se tienen como estratos los hoteles de 5 estrellas, de 4 estrellas, de 3 estrellas,
etc. y se utilizará un muestreo estratificado que nos asegure una adecuada representación de todos los
estratos.
En el caso particular de que los conglomerados sean áreas geográficas –bastante frecuente-
hablaremos de muestreo por áreas.
9
Tabla 1: Ventajas e inconvenientes de los diferentes tipos de muestreo aleatorio
Se selecciona una muestra de tamaño n de Sencillo y de fácil comprensión. Requiere que se posea de
Aleatorio simple una población de N unidades, cada antemano un listado
elemento tiene una probabilidad de completo de toda la
inclusión igual y conocida de n/N. población. Caro.
2) Muestreo no aleatorio
A veces, para estudios exploratorios, el muestreo aleatorio resulta excesivamente costoso y se acude a
métodos no aleatorios, aun siendo conscientes de que no son adecuados para realizar generalizaciones,
pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la
población tienen la misma probabilidad de se elegidos. Sólo comentaremos aquí el muestreo por
cuotas y el de opinión.
10
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen
unas determinadas condiciones (variables de control), por ejemplo: 20 individuos de 25 a 40 años, de
sexo femenino y residentes en Málaga. Siempre que se ajuste a las cuotas fijadas, el entrevistador tiene
libertad para elegir a los entrevistados. Este método se utiliza mucho en las encuestas de opinión.
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas"
mediante la inclusión en la muestra de grupos supuestamente típicos. Para la obtención de una muestra
mediante este método se puede acudir a criterios específicos de los investigadores o bien requerir las
opiniones de expertos en la materia. Por ejemplo, cuando el interés del estudio se centra en comparar
las características diferenciadoras de los clientes que han presentado cierta insatisfacción en el servicio
respecto a aquellos otros que no, se determina a juicio del investigador un número predeterminado de
encuestas a los clientes satisfechos y otro número de encuestas a clientes insatisfechos.