You are on page 1of 3

CÁLCULO DEL TAMAÑO DE MUESTRA (n)

Para calcular el tamaño de muestra, en forma previa se deben especificar:


- El nivel de confianza con el que se desea realizar la estimación.
- El margen de error máximo tolerable.

De esta manera se espera trabajar con una muestra que sea representativa y que las estimaciones sean
consistentes.

El margen de error es el intervalo en el cuál espero encontrar el dato que quiero medir de mi universo. El
dato puede ser en general de dos tipos: una media o una proporción.

Por ejemplo, si quiero calcular la media de hijos que tienen los habitantes de Guatemala entre 15 y 65 años,
me gustaría poder decir que la media es 2,1 hijos/persona con un margen de error del 5%. Eso significaría
que espero que la media esté entre 2,1 - 5% y 2,1 + 5%, lo que da un intervalo de 2,00 <-> 2,21.

Si quisiera definir un margen de error para una proporción, procedería de forma similar. Por ejemplo, me
gustaría poder estimar el número de personas de Guatemala entre 15 y 65 años que viven en una casa
propia, afirmando que son un total de 7.875 millones personas (45% de la población 17.5 millones) con un
margen del 5% de error, lo que significaría que la realidad está entre 8.75 millones (45%) y 7 millones (40%).

El nivel de confianza expresa la certeza de que realmente el dato que buscamos esté dentro del margen de
error. Por ejemplo, siguiendo con el caso anterior, si obtenemos un nivel de confianza del 95%, podríamos
decir que el porcentaje de personas del universo que viven en una casa propia, en el 95% de los casos se
encontrará entre el 45% y el 40%. O dicho de otra manera, si se repitiese 100 veces la encuesta
seleccionando muestras aleatorias del mismo tamaño, 95 veces la proporción que busco estaría dentro del
intervalo y 5 veces fuera.

Relación entre error y tamaño de muestra


Margen de error, nivel de confianza y tamaño de la muestra siempre van de la mano. Si quiero obtener un
margen de error y un nivel de confianza determinado (por ejemplo, error del 5% con confianza 95%)
necesitaré un tamaño de muestra mínimo correspondiente. Modificar cualquiera de los 3 parámetros, altera
los restantes:
1. Reducir el margen de error obliga a aumentar el tamaño de la muestra.
2. Aumentar el nivel de confianza obliga a aumentar el tamaño de la muestra.
3. Si aumenta el tamaño de mi muestra, puedo reducir el margen de error o incrementar el nivel de
confianza.

Las fórmulas que gobiernan la relación entre los parámetros anteriores es la LEY DE LOS GRANDES
NÚMEROS. Estos teoremas son los que dan soporte matemático a la idea de que el promedio de una
muestra al azar de una población de gran tamaño tenderá a estar cerca de la media de la población
completa. En concreto, el teorema del límite central demuestra que, en condiciones muy generales, la suma
de muchas variables aleatorias independientes (en el ejemplo, los habitantes de Guatemala que tienen casa
propia) «se aproxima bien» a una distribución normal (también llamada campana de Gauss).
Gracias al teorema del límite central, cuando se calcula una media (p.e. hijos por persona) o una proporción
(p.e. % de personas con casa propia) sobre una muestra, se puede saber cuál es la probabilidad de que el
universo tenga ese mismo valor o un valor parecido. El valor que calculemos en la muestra será el más
probable para nuestro universo y a medida que nos alejamos de este valor (por arriba o por abajo) cada vez
serán valores menos probables. En el ejemplo, si el 45% de la muestra de guatemaltecos tiene casa propia,
se puede afirmar que 45% es el valor más probable del universo estudiado. Un porcentaje de 44% será algo
menos probable, 43% aún menos, etc... Lo mismo sucede para valores superiores: 46% es menos probable
que 45%.

La forma en que disminuye la probabilidad a medida que se aleja de la media corresponde a una distribución

gaussiana. Se puede fijar un intervalo alrededor del valor más probable, de manera que se englobe el 95%

de la probabilidad (nivel de confianza). La distancia a la que se tiene que alejar del valor más probable para

englobar este 95% determina el margen de error.

Según el gráfico anterior, para una distribución normalizada (media 0, desviación 1) si se quiere englobar los
valores que cubren el 95% de los casos, se tiene que definir un margen de error entre -1,96 y +1,96 de la
media. Si se quiere cubrir el 99% de los casos, el margen debe alejarse hasta +-2,58.