You are on page 1of 26

tema

58 MATEMÁTICAS

Población y muestra.
Condiciones de representatividad de
una muestra.
Tipos de muestreo.
Tamaño de una muestra.
24-13850-13

Temario 1993
tema 58

matemáticas

1. Población y muestra. Condiciones de representatividad de una


muestra

2. Condiciones de representatividad de una muestra

3. Tipos de muestreo
3.1. Muestreo aleatorio simple

3.2. Muestreo aleatorio estratificado

3.3. Muestreo aleatorio sistemático

3.4. Muestreo polietápico, por áreas o conglomerados

3.5. Muestreo secuencial o muestreo sobre calidad

3.6. Métodos indirectos de muestreo

4. Tamaño de una muestra

3
tema 58

matemáticas

INTRODUCCIÓN

La Estadística tiene como objetivo recoger datos sobre la evolución de cualquier infor-
mación contenida en una muestra. Todos conocemos y podemos encontrar día a día en los
medios de comunicación algunos resultados referentes a estudios estadísticos que llevan a
cabo los estados, las empresas, los comercios o los bancos por poner algunos ejemplos.
Lo primero que se tiene que hacer es establecer el conjunto de elementos que nos interesa
estudiar, es decir, la población. La población que le interesará a un estado para su estudio
será todo el censo, en cambio una empresa privada, para llevar a cabo un estudio comercial
se conformará con obtener información de una parte de dicha población, cogiendo una
muestra.
En el presente tema se van a estudiar estos conceptos, las condiciones de representatividad
de una muestra, los tipos que existen y la forma de calcular el tamaño más adecuado para
esta.

5
tema 58

matemáticas

1 Población y muestra. Condiciones de


representatividad de una muestra
Definición:
Se llama Población, o bien universo, a cualquier conjunto, o colección, de indi-
viduos o elementos que tienen una característica común.
Observación:
No necesariamente ha de referirse a un conjunto de organismos vivientes.
Son ejemplos de Población:
1. Los habitantes de un determinado país.
2. Los árboles de un bosque.
3. Los establecimientos comerciales de una ciudad.
„„ Lo que nos interesa en la Población es medir o contar uno o varios caracteres
cuantitativos. Por ello es necesario que la Población esté bien definida para que
se sepa qué elementos la componen.
„„ Cuando el Estadístico puede observar todos los elementos de la Población, di-
remos que está realizando un censo. En tal caso la tarea se reduce a describir las
características y regularidades de la Población con los métodos de la Estadística
Descriptiva y construir un modelo de Distribución de Probabilidad que pueda
ser utilizado en posteriores investigaciones estadísticas.
Ahora bien, por diversos motivos no siempre es posible analizar cada elemento de
la Población; por ejemplo:
„„ Por ser inviable económicamente estudiar toda la Población.
„„ Porque el estudio puede implicar la destrucción del elemento, como es el caso
de ensayos destructivos: por ejemplo, estudiar la vida media de una partida de
bombillas, o la tensión de rotura de cables.
„„ Porque la población es muy difícil o imposible de controlar: por ejemplo, la
totalidad de las personas que entran en unos grandes almacenes a lo largo de
una semana.
„„ Porque se desea conocer rápidamente ciertos datos de la Población, y se tarda-
ría demasiado en controlar a todos: por ejemplo, para conocer la intención de
voto de los habitantes de un país en unas elecciones.

6
tema 58

matemáticas

Entonces las características de la Población deben ser estudiadas a partir de un


subconjunto de ésta.
Definición:
Una muestra de una Población es un subconjunto de elementos de dicha Pobla-
ción. El número de elementos que la componen se llama tamaño de la muestra y
el proceso de escoger una muestra de una población se denomina muestreo.
Si nuestra investigación se dirige a toda una población diremos que estamos ha-
ciendo un censo u observación exhaustiva. Si nos encontramos con la recogida
de información de una muestra, diremos que estamos efectuando una encuesta.
Al efectuar una observación exhaustiva vemos el valor que toma una característi-
ca x en cada uno de los individuos de la población. De ahí que conozcamos la dis-
tribución de la variable y no sean necesarios métodos de la inferencia estadística.
Si la característica x la observamos en una muestra de la población, para poder uti-
lizar adecuadamente la inferencia estadística, hemos de prescindir de las muestras
seleccionadas según un criterio u opinión personal.
Surge de modo natural la necesidad de cuantificar los errores de muestreo y de
conocer los aspectos fundamentales para una muestra sea representativa de la po-
blación ya que la información suministrada por una muestra representativa nos
sirve para inducir o inferir, con mayor o menor exactitud, las características de la
Población, mediante los métodos de la Estadística Inferencial.

7
tema 58

matemáticas

2 Condiciones de representatividad de una muestra


Para poder obtener conclusiones razonables a partir de una muestra, ésta debe
estar bien elegida, es decir, debe ser representativa de la Población. Esto depen-
de de dos aspectos fundamentales de la muestra: su tamaño y cómo se realiza la
selección de los individuos que la componen.
„„ Respecto al tamaño: es claro que si la muestra es demasiado pequeña no po-
demos obtener de ella ninguna conclusión que merezca la pena. Sin embargo, a
veces, con muestras relativamente pequeñas se obtienen resultados muy preci-
sos sobre la Población. Por ejemplo: en poblaciones homogéneas, es decir, en
poblaciones en las que cualquier subconjunto tiene características análogas al
conjunto, las muestras pequeñas son muy representativas. Es lo que ocurre con
los análisis de sangre y con los controles de calidad de una pieza de tela.
Otras veces ocurre que un aumento del tamaño de la muestra no supone un
aumento significativo de la representatividad.
En el último punto del tema veremos con más detalle este aspecto.
„„ Respecto a la forma de seleccionar los elementos de la muestra: al sustituir
el estudio de la Población por el estudio de una muestra, se cometen errores. Si
la muestra está seleccionada al azar, estos se pueden controlar. Sin embargo, si
la muestra está mal elegida, no es representativa y se producen errores adicio-
nales imprevistos e incontrolados.
Ejemplo:
Un ejemplo típico es el de las elecciones americanas de 1936, en las que ganó
Roosevelt.
Una revista hizo una encuesta de intención de voto a más de cuatro millones de
sus electores, y pronosticó el fracaso de Roosevelt.
Otra encuesta realizada a 4.500 personas anunció el éxito de Roosevelt con mucha
exactitud.
La razón es que en el primer caso la muestra no era representativa de la sociedad
americana, pues todos eran lectores de una determinada revista, mientras que en
las 4.500 personas de la segunda estaban representados todos los estamentos de
dicha sociedad.
Este es uno de tantos ejemplos que pone de manifiesto la necesidad de seleccionar
adecuadamente los elementos que integran la muestra, eliminando criterio perso-
nales. Es decir, los integrantes de una muestra han de ser elegidos al azar. Si ope-
ramos así estamos ante un muestreo probabilístico al que podemos aplicar, como
hemos indicado anteriormente, métodos de la inferencia estadística. Obtenemos
así muestras representativas.
Cuando la selección de los elementos de la muestra no se hace así estamos ante el
muestreo opinático o no probabilístico.

8
tema 58

matemáticas

Es decir:

- probabilístico → Muestra representativa


muestreo 
- opinático o no probabilístico → Muestra no representativa

Conviene distinguir entre dos tipos de errores en la selección de la muestra:


1. Errores muestrales: son aquellos que se encuentran latentes en toda muestra
representativa pues no proporcionan una medida exacta de las características
de la población, aun siendo representativa.
2. Sesgos: debidos a la falta de representatividad de la muestra o a errores de ob-
servación originados por definiciones defectuosas, respuestas o medidas mal
efectuadas…
Es, por tanto, importante conocer los diferentes tipos de muestreo, así como la
garantía de su representatividad. Antes de desarrollar este punto veamos algunos
conceptos básicos en el muestreo.

XX Distribución poblacional

Supongamos que en una Población nos interesa estudiar la característica numérica


x: tenemos x1, x2, ...., xn. Queremos saber su distribución, definida principalmente
por los parámetros poblacionales:
N = tamaño de la Población
N

∑x i

µ= i =1
= media poblacional
N
N N

∑ ( xi − µ) 2 ∑x 2
i

σ2 = i =1
= i =1
− µ2 = varianza poblacional
N0 N

σ = + σ 2 = desviación típica poblacional


A proporción poblacional, con A = número de elementos de la
pA = =
N
población con una característica A.

XX Distribución de la muestra

Medimos en la muestra la característica numérica x que nos interesa. x es una va-


riable estadística, y estudiamos la distribución de sus frecuencias con los métodos
de la Estadística Descriptiva.
Sean x1, x2, ..., xn los valores obtenidos. Con ellos obtendremos los parámetros
estadísticos o muestrales:

9
tema 58

matemáticas

n = tamaño de la muestra
n

∑x i

x= i =1
= media muestral
n
n n

∑ ( xi − x ) 2 ∑x 2
i
2
S2 = i =1
= i =1
− x = varianza muestral
n n

S = + S 2 = desviación típica muestral

α
p= = proporción muestral, con α = número de individuos de la muestra
n
con una característica A.

XX Distribución muestral

Nuestro objetivo es obtener información sobre la ley de Probabilidad que rige la


característica x de la Población a partir de las observaciones de la misma elegidas
para formar la muestra. Es decir, queremos estimar los parámetros poblacionales
a partir de los datos muestrales.
Definición:
Se llama estadístico a cualquier función que depende sólo de los valores de la
muestra: x1, x2, ..., xn.
Un estimador es un estadístico que se utiliza para estimar el valor de un paráme-
tro desconocido de la Población. Como para cada muestra considerada el estima-
dor toma un valor, éste es una variable aleatoria, y por lo tanto, cada estimador
tendrá una distribución, que llamaremos distribución muestral del estimador
considerado.
Los estadísticos más utilizados son x , S2, S, y un parámetro muestral que se llama
cuasivarianza muestral, definido de la siguiente forma:

∑ ( x − x)
i
2

SC2 = i =1
n −1

 2 n −1 2
 S = n SC

Es obvio que: 
 2 n
SC = n − 1 S
2

10
tema 58

matemáticas

3 Tipos de muestreo
El muestreo probabilístico se caracteriza porque puede calcularse de antemano
la probabilidad de obtener cada una de las posibles muestras, para lo cuál es ne-
cesario que la selección de la muestra pueda considerarse como un experimento
aleatorio.
Así, cada observación xi es una variable aleatoria que tiene la distribución de pro-
babilidad de la Población:
E[xi] = µ     V[xi] = 2     ∀i = 1, 2, ..., n
Este tipo de muestreo es el único que tiene rigor científico, y el único que puede
darnos el error que cometemos en la inferencia.
Dentro del muestreo aleatorio, hay varios tipos:

3.1. Muestreo aleatorio simple

Si se seleccionan de forma sucesiva n elementos de la población, ui, y se halla el


valor de la característica xi de modo que en cada extracción cada elemento tenga
la misma probabilidad de ser elegido, habremos obtenido una muestra aleatoria de
tamaño n, y diremos que el muestreo es aleatorio simple.
La representatividad de una muestra obtenida por muestreo aleatorio simple viene
garantizada por tener cada elemento la misma probabilidad de ser elegido. Así, si
un 40% de la población tiene la característica xi, se obtendrá, por término medio,
un 40% de elementos de la muestra con esa característica.
Dependiendo que los elementos de la población se seleccionen con o sin reempla-
zamiento distinguimos dos casos en el muestreo aleatorio simple:

XX Caso 1: muestreo aleatorio simple sin reemplazamiento

Cuando las sucesivas extracciones de elementos se realizan sin reemplazamiento.


1. Tenemos:
N
 n 
muestras posibles, y la probabilidad de seleccionar cada una de ellas es:
1
N
 n 
2. Probabilidad de que la unidad ui pertenezca a la muestra:

 N − 1 ( N − 1)!
 n − 1  ( n − 1)! ⋅ ( N − n)! n
P(ui pertenezca a una muestra determinada) = = =
N N! N
 n  n! ⋅ ( N − n)

11
tema 58

matemáticas

3. Variables indicadoras:
Para k = 1, ...N, sea βk una variable aleatoria tal que
1 si uk está en la muestra
βk = 
0 si uk no está en la muestra
Entonces:
n
a) P ( β k = 1) = por II.
N
n  n n
b) E [ β k ] = 1 ⋅ + 0 ⋅ 1 −  = .
N  N N
Definimos también la variable aleatoria:

1 si ui y uk éstán en la muestra
βi ⋅ β k = 
0 en caso contrario
Entonces:
 N − 2 ( N − 2)!
 n − 2  ( n − 2)! ⋅ ( N − n)! n ⋅ ( n − 1)
a) P ( β j ⋅ β k = 1) = = =
 N N! N ⋅ ( N − 1)
 n  ⋅
n! N( − n )!

n ⋅ ( n − 1)  n ⋅ ( n − 1)  n ⋅ ( n − 1)
b) E[ β j ⋅ β k ] = 1 ⋅ + 0 ⋅ 1 −  =
N ⋅ ( N − 1)  N ⋅ ( N − 1)  N ⋅ ( N − 1)

4. Distribución de la media muestra:

 n
 1 n
a) E[ x ] = E  1 ∑ ∑ E[ x ] = n ⋅ n ⋅ µ = µ, por la linealidad de la
1
xi  = i
 n i =1  n i =1

­esperanza.
b)

E [ x ]= µ  x + ... + xn n ⋅ µ  2 
V [ x ] = E  x − E[ x ]2  = E ( x − µ) 2  = E  1 − =
 n n  

1  n

2
 1  n n 
=E 2
n


∑ ( xi − µ) 


= E
 n 2  i =1 ∑
( xi − µ) 2 + ∑ ( x − µ) ⋅ ( x
i j − µ) =

 i =1
 i≠ j

n n

∑ ∑ E ( x − µ) ⋅ ( x
1 1
= E ( xi − µ) 2  + 2 i j − µ) =
n2 i =1
n i≠ j

∑ E ( β ⋅ β ) ⋅ ( x − µ) ⋅ ( x
1 1
= 2
⋅ n ⋅ σ2 + 2 i j i j − µ) =
n n i≠ j

∑ E[ β ⋅ β ] ⋅ E ( x − µ) ⋅ ( x
σ2 1
= + i j i j − µ)
n n2 i≠ j

12
tema 58

matemáticas

dónde βi · βj y (xi – µ) · (xj – µ)


   son v.a. independientes

n ⋅ ( n − 1)
N

∑ N ⋅ ( N − 1) E ( x − µ) ⋅ ( x
σ2 1
= + i j − µ) =
n n2 i≠ j

σ 2 1 n ⋅ (nn − 1)  N 
= + 2⋅ E
n n N ⋅ ( N − 1)  i ≠ j ∑
( xi − µ) ⋅ ( x j − µ) =


 N  N 
2

∑ ( xi − µ) = 0 ⇒  ∑( xi − µ) = 0 ⇒ 
 i =1  i =1  
 
 N N N N

⇒

∑ i =1
( xi − µ) +
2

i≠ j

( xi − µ) ⋅ ( x j − µ) = 0 ⇒ ∑ ( x − µ) ⋅ ( x
i≠ j
i j − µ) = − ∑
i =1
( xi − µ) 2 


( n − 1)  N


σ2
= + E − ( xi − µ) 2  =
n n ⋅ N ⋅ ( N − 1)  i =1 


( n − 1)  N  σ2 n −1

σ2
= +  E ( xi − µ) 2   = − ⋅ N ⋅ σ2 =
n n ⋅ N ⋅ ( N − 1)  i =1  n n ⋅ N ⋅ ( N − 1)

( N − 1) σ 2 − ( n − 1) σ 2 N − n σ 2
= = ⋅
n ⋅ ( N − 1) N −1 n
N −n
se llama factor de corrección para poblaciones finitas.
N −1
5. Distribución de la varianza muestral S2:

1 n
 1 N
 1 n

∑ ∑ ∑ E[ x ] − E[ x ]
2
E[S ] = E 
2
( xi − x )  = E 
2
x −x =
2
i
2
i
2

 n i =1   n i =1  n i =1

N − n σ2
1. V [ x ] = E [ x 2 ] − µ2 ⇒ E [ x 2 ] = V [ x ] + µ2 = ⋅ + µ2
N −1 n
2. V [ x ] = σ 2 = E [ x 2 ] − µ2 ⇒ E [ x 2 ] = σ 2 + µ2
Luego:

1  N − n σ2 
E[S 2 ] = ⋅ n ⋅ ( σ 2 + µ2 ) −  ⋅ + µ2  =
n  N −1 n 

N − n σ2  n ⋅ N − n − N + n  σ 2 N ⋅ ( n − 1)
= σ2 − ⋅ = σ2 ⋅ = ⋅
N −1 n  n ⋅ ( N − 1)  n N −1

13
tema 58

matemáticas

XX Caso 2: muestreo aleatorio simple con reemplazamiento

Cuando las sucesivas extracciones de elementos se realizan con reemplazamiento:


entonces tenemos un n-upla x1, x2, ..., xn. de variables aleatorias independientes e
idénticamente distribuidas según la distribución de la Población (variables aleato-
rias e independientes e idénticamente distribuidas ).

1. Tenemos Nn muestras posibles, y la probabilidad de seleccionar una de ellas es,

por tanto 1 .
Nn
2. Distribución de la media muestral x:
a) E [ x ] = µ (visto antes)
1 n
 v.a.i. 1 n n

∑ ∑ ∑
1 1 σ2
b) V [ x ] = V  xi  = 2 V [ xi ] = 2 σ2 = ⋅ n ⋅ σ 2
=
 n i =1  n i =1
n i =1
n2 n

3. Distribución de la varianza muestral S2:

1 n

E[S 2 ] = E 
 n
∑ ( x − x) 
i =1
i
2

n n

∑ ( x − x) = ∑ ( x − µ + µ − x)
i =1
i
2

i =1
i
2
=

n n n

= ∑ ( x − µ) + ∑ ( µ − x)
i =1
i
i =1
2
+2 ∑ ( x − µ) ⋅ ( µ − x) =
i =1
i

n n

= ∑
i =1
( xi − µ) 2 + n ⋅ ( µ − x ) 2 + 2( µ − x ) ∑ ( x − µ) =
i =1
i

= ∑ ( x − µ)
i =1
i
2
+ n ⋅ ( µ − x ) 2 + 2( µ − x ) ⋅ ( n ⋅ x − n ⋅ µ) =

n n

= ∑ ( x − µ)
i =1
i
2
+ n ⋅ ( µ − x ) + 2n ⋅ ( µ − x ) =
2 2
∑ ( x − µ)
i =1
i
2
− n ⋅ ( µ − x) 2

n n
Luego ∑ i =1
( xi − µ) 2 = ∑ ( x − x)
i =1
i
2
+ n ⋅ ( µ − x) 2

Este resultado tiene una importante interpretación: descompone la variabilidad de


los datos respecto a la media poblacional (la verdadera media) como suma de la
variabilidad respecto de la media muestral y la variabilidad entre la media mues-
tral y la verdadera.

14
tema 58

matemáticas

Tomando esperanzas queda:

 n   n 
∑ ∑
σ2
E ( xi − µ) 2  = E  ( xi − x ) 2  + n ⋅ E [( x − µ) 2 ] ⇒ n ⋅ σ 2 = E[n ⋅ S 2 ] + n ⋅ ⇒
 i =1   i =1  n
n −1 2
n · E[S2] = n · σ2 – σ2 = (n – 1) · σ2.Luego E [S 2 ] = σ
n
En consecuencia, el valor medio de S2 es menor que σ2, aunque la diferencia tiende
a 0 al aumentar el tamaño de la muestra. Es por esto que se define la cuasivarianza
muestral Sc2, que verifica:
 n  n n n −1 2
E[Sc2 ] = E  ⋅ S2 = ⋅ E[S 2 ] = ⋅ ⋅ σ = σ2
n −1  n −1 n −1 n

Y si n es grande S2 ≈ S2
Observación:
En el caso de ser la población infinita o el tamaño N muy grande, entonces es
prácticamente igual hacer el muestreo con o sin reemplazamiento, ya que:
Caso 1 Caso 2

N − n σ2 n→∞ σ2
V [ x] = ⋅  → V [ x] =
N −1 n n

N ⋅ ( n − 1) σ 2 n→∞ n −1 2
E[S 2 ] = ⋅  → E[S 2 ] = ⋅σ
N −1 n n

Como regla práctica se suele adoptar que si la fracción de muestreo n/N es menor
que 5/100, entonces se hace el muestreo aleatorio simple con reemplazamiento,
que es el que se utiliza con mayor frecuencia, y al ser variables aleatorias e inde-
pendientes e idénticamente distribuidas el estudio de las distribuciones de x y S2
queda mucho más sencillo como acabamos de ver.
Ejemplo:
Una variable aleatoria X tiene por distribución de probabilidad:

x 1 4

1 1
pi
3 2

a) Hallar µ y σ2
1 2
µ = 1⋅ + 4⋅ = 3
3 3
1 2
σ 2 = 12 ⋅ + 4 2 ⋅ − 32 = 11 − 9 = 2
3 3

15
tema 58

matemáticas

b) Formar todas las muestras aleatorias simples con remplazamiento de tamaño 2


y obtener las distribuciones de x y S2

Muestras Pi x S2

1
(1, 1) 1 0
9

2
(1, 4) 2,5 2,25
9

2
(4, 1) 2,5 2,25
9

4
(4, 4) 4 0
9

12 + 12
S 2 (1, 1) = − 12 = 0 = S 2 ( 4, 4)
2
12 + 4 2
S 2 (1, 4) = − 2, 52 = 2, 25 = S 2 ( 4, 1)
2

Distribución de x:

x Pi

1
1
9

4
2,5
9

4
4
9

Distribución de S2:

S2 Pi

5
0
9

4
2,25
9

16
tema 58

matemáticas

σ2 n −1 2
c) Comprobar que E [ x ] = µ, V [ x ] = y E[S 2 ] = ⋅σ
n n

1 4 4
E[ x ] = 1 ⋅ + 2, 5 ⋅ + 4 ⋅ = 3 = µ
      9 9 9

1 4 4
V [ x ] = 12 ⋅ + 2, 52 ⋅ + 4 2 ⋅ − 32 = 10 − 9 = 1
9 9 9
σ2 2
V [ x] = = =1
n 2

5 4
E[S 2 ] = 0 ⋅ + 2, 25 ⋅ = 1
9 9
n −1 2 1
      E[S ] = n ⋅ σ = 2 ⋅ 2 = 1
2

4. Distribución de la proporción muestral:


Definimos en la Población la variable aleatoria Y de Bernouilli:
Y ≡ B(1, pA). Sabemos que E[Y] = pA, V[Y] = pA · qA donde qA = 1 – pA.
Tomamos una muestra aleatoria simple de tamaño n Y1, Y2, ..., Yn.
n

∑Y i

La proporción muestral de A es: p = i =1


.
n
 n 
 ∑ Yi  n
a) E[ p] = E  i =1  = 1 ∑ E[Y ] = n ⋅ n ⋅ p
1
= pA
 n  n i A

  i =1

 

 n 
 ∑ Yi  n
pA ⋅ qA
b) V [ p] = V  i =1  = 12 ∑ V [Y ] = n
v.a.i. 1
⋅ n ⋅ pA ⋅ qA =
 n  n
i 2
n
  i =1

 

XX Distribuciones de probabilidad en el muestreo

Conocer las distribuciones de probabilidad en el muestreo de los estadísticos es-


tudiados es clave en la inferencia Estadística. Con los resultados obtenidos, supo-
niendo una muestra aleatoria simple con reemplazamiento, tenemos que:
a) Caso de Poblaciones normales: X ≡ N(µ, σ)
 σ 
1. Si σ0 conocida: x ≡ N  µ, 0 
 n

17
tema 58

matemáticas

x− µ
2. Si σ desconocida: ≡ t n−1
Sc
n
n⋅ S2 ( n − 1) ⋅ Sc2
3. ≡ ℵ2
n −1 ⇔ ≡ ℵ2n−1. Y, además, es independiente de x.
σ2 σ2
b) Caso de Poblaciones no normales:
1. Cuando no sabemos la distribución de la Población, y n ≥ 30, podemos apli-
car el Teorema Central del Límite y tenemos que:

 σ 
x → N  µ,  , si σ conocida
 n
 S2 
x → N  µ, c  , si σ desconocida
 n

2. Si Y ≡ B(1, p), y n ≥ 30, entonces por el Teorema Central del Límite:


 pA ⋅ qA 
p ≡ N  PA ,
 n 
Si tenemos alguna información sobre la Población, debe utilizarse, y da lu-
gar a otros tipos de muestreos probabilísticos:

3.2. Muestreo aleatorio estratificado

En el muestreo aleatorio estratificado, la población se divide en grupos homogé-


neos que se denominan estratos, y posteriormente se extrae una muestra aleatoria
simple de cada estrato. Así por ejemplo, si tenemos una población en la que el
60% son mujeres y el 40% hombres, para escoger una muestra de 2000 personas
dividimos la población en dos estratos: hombres y mujeres, y se escoge al azar una
muestra proporcional de cada estrato: 1200 mujeres y 800 hombres.
Si N es el tamaño de la población y denominamos por N1, … Nk el tamaño de cada
estrato, tendremos que N= N1+ … +Nk. El número de elementos de cada estrato
que debemos seleccionar nj, debe ser proporcional al número de elementos de
cada estrato, es decir:
Nj
nj = n
N
donde n es el número de elementos que queremos que tenga la muestra.
La representatividad de una muestra obtenida por muestreo aleatorio estratificado
viene garantizada por el hecho de que:
„„ El número de elementos que se tomen de cada estrato es proporcional al tamaño
del estrato.

18
tema 58

matemáticas

„„ El número de elementos seleccionados de cada estrato es proporcional a la va-


riabilidad de cada estrato
Una vez determinado el número de individuos que deben pertenecer a cada estra-
to, se procede a la selección de individuos de cada estrato por muestreo aleatorio
simple.
Ejemplo práctico:
En un instituto de enseñanza secundaria en se ofertan los siguientes tipos de en-
señanza:
„„ Ciclos de grado superior: 110 alumnos.
„„ Bachillerato: 162 alumnos.
„„ Ciclos de grado medio: 210 alumnos.
„„ 2.º ciclo de enseñanza secundaria obligatoria: 338 alumnos.
Se pretende valorar las faltas de ortografía que cometen los alumnos del centro
mediante una prueba-dictado de un texto de 20 líneas; la prueba se pasará a una
muestra de 50 alumnos, para minimizar el costo en tiempo y medios.
En esta situación parece conveniente utilizar para la extracción de la muestra el
muestreo aleatorio estratificado con afijación proporcional.
Dividimos la población en cuatro estratos: ciclos de grado superior, ciclos de gra-
do medio, bachillerato y 2.º ciclo de Enseñanza Secundaria Obligatoria.
Como el número total de alumnos son 820 y la muestra debe estar formada por
50 alumnos.
El cálculo del número que se han de tomar de cada estrato es:
Ciclos de grado superior:
820 —— 110  50 × 110
 x= ≈7
  50 ——    x  820
Bachillerato:
820 —— 162  50 × 162
 x= ≈ 10
  50 ——    x  820

Ciclos de grado medio:


820 —— 210  50 × 210
 x= ≈ 13
  50 ——    x  820

2.º ciclo de Enseñanza Secundaria Obligatoria:


820 —— 338  50 × 338
 x= ≈ 20
  50 ——    x  820

19
tema 58

matemáticas

3.3. Muestreo aleatorio sistemático

Se utiliza cuando los elementos de la Población están ordenados en listas.


Sea k el entero más próximo a N/n La muestra sistemática se toma eligiendo al
azar un elemento entre los k primeros. Sea n1 el orden del elegido. Tomamos a
continuación los elementos n1 + k, n1 + 2k, ..., a intervalos fijos de k hasta comple-
tar la muestra.
Si el orden de los elementos de la lista es al azar, este procedimiento es equiva-
lente al muestreo aleatorio simple, aunque resulta más fácil llevarlo a cabo sin
errores. Así pues, la representatividad de una muestra aleatoria sistemática es la
misma que la de una muestra aleatoria simple. Si el orden es tal que los individuos
próximos tienden a ser más semejantes que los alejados, el muestreo sistemático
tiende a ser más preciso que el muestreo aleatorio simple, al cubrir más homogé-
neamente toda la Población.
El muestreo sistemático puede utilizarse conjuntamente con el estratificado, para
seleccionar la muestra dentro de cada estrato.

3.4. Muestreo polietápico, por áreas o conglomerados

Si la Población es muy homogénea se utiliza este tipo de muestreo. Para realizar-


lo, se divide la población en diferentes secciones o conglomerados y se elige al
azar unas cuantas secciones para formar la muestra. La representatividad de una
muestra por áreas viene garantizada por el hecho de haber elegido los conglome-
rados por un método aleatorio.
Ejemplo:
Para seleccionar una muestra de personas que viven en Madrid, elegimos por
muestreo aleatorio simple un barrio, y se investiga la característica buscada en
todas las personas que viven en esa zona: estamos realizando un muestreo por
conglomerados en una sola etapa.
Si dentro del barrio elegimos al azar una calle, y tomamos entre sus vecinos la
muestra, estamos realizando un muestreo por conglomerados en dos etapas o
bietápico.
Si, además, seleccionamos al azar unos números de las viviendas de esa calle, y
tomamos aquí la muestra, estaremos realizando un muestreo por conglomerados
en tres etapas o trietápico, y así podríamos seguir eligiendo pisos, letras, etc.
En este caso la representatividad viene garantizada por el hecho de haber elegido
los conglomerados por un método aleatorio.

20
tema 58

matemáticas

3.5. Muestreo secuencial o muestreo sobre calidad

Este tipo de muestreo se utiliza sobre todo para realizar controles de calidad en los
que se debe estudiar una característica de una población cuyo estudio implica la
destrucción del elemento que se seleccione. En un muestreo secuencial las unida-
des de muestreo son examinadas progresivamente hasta llegar al punto en que se
tiene suficiente información como para dar el resultado con las probabilidades de
error previamente establecidas. Por tanto, primeramente se establecen unas pro-
piedades que debe de cumplir el elemento que se seleccione y se toma la decisión
de rechazarlo o aceptarlo y de continuar o no la inspección.
Con este tipo de muestreo se requiere una muestra de menor tamaño que en los
muestreos estudiados anteriormente aunque puede haber una ligera pérdida de
representatividad respecto a estos.

3.6. Métodos indirectos de muestreo

Si podemos estimar una recta de regresión entre dos variables de una población,
con una muestra de una variable (variable independiente que obtendremos por
métodos directos como muestreo aleatorio simple, muestreo por conglomera-
dos…) podemos estimar los valores de la otra variable (variable dependiente). La
representatividad de esta muestra dependerá del coeficiente de correlación entre
las dos variables que se estudien y de la representatividad de la muestra de la va-
riable independiente.
Así, por ejemplo, conocida la relación existente entre el peso del cerebro y el peso
corporal de ciertas especies de mamíferos, podemos estimar el peso del cerebro
y ahorrarnos muchas mediciones obteniendo únicamente estimaciones del peso
corporal.

21
tema 58

matemáticas

4 Tamaño de una muestra


En el apartado anterior se ha respondido una de las dos cuestiones formuladas al
principio del tema, ¿cómo se debe seleccionar una muestra para que sea repre-
sentativa? En este apartado abordaremos la otra cuestión planteada: ¿qué tamaño
debe tener la muestra?
Antes de realizar el muestreo hemos de fijar el tamaño de la muestra con el fin de
que los gastos económicos para su realización estén dentro de nuestro presupues-
to, que el tiempo que necesitemos para realizar el muestreo sea corto y que los
resultados sean fiables. En primer lugar, se establece el tamaño de la muestra de-
pendiendo del grado de precisión que queremos alcanzar. En función del tamaño
de la muestra se obtienen los gastos que requiere y el tiempo necesario. Los gastos
y el tiempo hace que muchos estudios no se realicen con la precisión determinada
inicialmente.
Veamos en distintos ejemplos como, determinado un error y un nivel de confianza
1- α podemos calcular el tamaño de una muestra.
Ejemplo 1:
El intervalo de confianza para la media poblacional desconocida µ de una Pobla-
ción normal con σ0 conocida es:
 σ 
IC1− α ( µ) =  x ± z α ⋅ 0 
 2 n
σ0
El error es: E = z α ⋅     (1)
2 n
Fijado 1 – α, el mínimo tamaño que ha de tener la muestra para conseguir esas
condiciones se obtiene despejando n en la expresión (1):
2
 zα ⋅ σ2 
2 σ
2
E = zα ⋅
2
⇒n= 2
0 
n  E 
2
 

Observemos que el tamaño de la muestra:


„„ Será mayor cuanto mayor sea z α , es decir, mayor 1 – α.
2

„„ Será mayor cuanto menor sea E: el intervalo es más preciso para la estima-
ción.
Ejemplo 2:
 p⋅q
Si tenemos una población binomial p ≡ N  p, , y el intervalo de confian-
za de nivel 1 – α para p es:  n 

 p⋅q
IC1− α ( p) =  p ± x α ⋅ 
 2
n 

22
tema 58

matemáticas

p⋅q
El error es E = z α ⋅ . Como no tenemos n, no podemos saber p ni q, pero
2
n
1
1
si sabemos que p ⋅ q < . Así E ≤ E ′ = z α ⋅ 4 , y fijado 1 – α y E’, podemos
4 2
n
obtener el tamaño muestral mínimo para este caso:
2
1 1 1 
E ′ = z ⋅ ⋅ ⇒ n =  ⋅ z α ⋅ ( E ′ ) −1 
2 2
α
4 n
2 2 2 

„„ Si no tenemos información sobre la población, utilizamos la desigualdad de


Markov:
E [ g ( ξ) ]
P ( g ( ξ) > λ) ≤
λ
σ2
tomando g ( x ) = ( x − µ) 2 > 0 ⇒ E [ g ( x )] = E ( x − µ) 2  = V [ x ] = y
λ = ε2 >0, entonces: n

P (( x − µ) 2 > ε2 ) ≤
σ2
n ⋅ ε2
⇔ P ( x − µ > ε) ≤
σ2
n ⋅ ε2
,

lo que nos permite determinar el tamaño de la muestra necesario para asegurar


con determinada probabilidad que la media muestral no se alejará más de una
determinada cantidad de la media poblacional.
Ejemplo 3:
En el proceso de selección de una muestra aleatoria simple de una población
con una varianza conocida σ2 = 10, y media desconocida µ, vamos a calcular el
tamaño de la muestra necesario para que la media muestral esté a menos de 2
unidades de la muestra poblacional con una probabilidad de al menos 0,9:

0, 9 ≤ P ( x − µ < 2) = 1 − P ( x − µ ≥ 2) ⇒

P ( x − µ ≥ 2) ≤
σ2 10 5
= = = 0, 1 ⇒ n = 25
2 ⋅ n 4 n 2n
2

23
tema 58

matemáticas

BIBLIOGRAFÍA
ARNÁIZ VELLANDO, G.: Introducción a la Estadística Teórica. Ed. Lex Nova, 1986.
AZORÍN poch, F.: Curso de muestreo y aplicaciones. Ed. Aguilar, 1969.
GARCÍA BARBANCHO, A.: Estadística elemental moderna. Ariel Economía, 1992.
RUEDA GARCÍA, M.M.: Técnicas de muestreo en páginas web. Plácido Cuadros, 2003.
SÁNCHEZ-CRESPO RODRÍGUEZ, J.: Curso intensivo de muestreo en poblaciones finitas. I.N.E.,
1984.
VARIOS: Introducción a la estadística. UNED, 1998.

24
tema 58

matemáticas

RESUMEN

Población y muestra.
Condiciones de representatividad de una muestra.
Tipos de muestreo.
Tamaño de una muestra.

1.
1 Población y muestra
Se denomina población a todo conjunto de elementos que tienen unas características co-
munes. Debido al hecho de que no siempre es posible analizar todos los elementos de una
población, se selecciona un subconjunto de ésta que se denomina muestra. La operación
de seleccionar una muestra se llama muestreo.

2.
2 Condiciones de representatividad de una muestra
Para poder obtener conclusiones razonables a partir de una muestra debemos prescindir de
las muestras seleccionadas según opiniones o criterios personales y cuantificar los errores
de muestreo. Es decir, una muestra debe ser representativa de la población. Esto depende
de dos aspectos fundamentales: de su tamaño y de cómo se realiza el muestreo.

3.
3 Tipos de muestreo

3.1. Muestreo aleatorio simple


Selección de n elementos de la población de modo que en cada extracción cada elemento
tenga la misma probabilidad de ser elegido.

3.2. Muestreo aleatorio estratificado


La población se divide en grupos homogéneos que se denominan estratos y posteriormen-
te se extrae una muestra aleatoria simple en cada estrato.

3.3. Muestreo aleatorio sistemático


La muestra sistemática se realiza cuando los elementos están ordenados en listas y se
toma eligiendo al azar un elemento entre los k primeros (siendo k el entero más próximo
al cociente entre el tamaño de la población y el tamaño de la muestra) . Sea i el orden del
elegido. Tomamos a continuación los elementos i + k, i + 2k, ..., a intervalos fijos de k hasta
completar la muestra.

3.4. Muestreo polietápico, por áreas o conglomerados


Se divide la población en diferentes secciones o conglomerados y se elige al azar unas
cuantas secciones para formar la muestra.

25
tema 58

matemáticas

3.5. Muestreo secuencial o muestreo sobre calidad


En un muestreo secuencial las unidades de muestreo son examinadas progresivamente
hasta llegar al punto en que se tiene suficiente información como para dar el resultado con
las probabilidades de error previamente establecidas.

3.6. Métodos indirectos de muestreo


Si podemos estimar una recta de regresión entre dos variables de una población, con una
muestra de una variable podemos estimar los valores de la otra variable.

4.
4 Tamaño de una muestra
Antes de realizar el muestreo hemos de fijar el tamaño de la muestra con el fin de que los
gastos económicos para su realización estén dentro de nuestro presupuesto, que el tiem-
po que necesitemos para realizar el muestreo sea corto y que los resultados sean fiables.
Determinado un error y un nivel de confianza 1- α podemos calcular el tamaño de una
muestra.

26