You are on page 1of 9

Muestreo Estratificado.

1.- Introduccin:
Para aplicar este diseo, se precisa que la poblacin est dividida en subpoblaciones, estratos, que no se solapen. Se selecciona una muestra probabilstica en cada estrato y se trabaja de manera independiente entre estratos. Razones de la popularidad de este mtodo: Permite realizar estimaciones de precisin expecifica en cada estrato; En un experimento, los aspectos prcticos relacionados con la respuesta, la medida o la informacin auxiliar pueden diferir considerablemente de una subpoblacin a otra. Existirn razones administrativas, divisin territorial, ... . Cuestiones tcnicas que plantea este muestreo: i) Construccin de Estratos: Los objetivos del estudio y los recursos disponibles contestarn las siguientes cuestiones Qu caractersticas utilizar para dividir la poblacin en estratos?; Cmo se identificarn los estratos?; Cuntos estratos debe haber?. En particular, los estratos deben estar constituidos por unidades lo ms homogeneas posibles; En el caso lmite de estricta homogeneidad bastara seleccionar una sola unidad en cada estrato ii) Eleccin de una muestra y mtodos de estimacin en cada estrato; El proceso de muestreo se realizar de manera independiente en cada estrato Ventajas de este diseo: i) Si las mediciones dentro de cada estrato son homognes, la estratificacin producir un lmite ms pequeo para el error de estimacin que el m.a. ii) Se puede reducir el costo por observacin al estratificar la poblacin en grupos convenientes. iii) Permite obtener estimaciones de parmetros poblacionales para subgrupos de la poblacin. Ejemplos: Ciudades i) El I.P.C. se obtiene a partir de encuestas a: Familias urbanas Empresas de bienes y sevicios

Bienes y servicios especficos ii) Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea rural 93.

2.- Notacin y Definiciones:


Definicin: Dada una poblacin U y 1 , . . . , y N , se entiende por estratificacin una particin de U en L subpoblaciones llamadas estratos, U 1 y 11 , . . . , y 1N 1 y k / k U 1 , . . . , U L y 11 , . . . , y 1N L y k / k U L , verificndose que N 1 . . . N L N.

Notacin: Muestra total s s 1 . . . s L / s i muestra en el estrato i-simo. Parmetros: y k y k N h y U h h

h1

kU
Nh N

h1kU h
L

h1
Nh N

h1

y U h W h y U h / W h
h1

tamao relativo del estrato.


nh Nh

Tamao relativo de la muestra en el estrato h: f h

3.- Estimadores.
-estimador:
h ; Puesto que la seleccin en los distintos estratos se realiza de manera
h1 L

independiente 1 , . . . , L son independientes. Var Var Var h Var h


h1 h1 L L

Nota: Este mtodo teien gran aplicacin ya que no precisa que el diseo muestral sea el mismo en cada estrato,

3.1 Muestreo Aleatorio Simple en los L estratos:


i) st
h1 L L

ks h

yk nh

Nh ;
2 h ; 2 S h .

Var st Var st
L h1 h1 L

N2 h 1f h nh N2 h 1f h nh

ii) P st W h P h ;
h1

VarP st W 2 h VarP st W 2 h
h1 h1 L

1f h nh 1f h nh

N h P1P N h 1

; .

P h 1P h n h n h 1

3.2 Muestreo Aleatorio Simple con reemplazamiento en los L estratos:


st
h1ks h L yk nh L

Nh;
N2 h nh N2 h nh

Var st Var st
h1 h1 L

2 h;
2 S h

4.- Afijaciones:
La obtencin del tamao muestral n se realiza en base a las condiciones del experimento o a la fijacin de la precisin deseada. La afijacin trata de repartir el tamao muestral n entre los estratos. Factores generales a tener en cuenta: Tamao del estrato; Variabilidad entre estratos; Costo que tiene medir una observacin en cada estrato.

4.1 Afijacin Uniforme:


i) Conocido n : n , por tanto Se asigna el mismo nmero de unidades muestrales a cada estrato, n h L favorece la representacin de los estratos pequeos y perjudica la de los grandes. ii) Consideracin de costes: Fijado C C 0 C h n h n
h1 L C C 0 L

C h
h1

4.2 Afijacin Proporcional.


Se precisa conocer N h h1,...,L ; i) Conocido n : nh Nh n N n h nW h . Por tanto, todos los elementos de la poblacin tienen la misma probabilidad de aparecer en la muestra. Nota: Esta afijacin es ptima siempre que la variabilidad de la respuesta en los estratos sea casi la misma. ii) Consideracin de costes: Fijado C C 0 C h n h
h1 L Ejercicio

C C 0

C h W h
h1

iii) Proporcional al total: Si la variable Y es positiva n h constante en todos los estratos.

y k y k
U Uh

; Esta afijacin es ptima si CV U h es

4.3 Afijacin de Mnima Varianza, suponiendo m.a.s. en todos los estratos:


i) Conocido n : Consiste en determinar los n h h1,...,L de forma que para un tamao de muestra fijo la L varianza del estimador sea mnima min Var n h n ; nh h1 N Si n h n L h h ;

N h h
h1

Observaciones: 1- Los valores de n h son proporcionales a los productos N h h y cuando h h n h nW h . Por esto se dice que es la afijacin de mnima varianza, si todos los estratos tienen la misma variabilidad respecto de la caracterstica en estudio.

2- Esta afijacin tiene el inconveniente de que precisa estimar mayor nmero de caractersticas poblacionales: h h1,...,L . 3- La utilidad de esta afijacin reside en los casos en los que hay gran diferencia en la variabilidad de la respuesta entre estratos ii) Consideracin de costes: Fijado C C 0 C h n h :
min
nh L Var C 0 C h n h C h1 CC 0
Wh h Ch h

h1

Si st n h

W
h h 1

Ch

No fijado C :
L min Var C 0 C h n h nh h1 W Si st n h h h Ch

Fijado B y K, el error de estimacin para una confianza dada), y no fijado C :


min
nh

C h n h Var V o
h1
Wh h Ch

; Vo B k
Ch

Si st n h h?.

W
h h 1 L

B2 K2

1 N

h 1

.Cunto valdr n?. Qu pasa si C h cte.

2 Wh h

4.4 Afijacin ptima correlada.


Sea X una v.a. altamente correlada con Y, la variable de inters. Supongamos que se conoce . X Uh Se toma: nh n
Nh X U
h

h1

Ejercicio: Justificar por qu es razonable esta solucin

Nh X Uh

: Supongamos m.a.s. en los L estratos

5.- Determinacin de n fijados B y K : h w h nnh , NN 1 h 1

st : n

h 2 W wh h h1 B2 K2 2 Wh h N h h1 h 2 N wh h L 2 L 2

Si Afijacin Proporcional: w h W h ; Si Mnima Varianza: wh


Nh h

st : n

h1 B2 K2

2 h Nh h1

N h h
h1

P st : n
B2 K2 h1

W2 h wh l

Nh N h 1

P h 1P h
Nh N h 1

P h 1P h WNh
h1

Ejercicio: Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea rural 93. Una encuesta previa sugiere que las varianzas de los estratos son 2 2 2 1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una confianza del 95% y unas fracciones de tamaos muestrales w i 1 ; i 1, 2, 3. 3 Si ademas se sabe que el coste por observacin en cada pueblo es de 9 euros y en el rea rural de 16 euros, encontrar los tamaos de muestra que permitan estimar a la empresa, con un coste mnimo, el tiempo medio que se ve la televisin.

6.- Comparaciones en la precisin de los estimadores.


i) Consideremos muestreo aleatorio con reemplazamiento en cada estrato: L 2 Afijacin Proporcional Var stcon Whn h Var con
2 n h1 L Afijacin Proporcional

h1

Wh2 h n

h1

W h y h y 2 n

ii) Consideremos m.a.s. en cada estrato: L Afijacin Proporcional 1f 2 Var st Wh h n


h1
2 Var 1 f n

Afijacin Proporcional

Var st

1f nN1

Nh y h y
h1

1 N

N
h1

Conclusiones: a) Si las medias de los estratos son iguales o casi iguales, puede ocurrir que el diseo estratificado con afijacin proporcional de resultados menos precisos que m.a.s. Qu pasa si y h y h?. b) La afijacin de mnima varianza siempre proporciona un estimador ms preciso que la afijacin proporcional; si h h, coinciden los errores de muestreo.

7.- Ejercicios.
7.1 El servicio cultural de la Junta de Castilla y Len desea conocer qu servicio prestan las bibliotecas existentes en la Comunidad y la utilizacin que de ellas hacen los ciudadanos. Por ello, de las N217 bibliotecas existentes (N 1 131 pblicas y N 2 86 privadas) se elige en cada estrato, cada semana y de forma aleatoria, a una de ellas y se anota el nmero de libros prestados en dicha semana. Se observa que al final del ao se prestaron un total de 11.360 libros en las 52 bibliotecas pblicas seleccionadas y 14.413 libros en las respectivas bibliotecas privadas. Las respectivas variabilidades muestrales fueron, en las bibliotecas 2 2 pblicas, s 1 1.415,2 y en las privadas s 2 12.978,5 a) Es el muestreo en cada estrato con o sin reposicin?. b) Determinar el nmero promedio estimado de libros que presta una biblioteca Castellano-Leonesa en una semana. Hallar un intervalo de confianza del 95%. ( ). c) La Junta desea tambin conocer cul es la proporcin de bibliotecas que prestan en promedio ms de 300 libros por semana. En las pblicas, slo 8 de las 52 bibliotecas prestaron en la semana observada ms de 300 libros, mientras que 29 bibliotecas privadas sobrepasaron esta cifra. Dar una estimacin del porcentaje de bibliotecas que en promedio prestan ms de 300 libros por semana y hallar la varianza estimada correspondiente. Solucin: a) El muestreo debe ser con reposicin. 2 11360 86 14413 217 241. 7; b) st W h y h 131 217 52 52 Var st
h1 h1 2 W2 h nh 2 S h 49. 12

Intervalo de confianza del 95% 241. 7 1. 96 49. 12 . c) VarP st


h1 2 W2 h n h 1

P st W h P h
h1

131 8 217 52

86 24 217 52

0. 314;

Ph

1 P h

0. 0017.

Intervalo de confianza del 95% 0. 314 1. 96 0017 . 7.2 Una escuela desea estimar la calificacin promedio que puede ser obtenida en un examen de comprensin de lectura por estudiantes de 6 de E.G.B. Los alumnos de la escuela son agrupados en 3 estratos, los que aprenden rpido en el estrato I, los que aprenden lento en el estrato III y el resto en el estrato II. La escuela decide esta estratificacin porque de esta manera se reduce la variabilidad en las calificaciones del examen. El 6 curso de E.G.B. contiene 55 alumnos en el estrato I, 80 en el estrato II y 65 en el estrato III. El examen se aplica a la muestra de 50 alumnos utilizando afijacin proporcional, y se obtienen los siguientes resultados: Estrato I Estrato II Estrato III yi : 79.71 64.75 37.44
2 s 105.14 158.2 186.13 i : a) Estimar la calificacin promedio para este curso. b) Habra sido conveniente utilizar afijacin de mnima varianza?. c) Encontrar el tamao de muestra requerido para estimar la calificacin promedio, con un lmite de 3.92 puntos para el error de estimacin (con una confianza del 95%). Usar

asignacin proporcional. d) Repetir el apartado c) usando ahora la asignacin de mnima varianza. Comparar los resultados con los del apartado c). Solucin: n 1 13. 75 14 Ni Afijacin proporcional n i 50 N n 2 20 20 n 3 16. 25 16 a) Estimadores: st W h h ; Var st
h1 3 h1 3 3 W2 h 1f h nh 2 S h / Wh Nh N

Estimaciones: st W h y h 59. 98; Var st 2. 28; B 1. 96 2. 28 2. 96 Intervalo de confianza del 95% 59. 98 2. 96 b) Para resolver esta cuestin lo que se debera hacer es un contraste de homogeneidad de las varianzas entre estratos. Si no la respuesta se basa en la comparacin visual de 2 s i :105.14, 158.2, 186.13. h W h / h 1, 2, 3; c) Afijacin proporcional w h nnh N N
h 2 W wh h L 2 2 W h h L

h1

Como el parmetro de inters es n


B2 K2

h1

h1

2 2 Wh h N h

B2 K2

h1

estimacin

h1

2 2 Wh h N h

32. 05 33

n 1 33 n 2 13 n 3 11

55 200

d) Afijacin de mnima varianza implica estimar w h

nh n

Nh h

w 1 0. 23
W2 h wh L 2 h 2

h1

w 2 0. 41 w 3 0. 36 31. 7 32

Nh h
L

Como el parmetro de inters es n


B2 K2 h1

2 Wh h N h h1

n 1 33 w 1 7 n 2 13 w 2 13 n 3 11 w 3 12 7.3 Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, B 62 y el rea rural 93. Una encuesta previa sugiere que las varianzas de los estratos son 2 2 2 1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una ; i 1, 2, 3. confianza del 95% y unas fracciones de tamaos muestrales w i 1 3

Solucin:
h 2 N wh h L 2

Frmula L 3; w i 1 3 N 3 93 n

general

h1 B2 K2

h1

;
2 h Nh

En

este

caso . N 2 62,

2 2 2 ; N 1 155, 1 25, 2 225, 3 100, i1,2,3 6991.275 56. 7, es decir n57n i n w i 19; i 1, 2, 3 123.225

8.- Programas.
Obtencin del tamao de muestra fijado un error de estimacin B y una confianza k:
Programa estranp.m: Permite obtener el tamao de muestra n fijado el error de estimacin, por ejemplo B 0. 05 y la confianza, por ejemplo k 1. 96. El diseo considerado es muestreo estratificado con L estratos y m.a.s. en cada estrato. Se supone que la afijacin es proporcional. El objetivo es estimar una proporcin poblacional P. function [n, nh]estranp(B,k,Ni) Lmax(size(Ni)) Ni2Ni-1 Ni3Ni./Ni2 Nsum(Ni) WiNi/N aux1Wi.*Ni3*0.25 n0.25*sum(aux1)/((B^2/k^2)0.25*(sum(aux1)/N)) nhn*Wi

Resolucin con MATLAB del ejercico 7.1:


Programa estra71.m: %Datos: %Tamaos de los estratos [Bibliotecas Pblicas, Privadas] Ni[131 86] %Tamaos de muestra [Bibliotecas Pblicas, Privadas] ni[52 52] %Total de libros prestados [Bibliotecas Pblicas, Privadas] ti[11360 14413] %Cuasiarianzas muestrales si2[1415.2 12978.5] %Solucion apartado b) %Nmero medio de libros prestado por semana muiti./ni %Pesos relativos de los estratos Nsum(Ni) WiNi/N %Estimacin de la media muestsum(Wi.*mui) %Estimacin del error de muestreo Wi2Wi.^2 varmusum((Wi2.*si2)./ni)

errormusqrt(varmu) %Intervalo de confianza del 95% icmu[muest-1.96*errormu, muest1.96*errormu] %Solucion apartado c) %Numero de semanas que prestan mas de 300 libros [Bibliotecas Pblicas, Privadas] Ai[8 29] PiAi./ni %Estimacin de la proporcion Pestsum(Wi.*Pi) %Estimacion del error de muestreo sp2Pi.*(1-Pi) varpsum((Wi2.*sp2)./(ni-1)) errorpsqrt(varp) %Intervalo de confianza del 95% icp[Pest-1.96*errorp, Pest1.96*errorp]