Muestreo, Estadistica

ESTADSTICA ESPAOLA
Vol. 40, Nm. 143, 1998, pgs. 5 a 31
Muestreo sistemtico con intervalo

de seleccin variable
por
GONZALO SNCHEZ-CRESPO BENITEZ
Delegacin del INE en Cantabria
Telfono: 942-216638
Correo electrnico: gsanchez@ine.es
RESUMEN
Este documento propone un nuevo sistema para seleccionar
muestras probabilsticas utilizando muestreo sistemtico con intervalo
de muestreo variable. Para ello, se define formalmente el procedimiento clsico de seleccin, utilizando intervalo de muestreo constante. Se incluye un ejemplo, resuelto con hoja de clculo, con datos
sencillos para comprender mejor el procedimiento. Despus se introduce, en trminos similares, el procedimiento propuesto de seleccin
con intervalo de muestreo variable. Entroncando con ciertos procedimientos de seleccin existentes en la literatura sobre Muestreo en
Poblaciones Finitas, se realiza una aplicacin de diferentes mtodos
al marco de la Encuesta de Hoteles en la Comunidad Autnoma de
Cantabria, bajo la perspectiva de los denominados modelos de superpoblacin. Por ltimo, se hace una referencia a un nuevo programa de ordenador, POSDEM(1), que hemos realizado, entre otros fines, para auxiliar en el proceso de diseo de encuestas por muestreo
probabilstico en poblaciones finitas.
(1) Programa para Optimizar la Seleccin en el Diseo de Encuestas por Muestreo. En su
versin Windows este programa se ha desarrollado en colaboracin entre Alberto Lezcano y el
autor de este artculo.
ESTADSTICA ESPAOLA
Palabras clave: Muestreo sistemtico. Intervalo variable. Modelo de

superpoblacin. Mtodos de seleccin de muestras. Aplicacin informtica: POSDEM.
Clasificacin AMS: 62D05
1. MUESTREO SISTEMTICO CON INTERVALO CONSTANTE

El muestreo sistemtico tiene como objetivo conseguir, con un mtodo sencillo
de aplicacin, un efecto similar al obtenido con la estratificacin y extender la
muestra a toda la poblacin. Se puede observar como en la prctica de las encuestas por muestreo se aplica con frecuencia la tcnica del muestreo sistemtico.
Esto es debido a las ventajas operacionales que presenta este mtodo y a ciertas
propiedades que verifica bajo determinadas supuestos. Sus principales ventajas
son: su facilidad de aplicacin; recoge un posible efecto de estratificacin; extiende
la muestra a toda la poblacin; si las unidades de muestreo se ordenan conforme a
una variable conocida y relacionada estructuralmente con la variable de estudio, se
pueden obtener grandes ganancias en precisin. Para que este mtodo sea efectivo necesita que los elementos de la poblacin se puedan ordenar con un criterio
relevante para la investigacin y no introducir regularidades ocultas.
Con esta tcnica se obtienen tantos estratos o grupos como elementos se
quieran incorporar a la muestra. La muestra estar formada en este caso con un
elemento de cada estrato. Esta muestra se puede considerar como un conglomerado.
Este mtodo consiste en, una vez ordenadas las unidades de la poblacin, dividir la poblacin en n grupos iguales de tamao k, de forma que N/n=k. Despus,
seleccionar aleatoriamente un elemento del primer grupo y los sucesivos elementos
que ocupen la misma posicin.
Como ejemplo utilizaremos una poblacin marco, esto es, la recopilacin de toda la informacin relevante sobre la poblacin que deseamos investigar con una
encuesta por muestreo, donde los valores de la variable en cada unidad coincide
con el valor que las identifica.
Sean las unidades U(i) = i donde X(i) = i con i = 1,...N y N=12. Se puede considerar, para introducir la aplicacin que se realizar a datos de la Comunidad Autnoma de Cantabra, que cada unidad, U(i), representada por un nmero correlativo,
es un establecimiento hotelero de ms de dos estrellas de plata y menos de cien
habitaciones. Y que el valor de la variable medida en cada unidad, X(i), representa
MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE
el nmero de plazas declaradas. Las unidades estn ordenadas conforme al valor

de la variable nmero de habitaciones.
Si fijamos un tamao de muestra de 4 unidades, se proceder de la siguiente
forma: para dividir la poblacin en grupos se obtiene el valor k = 12/4 = 3 perodo
que se utiliza para dividir la poblacin en n=4 grupos iguales. Esto es, el nmero de
unidades de la poblacin dividido por el nmero de unidades de la muestra.
Se selecciona en el primer grupo uno de los 3 elementos con probabilidad
1 1
=
k 3
Por ejemplo, si el aleatorio entre 1 y 3 es el valor 2, ste condicionar el resto
de la muestra, que estar configurada por aquellos elementos que ocupan, en los
otros grupos, la misma posicin relativa. As, la muestra quedara compuesta por
los siguientes elementos: 2, 5, 8, 11.
Se han seleccionado las unidades U( 2 ) , U( 2+k ) , U( 2+ 2k ) , U( 2+3k )
// 1 2 3 // // 4 5 6 //
// 7 8 9 // // 10 11 12 //
El mtodo de seleccin sistemtica con intervalo de muestreo constante puede

definirse de una manera formal utilizando la siguiente notacin: la seleccin se lleva
a cabo obteniendo un nmero aleatorio entre 1 y k, que denominaremos i. Este
nmero permite determinar la primera unidad que figurar en la muestra. Las n-1
unidades restantes se seleccionan de forma que:
zc= i+ (j-1) k
Donde
zc = Valor que identifica las unidades seleccionadas con intervalo constante
i = Nmero aleatorio de seleccin. Entre 1 y k
j = Nmero correlativo entre 1 y n. Donde n es el tamao de muestra.
k = Tamao de los grupos formados para la seleccin. k= N/ n
ESTADSTICA ESPAOLA
Se puede seguir un ejemplo, en el anexo 1, utilizando una hoja de clculo. En

este ejemplo se forma el espacio muestral, se estiman las principales caractersticas de cada muestra y sus errores de muestreo.
Este mtodo tiene la ventaja de extender la muestra a toda la poblacin. Tambin recoge el posible efecto de estratificacin. Por otra parte, este mtodo tiene el
inconveniente de que, con los datos de una sola muestra, se plantea un problema
para estimar el error debido al muestreo.
En el caso del muestreo aleatorio sin reposicin, la varianza debida al muestreo
viene dada por la expresin:
n S2
= 2.16
V( x sr ) = 1
N n
En el caso de muestreo sistemtico, la varianza viene dado por la expresin:

k
2
( x i X)
= 0.67
V( x sis ) = i = 1
k
Donde i representa la muestra i-sima.

Por otra parte, es tambin interesante la comparacin del muestreo sistemtico
con el muestreo estratificado aleatorio con una unidad por estrato. Para obtener la
varianza del estimador media, en el caso de que la seleccin de las unidades que
forman la muestra se obtengan mediante un procedimiento de muestreo estratificado con una unidad por estrato, se puede utilizar la expresin:
N n S2st
= 0,16
V( x str ) =
N n
Donde
S2st =
n k
1
xij x j
n(k 1) j = 1i = 1
con j representando el estrato j-simo.

En resumen tenemos, en este ejemplo, que el mtodo ms preciso es el muestreo estratificado con una unidad por estrato, seguido del muestreo sistemtico con
intervalo constante y por ltimo el muestreo sin reposicin. Este resultado era
previsible y puede verse un desarrollo ms formal en la obra de Cochran, 1977,

para el caso de poblaciones con tendencia lineal. nicamente se ha llevado a cabo
con el nimo de introducir en la seccin siguiente el procedimiento propuesto de
intervalo variable y poder realizar una ilustracin comparativa de los resultados.
Por otra parte, en el anexo 1, tambin podemos observar el problema que se
presenta de estimacin de varianzas al aplicar muestreo sistemtico. Mientras que
la varianza de la media es 0.67, cuya raz cuadrada es el error de muestreo, la
media de las varianzas sobre todas las muestras, de haber aplicado el supuesto de
orden aleatorio y haber calculado el error en base al muestreo aleatorio sin reposicin, hubiese proporcionado un valor de 2.5. Un mtodo ms ajustado a los datos
que se estn manejando en este ejemplo es mediante la denominada tcnica del
lazo, que consiste en unir dos unidades prximas como parte de una muestra
estratificada de tamao dos. Para este caso, la media de las varianzas pasara a
ser del valor 2.5 al valor 0.75, ms prximo al valor objetivo de 0.67. En la literatura
sobre teora del muestreo en poblaciones finitas se pueden encontrar otros mtodos para resolver el problema de la estimacin en el muestreo sistemtico.
2. MUESTREO SISTEMTICO CON INTERVALO VARIABLE

Entre los inconvenientes del muestreo sistemtico con intervalo constante se
citan la posibilidad de prdidas en precisin debidas a periodicidades ocultas,
siendo especialmente sugeridas precauciones en el caso de la existencia de ciclos
en la poblacin. Este tipo de poblaciones(2) son ms frecuentes de lo que se piensa
en la prctica de las encuestas por muestreo. Un ejemplo de esta situacin es
cuando el marco de unidades es producto de una operacin censal y dentro de los
hogares figuran sus miembros en padres e hijos por orden de edad. Si los grupos
son de una tamao similar y el intervalo de muestreo coincide con esta periodicidad, el muestreo sistemtico sera muy ineficaz. En este trabajo hemos planteado
un mtodo que tiende a eliminar, no slo el efecto tendencia, que estaba ya en la
literatura sobre muestreo (ver muestreo sistemtico centrado de Madow, correcciones de Yates, muestreo sistemtico equilibrado y muestreo modificado) sino que
tiende a eliminar tambin el efecto cclico, de forma que para corregirlo no es
necesario conocer a priori su existencia o sus caractersticas.
El muestreo sistemtico con intervalo variable es un mtodo que persigue aumentar la heterogeneidad interna de la muestra. Esto es, aumentar la variabilidad
interna de la muestra. Este mtodo consiste en seleccionar la muestra con un inter-
(2)
Ver Murthy M.N., 1967 pg.157
10
ESTADSTICA ESPAOLA
valo de muestreo variable que tenga como consecuencia un efecto de movilidad

dentro de cada estrato. Se pretende compensar las posibles distorsiones introducidas
al utilizar, en el esquema de intervalo constante, el mismo lugar relativo.
Ahora podemos introducir el mtodo con intervalo variable con una regla para
seleccionar las n-1 unidades restantes de la muestra. As, con una notacin similar
a la empleada anteriormente:
zv= i+ (j-1)(k+1) - c k
zv= Valor de la unidad muestral seleccionada con intervalo variable
Donde, por definicin, los valores que toma c vienen dados por las siguientes
situaciones:
Si zv=jk no ha sucedido nunca c=0
Si zv=jk ha ocurrido una vez c=1
Si zv=jk ha ocurrido dos veces c=2 ....
As, c= 0,1,2 ... de acuerdo con el nmero de veces que ha ocurrido que el valor
de zv ha sido igual al producto de j por k .
Este mtodo aplicado a datos del tipo Xi =i donde i=1,2,...N, con N cualquier
nmero natural, presenta un caso de muestras equilibradas cuando el tamao de
muestra es igual a la raz cuadrada del tamao de poblacin. En este caso, el error
debido al proceso de muestreo es cero. Esto es, sea cual sea la muestra seleccionada, la estimacin de la media coincide con la media poblacional.
En el anexo 1 se pueden observar los resultados de este mtodo aplicado a los
datos del ejemplo con intervalo constante, utilizando el mismo esquema de hoja de
clculo empleado antes. Para comprender mejor el mtodo de seleccin propuesto,
se incluye, en el anexo 2, un ejemplo con una poblacin un poco mayor que la
utilizada en la ilustracin de la hoja de calculo.
En precisin destaca una mejora importante, puesto que de una varianza del
estimador de 0.67 se ha pasado a un valor de 0.04. Por contra, la estimacin
esperada en base a la informacin proporcionada por cada muestra mediante la
tcnica del lazo empeora puesto que de 0.75 pasa a 0.97. El problema de la estimacin de la varianza en base a los datos de una sola muestra sistemtica y las
distintas alternativas de actuacin no se van a tratar de en este artculo, formarn
parte de una segunda entrega.
11
3. COMPARACIN ENTRE DIFERENTES MTODOS

Existe un gran nmero de mtodos de seleccin de muestras inspirados en los
principios del muestreo sistemtico, en funcin de las diferentes variantes que se
pueden considerar al establecer la regla de relacin entre las unidades seleccionadas. Siguiendo a Bellhouse y Rao (1975:694-697) hemos llevado a cabo un anlisis
del comportamiento de diferentes mtodos de seleccin de unidades muestrales
ante cambios en las especificaciones de los modelos. La evaluacin se ha realizado sobre diferentes procedimientos sistemticos de seleccin en el caso de modelos de superpoblacin polinmicos de grado entre uno y tres, calculando los valores
esperados del error cuadrtico medio del estimador sobre un conjunto de realizaciones aleatorias.
Nuestro foco de atencin se ha orientado al comportamiento errtico observado
en el mtodo centrado cuando aumenta el tamao de muestra y a la cuestin de no
tener que diferenciar entre valores pares o impares del nmero de grupos, k=N/n ,
que se forman en la poblacin. Hasta el momento slo el mtodo corregido en los
extremos de Yates eliminaba la tendencia lineal para valores pares o impares del
tamao de muestra o del nmero de grupos en la poblacin. El mtodo centrado de
Madow no elimina la tendencia cuando k es par. Hemos comprobado, tambin,
que cambios en la especificacin del trmino de error pueden suponer que los
mtodos centrados sean inestables frente a los restantes mtodos considerados.
En este apartado vamos a considerar los siguientes mtodos: estratificado con
una unidad por estrato (M_St_nh=1); sistemtico con intervalo de seleccin constante (S_isc); centrado de Madow (C_isc); corregido en los extremos de Yates
(Corr_extr.); sistemtico equilibrado;y sistemtico modificado. A estos mtodos
clsicos se han incorporado dos novedades: el primero es un mtodo que hemos
definido como sistemtico con intervalo de muestreo variable (S_isv); y, el segundo, y verdadero objeto de esta comunicacin, que consiste en aplicar el anterior al
mtodo centrado propuesto por Madow, a este mtodo lo hemos denominado:
sistemtico centrado con intervalo variable
nicamente aclarar que el mtodo C_isv limita el espacio muestral, cuando k
es par, a las dos muestras centrales con probabilidad un medio cada una, y en el
caso k impar a las tres centrales, con probabilidad un tercio. Esta es la primera
diferencia con el mtodo C_isc, la segunda, y ms importante es que la seleccin
se realiza aplicando un algoritmo de intervalo variable, que mantiene las probabilidades de cada unidad y que proporciona al mtodo una mayor coherencia en
cuanto a precisin y estabilidad. Para valores de k=2 y k=3 el mtodo C_isv coincide con con el mtodo S_isv.
12
ESTADSTICA ESPAOLA
Una descripcin de los restantes mtodos y sus implicaciones en modelos de

superpoblacin bajo diferentes supuestos sobre la forma de la poblacin puede
encontrarse en el libro de P.R. Krishnaiah y C.R. Rao, y en el artculo de D.R.
Bellhouse y J.N.K Rao citados en las referencias.
Dejamos para otro momento la comparacin entre el mtodo centrado con intervalo variable y los mtodos con probabilidades proporcionales al tamao. Adelantamos que es posible realizarla, en los mismo trminos que la actual, utilizando la
aplicacin POSDEM. Tambin es posible analizar el comportamiento de los mtodos considerados en presencia de poblaciones con variaciones cclicas, diferencias en los trminos de error y presencia de heterocedsticidad de la perturbacin
aleatoria.
4. RESULTADOS A TRAVS DE MODELOS DE SUPERPOBLACIN

Utilizando la aplicacin POSDEM vamos a modelar el comportamiento de una
poblacin para estudiar el error cuadrtico medio del estimador y su propia variabilidad para diferentes mtodos respecto del modelo. Este enfoque surge de la
necesidad de inferir resultados ms all de lo que representa el anlisis de una
nica poblacin natural, consecuencia de una determinada realizacin.
En este artculo nos vamos a interesar por el comportamiento de los diferentes
mtodos, no para cada caso aislado, sino para la situacin en la cual las especificaciones, que hacemos sobre el grado del polinomio o el tamao de muestra,
puedan no ser estrictamente correctas. En la medida que, al apartarnos de una
determinada especificacin, el mtodo sea ms inestable nos encontraremos con
mtodos menos robustos. La poblacin marco esta formada por 264 unidades,
establecimientos hoteleros, correspondientes a la Comunidad Autnoma de Cantabra, caracterizados y ordenados segn el nmero de habitaciones, la variable de
estudio ha sido la capacidad del hotel segn nmero de plazas. Esta poblacin se
ha considerado para ajustar diferentes modelos polinmicas de grado entre uno y
tres. Nuestra intencin es comprobar como afectan al error cuadrtico medio los
cambios en la especificacin del modelo o los cambios en el tamao de muestra.
Con la aplicacin POSDEM podemos estimar los parmetros de un modelo de
superpoblacin con el modulo que hemos denominado clculo de estructuras de
poblacin.
13
Figura 1
MDULO PARA EL CLCULO DE ESTRUCTURAS DE POBLACIN EN

POSDEM. MODELOS DE SUPERPOBLACIN
En primer lugar vamos a obtener los valores de los parmetros y del trmino de
error que mejor se ajustan a la poblacin que estamos estudiando. As tendremos:
Xi= a0 + a1 i1+ a2 i2+ a3 i3 + ei
donde
i representa las unidades de la poblacin y en este caso toma los valores de 1
a 264.
ai con i=1,2, y 3 son los parmetros de la ecuacin calculados inicialmente por
mnimos cuadrados, pero que pueden ser definidos con otros procedimientos.
ei es el trmino de error aleatorio que en este modelo se ha definido distribuido
normal con parmetros: media cero y desviacin tpica dos.
14
ESTADSTICA ESPAOLA
Em(ei) = 0; Em(ei2) =2; Em (ei ej ) = 0 el operador Em denota la esperanza respecto del modelo.
Con esta ecuacin podemos simular un conjunto de poblaciones finitas similares
a la poblacin original y calcular para cada una de ellas el error cuadrtico medio
del estimador para cada mtodo de seleccin utilizado. En la siguiente tabla tenemos la esperanza sobre el modelo del error cuadrtico medio calculado sobre un
conjunto de doscientas poblaciones finitas generadas mediante una ecuacin
polinmica de grado tres y un componente aleatorio distribuido normal.
Tabla 1
ESPERANZA DEL ERROR CUADRTICO MEDIO
n=2
n=3
n=4
n=12
n=22
n=44
n=66
n=132
M_St_nh=1
226,603.50
378.20 101.20
52.70
16.00
S_isc
324,073.50 150,973.00 86,567.40 9,872.90 3,046.60 762.00
313.20
70.70
S_isv
320,827.10 145,310.60 79,823.30 3,273.80
77,403.10 34,714.00 1,624.50
87.90
39.60
14.70
3,613.90
1,786.54
376.80
241.70 112.30
99.70
70.70
12,411.80
3,545.70
1,680.67
329.00
165.40
79.40
46.70
14.70
53,339.20
14,426.60
5,934.09
398.90
184.10
74.40
44.50
12.60
Equilibrado
123,466.20
63,178.00
8,698.90
396.40
176.10
75.70
46.40
14.70
Modificado
123,466.20
19,622.90 30,014.80 3,440.20 1,143.50 305.20
144.20
37.40
C_isc
12,264.60
C_isv
Corr_extr.
277.50
Dejamos para ms adelante el comentario de los mtodos equilibrado y modificado. En los grficos siguientes observamos como el mtodo centrado de Madow
(para k par) y el mtodo corregido de Yates presentan un comportamiento diferente
segn el tamao de muestra: para muestras pequeas C_isc es preferible a
Corr_extr. y cuando la muestra aumenta esta relacin se invierte. Aqu destacamos como el mtodo C_isv se ajusta en cada caso al mejor de los dos.
15
Grfico 1
ESPERANZA RESPECTO DEL MODELO DEL ERRROR CUADRTICO MEDIO
En segundo lugar vamos a observar la varianza respecto del modelo del error
cuadrtico medio. En la siguiente tabla tenemos el error cuadrtico medio obtenido
en cada poblacin finita, su valor esperado, su varianza y un indicador de la cota
superior del error que hemos definido como la esperanza mas dos veces la desviacin respecto del modelo.
Tabla 2
ESPERANZA Y VARIANZA DEL ERROR CUADRTICO MEDIO PARA UNA DESVIACIN DE LA PERTURBACIN ALEATORIA IGUAL A DOS Y UN TAMAO DE
MUESTRA IGUAL A CUATRO
E
I=E+2*D
Pf1
Pf2
...
Pf200
C_isc
1,786.54 2,579.44
4,998.67
1,534.43
984.14
...
1,971.18
C_isv
1,680.67 2,800.78
5,027.78
1,234.21
248.46
...
3,734.82
6,940.80
6,379.52
6,781.69
...
5,578.48
Corr_extr. 5,934.09
253.36
Podemos observar en el siguiente grfico como la dispersin respecto de su

valor esperado es superior en los mtodos centrados que en el mtodo de Yates.
Esto explica que en algunas de las poblaciones finitas consideradas se produzcan
resultados errticos. Para tener en cuenta la posibilidad de estos comportamientos
es por lo que se propone en este artculo utilizar como indicador del error de muestreo una cota superior del mismo que tenga en cuenta no slo los valores esperados sino tambin su varianza respecto del modelo.
16
ESTADSTICA ESPAOLA
Grfico 2
ERROR CUADRTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS REALIZADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLACIONAL BASADA EN UN MODELO POLINMICO DE GRADO TRES
En tercer lugar vamos a observar cual es el comportamiento de los indicadores

que estamos utilizando cuando cambian las especificaciones del trmino de error.
As hemos considerado en principio un trmino de error con distribucin normal de
parmetros cero y dos porque se ajustaba bien a los datos que estamos considerando. Ahora si aumentamos la desviacin del error e introducimos en el modelo un
componente de heterocedsticidad tendremos una nueva poblacin representada
en el grfico siguiente, que no tiene correspondencia con la original y que se ha
introducido nicamente con fines ilustrativos.
17
Grfico 3
POBLACIN HIPOTTICA DE HOTELES SEGN CAPACIDAD ORDENADOS
POR NMERO DE HABITACIONES
Aqu podemos observar como a pesar de que el valor esperado respecto del
modelo permite definir como preferibles los mtodos centrados al mtodo de Yates,
si bien la varianza respecto del modelo de los primeros provoca que en un gran
nmero de poblaciones el error cuadrtico medio del estimador obtenido este por
encima del obtenido con el mtodo de Yates. En la siguiente tabla podemos observar estos valores.
Tabla 3
ESPERANZA Y VARIANZA DEL ERROR CUADRTICO MEDIO PARA UNA DESVIACIN DE LA PERTURBACIN ALEATORIA IGUAL A SIETE, HETEROCEDSTICIDAD Y UN TAMAO DE MUESTRA IGUAL A CUATRO
E
C_isc
C_isv
Corr_extr.
74.27154
69.72824
81.82519
V
5014.4383
4525.6562
216.88261
I=E+2*D
215.89694
204.27424
111.27906
Pf1
1.975495
13.19773
89.037626
Estos resultados pueden analizarse grficamente.
Pf2
132.91205
151.38329
109.44578
...
...
...
...
Pf200
75.702003
73.30413
106.28774
18
ESTADSTICA ESPAOLA
Grfico 4
ERROR CUADRTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS GENERADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLACIONAL BASADA EN UN MODELO POLINMICO DE GRADO TRES, TRMINO DE
ERROR ALEATORIO DE DESVIACIN SIETE Y HETEROCEDASTCIDAD 0.01
En cuarto y ltimo lugar vamos a observar el comportamiento del valor esperado

respecto del modelo del error cuadrtico medio ante cambios en la especificacin
del grado del polinomio utilizado. En el grfico podemos observar los tres ajustes
que hemos realizado y los valores de los parmetros en la tabla siguiente.
19
Grfico 5
DISTINTOS MODELOS DE SUPERPOBLACIN AJUSTADOS
Nm. De
plazas entre 10
y 150
Hoteles
Tabla 4
COEFICIENTES ESTIMADOS PARA CADA MODELO
a0
Modelo 1
Modelo 2
Modelo 3
-4.19E+00
+2.07E+01
+7.39E-00
a1
+3.91E-01
-1.71E-01
+4.28E-01
a3
+2.12E-03
-3.51E-03
a4
+1.42E-05
Hemos comprobado los clculos que lleva a cabo el proceso de simulacin con
POSDEM mediante las ecuaciones siguientes:
Los resultados obtenidos al aplicar estos modelos en la generacin de poblaciones aleatorias pueden comprobarse, para el caso lineal, con los siguientes resultados tericos:
1) Muestreo sistemtico:
Em Vp ( x sis ) = a1 2 (k2 - 1)/12 + 2
con 2 = 2 (k - 1)/nk
20
ESTADSTICA ESPAOLA
El primer componente es la varianza debida a la tendencia lineal; el segundo

trmino es la debida al error aleatorio.
2) Muestreo aleatorio:
Em Vp ( x sr ) = a1 2 (k - 1) (nk + 1)/12 + 2
3) Muestreo estratificado con una unidad: se asume que la poblacin consiste en n estratos formados por los conjuntos de unidades 1...k k+1,...2k
,...(n-1)k+1,...,nk. Una muestra aleatoria se toma de cada estrato.
Em Vp ( x str ) = a1 2 (k2 - 1)/12n + 2
Se puede comprobar que en este caso:
Em Vp ( x strat ) Em Vp ( x sis ) Em Vp ( x sr )
En el caso de utilizar un modelo parablico de grado dos, el desarrollo terico
que hemos utilizado para confrontar nuestros resultados ha sido:
Em(ecm(2)) - Em(ecm(5))= (c2/720)(k2-1)(19k2-31)>0 para k impar
La tabla de resultados para los tres modelos permite cuantificar como a medida
que la poblacin se aleja de la forma de tendencia lineal los mtodos equilibrado,
modificado y corregido de Yates se comportan peor. Existe diferencia en cuanto al
tamao de muestra, as, a medida que esta aumenta la forma del modelo pierde
importancia en cuanto al valor esperado del error. Con los resultados de esta tabla
podemos observar como el mtodo centrado con intervalo variable es preferible a
los otros puesto que presenta un buen comportamiento independientemente de los
cambios en la forma de la poblacin o de los cambios en el tamao de muestra.
21
Tabla 5
ESPERANZA RESPECTO DE DIFERENTES MODELOS -P1,P2 Y P3- DEL ERROR
CUADRTICO MEDIO
P1
n=2
n=3
n=4
n=12
n=22
n=44
n=66 n=132
113,315
34,216 14,837
833
252
86
48
16
M_St_nh=1
224,661 100,024 56,408 6,510 2,019
525 233
56
S_isc
219,633
94,081 50,352 1,611
184
75
45
15
S_isv
2,057
1,430
1,049
373
200
116
81
56
C_isc
1,994
1,320
1,008
288
147
71
45
15
C_isv
2,649
1,477
1,055
326
163
68
39
15
Corr_extr.
1,975
12,238
967
300
158
72
45
15
Equilibrado
1,975
12,307
978
311
167
68
40
15
Modificado
P2
n=2
n=3
n=4
n=12 n=22 n=44
n=66 n=132
M_St_nh=1
S_isc
S_isv
C_isc
C_isv
Corr_extr.
Equilibrado
Modificado
173,327
54,556
231,284 101,451
227,090
96,966
11,312
2,944
11,301
3,023
47,951
10,421
122,912
13,849
122,912
11,929
23,809
56,998
52,508
1,670
1,620
3,891
8,527
29,671
1,184
6,567
3,012
361
292
357
410
3,467
305
2,007
249
220
191
171
180
1,079
93
540
77
120
73
80
78
292
50
246
45
95
48
49
45
154
16
55
16
55
16
15
16
29
En esta tabla podemos observar que los mtodos equilibrado y modificado son
sensibles a las especificaciones del modelo, tanto al orden del polinomio como a si
el tamao de muestra es par o impar. Los resultados para un modelo de ajuste
polinmico de grado tres se han presentado en la tabla 1. La principal conclusin
de este apartado es que, para este ejemplo con datos del marco de la encuesta de
establecimientos hoteleros, el muestreo centrado con intervalo de seleccin variable reduce el error cuadrtico medio, en trminos generales, frente a otros mtodos
sistemticos considerados. Esta reduccin se lleva a cabo con robustez sobre
parmetros que influyen decisivamente en el comportamiento de los otros mtodos
como son: el tamao de muestra, el nmero de grupos en la poblacin y sobre si
estos son pares o impares.
Tambin hemos observado en este apartado la relacin acusada entre el trmino de error aleatorio del modelo y el comportamiento errtico del mtodo centrado.
Por ello se ha propuesto un indicador de la cota superior del error, que incorpora la
informacin relativa a la representatividad del valor esperado, mediante la desviacin respecto del modelo del error cuadrtico medio.
22
ESTADSTICA ESPAOLA
5. PROGRAMA PARA OPTIMIZAR LA SELECCIN EN EL DISEO DE ENCUESTAS POR MUESTREO(3)

Este programa viene motivado por la dificultad que supone el disponer de un
instrumento que permita evaluar la poblacin marco para estudiar si se verifican las
hiptesis que se realizan sobre su estructura. Es necesario tener en cuenta que el
error debido al muestreo en diseos sistemticos, no slo depende del tamao de
las muestras sino tambin del nmero de clases que se formen, y que los clculos
que se precisan no estn disponibles mediante los programas estadsticos de uso
general.
Otra dificultad consiste en, una vez establecidos los supuestos sobre la estructura de la poblacin y evaluadas las alternativas sobre tamao de muestra y nmero de clases, evaluar los distintos mtodos de seleccin que se consideren como
alternativos. A este efecto es necesario considerar la poblacin dentro de un enfoque de modelo de superpoblacin que mejor se ajuste a esa determinada estructura poblacional que se est considerando.
El programa de ordenador POSDEM es un conjunto de instrucciones redactadas en un lenguaje de programacin, Visual Basic, que permite al usuario seleccionar alternativas y obtener resultados en un campo concreto, en este caso en el
diseo de encuestas por muestreo. Lleva a cabo tareas que por su repeticin,
complejidad de clculo o dificultad no podran llevarse a cabo de otro modo. Es un
instrumento de productividad personal. A efectos de ilustracin se presentan en la
figura 2 dos de las principales pantallas de esta aplicacin.
La aplicacin POSDEM se ha diseado de forma que permite, en el diseo de
encuestas por muestreo probabilstico, optimizar la seleccin de las unidades que
van a formar parte de una muestra. Utiliza diferentes mtodos de seleccin y
poblaciones definidas por el usuario. Bsicamente esta aplicacin informtica tiene
tres propsitos o puede ser utilizada desde tres pticas diferentes.
Por una parte, se puede utilizar como un instrumento pedaggico. Bajo este
punto de vista, permite resolver problemas de seleccin de unidades muestrales en
el diseo de encuestas con cualquier tipo de datos. En la misma lnea pedaggica,
tambin permite trabajar con variables de una poblacin objeto de estudio de la que
se dispone de informacin auxiliar de tipo censal y que constituye el marco que se
va utilizar. De esta forma es posible obtener el espacio muestral completo, bien
una representacin del espacio muestral; tambin permite obtener el espacio
paramtrico y del error de muestreo, y resulta ms sencillo comprender mejor
ciertos aspectos de la teora del muestreo en poblaciones finitas. As, es posible
(3)
Existe en este momento una versin de evaluacin de este programa en internet.
23
estudiar problemas donde, definido un cierto marco de unidades, se obtienen un

conjunto de muestras probabilsticas con sus caractersticas, estimaciones y errores asociados, calculando, adems, el estimador para cada muestra y los errores
debidos al muestreo para diferentes mtodos alternativos.
En segundo lugar constituye un instrumento de investigacin emprica. Permite determinar qu mtodo de seleccin es preferible para una determinada
estructura poblacional, y cules son las relaciones entre la estructura poblacional y
los procedimientos de muestreo utilizados. La aplicacin facilita el trabajar con
modelos de probabilidades iguales, desiguales, modelos de superpoblacin y
diseos complejos bietpicos.
En tercer lugar, se trata de una herramienta del trabajo de campo de una encuesta por muestreo. Dado un marco de unidades y una vez elegido el mtodo de
muestreo que mejor se ajusta a esa estructura poblacional, es posible determinar
qu unidades de la poblacin pertenecern finalmente a la muestra que ser investigada, y cuales sern visitadas en caso de ausencias, negativas u otras incidencias.
24
ESTADSTICA ESPAOLA
Figura 2
DOS PANTALLAS DE LA APLICACIN POSDEM(4)
(4) La aplicacin POSDEM tiene ms de cien opciones diferentes. Aqu slo se representan dos
de las pantallas ms significativas.
25
En resumen y desde esa triple ptica, este programa ser de utilidad: a alumnos de un curso de teora y prctica de muestreo en poblaciones finitas en sus dos
posibles versiones de bsico o avanzado; a profesores que deseen disponer de un
instrumento para la investigacin emprica del rea de las encuestas por muestreo;
y a empresas, oficinas centrales de estadstica o profesionales de investigaciones
por muestreo que deseen disear encuestas con una seleccin ptima de las
unidades muestrales. Este instrumento, la aplicacin POSDEM, permite realizar
diseos de una manera personalizada a cada investigacin e incorpora el conocimiento que el experto en muestreo tiene, no siendo necesario que la persona que
efectivamente realiza el diseo tenga estos conocimientos.
Vamos a resumir lo que permite hacer POSDEM:
1. El programa permite trabajar con bases de datos procedentes de ficheros
externos en formatos Dbase, Paradox, Foxpro y Acces. Tambin permite generar
variables definidas a medida y generar poblaciones aleatorias bajo una amplia
gama de posibilidades: aleatoriedad, dispersin, heterocedastcidad, tendencia y
ciclo. De forma que es posible modelar una gran variedad de poblaciones que se
pueden encontrar en la prctica de las encuestas por muestreo. Esta posibilidad se
utiliza sobre todo dentro del enfoque de modelos de superpoblacin.
2. El programa tiene incorporados diecisiete mtodos de seleccin y veinte
mtodos de estimacin distintos. Una vez elegido el mtodo y obtenidas las muestras, calcula para cada muestra, el estimador del total, de la media, o de la proporcin, segn se trate de datos cualitativos o cuantitativos; la varianza del estimador,
su desviacin tpica, los lmites de confianza al 95% y el coeficiente de variacin.
Calcula tambin, para ciertas opciones, los momentos de segundo, tercer y cuarto
orden. Todos estos clculos se realizan para cada muestra obtenida, y se pueden
listar bajo diferentes formatos, con salidas a pantalla, a impresora, a disco o al
portapapeles de Windows. Para una poblacin tipo de 800 unidades, calcula como
resultado final y en una sola realizacin, sin tener en cuenta procesos intermedios o
clculos definidos especficamente, un total de 11.298 estimaciones diferentes.
Dispone adems de cien opciones especficas, todas ellas accesibles desde men.
Las ms utilizadas dispuestas en teclas de funcin y teclas abreviadas (combinacin de ctrl+letra). Presenta tambin una ayuda en lnea de cada pantalla con su
correspondiente glosario y ejemplos. Esta ayuda se presenta en formato hipertexto.
3. De los procedimientos de seleccin que utiliza la aplicacin, tenemos un primer grupo con doce procedimientos que tienen en comn que la seleccin se
realiza con probabilidades iguales, y un segundo grupo de tres mtodos con
probabilidades desiguales, proporcionales al valor de una variable auxiliar,
generalmente el tamao.
26
ESTADSTICA ESPAOLA
4. Las muestras obtenidas se utilizan a su vez para calcular el error de muestreo. Esto es, el programa calcula la varianza, desviacin tpica, coeficiente de
variacin y lmites de confianza para todos los estimadores calculados en cada
muestra. As, tenemos la posibilidad de estudiar la varianza de la media y tambin
la varianza de la varianza o la varianza del momento de cuarto orden, entre otros
parmetros. Hay que destacar tambin que con este procedimiento, en la lnea de
los procedimientos bootstrap es posible calcular la varianza para estadsticos ms
sofisticados que la media o el total, como por ejemplo una componente principal.
5. La aplicacin utiliza por defecto variables cuantitativas, aunque tambin
permite procesar datos cualitativos. Y en cuanto a estimadores, utiliza por defecto,
cuando el mtodo de seleccin es con probabilidades iguales, el estimador de la
media y, cuando se refiere a mtodos con probabilidades desiguales el estimador
del total. Esto se ha mantenido as por similitud con los textos de muestreo. No
obstante, es posible elegir el tipo de estimador que vamos a utilizar: la media de
simple expansin, el total, la proporcin, el total de clase o incluso, si se dispone de
la informacin adecuada, es posible utilizar estimadores mejorados de regresin y
de razn.
6. Dentro de la filosofa del programa, un punto bsico es poder realizar comparaciones entre diferentes mtodos de seleccin, para poder elegir el ms conveniente a cierta estructura poblacional. El programa permite estudiar los resultados de cada experimento en forma de listados o grficamente. En cuanto a la
estructura de poblacin, esta puede estar definida por una poblacin ficticia, una
poblacin natural observada en la prctica, o una superpoblacin producto de un
modelo.
7. Los modelos de superpoblacin es uno de los puntos fuertes del programa
puesto que permite definir modelos complejos, por tramos, con distintas formas y
caractersticas en cuanto a trmino de error, heterocedasticidad, concavidad,
convexidad o componente cclico.
8. Permite tambin realizar los clculos necesarios para representar grficamente el coeficiente de correlacin intraclsica y la varianza, mediante un correlograma, definiendo los lmites inferior y superior del tamao de muestra. A su vez
permite realizar una descomposicin de la varianza, distinguiendo por fuente de
variacin entre muestras o dentro de muestras.
9. Para anlisis de tipo multivariante, se ha incorporado un mdulo de componentes principales que permite obtener la componente de un determinado conjunto de variables para su utilizacin en el diseo de la encuesta, bien como variable de estudio, bien como variable auxiliar o de ordenacin, en funcin del diseo
que se este realizando.
27
10. Permite, por ltimo realizar diseos polietpicos. As, en primer lugar es
posible obtener las unidades que formarn la muestra de unidades primarias sobre
las que a su vez se realizar un nuevo muestreo, hasta conseguir determinar las
unidades ltimas de estudio. La aplicacin tiene implementado un procedimiento
para obtener el error de muestreo en diseos bietpicos.
6. CMO SE ENCUADRA DENTRO DEL MARCO ESTADSTICO E INFORMTICO?

Dentro del marco estrictamente informtico, la simulacin de situaciones estocsticas por ordenador para determinar soluciones ptimas de ciertos problemas
tiene una utilidad innegable. En el campo de las encuestas por muestreo, desde el
comienzo del clculo computarizado, se ha prestado mucha atencin al proceso de
entrada de datos y posterior tratamiento de clculo. Sin embargo, tradicionalmente
ha existido una laguna precisamente en la fase anterior a la entrada de datos. Esto
es, en el momento de determinar que unidades se van a estudiar, en definitiva, en
procedimientos que simulasen el proceso de muestreo. Fundamentalmente se trata
de utilizar el ordenador para un etapa previa a la entrada de datos, con el fin de
determinar que unidades deben formar parte de una muestra probabilstica. Por
tanto, esta aplicacin es previa a aquellas de entrada de datos, de tabulacin y
clculo, o de anlisis estadstico. En este sentido, permite seleccionar muestras
probabilsticas a medida de la informacin marco correspondiente a determinada
poblacin. No obstante lo anterior, tambin permite estudios cuando la poblacin
es desconocida y despus de haber obtenido una muestra el investigador precisa
hacer inferencias de la poblacin con una medida de su precisin. Por tanto, esta
aplicacin se ha diseado con utilidades orientadas al momento anterior de la
salida a campo, elaborando una ficha tcnica y proporcionando el listado de unidades que debern ser investigadas, y con utilidades orientadas al momento posterior
del trabajo de campo, para poder analizar la informacin obtenida en cuanto a
precisin de las inferencias.
7. CONCLUSIONES
En primer lugar se propone un nuevo mtodo de seleccin sistemtico con intervalo de muestreo variable. Este mtodo elimina la tendencia resultado de la
ordenacin de las unidades poblacionales, presenta el caso de varianza cero para
poblaciones hipotticas Xi=i con i=1,2,3...N cuando se verifica la condicin de que
el tamao de muestra es igual a la raz cuadrada de la poblacin. En este caso
28
ESTADSTICA ESPAOLA
presenta importantes mejoras en precisin respecto del muestreo aleatorio simple y

el muestreo sistemtico con intervalo constante. En relacin con los otros mtodos
considerados: equilibrado, modificado, centrado y corregido, presenta un comportamiento similar, con la condicin de la raz, que depende de la estructura concreta
de la poblacin. El caso donde el mtodo supone una mejora importante respecto a
estos ltimos mtodos citados es cuando se aplica al muestreo centrado propuesto
por Madow. Ahi, en trminos de error cuadrtico medio, mejora al resto de los
mtodos sistemticos con los que se ha comparado, en los estudios empricos que
hemos llevado a cabo. Resaltar que mejora el comportamiento del mtodo centrado
propuesto por Madow para k par y el sistema de correciones debido a Yates
En segundo lugar, se proporciona un instrumento nuevo para determinar diseos de seleccin ajustados a estructuras poblacionales determinadas, bajo el
enfoque de modelos de superpoblacin. Esta materializacin se concreta en el
programa de ordenador POSDEM. As, se incorpora a los estudios empricos el
esquema terico de modelos de superpoblacin. Es posible trabajar de forma
emprica con diferentes tipos de modelos segn sea el ajuste a los datos que se
estn considerando. E incluso definir modelos por tramos de poblacin y tratarlos
de manera conjunta. Por tanto, como producto de este estudio, se proporciona un
programa de ordenador con bastantes funcionalidades.
Para otro artculo posterior dejaremos la comparacin de los mtodos que se
han considerado aqu y de los mtodos de probabilidades proporcionales al tamao, concretamente con, sin reposicin y con reposicin parcial. Se deja tambin
para esa ocasin mostrar las posibilidades de POSDEM para la realidad ante la
cual el investigador se encuentra con una poblacin desconocida sobre la que ha
aplicado algn mtodo probabilstico de seleccin y precisa obtener inferencias de
la poblacin y conocer alguna medida sobre la precisin de esas inferencias.
Podemos adelantar que con POSDEM es posible realizar experimentaciones de
muy distinto tipo como son semimuestras reiteradas, orden aleatorio, tcnica del
lazo, distintas variantes en la lnea de las sugerida por John W.Tukey, y por Jos
L.Snchez-Crespo, junto con las citadas tcnicas Bootstrap y Jacknife.
CVSM
(6)
13%
18%
12%
LIM.
S (5)
7,93
8,81
8,43
VARM DESM LIM.I

(2)
(3)
(4)
4,57
4,19
5,07
0,71
1,33
0,71
0,92
0,09
0,29
32%
1,51
0,33
2,17
MED
(1)
6,25
6,50
6,75
6,50
0,04
0,20
3%
6,91
6,09
6,50
1 5 9 10
2 6 7 11
3 4 8 12
1)
2)
3)
VALOR ESPERADO
VARIANZA
DESVIACION
COEF.VAR
LIMITE SUPERIOR
LIMITE INFERIOR
POBLACION (Orden aleatorio)
3,35
0,00
0,00
0%
3,35
3,35
3,45
3,35
3,35
3,35
DES
(8)
15,00
0,00
0,00
0%
15,00
15,00
13,00
15,00
15,00
15,00
CUA
(9)
3,87
0,00
0,00
0%
3,87
3,87
3,61
3,87
3,87
3,87
CUD
(10)
4,61
0,13
0,36
8%
5,33
3,89
1,21
(1) MED Estimador de la media.

(2) VARM Varianza del estimador media.
(3) DESM Desviacin del estimador.
(4) LIM.I Lmite inferior del intervalo de confianza al 95%.
(5) LIM.S Lmite superior.
(6) CVSM Coeficiente de variacin por el estimador medio en %.
(7) VAR Varianza muestral.
0,95
0,02
0,15
16%
1,24
0,65
1,47
0,84
1,15
0,84
8,39
0,13
0,36
4%
9,11
7,67
1,10
11,88
1,32
1,15
10%
14,17
9,58
11,92
3,44
0,03
0,17
5%
3,78
3,10
3,45
3,56
3,20
3,56
DES
(8)
15,83
2,35
1,53
10%
18,90
12,77
13,00
16,92
13,67
16,92
CUA
(9)
3,97
0,04
0,20
5%
4,37
3,58
3,61
4,11
3,70
4,11
CUD
(10)
61%
0%
4%
6%
69%
54%
55%
66%
57%
61%
CVS
(11)
54,17
8,43
2,90
5%
59,97
48,36
54,17
51,7
52,5
58,2
M2 (12)
54,17
112,89
10,62
20%
75,42
32,92
54,17
41,50
53,50
67,50
M2 (12)
(8) DES Desviacin muestral.

(9) CUA Cuasivarianza.
(10) CUD Cuasidesviacin.
(11) CVS Coeficiente de variacin.
(12) M2 Momento de segundo orden respecto al origen.
(13) M3
tercer
.
(14) M4
cuarto
15%
0%
2%
16%
19%
10%
23%
12,69
10,25
12,69
VAR
(7)
61%
1%
8%
13%
76%
45%
55%
70%
60%
52%
CVS
(11)
MUESTREO SISTEMTICO CON INTERVALO VARIABLE
11,25
0,00
0,00
0%
11,25
11,25
11,92
Unidades
de cada
muestra
14%
0%
2%
13%
17%
10%
23%
N de muestra
8,23
0,67
0,82
10%
9,87
6,60
1,10
0,75
0,00
0,00
0%
0,75
0,75
2,17
6,50
0,67
0,82
13%
8,13
4,87
6,50
VALOR ESPERADO
VARIANZA
DESVIACION
COEF.VAR
LIMITE SUPERIOR
LIMITE INFERIOR
POBLACION (Orden aleatorio)
4,77
0,67
0,82
17%
6,40
3,13
1,21
11,25
11,25
11,25
16%
13%
12%
7,23
8,23
9,23
3,77
4,77
5,77
0,87
0,87
0,87
0,75
0,75
0,75
5,50
6,50
7,50
1 4 7 10
2 5 8 11
3 6 9 12
1)
2)
3)
0,87
0,00
0,00
0%
0,87
0,87
1,47
VAR
(7)
CVSM
(6)
LIM.
S (5)
LIM.I
(4)
DES
M (3)
MUESTREO SISTEMTICO CON INTERVALO CONSTANTE

VAR
M (2)
MED
(1)
Unidades
de cada
muestra
N de muestra
Anexo 1
507,00
2888,00
53,74
11%
614,40
399,50
507,00
463,7
474,5
582,7
M3 (13)
507,00
17472,67
132,18
26%
771,37
242,63
507,00
352,00
494,00
675,00
M3 (13)
5059,17
774433,00
880,02
17%
6819,20
3299,13
5059,17
4296,75
4588,50
6292,25
M4 (14)
5059,17
2695043,56
1641,66
32%
8342,48
1775,85
5059,17
3164,50
4844,50
7168,50
M4 (14)
29
30
ESTADSTICA ESPAOLA
Anexo 2
Se incluye un ejemplo con una poblacin un poco mayor que la utilizada en la
ilustracin de la hoja de clculo para comprender mejor el mtodo propuesto:
Tamao de poblacin N = 21. Tamao de muestra n = 7. Nmero aleatorio para
la primera seleccin i = 2. Tamao de los grupos para la seleccin k = 3
A continuacin tenemos la poblacin y los valores muestrales seleccionados
con este mtodo:
ndice de cada
unidad de la
poblacin
Nmero
aleatorio
Correlativo
Nmero
Lmite
del
grupo
j.k
Condicin ndice de cada unidad

de la muestra
c
z=i+ (j-1) (k+1)-ck
0 (*)
2+(1-1)(3+1)-(0)(3)= 2
2+(2-1)(3+1)-(0)(3)= 6
1 (**)
2+(3-1)(3+1)-(1)(3)= 7
10
11
12
12
2+(4-1)(3+1)-(1)(3)= 11
13
14
15
15
2+(5-1)(3+1)-(1)(3)= 15
16
17
18
18
2 (***)
2+(6-1)(3+1)-(2)(3)= 16
19
20
21
21
2+(7-1)(3+1)-(2)(3)= 20
(*) z=j.k No ha ocurrido que zv=jk, as c=0

(**)
Ha ocurrido una vez que zv=jk, as c=1.

(***)
Es la segunda vez que ocurre que zv=jk, as c=2.
31
REFERENCIAS
AZORIN, F. Y SNCHEZ-CRESPO RODRIGUEZ, JL. (1986) Mtodos y aplicaciones del
muestreo. Alianza Universidad Textos. Madrid
BELLHOUSE,D.R.&RAO, J.N.K. (1975);Systematic sampling in the presence of a
trend;Biometrika 62, 694-697;
COCHRAN, W.G. (1977): Sampling Techniques, 3rd edition, New York: Wiley
MURTHY, M.N. Sampling theory and Methods (1967). Statistical Publishing Society, Calcutta
IACHAN, RONALDO (1982) : Systematic Sampling: A critical Review International
Statistical Review, 50, pp 293-303
KRISHNAIAH, P.R.
Holland.
RAO, C.R: Sampling, (1988), Handbook of Statistics, North-
SYSTEMATIC SAMPLING WITH VARIABLE SAMPLING INTERVAL

SUMMARY
This document proposes a new procedure in order to select samples with systematic sampling with variable sampling interval. For this,
it is defined formally the classical selection procedure, using constant
interval. An example is resolved with simple data in order to understand better the procedure. Later it is introduced, in similar terms, the
selection procedure proposed with variable sampling interval. With a
frame data it is made a superpopulatin aproach with diferent sampling selection metods. Lastly, it is made a reference to a new computer program carried out in order to help the sampling survey design.
Key words: Systematic sampling. Variable sampling interval. Computer application: POSDEM. Superpopulation model.
AMS classification: 62D05

Muestreo, Estadistica

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Muestreo, Estadistica

Uploaded by

Copyright:

Available Formats

ESTADSTICA ESPAOLA

Vol. 40, Nm. 143, 1998, pgs. 5 a 31

Muestreo sistemtico con intervalo

Palabras clave: Muestreo sistemtico. Intervalo variable. Modelo de

1. MUESTREO SISTEMTICO CON INTERVALO CONSTANTE

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

el nmero de plazas declaradas. Las unidades estn ordenadas conforme al valor

El mtodo de seleccin sistemtica con intervalo de muestreo constante puede

Se puede seguir un ejemplo, en el anexo 1, utilizando una hoja de clculo. En

En el caso de muestreo sistemtico, la varianza viene dado por la expresin:

Donde i representa la muestra i-sima.

con j representando el estrato j-simo.

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

previsible y puede verse un desarrollo ms formal en la obra de Cochran, 1977,

2. MUESTREO SISTEMTICO CON INTERVALO VARIABLE

Ver Murthy M.N., 1967 pg.157

valo de muestreo variable que tenga como consecuencia un efecto de movilidad

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

3. COMPARACIN ENTRE DIFERENTES MTODOS

Una descripcin de los restantes mtodos y sus implicaciones en modelos de

4. RESULTADOS A TRAVS DE MODELOS DE SUPERPOBLACIN

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

MDULO PARA EL CLCULO DE ESTRUCTURAS DE POBLACIN EN

324,073.50 150,973.00 86,567.40 9,872.90 3,046.60 762.00

320,827.10 145,310.60 79,823.30 3,273.80

77,403.10 34,714.00 1,624.50

19,622.90 30,014.80 3,440.20 1,143.50 305.20

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

Podemos observar en el siguiente grfico como la dispersin respecto de su

En tercer lugar vamos a observar cual es el comportamiento de los indicadores

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

Estos resultados pueden analizarse grficamente.

En cuarto y ltimo lugar vamos a observar el comportamiento del valor esperado

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

El primer componente es la varianza debida a la tendencia lineal; el segundo

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

5. PROGRAMA PARA OPTIMIZAR LA SELECCIN EN EL DISEO DE ENCUESTAS POR MUESTREO(3)

Existe en este momento una versin de evaluacin de este programa en internet.

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

estudiar problemas donde, definido un cierto marco de unidades, se obtienen un

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

6. CMO SE ENCUADRA DENTRO DEL MARCO ESTADSTICO E INFORMTICO?

presenta importantes mejoras en precisin respecto del muestreo aleatorio simple y

VARM DESM LIM.I

(1) MED Estimador de la media.

(8) DES Desviacin muestral.

MUESTREO SISTEMTICO CON INTERVALO VARIABLE

MUESTREO SISTEMTICO CON INTERVALO CONSTANTE

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

Condicin ndice de cada unidad

z=i+ (j-1) (k+1)-ck

(*) z=j.k No ha ocurrido que zv=jk, as c=0

Ha ocurrido una vez que zv=jk, as c=1.

MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE

RAO, C.R: Sampling, (1988), Handbook of Statistics, North-

SYSTEMATIC SAMPLING WITH VARIABLE SAMPLING INTERVAL

You might also like