You are on page 1of 12

Muestreo Aleatorio Simple. 1.

- Introduccin:
1.1 Definiciones:
Muestreo Aleatorio Simple sin reemplazamiento (m.a.s.): Diseo en el que se seleccionan unidades de la poblacin sin reponer los elementos observados, de tal modo que todas las unidades tienen la misma probabilidad de seleccin y todas las muestras son equiprobables. Muestreo Aleatorio con reemplazamiento: Si una vez observada la unidad sta es devuelta a la poblacin, es decir, la estructura de la poblacin permanece constante en cada extraccin.

1.2 Caractersticas:
i) M.A.S.: Tamao de muestra n. Seleccin sucesiva e independiente de las unidades con probabilidades iguales en cada extraccin a N1 ; t 0, 1, . . . , n. t Las muestras que constan de las mismas unidades obtenidas en distintos rdenes se consideran idnticas;
ps j
1 N n

/ sj u1, . . . , un

ii)Muestreo aleatorio simple con reemplazamiento: 1 Si el orden importa, tenemos N n muestras distintas ps j N n . Nn1 Si el orden no importa, tenemos n muestras distintas; Ejercicio verificar esta afirmacin.

1.3 Probabilidad de pertenecer un elemento a la muestra:


i) M.A.S.: n k N ii)Muestreo aleatorio simple con reemplazamiento: 1 n k 1 1 N

1.4 Ejemplos:
1 Se pretende auditorar los registros contables de un hospital de una ciudad. Los registros del hospital informatizados proporcionan un determinado total de cuentas por cobrar y el auditor debe verificar este total. El hospital tiene 28000 cuentas abiertas. 2 El ndice de televisin de Nielsen es el servicio ms ampliamente usado para la medicin de audiencia; Se basa en una m.a. de 1200 hogares aproximadamente que tienen conectados a la T.V. un audmetro. En una m.a. adicional de familias, cada familia anota en un diario los distintos programas que ve. 3 Las investigaciones de mercado incluyen, frecuentemente, una m.a.s. de usuarios potenciales de un producto. 4 Se puede estimar el volmen de madera o la proporcin de rboles enfermos tomando una m.a.s. de reas a travs de un marco de reas.

1.5 Cmo seleccionar una m.a.s.:


Tablas de Nmeros Aleatorios: Conjunto de enteros, generado de modo qu, comnmente, la tabla contendr todos los 10 enteros en proporciones aproximadamente iguales; Si un nmero es seleccionado desde un punto aleatorio en la tabla, es igualmente probable que sea cualquiera de los dgitos entre el 0 y el 9. Se puede usar cualquier punto de inicio y se puede mover en cualquier direccin predeterminada.

2.- Estimadores de la media, el total y proporcin poblacionales:


Objetivo : Dada la poblacin U estimar los parmetros:
y k ,
i1 N

y1, . . . , yN

se pretende que, a partir de una muestra s,

y
k 1

, para variables cuantitativas.

A a k , P
k1

a
k 1

A N

/ a k 0 1, para variables dicotmicas.

Notacin:

y k 2
f
n N

, 2

k1

, 2

N N1

2; Y

Y k
ks

Dada una muestra aleatoria Y 1 , . . . , Y n de una variable Y

S2 S 2 y
ks

Y k Y n Y k Y n1

ks

y k
s

Sea s

y1, . . . , yn

realizacin muestral observada

s2 s 2

y k y 2
s

y k y 2
s

n1

Ejercicio: Si los valores observados son toman 2 y 2 en funcin de P.

ak 0 1

kU

obtener las expresiones que

2.1 Muestreo aleatorio simple sin reemplazamiento (m.a.s.)


Ilustremos lo que se pretende con un ejemplo: Supongamos N 4, y los valores de una variable Y, en esta poblacin, 2. 5 1, 2, 3, 4 2 5 4 Posibles muestras 1, 2 1, 3 Z 1, 4 2, 3 2, 4 3, 4
1 6 1 6 1 6 1 6 1 6 1 6 3 2 4 2 5 2 6 2 7 2 1 6 1 6 1 6 1 6 1 6

de

tamao

n 2,

Y1, Y2 ,

sin

reemplazamiento

Por tanto, Y

Y 1 Y 2 2

E Y

2. 5
5 12

2 n Nn N1

Var Y

, es decir, Y

ser un buen estimador de la media poblacional ; por qu?. estimador: n k N ; kl


nn1 NN1

Variables cuantitativas: insesgados. A Variables cualitativas: P insesgados. Varianzas de los estimadores: Var 1 kl kk 2
y kUlU 1f 2 n N 2 Nn nN1 Nn nN1 yl l ks A N ks

yk k

N
ks

yk n

; Ejercicio: Demostrar que son

ak k

N
ks

ak n

; Ejercicio: Demostrar que son

N 2 1f n

Var VarA VarP

P1 P

P1 P

Ejercicio: Demostrar cmo a partir de disponer de la Var se deducen los dems casos. Estimacin de las varianzas:
n

S 2
k1

Y k Y n1

estimador insesgado de 2 Var

N 2 1f n

S 2

N 2 1f n1

S2

estimador insesgado de Var ; Cual es un estimador insesgado de 2 ?. Demostrar que:


Var
1f n 1f n1

S 2

1f n1

S2;

VarP VarA P1 P

P1 P;

N 2 1f P1 P n1 N1n Nn1 P1 P

es insesgado de P1 P

2.2 Muestreo aleatorio simple con reemplazamiento.


1 p k P elemento k sea escogido en una extraccin N Como el elemento k puede pertenecer a la muestra 1, 2, . . . , n veces, consideramos una nueva variable:

T k H i donde
k1

0 si no observamos el elemento k en la i-esima eleccin, 1 p k T k Bn, p k Estimador lineal insesgado: pwr


ks yk
n N

Hi

1 si observamos el elemento k en la i-esima eleccin, p k

(estimador de Hannsen y Hurwitz 1943)

Ejercicios: pwr , A pwr , P pwr ?. Demostrar que son estimadores lineales insesgados. Nota: Los estimadores lineales insesgados son iguales para muestreo aleatorio con y sin reemplazamiento. Lo que va a ser distinto son las varianzas de los estimadores. Estimadores alternativos: i) -estimador: k 1 1 p k n Variables cuantitativas:
ks yk k

A
ks

; Ejercicio: Demostrar que son insesgados.

N ak k

Variables cualitativas: P

; Ejercicio: Demostrar que son insesgados.

A N

ii) Caso en que n n s es aleatorio

alt Ny s

N ns

y k / E
s

1 ns

1 N

j 1

j N

m1

; n s m elementos distintos.

Varianzas de los estimadores: Var pwr


N2 n

Var pwr VarA pwr VarP pwr

2 n N2 n 1 n

P1 P

P1 P

Ejercicio: Demostrar cmo a partir de disponer de la Var pwr se deducen los dems casos. Estimacin de las varianzas: Dado que en el muestreo aleatorio con reemplazamiento S 2 insesgado de 2
Var pwr Var pwr
N2 n S 2 n
n

i1

Y k Y n1

es estimador

S 2 estimador insesgado de Var pwr ; ; ;

Demostrar que:
VarP pwr VarA pwr P1 P
P1P n1 N2 n1 n n1

P1 P

P1 P es insesgado de P1 P

2.3 Ejemplos:
1 Se supone que Suiza est dividida en 284 municipios. Para estimar el total de la variable CN de sitios ocupados por conservadores en los 200 consejos municipales ms pequeos, se tom una m.a.s. de 50 con los siguientes resultados: C: 3 4 5 6 7 8 9 10 11 12 13 14 15 16 f i : 4 7 3 6 7 10 4 2 2 1 1 1 0 2

2 Una industria particular desea conocer el grado de absentismo laboral no relacionado con enfermedad o vacaciones. Se toma una m.a. de 1000 individuos de un total de 36000 y se les pregunta si faltaron al trabajo sin justificacin ms de 5 das al ao. Se sabe que de los 36000, 1116 faltaron al trabajo ms de 5 das. Obtener el error de muestreo para estimar el parmetro de inters suponiendo m.a.s. con y sin reposicin.

3.- Intervalos de Confianza:


El teorema central del lmite garantiza la aproximacin a la distribucin normal de los estimadores lineales insesgados propuestos. Ademas, se puede demostrar que los estimadores de las varianzas propuestos son consistentes.

Por ejemplo:
E Var

N 0, 1

Var 2

General: Var 2

I.C. de nivel 1 para .

Nota: Habitualmente, los intervalos son asintticos. Ejemplos: 1 Se desea conocer el nmero de visitas realizado por unos psiclogos a las familias de una cierta comunidad en un ao especfico. Hay 25 psiclogos y cada uno de ellos realiza un nmero determinado de visitas. Se realiza una seleccin de 9 psiclogos con m.a.s. con los siguientes resultados: 5, 1, 4, 12, 5, 6, 4, 7, 0 . Estimar el parmetro de inters. 2 Supongamos que en una muestra de 400 empleados seleccionados con m.a. con reposicin de una nmina de 10000 empleados de una fbrica, el nmero que responden NO a desea usted hacer huelga? fue de 80. Estimar la proporcin del total de individuos que desean hacer huelga.

4.- Obtencin del tamao de muestra n fijado el error de estimacin y una confianza:
Conceptos Previos: Error de estimacin: B Error de muestreo Var . Procedimiento de clculo: Prefijado el error mximo admisible en el I.C. para un nivel de confianza dado 1 (equivalente a fijar la precisin mnima necesaria) se puede calcular el tamao muestral necesario;
p B 1 Utilizando la aproximacin normal p T.C.L.
Var Var

B Var

N0, 1 k k 2

B Var

1 2 Var B k

k 1. 96 si 1 0. 95

4.1 Muestreo Aleatorio Simple:


Frmula General: n : n0 : n0 P : n0 A : n0
k 2 2 B2 N 2 k 2 2 B2 k 2 P1P B2 N 2 k 2 P1P B2 N N1 N N1 n0
n0 N

; ;

N N1 N N1

1 1

Nota: En la prctica se tomar una muestra previa de n individuos para estimar N1n P1 P Nn 1 P 1 P y S 2 .

4.2 Muestreo aleatorio simple con reemplazamiento:


: n
k22 B2 N2k22 B2 k 2 P1P B2 N 2 k 2 P1P B2

: n P: n A: n

Nota: En la prctica se tomar una muestra previa de n individuos para estimar 2 P 1 P n n . 1 P 1 P y S

4.3 Observaciones:
i) Si el diseo es m.a.s., lim
N n0
n0 N

lim

que?: La funcin nn00N , como funcin de N, es una hiprbola equiltera que pasa por el N origen y tienen una asntota paralela al eje de abscisas; En concreto, si nn00N n 0 1 N n 0 n 0 1 n n 0 . N Conclusin: Por ejemplo, si tenemos dos poblaciones de tamaos 1000 y 1000000 en las que la variabilidad de la caracterstica en estudio es igual, y se verifica que n 0 n 0 1 1000, el tamao de muestra que tomaremos en ambas poblaciones, para cometer el mismo error con la misma confianza, ser igual, n n 0 . ii) Aproximadamente, n es inversamente proporcional al cuadrado del error de muestreo, B 2 , por tanto, para reducir el error a la mitad se necesitar una muestra cuatro veces mayor.

n0N n 0 N

n 0 n n 0 si N es grande; Por

4.4 Ejemplo:
Un gelogo desea estimar la proporcin de oro en una grieta de roca a partir de una m.a.s. de n puntos, observando la presencia o ausencia del mineral. De qu tamao tiene que ser la muestra para que el error mximo cometido al estimar la proporcin sea como mucho 0.05 con una confianza del 95%?.

5.- Error relativo del muestreo.


El error relativo admisible se define en funcin del coeficiente de variacin del estimador, CV , de la siguiente manera: E e r k CV Utilidad: Fijado e r se puede determinar el tamao muestral necesario; 2 2 n0 / n 0 k 2 2 ; Para y , n n0
N

Para la proporcin n

er x Nk 2 Q

2 N 1 e 2 r Pk Q

6.- Consideracin de los costes:


Supongamos que el gasto para obtener una muestra se puede expresar como c 0 c 1 n ; Determinemos el tamao muestral de forma que se minimice la variabilidad y el coste a la vez: n Si X Var N 2 ; nN Funcin a minimizar n Var c 0 c 1 n n
2 c1 2 N 2 c1
1 1

si si

1 1

7.- Estimacin de Dominios:


Planteamos algunos resultados que van a permitir utilizar el -estimador en el diseo m.a.s. para estimar el tamao absoluto y relativo de un dominio y la media y el total del dominio (subpoblacin especfica de la poblacin U)

7.1 Estimacin de tamaos del dominio:


Notacin: N d : Tamao absoluto Pd
Nd N

: Tamao relativo 1 si k U d 0 si k U d

del dominio U d .

Z dk N d

Sea Z dk

Z dk
U

n d Z dk ; p d
s

Z dk
s

Pd

estimadores: N d Np d ; Var N d
N 2 Nn P d Q d n nN1

; Var N d

N 2 1 f

pdqd n1

Ejercicio: P d , Var P d , Var P d ?

7.2 Estimacin del total y la media de un dominio:


Notacin: d y k y d
Ud d Nd

Sea Y dk estimadores: 8

y k si k U d 0 si k U d

Y dk d
U

Si N d es desconocido: d
sd

yk k yk k

Si N d es conocido: d Caso m.a.s.: Si N d es desconocido: Var d Var d N 2 1 f N2 d


1 nsd

Nd Nd

sd

2 2 p d S y s d q d y s d n

con p d

nsd n

y qd 1 pd

Si N d es conocido:
1 Nd 2 S ysd

Ejercicio: d , Var d , Var d ? Ejemplo: Se dispone de la poblacin de 124 pases. Se toma una m.a.s. de 50 y se dispone de los datos de su poblacin total. Sea U d : pases de Europa, de los cuales hay 5 en la muestra con los siguientes resultados: y k 205. 2, y 2 k 6232. 84
sd sd

estimar los prmetros de inters.

8.- Ejemplos:
8.1 Supongamos que en una muestra de 400 empleados, seleccionados con muestreo aleatorio, de entre una lista de 10000 empleados de una fbrica, el nmero que responden NO a la cuestin Desea usted hacer huelga? fue de 80. Obtener una estimacin puntual y por intervalos de confianza del 95% para el parmetro proporcin total de individuos que desean hacer huelga en la fbrica. Resolverlo considerando que la muestra se tome con o sin reemplazamiento. Solucin: i) m.a.s con reemplazamiento: Datos conocidos N 10000 n 400 y k 80
ks
1 n

ks

Estimacin puntual: P pwr Estimacin de la VarP pwr


P1P n1

varianza

yk 1 N

y k
ks

80 400 0. 2 (Error cuadrtico

medio):

0.20.8 399

0. 0004;

Error de muestreo: VarP pwr 0. 02 Error de estimacin con una confianza del 95%: B 1. 96 VarP pwr 0. 0392 Intervalo de confianza: Dado que p P P pwr 1. 96 VarP pwr 0. 95

0. 16, 0. 239 intervalo de confianza del 95% para P. ii) m.a.s: Datos conocidos N 10000 n 400 y k 80
ks

y k
Estimacin puntual: P mas Estimacin de VarP mas VarP
1f n1
ks

80 400

0. 2 varianza
400 10000

la P1 P
1 0.20.8 399

(E.C.M.):

0. 000384;

Error de muestreo: VarP mas 0. 0195 Error de estimacin con una confianza del 95%: B 1. 96 VarP mas 0. 03822 Intervalo de confianza: Dado que p P P mas 1. 96 VarP mas 0. 95

0. 161, 0. 238 intervalo de confianza del 95% para P. 8.2 Un gelogo desea estimar la proporcin de oro en una grieta de roca a partir de una m.a.s. de n puntos, observando la presencia o ausencia del mineral. De qu tamao tiene que ser la muestra para que el error mximo cometido al estimar la proporcin sea como mucho 0.05 B con una confianza del 95%?. Solucin: p PP B p P P 1. 96 VarP 0. 95 Ecuacin resultante,

1. 96 VarP 0. 05 Despejando se obtiene que

n0
n0 N

/ n0

k 2 P1P B2 n0 N

N N1

N N1

1 porque el

nmero de puntos es muy grande 1 P1 P 1 n 0 1.96 2 2 0.05

2 1 1 2 2

384. 16 y

0 n 385

9.- Programas de Matlab.


9.1.- M.A.S.
Obtencin de los individuos que conforman la muestra; Programa mas.m: Obtencin de una m.a.s. de n individuos de una poblacin de N; lo que se obtiene son los nmeros de los individuos que tiene que ser cuestionados suponiendo que los individuos de la poblacin estn con un nmero en una lista: function muestramas(N,n) unfix(unifrnd(1,N1)) j1 muestra(1,1)un while (jn); unfix(unifrnd(1,N1)); if un~muestra(1:length(muestra),1) jj1; muestra(j,1)un; end; end; Obtencin del tamao de muestra fijado un error de estimacin B y una confianza k: Programa masn.m: Parmetro de inters P, proporcin de individuos con cierta caracterstica y acotacin 10

P(1-P) 1 ; 4 function nmasn(N,B,k) p1/2 n0((k/B)^2)*(N/(N-1))*p*(1-p) nn0/((n0/N)1)

11

9.2.- Muestreo aleatrio simple con reemplazamiento:


Obtencin de los individuos que conforman la muestra; Programa mascon.m: Obtencin de una m.a.s. con reemplazamiento de n individuos de una poblacin de N; lo que se obtiene son los nmeros de los individuos que tiene que ser cuestionados suponiendo que los individuos de la poblacin estn con un nmero en una lista: function muestramascon(N,n) unfix(unifrnd(1,N1)) j1 muestra(1,1)un while (jn); unfix(unifrnd(1,N1)); jj1; muestra(j,1)un; end; Obtencin del tamao de muestra fijado un error de estimacin y una confianza: Programa masncon.m: Parmetro de inters P, proporcin de individuos con cierta caracterstica y acotacin P(1-P) 1 ; 4 function nmasncon(N,B,k) p1/2 n(k^2/B^2)*p*(1-p)

12

You might also like