Professional Documents
Culture Documents
- Introduccin:
1.1 Definiciones:
Muestreo Aleatorio Simple sin reemplazamiento (m.a.s.): Diseo en el que se seleccionan unidades de la poblacin sin reponer los elementos observados, de tal modo que todas las unidades tienen la misma probabilidad de seleccin y todas las muestras son equiprobables. Muestreo Aleatorio con reemplazamiento: Si una vez observada la unidad sta es devuelta a la poblacin, es decir, la estructura de la poblacin permanece constante en cada extraccin.
1.2 Caractersticas:
i) M.A.S.: Tamao de muestra n. Seleccin sucesiva e independiente de las unidades con probabilidades iguales en cada extraccin a N1 ; t 0, 1, . . . , n. t Las muestras que constan de las mismas unidades obtenidas en distintos rdenes se consideran idnticas;
ps j
1 N n
/ sj u1, . . . , un
ii)Muestreo aleatorio simple con reemplazamiento: 1 Si el orden importa, tenemos N n muestras distintas ps j N n . Nn1 Si el orden no importa, tenemos n muestras distintas; Ejercicio verificar esta afirmacin.
1.4 Ejemplos:
1 Se pretende auditorar los registros contables de un hospital de una ciudad. Los registros del hospital informatizados proporcionan un determinado total de cuentas por cobrar y el auditor debe verificar este total. El hospital tiene 28000 cuentas abiertas. 2 El ndice de televisin de Nielsen es el servicio ms ampliamente usado para la medicin de audiencia; Se basa en una m.a. de 1200 hogares aproximadamente que tienen conectados a la T.V. un audmetro. En una m.a. adicional de familias, cada familia anota en un diario los distintos programas que ve. 3 Las investigaciones de mercado incluyen, frecuentemente, una m.a.s. de usuarios potenciales de un producto. 4 Se puede estimar el volmen de madera o la proporcin de rboles enfermos tomando una m.a.s. de reas a travs de un marco de reas.
y1, . . . , yN
y
k 1
A a k , P
k1
a
k 1
A N
Notacin:
y k 2
f
n N
, 2
k1
, 2
N N1
2; Y
Y k
ks
S2 S 2 y
ks
Y k Y n Y k Y n1
ks
y k
s
Sea s
y1, . . . , yn
s2 s 2
y k y 2
s
y k y 2
s
n1
ak 0 1
kU
de
tamao
n 2,
Y1, Y2 ,
sin
reemplazamiento
Por tanto, Y
Y 1 Y 2 2
E Y
2. 5
5 12
2 n Nn N1
Var Y
, es decir, Y
Variables cuantitativas: insesgados. A Variables cualitativas: P insesgados. Varianzas de los estimadores: Var 1 kl kk 2
y kUlU 1f 2 n N 2 Nn nN1 Nn nN1 yl l ks A N ks
yk k
N
ks
yk n
ak k
N
ks
ak n
N 2 1f n
P1 P
P1 P
Ejercicio: Demostrar cmo a partir de disponer de la Var se deducen los dems casos. Estimacin de las varianzas:
n
S 2
k1
Y k Y n1
N 2 1f n
S 2
N 2 1f n1
S2
S 2
1f n1
S2;
VarP VarA P1 P
P1 P;
N 2 1f P1 P n1 N1n Nn1 P1 P
es insesgado de P1 P
T k H i donde
k1
Hi
Ejercicios: pwr , A pwr , P pwr ?. Demostrar que son estimadores lineales insesgados. Nota: Los estimadores lineales insesgados son iguales para muestreo aleatorio con y sin reemplazamiento. Lo que va a ser distinto son las varianzas de los estimadores. Estimadores alternativos: i) -estimador: k 1 1 p k n Variables cuantitativas:
ks yk k
A
ks
N ak k
Variables cualitativas: P
A N
alt Ny s
N ns
y k / E
s
1 ns
1 N
j 1
j N
m1
; n s m elementos distintos.
2 n N2 n 1 n
P1 P
P1 P
Ejercicio: Demostrar cmo a partir de disponer de la Var pwr se deducen los dems casos. Estimacin de las varianzas: Dado que en el muestreo aleatorio con reemplazamiento S 2 insesgado de 2
Var pwr Var pwr
N2 n S 2 n
n
i1
Y k Y n1
es estimador
Demostrar que:
VarP pwr VarA pwr P1 P
P1P n1 N2 n1 n n1
P1 P
P1 P es insesgado de P1 P
2.3 Ejemplos:
1 Se supone que Suiza est dividida en 284 municipios. Para estimar el total de la variable CN de sitios ocupados por conservadores en los 200 consejos municipales ms pequeos, se tom una m.a.s. de 50 con los siguientes resultados: C: 3 4 5 6 7 8 9 10 11 12 13 14 15 16 f i : 4 7 3 6 7 10 4 2 2 1 1 1 0 2
2 Una industria particular desea conocer el grado de absentismo laboral no relacionado con enfermedad o vacaciones. Se toma una m.a. de 1000 individuos de un total de 36000 y se les pregunta si faltaron al trabajo sin justificacin ms de 5 das al ao. Se sabe que de los 36000, 1116 faltaron al trabajo ms de 5 das. Obtener el error de muestreo para estimar el parmetro de inters suponiendo m.a.s. con y sin reposicin.
Por ejemplo:
E Var
N 0, 1
Var 2
General: Var 2
Nota: Habitualmente, los intervalos son asintticos. Ejemplos: 1 Se desea conocer el nmero de visitas realizado por unos psiclogos a las familias de una cierta comunidad en un ao especfico. Hay 25 psiclogos y cada uno de ellos realiza un nmero determinado de visitas. Se realiza una seleccin de 9 psiclogos con m.a.s. con los siguientes resultados: 5, 1, 4, 12, 5, 6, 4, 7, 0 . Estimar el parmetro de inters. 2 Supongamos que en una muestra de 400 empleados seleccionados con m.a. con reposicin de una nmina de 10000 empleados de una fbrica, el nmero que responden NO a desea usted hacer huelga? fue de 80. Estimar la proporcin del total de individuos que desean hacer huelga.
4.- Obtencin del tamao de muestra n fijado el error de estimacin y una confianza:
Conceptos Previos: Error de estimacin: B Error de muestreo Var . Procedimiento de clculo: Prefijado el error mximo admisible en el I.C. para un nivel de confianza dado 1 (equivalente a fijar la precisin mnima necesaria) se puede calcular el tamao muestral necesario;
p B 1 Utilizando la aproximacin normal p T.C.L.
Var Var
B Var
N0, 1 k k 2
B Var
1 2 Var B k
k 1. 96 si 1 0. 95
; ;
N N1 N N1
1 1
Nota: En la prctica se tomar una muestra previa de n individuos para estimar N1n P1 P Nn 1 P 1 P y S 2 .
: n P: n A: n
4.3 Observaciones:
i) Si el diseo es m.a.s., lim
N n0
n0 N
lim
que?: La funcin nn00N , como funcin de N, es una hiprbola equiltera que pasa por el N origen y tienen una asntota paralela al eje de abscisas; En concreto, si nn00N n 0 1 N n 0 n 0 1 n n 0 . N Conclusin: Por ejemplo, si tenemos dos poblaciones de tamaos 1000 y 1000000 en las que la variabilidad de la caracterstica en estudio es igual, y se verifica que n 0 n 0 1 1000, el tamao de muestra que tomaremos en ambas poblaciones, para cometer el mismo error con la misma confianza, ser igual, n n 0 . ii) Aproximadamente, n es inversamente proporcional al cuadrado del error de muestreo, B 2 , por tanto, para reducir el error a la mitad se necesitar una muestra cuatro veces mayor.
n0N n 0 N
n 0 n n 0 si N es grande; Por
4.4 Ejemplo:
Un gelogo desea estimar la proporcin de oro en una grieta de roca a partir de una m.a.s. de n puntos, observando la presencia o ausencia del mineral. De qu tamao tiene que ser la muestra para que el error mximo cometido al estimar la proporcin sea como mucho 0.05 con una confianza del 95%?.
Para la proporcin n
er x Nk 2 Q
2 N 1 e 2 r Pk Q
si si
1 1
: Tamao relativo 1 si k U d 0 si k U d
del dominio U d .
Z dk N d
Sea Z dk
Z dk
U
n d Z dk ; p d
s
Z dk
s
Pd
estimadores: N d Np d ; Var N d
N 2 Nn P d Q d n nN1
; Var N d
N 2 1 f
pdqd n1
Sea Y dk estimadores: 8
y k si k U d 0 si k U d
Y dk d
U
Si N d es desconocido: d
sd
yk k yk k
Nd Nd
sd
2 2 p d S y s d q d y s d n
con p d
nsd n
y qd 1 pd
Si N d es conocido:
1 Nd 2 S ysd
Ejercicio: d , Var d , Var d ? Ejemplo: Se dispone de la poblacin de 124 pases. Se toma una m.a.s. de 50 y se dispone de los datos de su poblacin total. Sea U d : pases de Europa, de los cuales hay 5 en la muestra con los siguientes resultados: y k 205. 2, y 2 k 6232. 84
sd sd
8.- Ejemplos:
8.1 Supongamos que en una muestra de 400 empleados, seleccionados con muestreo aleatorio, de entre una lista de 10000 empleados de una fbrica, el nmero que responden NO a la cuestin Desea usted hacer huelga? fue de 80. Obtener una estimacin puntual y por intervalos de confianza del 95% para el parmetro proporcin total de individuos que desean hacer huelga en la fbrica. Resolverlo considerando que la muestra se tome con o sin reemplazamiento. Solucin: i) m.a.s con reemplazamiento: Datos conocidos N 10000 n 400 y k 80
ks
1 n
ks
varianza
yk 1 N
y k
ks
medio):
0.20.8 399
0. 0004;
Error de muestreo: VarP pwr 0. 02 Error de estimacin con una confianza del 95%: B 1. 96 VarP pwr 0. 0392 Intervalo de confianza: Dado que p P P pwr 1. 96 VarP pwr 0. 95
0. 16, 0. 239 intervalo de confianza del 95% para P. ii) m.a.s: Datos conocidos N 10000 n 400 y k 80
ks
y k
Estimacin puntual: P mas Estimacin de VarP mas VarP
1f n1
ks
80 400
0. 2 varianza
400 10000
la P1 P
1 0.20.8 399
(E.C.M.):
0. 000384;
Error de muestreo: VarP mas 0. 0195 Error de estimacin con una confianza del 95%: B 1. 96 VarP mas 0. 03822 Intervalo de confianza: Dado que p P P mas 1. 96 VarP mas 0. 95
0. 161, 0. 238 intervalo de confianza del 95% para P. 8.2 Un gelogo desea estimar la proporcin de oro en una grieta de roca a partir de una m.a.s. de n puntos, observando la presencia o ausencia del mineral. De qu tamao tiene que ser la muestra para que el error mximo cometido al estimar la proporcin sea como mucho 0.05 B con una confianza del 95%?. Solucin: p PP B p P P 1. 96 VarP 0. 95 Ecuacin resultante,
n0
n0 N
/ n0
k 2 P1P B2 n0 N
N N1
N N1
1 porque el
2 1 1 2 2
384. 16 y
0 n 385
11
12