Professional Documents
Culture Documents
El establecimiento Las Maras, que cuenta con 400 Has. de campo, dedicada a la
actividad agrcola ganadera, tiene intenciones de exportar trigo a la Repblica China,
para lo cul dispondra de 60 Has. del total para ese cultivo. De acuerdo a los
rendimientos obtenidos a lo largo de su trayectoria como agricultora, sabe
perfectamente que la produccin por cada Ha. se distribuye normalmente con una
media de 120 quintales y una desviacin estndar de 12 quintales
La administradora del establecimiento indica que el destino que se le piensa dar a
esas 60 Has. puede ser conveniente siempre que la cosecha media por Ha. esperada
se ubique entre los 115 y 123 quintales, con una probabilidad mayor al 85%.
Cul es el destino ms conveniente para esas Hectreas?
La respuesta a este tipo de problema se encontrar al estudiar el Mdulo IV
4.1. MUESTREO
Cuando iniciamos el estudio de esta asignatura, decamos que la misma estaba
constituida por el conjunto de mtodos y tcnicas que permitan estudiar una muestra
debidamente representativa de una poblacin a fin de poder determinar los valores
estadsticos para poder inferir con un cierto grado de bondad sobre los parmetros
poblacionales..
Realizar un censo de la poblacin es conveniente:
-1-
-2-
de este estudio ganador y por amplio margen a Landon. Sin embargo es Roosevelt
quien gana las elecciones por amplio margen. El error cometido estaba en que los
2.000.000 de encuestados pertenecan a la clase de mejores recursos y por lo tanto
tenan telfono y automviles y que en general respondan a los republicanos,
mientras que a Roosevelt, lo apoyaban las clases de menores recursos.
Cuando efectuamos un diseo muestral es necesario tratar de minimizar todos los
errores, sean muestrales o no muestrales. Ntese que no es solamente el error
cometido en la estimacin del parmetro sino en las decisiones resultantes de ellas,
las que por lo general dan lugar a prdida de dinero, claro que una mayor seguridad
en los resultados conlleva generalmente a un incremento del costo del diseo de la
muestra. En este texto centraremos la atencin en determinar que diseos muestrales
maximiza la probabilidad del xito de los resultados.
Clasificaremos las muestras como:
a- Probabilsticas
Muestras
b- No probabilsticas
a- Muestras probabilsticas
a) Cuando de una poblacin todas las muestras posibles del mismo tamao n
tienen la misma probabilidad de ser seleccionada reciben el nombre de
muestras aleatorias simples. Podramos ampliar esta definicin indicando que,
la definicin anterior implica en si misma que para tener una muestra aleatoria
simple, todos los elementos de la poblacin tienen la misma probabilidad de
ser elegido en una muestra. El muestreo aleatorio simple se complica cuando
la poblacin es muy grande, llegando en muchos casos a ser imposibles de
aplicar
En el caso de contar con una poblacin finita, se podra:
A -1 Efectuar un listado de todos los elementos de la poblacin y luego aplicar
un mtodo aleatorio para seleccionar los elementos que se habrn de
muestrear
-3-
A -2 Cuando la poblacin es finita y no muy grande se podra utilizar para este tipo de
muestreo la tabla de nmeros aleatorios. Esta tabla ha sido confeccionada con
ayuda de una computadora, la que ha generado una serie de valores de manera
azarosa (en realidad podramos decir que es pseudo azar). La lista de nmeros
aleatorios contienen los diez dgitos de nuestro sistema decimal, de 0 a 9 y consta
cada uno de ellos de cinco dgitos determinado cada uno de ellos de manera
totalmente azarosa. Su forma de uso es la siguiente:
1- Se numeran todos los elementos que conforman la poblacin, si la
misma estuviere formada por 1950 elementos el primero tendra la
numeracin de 0001.
2- A partir de cualquier nmero de la tabla de nmeros aleatorios pero
teniendo en cuenta que el nmero elegido este conformado por tantos
dgitos como la cantidad de dgitos que posee el ltimo elemento de la
poblacin.
3- A partir del nmero elegido se irn seleccionando los elementos de la
poblacin cuya numeracin coincida con los nmeros correlativos de la
tabla, en el orden elegido, teniendo en cuenta que un nmero de la
tabla no coincide con un numerado se deshecha como tambin en el
caso de repeticin
-4-
a) Caractersticas de la poblacin
Variabilidad de estadsticos:
b) Tamao de la muestra
c) Tipo de parmetro en estudio
-5-
Poblacin
x2
s2
n
x3
s3
n
xi
si
Consideramos una poblacin finita pero con un N lo suficientemente grande de forma
tal que, una muestra efectuada sin reposicin no modifique sus caractersticas.
Si consideramos ahora las medias de todas esas muestras y generamos con ellas
una distribucin tendramos lo que denominaremos una distribucin de medias
muestrales, esta distribucin tendr una media a la que denotaremos como x y un
desvo estndar
-6-
Trabajadores
A
B
C
D
E
Sumas
Xi Salarios $
400
400
500
600
600
Tabla 4.1
Media
500
500
500
500
500
(xi - )
-100
-100
0
100
100
( xi - )2
10000
10000
0
10000
10000
40000
2500
Poblacionales
2=
=
2500
= $500
5
media
40000
= $8000 Varianza
5
8000 = $ 89,44 Desviacin estndar
-7-
Grfico 4.1
2,5
frecuencia
2
1,5
1
0,5
0
300
400
500
600
700
salarios
frecuencia
2
1,5
1
0,5
0
200
300
400
500
600
700
800
salarios
Ahora bien, consideremos de esta poblacin todas las muestras posibles de dos
elementos cada una de ellas y que, de acuerdo a lo que ya vimos, su nmero estar
dado por las combinaciones de cinco elementos tomados de dos en dos 5C2 . Adems
de cada muestra determinemos su media tal como lo muestra la siguiente tabla 4.2.
Tabla 4.2
Muestras
A-B
A-C
A-D
A-E
B-C
B-D
B-E
C-D
C-E
D-E
Xi
800
900
1000
1000
900
1000
1000
1100
1100
1200
x
400
450
500
500
450
500
500
550
550
600
-8-
Con las medias de todas las muestras podemos generar una nueva distribucin la que
denominaremos Distribucin de Medias Muestrales de tamao 2 y de la cul
determinaremos
1) La media de la distribucin muestral
2) La varianza de la distribucin muestral
3) La desviacin estndar de las medias muestrales (el que como ya dijimos toma
el nombre de error muestral estndar de las medias para muestras de tamao
2)
4) Probabilidad de ocurrencia de las medias muestrales
Tabla 4.3
xi
400
450
500
550
600
fi
1
2
4
2
1
10
xi . fi Fri
400
900
2000
1100
600
5000
0,1
0,2
0,4
0,2
0,1
( xi - x ) ( xi - x )2.fi
-100
-50
0
50
100
0
10000
5000
0
5000
10000
30000
x =
5000
= 500$
10
Var ( x) =
30000
= $3000
10
x = 3000 = $54,77
4- La probabilidad de ocurrencia de las medias muestrales viene dada por la columna
de frecuencias relativas (i/n).
As, la probabilidad de que una muestra de tamao 2, tomada de esa poblacin,
proporcione un promedio salarial de $500 es de:
4 / 10 = 0,4
El histograma y polgono de frecuencias lo entrega el grfico 4.3
-9-
Grafico 4.3
4,5
4
frecuencia
3,5
3
2,5
2
1,5
1
0,5
0
300
400
450
500
550
600
700
salarios
probabilidad
Grafico 4.4
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
200
300
400
500
600
700
800
medias muestrales
Como conclusin podemos decir que, si de la poblacin se extraen todas las muestras
posibles y de cada una de ellas se determina su media, la distribucin generada con
las medias de todas las muestras presenta las siguientes caractersticas:
- 10 -
= 10 muestras
y con las mismas generemos una nueva tabla 4.5 que nos entrega la suma y la media
de los elementos de cada una de las muestras
Tabla 4.5
muestras
A-B-C
A-B-D
A-B-E
A-C-D
A-C-E
A - D -E
B-C-D
B-C-E
B-D-E
C-D-E
xi
Xi
1300
1400
1400
1500
1500
1600
1500
1500
1600
1700
433,33
466,67
466,67
500,00
500,00
533,33
500,00
500,00
533,33
566,67
Con las medias de todas las muestras de tamao n=3 se genera una nueva
distribucin de muestreo tal como lo muestra la tabla 4.6.
Tabla 4.6
x
433,33
466,67
500,00
533,33
566,67
fi
1
2
4
2
1
10
x . fi
433,33
933,34
2000
1066,66
566,67
5000
fri
0,1
0,2
0,4
0,2
0,1
1
( x - x )
( x - x )2.fi
-66,67
-33,33
0,00
33,33
66,67
0
4444,8889
2221,7778
0
2221,7778
4444,8889
13333,3334
- 11 -
x =
5000
= 500$
10
Var ( x) =
13333,33
= 1333,33$ 2
10
x = 1333,33 = $36,51
4- Tambin podemos determinar la probabilidad de ocurrencia de medias muestrales
de forma tal que la probabilidad que en una muestra de tamao 3 se obtenga una
media de ingresos de $466,67 ser de 0,2
Los grficos correspondientes a esta distribucin son 4.5 y 14.6:
Grafico 4.5
4,5
4
frecuencia
3,5
3
2,5
2
1,5
1
0,5
0
400
433,33
466,67
500,00
533,33
566,67
600,00
Ingresos
- 12 -
Grafico 4.6
Probabilidad
0,5
0,4
0,3
0,2
0,1
0
300
400
500
600
Ingresos
Tabla 4.7
Tamao de la
muestra: n
2
3
Media
$ 500
$ 500
Desviacin
estndar
$54,77
$36,51
Rango o
recorrido
600 400 =200$
566,67
433,33=133,34
- 13 -
menor al desvo estndar poblacional, denominado error muestral estndar cuyo valor
es igual a x =
Resumiendo:
1- La distribucin de las medias muestrales para n grande es normal
donde:
- 14 -
( N n)
de tal manera que:
( N 1)
fc=
x =
( N n)
( N 1)
En este ltimo concepto debemos tener en cuenta los casos analizados debido a que
la poblacin es finita y el tamao de la muestra en ambos casos es mayor al 5% del
tamao poblacional
En la distribucin de las medias muestrales para n = 2, su desvo estndar nos dio el
valor de:
x = $54,77
y de acuerdo al teorema del Lmite Central y teniendo en cuenta el factor de correccin
x=
( N n)
89,44 (5 2)
=
.
= $54,77
( N 1)
5 1
2
x = $36,51
Aplicando el teorema y el factor de correccin tendremos:
89,44
=
(5 3)
= $36,51
(5 1)
- 15 -
Si se pudieren sacar todas las muestras posibles de 36 hogares cada una de ellas, y
de cada una obtuviramos su consumo medio, con las medias de todas las muestras
se generara una distribucin muestral de consumos medios y tamao 36, cuya media
coincide con la media poblacional la cul no es conocida. La media de la muestra
diferir respecto a la media de la distribucin muestral en z x :
F(X)
z. x
x =
z. x = x
despejando z tendremos:
z=
z=
x
0,5
= 0,4918
1,25
36
- 16 -
P( x ) =0,9836
p =
p.q
n
3
= 0,5
6
- 17 -
Vendedores
A
B
C
X
Y
Z
p=
3
= 0,5
6
Tabla 4.8
xi - p
0,5
0,5
0,5
-0,5
-0,5
-0,5
Xi
1
1
1
0
0
0
3
(xi p)2
0,25
0,25
0,25
0,25
0,25
0,25
1,5
q = 1 p = 0,5
Var(x) =
(xi - p)
=
=
1,5
6
Var ( x)
1,5
= 0,5
6
p.q
Consideremos ahora todas las muestras posibles de tamao n = 4 cada una de ellas, y
para cada una de las muestras la cantidad de extranjeros obteniendo as la
proporcin correspondiente.
Se pretende determinar:
a) las proporciones de extranjeros en las muestras
b) la media en la distribucin de las proporciones muestrales
c) la varianza y desviacin estndar en la distribucin de las
proporciones muestrales.
- 18 -
Total de muestras:
6C4
= 15
Extranjeros
No
Extranjeros
pi
A
B
C
AB
AB
AB
AC
AC
AC
BC
BC
BC
ABC
ABC
ABC
Total
XYZ
XYZ
XYZ
XY
XZ
YZ
XY
XZ
YZ
XY
XZ
YZ
X
Y
Z
0,25
0,25
0,25
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,75
0,75
0,75
7,5
fi
pi.fi
(pi - P)2.fi
0,25
0,5
0,75
3
9
3
15
0,75
4,5
2,25
7,5
0,1875
0
0,1875
0,375
p =
p =
p . fi
i
N
7,5
= 0,5 = p
15
- 19 -
Var( p ) =
(pi p ) . fi =
2
p=
(( p
p ) 2 . fi )
N
0,375
= 0,1581
15
p*q
N
p =
p =
p*q
*
N
0,5 * 0,5
*
4
N n
N 1
64
= 0,158
6 1
p =
p.q
N
Recordar:
Cuando la relacin entre el tamao de la muestra n y el de la poblacin N es
mayor o igual a 0,05 debemos aplicar el factor finito de correccin:
- 20 -
x=
N n
para la distribucin de medias muestrales
N 1
N n
para la distribucin de proporciones
N 1
p.q
n
p=
muestrales
N n
tiende a ser igual a 1 y su incidencia es nula o
N 1
insignificante.
RESOLUCIN
Ya estamos en condiciones de poder resolver el problema planteado al inicio de esta
unidad.
Las 60 Has disponibles se consideran como una muestra n = 60 y si se pudieran tomar
todas las muestras posibles de n= 60 cada una de ellas, el rendimiento medio de cada
una de ellas conformaran una distribucin normal
Con una media x igual a la media de 120 quintales por Ha y un desvo estndar de:
x =
z=
xx
reemplazando
x
x = 120
z=
123
123 120
= 1,936
12
60
xx
= 1,25
12
60
- 21 -
La probabilidad de que el rendimiento medio se ubique entre los lmites fijados ser:
P(115 < x <123 ) = 0,4736 + 0,5 = 0,9736
La probabilidad de que el rendimientos medio de quintales por Ha. sea menor a 123 y
mayor a 115 es del 97,36%, por lo que como supera al 85% ser aconsejable sembrar
para exportacin las 60 Has. con trigo.
4.3.
ESTIMACIN
El hombre permanentemente se encuentra haciendo estimaciones. Estima el gerente
de marketing las ventas del prximo mes, estima el gerente de produccin la cantidad
de mano de obra necesaria para un perodo de produccin , el gerente de una entidad
bancaria efecta una estimacin sobre el cumplimiento de un cliente para el
otorgamiento de un crdito o descubierto, estima la ama de casa estima las
cantidades de comestible necesaria para que toda la familia sea satisfecha con una
comida, estima el peatn la velocidad del automvil que se desplaza en su direccin
y en funcin de esa estimacin decide si cruza la calzada caminando, con paso
acelerado o corriendo y de la misma manera que el grado de exactitud de la
estimacin permite la continuidad de un gerente en su puesto, tambin define el futuro
del peatn.
Cuando en la primera unidad definamos a Estadstica como El conjunto de tcnicas
y mtodos que permiten estudiar una muestra debidamente representativa de una
poblacin para determinar los valores estadsticos, a fin de poder con ellos inferir con
un cierto grado de bondad sobre los parmetros de la poblacin, quedaba claro que el
objetivo final era el de inferir algo acerca de una poblacin a partir de la informacin
adquirida de una muestra y justamente la inferencia estadstica esta basada en la
estimacin.
En esta unidad no solo veremos como se puede estimar la media o proporcin de una
poblacin, sino que tambin estimaremos el error con que estimamos al parmetro ya
que calcular la porcin exacta o la media exacta sera una meta imposible de obtener.
- 22 -
x=
( xi. fi)
n
- 23 -
x1
Tamao n
Poblacin
Tamao N
Tamao n
x2
Tamao n
x3
Tamao n
xi
Para una muestra cualquiera, su media estar ubicada bajo la curva a una distancia
mxima E de la media poblacional, por lo tanto si estimamos la media poblacional a
travs de la media de esa muestra cometemos un error, el cul est dado por E.
F( x )
x =
- 24 -
desvo estndar de esa distribucin que denominamos como error muestral estndar,
es:
E=z x = x
Si tenemos en cuenta que
x =
error estndar
Para una poblacin determinada, esta tiene definido su desvo estndar y por lo tanto
el error muestral queda sujeto a la variacin del tamao de la muestra y del grado de
seguridad con que se quiera estimar el parmetro.
Los grados de seguridad ms utilizados son los de: 90%, 95%,98% y 99%.
Supongamos adoptar un valor de seguridad del 95% en la estimacin puntual de la
media poblacional, esto implica que el valor de z = 1,96, y el rea encerrada por la
curva normal en el intervalo - 1,96. x y +1,96 x es de 0,95, esto adems
indica que, el 95% de todas las muestras tienen una media comprendida en ese
intervalo.
El nivel de confianza que se establezca define el valor de z, el cul se extrae de la
tabla de distribucin normal estndar, para lo cul debe ingresarse a dicha tabla a
partir de la superficie correspondiente a la confianza establecida, los ms utilizados se
entregan en la tabla:
Tabla 4.9
Nivel de confianza
Z
90%
1,645
95%
1,96
98%
2,33
99%
2,575
- 25 -
( x 1,96. )
la probabilidad de que la
media poblacional est comprendida en ese intervalo ser del 95%, el 5% restante es
la probabilidad de que justamente la muestra elegida posea una media que no que no
est comprendida en el intervalo 1.96. x .
LIC = x Z . x
( Z . )
x
determinada bondad.
.
F( x )
95%
-z x
+z x
E
x
E
- 26 -
Lic= x -E
Lsc= x +E
E=zx
Siendo x =
RECORDAR
E=z x
x =
Ejemplo 1:
El propietario de un restaurante desea determinar el tiempo promedio que una pareja
ocupa una mesa. A estos efectos tom los tiempos que emplearon las ltimas 50
parejas y determin un tiempo promedio de 80 con una desviacin estndar de 15.
Se desea:
a) Estimar puntualmente el verdadero tiempo promedio () que dedica a cada
comensal.
b) Estimar el verdadero tiempo promedio () mediante un intervalo de confianza del
95%.
Solucin:
Teniendo en cuenta que los datos son:
n = 50
x = 80
= 15
la bondad establecida es del 95% por lo que el valor de :
z = 1,96
Estimacin puntual:
= x = 80'
Estimacin por intervalo:
x =
15
50
= 2,121
- 27 -
Ejemplo 2:
Debido a la necesidad de ahorrar energa el gobierno comunal de una localidad
realiz un muestreo de 81 viviendas a los efectos de determinar el consumo promedio
diario de cada una de ellas. El informe del estudio realizado indicaba que los
consumos diarios por hogar varan normalmente con una media de 15 Kw. diarios y un
desvo estndar de 3.
Se solicita determinar:
a) El consumo puntual promedio de todos los hogares
b) El intervalo de consumo que contenga al promedio de todos los hogares de esa
comunidad con una seguridad del 98%.
Solucin:
Teniendo en cuenta que: n = 81 viviendas
x = 15 Kw. diarios
= 3 Kw. diarios
Un grado de seguridad del 98% implica un:
z = 2,33
El desvo estndar de la distribucin muestral para tamao de muestra 81:
x =
a)
Estimacin puntual
3
81
= 0,33 Kw.
= 15
Significa que con un 98% de certeza el consumo promedio real por vivienda
y por da esta dentro de estos valores.
- 28 -
p =
p.q
n
p =
p.(1 p )
n
( N n)
( N 1)
p =
p.q
.
n
( N n)
( N 1)
p - z . p
- 29 -
p.q
error muestral estndar de las proporciones
n
p =
Ejemplo 3
La caja de Jubilaciones de una Provincia de la Argentina ha determinado que de los
ltimos 100 empleados pblicos que deciden iniciar los trmites de jubilacin sin
recurrir a ningn gestor es del 40%.
Se solicita determine:
a)
Puntualmente la proporcin poblacional de empleados que
encaran personalmente su jubilacin
b)
Genere un intervalo de confianza que contenga a la
proporcin poblacional con una bondad del 95%
Datos:
n = 100
p = 0,4 por lo que:
q = 1 p = 0,6
a) Estimacin puntual :
p = p = 0,4
p = 40%
Error muestral estndar de las proporciones, adoptaremos en este caso como
proporcin poblacional la proporcin de la muestra:
p =
0,4 * 0,6
=0,049
100
b) Intervalo de Confianza
Lic = p z. p
Lsc = p + z. p
Lic = 0,4 1,96 * 0,049
Lsc = 0,4 + 1,96 * 0,049
Es decir que la proporcin de todos los empleados pblicos que realizan sus trmites
jubilatorios sin intervencin de gestores se ubica en el intervalo
- 30 -
(30,39% y 49,6%)
Ejemplo 4:
Los estudiantes de una Universidad analizan la posibilidad de tomar el establecimiento
debido a las medidas rectorales que no permiten la actuacin del Centro de
Estudiantes. A los efectos de determinar el porcentaje de estudiantes que estn a
favor de esa medida se entrevistaron 150 alumnos de los cuales 40 de ellos indicaron
estar a favor de la medida. Se solicita:
a) Determine puntualmente el porcentaje de todos los alumnos que se plegaran a
la medida
b) Estime un intervalo de confianza del 95% que contenga al porcentaje
poblacional.
Datos:
Tamao de la muestra
n = 150 alumnos
Alumnos a favor de la medida: x = 40
Porcentaje muestral
p=
x 40
=
n 150
p = 26,67%
Estimacin Puntual
p = p = 26,67%
Estimacin por intervalo con una confianza de confianza del 95%
p =
Adoptando
p*q
n
p = p = 26,67%
Q = 1 p = 73,33%
p=
(0,2667.0,7333)
= 0,0361
150
- 31 -
4.3.4
Una de las dudas que se le presenta a todo alumno cuando estudia muestreo es el de
determinar cual es el tamao de la muestra necesaria para que, el estadstico
necesario para efectuar la correspondiente inferencia, tenga la mayor exactitud. Y por
lo tanto el error cometido cuando se infiere el parmetro sea el menor posible o el
que estemos dispuestos a aceptar.
Estudiaremos como definimos el tamao de la muestra para la determinacin de la
media y tambin para la determinacin de la proporciones.
x=
z. * 2
)
E
cometer,
se
se
conoce
- 32 -
Z:
Define
el
grado
inferencia.
n : Tamao de la muestra.
de
seguridad
con
que
se
efecta
la
Ejemplo.
Una Empresa dedicada a cultivos de ctricos en el sur del Pas sabe que los pesos de
las naranjas de su plantacin varan normalmente con un desvo estndar de 7 grs. y
necesita estimar el peso promedio de todas las naranjas de esa plantacin, teniendo
en cuenta que el error que se pretende cometer en la estimacin no sea mayor a un
gramo del peso con una seguridad del 95%.
Aplicando la expresin que determina el tamao de una muestra, y teniendo en
cuenta que el valor de z, para una bondad del 95% es de 1,96, tendremos:
z.
n=
1, 96.7
n=
n = 189 naranjas.
x n x1
k
- 33 -
Una vez que se toma una muestra del tamao adecuado el resultado de la muestra
debe de ser evaluado, a tales efectos debe determinarse el desvo estndar de la
media x si el producto z. x (error de estimacin) es menor que el error
especificado; la estimacin de la muestra es considerada satisfactoria. En caso de que
el error encontrado sea mayor el tamao de la muestra deber ser incrementada.
p =
y
p.q
n
E = z . p
z
n = pq
E
- 34 -