You are on page 1of 58

TEOREMA CENTRAL

DEL LÍMITE
Teorema Central del Límite
 Sean X
i
(i = 1, 2,…, n) variables aleatorias
independientes con la misma distribución,
tales que, E(X
i
) = μ, V(X
i
) = σ
2
 Definimos la variable aleatoria S como:


 Si n → ·, entonces, aproximadamente
S ~ N(nμ , nσ
2
)
¿
=
=
n
i
i
X S
1
Ejemplo
 El peso de ciertos motores tiene una media
de 30 kg y una desviación estándar de 4 kg
 Se extrae una muestra al azar de 100 de
estos motores
 Encontrar aproximadamente la probabilidad
de que el peso total de los100 motores sea
de a lo más 3060 kg
 Asuma independencia entre los pesos de
los motores
Solución
9332 , 0 ) 5 , 1 ( )
1600
3000 3060
( ) 3060 ( = u =
÷
u = s S P
) 1600 , 3000 ( ~
1600 4 100 , 3000 30 100
. 4 . 30
) 100 ,..., 1
:
2 2
100
1
N S
X S
kg kg
i X
Sea
aprox
S S
i
i
i
= × = = × =
= =
= =
= =
¿
=
o µ
o µ
motores 100 los de total peso
( motor ésimo - i del peso
Ejemplo
 La longitud de ciertos cables tiene una
distribución uniforme entre 3 y 5 metros.
 Se extrae una muestra al azar de 50 de
estos cables.
 Encontrar aproximadamente la
probabilidad de que la longitud total de los
50 cables sea de a lo más 207 metros.
 Asuma independencia entre las longitudes
de los cables

Solución
3333 , 0
12
) 3 5 (
) (
4
2
5 3
) (
) 5 , 3 ( ~
2
2
=
÷
= =
=
+
= =
=
=
i
i
i
i
X V
X E
U X
X
o
µ
50) ..., 2, 1, (i
cable ésimo - i del metros, en longitud,
… sigue solución







La probabilidad de que la longitud total de los 50
cables sea de a lo más 207 metros es 95,46%
) 665 , 16 ; 200 (
665 , 16 3333 , 0 50 , 200 4 50
2
50
1
N S
X S
S S
i
i
aprox
~
cables 50 de total longitud
= × = = × =
= =
¿
=
o µ
9546 , 0 ) 71 , 1 ( )
665 , 16
200 207
( ) 207 ( = u =
÷
u = s S P
Aproximación de la binomial
por la normal
 Sea X ~ B(n,p) (μ = np, σ
2
= npq)


 Si n → ·, entonces, por el TCL:
X ~ N(np, npq)
 En general, la aproximación es buena si:
n≥30 np>5 y n(1-p)>5
ntes independie aleatorias variables
con
s X
n i p Bernoulli X X X
i
i
n
i
i
´
,..., 1 ) ( ~
1
= ¬ =
¿
=
ESTADÍSTICA
INFERENCIAL
El muestreo
 En muchos problemas, los datos de sólo una parte de la
población (muestra), pueden dar la información
necesaria para tomar una decisión o probar una
hipótesis referente a la población o universo.
 El objetivo del muestreo es seleccionar una muestra que
sea representativa de la población. Para esto, se debe
determinar el método adecuado de selección, el tamaño
correcto de la muestra y la técnica de estimación que se
usará posteriormente.
Observaciones
 La mayoría de los métodos estadísticos se basan en
la independencia y la representatividad del muestreo
aleatorio simple.
 Los resultados que estudiaremos a continuación
responden únicamente al muestreo aleatorio simple.
Si se usan otros métodos de muestreo, los
resultados deben modificarse.
 No existe inferencia estadística fiable sin un diseño
aleatorizado. El muestreo aleatorio garantiza
estadísticamente la validez de los resultados.
(Basado en: La Estadística en Cómic, L. Gonick y W. Smith)
Muestra aleatoria
 Una muestra aleatoria de tamaño n de la
población descrita por la variable aleatoria
X, es un conjunto de n variables aleatorias:
X
1
, X
2
,…, X
n
independientes y con la misma
distribución que la variable aleatoria X.
Media y varianza de las v.a. de la
muestra aleatoria
 Sea X es una variable aleatoria con:
 E(X) = μ y V(X) = σ
2

 Si X
1
, X
2
,…, X
n
es una muestra aleatoria de
la población definida por la variable
aleatoria X, entonces
 E(X
i
) = μ, V(X
i
) = σ
2
(i = 1, 2,…, n)
Estadístico y distribución
muestral
 Un estadístico es una función de las variables
de una muestra aleatoria
 Un estadístico es una variable aleatoria
 Una distribución muestral es la distribución de
probabilidades de un estadístico
Distribuciones muestrales
de algunos estadísticos
importantes
 Distribución de la media muestral
 Distribución de la proporción muestral
 Distribución de la varianza muestral

Ejemplo
(Distribución de la media muestral)
 Por estudios anteriores se sabe que en un
banco, el saldo en las cuentas de sus
ahorristas tiene una media de 2500 soles y
una desviación estándar de 400 soles.
 Encontrar la probabilidad de que el saldo
medio en una muestra de 50 cuentas esté
entre 2350 y 2650 soles.
Solución:
 X = saldo en soles en una cuenta
 μ = 2500, σ = 400, σ
2
= 400
2

) , (
,
__
__
__ __
3200 2500 N ~ X
3200
50
400
2500
cuentas 50 de
muestra la en medio saldo
50
X
X
aprox
2
2
X X
50
1 i
i
= = o = µ
=
¿
=




9920 , 0 ) 65 , 2 ( ) 65 , 2 (
)
3200
2500 2350
( )
3200
2500 2650
(
) 2650 2350 (
__
= ÷ u ÷ u =
÷
u ÷
÷
u =
< < X P
La probabilidad de que el saldo medio en la muestra de
50 cuentas esté entre S/.2350 y S/.2650 es
aproximadamente del 99,2%
Ejemplo
(Distribución de la proporción muestral)
 En cierto banco se ha calculado que el
17% de los clientes que poseen fondos
mutuos son personas retiradas.
 Se toma una muestra aleatoria de 500
clientes del banco que poseen fondos
mutuos.
 Encontrar la probabilidad de que al
menos el 20% de los clientes de la
muestra sean personas retiradas.
Solución:
 P = Proporción de personas retiradas en la
muestra de 500 clientes
p = 0,17
) 0002822 , 0 ; 17 , 0 (
0002822 , 0
500
83 , 0 17 , 0
, 17 , 0
500
__
2
__ __
N P
n
P P
~
=
×
= =
=
o µ
… sigue solución
0367 , 0 )
0002822 , 0
17 , 0 20 , 0
( ) 20 , 0 (
:
) 0002822 , 0 ; 17 , 0 ( ~
__
=
÷
> = > Z P P P
calcular Debemos
N P
Hay una probabilidad aproximada de 0,0367 de
que en una muestra de 500 accionistas con fondos
mutuos encontremos al menos 20% de personas
retiradas.
ESTIMACIÓN DE
PARÁMETROS
Estimación de parámetros
 La población se identifica con una v.a. X
 No conocemos sus parámetros.
 De la población se obtiene una muestra
aleatoria.
 A partir de la muestra, intentamos
estimar los parámetros.
Métodos de estimación
 Estimación puntual
 Parámetro = Número
 Estimación por intervalos
 Parámetro e[a, b] con un nivel de
confianza (1-o)*100%
Estimador puntual
 Un estimador puntual es un estadístico que
se usa para estimar un parámetro.
 Al ser un estadístico, es una variable
aleatoria.
 A la desviación estándar de un estimador
se le denomina error estándar del
estimador.

Estimación puntual
 Sean x
1
, x
2
,…, x
n
los valores experimentales de
una muestra aleatoria X
1
, X
2
,…, X
n
de la
población definida por la v.a. X.
 Si es un estimador puntual del
parámetro O, entonces
es una estimación puntual del
parámetro O
) ,..., (
ˆ
1 n
X X O
) ,..., (
ˆ
1 n
x x u
Ejemplos de estimadores puntuales
. l poblaciona varianza la
de puntual estimador es muestral varianza La . 3
. l) poblaciona n (proporció
población la en éxito de ad probabilid la
de puntual estimador es muestral proporción La . 2
. l poblaciona media la
de puntual estimador es muestral media La 1.
2
2
o
µ
S
p
P
X
Sesgo de un estimador
 Sea estimador puntual del parámetro u
 El sesgo de es:


 es un estimador insesgado de
parámetro u sí y solo sí

O
ˆ
u ÷ O = O )
ˆ
( )
ˆ
( E sesgo
O
ˆ
O
ˆ
u = O · = O )
ˆ
( 0 )
ˆ
( E sesgo
Ejemplos
X
 es un estimador insesgado de µ

 es un estimador insesgado de p

 es un estimador insesgado de o
2

P
( ) µ = X E
( ) p P E =
2
S
2
2
1
2
)
1
) (
( ) ( o =
÷
÷
=
¿
=
n
X X
E S E
n
i
i
Estimador más eficiente
 Dados dos estimadores insesgados de un
parámetro, es más eficiente el que tiene
menor varianza

Ejemplo
 Sea X
1
, X
2
,…, X
n
una muestra aleatoria de
la variable aleatoria X, con E(X
i
) = μ,
V(X
i
) = σ
2
(i = 1, 2,…, n)
 Sean




dos estimadores de µ

5
ˆ
5
1
2
¿
=
= O
i
i
X
10
ˆ
10
1
1
¿
=
= O
i
i
X




.
ˆ ˆ
)
ˆ
( )
ˆ
(
5
)
ˆ
(
10
)
ˆ
(
.
ˆ ˆ
)
ˆ
( )
ˆ
(
2 1
2 1
2
2
2
1
2 1
2 1
O O
÷ O < O
÷ = O = O
O O
÷ = O = O
que eficiente más es
V V
V y V
insesgados son y
E y E
o o
µ µ
Estimación por intervalos
de confianza
Intervalo de confianza
 Sean x
1
, x
2
,…, x
n
los valores observados de una
muestra aleatoria X
1
, X
2
,…, X
n
de la variable aleatoria X
que depende del parámetro desconocido θ.
 Sean A = H(X
1
,…, X
n
) y B = G(X
1
,…, X
n
) dos
estadísticos tales que P(A ≤ θ ≤ B)= 1-o.
 Si a = H(x
1
,…,x
n
) y b = G(x
1
,…,x
n
), entonces
I(θ) = [a , b] es la estimación por intervalo de confianza
para θ al nivel de confianza de (1-o)*100%.
Interpretación del nivel de confianza
Ejemplo: Nivel de confianza = 95%
 Si se seleccionan repetidamente 1000 muestras
de tamaño n, y calculamos la media de cada una de
ellas, podremos realizar 1000 estimaciones por
intervalo de confianza para la media poblacional µ.
 Se espera o confía que aproximadamente 950 de
ellas contengan el parámetro µ y las restantes no lo
contengan.
Estimación por intervalo para la media
a un nivel de confianza del 95%
Intervalos a
95% de
confianza
para μ,
generados
con once
muestras
de tamaño
n
Figura: http://www.fisicanet.com.ar/matematica/estadisticas/ap1/estadistica06.gif
Ejemplos de estimación por
intervalos de confianza
Ejemplo
 Para estimar el precio medio de las guías
turísticas para visitar el Cusco se elige una
muestra aleatoria formada por 34 guías y se
determina que la media muestral es de S/.34,90
 Por estudios realizados anteriormente se sabe
que la desviación estándar de los precios de
estas guías es de S/.4,50
 Construya un intervalo de confianza para el
precio medio de las guías turísticas para visitar el
Cusco, al nivel del 95 %. Interprete
Solución:
n
x
n
x
o
µ
o
96 . 1 96 . 1 + s s ÷
El intervalo de confianza al 95% está dado por:



Reemplazando los datos tenemos:





Se estima que el precio medio de las guías de turismo
para visitar el Cusco, está entre S/.33,39 y S/.36,41, con
una confianza del 95%
41 , 36 39 , 33
34
5 , 4
96 , 1 9 , 34
34
5 , 4
96 , 1 9 , 34
s s
+ s s ÷
µ
µ
Ejemplo
 Se desea estimar la longitud media de
ciertos cables. En una muestra de 100
cables se encuentra que la longitud tiene
una media de 80m y una desviación
estándar de 15m.
 Hallar un intervalo con una confianza del
95%, para la media de las longitudes de los
cables.
Solución:




m. 82,94 y m 77,06 entre estará cables los de media
longitud la que estima se confianza de 95% un Con
metros) (en cables los de media longitud
] 94 , 2 80 [ ] 5 , 1 96 , 1 80 [ ) (
5 . 1
100
15
ˆ
15 , 80 : 100
96 , 1
975 , 0
2
1 1 95 , 0 . .
__ __
975 , 0
± = × ± =
= = = ~
= = =
= ÷
= ÷ ÷ ÷ = =
=
µ
o o
o
o
µ
I
n
s
s x n
z
C N
x
X X
x
Ejemplo
 Los pesos, en kg, de 10 motores marca
ACME fueron: 42, 35, 28, 39, 47, 40, 31,
44, 37, 51.
 Si la distribución de los pesos es normal,
estimar con intervalos de confianza del
95% la media y la desviación estándar de
los pesos de los motores marca ACME.
Solución:



kg. 44,44 y 34,36 entre estará motores los de medio
peso el que estima se confianza de 95% un Con
: calculamos datos los De
kg.) (en motores los de medio peso
] 0379 , 5 4 , 39 [ ] 227 , 2 2622 , 2 4 , 39 [ ) (
227 , 2
10
04 , 7
2622 , 2
975 , 0
2
1 1 95 , 0 . .
. 04 , 7 4 , 39 : 10
) 9 , 975 . 0 (
± = × ± =
= =
= ÷
= ÷ ÷ ÷ = =
= = =
=
µ
o
o
µ
I
n
s
t
C N
kg s kg x n
x
x
Solución:



0228 , 19 7004 , 2
975 , 0
2
1 1 95 , 0 . .
. 04 , 7 10
) 9 , 975 . 0 (
2
) 9 , 025 . 0 (
2
= = ÷
= ÷ ÷ ÷ = =
= =
=
_ _
o
o
o
C N
kg s n
x
: que teníamos datos los De
kg.) (en motores de pesos los de estándar desviación
( )
( ) ( )
] 85 , 12 ; 84 , 4 [
7004 , 2
) 04 , 7 ( 9
,
0228 , 19
) 04 , 7 ( 9 1
,
1
2 2
2
1 ,
2
2
2
1 ,
2
1
2
=
(
(
¸
(

¸

× ×
=
(
(
(
(
¸
(

¸

÷ ÷
=
÷ ÷ ÷ n n
s n s n
I
o o
_ _
o
Ejemplo
 En una muestra aleatoria de 100 clientes de
una empresa de telefonía celular, se encontró
que 28 de ellos presentaron quejas por fallas
en el servicio durante el mes de abril.
 Hallar un intervalo con una confianza del
90%, para la proporción de clientes de esta
empresa que presentaron quejas por fallas en
el servicio, durante el mes de abril.
Solución:
] 074 , 0 28 , 0 [ ] 045 , 0 645 , 1 28 , 0 [ ) (
045 , 0
100
) 72 , 0 )( 28 , 0 (
ˆ
28 , 0
100
28
: 100
645 , 1 05 , 0
2
1 90 , 0 . .
__ __
05 , 0
± = × ± =
= = ~
= = =
= ÷ = ÷ ÷ = =
=
p I
p n
z C N
p
P P
o o
o
o
abril en servicio el en fallas por
quejas n presentaro que clientes de proporción
El porcentaje de clientes que presentaron quejas por fallas en el
servicio, durante el mes de abril, se estima entre 20,6% y 35,4%
con una confianza del 90%
Intervalo de confianza
 La forma general de una estimación por intervalo
es: Estimación puntual ± margen de error
 El margen de error determina qué tan precisa es
la estimación realizada, y este valor depende de
los siguientes factores:
 Tamaño de la muestra: n
 Nivel de confianza: (1-o)
 Variabilidad de la población: o

Tamaño de muestra para
estimar μ
 Para tener una confianza de (1-o) de que
el margen de error o error de estimación,
al estimar la media poblacional con la
media muestral, sea de a lo más e
unidades:
__
2
1
__
1 ) | (|
X
z e
e X P
o
o µ
o
× =
÷ ÷ = s ÷
÷
Tamaño de muestra para
estimar μ
 Si la población es infinita o el muestreo es
con reposición, entonces:

2
2
1
2
1
__
|
|
|
.
|

\
|
×
=
÷ × = ÷ =
÷
÷
e
z
n
n
z e
n
X
o
o o
o
o
o
Tamaño de muestra para
estimar μ
 Si σ es desconocida, para encontrar el
tamaño de muestra, σ se estima por s
x
.
Ejemplo
 El peso de los motores marca TEC, es
una variable con una desviación estándar
de 7,04 kg
 Hallar el tamaño de muestra para que con
una confianza del 99% el error de
estimación, al estimar la media
poblacional por la media muestral, sea de
a lo más 2 kg
 X = peso (en kg) σ = 7,04 kg , e = 2 kg.






 Basta tomar una muestra de 83 motores para que la
estimación del peso medio, al 99% de confianza, tenga
un error máximo de 2 kg.


83 15 , 82
2
04 , 7 575 , 2
575 , 2
995 , 0
2
1 1 99 , 0 . .
2
995 , 0
= ÷ = |
.
|

\
| ×
=
= ÷
= ÷ ÷ ÷ = =
n n
z
C N
o
o
Tamaño de muestra para
estimar p
 Para tener una confianza de (1-o) de que el
error de estimación, al estimar la
proporción poblacional por la proporción
muestral, sea de a lo más e*100% :
__
2
1
__
1 ) | (|
P
z e
e p P P
o
o
o
× =
÷ ÷ = s ÷
÷
Tamaño de muestra para
estimar p
 Si la población es infinita o el muestreo es
con reposición, entonces:

2
2
1
2
1
__
|
|
|
.
|

\
|
=
÷ = ÷ =
÷
÷
e
pq z
n
n
pq
z e
n
pq
P
o
o
o
Tamaño de muestra para
estimar p
 Como p es desconocida (p es el
parámetro que se desea estimar), para
encontrar el tamaño de muestra, p se
estima usando una estimación previa
disponible o por 0,5.
Ejemplo
 Se desea estimar la proporción de clientes
de la empresa de telefonía celular que
presentaron quejas por fallas en el servicio
durante el mes de abril.
 Hallar el tamaño de muestra para que con
una confianza del 95% el error de
estimación, al estimar la proporción
poblacional por la proporción muestral, sea
de a lo más 4%.

Solución:


601 25 , 600
04 , 0
5 , 0 5 , 0 96 , 1
5 . 0 04 , 0
96 , 1 975 , 0
2
1 1 95 , 0 . .
2
975 , 0
= ÷ =
|
|
.
|

\
|
× ×
=
~ =
= ÷ = ÷ ÷ ÷ = =
n n
p e
z C N
o
o
Para cumplir los requerimientos, se debe tomar
una muestra de 601 clientes