You are on page 1of 15

Intervalos de conanza

Nicolas Saintier

22 de octubre de 2014
Ejemplo

El gerente de un supermercado quiere estimar el tiempo promedio µ


que pasan sus clientes en su local. Para eso seleccionamos al azar n
clientes y preguntamos a cada uno cuanto tiempo pasó en el local.
Obtenemos n variables aleatorias T1 , .., T donde
n

T = tiempo pasado por el i-esimo cliente en el local.


i

Las T son independientes (si suponemos que los clientes


i

interrogados no tienen ninguna relación entre ellos) y tienen todas


la misma distribución (el tiempo que pasa un cliente cualquiera en
el local). En particular tienen esperanza

E (T ) = µ
i para todo i = 1, .., n.

PodemosPentonces intentar aproximar µ por el promedio


T̄ := 1
n =1 T de los T .
n
n

i i i
Ejemplo

pregunta: usando los datos muestrales T1 , ..., T , se puede armar


n

un intervalo [a, b] de forma tal que



P a ≤ µ ≤ b) ≈ 0,9

o sea un intervalo que contenga a µ con proba ≈ 0,9 ?

Un tal intervalo se llama intervalo de conanza para µ de conanza


asintótica 0,9.
Formulación abstracta del problema

Tenemos una va X y una muestra X1 , .., X de tamano n de X (es


n

decir n va independientes con misma distribución que X )

Usando los X queremos estimar µ := E (X ).


i

Nota: en general se busca estimar alguna cantidad θ que involucre


X (por ejemplo su esperanza, su varianza, o si X tiene una
densidad dependiendo de un parametro este mismo parametro
(pensar en las distribuciones exponenciales, normales ... que
dependen de uno o más parámetros)).
Denición de intervalo de conanza (IC)

Denición
Un intervalo de conanza (IC) para µ de conanza 1 − α es un
intervalo [a, b] con a y b funciones de X1 , .., X tal que
n

P (a ≤ µ ≤ b) = 1 − α.

En el caso que

lím
n →+∞ P (a ≤ µ ≤ b) = 1 − α,

hablamos de IC de conanza asintótica 1 − α.


Note que a y b dependen de la muestra: son aleatorios.
Procedimiento general (1)

Usamos el promedio muestral X̄ := 1 =1 como estimador de µ.


n
P
n i
n

Tiene sentido ya que X̄ ≈ E (X1 ) = µ cuando n es grande según la


n

Ley de los Grandes Numeros.


Dado z α2 > 0 (cualquiera por el momento), sabemos por el TCL que
 X̄ − µ  TCL
P − z α2 ≤ n
≤ z α2 ≈ P (−z α2 ≤ Z ≤ z α2 ) = 2Φ(z α2 ) − 1
√σ
n

donde Z ∼ N (0, 1).


Usando la tabla de la normal, elegimos z α2 tal que

2Φ(z α2 ) − 1 = 1 − α

o sea
α
Φ(z α2 ) = 1 −
2
Procedimiento general (2)

Luego con esta elección de z α2 tenemos


 X̄ − µ 
P − z2 ≤ α
n
≤ z2α ≈1−α
√σ
n

o sea despejando µ,
 
σ σ
P X̄ − zα/2 √ ≤ µ ≤ X̄ + zα/2 √ ' 1 − α.
n n
n n

Conclusión: el intervalo aleatorio


h σ σ i
X̄ − zα/2 √ , X̄ + zα/2 √
n n
n n

es un IC de nivel asintótico 1 − α para µ.


Vuelta al ejemplo

Supongamos que σ = 20 y que después de entrevistar a n = 100


clientes (note que 100 > 30 por lo que podemos usar el TCL),
obtenemos un promedio muestral de X̄ = 33.
n

Entonces un IC para µ de nivel asintótico 1 − α = 0,9 (luego


z α2 = 1,65) es
√ √ i
h 20 20
33 − 1,65 √ , 33 + 1,65 √ = [32,26, 33,74].
100 100

El nivel de conanza de 0.9 signica que si realizamos otras


encuestas, obteniendo asi otros IC para µ, aproximadamente el
90 % de ellos contendrán a µ.
Sobre la longitud del IC

Intuitivamente, mayor la cantidad de personas que entrevistemos,


mejor la estimación de µ o sea mas pequenno el IC.
¾Que tan grande debe elegirse n para que la longitud del IC sea < ε
(con ε > 0 dado) ?
=⇒ La longitude de un intervalo [a, b] es b − a. Luego la longitud
del IC es
σ  σ  σ
X̄ + zα/2 √ − X̄ − zα/2 √ = 2zα/2 √
n n n
n n

Buscamos entonces n tal que


σ
2zα/2 √ < ε
n
o sea despejando n,
 2z 2
α/2 σ
n> .
ε
Comentarios importantes (1)

Este razonamiento esta basado sobre


la suposición que se conoce σ ,
el uso del TCL. Recordar que la aproximacion dada por el TCL
se considera buena si n ≥ 30.
Si no se conoce σ y n1

Si no se conoce σ y n  1, se debe reemplazar σ en la fórmula


anterior por el desvío muestral S denido por
n

1
n 2
2
X
S = X − X̄ .
n−1
n i n

i =1

Note el parecido con la def de la varianza

Var (X ) = E [(X − E (X ))2 ]

Se puede probar que E (S 2 ) = σ 2 .


n
Si los datos son normales: X i ∼ N (µ, σ 2 ) para todo i

2
Si σ es conocido entonces sabemos que X̄ ∼ N (µ, σ ) por lo que
n
n

no hace falta usar el TCL: el IC tiene un nivel de conanza


exactamente de 1 − α.

Si σ es desconocido se debe elegir z α2 usando la tabla de la


distribución t de Student con n − 1 grados de libertad. En este caso
el IC tiene un nivel de conanza exactamente de 1 − α.
Caso particular de una proporción: ejemplo

Volvemos al ejemplo de la clase sobre LGN y TCL: queremos


estimar la proporción p de hogar que poseen una computadora.
Para eso entrevistamos a n personas preguntando a cada una si hay
una compu en su hogar, e aproximamos p por el promedio muestral
1P
X̄ :=
n
n
n

i=1 X con i

(
1 si hay una compu en el hogar del i-ésimo entrevistado
X =
0 sino
i

Como armar un IC para p ?

Note que X ∼ Ber (p ) por lo que E (X ) = p y Var (X ) = p (1 − p ).


i i i
Caso particular de una proporción: procedimiento general

En el caso que querramos estimar una proporción p como en el


ejemplo anterior, no conocemos σ 2 = p (1 − p ).

Como X̄ ≈ p, estimamos σ 2 por


n

σ 2 ≈ X̄ (1 − X̄ ).
n n

Con esta modicación admitimos que

X̄ (1 − X̄ ) X̄ (1 − X̄ ) i
h p p
X̄ − zα/2 n
√ n
, X̄ + zα/2
n
√ n

n n
n n

es una IC para p de nivel asintotica 1 − α aproximadamente.


Vuelta al ejemplo

Entrevistamos a n = 1000 personas (podemos usar el TCL)


obteniendo que el 56 % de ellas poseen una compu en su hogar
(entonces X̄ = 0,56).
n

Un IC para p de nivel asintotico 1 − α = 0,9 (luego z α2 = 1,65) es

0,56(1 − 0,56) 0,56(1 − 0,56) i


h p p
0,56 − 1,65 √ , 0,56 + 1,65 √
1000 1000
o sea [0,5341, 0,5859].

You might also like