Intervalo de Confianza

Intervalos de conanza
Nicolas Saintier
22 de octubre de 2014
Ejemplo
El gerente de un supermercado quiere estimar el tiempo promedio µ

que pasan sus clientes en su local. Para eso seleccionamos al azar n
clientes y preguntamos a cada uno cuanto tiempo pasó en el local.
Obtenemos n variables aleatorias T1 , .., T donde
n
T = tiempo pasado por el i-esimo cliente en el local.

i
Las T son independientes (si suponemos que los clientes

i
interrogados no tienen ninguna relación entre ellos) y tienen todas

la misma distribución (el tiempo que pasa un cliente cualquiera en
el local). En particular tienen esperanza
E (T ) = µ
i para todo i = 1, .., n.
PodemosPentonces intentar aproximar µ por el promedio

T̄ := 1
n =1 T de los T .
n
n
i i i
Ejemplo
pregunta: usando los datos muestrales T1 , ..., T , se puede armar

n
un intervalo [a, b] de forma tal que

P a ≤ µ ≤ b) ≈ 0,9
o sea un intervalo que contenga a µ con proba ≈ 0,9 ?
Un tal intervalo se llama intervalo de conanza para µ de conanza

asintótica 0,9.
Formulación abstracta del problema
Tenemos una va X y una muestra X1 , .., X de tamano n de X (es

n
decir n va independientes con misma distribución que X )
Usando los X queremos estimar µ := E (X ).

i
Nota: en general se busca estimar alguna cantidad θ que involucre

X (por ejemplo su esperanza, su varianza, o si X tiene una
densidad dependiendo de un parametro este mismo parametro
(pensar en las distribuciones exponenciales, normales ... que
dependen de uno o más parámetros)).
Denición de intervalo de conanza (IC)
Denición
Un intervalo de conanza (IC) para µ de conanza 1 − α es un
intervalo [a, b] con a y b funciones de X1 , .., X tal que
n
P (a ≤ µ ≤ b) = 1 − α.
En el caso que
lím
n →+∞ P (a ≤ µ ≤ b) = 1 − α,
hablamos de IC de conanza asintótica 1 − α.

Note que a y b dependen de la muestra: son aleatorios.
Procedimiento general (1)
Usamos el promedio muestral X̄ := 1 =1 como estimador de µ.

n
P
n i
n
Tiene sentido ya que X̄ ≈ E (X1 ) = µ cuando n es grande según la

n
Ley de los Grandes Numeros.

Dado z α2 > 0 (cualquiera por el momento), sabemos por el TCL que
X̄ − µ TCL
P − z α2 ≤ n
≤ z α2 ≈ P (−z α2 ≤ Z ≤ z α2 ) = 2Φ(z α2 ) − 1
√σ
n
donde Z ∼ N (0, 1).

Usando la tabla de la normal, elegimos z α2 tal que
2Φ(z α2 ) − 1 = 1 − α
o sea
α
Φ(z α2 ) = 1 −
2
Procedimiento general (2)
Luego con esta elección de z α2 tenemos

X̄ − µ
P − z2 ≤ α
n
≤ z2α ≈1−α
√σ
n
o sea despejando µ,

σ σ
P X̄ − zα/2 √ ≤ µ ≤ X̄ + zα/2 √ ' 1 − α.
n n
n n
Conclusión: el intervalo aleatorio

h σ σ i
X̄ − zα/2 √ , X̄ + zα/2 √
n n
n n
es un IC de nivel asintótico 1 − α para µ.

Vuelta al ejemplo
Supongamos que σ = 20 y que después de entrevistar a n = 100

clientes (note que 100 > 30 por lo que podemos usar el TCL),
obtenemos un promedio muestral de X̄ = 33.
n
Entonces un IC para µ de nivel asintótico 1 − α = 0,9 (luego

z α2 = 1,65) es
√ √ i
h 20 20
33 − 1,65 √ , 33 + 1,65 √ = [32,26, 33,74].
100 100
El nivel de conanza de 0.9 signica que si realizamos otras

encuestas, obteniendo asi otros IC para µ, aproximadamente el
90 % de ellos contendrán a µ.
Sobre la longitud del IC
Intuitivamente, mayor la cantidad de personas que entrevistemos,

mejor la estimación de µ o sea mas pequenno el IC.
¾Que tan grande debe elegirse n para que la longitud del IC sea < ε
(con ε > 0 dado) ?
=⇒ La longitude de un intervalo [a, b] es b − a. Luego la longitud
del IC es
σ σ σ
X̄ + zα/2 √ − X̄ − zα/2 √ = 2zα/2 √
n n n
n n
Buscamos entonces n tal que

σ
2zα/2 √ < ε
n
o sea despejando n,
2z 2
α/2 σ
n> .
ε
Comentarios importantes (1)
Este razonamiento esta basado sobre

la suposición que se conoce σ ,
el uso del TCL. Recordar que la aproximacion dada por el TCL
se considera buena si n ≥ 30.
Si no se conoce σ y n1
Si no se conoce σ y n 1, se debe reemplazar σ en la fórmula

anterior por el desvío muestral S denido por
n
1
n 2
2
X
S = X − X̄ .
n−1
n i n
i =1
Note el parecido con la def de la varianza
Var (X ) = E [(X − E (X ))2 ]
Se puede probar que E (S 2 ) = σ 2 .

n
Si los datos son normales: X i ∼ N (µ, σ 2 ) para todo i
2
Si σ es conocido entonces sabemos que X̄ ∼ N (µ, σ ) por lo que
n
n
no hace falta usar el TCL: el IC tiene un nivel de conanza

exactamente de 1 − α.
Si σ es desconocido se debe elegir z α2 usando la tabla de la

distribución t de Student con n − 1 grados de libertad. En este caso
el IC tiene un nivel de conanza exactamente de 1 − α.
Caso particular de una proporción: ejemplo
Volvemos al ejemplo de la clase sobre LGN y TCL: queremos

estimar la proporción p de hogar que poseen una computadora.
Para eso entrevistamos a n personas preguntando a cada una si hay
una compu en su hogar, e aproximamos p por el promedio muestral
1P
X̄ :=
n
n
n
i=1 X con i
(
1 si hay una compu en el hogar del i-ésimo entrevistado
X =
0 sino
i
Como armar un IC para p ?
Note que X ∼ Ber (p ) por lo que E (X ) = p y Var (X ) = p (1 − p ).

i i i
Caso particular de una proporción: procedimiento general
En el caso que querramos estimar una proporción p como en el

ejemplo anterior, no conocemos σ 2 = p (1 − p ).
Como X̄ ≈ p, estimamos σ 2 por

n
σ 2 ≈ X̄ (1 − X̄ ).
n n
Con esta modicación admitimos que
X̄ (1 − X̄ ) X̄ (1 − X̄ ) i
h p p
X̄ − zα/2 n
√ n
, X̄ + zα/2
n
√ n
n n
n n
es una IC para p de nivel asintotica 1 − α aproximadamente.

Vuelta al ejemplo
Entrevistamos a n = 1000 personas (podemos usar el TCL)

obteniendo que el 56 % de ellas poseen una compu en su hogar
(entonces X̄ = 0,56).
n
Un IC para p de nivel asintotico 1 − α = 0,9 (luego z α2 = 1,65) es
0,56(1 − 0,56) 0,56(1 − 0,56) i

h p p
0,56 − 1,65 √ , 0,56 + 1,65 √
1000 1000
o sea [0,5341, 0,5859].

Intervalo de Confianza

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Intervalo de Confianza

Uploaded by

Copyright:

Available Formats

Intervalos de conanza

El gerente de un supermercado quiere estimar el tiempo promedio µ

T = tiempo pasado por el i-esimo cliente en el local.

Las T son independientes (si suponemos que los clientes

interrogados no tienen ninguna relación entre ellos) y tienen todas

PodemosPentonces intentar aproximar µ por el promedio

pregunta: usando los datos muestrales T1 , ..., T , se puede armar

un intervalo [a, b] de forma tal que

o sea un intervalo que contenga a µ con proba ≈ 0,9 ?

Un tal intervalo se llama intervalo de conanza para µ de conanza

Tenemos una va X y una muestra X1 , .., X de tamano n de X (es

decir n va independientes con misma distribución que X )

Usando los X queremos estimar µ := E (X ).

Nota: en general se busca estimar alguna cantidad θ que involucre

hablamos de IC de conanza asintótica 1 − α.

Usamos el promedio muestral X̄ := 1 =1 como estimador de µ.

Tiene sentido ya que X̄ ≈ E (X1 ) = µ cuando n es grande según la

Ley de los Grandes Numeros.

donde Z ∼ N (0, 1).

Luego con esta elección de z α2 tenemos

Conclusión: el intervalo aleatorio

es un IC de nivel asintótico 1 − α para µ.

Supongamos que σ = 20 y que después de entrevistar a n = 100

Entonces un IC para µ de nivel asintótico 1 − α = 0,9 (luego

El nivel de conanza de 0.9 signica que si realizamos otras

Intuitivamente, mayor la cantidad de personas que entrevistemos,

Buscamos entonces n tal que

Este razonamiento esta basado sobre

Si no se conoce σ y n  1, se debe reemplazar σ en la fórmula

Note el parecido con la def de la varianza

Var (X ) = E [(X − E (X ))2 ]

Se puede probar que E (S 2 ) = σ 2 .

no hace falta usar el TCL: el IC tiene un nivel de conanza

Si σ es desconocido se debe elegir z α2 usando la tabla de la

Volvemos al ejemplo de la clase sobre LGN y TCL: queremos

Como armar un IC para p ?

Note que X ∼ Ber (p ) por lo que E (X ) = p y Var (X ) = p (1 − p ).

En el caso que querramos estimar una proporción p como en el

Como X̄ ≈ p, estimamos σ 2 por

Con esta modicación admitimos que

es una IC para p de nivel asintotica 1 − α aproximadamente.

Entrevistamos a n = 1000 personas (podemos usar el TCL)

Un IC para p de nivel asintotico 1 − α = 0,9 (luego z α2 = 1,65) es

0,56(1 − 0,56) 0,56(1 − 0,56) i

You might also like

Intervalos de conanza

Un tal intervalo se llama intervalo de conanza para µ de conanza

hablamos de IC de conanza asintótica 1 − α.

El nivel de conanza de 0.9 signica que si realizamos otras

Si no se conoce σ y n 1, se debe reemplazar σ en la fórmula

no hace falta usar el TCL: el IC tiene un nivel de conanza

Con esta modicación admitimos que