You are on page 1of 16

INTRODUCCIN

En este trabajo se va a dar a conocer la estimacin mediante Intervalos de


Conanza, que es uno de los tres grandes conjuntos de tcnicas que se utilizan en la
Inferencia Estadstica.
La "estimacin por intervalo" consiste en determinar un par de valores a y b
tales que constituidos en intervalo [a ,b] ; y para una probabilidad 1- prefijada (nivel
de confianza) se verifique en relacin al parmetro a estimar se cumpla :
en otros trminos
La construccin de intervalos especficos depende de las caractersticas de la
poblacin (normal o no ,etc.) ,de los parmetros o combinaciones de parmetros a
los que se les construye (media , varianza , proporcin , coeficiente de correlacin ,
diferencias de medias, etc.) , tamao muestral y parmetros poblacionales conocidos
. De ello se deduce que segn dichas circunstancias la construccin de intervalos
variar, si bien es cierto que el patrn de trabajo para su construccin permanece
invariable.
A continuacin se vern detalladamente los intervalos de confianza para las
diferencias de medias.
INFERENCIA ESTADISTICA.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS.
Suponemos dos poblaciones independientes
X N (
1
,
1
2
) , Y N (
2
,
2
2
)
Tomamos muestras de tamao
n
1
y
n
2
, respectivamente.
a) Si
1
2
y
2
2
son conocidas, como X
n
1
Y
n
2
N
1

2
,

1
2
n
1
+

2
2
n
2



_
,

, el
intervalo de confianza ser:

1

2
X
n
1
Y
n
2
z
1

2

1
2
n
1
+

2
2
n
2
, X
n
1
Y
n
2
+ z
1

2

1
2
n
1
+

2
2
n
2



1
]
1
b) Si
1
2
y
2
2
son desconocidas pero iguales, como
X
n
1
Y
n
2

1

2
( )
n
1
s
1
2
+ n
2
s
2
2
n
1
+ n
2
2
1
n
1
+
1
n
2



_
,

t
n
1
+ n
2
2
, el intervalo de confianza ser:
X
n
1
Y
n
2
t
n
1
+ n
2
2
1

2
n
1
s
1
2
+ n
2
s
2
2
n
1
+ n
2
2
1
n
1
+
1
n
2




_
,

, X
n
1
Y
n
2
+ t
n
1
+ n
2
2
1

2
n
1
s
1
2
+ n
2
s
2
2
n
1
+ n
2
2
1
n
1
+
1
n
2




_
,





1
]
1
1
Ejemplo: Dos universidades pblicas tienen dos mtodos distintos para
inscribir a sus alumnos. Los dos desean comprobar el tiempo promedio que toma la
inscripcin de los alumnos. En cada universidad se tomaron los tiempos de
inscripcin de 31 alumnos tomados al azar. Las medias y desviaciones tpicas
muestrales fueron: x 20' 3 ,
s
x
2 ' 5
,
y 23
,
s
y
3
. Si se supone que el muestreo
se llev a cabo en dos poblaciones normales e independientes, obtener los intervalos
de confianza al nivel de riesgo 0'05 para la diferencia entre las medias del tiempo de
inscripcin para las dos universidades.
2
a) suponiendo que las varianzas poblacionales son
x
2
9 ,

y
2
10
.
b) suponiendo que las varianzas poblacionales son desconocidas pero iguales.
Para el apartado a
0 05 1 0 ' 95 1

2
0 ' 975 z
1

2
1 ' 96
Sustituyendo los valores en el intervalo obtenemos:

1

2
20' 3 23 1 ' 96
9
31
+
10
31
, 20' 3 23+ 1 ' 96
9
31
+
10
31




1
]
1
1

2 ' 7 1 ' 53, 2 ' 7 + 1 ' 53 [ ] 4 ' 23, 1 ' 17 [ ]
Para el apartado b, buscamos en la tabla de la t de Student
t
31+ 31 2
0 ' 975
2
.
Sustituyendo los valores en el intervalo obtenemos:
20' 3 23 2
312 ' 3
2
+ 313
2
31+ 31 2
1
31
+
1
31


_
,
, 20' 3 23 + 2
312 ' 3
2
+ 313
2
31+ 31 2
1
31
+
1
31


_
,



1
]
1

2 ' 7 1 ' 4 , 2 ' 7 + 1 ' 4 [ ] 4 ' 1 , 1 ' 3 [ ]
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS DE DISTRIBUCIONES NORMALES
INDEPENDIENTES.VARIANZA COMN

Caso de varianza desconocida y comn
Supondremos la existencia de dos poblaciones sobre las que una variable
determinada sigue una distribucin Normal con idntica varianza en las dos. Sobre la
poblacin 1, la variable sigue una distribucin N(
1
, ) y, sobre la poblacin 2, sigue
una distribucin N(
2
, ). Igualmente supondremos que disponemos de
dos muestras aleatorias independientes, una para cada poblacin, de tamaos
muestrales n1 y n2 respectivamente.
El objetivo es construir un intervalo de confianza, con nivel de
confianza (1 ) 100 %, para la diferencia de medias
3

1

2
El mtodo se basa en la construccin de una nueva variable D, definida como
la diferencia de las medias muestrales para cada poblacin
Esta variable, bajo la hiptesis de independencia de las muestras, sigue una
distribucin Normal de esperanza

1

2
y de varianza
La estimacin conjunta, a partir de las dos muestras, de la varianza comn
viene dada por la expresin
y, utilizando la propiedad de que la variable
Sigue una distribucin
2
con n
1
+ n
2
2 grados de libertad, podemos construir
un estadstico pivote que siga una distribucin t de Student y que nos proporciona la
frmula siguiente para el intervalo de confianza para la diferencia de medias:
4
Donde t
/2
es el valor de una distribucin t de Student con n
1
+ n
2
2 grados de
libertad que deja a su derecha una probabilidad de /2.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS DE DISTRIBUCIONES NORMALES
INDEPENDIENTES.VARIANZA DIFERENTE.
Caso de varianzas desconocidas y diferentes
Cuando tenemos razones para suponer que la varianza no es comn, no
podemos utilizar el estadstico anterior. Hemos de destacar que, en esta situacin, no
existe un mtodo exacto que permita obtener el intervalo de confianza deseado. Lo
ms que tenemos son aproximaciones a la solucin. Un intervalo aproximado con
nivel de confianza (1 ) 100 % es
,
donde
1
y
2
son las varianzas muestrales corregidas para cada poblacin y
donde t
/2
es el valor de una distribucin t de Student con g grados de libertad, donde
Si los grados de libertad resultantes son decimales, puede optarse por hacer
una interpolacin entre los dos valores enteros ms cercanos o bien por tomar el
valor ms desfavorable, aquel que suponga un radio mayor para el intervalo de
confianza y que coincide con el redondeo a la baja de los grados de libertad.
Es, por tanto, muy importante, antes de proceder a la obtencin del intervalo
de confianza para la diferencia de medias, verificar si la suposicin de
5
homogeneidad de varianzas es razonable o no. Una manera de verificarlo
consiste en la construccin del intervalo para el cociente de varianzas, tal como se
explica ms adelante, y comprobar si en dicho intervalo est incluido el valor 1. La
inclusin de la unidad dentro del intervalo resultante, la debemos interpretar en el
sentido de que la muestra no proporciona evidencia suficiente para afirmar que las
varianzas son diferentes y, por tanto, no es incorrecta la utilizacin del intervalo para
varianza comn. De manera anloga, el intervalo de confianza para la diferencia de
medias nos puede servir para verificar la suposicin de que las medias son iguales o
diferentes; en este caso, si el valor 0 est incluido en el intervalo, la conclusin es
que la muestra no proporciona evidencia suficiente para afirmar que las medias son
diferentes.
Nota importante: El prrafo anterior nos introduce en la posibilidad de utilizar
intervalos de confianza para verificar o rechazar ciertas suposiciones sobre el
parmetro o los parmetros de las distribuciones. La tcnica especfica para la
verificacin de dichas suposiciones o hiptesis a partir de muestras aleatorias se
ver en los temas siguientes, donde se introduce el concepto de contraste de
hiptesis, sin embargo no podemos dejar de mencionar aqu que los intervalos de
confianza nos pueden proporcionar una tcnica alternativa o complementaria para la
resolucin de contrastes.
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA
POBLACIN CUALQUIERA, CONOCIDA LA VARIANZA.
Las circunstancias especficas para la construccin de este intervalo son las
siguientes :
Intervalo para
Conocida ( o la varianza )
Distribucin poblacional desconocida.
Nivel de confianza dado 1-
Tamao muestral desconocido luego nos colocamos en el peor de los casos , es
decir pequeo.
6
Partiendo del conocido teorema de Markov :
Donde g(x) es una funcin cualquiera de la variable aleatoria x , y dicha funcin g
est definida NO negativa, siendo c una constante cualquiera. As :
Definiendo g(x)= es, evidentemente, no negativa y tomando
c=H
2
tendremos en aplicacin de Markov :
Dado que :
Tendremos que
Transponiendo este resultado al enunciado general :
Tomando la raz cuadrada
Despejando para centrar el parmetro a estimar tendremos

7
Si queremos establecer un nivel de confianza 1- igualaremos ste a d e
manera que por lo que en funcin del nivel de confianza el intervalo
quedara :


o bien : con ms de 1- de confianza

ejemplo 1
En poblacin cuya distribucin se desconoce se obtiene una muestra (m.a.s.)
de 2000 valores de la que resulta una media de 225 y una desviacin tpica de 10 .
Suponiendo que la varianza muestral coincide con la poblacional, estimar un
intervalo para la media de la poblacin con un nivel de confianza del 95%.
Tendramos 1- =0.95 luego =0.05 ; S=10= ; n=2000 ;
con
Aplicando con ms de 0.95 de
confianza.
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA
POBLACIN NORMAL CON VARIANZA CONOCIDA.
Las circunstancias especficas para la construccin de este intervalo son las
siguientes:
8
Intervalo para
Conocida ( o la varianza )
Distribucin poblacional normal.
Nivel de confianza dado 1-
Tamao muestral desconocido luego nos colocamos en el peor de los casos, es decir
pequeo.
Conocemos que la media muestral se distribuye luego
tipificando
Como se ha comentado, al ser la normal
reducida una distribucin simtrica y
unimodal, el intervalo de menor amplitud y
de probabilidad 1 - ser el intervalo
centrado en la media ,es decir:
El intervalo . Donde
es el valor de la tabla de la N[0 ;1] que
haga que Es decir el
valor de la normal reducida que deje a su derecha una cola de probabilidad de /2
As el valor ser el valor simtrico de (con signo negativo) y dejar a
su izquierda una cola de /2 . De esta forma entre, y queda encerrada
una probabilidad de 1 - :
Sera as el intervalo de menor amplitud :
Despejando la media poblacional
tendramos :
9

nota: si el muestreo fuera sin reposicin, por lo tanto no m.a.s. y si irrestricto ;
el intervalo se vera afectado por el factor corrector de poblaciones
finitas .Resultando , y sirva este ejemplo para comprobar lo que ocurrira en otros
intervalos de otras caractersticas, de la siguiente forma :

Siendo N el tamao
de la poblacin.
nota :Aunque no se conozca (desviacin poblacional) si la muestra es
bastante grande , n >30 es habitual considerar la desviacin tpica muestral , S ,
como si fuera la poblacional y aplicar el intervalo de estimacin obtenido arriba.
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA
POBLACIN NORMAL DE VARIANZA DESCONOCIDA
(MUESTRAS PEQUEAS)
Las circunstancias especficas para la construccin de este intervalo son las
siguientes :
Intervalo para
desconocida ( o la varianza )dado que n es pequea no podemos tomar S como
Distribucin poblacional normal.
Nivel de confianza dado 1-
Tamao muestral desconocido luego nos colocamos en el peor de los casos , es
decir pequeo.
Del estudio de las distribuciones muestrales conocemos
que :
10
Como la distribucin de t de student es una distribucin simtrica , unimodal y
centrada en 0 , de todos los intervalos que verifiquen que : P(t IN) = 1 - el de
menor amplitud ser:
Donde
es el correspondiente valor de la
variable t para n - 1 grados de libertad y
nivel de significacin . Dicho intervalo
quedara :
Para un
nivel de confianza prefijado y despejando tendramos como intervalo


Recurdese que en el caso de muestreo irrestricto sera de aplicacin el antes
nombrado factor corrector de poblaciones finitas.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS CON POBLACIONES NORMALES Y VARIANZAS
CONOCIDAS.
Las circunstancias especficas para la construccin de este intervalo son las
siguientes :
Intervalo para
Conocidas desconocidas con tamaos muestrales grandes
Distribuciones poblacionales normales.
11
Nivel de confianza dado 1-
Tamaos muestrales desconocidos
luego nos colocamos en el peor de los casos , es decir pequeo.
Conocemos que
Luego la tipificando tendremos:
para un nivel de confianza dado 1- que genera los valores extremos de un
intervalo centrado en dicha N[0 ;1] ; como ya vimos tendramos :
Despejando :
Evidentemente y como en los casos anteriores se ha supuesto m.a.s. , en
caso de irrestricto se aplicara el f.c.p.f..
Si la varianza no fuera conocida pero la muestra fuera grande (superior a
treinta cada una) tomaramos como varianza poblacional su homnima muestral.
12
FORMULAS DE INTERVALOS DE CONFIANZA
13
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS
MEDIAS DE DATOS NORMALES INDEPENDIENTES

Los lmites para el intervalo de una diferencia de medias correspondientes a dos
muestras independientes son:
Donde el smbolo t
/2
es el mismo valor crtico que antes, prob(T > t
/2
) = /2, y
corresponde a un intervalo de confianza 1 %.
Este intervalo puede utilizarse de manera alternativa al contraste de hiptesis para
decidir (con nivel de significacin %) si hay igualdad de los dos grupos. Se
decidir por la igualdad de los grupos si el valor 0 queda incluido en cualquier
posicin en el intervalo, es decir, el nmero 0 no ha de estar forzosamente en el
centro del intervalo para aceptar H
0
.
Si se ha planteado el contraste ms general H
0
:
1

2
= d
0
bastar que el valor d
0
quede incluido en el intervalo.
An si se hace el contraste T de dos muestras, en primer lugar, es aconsejable
obtener el intervalo de confianza de la diferencia de medias, si ste ha resultado
significativo, puesto que ayudar a interpretar si existe significacin aplicada adems
de la estadstica.
Si se dispone de alguna informacin previa y quiere calcularse slo alguno de los dos
intervalos unilaterales, bastar sustituir t
/2
por t

y descartar el lmite superior o
inferior del intervalo segn el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:
La decisin tomada con este intervalo es totalmente equivalente a la decisin tomada
con el contraste t de Student de dos muestras independientes con alternativa
unilateral derecha.
Considerando para la distribucin Normal la Tabla del Area entre 0 y z
Intervalos de Confianza para la Diferencia de Medias Poblacionales
1. Poblaciones Desconocidas Desvos Poblacionales Conocidos
( ) ( ) ( )



1
1
]
1

+ + +

1
2
2
2
5 . 0
2
2
2
5 . 0
y
y
x
x
y x
y
y
x
x
n n
z y x m m
n n
z y x IC
2. Poblaciones Desconocidas Desvos Poblacionales Desconocidos
( ) ( ) ( )


1
1
]
1



1
1 1 1 1
2
2
2
5 . 0
2
2
2
5 . 0
y
y
x
x
y x
y
y
x
x
n
S
n
S
z y x m m
n
S
n
S
z y x IC
3. Poblaciones Normales Desvos Poblacionales Conocidos
( ) ( ) ( )



1
1
]
1

+ + +

1
2
2
2
5 . 0
2
2
2
5 . 0
y
y
x
x
y x
y
y
x
x
n n
z y x m m
n n
z y x IC
4. Poblaciones Normales Desvos Poblacionales Desconocidos
( )
( )
( ) ( )
( )
1
1
]
1

,
_

+
+
+
+

,
_

+
+
+

+ +

y x y x
y y x x n n
y x
y x y x
y y x x n n
n n n n
S n S n
t y x m m
n n n n
S n S n
t y x IC
y x y x
1 1
2
1 1
2
2 2
2
2 2
2
2
1
2
1

FORMULAS DE INTERVALOS DE CONFIANZA
Considerando para la distribucin Normal la Funcin de Distribucin
Intervalos de Confianza para la Diferencia de Medias Poblacionales
5. Poblaciones Desconocidas Desvos Poblacionales Conocidos
( ) ( ) ( )



1
1
]
1

+ + +

1
2
2
2
1
2
2
2
1
y
y
x
x
y x
y
y
x
x
n n
z y x m m
n n
z y x IC
6. Poblaciones Desconocidas Desvos Poblacionales Desconocidos
( ) ( ) ( )


1
1
]
1



1
1 1 1 1
2
2
2
1
2
2
2
1
y
y
x
x
y x
y
y
x
x
n
S
n
S
z y x m m
n
S
n
S
z y x IC
7. Poblaciones Normales Desvos Poblacionales Conocidos
( ) ( ) ( )



1
1
]
1

+ + +

1
2
2
2
1
2
2
2
1
y
y
x
x
y x
y
y
x
x
n n
z y x m m
n n
z y x IC
14
8. Poblaciones Normales Desvos Poblacionales Desconocidos
( )
( )
( ) ( )
( )
1
1
]
1

,
_

+
+
+
+

,
_

+
+
+

+ +

y x y x
y y x x n n
y x
y x y x
y y x x n n
n n n n
S n S n
t y x m m
n n n n
S n S n
t y x IC
y x y x
1 1
2
1 1
2
2 2
2
2 2
2
2
1
2
1

CONCLUSIN
El proceso de inferencia es aquel mediante el cual se pretende estimar el valor
de un parmetro a partir del valor de un estadstico. Esta estimacin puede ser
puntual o bien por intervalo. Se acostumbra a dar una estimacin por intervalo, en el
que se espera encontrar el valor del parmetro con una elevada probabilidad. Esta
estimacin recibe el nombre de estimacin mediante intervalos de confianza.
La estimacin por intervalos de confianza como vimos en este trabajo consiste
en determinar un posible rango de valores o intervalo (a; b), en el que, con una
determinada probabilidad, sus lmites contendrn el valor del parmetro poblacional
que andamos buscando. Para cada muestra obtendremos un intervalo distinto que,
para el X % de ellas, contendr el verdadero valor del parmetro. A este intervalo se
le denomina intervalo de confianza.
Evidentemente esta tcnica no tiene porqu dar siempre un resultado correcto,
ya que para algunas muestras el intervalo correspondiente contendr el verdadero
valor del parmetro y para otras no. A la probabilidad de que hayamos acertado al
decir que el intervalo contiene al parmetro se la denomina nivel de confianza (o
simplemente confianza). Tambin se denomina nivel de significacin a la
probabilidad de errar en esta afirmacin, es decir la significacin (probabilidad de
errar con nuestro intervalo) ser igual a 1-(nivel de confianza), ya que el nivel de
confianza corresponde a la probabilidad de que el intervalo contenga el valor
verdadero del parmetro.
15
FUENTES DE INFORMACIN
Fuentes Electrnicas
1.http://www.ing.unlp.edu.ar/fismat/estadistica/estadistica/archivos/Capitulo5_ESTIM
ACION_POR_INTERVALO_ES_DE_CONFIANZA.pdf
2.http://www.uv.es/ceaces/tex1t/5%20interval/intervalos.html
3.http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t
0.htm
16

You might also like