You are on page 1of 12

TEMA: ESTIMACION Y PRUEBA DE HIPOTESIS

INFERENCIA ESTADISTICA:
Es un conjunto de mtodos mediante los cuales podemos hacer afirmaciones con respecto a una
poblacin completa a partir de nicamente la observacin de una parte de la poblacin (muestra)

FORMAS BASICAS PARA REALIZAR LA INFERENCIA ESTADISTICA:
Estimacin
Prueba de Hiptesis

ESTADISTICOS: Medidas en una muestra (media, varianza, proporcin, etc.)

PARAMETROS: Medidas en una poblacin (,
2
, P)

ESTIMADOR: Es una funcin de variables aleatorias observables usadas para estimar un
parmetro poblacional (utilizando distribucin de probabilidad de cada estimador)

POBLACION, VARIABLE, DATOS, PARAMETROS Y MUESTRA
Elementos. (Cualquier naturaleza)
Caracterstica de inters. ( Es individual, es variable) se representa por X
Datos. Son los valores realmente observados de X.
As x
i
representa la i-sima obs de X donde i = 1,2, ...
Muestra. Una parte de la poblacin (Debe ser representativa de la poblacin)
Poblacin (tamao N)

Parmetro: Son caractersticas poblacionales (constantes, se representan por letras griegas)
N
x
N
x ... x x
N
.
i
N 2 1

=
+ + +
= ,

=
N
i
x ,
N
) (x
N
.
2
i

=
2
,
2
=

Por qu se muestrea?
Para tomar decisiones con base a informacin real, completa, por tal razn se utiliza la informacin
de una muestra para estimar los parmetros.

VENTAJAS DEL MUESTREO
Rapidez y bajo costo de la informacin (Oportuna, exactitud aceptable)
Poblacin muy grande (Infinita)
Evita la destruccin de la poblacin (La medicin de la caracterstica destruye al elemento)

TIPOS DE MUESTREO

No probabilisticos Probabilisticos
i) No todos los elementos tienen posibilidad de i) Todos tienen posibilidad de integrar la
muestra
integrar la muestra
ii) Seleccin segn el criterio personal ii) Seleccin conforme las leyes del azar
iii) La precisin no se puede medir objetivamente iii) La precisin se puede medir objetivamente


TIPOS DE MUESTREOS PROB: MAS, MASIS, MAE, MAC

MAS
Cada muestra posible y cada elemento tienen igual probabilidad de integrar la muestra

Condiciones para que sea prctico:
i) o pequea y N no es muy grande
ii) Fcil acceso a los elementos y poco costoso

Cmo seleccionarla?
1) Construir el marco muestral 3) Usar una tabla de Naleatorios
2) Con o sin reposicin i) Asignar cdigos ii) Entrada iii) Direccin iv) Cdigo Elemento

MASIST
Se utiliza un intervalo uniforme que se mide en el orden o en el tiempo para garantizar que cada
elemento tuvo la misma prob de integrar la muestra
Condiciones para que sea prctico:
i) Se dispone de una lista
ii) Se tiene un proceso contnuo de produccin
Cmo seleccionarla?
1. Numerar u ordenar los elementos poblacionales
Por ejemplo: 1, 2, 3, . . . . . . . N.
2. Obtener el intervalo de muestreo

n
N
= k

3. Seleccionar al azar un punto de arranque r
k 1 s s r
4. Tomar cada k-simo elemento a partir del punto de arranque r

r, r + k, r + 2k, . . . . .

MUESTRA DE UNA V.A.
Sea X una v.a. asociada a un experimento aleatorio c
Si repetimos c n veces y hacemos que la v.a. X
i
represente la i-sima obs. de X en la i-sima
realizacin de c. Entonces las v.a. X
1,
X
2
,...,X
n
forman una muestra aleatoria de X

Estadstico
Sea X
1,
X
2
,...,X
n
una muestra aleatoria de X y h una funcin de las v.a. X
1,
X
2
,...,X
n

Definimos que Y = h(X
1,
X
2
,...,X
n
) es un estadstico

Estimador de un parmetro u (Theta)
Sea X una v.a. cuya dist. de prob. depende de u. Sea X
1,
X
2
,...,X
n
una muestra aleatoria de X y g
una funcin de las v.a. X
1,
X
2
,...,X
n
. Se define que (Theta con acento )

= g(X
1,
X
2
,...,X
n
) es un
estimador de u


La media muestral

n
X
X
n
i
= es un estimador de la media poblacional

El total muestral

X N es un estimador del total poblacional t


Varianza muestral
1 n
) x (x
S
n
2
i
2


es un estimador de o
2


Desviacin estndar muestral
2
S S = es un estimador de o
PRECISION Y EXACTITUD DE UNA ESTIMACION
El error de muestreo de una estimacin se denota y define as -

e
m
=
No son medibles pero son controlables. A menor e
m
mayor precisin
Para , - X e
m
=

Errores ajenos al muestreo
Algunas causas de estos errores son:
i) Los intrumentos de medida (cuestionarios, entrevistas, etc.) no son precisos, esto es, no miden
lo que se pretende.
ii) Entrevistados dan respuestas incorrectas.
iii) Entrevistador anota las respuestas en lugares inapropiados.
Estos errores no son medibles pero pueden ser controlados evitando la causa que los producen.
Error total. A menor error total mayor exactitud

DISTRIBUCION MUESTRAL DE UN ESTIMADOR

PROPIEDADES DE UN ESTIMADOR

1. Insesgadura. u =
u


De otra manera,
u


se llama sesgado y a la diferencia u
u

le llamaremos sesgo.








u

1

u

2

u u
u


Estimador insesgado Estimador sesgado

2. Eficiencia
Sean
u

1
y
u

2
estimadores de un mismo parmetro u

2

1
u
o <
2

2
u
o
1

u es ms eficiente que
2

u









u
1

u u
u

u
,

u

Qu estimador preferira usted?


: error estndar de

. Error de muestreo esperado (promedio). Un indicador de la precisin del


estimador.




MUESTREO EN POBLACIONES CON UNA DIST DE PROB
)
n

, ( X ) , ( X
X X

~ ~
= =
Para un muestreo sin reposicin de una poblacin finita

l - N
n - N

n


X
=
Algunas observaciones importantes relacionadas con el
X
o son las siguientes:
i)
X
o s o
ii) A menor o menor
X
o
A mayor tamao de muestra n menor
X
o
iii) A menor
X
o mayor precisin del estimador X

Muestreo en poblaciones normales
)
n
, ( X ) , ( X
X
ormal Normal
~ ~
o
o o = =
X
N
Muestreo en poblaciones no normales
Teorema del lmite central (TLC)
)
n

, ( Normal aprox. X 30 n y ) , ( Normal No X


X X

~ ~
= = >

ESTIMADOR PUNTUAL Y POR INTERVALO

Un estimadro puntual de un parmetro es aquel que proporciona un nico estimado de ese
parmetro
Un estimador por intervalo de un parmetro u
Es el que define un par de v.a. Li (lm inf) y Ls (Lm sup) tales que
P(Li s u s Ls) = 1- o Nivel de confianza
P(De que u no se encuentre en [ Li , Ls ] = o Riesgo
Cada muestra proporciona un intervalo de confianza del (1 - o)%
En muestreo repetido esperamos que un (1 - o)% de los intervalos particulares obtenidos de [ Li ,
Ls] cubran el parmetro y un (o)% no lo cubra


ESTIMADOR PUNTUAL DE Y t
Media muestral Total muestral
n
X
X
n
i
= X N
El error estndar de X El error estndar de X N

n


X
= si la poblacin es infinita
X X N
N =

l - N
n - N

n


X
= si la poblacin es finita.







ESTIMADOR POR INTERVALO PARA Y t CUANDO o ES CONOCIDA
Cuando tomamos muestras de tamao n
(n > 30 si no Normal)
Dist poblacional de X Dist muestral de X
Normal o no Normal

Normal o aprox
Normal
o conoc
X
o


X X
Xes insesgado
X
=
Error estndar de X

n


X
= si poblacin inf

l - N
n - N

n


X
= si poblacin fin
Expresando el error de muestreo X - , en unidades del
X
o
o 1
Normal estndar


2




-
/2
z
o
0
/2
z
o


- X
Z =
X
o


Si
/2
z es un valor de Z que tiene a su derecha una rea acumulada de


2
o
y a su izquierda un
rea acumulada de

2
- 1
o

P
- 1 z

- X
z -
/2
X
/2
=
|
|
.
|

\
|
s s


P( ) - 1
x
z X - -
x
z - X -
/2 /2
= + s s ,
P( ) - 1
x
z X
x
z - X
/2 /2
= + s s

Hay una confianza del (1 - o)100% de que z X z - X
x
/2
x
/2
+ s s
O de una manera ms breve
Un estimador por intervalo de confianza del (1 - o)100% para est dado por
z X
x
/2

donde lmite inf: z - X
/2 X
o
o
y lm sup: z X
x
/2
o
o
+

Con un razonamiento similar
Un estimador por intervalo de confianza del (1 - o)100% para t est dado por
z X N
X N /2
donde
X X N
N =
Si sustituimos
X
o o
X N
o por su correspondiente frmula segn la poblacin sea infinita o finita,
llegamos a las frmulas de la pgina 23


TAMAO DE MUESTRA PARA
Queremos estimar con una confianza del (1 - o)100% de que
E - X s donde E es el mximo error permitido
Entonces hay una confianza del (1 - o)100% de que
E X E - X + s s o bien E X
Luego
x
z E
/2
=
Si sustituimos
x
o por su correspondiente frmula segn la poblacin sea infinita o finita y luego
solucionamos para n llegamos a las frmulas

ESTIMADOR POR INTERVALO PARA Y t CUANDO o ES DESCONOCIDA
Cuando tomamos muestras de tamao n
(n > 30 si no Normal)
Dist poblacional de X Dist muestral de X
Normal o no Normal
Normal o aprox
Normal
si n > 30
o desc
X
o


X X
Xes insesgado
X
=
Error estndar estimado de X

n
S

X
= si poblacin inf

l - N
n - N

n
S

X
= si poblacin fin
Expresando el error de muestreo X - , en unidades del
X
o
o 1
t de Student con n-1 g.l


2




-
/2
t
o
0
/2
t
o

t
- X
X

=

/2
t
o
es un valor de t que tiene a su derecha una rea acumulada de


2
o

Con un razonamiento similar al que hicimos con la dist Z
Un estimador por intervalo de confianza del (1 - o)100% para y t estan dados respectivamente
por
t X
X /2
y t X N
X N /2
donde
X X N
N =
Caractersticas:
1. Es una familia de distribuciones t
2. Es simtrica y de forma acampanada con
2 n ,
2 - n
n

t
y 0
t
> = o =

3.
t
o es ligeramente superior a 1
4. dist Z dist t Lim
gl
=


La dist t se parece a la distribucin Z cuando n > 30
POBLACIONES CON DIST DE BERNOULLI

Y es una variable aleatoria cualitativa con dos resultados xito (E) y fracaso (F)
Estos resultados pueden ser cuantificados as


F si 0
E si 1
Y

=

Y tiene una distribucin de Bernoulli dada por


0 y si p - 1
1 y si p
y) ( f

=
=
=

Con
Y
= p y o
Y
= ) p - 1 ( p

Parmetros:
Total poblacional lo definiremos as
t = y
N
.
i
= Ntotal de xitos en la poblacin
Proporcin poblacional

poblacin la de Tamao
poblacin la en xitos de total N

N
0
= =
t
p
Estimadores de p Y t
Proporcin muestral
muestra la de Tamao
muestra la en xitos de No.

n
X

n
Y

n
.
i
= = =

S
p
El error estndar estimado de p
S

=
finita es poblacin la si
1 N
n N
n
) p (1 p
infinita es poblacin la si
n
) p (1 p

S S
S S
p
S


donde p
S
es el estimador de p
Total muestral Error estndar estimado de N p
s

N p
s
S S
p Np
N =

Los estimadores por intervalo de confianza del ( 1 - o )100 % para p y t son
respectivamente

S
p
/2
S

z
p

y
S S
Np
/2
z
p

N

siempre que n p > 5 y n ( 1 p ) > 5


Si sustituimos
S
p

o o
S
Np
o por su correspondiente frmula, segn la poblacin sea infinita o finita,
llegamos a las frmulas de la pg 39

DETERMINACION DE n PARA p
Si en
S
p /2
z E = sustituimos
S
p

o por su correspondiente frmula, segn la poblacin sea infinita o


finita y luego resolvemos para n llegamos a las frmulas de la pg 40

MUESTREO ALEATORIO ESTRATIFICADO
Es prctico utilizarlo en poblaciones donde X tenga una gran variabilidad ( o es grande )
Estrato es un conjunto de elementos con caractersticas parecidas



Parmetros:
Total poblacional
t =

t
L
.
i

Media poblacional
=
N
t


ESTIMADOR DE Y t
Media muestral estratificada Error estndar estimado de
st
X

i
L
.
i st
X N
N
1
X

= )
N
n
(1
n
S
N
N
1

L
.
i
i
i
2
i 2
i X
st

=


Si 05 . 0
N
n
i
i
s para i = 1, 2, ... , L , podemos omitir el factor de correcin )
N
n
1 (
i
i
dentro del
radical.
Total muestral estratificado Error estndar estimado del N
st
X

i
X N X N
L
.
st i

=
st st
X X N
N =

ESTIMADOR POR INTERVALO PARA Y t
Un estimador por intervalo de confianza del 95% para y t estan dados respectivamente por


st
X st
2 X y
st
X N st
2 X N
El error mximo permitido en la estimacin de es
st
X
2 E =
El error mximo permitido en la estimacin de t es
st
X N
2 E =

SELECCIN DEL TAMAO DE LA MUESTRA PARA ESTIMAR

Hay muchas maneras para asignar un tamao de muestra n a los diversos estratos.

El mejor esquema de asignacin est influido por tres factores.

1. El nmero de elementos en cada estrato (N
i
)
2. La variabilidad de las observaciones dentro de cada estrato (o
i
)
3. El costo por obtener una observacin de cada estrato (c
i
)

Asignacin de costo mnimo y menor error de muestreo
El tamao de muestra requerido n para estimar con error mximo permitido E y un nivel de
confianza del 95% es


S N
4
E
N
c S N c / S N
n
L
2
i i
2
2
i i
L
i i
L
i i


+
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= ,
c / S N
c / S N
n n
i i
L
i
i i i
i

=

Asignacin de Neyman
Si c
1
= c
2
= . = c
L
= c, entonces los trminos de costos en la frmula de asignacin de costo
mnimo se cancelan y queda as

S N
4
E
N
S N
n
L
2
i i
2
2
L
i i
2

+
|
|
.
|

\
|
|
|
.
|

\
|
= ,

=
L
i i
i i
S N
S N
n n
i


Asignacin proporcional
Si c
1
= c
2
= . = c
L
= c y S
2
1
= S
2
2
= . = S
2
L
= S
2
Se cancelan las desviaciones estndar
en la frmula de asignacin Neyman y queda


S
4
E
N
S N
n
2

2
2
+
|
|
.
|

\
|
= donde S
2
es la varianza comn ,
|
.
|

\
|
= =

N
N
n
N
N
n n
i
L
i
i
i


MUESTREO ALEATORIO POR CONGLOMERADOS

Consiste en dividir la poblacin en colecciones de elementos que llamaremos conglomerados Por
lo tanto al aplicar este mtodo se logra fcilmente la construccin de un marco que liste todos los
conglomerados y la reduccin del costo por observar un elemento.
El muestreo por conglomerados es menos costoso que el muestreo aleatorio estratificado o
simple si se cumple lo siguiente:
1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos
de la poblacin.
2. El costo por obtener observaciones se incrementa con la distancia que separa los elementos.

=
=
i
m
1 j
ij
x
i
t

M =
N
M

n
i
m m =
n
m
n
i



Parmetros:
Total poblacional
t =

t
N
i

Media poblacional
=
M
t


ESTIMADOR DE Y t

Media muestral por conglomerado Error estndar estimado de
c
X

m

X
n
n
i
i
c

=
) X

M n
N
n
- 1

1 - n
m -
n
(

2
c i i
2 X
c

|
|
|
.
|

\
|
=
Si
N
n
s 0.05 podemos aproximar el factor ( 1 -
N
n
) dentro del radical a 1

Total muestral por conglomerado Error estndar estimado del M
c
X

|
|
|
|
|
.
|

\
|

=
n
m

n

M
i
i
c
X M
c c
X X M
M =
M puede ser estimado con m N

~ M

ESTIMADOR POR INTERVALO PARA Y t

Un estimador por intervalo de confianza del 95% para y t estan dados respectivamente por

2
c
X c
X y
c
X M
2 X M
c

El error muestral mximo permitido en la estimacin de es
c
X
2 E =
El error muestral mximo permitido en la estimacin de t es
c
X M
2 E =

SELECCIN DEL NUMERO DE CONGLOMERADOS EN LA MUESTRA PARA

El nmero de conglomerados en la muestra n para estimar con error mximo permitido E y un
nivel de confianza del 95% es

S
4
E
M N
S N

2
c
2
2
2
c
+
|
|
.
|

\
|
= n
donde
( )

1 - n
X m -
S
n
2
c i i
2
c
t
= puede calcularse de una muestra preliminar y M puede ser
estimado por m con la misma muestra


PRUEBA DE HIPOTESIS

El problema de decisin a estudiar:
i) 2 hiptesis
ii) 2 alternativas

PROCEDIMIENTO DE LA PRUEBA ACERCA DE

1. FORMULACION DE LAS HIPOTESIS
2.
Hiptesis estadstica. Es un supuesto acerca del valor de un parmetro
Consideremos una accin y su efecto
Hiptesis nula (H
0
) Ausencia de efecto
Hiptesis alterna (H
1
) Presencia de efecto

Tipos de pruebas
Unilaterales
Cola der Cola izq
H
0
: =
0
( >
0
)

H
0
: =
0
( s
0
)
H
1
: <
0
H
1
: >
0

Bilaterales
H
0
: =
0

H
1
: =
0


2. ELEGIR UN NIVEL DE SIGNIFICACION

Error I: Seleccionar A
1
cuando H
0
es V
P ( error I ) s o o es el nivel de significacin Los ms usuales o = 0.01 o = 0.05

3. IDENTIFICAR EL ESTADISTICO DE PRUEBA Y ESTABLECER UNA REGLA DE DECISION

Como X-
0
= 47.30-44 = 3.30 qq/mz
H
0
: X-
0
no es signif
H
1
: X-
0
es signif
Cmo saber si X-
0
es signif ?
X
0

X
= Z o t Estadstico de prueba
Es Z o t es signif distinto de cero ?

Establezcamos un valor crtico de Z o t cuyo valor dependa de o as

Cola der Cola izq







0

z Z o t -

z 0
Z o t

t
Es cero Es mayor Es menor Es cero
A R R A

Dos colas Ej 2.2 Poblacin no normal, o desc, n >
30
o 1



2

= 0.05


-
/2
z
o
0
/2
z
o
Z o t 0 1.65 Z
-
/2
t
o

/2
t
o
Es cero Es mayor
Es menor Es cero Es mayor A R
R A R

Como decir que Z o t es distinto de cero equivale a rechazar H
0
y decir que Z o t es cero equivale a
"aceptar" H
0
la regla de decisin puede resumirse como aparece en la pg 89

4. TOMAR UNA MUESTRA ALEATORIA Y DETERMINAR EL VALOR DEL ESTADISTICO DE
PRUEBA
En base a una muestra valoramos que
X
0

X
que puede ser igual a Z o t


5. SELECCIONAR UNA ALTERNATIVA

Rechazo H
0
Aceptacin de H
1

No rechazo H
0
"Aceptacin" de H
0


PROCEDIMIENTO DE LA PUEBA ACERCA DE p

Ahora como la proporcin poblacional es una media poblacional, el procedimiento para probar
hiptesis acerca de p ser el mismo que se utiliz para .

Como las hiptesis sern suposiciones acerca de p, el estadstico de prueba ser naturalmente la
proporcin muestral p
S
pero estandarizada, esto es, la diferencia p
S
- p
0
expresada en unidades
del error estndar de p
S
donde p
0
es el valor supuesto de p
Si n es suficientemente grande, esto es, np
0
> 5 y n (1 p
0
) > 5
entonces el estadstico de prueba es

p - p
S
p
0 S
o
= Z donde

n


Y
p
S
o
o = =

) p - 1 ( p

n

0 0
si la poblacin es infinita
o
n


Y
p
S
o
o =
1 - N
n - N
=

) p - 1 ( p

n

0 0
1 - N
n - N
si la poblacin es finita.