You are on page 1of 0

Probabilidades y Estadística

Edmundo Peña Rozas, Juan Garcés Seguel
1
Estimación Puntual y por Intervalos

La inferencia estadística está relacionada con los métodos para obtener conclusiones o generalizaciones acerca
de una población. Estas conclusiones sobre la población pueden estar relacionadas ó con la forma de la
distribución de una variable aleatoria, o con los valores de uno o varios parámetros de la misma.

El campo de la inferencia estadística se divide en dos: Por un lado tenemos el problema de la estimación de los
parámetros de una distribución, y por el otro, las pruebas de hipótesis. En el problema de estimación se trata de
elegir el valor de un parámetro de la población, mientras que en las pruebas de hipótesis se trata de decidir
entre aceptar o rechazar un valor especificado (por ejemplo, si el medicamento A es superior al medicamento
B).

A su vez el problema de la estimación se puede dividir en dos áreas: La estimación puntual, y la estimación por
intervalos de confianza. En forma similar, en el campo de las pruebas de hipótesis se pueden considerar dos
áreas: Pruebas de hipótesis sobre parámetros, para determinar si un parámetro de una distribución toma o no
un determinado valor, y Pruebas de Bondad de Ajuste, para definir si un conjunto de datos se puede modelar
mediante una determinada distribución.



Estimación puntual

La estimación puntual consiste en utilizar el valor de una estadística o un valor estadístico para estimar el
parámetro de una población. Por ejemplo, cuando usamos la media muestral X para estimar la media de una
población (µ), o la proporción de una muestra P para estimar el parámetro de una distribución binomial θ. Una
“estimación puntual” de algún parámetro de una población θ es un solo valor obtenido a partir de un estadístico
θ
ˆ
.

Estimador. Se denomina “estimador” de un parámetro θ a un estadístico T = t(X
1
, X
2
, ..., X
n
) que es usado para
estimar el valor del parámetro θ de una población. Al valor observado del estadístico t = t(x
1
, x
2
, ..., x
n
) se le
denomina “estimador” de θ. Cuando hablamos del parámetro θ nos podemos estar refiriendo a un solo
parámetro, o a un conjunto de parámetros desconocidos. Si el parámetro θ es estimado, lo representamos
como θ
ˆ
. Es decir, θ
ˆ
= T = t(X
1
, X
2
, ..., X
n
)

Los principales métodos de estimación de parámetros son los siguientes

Método de los momentos
Método de máxima verosimilitud
Mínimos cuadrados

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
2
Para la estimación de parámetros de distribuciones de probabilidad los métodos empleados son los dos
primeros, mientras que el método de mínimos cuadrados se usa principalmente en los estudios de regresión.

Método de los Momentos

Los momentos sirven para caracterizar una distribución de probabilidad, y si dos variables aleatorias tienen los
mismos momentos, entonces dichas variables tienen o siguen la misma función de densidad. Por lo tanto, los
podemos emplear para estimar sus respectivos parámetros. El método consiste en igualar los primeros
momentos de una población a los momentos correspondientes de una muestra.


Método de Máxima Verosimilitud

El método básicamente consiste en determinar la función de verosimilitud de una muestra o conjunto de
variables aleatorias X
1
, X
2
, ..., X
n
(definida como la función conjunta de densidad de dichas variables) para a
continuación derivar la función de verosimilitud con respecto a cada uno de los parámetros a estimar, igualar a
cero y despejar el respectivo valor.

Los estimadores son variables aleatorias, y por lo tanto tienen una función de densidad, correspondiente a las
distribuciones muestrales. Por lo tanto, no hay ningún estimador perfecto, ya que siempre habrá algún error en
el proceso de estimación, de tal manera que se espera que un estimador puntual cumpla con ciertas
propiedades:.

Insesgamiento: Como no hay ningún estimador perfecto que de siempre estimación exacta del parámetro, será
un estimador insesgado aquel que en promedio es igual al parámetro. El valor esperado del estimador debería
ser igual al parámetro que trata de estimar. En caso de que lo sea, se dice que el estimador es “insesgado”, en
caso contrario se diría que es sesgado.

Consistencia: Es razonable esperar que un estimador mejore a medida que se aumenta el tamaño de la
muestra, de acuerdo a esto, cuando el tamaño de la muestra es muy grande los estimadores tomarán, por lo
general, valores muy próximos a los parámetros respectivos. Entonces, un estimador es consistente cuando se
cumple que a medida que el tamaño de la muestra crece, el valor estimado se aproxima al parámetro
desconocido.

Eficiencia: Al estimador, al ser una variable aleatoria, no se le puede exigir que para una muestra cualquiera se
obtenga como estimación el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión con
respecto al valor central (varianza) sea tan pequeña como sea posible.

Suficiencia: El estimador debería aprovechar toda la información existente en la muestra. Un estimador T es
suficiente si utiliza toda la información relevante de la muestra para estimar el parámetro θ de la población. Es
decir, un estimador T es suficiente si todo el conocimiento que se obtiene acerca del parámetro θ es mediante la
especificación real de todos los valores de la muestra.

Dado que los estimadores puntuales raramente coincidirán con los parámetros que tratan de estimar, es
posible otorgarse una mayor libertad en su estimación mediante el uso de la “estimación por intervalos” o
“intervalos de confianza”.

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
3
Un intervalo de confianza es un intervalo dentro del cual se espera encontrar el verdadero valor de un
parámetro.

Definición: Sea 1-α una probabilidad especificada alta y sean T1 y T2, dos estadísticos tales que
P[T1 ≤ θ ≤ T2] = 1–α

El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-α)% para el parámetro desconocido θ.
Las cantidades T1, T2 reciben el nombre de límites de confianza inferior y superior, respectivamente, y (1-α) es
el Nivel de Confianza asociado con el intervalo.

La interpretación de un intervalo de confianza radica en la interpretación de una probabilidad de largo plazo, y
es que, si se recopila un número grande de muestras aleatorias y se calcula un intervalo de confianza del
100(1-α)% para el parámetro θ para cada una de las muestras, entonces el 100(1- α)% de esos intervalos
contienen el valor verdadero de θ.


De acuerdo con la interpretación, el nivel de confianza del 100(1-α)% no es tanto un enunciado sobre un
intervalo particular sino que pertenece a lo que pasaría si se construyera un número grande de intervalos
semejantes.

INTERVALO DE CONFIANZA PARA MEDIA POBLACIONAL CON VARIANZA
POBLACIONAL CONOCIDA


Si x es la media de una muestra aleatoria de tamaño n de una población que se distribuye normal con varianza
poblacional σ
2
, el intervalo de confianza de (1 - α) 100% para µ es:

n
z x
n
z x
σ
µ
σ
α α 2 / 1 2 / 1 − −
+ ≤ ≤ −


Cabe hacer notar que aun cuando la distribución de la variable aleatoria no sea normal, si n≥30, la distribución
tenderá a la normal, de tal manera que este intervalo de confianza para la media puede ser aplicado para
muestras grandes aunque la variable original no distribuya exactamente como una normal.

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
4
Ejemplo.

Si µ representa la longitud media de un eje proveniente de un proceso de producción normal con una varianza
de 0.01 cm., y se toman muestras de 16 ejes, cuál será el intervalo de confianza del 95% para el nivel medio del
proceso.

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solución:

96 . 1 025 . 0 2 / 05 . 0 01 . 0 92 . 4 16
975 . 0 2 / 1
2
= = → = → = = = =

z z x n
α
α α σ


97 . 4 87 . 4
16
1 . 0
96 . 1 92 . 4
16
1 . 0
96 . 1 92 . 4
2 / 1 2 / 1
≤ ≤
+ ≤ ≤ −
+ ≤ ≤ −
− −
µ
µ
σ
µ
σ
α α
n
z x
n
z x


INTERVALO DE CONFIANZA PARA MEDIA POBLACIONAL CON VARIANZA
POBLACIONAL DESCONOCIDA

Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria proveniente de
una distribución normal, en lugar de usar distribución normal, se debe emplear la distribución t. Es decir, la
variable T definida de la siguiente manera sigue una distribución t con n-1 grados de libertad.

1
~

=

n
t T
n
s
x µ


Si x y s son la media muestral y la desviación estándar de una muestra aleatoria tomada de una distribución
normal con varianza σ² desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-α)% para µ será
aquel que cumpla que:
P[T1 ≤ µ ≤ T2] = 1–α

Entonces, Si x es la media muestral de una muestra aleatoria de tamaño n de una población con varianza
desconocida σ
2
, y s
2
es la varianza muestral, el intervalo de confianza para la media poblacional µ está dado
por:

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
5

n
s
t x
n
s
t x
n n ) 2 / 1 ; 1 ( ) 2 / 1 ; 1 ( α α
µ
− − − −
+ ≤ ≤ −


Ejemplo.

Si µ representa la longitud media de un eje proveniente de un proceso de producción normal, y se toman
muestras de 16 ejes, cuál será el intervalo de confianza del 95% para el nivel medio del proceso?.

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solución:

131 . 2 025 . 0 2 / 05 . 0 0083 . 0 92 . 4 16
) 975 . 0 ; 15 ( ) 2 / 1 ; 1 (
2
= = → = → = = = =
− −
t t s x n
n α
α α








Ejemplo:
El contenido de una muestra aleatoria de 7 contenedores de ácido sulfúrico, se presenta a continuación:
9.8, 10.2, 10.4, 9.8, 10, 10.2, y 9.6 litros. Encontrar un intervalo de confianza del 95% para el contenido
promedio de los contenedores.
( 1;1 / 2) (6;0.975)
7 10 0.283 0.05 / 2 0.025 2.447
n
n x s t t
α
α α
− −
= = = = → = → = =
( 1;1 / 2) ( 1;1 / 2)
0.283 0.283
10 2.447 10 2.447
7 7
9.74 10.26
n n
s s
x t x t
n n
α α
µ
µ
µ
− − − −
− ≤ ≤ +
− ≤ ≤ +
≤ ≤


( 1;1 / 2) ( 1;1 / 2)
0.091 0.091
4.92 2.131 4.92 2.131
16 16
4.87 4.97
n n
s s
x t x t
n n
α α
µ
µ
µ
− − − −
− ≤ ≤ +
− ≤ ≤ +
≤ ≤
Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
6
Cuando la muestra es lo suficientemente grande y aun cuando el supuesto de normalidad no se cumpla
cabalmente, apoyándose en el teorema del límite central, se puede utilizar como aproximación el siguiente
intervalo de confianza para muestras grandes, el cual indudablemente mejorará en calidad conforme aumente el
tamaño de la muestra.


1 / 2 1 / 2
s s
x z x z
n n
α α
µ
− −
− ≤ ≤ +


La figura que se muestra a continuación, presenta en esquema para seleccionar el intervalo de confianza para µ
más adecuado


DISTRIBUCIÓN MUESTRAL DE UNA PROPORCION


Proporción: Es la fracción de una población que posee una rasgo o característica de interés.

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
7
población la de Tamaño
éxitos de número
N
X
P = =

El estimador puntual de la proporción está dado por:

muestra la de Tamaño
éxitos de número
n
x
p = =

Si P es la proporción de individuos de en una población que presenta cierta característica de interés y p es la
proporción de individuos en una muestra que presenta dicha característica, al aplicar el teorema del límite
central se puede demostrar que p distribuye aproximadamente normal, con media P y varianza P(1-P)/n,
siempre y cuando np ≥ 5 np(1-p) ≥ 5.

De lo anterior se desprende que el estadístico Z:

) 1 , 0 ( ~
) 1 (
N
n
P P
P p
Z


=


Intervalo de Confianza para una Proporción

Si p es la proporción de interés en una muestra aleatoria de tamaño n, y se tiene que el estadístico:
) 1 , 0 ( ~
) 1 (
N
n
P P
P p
Z


=

Entonces, al despejar P se tiene que:
n
P P
Z p P
) 1 ( −
± =
Entonces, dado que P es desconocido pero lo podemos reemplazar por p, intervalo de confianza aproximado
de 100(1-a)% para la proporción de la población P cuando n es suficientemente grande esta dado:

n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1

+ ≤ ≤


− − α α


Ejemplo:
Un fabricante asegura a un potencial comprador que el porcentaje defectuoso de su proceso es máximo el 4%.
Para comprobar la afirmación del productor, el cliente solicita que se le inspeccione una muestra de 300
artículos de los que hay en el inventario. Al verificar esta muestra se obtienen 18 artículos defectuosos. Podrá el
cliente potencial dudar de la afirmación del proveedor?
Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
8

Solución:
p=18/300=0.06, n=300, Z
1-α/2
=1.96

n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1

+ ≤ ≤


− − α α

300
) 06 . 0 1 ( 06 . 0
96 . 1 06 . 0
300
) 06 . 0 1 ( 06 . 0
96 . 1 06 . 0

+ ≤ ≤

− P
087 . 0 033 . 0 ≤ ≤ P


Ejemplo:
En una muestra aleatoria de 500 familias que cuentan con televisión pagada en la ciudad de Concepción, se
encontró que 340 tienen contratado el plan MovieMax. Encuentre un intervalo del 95% de confianza para la
proporción real de familias con televisión pagada en Concepción que está suscrita a MovieMax.

Solución:
A partir de los datos se obtiene lo siguiente: p=340/500=0.68, n=500, Z
1-α/2
=1.96
n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1

+ ≤ ≤


− − α α

0.68(1 0.68) 0.68(1 0.68)
0.68 1.96 0.68 1.96
500 500
P
− −
− ≤ ≤ +
0.64 0.72 P ≤ ≤
Por lo tanto, con un 95% de confianza, la verdadera proporción de familias con televisión pagada en
Concepción que están suscritas a Movie Max, está entre un 64% y 72%.

INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL

Si X
1
, X
2
, …, X
n
es una muestra aleatoria de tamaño n tomada de una población normal, y si s
2
es la varianza
muestral, entonces s
2
es un estimador puntual de la varianza poblacional σ². Por otra parte, si la población es
normal, la distribución muestral de S
2
es una distribución ji-cuadrado con n - 1 grados de libertad.
2
1
2
2
2
~
) 1 (


=
n
s n
S χ
σ

Por lo tanto, para obtener un intervalo de confianza del 100(1-α)% para la varianza σ
2
nos basamos en el
estadístico S
2
y en la distribución ji cuadrado. Por lo tanto, tenemos la siguiente probabilidad:


α χ
σ
χ
α α
− =











− − −
1
) 1 (
2
) 2 / 1 ; 1 (
2
2
2
) 2 / ; 1 ( n n
s n
P

Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
9

De la cual se desprende


α
χ
σ
χ
α α
− =









≤ ≤

− − −
1
) 1 ( ) 1 (
2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2
n n
s n s n
P


Entonces el intervalo de confianza para σ
2
es:


2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2
) 1 ( ) 1 (
α α
χ
σ
χ
− − −

≤ ≤

n n
s n s n


Ejemplo.

Si la longitud de un eje proviene de un proceso de producción distribuido normal, y se toman muestras de 16
ejes, cuál será el intervalo de confianza al 95% para la varianza del proceso?

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solución:
262 . 6
488 . 27 025 . 0 2 / 05 . 0
0083 . 0 16
2 2
2 2
2
) 025 . 0 ; 15 ( ) 2 / ; 1 (
) 975 . 0 ; 15 ( ) 2 / 1 ; 1 (
= =
= = → = → =
= =

− −
χ χ
χ χ α α
α
α
n
n
s n


0199 . 0 0045 . 0
262 . 6
0083 . 0 ) 1 16 (
488 . 27
0083 . 0 ) 1 16 (
) 1 ( ) 1 (
2
2
2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2
≤ ≤

≤ ≤


≤ ≤

− − −
σ
σ
χ
σ
χ
α α n n
s n s n


Ejemplo
Probabilidades y Estadística
Edmundo Peña Rozas, Juan Garcés Seguel
10
Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma una
muestra aleatoria de 15 varillas y se mide el diámetro (cm). Suponga que el diámetro de la varilla tiene una
distribución normal.
8,24 8,23 8,2
8,21 8,2 8,28
8,23 8,26 8,24
8,25 8,19 8,25
8,26 8,23 8,24
a) Construya un intervalo de confianza del 95% para el diámetro promedio de la varilla.

b) Construya un intervalo de confianza del 95% para la dispersión del diámetro de las varillas.

Solución
a) Se tiene que: 8, 23 ; 0, 025 ; 15 x s n = = = . Además, la varianza es desconocida, por lo tanto, un
intervalo de confianza para la media está dado por:
n
s
t x
n
s
t x
n n ) 2 / 1 ; 1 ( ) 2 / 1 ; 1 ( α α
µ
− − − −
+ ≤ ≤ −

Entonces
0, 025 0, 025
8, 23 2,1448 8, 23 2,1448 8, 219 8, 248
15 15
µ µ − ≤ ≤ − ⇔ ≤ ≤
Por lo tanto, un intervalo del 95% de confianza para el diámetro medio de las varillas está dado por:
[8,219; 8,248].

b) Un intervalo de confianza del 95% para la dispersión del diámetro de las varillas está dado por:
2 2
2
2 2
( 1;1 / 2) ( 1; / 2)
2 2
2
2
( 1) ( 1)
(15 1)0.025 (15 1)0.025
26,119 5.629
0, 0003 0, 002
n n
n s n s
α α
σ
χ χ
σ
σ
− − −
− −
≤ ≤
− −
≤ ≤
≤ ≤