Estadistica

1.
ESTIMACIÓN PUNTUAL
1.1 INTRODUCCIÓN
1.2 PROPIEDADES DE LOS ESTIMADORES
1.3 MÉTODO DE CÁLCULO DE LOS ESTIMADORES
2. ESTIMACIÓN POR INTERVALOS DE CONFIANZA
2.1 CASOS PARTICULARES
2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA

2.1.2 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
2.1.3 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS
PROPORCIONES
2.1.5 INTERVALO DE CONFIANZA PARA LA VARIANZA
2.1.6 INTERVALO DE CONFIANZA PARA EL COCIENTE DE
VARIANZAS
3. PRECISIÓN Y TAMAÑO DE LA MUESTRA

TEMA 6
ESTIMACIÓN
1. ESTIMACIÓN PUNTUAL
1.1. INTRODUCCIÓN
En todo este tema vamos a suponer que estamos estudiando una población
cuya distribución es conocida excepto en un parámetro (m , s , l ,. ..) al que
2
llamaremos q . A la distribución de la población la denotaremos por f(x).
Diremos que nos encontramos ante un problema de estimación cuando,

dada una población con una distribución f(x) donde q es un parámetro
desconocido, aventuremos o infiramos en base a los datos muestrales
X , X ,..., X el valor de q . Si al inferir el parámetro damos un único valor
1 2 n
estaremos ante un problema de estimación puntual.
Estimador puntual qˆ X 1 , X 2 ,..., X n  : será una función de la muestra aleatoria

(un estadístico) que utilizaremos para estimar el valor del parámetro q .
Estimación qˆ : valor obtenido del estimador al sustituir por los valores de una
muestra completa.
Cuando no haya lugar para la confusión designaremos al estimador

simplemente por qˆ .
Un estimador es, por tanto, un estadístico y, por ello, es una v.a. con una
determinada distribución de probabilidad llamada distribución muestral.
Dado un parámetro, podríamos utilizar distintos estimadores puntuales para

estimarlo. Por ejemplo, para estimar la varianza de la población podemos
utilizar la varianza muestral o la cuasi-varianza muestral. ¿Cuál es mejor?
Veamos a continuación como comprobar si un estadístico es un buen
estimador de un parámetro. Para ello le exigiremos una serie de propiedades.
Como el estadístico es una variable aleatoria, las propiedades se las tenemos
que exigir a su distribución de probabilidad.
1.2. PROPIEDADES DE LOS ESTIMADORES.
Un estadístico se considera un buen estimador de un parámetro si cumple: ser

insesgado, ser consistente y ser eficiente.
A. INSESGADEZ

Un estimador qˆ es insesgado si E qˆ  q . Es decir, su distribución está
centrada en el parámetro a estimar.
Ejemplos: Sea una m.a.s. X , X ,..., X

1 2 n tal que E X   m
i y
Var X   s
2
a) Consideremos como estimador de la media poblacional a la media
muestral. Es decir m€  Xn . Por el tema anterior, sabemos que E X n  m .
Por tanto, la media muestral es estimador insesgado de la media poblacional.
b) Supongamos como estimador de la varianza poblacional a la varianza
n-1
muestral, sˆ 2  s n2 . Del tema anterior , sabemos que E sn   s
2 2
. Por
n
tanto, la varianza muestral no es un estimador insesgado de la varianza
poblacional .
c) Consideremos ahora como estimador de la varianza poblacional a la
cuasi-varianza muestral, sˆ 2  sn2 . Del tema anterior sabemos que E sn  s

2 2
. Por tanto, la cuasi-varianza muestral es un estimador insesgado de la

varianza poblacional.
B. CONSISTENCIA
Diremos que qˆ es un estimador consistente de q si cumple:
lim E qˆ  q
n 
y limVar qˆ  0
n  n 
 
 lim P qˆ  q  1
Esto significa que si tomáramos la mayor muestra posible, el estimador

coincidiría con el valor del parámetro.
Ejemplo: Veamos que los estimadores de los cuales hemos hablado en el

apartado anterior son consistentes.
s2
a) Si consideramos m̂  X n . Se cumple que E X n   m y Var X n  .

n
s 2
Pero tomando límites, lim  0 . Por tanto, X es estimador consistente. n

n n 
b) Si consideramos sˆ  s n . Se cumple que:

2 2
n-1 2n - 1
E s  s Vars   s
2 2 2 4
y
n
n
n
n 2
Tomando límites,
n-1 2 n - 1
lim s s s 0
2 2
lim
4
y
n 
n n 
n 2
Por tanto, sn es un estimador consistente de s .

2 2
2
c) Si consideremos sˆ  sn . Se cumple que
2
2
E s  s Vars  s
2 2 2 4
y
n-1
n n
Tomando límites,
2
lims  s
2 2
lim s 0
4
y
n 
n 
n-1
Por tanto, sn es un estimador consistente de la varianza poblacional.
2
C. EFICIENCIA
Dados dos estimadores de q , qˆ1 y qˆ2 , decimos que qˆ1 es más eficiente que
   
qˆ2 , si Var qˆ1  Var qˆ2 . Nos interesa el que tenga menos dispersión. Para
Var qˆ1  
comparar la eficiencia se construye el cociente
Var qˆ2  
. Si es mayor que 1,
entonces qˆ2 es más eficiente; si es igual a 1, entonces ambos estimadores
son igual de eficientes; si es menor que 1, entonces qˆ1 es más eficiente.
Ejemplo: Consideremos como estimadores de s a sn y sn . Calculamos el

2 2 2
cociente de las varianzas:
2( n - 1)
s 4
Vars  (n - 1)
2 2
n
 n 2
  1 Por tanto, s es más eficiente.

2
Vars 
2
n
2
s n
4
2 n
(n - 1)
1.3. MÉTODOS DE CÁLCULO DE LOS ESTIMADORES.
De los diferentes métodos de cálculo de los estimadores, nosotros veremos:
a) Estimación por el método de los momentos.

b) Estimación máximo-verosímil.
A. ESTIMCIÓN POR EL MÉTODO DE LOS MOMENTOS
Consiste en tomar como estimadores de los momentos poblacionales a los

momentos muestrales. Se obtiene una ecuación de donde podemos despejar el
parámetro a estimar.
B. ESTIMACIÓN MÁXIMO-VEROSÍMIL
Sea X una variable aleatoria con distribución f ( x; q ) donde q es el parámetro
desconocido. Sean X1 , X2 ,... Xn n variables aleatorias independientes con la
misma distribución que X; es decir, sea ( X1 , X2 ,... Xn ) una m.a.s. Bajo estas
condiciones la distribución conjunta de las variables aleatorias X1 , X2 ,... Xn

será igual al producto de las marginales.
f ( x , x , ..., x ; q )  f ( x ; q ) × f ( x ;q )×...× f ( x ; q )
1 2 n 1 2 n
Si consideramos x1 , x2 ,.. . xn fijos y estudiamos esta función como función de

q recibe el nombre de función de verosimilitud y se denota por V( q ).
Sean qˆ1  u1 ( X 1 , X 2 ,... X n ) , qˆ2  u 2 ( X 1 , X 2 ,... X n ) , etc. diversos estimadores

de q . De todos ellos pretendemos elegir el que haga máxima la función de
verosimilitud. Es decir, un estimador qˆ será estimador máximo-verosímil
(EMV) de q si maximiza V( q ).
Debido a que la función de verosimilitud es no negativa, continua y creciente,

alcanzará su máximo en los mismos puntos que su logaritmo y por ello, y por
razones de cálculo se suele maximizar lnV (q ) cuando esta depende de
exponenciales.Así pues, deberemos resolver la siguiente ecuación:
d( lnV (q ))
0
dq
En el caso de dos o más parámetros desconocidos, el procedimiento es el

mismo. Por ejemplo, si tuviéramos V (q 1 ,q 2 , q 3 ) los tres estimadores máximo
verosímiles serán los que maximizan la función V (q 1 ,q 2 , q 3 ) o su logaritmo.

Se obtendrían al resolver las ecuaciones siguientes:
d( lnV (q , q , q ) )
1 2
0 ^ 3
dq 1
d( lnV (q , q , q ) )
1
0
2 3
dq 2
d( lnV (q , q , q ) )
1
0
2 3
dq 3
Propiedades de los EMV
a) Son consistentes.
b) Son asintoticamente eficientes. Es decir, tienen la varianza mínima

cuando el tamaño muestral tiende a infinito.
c) Si qˆ es estimador suficiente de q , el EMV de q es función de qˆ .
d) Son asintoticamente normales. Es decir, su distribución tiende a la

distribución normal cuando tiende a infinito el tamaño de la muestra.
e) Si qˆ es EMV de q , entonces g( qˆ ) es EMV de g( q ), siendo g una
aplicación biyectiva.
Ejemplo: Obtener el EMV del parámetro de una v.a. X que sigue una
distribución de Bernouilli, X  Be( p) . Su función de cuantía es
f ( x; p)  p (1 - p)
x 1- x
Si elegimos una muestra de tamaño n, la función de verosimilitud

correspondiente será:
V ( p)  f ( x ; p) × f ( x ; p)×. ..× f ( x ; p)  p (1 - p) p (1 - p) . .. p (1 - p) 
x1 1 - x1 x2 1- x2 xn 1- x n
1 2 n
 på (1 - p) å
xi n- xi
Tomando logaritmos tenemos
lnV ( p)  å x ln p + (n - å x ) ln(1 - p)
i i
Para obtener el EMV de p debemos resolver la ecuación d( lnV ( p))  0
dp
En este caso
d( lnV ( p)) 1 ( - 1)
 å x + (n - åx ) 0
dp p (1 - p)
i i
Haciendo operaciones e igualando denominadores obtenemos:
(1 - p)å x - p(n - å x ) 
i i å x - på x - np+ på x  å x
i i i i
- np  0
Despejando el valor de p obtenemos el estimador pˆ  åx i
Por tanto EMV(p)=

åx i
. Es decir, la proporción de éxitos de la muestra.
n
2.ESTIMACIÓN POR INTERVALOS DE CONFIANZA
En la estimación puntual atribuimos al parámetro el valor correspondiente del

estimador obtenido en la muestra aleatoria de tamaño n. Es claro, que dicho
valor dificilmente coincidirá con el verdadero valor del parámetro aunque el
tamaño de la muestra sea muy grande.
La estimación por intervalos consiste en atribuir al parámetro desconocido un

rango de posibles valores (en base a los datos muestrales) que tengan una alta
probabilidad de incluir entre ellos al valor del parámetro desconocido. Para ello
será imprescindible conocer la distribución muestral del estadístico utilizado.
El intervalo estimado que debe contener al parámetro se llama intervalo

confidencial o de confianza. Denominamos límites confidenciales a los
extremos de dicho intervalo. Llamaremos nivel de confianza a la probabilidad
de que un intervalo contenga al parámetro desconocido y se suele denotar por
1 - a . Se llama nivel de riesgo o de significación al valor de a .
Es decir, P q Î a, b  1 - a . Esto indica que el (1 - a )% de intervalos
construidos contendrán al parámetro desconocido.
Denominaremos error muestral máximo a la diferencia entre el valor de la
b-a
estimación muestral y el valor del parámetro; es decir, E  qˆ - q  .
2
Ejemplo: Sea q el parámetro desconocido y qˆ el estimador que consideramos

el cual sigue una distribución N (q , s ) . Supongamos un error muestral
2
máximo E  qˆ - q  2s .
Si calculamos la probabilidad de tener ese error o uno menor, obtendremos:
   

P qˆ - q  2s  P - 2s  qˆ - q  2s  P - 2 
qˆ - q
s

 2    ( 2) -  (-2)  =
 
2 (2) - 1  0, 9544 ya que el estimador seguía una distribución normal.
Esta probabilidad podemos escribirla también de la siguiente forma:
    
P - 2s  qˆ - q  2s  P 2s  qˆ - q  -2s  P - 2s + qˆ  q  2s + qˆ  
 
 P q Î qˆ - 2s , qˆ + 2s 

Por tanto, el intervalo de confianza qˆ - 2s , qˆ + 2s  tiene un nivel de confianza
1 - a =0'9544 o un nivel de significación de a =0'0456. Esto equivale a decir
que tenemos la confianza 0'9544 de que, extraida una muestra y calculado el
valor de qˆ , éste no se aleja del parámetro más de dos desviaciones típicas o
un riesgo de 0'0456 de que se aleja más de esa cantidad.
Dicho de otro modo, si sale una muestra en que qˆ está en la zona rayada el
intervalo no contendrá a q .
Normalmente lo que se hace es fijar de antemano el nível de confianza y se
busca el intervalo correspondiente a ese nível de confianza utilizando la
distribución muestral del estadístico.
2.1 CASOS PATICULARES
2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA
Si desconocemos la distribución de la población, podemos hallar un intervalo

de confianza para la media, basándonos en un resultado que conocemos como
Desigualdad de TChebychev.
Sea X una v.a. cualquiera con media m y varianza s . Se cumple que:

2
P
m - k  X  m + k   1- 1
 s s k
2
Usando el anterior resultado, aplicándolo a la variable aleatoria X y tomando
1
a 2 , obtendríamos que el intervalo para un nivel 1 - a sería:
k
éX - s , Xn +s ù
ë n
na na û
Para analizar los resultados que presentamos a continuación, supongamos una

población que se distribuye normal de media m y varianza poblacional s .
2
También servirán cuando la población no es normal pero el tamaño muestral es

grande.
a) Si s es conocida.
2
X -m
Ya sabemos que s  N( 0,1) . Sea z
n
1-
a
el percentil de la distribución
2
n
a
normal; es decir,  ( z)  1 - .
2
 
X -m
P - z  z n   1- a
 1-
a
s 1-
a

 2
n 2

 s s 
Haciendo operaciones P  Xn - z mX +z   1- a
 1-
a
2
n n
1-
a
2
n
Por tanto, el intervalo de confianza para m será:

é s s ù
êX - z a
n
,X + z a
n úû
ë
n n
1- 1-
2 2
b) Si s es desconocida.
2
X -m
En este caso tenemos que
n
n - 1 t
s
n- 1
Por el mismo razonamiento anterior, si llamamos tn - 1 1-

a al percentil de la
2
a
distribución t de Student tal que P tn - 1  x  1 -
, el intervalo de confianza
2
al nivel de significación a (o equivalentemente, al nivel de confianza 1- a )
será:
é s s ù
êë X - t ,X + t
n n
n- 1 n - 1 úû
n n -1 a n n- 1 a
1- 1-
2 2
Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitarios. Responden

a una prueba de inteligencia espacial, en la que alcanzan una media de 80 y
una varianza de 100. ¿Entre qué límites se hallará la verdadera inteligencia
espacial media de los estudiantes, a un nivel de confianza del 99%?
a
1 - a  0' 99Þ a  0' 01Þ 1 -  0' 995
2
La varianza poblacional es desconocida y la población no es normal, pero el
tamaño muestral es mayor que 30, por tanto, el intervalo correspondiente será:
é s s ù
êë X - t ,X + t
n n
n- 1 n - 1 úû
n n -1 a n n- 1 a
1- 1-
2 2
Buscamos en las tablas la distribución t de Student t60 0 ,9 9 5

 2' 66.
Sabemos que Xn  80 y sn  10. Sustituyendo en el intervalo de confianza

tenemos:
é 10 10 ù
êë80- 2' 66 60 , 80+ 2' 66 60 úû
Por tanto, m Î  76' 57,83' 43 con un nivel de confianza del 99%.
2.1.2 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
Si en una población Bernouilli de parámetro p definimos la v.a. X= nº éxitos en

la muestra, X sigue una distribución binomial de parámetros (n,p). Si la muestra
es grande, tenemos que la proporción muestral P=X/n se distribuye
 pq
aproximadamente como una normal N  p,  y podremos usar el teorema
 n
central del límite.
En una población Bernoulli, m  p , s 2  p(1 - p) y si denotamos por P a la
proporción en la muestra Xn  P . Así pues podemos aplicar el intervalo de

confianza para la media con varianza conocida visto anteriormente,
sustituyendo lo anterior y aproximando p(1-p) por P(1-P). un intervalo de
confianza aproximado para p a nivel 1 - a sería:
é P (1 - P ) P (1 - P ) ù
êP - z a
n
,P + z a
n ú
ë 1-
2
1-
2 û
Ejemplo: Uno de los líderes de un colectivo laboral desea plantear una cuestión
a todos los miembros del grupo. Si más de la mitad respondieran NO entonces
preferiría no plantearla para no minar su prestigio. Para salir de dudas, elige
aleatoriamente a 100 trabajadores a los que hace la pregunta y sólo 30
responden NO. ¿Entre qué límites se hallará la verdadera proporción al nivel
del 95%?
Como el tamaño muestral es grande, podemos aplicar el teorema central del
a
límite. Tenemos 1 - a  0' 95Þ 1 -  0' 975Þ z a
 1' 96
2 1-
2
Sustituyendo los valores en el intervalo correspondiente:
é 0' 3 × 0' 7 0' 3× 0' 7 ù

ê 0' 3 - 1' 96 , 0' 3 + 1' 96  0' 2102, 0' 3898
ë 100 100 úû
Por tanto, la verdadera proporción está en el intervalo  0' 2102, 0' 3898 con
un nivel de confianza del 95%.
2.1.3 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS.

Suponemos dos poblaaciones independientes
X  N (m , s ) , Y  N(m , s )
2 2
1 1 2 2
Tomamos muestras de tamaño n1 y n2 , respectivamente.
 s s  2 2
a) Si s y s son conocidas, como X - Y  N  m - m , +

2 2
,
1 2
n n 
1 2 n1 n2 1 2
 1 2
el intervalo de confianza será:
é s 2
s 2
s s ù
2 2
m - m ÎêX - Y -z a
+
1
,X - Y + z
2
a
+ 1
ú
2
n n n n û
1 2 n1 n2 n1 n2
ë 1-
2 1 2
1-
2 1 2
s s
2 2
b) Si 1 y 2 son desconocidas pero iguales, como
X - Y - m - m 
t
n1 n2 1 2
n1 + n 2 - 2
ns + n s  1 1 
2 2
, el intervalo de confianza será:
 + 
1 1 2 2
n + n - 2 n n 
1 2 1 2
é ù
êX - Y - t n1 s12 + n2 s22  1 1 n1 s12 + n2 s22  1 1 ú
 +  , X n - Y n + tn  + 
ê n n1 + n2 - 2  n1 n2  n1 + n2 - 2  n1 n2  ú
1 n n 2 1 + n2 - 2 a 1 2 1 + n2 - 2 a
ë û
1- 1-
2 2
Ejemplo: Dos universidades públicas tienen dos métodos distintos para

inscribir a sus alumnos. Los dos desean comprobar el tiempo promedio que
toma la inscripción de los alumnos. En cada universidad se tomaron los
tiempos de inscripción de 31 alumnos tomados al azar. Las medias y
desviaciones típicas muestrales fueron: x  20' 3, sx  2' 5, y  23 , sy  3. Si se
supone que el muestreo se llevó a cabo en dos poblaciones normales e
independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para
la diferencia entre las medias del tiempo de inscripción para las dos
universidades,
a) suponiendo que las varianzas poblacionales son s x  9 , s y  10 .
2 2
b) suponiendo que las varianzas poblacionales son desconocidas pero

iguales.
a
Para el apartado a a  0 ¢ 05Þ 1- a  0' 95Þ 1 -  0' 975 Þ z a
 1' 96
2 1-
2
Sustituyendo los valores en el intervalo obtenemos:
é 9 10 9 10 ù
m 1 - m 2 Î ê 20' 3 - 23- 1' 96 + , 20' 3 - 23+ 1' 96 + ú
êë 31 31 31 31 úû
  - 2' 7 - 1' 53, - 2' 7 + 1' 53   - 4' 23, - 1' 17
Para el apartado b, buscamos en la tabla de la t de Student t31 + 31 - 2 0 '9 7 5

 2.
Sustituyendo los valores en el intervalo obtenemos:
é 31 × 2' 32
+ 31 × 3  1 1 
2
31 × 2' 32 +31 × 3  1 1  ù
2
êë20' 3 - 23 - 2 + , 20' 3 - 23 + 2
31 + 31 - 2  31 31 31 + 31 - 2  31 + 31 úû 
 -2' 7 -1' 4, -2' 7 +1' 4  -4' 1, -1' 3

PROPORCIONES.
Sean X  Be( p1 ) e Y  Be( p2 ) dos poblaciones independientes con p1 y

p desconocidos. Extraemos muestras de tamaño n y n , respectivamente.
2 1 2
 p ×q p ×q 
Como P1 - P2  N  p1 - p2 , +  y desconocemos los valores de
1 1 2 2
 n 1
n  2
p y p , aproximaremos las proporciones poblacionales por las proporciones

1 2
muestrales correspondientes. Por tanto, el intervalo de confianza será:

é P ×Q P ×Q P × Q P ×Q ù
p - p Î êP - P - z a
1
+ ,P - P + z
1 2 2
a
1
+ ú
1 2 2
n n n n û
1 2 1 2 1 2
ë 1-
2 1 2
1-
2 1 2
Caso particular: Si tenemos p  p  p, entonces

1 2 E P - P   0 y
1 2
 1 1 n ×P + n ×P
VarP - P   pq +  . Lo que haremos es sustituir p por
1 1 2 2
1
n n
2
1 2
n+n 1 2
Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la

proporción de mujeres entre sus empleados diplomados y licenciados. De cada
empresa se toma una m.a.s. de 40 empleados entre los diplomados y
licenciados, obteniéndose que en la empresa A había 16 mujeres y en la
empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de
proporciones poblacionales al nivel de confianza 0'96 ¿Podemos pensar que la
proporción es la misma?
a
1 - a  0' 96Þ 1 -  0' 98Þ z a
 2' 05
2 1-
2
16 22
P   0' 4 P   0' 55
40 40
1 2
Sustituyendo en el intervalo:
é 0' 4 × 0' 6 0' 55 × 0' 45 0' 4 × 0' 6 0' 55 × 0' 45 ù

êë0' 4 - 0' 55 - 2' 05 40
+
40
, 0' 4 - 0' 55 + 2' 05
40
+
40 úû =
=-0' 15 - 0' 2265, -0'15 + 0' 2265  -0' 3765, 0' 0765
El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.
2.1.5 INTERVALO DE CONFIANZA PARA LA VARIANZA.
Si tenemos una población X  N (m , s ) con s 2 desconocida, entonces

2
 n - 1 sn2-1
  2n -1
s 2
El intervalo de confianza para la varianza poblacional al nivel de confianza

1 - a lo podemos obtener como sigue:
 (n - 1)sn2-1 
P  2n -1a    2n -1 a   1 - a
 2
s 2
1- 
2
Despejando s 2 tenemos:
Es decir,
é ù
ê (n - 1)sn2-1 (n - 1)sn2-1 ú
s Îê
2
,
 2n -1 a  2n -1a ú
êë 1-
2 2
úû
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura
superior a las mujeres en la población española. Según las últimas tablas en el
servicio militar, los varones entre 18 y 20 años presentan una varianza de
0'0529. de las mujeres no tenemos información, por ello tomamos una muestra
de 101 mujeres entre 18 y 20 años y obtenemos ¿Entre qué valores se
encontrará la verdadera varianza a un nivel de 0'95 de confianza?
Sustituyendo en el intervalo tendremos:

2.1.6 INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS.
La distribución muestral del cociente de varianzas muestrales, cuando

teníamos dos poblaciones normales e independientes era:
A partir de aquí deducimos el intervalo de confianza para el cociente de

varianzas poblacionales al nivel de y obtenemos
Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de

confianza para el cociente de varianzas al nivel de confianza 0'95. ¿Podríamos
aceptar la suposición de que las varianzas poblacionales son iguales?
Sustituyendo en el intervalo obtenemos
El intervalo contiene al 1 y los extremos están bastante próximos al 1. Hay

mayor diferencia por el extremo inferior, lo que indica que la varianza de la
población X es menor que la de la población Y.
3. PRECISIÓN Y TAMAÑO DE LA MUESTRA
En general, cuanto más estrecho es un intervalo de confianza mayor precisión

tendrá nuestra estimación (será menor el error muestral máximo). Ahora bien,
la amplitud de un intervalo depende de dos factores: el nivel de confianza que
decidimos utilizar y el tamaño del error típico (es la desviación típica) del
estadístico utilizado como estimador.
Si disminuimos el nivel de confianza, diminuye la amplitud del intervalo, pero
aumenta el riesgo. Debemos intentar reducir la amplitud del intervalo
manteniendo constante el nivel de confianza; para ello hay que reducir el error
típico del estimador.
En el caso de la media, el error típico es . Por lo tanto, variando el tamaño
muestral variaremos el error típico. Al aumentar n, disminuye . Por tanto,
manipulando el tamaño de la muestra podemos obtener los intervalos de la
precisión que deseemos.
Para la media:
Para la proporción:
Ejemplo: Queremos estimar la media de una población normal con varianza

poblacional igual a 4. ¿qué tamaño muestral debemos tomar para que E=0'02
al nivel de confianza 0'95?
Como conocemos la varianza poblacional, el tamaño muestral será:
¿y si queremos un error E=1 al mismo nivel de confianza? En este caso
= . Redondeamos n=16.

Estadistica

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadistica

Uploaded by

Copyright:

Available Formats

1.

2. ESTIMACIÓN POR INTERVALOS DE CONFIANZA

2.1 CASOS PARTICULARES

2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA

3. PRECISIÓN Y TAMAÑO DE LA MUESTRA

llamaremos q . A la distribución de la población la denotaremos por f(x).

Diremos que nos encontramos ante un problema de estimación cuando,

estaremos ante un problema de estimación puntual.

Estimador puntual qˆ X 1 , X 2 ,..., X n  : será una función de la muestra aleatoria

Cuando no haya lugar para la confusión designaremos al estimador

Dado un parámetro, podríamos utilizar distintos estimadores puntuales para

1.2. PROPIEDADES DE LOS ESTIMADORES.

Un estadístico se considera un buen estimador de un parámetro si cumple: ser

Ejemplos: Sea una m.a.s. X , X ,..., X

a) Consideremos como estimador de la media poblacional a la media

muestral. Es decir m€  Xn . Por el tema anterior, sabemos que E X n  m .

Por tanto, la media muestral es estimador insesgado de la media poblacional.

b) Supongamos como estimador de la varianza poblacional a la varianza

c) Consideremos ahora como estimador de la varianza poblacional a la

cuasi-varianza muestral, sˆ 2  sn2 . Del tema anterior sabemos que E sn  s

. Por tanto, la cuasi-varianza muestral es un estimador insesgado de la

Esto significa que si tomáramos la mayor muestra posible, el estimador

Ejemplo: Veamos que los estimadores de los cuales hemos hablado en el

a) Si consideramos m̂  X n . Se cumple que E X n   m y Var X n  .

Pero tomando límites, lim  0 . Por tanto, X es estimador consistente. n

b) Si consideramos sˆ  s n . Se cumple que:

Por tanto, sn es un estimador consistente de s .

entonces qˆ2 es más eficiente; si es igual a 1, entonces ambos estimadores

son igual de eficientes; si es menor que 1, entonces qˆ1 es más eficiente.

Ejemplo: Consideremos como estimadores de s a sn y sn . Calculamos el

cociente de las varianzas:

  1 Por tanto, s es más eficiente.

1.3. MÉTODOS DE CÁLCULO DE LOS ESTIMADORES.

De los diferentes métodos de cálculo de los estimadores, nosotros veremos:

a) Estimación por el método de los momentos.

A. ESTIMCIÓN POR EL MÉTODO DE LOS MOMENTOS

Consiste en tomar como estimadores de los momentos poblacionales a los

condiciones la distribución conjunta de las variables aleatorias X1 , X2 ,... Xn

Si consideramos x1 , x2 ,.. . xn fijos y estudiamos esta función como función de

Sean qˆ1  u1 ( X 1 , X 2 ,... X n ) , qˆ2  u 2 ( X 1 , X 2 ,... X n ) , etc. diversos estimadores

Debido a que la función de verosimilitud es no negativa, continua y creciente,

En el caso de dos o más parámetros desconocidos, el procedimiento es el

verosímiles serán los que maximizan la función V (q 1 ,q 2 , q 3 ) o su logaritmo.

Propiedades de los EMV

b) Son asintoticamente eficientes. Es decir, tienen la varianza mínima

c) Si qˆ es estimador suficiente de q , el EMV de q es función de qˆ .

d) Son asintoticamente normales. Es decir, su distribución tiende a la

Si elegimos una muestra de tamaño n, la función de verosimilitud

Tomando logaritmos tenemos

Haciendo operaciones e igualando denominadores obtenemos:

Despejando el valor de p obtenemos el estimador pˆ  åx i

Por tanto EMV(p)=

2.ESTIMACIÓN POR INTERVALOS DE CONFIANZA

En la estimación puntual atribuimos al parámetro el valor correspondiente del

La estimación por intervalos consiste en atribuir al parámetro desconocido un

El intervalo estimado que debe contener al parámetro se llama intervalo

Denominaremos error muestral máximo a la diferencia entre el valor de la

Ejemplo: Sea q el parámetro desconocido y qˆ el estimador que consideramos

Si calculamos la probabilidad de tener ese error o uno menor, obtendremos:

2 (2) - 1  0, 9544 ya que el estimador seguía una distribución normal.

Esta probabilidad podemos escribirla también de la siguiente forma:

2.1 CASOS PATICULARES

2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA