Presentaciã N Tema 5 - A

ESTATÍSTICA
EMPRESARIAL II
Prof. Ángela Troitiño Cobas

Dpto. Economía Cuantitativa
Universidade de Santiago de Compostela
Obxectivo
Enlazando co tema 3, cando modelizamos o
comportamento dun fenómeno aleatorio a través dun
modelo teórico é habitual que este veña definido en
función dun ou varios parámetros descoñecidos.
A estimación dos parámetros descoñecidos constitúe
un dos obxectivos principais da inferencia.
Dita estimación pode realizarse de forma puntual ou por
intervalos. E para obter bos resultados, débense
empregar estimadores de boas propiedades.
TEMA 5
Estimación
5.1- Estimación: Propiedades dos estimadores
puntuais
5.2- Métodos de estimación puntual: Método dos
momentos e de máxima verosimilitude.
5.3- Estimación por intervalo: Métodos de construción
de intervalos de confianza. Intervalos de confianza
en poboacións normais.
Estimación
 Estimación: conxunto de técnicas que permiten a determinación
dos parámetros descoñecidos dunha distribución poboacional a través
dunha mostra.
 Métodos de estimación:
 Puntual: asigna a cada parámetro unha estimación (valor) concreta
 Vantaxe: especifica univocamente o valor do parámetro.
 Desvantaxe: para cada posible realización mostral, a estimación pode
ser diferente. Ademais, non é posible saber a fiabilidade da estimación.
 Por intervalos: consiste en definir un intervalo ao que pertencerá o
parámetro cunha certa probabilidade.
 Vantaxe: permite unha maior posibilidade de acerto xa que asigna un
intervalo de valores ó parámetro. Indica a fiabilidade da estimación por
dúas vías: a través do erro de estimación (ou amplitude do intervalo) e
pola probabilidade de que o parámetro se atope no intervalo (nivel de
confianza ó que se realiza a estimación).
 Desvantaxe: non especifica univocamente un valor para o parámetro.
Estimadores
Media mostral
Poboación Varianza mostral
Proporción mostral
MOSTRA (v.a.)
X → N (µ ,σ ) Distribución do estimador
{X 1 , X 2 ,..., X n }
X → B( p) mostras
{x1 , x2 ,..., xn } Estimacións
Puntual
Por intervalos
Parámetros ?
Fiabilidade das estimacións

Estimación
 Distribución poboación: X → f ( x;θ ) con parámetro θ
descoñecido (modelo paramétrico, con θ descoñecido)
X → N (µ ,σ ) X → B( p) X → B (n, p )
 Obxectivo: estimar o parámetro θ (ex: µ , σ, p, λ)
 Instrumento: un estatístico ou estimador T
 Estimación puntual: valor do estimador en cada realización
mostral.
O Nº DE ESTIMACIÓNS PUNTUAIS PODE SER MOI ALTO
xa que, para cada posible realización mostral (mostra) e
estimador, podemos obter unha estimación.
 Lembremos o exemplo do tema 4
Exemplo
 POBOACIÓN: urna con 5 bolas {2, 3, 4, 5, 6}
 MOSTRA (m.a.s.) de tamaño n=2, (X1, X2)
 Valores da Mostra, realizacións mostrais ou
mostras (x1, x2):
(2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 2) (3, 3) (3, 4) (3, 5) (3,
6) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 2) (5, 3) (5, 4) (5, 5)
(5, 6) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
 Nº de posibles realizacións mostrais(mostras)
dunha m.a.s.:
Nn=25 (tamaño poboación tamaño mostra )
Estatístico
 Definamos o estatístico: MEDIA MOSTRAL
X1 + X 2
X =
2
 Observemos que poderiamos ter seleccionado outros

estatísticos/estimadores diferentes: moda, mediana,
ou calquera outra función das v.a. da mostra
(lembremos a def. de estatístico)
X1 + X 2
Estimacións puntuais X =
2
Realizacións mostrais (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
valores de X 2 2.5 3 3.5 4 2.5 3 3.5 4 4.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
valores de X 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
Realizacións mostrais (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

valores de X 4 4.5 5 5.5 6
probabilidade 1/25 1/25 1/25 1/25 1/25
Na realidade, non se obteñen todos os posibles valores
da mostra, xeralmente obtense UN SÓ VALOR
estimacións 2 2.5 3 3.5 4 2.5 3 3.5 4 4.5
estimacións 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5

estimacións 4 4.5 5 5.5 6
e non sabemos se esa estimación está próxima ó parámetro µ ou non.

De aí a importancia de:
 traballar con estimadores de boas propiedades, e de
 acompañar a estimación puntual dunha estimación por intervalos, que si
permite dar unha medida da fiabilidade
PROPIEDADES DOS
ESTIMADORES
 Erro Cadrático Medio
 Propiedades:
 Innesgamento
 Eficiencia
 Consistencia
 Suficiencia
PROPIEDADES DOS ESTIMADORES
Cando un estimador é bo? Cando achega boas estimacións
 Cando estas están preto do parámetro.
Ex. Cal dos tres ss. estimadores consideras que achegará
mellores estimacións do parámetro θ ? Xustifica.
θ
Vexamos (ex. Tema 4)
Distribución mostral do estatístico

valores de X 2 2.5 3 3.5 4 2.5 3 3.5 4 4.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
valores de X 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25

valores de X 4 4.5 5 5.5 6
probabilidade 1/25 1/25 1/25 1/25 1/25
Cálculo ECM
DISTRIBUCIÓN DO ESTATÍSTICO MEDIA MOSTRAL
(función de cuantía da probabilidade)
1 / 5 se x = 2,3,4,5,6
0,25
P( X = x) =   0,20
 0 noutro caso  0,15
0,10
Parámetro poboaciónal: μ=4 0,05
0,00
2 2,5 3 3,5 4 4,5 5 5,5 6
X =x 2 2.5 3 3.5 4 4.5 5 5.5 6

P( X =x ) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Erros -2 -1.5 -1 -0.5 0 0.5 1 1.5 2
Erros 2 4 2.25 1 0.25 0 0.25 1 2.25 4
ECM (T ) = E (T − θ )
2
= 4(1/25) + 2.25(2/25) + 1(3/25) + …
Criterio Xeral
Minimizar ERRO CADRÁTICO MEDIO
 Parámetro θ. Estimador T. Estimacións ti . Erros= (ti-θ)
Mostras: m1 m2 … mi … mm
Erros: (t1 - θ) , (t2 - θ), … (ti - θ) , …., (tm - θ)

Cómo achegar unha medida resumo dos erros? Primeiro: dado que os
erros poden ser positivos ou negativos, habería que neutralizar o efecto do signo
(aplicar valor absoluto ou elevar a potencia par) para que as desviacións negativas
e positivas non se compensen (óptase por tomar os erros ó cadrado (ti- θ)2 ). Logo
resúmense calculando unha media:
ECM (T ) = E (T − θ )
2
Medida : Erro Cadrático Medio
Ó construír un estimador pretendemos que as súas estimacións puntuais se aproximen o
máis posible ó valor do parámetro, pretensión que equivale a minimizar o Erro Cadrático
Medio.
Descomposición do Erro Cadrático Medio
Que contén o ECM?
Operando ECM (T ) = E (T − θ )
2

( )
ECM (T ) = E T 2 + θ 2 − 2θ T = E (T 2 ) + θ 2 − 2θ E ( T ) =
E (T )− ( E (T )) + ( E (T )) + θ − 2θ E ( T ) = Var (T ) + (E (T ) − θ )
2 2 2 2 2
 
sumamos e restamos ( E (T )) 2 nesgo ó cadrado
Onde: Var (T ) = E (T 2 ) − ( E (T )) 2
(E (T ) − θ )2 = ( E (T )) 2 + θ 2 − 2θ E (T )
 Concluímos que ECM = Var(T) + (E(T)- θ)2

denominando nesgo do estimador á distancia existente entre o propio
parámetro e o valor que en media se espera que dea o estimador:
Nesgo (T) = E(T)- θ
Mellor estimador?
 Conclusión: o mellor estimador é aquel que teña o
erro cadrático medio máis pequeno de entre todos os
estimadores posibles.
 Problema: para a maior parte das distribucións

poboacionais f(x;θ) non existe ningún estimador que
minimice o ECM para todos os posibles valores de θ.
Exemplo: ECM dos estimadores T1 e T2, para diferentes valores do parámetro
ECM (T )
T1 mellor ca T2 T2 mellor ca T1
Propiedades dos estimadores
 Isto é, un estimador pode ter un ECM mínimo para algúns valores
de θ , mentres que outro estimador pode ter a mesma propiedade
para outros valores de θ, polo que resultaría difícil decidir cal dos
dous é mellor (dado que descoñecemos θ).
 Por esta razón se deben examinar criterios adicionais para a

selección de estimadores, entre os que se destacan:
 Non nesgamento ou innesgamento (insesgadez)
 Eficiencia
 Consistencia
 Suficiencia
INNESGAMENTO
 Dise que un estatístico T é un estimador innesgado (*) do
parámetro θ, se E(T) = θ , para todos os posibles valores
de θ, o que significa que o seu nesgo (E(T) – θ) é cero.
T é innesgado de θ ↔ E(T) = θ
T é innesgado de θ ↔ Nesgo (T) = E(T) – θ = 0
 Dise que T é asintoticamente innesgado de θ, se o seu
nesgo tende a cero cando o tamaño da mostra tende a
infinito. T é asintoticamente innesgado ↔ lim E (T ) = θ
n →∞
lim ( E (T ) − θ ) = 0
n →∞
Estimadores innesgados
Son T1 e/ou T2 estimadores innesgados de θ ?
Innesgado quere dicir que a distribución está centrada no parámetro, isto é, que en
media dá estimacións exactas. T2 é nesgado, ten nesgo positivo (sobrevalora o valor
do parâmetro de forma sistemática). Analogamente, se o nesgo fose negativo
infravaloraría o valor verdadeiro do parâmetro de forma sistemática.
 O nesgo equivale a un erro sistemático, non aleatorio, non se
corrixe aumentando o tamaño da mostra.
 O signo do nesgo (positivo ou negativo) ten unha interpretación
importante. Cando é positivo indica que o estimador tende, en
media, a sobreestimar o valor do parámetro descoñecido,
mentres que se é negativo tende a infravaloralo.
 A propiedade de innesgamento dun estimador recolle a idea de
que, sexa cal sexa o tamaño da mostra, un bo estimador debe dar,
en media, estimacións exactas.
 Esta propiedade é especialmente desexable cando se traballa con
mostras pequenas. En mostras grandes, chegaría con que o
estimador fose asintoticamente innesgado.

Se o obxectivo é dar no centro da diana, cal
dos 4 tiradores é o mellor?
É SUFICIENTE CO INNESGAMENTO?
Non chega. Parece natural esixir que a
dispersión (varianza) sexa pequena. Nun
sentido ideal, interesaríanos ter estimadores
innesgados con pequena varianza (alta
precisión ou eficiencia)
Como xa vimos, o criterio que combina estas dúas cuestións é o ERRO CADRÁTICO
MEDIO: ECM(T) = E(T- θ)2 = [E(T)- θ]2 + Var(T) que se descompón na suma do
nesgo do estimador ó cadrado máis a súa varianza.
A PRECISIÓN ou EFICIENCIA dun estimador é o inverso do seu ECM. Canto menor
ECM, máis precisión ou eficiencia ten o estimador.
Eficiencia
Eficiencia en Media Cadrática ou Erro Cadrático Medio
Eficiencia termos relativos:
E [T1 − θ ] ≤ E [T2 − θ ]
2 2
T1 é máis eficiente ca T2 ⇔ , ∀ θ
cumpríndose a estrita desigualdade para algún valor de θ.
Eficiencia termos absolutos:

⇔ E [T − θ ] ≤ E [Ti − θ ]
2 2
T é eficiente , ∀ T ≠ Ti e ∀θ
cumpríndose a estrita desigualdade para algún valor de θ.
Eficiencia
Eficiencia (en xeral) vs Eficiencia en estimadores innesgados
ECM (T ) = E (T − θ ) = Var (T ) + (E (T ) − θ )
2 2

nesgo ó cadrado
Eficiencia en xeral minimizar o ECM
Eficiencia en estimadores innesgados Unha clase interesante

de estimadores é a dos ESTIMADORES INNESGADOS DE MÍNIMA VARIANZA,
estimadores innesgados que, ó minimizar a súa varianza, minimizan o ECM (dentro
da categoria dos innesgados)
Eficiencia en estimadores innesgados
 En termos relativos
Sexan T1 e T2 estimadores innesgados.
Dise que T1 é máis eficiente ca T2 se Var (T1) < Var (T2)
θ
 En termos absolutos
Para poder buscar o estimador máis eficiente en termos absolutos, existen procedementos
interesantes como a Cota de Cramer-Rao que indica o valor mínimo posible da varianza.
Segundo teñen demostrado Cramér-Rao, a varianza de calquera estimador innesgado T nunca
será inferior á unha cota fixa coñecida como Cota de Cramér-Rao, isto é,
1
Var ( T ) ≥
( )
2
 ∂ ln f ( x;θ ) 
nE  
 ∂θ 
Estimador eficiente en termos absolutos: estimador innesgado con varianza igual á Cota de
Cramér-Rao, isto é, o estimador innesgado de menor varianza
1 ; f(x;θ)=función de probabilidade poboacional

Var ( T ) =
( )
2
 ∂ ln f ( x;θ ) 
nE  
 ∂θ 
O estimador eficiente dentro dos innesgados
 é o mellor estimador, xa que é o de menor varianza entre os innesgados
 de existir, é único, non hai outro tan bo coma el, mais...
 ... problema!... non necesariamente existe.
Pode ocorrer que non exista ningún estimador innesgado que teña varianza igual á Cota
mínima de Cramér-Rao. En tal caso, o estimador innesgado que teña a varianza máis
pequena, igualmente constituirá o estimador innesgado de varianza mínima.
En síntese:
Comparando dous ou máis estimadores, o máis eficiente é o de
menor ECM. Isto é:
- Se ambos son innesgados, o máis eficiente será o de menor varianza
- Se algún non é innesgado, o máis eficiente é o de menor ECM
Estimadores consistentes
 Recolle a idea de que o estimador debe dar mellores resultados
na medida que aumenta o tamaño da mostra.
 Constitúe unha propiedade asintótica, isto é, dános o
comportamento do estimador cando a mostra medra
indefinidamente.
 Exemplo. Supoñamos
Distribución poboacional X→ N(0,1)
(observemos que μ = 0)
Estimador de µ: media mostral
Mostras: de diversos tamaños, dende n=1 a n=1000
µ=0
1 100 200 300 400 500 600 700 800 900 1000
Tamaño mostral n: 1 …1000
Conclusión: a medida que aumenta o tamaño da mostra, as medias mostrais

tenden a aproximarse cada vez máis ó valor da media poboacional
Estimadores consistentes
IDEA: conforme aumenta o tamaño da mostra, a distribución do
estimador debe estar cada vez máis concentrada ó redor do parámetro.
Definición
Un estimador é consistente cando converxe ao valor do
parámetro, conforme o tamaño da mostra aumenta.
A definición formal de consistencia varía segundo o tipo de converxencia

que se esixa. Así,
Tipo converxencia → Tipo consistencia
converxencia en probabilidade → consistencia en probabilidade
converxencia en media cadrática → consistencia en media cadrática
…
Consistencia en probabilidade
Dise que un estimador é consistente en probabilidade cando converxe
en probabilidade ao valor do parámetro, conforme n medra. Isto
indícanos que a medida que n aumenta, os valores do estimador Tn
concéntranse máis e máis ó redor de θ.
T é un estimador consistente en probabilidade para θ se, para n > s,
P[θ − ε < Tn < θ + ε ] > P[θ − ε < Ts < θ + ε ] , ∀ ε > 0
Isto é, Tn 
→p
θ ⇔
n →∞
( )
lim P T n − θ ≤ε = 1
Estimadores consistentes en
probabilidade
Pode demostrarse que
 Os momentos mostrais respecto á orixe son estimadores
consistentes dos correspondentes momentos poboacionais.
Ex.
X
→p
µ pˆ 
→p
p
 Os momentos mostrais respecto á media son estimadores

consistentes dos correspondentes momentos poboacionais.
Ex.
S2 
→p
σ2 2
Sc 
→p
σ2
Consistencia en media cadrática
.c .
T m →θ [
⇔ lim E (T − θ ) 2 = 0
n →∞
]
Como o ECM é suma do nesgo e da varianza, unha condición necesaria e suficiente para a
consistencia en media cuadrática é que sexa asintoticamente innesgado e que a varianza
tenda a 0 ó aumentar o tamaño mostral.
m .c .
lim E (T ) = θ
T →θ ⇔ n →∞
lim Var (T ) → 0
n →∞
Observación: a consistencia en media cadrática é unha condición máis forte ca

consistencia en probabilidade, polo que a primeira implica a segunda, pero non á inversa.
T m.c .
→θ ⇒ T 
→p
θ
" ⇐ "
ESTIMADOR Innesgamento Varianza Consistencia De mínima varianza
Media mostral Si σ2/n Si Baixo normalidade
Varianza mostral 2(n-1)σ4/n2 Si -
Cuasivarianza mostral Si 2σ4/(n-1) Si Baixo normalidade

Proporción mostral Si p(1-p)/n Si Baixo normalidade
Estimadores suficientes
 Un estimador suficiente T do parámetro θ é aquel que
resume o conxunto de información relevante contida na
mostra aleatoria, e ningún outro estatístico pode
proporcionar información adicional acerca do parámetro.
Esta propiedade non é importante de por si mesma, senón que o é en

canto a que constitúe unha condición necesaria para a eficiencia
(os estimadores eficientes pertencen á clase dos suficientes)
Exercicio
Partindo dunha m.a.s. obtida dunha poboación con media µ e desviación σ ,
Temos que calcular os erros cadráticos medios e compararlos
ECM (T ) = E (T − θ ) = Var (T ) + (E (T ) − θ )
2 2

nesgo ó cadrado
Para T2 temos que calcular a súa media e súa varianza para determinar o ECM
Entón,
ECM(T2) = (E(T2)- θ)2 + Var(T2) = (µ-µ)2 + (n+3)σ2/(n+1)2 = (n+3)σ2/(n+1)2
Conclusión: T1 é máis eficiente ca T2 pois o seu ECM é ≤ para calquera n e é extrictamente menor
para n>1
b) Son consistentes en media cuadrática?
Si o son
Estimación por
intervalo
 Métodos de construción de
intervalos de confianza.
 Intervalos de confianza en
poboacións normais
Estimación por intervalos
 O método de estimación por intervalos consiste en definir un
intervalo (aleatorio) que conterá o parámetro poboacional θ cunha
probabilidade (1 − α )
P(θ inf (T ( X )) < θ < θ sup (T ( X )) ) = 1 − α

 Observemos que:
 Constitúe un intervalo aleatorio, definido en función dun estimador
e, polo tanto, da mostra (v.a.).
 Os extremos do intervalo son aleatorios (v.a.), xa que son función
do estimador e, polo tanto, das variables da mostra.
 Para as diferentes realizacións mostrais, o intervalo aleatorio tomará
diferentes valores que constituirán as estimacións por intervalo.
Estimación por intervalos
IMPORTANTE DIFERENCIAR ENTRE
VARIABLES VALORES
X = {X 1 , X 2 ,..., X n } MOSTRA (v.a.) mostras x = {x1 , x2 ,..., xn }
T ( X ) = T ( X 1 , X 2 ,..., X n ) Estimador estimacións T ( x) = T ( x1 , x2 ,..., xn )
Intervalo estimacións por

de Confianza intervalo
(θ inf (T ( X )) ; θ sup (T ( X )) ) (θ inf (T ( x)) ; θ sup (T ( x)) )
(probabilidade 1-α) (nivel de confianza 1-α)

Construción de intervalos
Para construir os intervalos é habitual empregar o MÉTODO DO PIVOTE
que consiste en empregar un estatístico (ESTATÍSTICO PIVOTE) para
realizar a estimación.
 Poboación: X → f ( x,θ )
 Sexa X = {X 1 , X 2 ,..., X n } unha m.a.s.
 Chamamos estatístico pivote a unha función das variables da mostra
e do parámetro, por tanto unha v.a. T(X; θ), con distribución de
probabilidade que non depende do dito parámetro.
 Son estatísticos pivote os xa vistos no derradeiro apartado do tema 4
PARÁMETRO ESTATÍSTICO PIVOTE DISTRIBUCIÓN
DESCOÑECIDO T ( X ,θ ) DO E. PIVOTE
1. POBOACIÓN NORMAL
X -µ
µ con σ2
coñecida
N(0,1)
σ/ n
µ con σ2 XX −- µµ
descoñecida Sc t n -1
SC′ / nn
2
σ2 con µ
coñecida
n S2
2
χ n
σ
σ2 con µ 2
descoñecida
( n - 1) S C2 χ n-1
σ2
PARÁMETRO ESTATÍSTICO PIVOTE DISTRIBUCIÓN
DESCOÑECIDO T ( X ,θ ) DO E. PIVOTE
2. POBOACIÓN DE BERNOULLI (n grande)
pˆ − p
Proporción
p
pq N(0,1)
n
3. POBOACIÓN DESCOÑECIDA (n grande)
X −µ
µ con σ2 coñecida •→ N (0;1)
σ
n
µ con σ2 X −µ
descoñecida
•
→ t n -1 → N (0;1)
Sc
n
Construción de intervalos
Método do Pivote
 A construción dun intervalo de confianza polo método do
pivote baséase en construír un intervalo para o estatístico
pivote con probabilidade 1-α
[ ]
P Tinf ( X ,θ ) < T ( X ,θ ) < Tsup ( X ,θ ) = 1 − α
 Posteriormente, mediante unha manipulación alxebraica, o
intervalo para o estatístico convértese nun intervalo para o
parámetro con probabilidade 1-α
P (θ inf (T ( X )) < θ < θ sup (T ( X )) ) = 1 − α
Determinación de intervalos de confianza
Para a media poboacional,

con varianza poboacional σ2 coñecida ou descoñecida
Para a varianza poboacional,
con media poboacional µ coñecida ou descoñecida
Para a proporción poboacional (n grande)
LEMBREMOS
Distribución da Media Mostral
X -µ
→ N (0 ,1)
Grande e σ coñecida (prop.reprod.Normal ou TCL) X → Normal
σ/ n
X -µ
Mostra (n) Grande e σ descoñecida → tn-1 → N(0,1)
SC / n
X -µ
→ N (0 ,1)
Pob.Normal , σ coñecida X →
σ/ n Normal
X -µ
Pequeño Pob. Normal , σ descoñecida → t n-1
SC / n
Pob.Descoñecida → Estat. Non Paramétrica
Lembremos
Construción de intervalos . Método do Pivote
 A construción dun intervalo de confianza polo método do
pivote baséase en construír un intervalo para o
estatístico pivote con probabilidade 1-α
[ ]
P Tinf ( X ,θ ) < T ( X ,θ ) < Tsup ( X ,θ ) = 1 − α
 Posteriormente, mediante unha manipulación alxebraica,
o intervalo para o estatístico convértese nun intervalo
para o parámetro
Intervalo para a media poboacional µ
con σ2 coñecida
Aplicable a: “poboación normal e σ2 coñecida” ou ‘n grande’
Idem:
 Parámetro a estimar: µ n grande, σ descoñ.
Estatístico pivote: X −µ .
 X -µ → N (0,1)
→ N (0 ,1) Sc
σ/ n n
 Proponse un intervalo no que o estatístico tomará
valores con probab. 1-α
 
 X −µ 
P − zα < < zα  = 1 − α
 2 σ 2

 n 
N(0,1)
 
 X −µ 
P − zα < < zα  = 1 − α
 2 σ 2

 n 
N(0,1)
 
 X −µ 
Do intervalo para o estatístico P − zα < < zα  = 1 − α
 2 σ 2

 n 
Despexamos o intervalo para o parámetro
 σ σ 
P  − zα < X − µ < zα  = 1−α
 2 n 2 n
 σ σ 
P  − X − zα < − µ < − X + zα = 1 − α Ó cambiar de – a +,
 2 n 2 n
cambia tamén o signo < a >
 σ σ  Ex. ( -2 < -µ < -1 )
P  + X + zα > µ > + X − zα = 1 − α
 2 n 2 n (2 >µ >1)
 σ σ 
P  X − zα < µ < X + zα = 1 − α
 σ 
 X ± zα
 2 n 2 n

Resultando o intervalo:  2 n
σ
zα 2 n
marxe de erro, erro mostral ou erro de estimación.
con prob. (1-α)
 σ σ   σ 
P  − zα
 2 n
< X − µ < zα
2
 = 1−α
n
P X − µ <

z α
2
 = 1 − α
n
Este erro de estimación existe de forma natural debido a que se estuda só unha
parte da poboación (mostra) e non a totalidade. O seu tamaño depende do
nivel de confianza, do tamaño mostral e da dispersión da poboación:
a) cuanto maior é o tamaño da mostra (máis información) menor é o erro
b) cuanto maior é o nivel de confianza (maior seguridade nas afirmacións,
maior posibilidade de acertar) maior é o erro (amplitude do intervalo)
c) cuanto maior é a dispersión da poboación (máis heteroxénea) maior é
o erro.
Amplitude do intervalo vs. tamaño da mostra vs.
nivel de confianza vs. desviación poboacional
Observemos que 
 X ± zα
σ 

 Canto máis grande é o tamaño da  2 n
mostra (n), menor é σ/raiz(n) ►
menor amplitude do intervalo.
 Canto máis grande é o nivel de
confianza (1-α), maior é zα/2 ,
► maior amplitude do intervalo.
 Canto máis grande é a dispersión
poboacional σ, ► maior é a
amplitude do intervalo
Determinación do tamaño da mostra
A expresión do erro emprégase para obter o tamaño mostral necesario baixo certas
condicións de traballo prefixadas (nivel de confianza α, desviación típica σ e erro de
estimación “e”) sen máis ca despexalo da expresión:
X − µ = e = zα
σ
Despexando n, resulta: n e= z α σ
n=
z α
2
σ
2 n 2
2
e
 zα σ 
n= 2 
 e 
 
De onde concluimos que o tamaño mostral necesario depende do nivel de confianza, da
dispersión da poboación e do erro que estamos dispostos a cometer:
a) canto maior é o erro que estamos dispostos a tolerar (menos precisión) menor é o tamaño n
b) canto maior é o nivel de confianza (máis seguridade nas afirmacións), maior zα/2 , maior é o tamaño n
c) canto máis dispersa é a poboación (máis heteroxénea) maior é o tamaño n.
O mesmo desenvolvemento realízase para obter o tamaño da mostra noutros casos como
estimación de µ con varianza poboacional descoñecida, estimación de p, …. Procédese de
forma análoga partindo da expresión do erro mostral en cada casuística concreta.
NOTA: Se o resultado para n non fose un número enteiro, redondéase cara arriba. E se non se parte dunha
poboación normal e/ou a varianza poboacional fose descoñecida, o tamaño mínimo da mostra deberá ser
30, para poder aplicar o TCL.
Determinación do tamaño da mostra
Exemplo (boletín, nº12)
 O xerente de produción dunha empresa desexa estimar cun marxe de 3
horas (de máis ou de menos) e un nivel de confianza do 90% o tempo
medio (en horas) que se tarda en producir un determinado produto.
σ
X − µ = e = zα = 3horas
2 n
 Supoñendo que a desviación poboacional do número de horas que precisa

para a produción do produto é de 10 horas (σ=10)
 Calcular o tamaño mínimo de mostra que se require para achegar un
intervalo da amplitude e co nivel de confianza sinalados.
2 1-α=90%; α/2=5%
 Solución:  zα σ   1.645 *10  2
n= 2  =  = 31 P(Z<zα/2)=0,95;
 e   3 
  zα/2 =1,645
* Se o resultado non é un número enteiro, redondéase cara arriba.

* Se a poboación non é normal e/ou non se coñece a varianza poboacional,
o tamaño mínimo da mostra deberá ser 30, para poder aplicar o TCL.
α/2=5%
P(Z<zα/2)=0,95;
interpolamos
zα/2 =1,645
LEMBREMOS
Grande e σ coñecida (prop.reprod.Normal ou TCL) X µ Normal
X -→ → N (0 ,1)
σ/ n
X -µ
SC / n
X -µ
Pob.Normal , σ coñecida → N (0 ,1)
X → Normal
σ/ n
X -µ
SC / n
Intervalo para a media poboacional µ
con σ2 descoñecida
Aplicable a: “poboación normal e σ2 descoñecida”
Tamén se pode aplicar a
poboación descoñecida con
 Parámetro a estimar: µ σ2 descoñecida e n grande,
mais neste caso a
 Estatístico pivote: X -µ distribución t-Student pode
→ t n −1 aproximarse á normal
SC / n
 Prantexamos un intervalo no que o estatístico tomará

valores con probab. (1 − α ) , sendo 0 < α <1
 
 X −µ 
P − t α < < tα  = 1−α
 2 , n −1 SC 2 , n −1 

 n 
 
 X −µ 
P − t α < < tα  = 1−α
 2 , n −1 SC 2 , n −1 

 n 
 SC SC 
P − t α < X − µ < tα  = 1 − α
2 , n −1 n 2 , n −1 n
 
 SC SC 
P X − t α < µ < X + tα = 1 − α
2 , n −1 n 2 , n −1 n
 
 SC 
O intervalo que resulta é  X ± tα 
 2 , n −1 n 
E o erro de estimación: SC
tα 2 , n −1 n
Observemos que o erro de estimación e a amplitude do intervalo
 diminúe ó aumentar o tamaño da mostra
aumenta ó aumentar o nivel de confianza
varía tamén en función da cuasivarianza mostral
(estimación da dispersión poboacional)
LEMBREMOS
Grande e σ coñecida (prop.reprod.Normal ou TCL) X µ Normal
X -→ → N (0 ,1)
σ/ n
X -µ
SC / n
X -µ
Pob.Normal , σ coñecida → N (0 ,1)
X → Normal
σ/ n
X -µ
SC / n
Exercicio (boletín de exercicios; ex.3)
 Considérase que o tempo necesario para producir certa peza X segue unha
distribución normal de media μ descoñecida e desviación típica σ=1,9 minutos.
Elixida unha mostra ao chou de 8 unidades obtéñense os seguintes tempos en
minutos: 38,5; 39; 41,5; 37; 39,5; 40,5; 38; 38.
a. Obter o intervalo de confianza para a media poboacional ao 99% de nivel de
confianza. (Sol: (37,2668- 40,7332)). Interpreta
b. É correcto dicir que o tempo medio en producir ese tipo de peza varía entre
37,2668 e 40,7332 cunha probabilidade do 99%? Xustifica
c. Que tamaño mostral se necesitaría para estimar a media poboacional a un 99%
de confianza cun marxe de erro de 1 minuto? (sol: 25)
d. Determina un intervalo do mesmo nivel de confianza para a media se consideras
que a varianza é descoñecida. Compárao co resultado do apartado a). (Sol:
(37,1891-40,8109))
e. Determina un intervalo de confianza do 99% para a varianza. (Sol: (0,7389-
15,1668)). Compárao coa desviación típica do enunciado.
a) Obter o intervalo de confianza para a media poboacional ao 99% de nivel de confianza.
interpreta
X: Tempo necesario para producir unha certa peza (en minutos) Datos a ter en conta:
X → N ( µ ;1,92) • Distribución da poboación?
Normal
38,5, 39, 41,5, 37, 39,5, 40,5, 38, 38 • σ coñecida?
x = 39 minutos Si
• 1-α=99% ; α=1; α/2=0,005
Intervalo de confianza para µ con σ2 coñecida
Cálculos intermedios:
X −µ
→ N (0,1) n=8
σ
n σ =1,9
P X − zα σ < µ < X + zα σ  = 1−α media mostral=39

 2 n 2 n
N(0,1) S=1,36930639
Sc= 1,46385011
 σ  Nivel confianza 99%
α/2=0,005
1-α=0,99
α/2=0,005
 X ± zα 
 2 n P(Z<zα/2)=0,995;
zα/2 =2,58
-2,58 2,58
µ ∈ (37,26; 40,73) cun nivel de confianza do 99%

α/2=0,5%
P(Z<zα/2)=0,995;
zα/2 =2,58
b) É correcto dicir que o tempo medio en producir ese tipo de peza varía entre 37,26 e
40,73 cunha probabilidade do 99%? Xustifica
Sol. Non.  σ σ 

z
P X − α
2 n
<µ <X + α z 2
= 1 − α probabilidade 1-α
n
 σ σ 
 x − zα < µ < x + zα  nivel de confianza 1-α
 2 n 2 n
Xustificación: INTERPRETACIÓN DO CONCEPTO DE NIVEL DE CONFIANZA (máis adiante)
c) Que tamaño mostral se necesitaría para estimar a media poboacional a un 99% de

confianza cun marxe de erro de 1 minuto?
σ=1.9
1 min. P(Z<z)=0,995
n=24.0296, é decir, n=25

d) Determina o intervalo de confianza para o tempo medio de fabricación ó 99% de n.c.
supoñendo que a desviación poboacional é descoñecida. Compárao co apartado a).
Datos a ter en conta: Poboación normal? σ coñecida? n grande?
Poboacións normais
Estatístico pivote Intervalo de confianza Erro
Media con varianza
σ2 desconocida
Cálculos intermedios: n=8; media mostral = 39; S=1,36930639 ; Sc= 1,46385011 ;

t α/2,n-1 = 3,499 P(T>t)=0,005 (ver páx. ss)
Estimación por intervalo para µ:
Solución: μ pertence (37,19 ; 40,81) cun n.c. do 99%

_________________________________________
 Como resolverías se a distribución de X na poboación fose descoñecida?
(tanto considerando varianza poboacional coñecida como descoñecida)
Observa que n=8 (tamaño mostral pequeño)
P(T>t)=0,005
t α/2,n-1 = 3,499
Intervalo para a varianza poboacional σ2
con µ coñecida
 Poboación: X → N ( µ , σ )
 Parámetro a estimar: σ 2
Estatístico pivote: n S
2
 → χ n2
σ2
valores con probab. 1-α , sendo 0 < α <1
 2 n S2 
P χ α < 2 < χ α ,n  = 1 − α
2
 1− 2 ,n σ 2 
 2 n S2 
P χ α < 2 < χ α ,n  = 1 − α
2
 1− 2 ,n σ 2 
 
 1 2
1  
P 2 >
σ > = 1−α
χ α nS 2
χ α ,n 
2
 1− ,n
 2 2 
   
 n 2 n 2 
 n 2 n 2 
S S
P 2 > σ 2 > 2  = 1−α  S , S 
χ α χ 
 1− ,n α
,n 
 χ α2 χ 2 α 
 2 2   1− , n 
 2 ,n 2 
Intervalo para a varianza poboacional σ2
con µ descoñecida
 Poboación: X → N ( µ , σ )
 Parámetro a estimar: σ 2
( n - 1 ) S c2
 Estatístico pivote: → χ n2−1
σ2
valores con probab. (1 − α ) , sendo 0 < α <1
 2 (n − 1) S C2 
P χ α < χ α ,n−1  = 1 − α
2
2
<
 1− , n −1
2 σ 2 
 2 (n − 1) S C2 
P χ α < χ α ,n−1  = 1 − α
2
2
<
 1− , n −1
2 σ 2 
 
 1 2
1 
P 2 >
σ >  = 1−α
χ α χ α ,n−1 
2
(n − 1) S C
2
 1− ,n −1
 2 2 
 
 (n − 1) 2 (n − 1) S C2 
S  
P 2 C
>σ >
2  = 1−α  (n − 1) 2 (n − 1) 2 
 χ α χ α ,n−1 
2
 1− ,n −1  SC SC 
  , 2
2 2
 χα 2
χ 
 , n −1 1− , n −1 
α
 2 2 
Ter en conta que:
n
2
S =
c
1 n
∑ (Xi − X )
2
S c2 = S2
n − 1 i =1 n −1
Exercicio (boletín, nº 3)
e) Determina un intervalo de confianza ó 99% de n.c. para a varianza. Compárao
coa desviación típica do enunciado.
Datos a ter en conta:  
 ( n − 1) 2 ( n − 1) 2 
 SC SC 
poboación normal? SI ,
χ χ
2 2
 
 α
, n −1 1− , n −1 
α
µ coñecida? NON  2 2 
Cálculos intermedios: n=8; valor media mostral=39; S=1,36930639;
Sc= 1,46385011 ; Chi-cadrado0.005, 7 =20,3 Chi-cadrado0.995, 7 =0,989
Estimación do intervalo:
[7*1,463852 /20,3 ; 7*1,463852 /0,989 ] = [0,7389; 15,1668]
Solución: σ2 pertence (0,7389; 15,1668) cun n.c. do 99%
Comparación: no enunciado dinnos que σ (a dispersión do tempo de fabricación) é

1,9. Mais se non a coñecemos e temos que estimala a partir da mostra de tamaño
n=8, o resultado que se podería concluír é que σ tomaría valores entre 0.8596 e
3.894 cun nivel de confianza do 99%
Chi-cadrado0.005, 7 =20,3
Chi-cadrado0.995, 7 =0,989
Intervalo para a proporción poboacional
p
 Poboación: X → B( p )
 Parámetro a estimar: p pˆ − p
→ N (0,1)
 Estatístico pivote (n grande) pˆ qˆ
n
valores con probab. (1 − α )
 
 
 pˆ − p  = 1−α
P − zα < < z 2
 2 pˆ qˆ
α
 
 n 
Intervalo para a proporción poboacional
 
 
 ˆ−p
p  = 1−α
P − zα < < z 2
 2 ˆ qˆ
p
α
 
 n 
 pˆ qˆ pˆ qˆ 
P − zα < pˆ − p < zα  = 1−α
 2 n 2 n 
 pˆ qˆ pˆ qˆ 
P − pˆ − zα < − p < − pˆ + zα = 1 − α
 2 n 2 n 
 pˆ qˆ 
 pˆ qˆ pˆ qˆ   pˆ ± zα 
P pˆ − zα < p < pˆ + zα = 1 − α  2 n 
 2 n 2 n  
Exercicio (boletín, nº 10)
Sobre unha mostra de 120 asistentes a un espectáculo deportivo
calculouse que só 38 acudiron con vehículo propio.
a) Estimar ao 95% de confianza un intervalo para a proporción de

asistentes ao espectáculo que acudiron con vehículo propio.
(Sol: (23,34%, 39,98%))
b) Que poderías facer para reducir a amplitude do intervalo?

38
ˆ =
p = 0,3166
- 120 α=5% α/2=0,025 Datos a ter en conta:
qˆ = 1 − p
ˆ = 0,6833
N=120, grande
Intervalo de confianza da proporción
ˆ − p
p
→ N (0,1) para n > 30
ˆ qˆ
p  pˆ qˆ 
n  pˆ ± zα 
   2 n 
P ˆ
 p − zα 2

ˆ qˆ
p
n
ˆ + zα
< p< p
2
ˆ qˆ
p
n
 =1−α



P(Z< zα/2 )=0,975 → zα/2 =1,96
p ∈ (0,2335;0,3999) cun nível de confianza do 95%

p ∈ ( 23,35%;39,99%) cun nível de confianza do 95%
pˆ qˆ
b) Para reducir a amplitude do intervalo habería que reducir zα e isto pode facerse de
2 n
dúas formas:
reducindo o nivel de confianza 1-α da estimación para diminuír zα/2 , ou
aumentar o tamaño da mostra (n), xa que isto permite diminuír a varianza do estatístico
pˆ qˆ
e con ela diminuiría a amplitude do intervalo.
n
Exemplo: Seleccionáronse 120 traballadoras para estimar a proporción delas que
consideran que as actividades de formación ofrecidas pola empresa son axeitadas. Das
120 seleccionadas, 96 responderon afirmativamente.
a) Obter unha estimación puntual da porcentaxe de traballadoras que pensan que a
formación é axeitada.
b) Obter un intervalo de confianza ó 80% de n.c. para estimar a proporción de
traballadoras que consideran que a formación é positiva.
c) Cal é o erro mostral?
d) Se desexa estimar a proporción cun erro máximo do 3% a un nivel de confianza do
80%. Que tamaño deberá ter a mostra?
a) Estimación puntual de la proporción Un 80% de las trabajadoras
b) Intervalo de confianza para a proporción ó nivel do 80%:
n grande
P(Z< zα/2 )=0,90 → zα/2 =1,28
0,80 0,90
0,10 0,10
-Zα/2 Zα/2 Zα/2= 1,28

Intervalo de confianza
Interpretación:
A proporción de traballadoras que consideran as actividades de
formación axeitadas está entre un 75,3% e un 84,7% cun nivel de
confianza do 80%
Distancia máxima entre o valor obtido 0,80 e o valor da proporción poboacional desconocida cun
nivel de confianza do 80%.
O enunciado indica que:
Erro máximo 3% E = 0,03
Nivel de confianza 80% Zα/2= 1,28
Estimación de p (máis desfavorable) Tende a empregarse a estimación

de p máis favorable porque o
tamaño da mostra o debemos
Substituíndo: definir antes de obter a mostra,
polo que se supón que aínda non
temos a estimación puntual
correspondente
n=455,111 , é decir, n= 456 traballadoras

PROBABILIDADE VS.
NIVEL DE CONFIANZA
Probabilidade vs. Nivel de confianza
 A construción dun intervalo de confianza baséase en
construír un intervalo ao que o parámetro pertence con
probabilidade (1 − α )
 Unha vez realizada unha estimación por intervalo

(cálculo do intervalo nun valor concreto da mostra)
(θinf (T ( x)) ; θsup (T ( x)))
A probabilidade tórnase nivel de confianza (xa non é
correcto dicir que o parámetro pertence á estimación
obtida con probabilidade 1-α).
Probabilidade ou Nivel de confianza ?
Exemplo
 Supoñamos unha persoa que se presenta a un exame de oposición.
 O temario da oposición consta de 10 temas dos cales o opositor ten ben preparados
do 1 ó 9, pero por falla de tempo non sabe nada do 10º.
 Sábese que o exame consistirá nunha “pregunta-tema” sobre só un dos temas que
será elixido ó chou.
 Como o opositor preparou 9 dos 10 temas, inicialmente ten unha probabilidade
do 90% de superar o exame (xa que a selección do tema se fai ó chou, entre os 10).
 Realizado o exame (ou realizado o sorteo da pregunta), o resultado xa non é
aleatorio, “a sorte xa está botada”, XA NON HAI ALEATORIEDADE SOBRE O
TEMA QUE PODE SAÍR:
 Se saíu algún dos 9 temas que estudou: P(aprobar)=1
 Se saíu o tema 10: P(aprobar)=0.
XA NON SE PODE FALAR DE PROBABILIDADE, HAI QUE FALAR DE NIVEL DE
CONFIANZA
Idem “sorteos de lotería”. Se o sorteo xa está feito, aínda que non coñezamos cal
foi a combinación premiada, xa non se pode falar de probabilidade senón que se
debe falar de confianza.
Idem “cualificación na materia M”. Pode que o alumno aínda non a coñeza, mais
se o exame está feito (imaxinemos un exame tipo test), a sorte xa está botada. O
alumno pode ter unha confianza alta en aprobar, mais a “cualificación” xa é “algo
fixo” (xa non hai aleatoriedade). A probabilidade de que aprobe é 1 (se respostou
correctamente un nº mínimo de preguntas) ou 0 (se non o fixo).
 Isto é, obtida unha estimación por intervalo,
(θ inf (T ( x )) ; θ sup (T ( x)) )
xa non é correcto dicir que temos unha probabilidade (1 − α ) de que
o parámetro se atope dentro do intervalo estimado, senón que esta se
converte en nivel de confianza (1 − α ) . Isto é, obtida a estimación
a probabilidade trócase en nivel de confianza
 En resume
 falamos de probabilidade cando nos referimos ó intervalo aleatorio,
(θ inf (T ( X )) ; θ sup (T ( X )))
 e falamos de nivel de confianza cando nos referimos a unha
estimación concreta do intervalo
(θ inf (T ( x)) ; θ sup (T ( x)) )
Que é o nivel de confianza? (ex. tema 4)
Poboación {2, 3, 4, 5, 6} con media poboacional µ=4
Distribución do estatístico media mostral (m.a.s. X1, X2; n=2):
2 2.5 3 3.5 4 4.5 5 5.5 6
X =x µ
P( X =x ) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Podemos empregar a distribución do estatístico para calcular

a probabilidade de que este tome valores ó redor do parámetro (idem T.4).
( )
P X ∈ [µ ± 1,5] =
2 3 4 5
+ + + + + +
4 3
25 25 25 25 25 25 25 25
2 23
= = 0,92
E, a partir desa distribución, tamén podemos despexar un intervalo para o parámetro
Exemplo: o intervalo [ X ± 1,5 ] contén o parámetro cunha probabilidade do 92%
( [ ])
Isto é, a partir dos 25 valores da mostra,
2 3 4 5 4 3 2 23
P µ ∈ X ± 1,5 = + + + + + + = = 0,92 obtemos 25 estimacións por intervalo,
25 25 25 25 25 25 25 25 estando µ no 92% delas (23/25)
É dicir, o parámetro µ está no 92% de todas as posibles estimacións por intervalo
Estimacións 0,5-3,5 1-4 1,5-4,5 2-5 2,5-5,5 3-6 3,5-6,5 4-7 4,5-7,5
Probabilidade 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Que é o nivel de confianza? (ex. tema 4)
µ=4
DISTRIBUCIÓN DO ESTATÍSTICO MEDIA MOSTRAL
(fun ción d e cuantía d a probabilidade)
0,25
0,20
Intervalo ó 92% de nivel
0,15
de confianza
0,10
[ X ± 1,5 ]
0,05
0,00 EXEMPLO TEMA 4:

2 2,5 3 3,5 4 4,5 5 5,5 6
µ 25 posibles valores da mostra
25 posibles estimacións por intervalo
Intervalo ó 92% n.c.
O 92% de todas as posibles

estimacións (23 das 25
posibles ) conteñen o
verdadeiro valor do
…….. parámetro
Estimacións 0,5-3,5 1-4 1,5-4,5 2-5 2,5-5,5 3-6 3,5-6,5 4-7 4,5-7,5
Probabilidade 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Que é o nivel de confianza? Síntese
Se tomásemos todas as posibles mostras de
tamaño n que se poderían formar a partir da
Estimacións: L1 L2
poboación obxecto de estudo (xeralmente
infinitas mostras) e construísemos para cada
unha delas o correspondente intervalo
estimado, no (1-α)% destes intervalos estaría
o valor do parámetro θ e no α% restante non
estaría. Por iso, cando obtemos unha
estimación dicimos que temos un nivel de
confianza (1-α) de que o parámetro
poboacional estea no intervalo estimado.
Nunca teremos certeza de se o parámetro está
µ
ou non na estimación obtida xa que o Non contén
parámetro é descoñecido, mais como sabemos aµ
que o (1-α)% de todas as posibles estimacións
conteñen o valor do parámetro, isto danos Nota: O nivel de confianza o fixa o investigador,
unha confianza do (1-α)% de que a nosa os habituais son 90, 95 e 99%.
estimación sexa unha das que conteñen ó
parámetro.
α representa a probabilidade de erro ou RISCO
Grazas pola túa atención

Presentaciã N Tema 5 - A

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Presentaciã N Tema 5 - A

Uploaded by

Copyright:

Available Formats

ESTATÍSTICA

Prof. Ángela Troitiño Cobas

Fiabilidade das estimacións

 Observemos que poderiamos ter seleccionado outros

Realizacións mostrais (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

Realizacións mostrais (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

e non sabemos se esa estimación está próxima ó parámetro µ ou non.

Distribución mostral do estatístico

Realizacións mostrais (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

 0 noutro caso  0,15

Parámetro poboaciónal: μ=4 0,05

X =x 2 2.5 3 3.5 4 4.5 5 5.5 6

Erros: (t1 - θ) , (t2 - θ), … (ti - θ) , …., (tm - θ)

 Concluímos que ECM = Var(T) + (E(T)- θ)2

 Problema: para a maior parte das distribucións

 Por esta razón se deben examinar criterios adicionais para a

Eficiencia termos relativos:

Eficiencia termos absolutos:

Eficiencia en xeral minimizar o ECM

Eficiencia en estimadores innesgados Unha clase interesante

1 ; f(x;θ)=función de probabilidade poboacional

Tamaño mostral n: 1 …1000

Conclusión: a medida que aumenta o tamaño da mostra, as medias mostrais

A definición formal de consistencia varía segundo o tipo de converxencia

T é un estimador consistente en probabilidade para θ se, para n > s,

P[θ − ε < Tn < θ + ε ] > P[θ − ε < Ts < θ + ε ] , ∀ ε > 0

 Os momentos mostrais respecto á media son estimadores

Observación: a consistencia en media cadrática é unha condición máis forte ca

Varianza mostral 2(n-1)σ4/n2 Si -

Cuasivarianza mostral Si 2σ4/(n-1) Si Baixo normalidade

Esta propiedade non é importante de por si mesma, senón que o é en

Temos que calcular os erros cadráticos medios e compararlos

b) Son consistentes en media cuadrática?

P(θ inf (T ( X )) < θ < θ sup (T ( X )) ) = 1 − α

Intervalo estimacións por

(probabilidade 1-α) (nivel de confianza 1-α)

Para a media poboacional,

 Supoñendo que a desviación poboacional do número de horas que precisa

* Se o resultado non é un número enteiro, redondéase cara arriba.

 Prantexamos un intervalo no que o estatístico tomará

µ ∈ (37,26; 40,73) cun nivel de confianza do 99%

Xustificación: INTERPRETACIÓN DO CONCEPTO DE NIVEL DE CONFIANZA (máis adiante)

c) Que tamaño mostral se necesitaría para estimar a media poboacional a un 99% de

n=24.0296, é decir, n=25

Cálculos intermedios: n=8; media mostral = 39; S=1,36930639 ; Sc= 1,46385011 ;

Solución: μ pertence (37,19 ; 40,81) cun n.c. do 99%

Solución: σ2 pertence (0,7389; 15,1668) cun n.c. do 99%

Comparación: no enunciado dinnos que σ (a dispersión do tempo de fabricación) é

a) Estimar ao 95% de confianza un intervalo para a proporción de

(Sol: (23,34%, 39,98%))

b) Que poderías facer para reducir a amplitude do intervalo?

P(Z< zα/2 )=0,975 → zα/2 =1,96

p ∈ (0,2335;0,3999) cun nível de confianza do 95%

b) Intervalo de confianza para a proporción ó nivel do 80%:

-Zα/2 Zα/2 Zα/2= 1,28

Estimación de p (máis desfavorable) Tende a empregarse a estimación

n=455,111 , é decir, n= 456 traballadoras

 Unha vez realizada unha estimación por intervalo

Podemos empregar a distribución do estatístico para calcular

0,00 EXEMPLO TEMA 4:

Intervalo ó 92% n.c.

O 92% de todas as posibles

You might also like