Professional Documents
Culture Documents
EMPRESARIAL II
MOSTRA (v.a.)
X → N (µ ,σ ) Distribución do estimador
{X 1 , X 2 ,..., X n }
X → B( p) mostras
{x1 , x2 ,..., xn } Estimacións
Puntual
Por intervalos
Parámetros ?
X1 + X 2
X =
2
Realizacións mostrais (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
valores de X 2 2.5 3 3.5 4 2.5 3 3.5 4 4.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
Realizacións mostrais (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
valores de X 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
Realizacións mostrais (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
estimacións 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5
θ
Vexamos (ex. Tema 4)
Realizacións mostrais (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
valores de X 3 3.5 4 4.5 5 3.5 4 4.5 5 5.5
probabilidade 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25 1/25
1 / 5 se x = 2,3,4,5,6
0,25
P( X = x) = 0,20
0,10
0,00
2 2,5 3 3,5 4 4,5 5 5,5 6
ECM (T ) = E (T − θ )
2
= 4(1/25) + 2.25(2/25) + 1(3/25) + …
Criterio Xeral
Minimizar ERRO CADRÁTICO MEDIO
Parámetro θ. Estimador T. Estimacións ti . Erros= (ti-θ)
Mostras: m1 m2 … mi … mm
ECM (T ) = E (T − θ )
2
Medida : Erro Cadrático Medio
Ó construír un estimador pretendemos que as súas estimacións puntuais se aproximen o
máis posible ó valor do parámetro, pretensión que equivale a minimizar o Erro Cadrático
Medio.
Descomposición do Erro Cadrático Medio
Que contén o ECM?
Operando ECM (T ) = E (T − θ )
2
( )
ECM (T ) = E T 2 + θ 2 − 2θ T = E (T 2 ) + θ 2 − 2θ E ( T ) =
E (T )− ( E (T )) + ( E (T )) + θ − 2θ E ( T ) = Var (T ) + (E (T ) − θ )
2 2 2 2 2
sumamos e restamos ( E (T )) 2 nesgo ó cadrado
Onde: Var (T ) = E (T 2 ) − ( E (T )) 2
(E (T ) − θ )2 = ( E (T )) 2 + θ 2 − 2θ E (T )
ECM (T )
T1 mellor ca T2 T2 mellor ca T1
Propiedades dos estimadores
Isto é, un estimador pode ter un ECM mínimo para algúns valores
de θ , mentres que outro estimador pode ter a mesma propiedade
para outros valores de θ, polo que resultaría difícil decidir cal dos
dous é mellor (dado que descoñecemos θ).
Eficiencia
Consistencia
Suficiencia
INNESGAMENTO
Dise que un estatístico T é un estimador innesgado (*) do
parámetro θ, se E(T) = θ , para todos os posibles valores
de θ, o que significa que o seu nesgo (E(T) – θ) é cero.
T é innesgado de θ ↔ E(T) = θ
T é innesgado de θ ↔ Nesgo (T) = E(T) – θ = 0
Dise que T é asintoticamente innesgado de θ, se o seu
nesgo tende a cero cando o tamaño da mostra tende a
infinito. T é asintoticamente innesgado ↔ lim E (T ) = θ
n →∞
lim ( E (T ) − θ ) = 0
n →∞
Estimadores innesgados
Son T1 e/ou T2 estimadores innesgados de θ ?
Innesgado quere dicir que a distribución está centrada no parámetro, isto é, que en
media dá estimacións exactas. T2 é nesgado, ten nesgo positivo (sobrevalora o valor
do parâmetro de forma sistemática). Analogamente, se o nesgo fose negativo
infravaloraría o valor verdadeiro do parâmetro de forma sistemática.
Estimadores innesgados
O nesgo equivale a un erro sistemático, non aleatorio, non se
corrixe aumentando o tamaño da mostra.
O signo do nesgo (positivo ou negativo) ten unha interpretación
importante. Cando é positivo indica que o estimador tende, en
media, a sobreestimar o valor do parámetro descoñecido,
mentres que se é negativo tende a infravaloralo.
A propiedade de innesgamento dun estimador recolle a idea de
que, sexa cal sexa o tamaño da mostra, un bo estimador debe dar,
en media, estimacións exactas.
Esta propiedade é especialmente desexable cando se traballa con
mostras pequenas. En mostras grandes, chegaría con que o
estimador fose asintoticamente innesgado.
Estimadores innesgados
Se o obxectivo é dar no centro da diana, cal
dos 4 tiradores é o mellor?
É SUFICIENTE CO INNESGAMENTO?
Non chega. Parece natural esixir que a
dispersión (varianza) sexa pequena. Nun
sentido ideal, interesaríanos ter estimadores
innesgados con pequena varianza (alta
precisión ou eficiencia)
Como xa vimos, o criterio que combina estas dúas cuestións é o ERRO CADRÁTICO
MEDIO: ECM(T) = E(T- θ)2 = [E(T)- θ]2 + Var(T) que se descompón na suma do
nesgo do estimador ó cadrado máis a súa varianza.
A PRECISIÓN ou EFICIENCIA dun estimador é o inverso do seu ECM. Canto menor
ECM, máis precisión ou eficiencia ten o estimador.
Eficiencia
Eficiencia en Media Cadrática ou Erro Cadrático Medio
E [T1 − θ ] ≤ E [T2 − θ ]
2 2
T1 é máis eficiente ca T2 ⇔ , ∀ θ
cumpríndose a estrita desigualdade para algún valor de θ.
ECM (T ) = E (T − θ ) = Var (T ) + (E (T ) − θ )
2 2
nesgo ó cadrado
θ
Eficiencia en estimadores innesgados
En termos absolutos
Para poder buscar o estimador máis eficiente en termos absolutos, existen procedementos
interesantes como a Cota de Cramer-Rao que indica o valor mínimo posible da varianza.
Segundo teñen demostrado Cramér-Rao, a varianza de calquera estimador innesgado T nunca
será inferior á unha cota fixa coñecida como Cota de Cramér-Rao, isto é,
1
Var ( T ) ≥
( )
2
∂ ln f ( x;θ )
nE
∂θ
Estimador eficiente en termos absolutos: estimador innesgado con varianza igual á Cota de
Cramér-Rao, isto é, o estimador innesgado de menor varianza
( )
2
∂ ln f ( x;θ )
nE
∂θ
Eficiencia en estimadores innesgados
O estimador eficiente dentro dos innesgados
é o mellor estimador, xa que é o de menor varianza entre os innesgados
de existir, é único, non hai outro tan bo coma el, mais...
... problema!... non necesariamente existe.
Pode ocorrer que non exista ningún estimador innesgado que teña varianza igual á Cota
mínima de Cramér-Rao. En tal caso, o estimador innesgado que teña a varianza máis
pequena, igualmente constituirá o estimador innesgado de varianza mínima.
En síntese:
Comparando dous ou máis estimadores, o máis eficiente é o de
menor ECM. Isto é:
- Se ambos son innesgados, o máis eficiente será o de menor varianza
- Se algún non é innesgado, o máis eficiente é o de menor ECM
Estimadores consistentes
Recolle a idea de que o estimador debe dar mellores resultados
na medida que aumenta o tamaño da mostra.
Constitúe unha propiedade asintótica, isto é, dános o
comportamento do estimador cando a mostra medra
indefinidamente.
Exemplo. Supoñamos
Distribución poboacional X→ N(0,1)
(observemos que μ = 0)
Estimador de µ: media mostral
Mostras: de diversos tamaños, dende n=1 a n=1000
µ=0
1 100 200 300 400 500 600 700 800 900 1000
Definición
Un estimador é consistente cando converxe ao valor do
parámetro, conforme o tamaño da mostra aumenta.
Isto é, Tn
→p
θ ⇔
n →∞
( )
lim P T n − θ ≤ε = 1
Estimadores consistentes en
probabilidade
Pode demostrarse que
Os momentos mostrais respecto á orixe son estimadores
consistentes dos correspondentes momentos poboacionais.
Ex.
X
→p
µ pˆ
→p
p
.c .
T m →θ [
⇔ lim E (T − θ ) 2 = 0
n →∞
]
Como o ECM é suma do nesgo e da varianza, unha condición necesaria e suficiente para a
consistencia en media cuadrática é que sexa asintoticamente innesgado e que a varianza
tenda a 0 ó aumentar o tamaño mostral.
m .c .
lim E (T ) = θ
T →θ ⇔ n →∞
lim Var (T ) → 0
n →∞
T m.c .
→θ ⇒ T
→p
θ
" ⇐ "
ESTIMADOR Innesgamento Varianza Consistencia De mínima varianza
Media mostral Si σ2/n Si Baixo normalidade
ECM (T ) = E (T − θ ) = Var (T ) + (E (T ) − θ )
2 2
nesgo ó cadrado
Para T2 temos que calcular a súa media e súa varianza para determinar o ECM
Entón,
ECM(T2) = (E(T2)- θ)2 + Var(T2) = (µ-µ)2 + (n+3)σ2/(n+1)2 = (n+3)σ2/(n+1)2
Conclusión: T1 é máis eficiente ca T2 pois o seu ECM é ≤ para calquera n e é extrictamente menor
para n>1
Si o son
Estimación por
intervalo
Métodos de construción de
intervalos de confianza.
Intervalos de confianza en
poboacións normais
Estimación por intervalos
O método de estimación por intervalos consiste en definir un
intervalo (aleatorio) que conterá o parámetro poboacional θ cunha
probabilidade (1 − α )
Poboación: X → f ( x,θ )
Sexa X = {X 1 , X 2 ,..., X n } unha m.a.s.
Chamamos estatístico pivote a unha función das variables da mostra
e do parámetro, por tanto unha v.a. T(X; θ), con distribución de
probabilidade que non depende do dito parámetro.
Son estatísticos pivote os xa vistos no derradeiro apartado do tema 4
PARÁMETRO ESTATÍSTICO PIVOTE DISTRIBUCIÓN
DESCOÑECIDO T ( X ,θ ) DO E. PIVOTE
1. POBOACIÓN NORMAL
X -µ
µ con σ2
coñecida
N(0,1)
σ/ n
µ con σ2 XX −- µµ
descoñecida Sc t n -1
SC′ / nn
2
σ2 con µ
coñecida
n S2
2
χ n
σ
σ2 con µ 2
descoñecida
( n - 1) S C2 χ n-1
σ2
PARÁMETRO ESTATÍSTICO PIVOTE DISTRIBUCIÓN
DESCOÑECIDO T ( X ,θ ) DO E. PIVOTE
2. POBOACIÓN DE BERNOULLI (n grande)
pˆ − p
Proporción
p
pq N(0,1)
n
3. POBOACIÓN DESCOÑECIDA (n grande)
X −µ
µ con σ2 coñecida •→ N (0;1)
σ
n
µ con σ2 X −µ
descoñecida
•
→ t n -1 → N (0;1)
Sc
n
Construción de intervalos
Método do Pivote
A construción dun intervalo de confianza polo método do
pivote baséase en construír un intervalo para o estatístico
pivote con probabilidade 1-α
[ ]
P Tinf ( X ,θ ) < T ( X ,θ ) < Tsup ( X ,θ ) = 1 − α
Posteriormente, mediante unha manipulación alxebraica, o
intervalo para o estatístico convértese nun intervalo para o
parámetro con probabilidade 1-α
P (θ inf (T ( X )) < θ < θ sup (T ( X )) ) = 1 − α
Determinación de intervalos de confianza
X -µ
Pequeño Pob. Normal , σ descoñecida → t n-1
SC / n
Pob.Descoñecida → Estat. Non Paramétrica
Lembremos
Construción de intervalos . Método do Pivote
A construción dun intervalo de confianza polo método do
pivote baséase en construír un intervalo para o
estatístico pivote con probabilidade 1-α
[ ]
P Tinf ( X ,θ ) < T ( X ,θ ) < Tsup ( X ,θ ) = 1 − α
Posteriormente, mediante unha manipulación alxebraica,
o intervalo para o estatístico convértese nun intervalo
para o parámetro
P(θ inf (T ( X )) < θ < θ sup (T ( X )) ) = 1 − α
Intervalo para a media poboacional µ
con σ2 coñecida
Aplicable a: “poboación normal e σ2 coñecida” ou ‘n grande’
Idem:
Parámetro a estimar: µ n grande, σ descoñ.
Estatístico pivote: X −µ .
X -µ → N (0,1)
→ N (0 ,1) Sc
σ/ n n
Proponse un intervalo no que o estatístico tomará
valores con probab. 1-α
X −µ
P − zα < < zα = 1 − α
2 σ 2
n
N(0,1)
X −µ
P − zα < < zα = 1 − α
2 σ 2
n
N(0,1)
X −µ
Do intervalo para o estatístico P − zα < < zα = 1 − α
2 σ 2
n
Despexamos o intervalo para o parámetro
σ σ
P − zα < X − µ < zα = 1−α
2 n 2 n
σ σ
P − X − zα < − µ < − X + zα = 1 − α Ó cambiar de – a +,
2 n 2 n
cambia tamén o signo < a >
σ σ Ex. ( -2 < -µ < -1 )
P + X + zα > µ > + X − zα = 1 − α
2 n 2 n (2 >µ >1)
σ σ
P X − zα < µ < X + zα = 1 − α
σ
X ± zα
2 n 2 n
Resultando o intervalo: 2 n
σ
zα 2 n
marxe de erro, erro mostral ou erro de estimación.
con prob. (1-α)
σ σ σ
P − zα
2 n
< X − µ < zα
2
= 1−α
n
P X − µ <
z α
2
= 1 − α
n
Este erro de estimación existe de forma natural debido a que se estuda só unha
parte da poboación (mostra) e non a totalidade. O seu tamaño depende do
nivel de confianza, do tamaño mostral e da dispersión da poboación:
a) cuanto maior é o tamaño da mostra (máis información) menor é o erro
b) cuanto maior é o nivel de confianza (maior seguridade nas afirmacións,
maior posibilidade de acertar) maior é o erro (amplitude do intervalo)
c) cuanto maior é a dispersión da poboación (máis heteroxénea) maior é
o erro.
Amplitude do intervalo vs. tamaño da mostra vs.
nivel de confianza vs. desviación poboacional
Observemos que
X ± zα
σ
Canto máis grande é o tamaño da 2 n
mostra (n), menor é σ/raiz(n) ►
menor amplitude do intervalo.
Canto máis grande é o nivel de
confianza (1-α), maior é zα/2 ,
► maior amplitude do intervalo.
Canto máis grande é a dispersión
poboacional σ, ► maior é a
amplitude do intervalo
Determinación do tamaño da mostra
A expresión do erro emprégase para obter o tamaño mostral necesario baixo certas
condicións de traballo prefixadas (nivel de confianza α, desviación típica σ e erro de
estimación “e”) sen máis ca despexalo da expresión:
X − µ = e = zα
σ
Despexando n, resulta: n e= z α σ
n=
z α
2
σ
2 n 2
2
e
zα σ
n= 2
e
De onde concluimos que o tamaño mostral necesario depende do nivel de confianza, da
dispersión da poboación e do erro que estamos dispostos a cometer:
a) canto maior é o erro que estamos dispostos a tolerar (menos precisión) menor é o tamaño n
b) canto maior é o nivel de confianza (máis seguridade nas afirmacións), maior zα/2 , maior é o tamaño n
c) canto máis dispersa é a poboación (máis heteroxénea) maior é o tamaño n.
O mesmo desenvolvemento realízase para obter o tamaño da mostra noutros casos como
estimación de µ con varianza poboacional descoñecida, estimación de p, …. Procédese de
forma análoga partindo da expresión do erro mostral en cada casuística concreta.
NOTA: Se o resultado para n non fose un número enteiro, redondéase cara arriba. E se non se parte dunha
poboación normal e/ou a varianza poboacional fose descoñecida, o tamaño mínimo da mostra deberá ser
30, para poder aplicar o TCL.
Determinación do tamaño da mostra
Exemplo (boletín, nº12)
O xerente de produción dunha empresa desexa estimar cun marxe de 3
horas (de máis ou de menos) e un nivel de confianza do 90% o tempo
medio (en horas) que se tarda en producir un determinado produto.
σ
X − µ = e = zα = 3horas
2 n
SC SC
P − t α < X − µ < tα = 1 − α
2 , n −1 n 2 , n −1 n
SC SC
P X − t α < µ < X + tα = 1 − α
2 , n −1 n 2 , n −1 n
SC
O intervalo que resulta é X ± tα
2 , n −1 n
E o erro de estimación: SC
tα 2 , n −1 n
Observemos que o erro de estimación e a amplitude do intervalo
diminúe ó aumentar o tamaño da mostra
aumenta ó aumentar o nivel de confianza
varía tamén en función da cuasivarianza mostral
(estimación da dispersión poboacional)
LEMBREMOS
Distribución da Media Mostral
Grande e σ coñecida (prop.reprod.Normal ou TCL) X µ Normal
X -→ → N (0 ,1)
σ/ n
X -µ
Mostra (n) Grande e σ descoñecida → tn-1 → N(0,1)
SC / n
X -µ
Pob.Normal , σ coñecida → N (0 ,1)
X → Normal
σ/ n
X -µ
Pequeño Pob. Normal , σ descoñecida → t n-1
SC / n
Pob.Descoñecida → Estat. Non Paramétrica
Exercicio (boletín de exercicios; ex.3)
Considérase que o tempo necesario para producir certa peza X segue unha
distribución normal de media μ descoñecida e desviación típica σ=1,9 minutos.
Elixida unha mostra ao chou de 8 unidades obtéñense os seguintes tempos en
minutos: 38,5; 39; 41,5; 37; 39,5; 40,5; 38; 38.
a. Obter o intervalo de confianza para a media poboacional ao 99% de nivel de
confianza. (Sol: (37,2668- 40,7332)). Interpreta
b. É correcto dicir que o tempo medio en producir ese tipo de peza varía entre
37,2668 e 40,7332 cunha probabilidade do 99%? Xustifica
c. Que tamaño mostral se necesitaría para estimar a media poboacional a un 99%
de confianza cun marxe de erro de 1 minuto? (sol: 25)
d. Determina un intervalo do mesmo nivel de confianza para a media se consideras
que a varianza é descoñecida. Compárao co resultado do apartado a). (Sol:
(37,1891-40,8109))
e. Determina un intervalo de confianza do 99% para a varianza. (Sol: (0,7389-
15,1668)). Compárao coa desviación típica do enunciado.
a) Obter o intervalo de confianza para a media poboacional ao 99% de nivel de confianza.
interpreta
X: Tempo necesario para producir unha certa peza (en minutos) Datos a ter en conta:
X → N ( µ ;1,92) • Distribución da poboación?
Normal
38,5, 39, 41,5, 37, 39,5, 40,5, 38, 38 • σ coñecida?
x = 39 minutos Si
• 1-α=99% ; α=1; α/2=0,005
Intervalo de confianza para µ con σ2 coñecida
Cálculos intermedios:
X −µ
→ N (0,1) n=8
σ
n σ =1,9
P X − zα σ < µ < X + zα σ = 1−α media mostral=39
2 n 2 n
N(0,1) S=1,36930639
Sc= 1,46385011
σ Nivel confianza 99%
α/2=0,005
1-α=0,99
α/2=0,005
X ± zα
2 n P(Z<zα/2)=0,995;
zα/2 =2,58
-2,58 2,58
σ=1.9
1 min. P(Z<z)=0,995
Estatístico pivote: n S
2
→ χ n2
σ2
Prantexamos un intervalo no que o estatístico tomará
valores con probab. 1-α , sendo 0 < α <1
2 n S2
P χ α < 2 < χ α ,n = 1 − α
2
1− 2 ,n σ 2
2 n S2
P χ α < 2 < χ α ,n = 1 − α
2
1− 2 ,n σ 2
1 2
1
P 2 >
σ > = 1−α
χ α nS 2
χ α ,n
2
1− ,n
2 2
n 2 n 2
n 2 n 2
S S
P 2 > σ 2 > 2 = 1−α S , S
χ α χ
1− ,n α
,n
χ α2 χ 2 α
2 2 1− , n
2 ,n 2
Intervalo para a varianza poboacional σ2
con µ descoñecida
Poboación: X → N ( µ , σ )
Parámetro a estimar: σ 2
( n - 1 ) S c2
Estatístico pivote: → χ n2−1
σ2
Prantexamos un intervalo no que o estatístico tomará
valores con probab. (1 − α ) , sendo 0 < α <1
2 (n − 1) S C2
P χ α < χ α ,n−1 = 1 − α
2
2
<
1− , n −1
2 σ 2
2 (n − 1) S C2
P χ α < χ α ,n−1 = 1 − α
2
2
<
1− , n −1
2 σ 2
1 2
1
P 2 >
σ > = 1−α
χ α χ α ,n−1
2
(n − 1) S C
2
1− ,n −1
2 2
(n − 1) 2 (n − 1) S C2
S
P 2 C
>σ >
2 = 1−α (n − 1) 2 (n − 1) 2
χ α χ α ,n−1
2
1− ,n −1 SC SC
, 2
2 2
χα 2
χ
, n −1 1− , n −1
α
2 2
Ter en conta que:
n
2
S =
c
1 n
∑ (Xi − X )
2
S c2 = S2
n − 1 i =1 n −1
Exercicio (boletín, nº 3)
e) Determina un intervalo de confianza ó 99% de n.c. para a varianza. Compárao
coa desviación típica do enunciado.
Datos a ter en conta:
( n − 1) 2 ( n − 1) 2
SC SC
poboación normal? SI ,
χ χ
2 2
α
, n −1 1− , n −1
α
µ coñecida? NON 2 2
Cálculos intermedios: n=8; valor media mostral=39; S=1,36930639;
Sc= 1,46385011 ; Chi-cadrado0.005, 7 =20,3 Chi-cadrado0.995, 7 =0,989
Estimación do intervalo:
[7*1,463852 /20,3 ; 7*1,463852 /0,989 ] = [0,7389; 15,1668]
n
Intervalo para a proporción poboacional
ˆ−p
p = 1−α
P − zα < < z 2
2 ˆ qˆ
p
α
n
pˆ qˆ pˆ qˆ
P − zα < pˆ − p < zα = 1−α
2 n 2 n
pˆ qˆ pˆ qˆ
P − pˆ − zα < − p < − pˆ + zα = 1 − α
2 n 2 n
pˆ qˆ
pˆ qˆ pˆ qˆ pˆ ± zα
P pˆ − zα < p < pˆ + zα = 1 − α 2 n
2 n 2 n
Exercicio (boletín, nº 10)
Sobre unha mostra de 120 asistentes a un espectáculo deportivo
calculouse que só 38 acudiron con vehículo propio.
n grande
P(Z< zα/2 )=0,90 → zα/2 =1,28
0,80 0,90
0,10 0,10
Interpretación:
A proporción de traballadoras que consideran as actividades de
formación axeitadas está entre un 75,3% e un 84,7% cun nivel de
confianza do 80%
Distancia máxima entre o valor obtido 0,80 e o valor da proporción poboacional desconocida cun
nivel de confianza do 80%.
O enunciado indica que:
Erro máximo 3% E = 0,03
Nivel de confianza 80% Zα/2= 1,28
Idem “sorteos de lotería”. Se o sorteo xa está feito, aínda que non coñezamos cal
foi a combinación premiada, xa non se pode falar de probabilidade senón que se
debe falar de confianza.
Idem “cualificación na materia M”. Pode que o alumno aínda non a coñeza, mais
se o exame está feito (imaxinemos un exame tipo test), a sorte xa está botada. O
alumno pode ter unha confianza alta en aprobar, mais a “cualificación” xa é “algo
fixo” (xa non hai aleatoriedade). A probabilidade de que aprobe é 1 (se respostou
correctamente un nº mínimo de preguntas) ou 0 (se non o fixo).
Probabilidade ou Nivel de confianza ?
Isto é, obtida unha estimación por intervalo,
(θ inf (T ( x )) ; θ sup (T ( x)) )
xa non é correcto dicir que temos unha probabilidade (1 − α ) de que
o parámetro se atope dentro do intervalo estimado, senón que esta se
converte en nivel de confianza (1 − α ) . Isto é, obtida a estimación
a probabilidade trócase en nivel de confianza
En resume
falamos de probabilidade cando nos referimos ó intervalo aleatorio,
(θ inf (T ( X )) ; θ sup (T ( X )))
e falamos de nivel de confianza cando nos referimos a unha
estimación concreta do intervalo
(θ inf (T ( x)) ; θ sup (T ( x)) )
Que é o nivel de confianza? (ex. tema 4)
Poboación {2, 3, 4, 5, 6} con media poboacional µ=4
Distribución do estatístico media mostral (m.a.s. X1, X2; n=2):
2 2.5 3 3.5 4 4.5 5 5.5 6
X =x µ
P( X =x ) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
( )
P X ∈ [µ ± 1,5] =
2 3 4 5
+ + + + + +
4 3
25 25 25 25 25 25 25 25
2 23
= = 0,92
E, a partir desa distribución, tamén podemos despexar un intervalo para o parámetro
Exemplo: o intervalo [ X ± 1,5 ] contén o parámetro cunha probabilidade do 92%
( [ ])
Isto é, a partir dos 25 valores da mostra,
2 3 4 5 4 3 2 23
P µ ∈ X ± 1,5 = + + + + + + = = 0,92 obtemos 25 estimacións por intervalo,
25 25 25 25 25 25 25 25 estando µ no 92% delas (23/25)
É dicir, o parámetro µ está no 92% de todas as posibles estimacións por intervalo
Estimacións 0,5-3,5 1-4 1,5-4,5 2-5 2,5-5,5 3-6 3,5-6,5 4-7 4,5-7,5
Probabilidade 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Que é o nivel de confianza? (ex. tema 4)
µ=4
DISTRIBUCIÓN DO ESTATÍSTICO MEDIA MOSTRAL
(fun ción d e cuantía d a probabilidade)
0,25
0,20
Intervalo ó 92% de nivel
0,15
de confianza
0,10
[ X ± 1,5 ]
0,05
Estimacións 0,5-3,5 1-4 1,5-4,5 2-5 2,5-5,5 3-6 3,5-6,5 4-7 4,5-7,5
Probabilidade 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
Que é o nivel de confianza? Síntese
Se tomásemos todas as posibles mostras de
tamaño n que se poderían formar a partir da
Estimacións: L1 L2
poboación obxecto de estudo (xeralmente
infinitas mostras) e construísemos para cada
unha delas o correspondente intervalo
estimado, no (1-α)% destes intervalos estaría
o valor do parámetro θ e no α% restante non
estaría. Por iso, cando obtemos unha
estimación dicimos que temos un nivel de
confianza (1-α) de que o parámetro
poboacional estea no intervalo estimado.
Nunca teremos certeza de se o parámetro está
µ
ou non na estimación obtida xa que o Non contén
parámetro é descoñecido, mais como sabemos aµ
que o (1-α)% de todas as posibles estimacións
conteñen o valor do parámetro, isto danos Nota: O nivel de confianza o fixa o investigador,
unha confianza do (1-α)% de que a nosa os habituais son 90, 95 e 99%.
estimación sexa unha das que conteñen ó
parámetro.
α representa a probabilidade de erro ou RISCO
Grazas pola túa atención