Professional Documents
Culture Documents
ESTADÍSTICA I – TEMES 4 i 5
MOSTREIG, DISTRIBUCIONS MOSTRALS I TEORIA DE
L’ESTIMACIÓ
Àlex Pérez-Laborda
Departament d’Economia, URV
INTRODUCCIÓ
IDEA: Les distribucions de les variables aleatòries que caracteritzen una determinada població
depenen d’un conjunt de paràmetres en general desconeguts
Població: Població:
X~Po(λ) X~Bi(n,p)
Paràmetre: λ? Població: Paràmetre: p?
X~P(θ)
Població: Població:
Paràmetre: θ?
X~exp(α) X~N(μ,σ2)
Per poder caracteritzar la v.a. (trobar probabilitats d’obtenir qualssevol valor) subjecte a estudi,
necessitem “estimar ≈ trobar un valor” per als paràmetres desconeguts!!!!
Estimador:
θˆ ≈ θ
INTRODUCCIÓ
INTRODUCCIÓ
Com construir un estimador?
PAS 1) Seleccionar una mostra provinent de la població a estudi:
“Ex-Ante”
Població:
cada observació es una v.a. distribuïda
X~P(θ) { x1 , x2 ,..., xn } com la població.
Paràmetre: θ? x1~P(θ),…, xn~ P(θ)
Exemple:
Població:
X~P(θ) { x1 , x2 ,..., xn } ⌢
θ = f ( x1 , x2 ,..., xn )
Paràmetre: θ?
⌢
Volem construir l’estimador θ de tal manera que satisfaci certes propietats (veure apèndix)
que garanteixin que l’estimador s’assembli al paràmetre buscat
⌢
θ ≈θ
Exemple:
PREGUNTES: Com saber que hem de fer amb les observacions per construir un estimador?
TEORIA DE L’ESTIMACIÓ
(Veurem un bocí)
var(P1)= E[(P1-E(P1)^2)]=E[(P1-P)^2]
(L’estimació per interval només de μ i π) error
cuadratico
medio,
cuando no
p sola=probbilidad
estan
insesgados
ESTIMACIÓ PER PUNT
Idea del mètode: Identificar el paràmetre poblacional amb el seu equivalent estadístic mostral.
1 n
µ? → µˆ = X = ∑ xi
n i =1 P1(n)--> n-> infinito--> P a medida que n augmenta, debe ir hacia p
E(P,n)-->n-> infinito__>P
(i )
a medida que n augmenta que var vaya hacia 0
∑
2
S = x − X
n i =1
σ 2 ? → σˆ 2 =
(i )
n
S 2 = 1
n −1 n − 1 ∑
2
x − X
i =1
NOTES:
2) Recordeu que per al càlcul de la variància MOSTRAL (de manera similar a com passa a la
variància POBLACIONAL) podem utilitzar una fórmules alternatives que simplifiquen el càlcul:
Sn^2-1= n/n-1*Sn^2
ESTIMACIÓ PER PUNT
Exemple 1
El rati preu-benefici per una mostra aleatòria de deu accions negociades al NYSM un día en concret van ser:
10,16, 5, 10, 12 , 8 , 4, 6, 5, 4
Utilitzi el mètode dels moments per obtenir estimacions puntuals dels següent paràmetres poblacionals:
Esperança, Variància i la Proporcio poblacional de valors amb rendiment superior a 8.5
Solució:
P[ E(x) si Li i LI]=0,95
la variable aleatoria es en base a los limites inferiores i superiores, que se calculan, se sacan a partir de la muestra, dado que es
aleatoria.
SI NO CONOCES MEDIA MU NI VARINZA: MEDIA-MU/ RAIZ DE (QUASIVARIANZA/N-1), Y ASI LLEGAMOS A UNA T STUDENT tn-1
se hace t student pq no se puede llegar a una normal (0,1) grados libertad= n-1
PROPIETATS
ESTIMACIO PER
DELS
INTERVAL
ESTIMADORS
Si. Podem fer servir la propietat additiva (si sabem que la població d’estudi és Normal) o bé, el
TLC (si la mostra és gran) Veure “distribucions dels estadístics mostrals” Moodle.
• Utilitzarem la distribució del estimador θˆ per donar un interval de valors [θ m,θ M ] del que
podem assegurar (ex-ante) amb una determinada probabilitat (nivell de confiança), que
contindrà el vertader paràmetre θ.
• Dit d’una altre manera, si el nivell de confiança es del 90%, la probabilitat de que ens
equivoquem (es a dir que l’interval no contingui el vertader paràmetre) només és del 10%.
• El nivell de probabilitat l’escollim nosaltres en funció de quan segurs volem estar, però
evidentment, a major nivell de confiança, major serà l’interval (i per tant, menys precisa
serà la nostra estimació).
ejemplo nivel de confianza al 95%
1-alfa=0,95
alfa es 0,05
Gràficament:
Nivell de confiança
Nivell de significació
1-α
α/2 α/2
θm θM
No estem segurs del valor real de θ però, podem asegurar que es trova entre θm < θ
< θM amb una “confiança” del 1-α %
ESTIMACIO PER INTERVAL
Pràctic: Com trobem un interval de confiança en 5 passos:
X~P(θ), θ?
PAS 1: Identificar QUIN PARÀMETRE (θ) i fer una ESTIMACIÓ PER PUNT ( θ̂ )
µ ? → µˆ = X π ? → πˆ = p
µ1 − µ2 ? → µ1 − µ2 = X 1 − X 2 π 1 − π 2 ? → π 1 − π 2 = p1 − p2
ESTIMACIO PER INTERVAL
PAS 2: Identificar QUE CONEIXEM de la població de la qual desconeixem el paràmetre:
a) Esperança d’una població:
Coneixem la variància poblacional (σ2)?
Població X~Normal? Si NO necessitem estimador: S2 o S2n-1?
Si NO necessitem una mostra gran ( n>30)
PAS 3: Anar a el full “intervals de confiança” (Moodle) i trobar el cas concret segons els pas 1 i 2 i
identificar EL MODEL DE DISTRIBUCIÓ sota aquestes condicions:
ESTIMACIO PER INTERVAL
PAS 3: Anar a el full “intervals de confiança” (Moodle) i trobar el cas concret segons els pas 1 i 2 i
identificar EL MODEL DE DISTRIBUCIÓ del estimador sota aquestes condicions
ESTIMACIO PER INTERVAL
PAS 4: Trobar el valor ABSCISSA que deixa una probabilitat PER SOBRE igual a LA MEITAT DEL
NIVELL DE SIGNIFICACIÓ: α/2 segons el model trobat en el Pas 3
α 1 − Confiança
Nivell de significació: Confiança = 1 − α ⇒ =
2 2
1-α
α/2 α/2
ABSISSA?
PAS 5: Utilitzar el full “intervals de confiança” per CALCULAR EXTREM SUPERIOR E INFERIOR de
l’interval de confiança
ESTIMACIO PER INTERVAL
Teoria: Perquè construïm l’interval de confiança així?
Exemple: Construcció d’un interval de confiança per l’esperança poblacional amb variància poblacional
coneguda.
X ~ N ( µ , σ 2 ) , σ 2 coneguda µˆ = X
n
ESTIMACIO PER INTERVAL
Z
X −µ
~ N ( 0,1)
Com σ 2 , sigui, zα/2 l’abscissa tal que P(Z< zα/2)=α/2:
n
1-α
α/2 α/2
-zα/2 zα/2
X −µ
P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P − zα / 2 ≤ ≤ zα / 2 = 1 − α operant a les dos bandes de la desigualdat per aïllar µ :
σ2 n
P − zα / 2 ≤
X −µ
σ2 n
( ) (
≤ zα / 2 = P − zα / 2 σ 2 n ≤ X − µ ≤ zα / 2 σ 2 n = P − zα / 2 σ 2 n ≤ X − µ ≤ zα / 2 σ 2 n =
)
( ) (
= P − X − zα / 2 σ 2 n ≤ − µ ≤ − X + zα / 2 σ 2 n = P X − zα / 2 σ 2 n ≤ µ ≤ X + zα / 2 σ 2 n = 1 − α )
Llavors:
( )
P µ ∈ X ± zα / 2 σ 2 n = 1 − α
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 3 Considerem que el temps necessari per produir certa peça segueix una normal de
mitjana desconeguda i desviació típica 1,9 minuts. D'una mostra de 8 elements s'han obtingut els
següents temps de producció:
38,5 39,0 41,5 37,0 39,5 40,5 38,0 38,0
Trobeu un interval de confiança per a la mitjana poblacional amb un nivell de significació del 1,1%.
312
µ ? → µˆ = X = = 39
8
PAS 2: Sabem que la població SI és Normal i SI coneixem la variància poblacional σ2= 1.92:
X ~ N ( µ ,1.92 ), µ ?
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una N(0,1)
zα/2
Tenim una “confiança” del 98.9% de que l’interval
σ 1.9
PAS 5: Interval: X ± zα / 2 = 39 ± 2.54 = [37.29, 40.71] [37.29, 40.71] contingui el vertader valor de μ
n 8
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 4
El temps que es tarda a fer cert recorregut d'una línia de tren és aleatori amb distribució normal de
paràmetres desconeguts. Donada una mostra de 20 elements, s'ha obtingut una mitjana mostral de 32
minuts i una variància mostral de 25.
a) Determineu un interval, al 99% de confiança, per al temps mitjà que es tarda a fer el recorregut.
µ ? → mostra n)20 i X = 32
PAS 2: Sabem que la població SI és Normal i NO coneixem la variància poblacional
X ~ N ( µ , σ 2 ), µ ?, σ 2 ?
σˆ 2 = S 2 = 25
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una t student amb n-1 = 20-1= 19 graus de llibertat
PAS 4: Nivell Confiança: =99% el que implica que Nivell Significació: = 1%=0.01
tα/2
Tenim una “confiança” del 99% de que l’interval
σ 5
PAS 5: Interval: X ± tα / 2 = 32 ± 2.86 = [ 28.71, 35.28] [28.71, 35.28] contingui el vertader valor de μ
n 20 − 1
ESTIMACIO PER INTERVAL (EXEMPLES)
b) El nivell de confiança que ens permetria treballar amb una precisió de ±2,4 minuts.
Ara estem buscant el nivell α???? de tal manera que l’interval de confiança sigui:
σ
X ± tα /2 = 32 ± 2.4 = [ 29.6, 34.4 ]
n
S 5 20 − 1
Igualem les dues expressions: tα/2 tα /2 = tα /2 = 2.4 ⇒ tα /2 = 2.4 = 2.092
n −1 20 − 1 5
α
P (t19 ≤ 2.092) = 0,975 ⇒ = 0.025 ⇒ α = 0.05 ⇒ 1 − α = 0.95
2
α /2=0.025 α /2 = 0.025
1-α =
0.95
tα/2 = 2.092
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 5 Una entitat bancària ha calculat que el moviment per finestreta d'ingressos i reintegraments en els
comptes corrents segueix una llei normal, en cada cas i de manera independent:
Per estimar la diferència mitjana entre els ingressos i els reintegraments es va agafar una mostra de 18 operacions
per finestreta que afectessin a comptes corrents, amb els següents resultats:
Calculeu un interval de confiança per a la diferència: μi-μr, amb un nivell de significació de 0,05.
X i ~ N ( µi ,9.32 ), X r ~ N ( µ r , 7.42 )
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una N(0,1)
zα/2
σ 12 σ 22 9.32 7.42
PAS 5: Interval: ( X 1 − X 2 ) ± zα /2 +
n1 n2
= 85 ± 1.96
8
+
10
= [ 77.89, 92.91]
23
π ? → mostra n=66 i p = = 0.3485
66
PAS 2: Compleix les condicions? SI:
zα/2
p (1 − p ) 0.3485 (1 − 0.3485 )
PAS 5: Interval: p ± zα / 2 = 0.3485 ± 1.64 = [ 0.252, 0.445]
n 66
1,56765
n= = 16,248077
0,09648
n = (16,248077)2 = 264
264
n anterior = 66 ⇒ = 4
66
Calculeu, amb una confiança de 0,955, un interval per al increment percentual de públic que coneix el
producte.
PAS 1: Volem Interval confiança sobre la diferencia proporcions poblacionals (π1- π2):
82
mostra n a =250-47=203 i pa = = 0.4039
203
πd −πa ? → → π d − π a = pd − pa = 0.6494 − 04039 = 0.2455
163
mostra n d =300-49=251 i pd = = 0.6494
251
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 2: Compleixen les condicions?: SI
zα/2
PAS 5:
Interval:
pd (1 − pd ) pa (1 − pa ) 0.6494 (1 − 0.6494 ) 0.4039 (1 − 0.4039 )
( pd − pa ) ± zα / 2 + = 0.3485 ± 2 + = [ 0.154, 0.337 ]
nd na 251 203
per conèixer les propietats del estimador, caldrà conèixer les seves característiques:
E(θˆ) =θ
3) Consistent: Quant més gran sigui la mostra, més segurs estem de que el estimador coincideixi
amb el vertader paràmetre poblacional:
E(θˆ) → θ
n →∞
⇒ θˆ
n →∞
→θ
V(θˆ)
n →∞
→ 0
APPENDIX: PROPIETATS
PROPIETATS DELS ESTIMADORS
DELS ESTIMADORS
¿Quines propietats tenen els estimadors per el mètode dels moments de μ, σ2 i π ?
Nota: Sovint alhora de decidir entre dos possibles estimadors per un determinat paràmetre,
trobem un “trade-off” entre el biaix i la variància i necessitem un criteri per decidir :
Error Quadràtic Mitjà (EQM): Agafem el que tingui menor EQM= Variància + Biaix2
APPENDIX: PROPIETATS DELS ESTIMADORS
EXERCICI 1
En mostres de grandària n=3 d'una v.a. normal amb mitjana µ i variància coneguda σ2=1, es
consideren els següents estimadors de µ:
1 1 1
U1 = X1 + X2 + X3
3 3 3
1 1 1
U2 = X1 + X2 + X3
4 2 4
1 3 1
U3 = X1 + X2 + X3
8 8 2
1 1 1 1 1 1
E[U2] = E[ X1 + X2 + X3] = E[ X1] + E[ X2] + E[ X3] =
4 2 4 4 2 4
1 1 1 1 1 1 1 1 1
= E[X1] + E[X2] + E[X3] ={E[Xi]=µ}= µ+ µ+ µ = µ [ + + ] = µ
4 2 4 4 2 4 4 2 4
1 3 1 1 3 1
E[U3] = E[ X1 + X2 + X3] = E[ X1] + E[ X2] + E[ X3] =
8 8 2 8 8 2
1 3 1 1 3 1 1 3 1
= E[X1] + E[X2] + E[X3] ={E[Xi]=µ}= µ+ µ+ µ = µ [ + + ] = µ
8 8 2 8 8 2 8 8 2
1 1 1 1 1 1
Var[U2] = Var[ X1 + X2 + X3] = Var[ X1] + Var[ X2] + Var[ X3] =
4 2 4 4 2 4
2 2 2
1 1 1
= Var[X1] + Var[X2] + Var[X3] ={Var[Xi]=1}=
4 2 4
2 2 2
1 1 1 1 1 1 6 3
= + + = + + = = = 0,375
4 2 4 16 4 16 16 8
1 3 1 1 3 1
Var[U3] = Var[ X1 + X2 + X3] = Var[ X1] + Var[ X2] + Var[ X3] =
8 8 2 8 8 2
2 2 2
1 3 1
= Var[X1] + Var[X2] + Var[X3] ={Var[Xi]=1}=
8 8 2
2 2 2
1 3 1 1 9 1 26 13
= + + = + + = = = 0,40625
8 8 2 64 64 4 64 32
1
µ̂ 2 = x1 + 1 x2 + 1 x3 = 1 ·(2,6) + 1 ·(3,1) + 1 ·(1,8) = 2,65
4 2 4 4 2 4
1
µ̂ 3 = x1 + 3 x2 + 1 x3 = 1 ·(2,6) + 3 ·(3,1) + 1 ·(1,8) = 2,3875
8 8 2 8 8 2