You are on page 1of 41

p ( 0 ≤ Z ≤ z ) = (Taules)

ESTADÍSTICA I – TEMES 4 i 5
MOSTREIG, DISTRIBUCIONS MOSTRALS I TEORIA DE
L’ESTIMACIÓ

Àlex Pérez-Laborda
Departament d’Economia, URV
INTRODUCCIÓ
IDEA: Les distribucions de les variables aleatòries que caracteritzen una determinada població
depenen d’un conjunt de paràmetres en general desconeguts

Població: Població:
X~Po(λ) X~Bi(n,p)
Paràmetre: λ? Població: Paràmetre: p?
X~P(θ)
Població: Població:
Paràmetre: θ?
X~exp(α) X~N(μ,σ2)

Paràmetre: α? En general Paràmetres: μ? σ2?

Per poder caracteritzar la v.a. (trobar probabilitats d’obtenir qualssevol valor) subjecte a estudi,
necessitem “estimar ≈ trobar un valor” per als paràmetres desconeguts!!!!
Estimador:

θˆ ≈ θ
INTRODUCCIÓ
INTRODUCCIÓ
Com construir un estimador?
PAS 1) Seleccionar una mostra provinent de la població a estudi:

“Ex-Ante”
Població:
cada observació es una v.a. distribuïda
X~P(θ) { x1 , x2 ,..., xn } com la població.
Paràmetre: θ? x1~P(θ),…, xn~ P(θ)

Exemple:

Població: Bombetes “Ex-Ante”


produïdes per una
màquina
{ x1 , x2 ,..., x500 } NO sabem la duració de cadascuna de
les 500 bombetes de la mostra.
Duració: X~exp(α) Prenem mostra de 500
bombetes de la màquina a SI sabem que la duració de cadascuna
Paràmetre: α? estudiar de les bombetes es una v.a:
x1~exp(α),…, x500~exp(α)
INTRODUCCIÓ
PAS 1) Seleccionar una mostra provinent de la població a estudi:

PREGUNTES: Quantes observacions agafar? Com agafar-les?

TEORIA DEL MOSTREIG


(No veurem res)

Mostreig Aleatori Simple, Mostreig Estratificat, Mostreig Sistemàtic,


Mostreig per Conglomerats, Mostreig per Àrees....

La idea es aconseguir una mostra representativa (que s’assembli a la població)


INTRODUCCIÓ

PAS 2) Utilitzar la mostra per construir un estimador θ del paràmetre desconegut θ:

Població:
X~P(θ) { x1 , x2 ,..., xn } ⌢
θ = f ( x1 , x2 ,..., xn )
Paràmetre: θ?

Volem construir l’estimador θ de tal manera que satisfaci certes propietats (veure apèndix)
que garanteixin que l’estimador s’assembli al paràmetre buscat

θ ≈θ
Exemple:

Població: Bombetes produïdes per una màquina


{ x1 , x2 ,..., x500 }
Duració: X~exp(α) Paràmetre: α?

• Per teoria sabem que en el model exponencial: α = 1/ E(X) E(x)= 1/LANDA

• Si : x + ... + x n 1 1 1 landa= 1/ esperanza E(X)


X = 1 ≈ E(X ) ⇒ ≈ = α ⇒ αˆ =
N X E(X ) X
INTRODUCCIÓ

PAS 2) Utilitzar la mostra per construir un estimador θ del paràmetre desconegut θ:

PREGUNTES: Com saber que hem de fer amb les observacions per construir un estimador?

TEORIA DE L’ESTIMACIÓ
(Veurem un bocí)

Diversos mètodes generals d’estimació:


Mètode dels Moments Màxima Versemblança Mínima Distància ...

Dos maneres de proporcionar l’estimador :


Estimació per punt, Estimació per interval***
INTRODUCCIÓ
NOTA: En aquest curs només estimarem 3 paràmetres poblacionals:
1) E(X)= μ 2) V(X)= σ2 i 3) la proporció poblacional: π insesgado= está centrado, su valor
esperado coincide con el verdadero
valor

sesgo= diferecnia entre el


estimaaodr i el valor real
PER QUÈ?
tienen que ser insesgados
X~Bernuilli(π) los dos estimadores para
poder escoger entre dos
estimadores
π?
X~Po(λ) X~Bi(n,π)
λ=μ? π?
Els paràmetres dels models
del T2 són (o depenen que es la
var

X~exp(α) només de) μ i σ2 X~N(μ,σ2) nos


quedamos

α=1/ μ? μ? σ2? con el que


tenga el
X~tv error
cuadratico
medio
v=2σ2/( σ2-1)? mas
pequeño

var(X)= xk^2*pk- E(X)^2

var(P1)= E[(P1-E(P1)^2)]=E[(P1-P)^2]
(L’estimació per interval només de μ i π) error
cuadratico
medio,
cuando no
p sola=probbilidad
estan
insesgados
ESTIMACIÓ PER PUNT

METODE DELS MOMENTS:

Idea del mètode: Identificar el paràmetre poblacional amb el seu equivalent estadístic mostral.
1 n
µ? → µˆ = X = ∑ xi
n i =1 P1(n)--> n-> infinito--> P a medida que n augmenta, debe ir hacia p

E(P,n)-->n-> infinito__>P

 2 1 n Var (P,n)-->N--> infinito--> 0

(i )
a medida que n augmenta que var vaya hacia 0


2
 S = x − X
 n i =1
σ 2 ? → σˆ 2 = 
(i )
n
S 2 = 1
 n −1 n − 1 ∑
2
x − X
i =1

π ? → πˆ = p = % percentatge d'Exits a la mostra


ESTIMACIÓ PER PUNT

NOTES:

1) En mostres petites, S2n-1 (quasi variància mostral) té millors propietats que S2

2) Recordeu que per al càlcul de la variància MOSTRAL (de manera similar a com passa a la
variància POBLACIONAL) podem utilitzar una fórmules alternatives que simplifiquen el càlcul:

TIPIFICAR A N(0,1)--> MEDIA-ESPERANZA (MU)/ RAIZ DE


(VAR/(n))
n
1
S 2 = ∑ xi2 − X 2
n i =1
1 n 2 n
S n −1
2
= ∑
n − 1 i =1
xi −
n −1
X 2

Sn^2-1= n/n-1*Sn^2
ESTIMACIÓ PER PUNT
Exemple 1
El rati preu-benefici per una mostra aleatòria de deu accions negociades al NYSM un día en concret van ser:

10,16, 5, 10, 12 , 8 , 4, 6, 5, 4

Utilitzi el mètode dels moments per obtenir estimacions puntuals dels següent paràmetres poblacionals:
Esperança, Variància i la Proporcio poblacional de valors amb rendiment superior a 8.5

10 + 16+5+10 + 12+8 +4+6+5+4 80


µˆ = X = = = 8
10 10
 2 102 + 162 +52 +102 + 122 +8 2 +42 +62 +52 +42
 S = 10
− 82 = 14.2
σˆ 2 = 
 S 2 = n S 2 = 10 14.2 = 15.78
n −1
 n −1 9
 4
 p = % mostral = = 0.4
10
πˆ = 
 p = 1 + 1 + 0 + 1 + 1 + 0 + 0 + 0 + 0 + 0 = 0.4
 10
ESTIMACIÓ PER PUNT
PROBLEMA: Els estimadors són (ex-ante) variables aleatòries
1) Els estimadors els calculem a partir d’un mostra
(Ex ante) no sabem el valor de cadascuna de les observacions mostrals
(Ex-ante) tampoc sabem el valor del’estimador
2) El valor del estimador canvia amb la mostra.

Exemple: Esperança del pes d’un nen al néixer?

{2.3,3.7,3.4,2.8,2.5} →µˆ = X = 2.9


Pes nen 10 anys {2.4,3.5,3.1,2.2,2.9} → µˆ = X = 2.8
~N(μ,σ2)
{2.8,3.2,3.3,4.2,3.5} → µˆ = X = 3.4

¿Quin valor prenem com estimador: 2.94 2.8 o 3.4 ?


ESTIMACIÓ PER PUNT

Solució:

• Els estimadors son v.a.

• Si coneguéssim la seva funció de quantia (discret) o la seva funció de distribució (continu),


podríem calcular la probabilitat de que (ex-ante) l’estimador estigui entre qualsevol dos
valors. (Calcular probabilitats és el que hem fet en els T1,T2 i T3 )

Podem fer servir aquestes probabilitats per construir un “interval de confiança”

(ESTIMACIÓ PER INTEVAL)

P[ E(x) si Li i LI]=0,95

la variable aleatoria es en base a los limites inferiores i superiores, que se calculan, se sacan a partir de la muestra, dado que es
aleatoria.

LIMTE INFERIOR= MEDIA-NUM DE TABLA* RAIZ CUADRADA DE (VARIANZA/MUESTRA (n))


LIMTE SUPERIOR= MEDIA+NUM DE TABLA* RAIZ CUADRADA DE (VARIANZA/MUESTRA (n))

SI NO CONOCES MEDIA MU NI VARINZA: MEDIA-MU/ RAIZ DE (QUASIVARIANZA/N-1), Y ASI LLEGAMOS A UNA T STUDENT tn-1

se hace t student pq no se puede llegar a una normal (0,1) grados libertad= n-1
PROPIETATS
ESTIMACIO PER
DELS
INTERVAL
ESTIMADORS

¿Coneixem la distribució de probabilitat dels estimadors per el mètode dels moments de μ,


σ2 i π ?

Si. Podem fer servir la propietat additiva (si sabem que la població d’estudi és Normal) o bé, el
TLC (si la mostra és gran) Veure “distribucions dels estadístics mostrals” Moodle.

Exemple: Distribució de la mitjana mostral d’una població amb variància coneguda


x1 + .... + xn
µˆ = X =
n
 1 1 1
 E ( X ) = µ + ... + µ = n × µ=µ
1 1  n n n
X = x1 + .... + xn ⇒  2 2 2
n n Transformació  1 2 1 2 1 2 1 2
Lineal V ( X ) =   σ + ... +   σ = n ×   σ = σ
 n n n n
 1 
A) Si x i ~N(µ ,σ 2 ) ⇒ propietat additiva: X ~ N  µ , σ 2 
 n 
 1 
B)Si n>30 ⇒ TLC: X ~ N  µ , σ 2 
aprox
 n 
ESTIMACIO PER INTERVAL
Estimació per interval:

• Utilitzarem la distribució del estimador θˆ per donar un interval de valors [θ m,θ M ] del que
podem assegurar (ex-ante) amb una determinada probabilitat (nivell de confiança), que
contindrà el vertader paràmetre θ.

• Dit d’una altre manera, si el nivell de confiança es del 90%, la probabilitat de que ens
equivoquem (es a dir que l’interval no contingui el vertader paràmetre) només és del 10%.

• La probabilitat d’error s’anomena (nivell de significació “α”)

Nivell de confiança = 1-α

• El nivell de probabilitat l’escollim nosaltres en funció de quan segurs volem estar, però
evidentment, a major nivell de confiança, major serà l’interval (i per tant, menys precisa
serà la nostra estimació).
ejemplo nivel de confianza al 95%
1-alfa=0,95
alfa es 0,05
Gràficament:

Nivell de confiança
Nivell de significació

1-α
α/2 α/2

θm θM

No estem segurs del valor real de θ però, podem asegurar que es trova entre θm < θ
< θM amb una “confiança” del 1-α %
ESTIMACIO PER INTERVAL
Pràctic: Com trobem un interval de confiança en 5 passos:
X~P(θ), θ?

PAS 1: Identificar QUIN PARÀMETRE (θ) i fer una ESTIMACIÓ PER PUNT ( θ̂ )

a) Esperança d’una població: c) Proporció d’una població:

µ ? → µˆ = X π ? → πˆ = p

b) Diferencia d’esperances entre dos d) Diferencia d’esperances entre dos


poblacions: poblacions:

µ1 − µ2 ? → µ1 − µ2 = X 1 − X 2 π 1 − π 2 ? → π 1 − π 2 = p1 − p2
ESTIMACIO PER INTERVAL
PAS 2: Identificar QUE CONEIXEM de la població de la qual desconeixem el paràmetre:
a) Esperança d’una població:
Coneixem la variància poblacional (σ2)?
Població X~Normal? Si NO necessitem estimador: S2 o S2n-1?
Si NO necessitem una mostra gran ( n>30)

b) Diferencia d’esperances entre dos poblacions

Població X1 i X2~Normals? Coneixem la variàncies poblacionals (σ12 i σ22)?


Si NO necessitem mostres grans ( n1 i n2 >30) Si NO necessitem estimadors: S2 o S2n-1 per a cada
mostra
Sabem almenys si tot i ser desconegudes les
variàncies son iguals? Si no, en aquest curs no
podem resoldre.

c) Proporció d’una població d) Diferència de proporcions poblacionals


Necessitem n > 30 i que l’estimador puntual Necessitem n1 i n2 > 30 i que l’estimador puntuals
verifiqui: verifiquin:
np>5 n1p1>5 n2p2>5
n(1-p)>5 n1(1-p1)>5 n2(1-p2)>5
ESTIMACIO PER INTERVAL

PAS 3: Anar a el full “intervals de confiança” (Moodle) i trobar el cas concret segons els pas 1 i 2 i
identificar EL MODEL DE DISTRIBUCIÓ sota aquestes condicions:
ESTIMACIO PER INTERVAL
PAS 3: Anar a el full “intervals de confiança” (Moodle) i trobar el cas concret segons els pas 1 i 2 i
identificar EL MODEL DE DISTRIBUCIÓ del estimador sota aquestes condicions
ESTIMACIO PER INTERVAL
PAS 4: Trobar el valor ABSCISSA que deixa una probabilitat PER SOBRE igual a LA MEITAT DEL
NIVELL DE SIGNIFICACIÓ: α/2 segons el model trobat en el Pas 3

α 1 − Confiança
Nivell de significació: Confiança = 1 − α ⇒ =
2 2

1-α
α/2 α/2

ABSISSA?

PAS 5: Utilitzar el full “intervals de confiança” per CALCULAR EXTREM SUPERIOR E INFERIOR de
l’interval de confiança
ESTIMACIO PER INTERVAL
Teoria: Perquè construïm l’interval de confiança així?
Exemple: Construcció d’un interval de confiança per l’esperança poblacional amb variància poblacional
coneguda.

X ~ N ( µ , σ 2 ) , σ 2 coneguda µˆ = X

x1 + ... + xn ; on xi ~ N ( µ , σ 2 ) ⇒ Fent servir la propietat additiva Normal:


1 1
X =
n n
1 1 1 
E ( X ) = µ + ... + µ = n × µ = µ 
n n n   σ2 
2 
⇒ X ~ N  µ, 
σ
2 2 2
  2
1   2
1   2
1   n 
V ( X ) =   σ + ... +   σ = n ×   σ =
n n n n 
Z
X −µ
→ Tipificant: ~ N ( 0,1)
σ 2

n
ESTIMACIO PER INTERVAL
Z
X −µ
~ N ( 0,1)
Com σ 2 , sigui, zα/2 l’abscissa tal que P(Z< zα/2)=α/2:
n

1-α
α/2 α/2
-zα/2 zα/2

 X −µ 
P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P  − zα / 2 ≤ ≤ zα / 2  = 1 − α operant a les dos bandes de la desigualdat per aïllar µ :
 σ2 n 
 
 
P  − zα / 2 ≤

X −µ
σ2 n
( ) (
≤ zα / 2  = P − zα / 2 σ 2 n ≤ X − µ ≤ zα / 2 σ 2 n = P − zα / 2 σ 2 n ≤ X − µ ≤ zα / 2 σ 2 n =
 )
 

( ) (
= P − X − zα / 2 σ 2 n ≤ − µ ≤ − X + zα / 2 σ 2 n = P X − zα / 2 σ 2 n ≤ µ ≤ X + zα / 2 σ 2 n = 1 − α )
Llavors:

( )
P µ ∈  X ± zα / 2 σ 2 n  = 1 − α
 
ESTIMACIO PER INTERVAL (EXEMPLES)

EXERCICI 3 Considerem que el temps necessari per produir certa peça segueix una normal de
mitjana desconeguda i desviació típica 1,9 minuts. D'una mostra de 8 elements s'han obtingut els
següents temps de producció:
38,5 39,0 41,5 37,0 39,5 40,5 38,0 38,0
Trobeu un interval de confiança per a la mitjana poblacional amb un nivell de significació del 1,1%.

PAS 1: Volem Interval confiança sobre la esperança (μ):

312
µ ? → µˆ = X = = 39
8
PAS 2: Sabem que la població SI és Normal i SI coneixem la variància poblacional σ2= 1.92:

X ~ N ( µ ,1.92 ), µ ?
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una N(0,1)

PAS 4: Nivell Significació: = 1.1% Nivell Confiança: =98.9%

α/2 = 0,011/2 = 0,0055


Taules de la N(0,1):

α /2=0.0055 α /2=0.0055 P(0 ≤ Z ≤ zα/2) = 0,5 – 0,0055 = 0,4945


1-α=
0.989 zα/2 = 2,54

zα/2
Tenim una “confiança” del 98.9% de que l’interval
σ 1.9
PAS 5: Interval: X ± zα / 2 = 39 ± 2.54 = [37.29, 40.71] [37.29, 40.71] contingui el vertader valor de μ
n 8
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 4
El temps que es tarda a fer cert recorregut d'una línia de tren és aleatori amb distribució normal de
paràmetres desconeguts. Donada una mostra de 20 elements, s'ha obtingut una mitjana mostral de 32
minuts i una variància mostral de 25.

a) Determineu un interval, al 99% de confiança, per al temps mitjà que es tarda a fer el recorregut.

PAS 1: Volem Interval confiança sobre la esperança (μ):

µ ? → mostra n)20 i X = 32
PAS 2: Sabem que la població SI és Normal i NO coneixem la variància poblacional

X ~ N ( µ , σ 2 ), µ ?, σ 2 ?

De la mostra sabem la variància mostral que es un estimador de la variància poblacional:

σˆ 2 = S 2 = 25
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una t student amb n-1 = 20-1= 19 graus de llibertat

PAS 4: Nivell Confiança: =99% el que implica que Nivell Significació: = 1%=0.01

α/2 = 0,01/2 = 0,005


Taules de la T19: P(T19 ≤ tα/2)

α /2=0.005 α /2=0.005 P(T19 ≤ tα/2) = 0,005+0.99 = 0,995


1-α=
0.99 zα/2 = 2,86

tα/2
Tenim una “confiança” del 99% de que l’interval
σ 5
PAS 5: Interval: X ± tα / 2 = 32 ± 2.86 = [ 28.71, 35.28] [28.71, 35.28] contingui el vertader valor de μ
n 20 − 1
ESTIMACIO PER INTERVAL (EXEMPLES)
b) El nivell de confiança que ens permetria treballar amb una precisió de ±2,4 minuts.

Ara estem buscant el nivell α???? de tal manera que l’interval de confiança sigui:

σ
X ± tα /2 = 32 ± 2.4 = [ 29.6, 34.4 ]
n

S 5 20 − 1
Igualem les dues expressions: tα/2 tα /2 = tα /2 = 2.4 ⇒ tα /2 = 2.4 = 2.092
n −1 20 − 1 5

Utilitzem les taules de la t ( a la inversa) i veiem que:

α
P (t19 ≤ 2.092) = 0,975 ⇒ = 0.025 ⇒ α = 0.05 ⇒ 1 − α = 0.95
2

α /2=0.025 α /2 = 0.025
1-α =
0.95

tα/2 = 2.092
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 5 Una entitat bancària ha calculat que el moviment per finestreta d'ingressos i reintegraments en els
comptes corrents segueix una llei normal, en cada cas i de manera independent:

Ingressos: N(μi, 9,32)

Reintegraments: N(μr, 7,42)

Per estimar la diferència mitjana entre els ingressos i els reintegraments es va agafar una mostra de 18 operacions
per finestreta que afectessin a comptes corrents, amb els següents resultats:

8 ingressos per un import mitjà de 228 €.

10 reintegraments per un import mitjà de 143 €.

Calculeu un interval de confiança per a la diferència: μi-μr, amb un nivell de significació de 0,05.

PAS 1: Volem Interval confiança sobre la diferència d’esperances (μi- μr):

µi − µr ? → mostra n i =8 i X i = 228 i mostra n r =10 i X r = 143 ⇒ µi − µr = 228 − 143 = 85


PAS 2: Sabem que les poblacions SI son Normals i SI coneixem les variàncies poblacionals:
σi2= 9.32 i σr2= 7.42

X i ~ N ( µi ,9.32 ), X r ~ N ( µ r , 7.42 )
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 3: Veiem que el pivot segueix una N(0,1)

PAS 4: Nivell Significació: 5% Nivell Confiança: =95%

α/2 = 0,05/2 = 0,025


Taules de la N(0,1): P(0<Z ≤ zα/2)

α /2=0.025 α /2=0.025 P(0<Z ≤ zα/2) = 0.5 - 0.025 = 0,475


1-α=
0.95 zα/2 = 1,96

zα/2
σ 12 σ 22 9.32 7.42
PAS 5: Interval: ( X 1 − X 2 ) ± zα /2 +
n1 n2
= 85 ± 1.96
8
+
10
= [ 77.89, 92.91]

Tenim una “confiança” del 95% de que l’interval


[77.89, 92.91] contingui el valor de μi – μr
ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 10 Es vol estimar un interval, del 90% de confiança, per a la proporció de persones que estalvien una
mitjana de 250 € o més al mes. Per aquest motiu, s'ha agafat una mostra aleatòria de 66 persones i s'ha comprovat
que només 23 persones presentaven aquell nivell d'estalvi.

a) Calculeu l'interval de confiança per a la proporció poblacional.

PAS 1: Volem Interval confiança sobre la proporció poblacional (π):

23
π ? → mostra n=66 i p = = 0.3485
66
PAS 2: Compleix les condicions? SI:

n = 66 > 30 np = 66 × 0.3485 = 23 > 5 n (1 − p ) = 66 × (1 − 0.3485) = 43 > 5


PAS 3: Veiem que el pivot segueix una N(0,1)
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 4: Nivell Confiança =90% Nivell significació = 10%

α/2 = 0,1/2 = 0,05


Taules de la N(0,1): P(0<Z ≤ zα/2)

α /2=0.05 α /2=0.05 P(0<Z ≤ zα/2) = 0.5 - 0.05 = 0,45


1-α=
0.90 zα/2 = 1,645

zα/2
p (1 − p ) 0.3485 (1 − 0.3485 )
PAS 5: Interval: p ± zα / 2 = 0.3485 ± 1.64 = [ 0.252, 0.445]
n 66

Tenim una “confiança” del 90% de que l’interval


[0.252 , 0.445] contingui el valor de π
ESTIMACIO PER INTERVAL (EXEMPLES)
a) Quina grandària hauria de tenir la mostra per reduir a la meitat l'amplada de l'interval anterior?

Suposem que la proporció mostral ( p̂ = 0,3485) es manté constant.


 pˆ · (1 − pˆ )   pˆ · (1 − pˆ )  pˆ · (1 − pˆ )
Amplitud de l’interval:  pˆ + zα / 2  −  pˆ − zα / 2  = 2· zα / 2
 n   n  n

Amplitud anterior = 1,645 · 0.058652 = 0,19296


Amplitud exigida = (0,19296) / 2 = 0.09648
0,3485 · 0,6515
0.09648 = 2 · 1,645 → 0.09648 = 1,56765
n n

1,56765
n= = 16,248077
0,09648

n = (16,248077)2 = 264
264
n anterior = 66 ⇒ = 4
66

Si n és 4 vegades més gran l’amplitud de l’interval es redueix a la meitat.


ESTIMACIO PER INTERVAL (EXEMPLES)
EXERCICI 11 Un dels indicadors que generalment s'agafen per valorar una campanya publicitària
és l'augment de públic que coneix el producte respecte el d'abans de la campanya. En aquest sentit, es
disposa d'informació procedent de les enquestes, abans i després de la campanya, amb les dades
següents:
Abans Després campanya
campanya

Enquesta inicial 250 persones 300 persones

No volen contestar 47 persones 49 persones

Coneixen el producte 82 persones 163 persones

Calculeu, amb una confiança de 0,955, un interval per al increment percentual de públic que coneix el
producte.
PAS 1: Volem Interval confiança sobre la diferencia proporcions poblacionals (π1- π2):

82 
mostra n a =250-47=203 i pa = = 0.4039 
203 
πd −πa ? →  → π d − π a = pd − pa = 0.6494 − 04039 = 0.2455
163
mostra n d =300-49=251 i pd = = 0.6494 
251 
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 2: Compleixen les condicions?: SI

n1 = 203 > 30 n1 p1 = 203 × 0.4039 > 5 n1 (1 − p1 ) = 203 × (1 − 0.4039) > 5


n2 = 251 > 30 n2 p 2 = 251 × 0.6494 > 5 n2 (1 − p 2 ) = 251 × (1 − 0.6494) > 5
PAS 3: Veiem que el pivot segueix una N(0,1)
ESTIMACIO PER INTERVAL (EXEMPLES)
PAS 4: Nivell Confiança =95.5% Nivell significació = 4.5%

α/2 = 0,045/2 = 0,0225


Taules de la N(0,1): P(0<Z ≤ zα/2)

α /2=0.0225 α /2=0.0225 P(0<Z ≤ zα/2) = 0.5 - 0.0225 = 0,4775


1-α=
0.955 zα/2 ≈ 2.00

zα/2
PAS 5:
Interval:
pd (1 − pd ) pa (1 − pa ) 0.6494 (1 − 0.6494 ) 0.4039 (1 − 0.4039 )
( pd − pa ) ± zα / 2 + = 0.3485 ± 2 + = [ 0.154, 0.337 ]
nd na 251 203

Tenim una “confiança” del 95.5% de que l’interval


[0.154 , 0.337] contingui el valor de πd- πa
APPENDIX:
APPENDIX:PROPIETATS
PROPIETATSDELS
D’UNESTIMADORS
ESTIMADOR
RECORDATORI: Els estimadors es construeixen a partir d’una mostra, per tant (ex-ante) són
variables aleatòries

per conèixer les propietats del estimador, caldrà conèixer les seves característiques:

E (θˆ) → Informa sobre quin es valor central


V (θˆ) → Informa sobre si obtindrem estimadors a prop del valor esperat o bé dispersos a banda i banda
Pθˆ → Podrem calcular la probabilitat de obtenir un estimador entre dos valors qualssevol: P(a < θˆ < b)

¿Quines propietats volem que tingui un estimador?


Volem que aproximi el paràmetre poblacional el millor possible: θˆ ≈ θ per tant:

1) Absència de Biax: Volem que E(θˆ) = θ ⇒ Biaix ≡ E(θˆ) − θ = 0

2) Eficiència: Volem que V(θˆ) sigui el més menuda possible :


V(θˆ) GRAN: més probable obtenir V(θˆ) MENUDA: menys probable obtenir
(amb una determinada mostra) un (amb una determinada mostra) un valor
valor allunyat de θ allunyat de θ

E(θˆ) =θ
3) Consistent: Quant més gran sigui la mostra, més segurs estem de que el estimador coincideixi
amb el vertader paràmetre poblacional:

E(θˆ)  → θ 
n →∞
 ⇒ θˆ 
n →∞
→θ
V(θˆ) 
n →∞
→ 0 
APPENDIX: PROPIETATS
PROPIETATS DELS ESTIMADORS
DELS ESTIMADORS
¿Quines propietats tenen els estimadors per el mètode dels moments de μ, σ2 i π ?

Estimador Sense Consistent


Paràmetre ( θ ) Estimador ( θˆ ) E( θˆ ) Sense Biaix Biaix de Variància Mínima
μ X μ SI SI, si X~N SI
S2 n-1/n σ2 NO No SI
σ2
S n2−1 σ2 SI SI, si X~N SI
p ( o π) pˆ (p) =% mostra p (π) SI SI SI

Nota: Sovint alhora de decidir entre dos possibles estimadors per un determinat paràmetre,
trobem un “trade-off” entre el biaix i la variància i necessitem un criteri per decidir :
Error Quadràtic Mitjà (EQM): Agafem el que tingui menor EQM= Variància + Biaix2
APPENDIX: PROPIETATS DELS ESTIMADORS
EXERCICI 1

En mostres de grandària n=3 d'una v.a. normal amb mitjana µ i variància coneguda σ2=1, es
consideren els següents estimadors de µ:
1 1 1
U1 = X1 + X2 + X3
3 3 3
1 1 1
U2 = X1 + X2 + X3
4 2 4
1 3 1
U3 = X1 + X2 + X3
8 8 2

a) Comproveu que són estimadors sense biaix i estudieu la seva eficiència.


Ui és un estimador sense biaix de µ ↔ E[Ui] = µ.
1 1 1 1 1 1
E[U1] = E[ X1 + X2 + X3] = E[ X1] + E[ X2] + E[ X3] =
3 3 3 3 3 3
1 1 1 1 1 1 1 1 1
= E[X1] + E[X2] + E[X3] ={E[Xi]=µ}= µ+ µ+ µ = µ [ + + ] = µ
3 3 3 3 3 3 3 3 3

1 1 1 1 1 1
E[U2] = E[ X1 + X2 + X3] = E[ X1] + E[ X2] + E[ X3] =
4 2 4 4 2 4
1 1 1 1 1 1 1 1 1
= E[X1] + E[X2] + E[X3] ={E[Xi]=µ}= µ+ µ+ µ = µ [ + + ] = µ
4 2 4 4 2 4 4 2 4

1 3 1 1 3 1
E[U3] = E[ X1 + X2 + X3] = E[ X1] + E[ X2] + E[ X3] =
8 8 2 8 8 2
1 3 1 1 3 1 1 3 1
= E[X1] + E[X2] + E[X3] ={E[Xi]=µ}= µ+ µ+ µ = µ [ + + ] = µ
8 8 2 8 8 2 8 8 2

Els 3 són estimadors sense biaix.


APPENDIX: PROPIETATS DELS ESTIMADORS
1 1 1 1 1 1
Var[U1] = Var[ X1 + X2 + X3] = Var[ X1] + Var[ X2] + Var[ X3] =
3 3 3 3 3 3
2 2 2
1 1 1
=   Var[X1] +   Var[X2] +   Var[X3] ={Var[Xi]=1}=
3 3 3
2 2 2
1 1 1 1 1 1 3 1
=   +   +   = + + = = = 0,3333
3 3 3 9 9 9 9 3

1 1 1 1 1 1
Var[U2] = Var[ X1 + X2 + X3] = Var[ X1] + Var[ X2] + Var[ X3] =
4 2 4 4 2 4
2 2 2
1 1 1
=   Var[X1] +   Var[X2] +   Var[X3] ={Var[Xi]=1}=
 4  2  4
2 2 2
1 1 1 1 1 1 6 3
=   +  +  = + + = = = 0,375
 4  2  4 16 4 16 16 8

1 3 1 1 3 1
Var[U3] = Var[ X1 + X2 + X3] = Var[ X1] + Var[ X2] + Var[ X3] =
8 8 2 8 8 2
2 2 2
1 3 1
=   Var[X1] +   Var[X2] +   Var[X3] ={Var[Xi]=1}=
8 8  2
2 2 2
1 3 1 1 9 1 26 13
=   +  +  = + + = = = 0,40625
8 8  2 64 64 4 64 32

Var[U1] < Var[U2] < Var[U3].


L’estimador més eficient és U1, seguit de U2 i el menys eficient és U3
APPENDIX: PROPIETATS DELS ESTIMADORS

b) Calculeu l'estimació de µ, mitjançant els estimadors anteriors, per a la mostra:


x1=2,6 x2=3,1 x3=1,8
1
µ̂1 = x1 + 1 x2 + 1 x3 = 1 ·(2,6) + 1 ·(3,1) + 1 ·(1,8) = 2,5
3 3 3 3 3 3

1
µ̂ 2 = x1 + 1 x2 + 1 x3 = 1 ·(2,6) + 1 ·(3,1) + 1 ·(1,8) = 2,65
4 2 4 4 2 4

1
µ̂ 3 = x1 + 3 x2 + 1 x3 = 1 ·(2,6) + 3 ·(3,1) + 1 ·(1,8) = 2,3875
8 8 2 8 8 2

You might also like