You are on page 1of 16

Estadística inferencial

Un dels problemes típics de l’estadística inferencial és:


• Volem conèixer el valor d’una característica en el global
d’una població
Estimació puntual • No podem mesurar aquesta característica en tots els
individus de la població
• Extraiem una mostra de la població, mesuram la
característica en els individus d’aquesta mostra i inferim
el valor de la característica en el global de la població
• Com ho hem de fer?
• Com ha de ser la mostra?
• Quina informació podem inferir de veritat?

1 / 63 2 / 63

Exemple Definicions bàsiques


Mostra aleatòria simple (m.a.s.) de mida n: D’una població,
repetim n vegades el procés d’escollir equiprobablement un
individu; els individus triats es poden repetir

Exemple: Escollim a l’atzar n estudiants de la UIB (amb


possibles repeticions) per midar-los l’alçada

D’aquesta manera, totes les mostres possibles de n individus


(possiblement repetits: multiconjunts) tenen la mateixa
probabilitat

Llegiu-vos aviat la lliçó 2 de l’AprenderR-II sobre


Mostreig

http://diari.uib.cat/digitalAssets/124/124064_1_reportatge.pdf
3 / 63 4 / 63
Definicions bàsiques Formalment
Estimador (puntual), o estadístic: Una funció que aplicada als Una m.a.s. de mida n d’una v.a. X és un vector de n còpies
valors d’una mostra ens permet estimar un paràmetre que independents (X1 , . . . , Xn ) de X
vulguem saber de tota la població
Exemple: Sigui X la v.a. «triam un estudiant de la UIB i li
Exemple: Empram la mitjana aritmètica de les alçades d’una midam l’alçada». Una m.a.s. de X de mida n serà un vector
mostra d’estudiants de la UIB per estimar l’alçada mitjana dels de n còpies independents (X1 , . . . , Xn ) d’aquesta X .
estudiants de la UIB
Una realització de la m.a.s. (X1 , . . . , Xn ) és un vector
(x1 , . . . , xn ) de valors presos per aquestes vv.aa.

Quan no hi hagi necessitat de filar prim, cometrem l’abús de


llenguatge de dir m.a.s. tant a (X1 , . . . , Xn ) com a una
realització (x1 , . . . , xn ); i ometrem els parèntesis

5 / 63 6 / 63

Formalment Formalment
Un estimador T és una funció aplicada a una m.a.s. Un estimador T és una funció aplicada a una m.a.s. X1 , . . . , Xn
X1 , . . . , Xn :
T = f (X1 , . . . , Xn ) T = f (X1 , . . . , Xn )
Aquest estimador s’aplica a les realitzacions de la mostra i
dóna nombres reals
Per tant, un estimador és una (nova) variable aleatòria, amb
Exemple: La mitjana mostral d’una m.a.s. X1 , . . . , Xn de mida distribució (en diem la distribució mostral de l’estimador),
n és esperança, desviació típica (en diem l’error estàndard, o típic,
X1 + · · · + Xn
X := de l’estimador), etc.
n
Quan l’aplicam a una realització x1 , . . . , xn de la m.a.s., Del coneixement d’aquesta distribució mostral, podrem
obtenim la seva mitjana aritmètica: estimar propietats de X a partir de les d’una mostra
x1 + · · · + xn
n

7 / 63 8 / 63
La vida real La vida real
A la vida real, les mostres aleatòries se solen prendre sense
Probabilitat que si triam n estudiants de la UIB Mida màxima d'una mostra perquè la probabilitat de repeticions

repeticions (sense reposició). No són mostres aleatòries siguin tots diferents sigui menor que 0.05

40
1.0
simples. Però:

0.9

35
0.8
• Si la mida N de la població és MOLT més gran que la

0.7

30
0.6
mida n de la mostra, els resultats per a m.a.s. valen

probabilitat

25
0.5

n
(aproximadament) en aquest cas, perquè les repeticions

0.4

20
0.3
són improbables i les variables aleatòries que formen la

15
0.2
mostra són gairebé independents

0.1

10
0.0
Cometrem l’abús de llenguatge de dir que en aquest cas 0 20 40 60 80 100 120 140 160 180 200 500 2000 3500 5000 6500 8000 9500 11000 12500 14000 15500

també tenim una m.a.s. n N

• Quan n és relativament gran comparat amb N, de vegades


es poden donar versions corregides dels estimadors

9 / 63 10 / 63

La vida «més» real Mostres de conveniència


A la pràctica, (gairebé) mai no disposarem d’una mostra
aleatòria. Ens haurem de conformar amb una mostra
oportunista (o de conveniència: la que poguem)

Heu de tenir clar que els resultats que donarem NO són vàlids
en aquest cas, però si no tenim res millor. . .

És convenient aleshores explicar amb detall com s’ha obtingut


la mostra i descriure amb detall les seves característiques, a fi
que altres investigadors puguin decidir si els individus «són Durant la 2a Guerra Mundial consultaren a Abraham Wald on
típics» i si poden extrapolar les estimacions al seu context se tenia que reforçar el blindatge dels B-29
Va demanar que es marcassin els impactes als B-29 que
tornassin de les missions
I que reforçassin les zones sense impactes
https://people.ucsc.edu/~msmangel/Wald.pdf
11 / 63 12 / 63
Disclaimer Mitjana mostral
Mitjana mostral: Prenem una m.a. de mida n de una v.a. X i
Els estimadors tenen sempre sentit per a mostres en calculam la mitjana aritmètica dels seus valors
general, però gairebé tots els teoremes que
estableixen les seves propietats són vertaders només Formalment, si es tracta d’una m.a. simple, prenem n còpies
sota determinades restriccions (m.a.s., condicions independents X1 , . . . , Xn de la v.a. X i calculam
extra sobre X , . . . ), per la qual cosa les seves X1 + · · · + Xn
X =
conseqüències tan sols són segures sota aquestes n
restriccions
Teorema
Siguin X1 , . . . , Xn una m.a. d’una v.a. X i X la seva mitjana
mostral.
Si µX i σX són l’esperança i la desviació típica de X ,
• E (X ) = µX

• Si la m.a. és simple, σ(X ) = σX / n

σ(X ) és l’error estàndard o típic de X


13 / 63 14 / 63

Mitjana mostral Un experiment


> tests = scan ( " tests . txt " )
• X és un estimador puntual de µX Read 185 items
> mean ( tests )
• E (X ) = µX : Si repetíssim moltes vegades el procés de [1] 55.43243
prendre una m.a.s. de mida n i calcular-ne la mitjana > set . seed (100)
mostral, molt probablement el valor mitjà d’aquestes > mitjanes = replicate (10^5 ,
mean ( sample ( tests ,40 , rep = TRUE ) ) )
mitjanes s’acostaria molt a µX (esperam que doni µX ) > mean ( mitjanes )
√ [1] 55.42509
• σ(X ) = σX / n: per a X fixada, la variabilitat dels
> sd ( mitjanes )
resultats de X decreix amb n i tendeix a 0 quan n → ∞ [1] 3.387893
> sd ( tests ) / sqrt (40)
[1] 3.390031

15 / 63 16 / 63
Exemple Combinació lineal de normals és
normal
S’ha pres una m.a.s. de 10 estudiants de la UIB, i les seves
alçades han estat Teorema
Si Y1 , . . . , Yn son vv.aa. normals independents, cada
1.62, 1.75, 1.64, 1.69, 1.83, 1.85, 1.72, 1.61, 1.93, 1.62
Yi ∼ N(µi , σi ), i a1 , . . . , an , b ∈ R aleshores
Podem estimar l’alçada mitjana dels estudiants de la UIB:
Y = a1 Y1 + · · · + an Yn + b
1.62 + 1.75 + 1.64 + · · · + 1.62
x= = 1.726 és una v.a. N(µ, σ) amb µ i σ les que toquen:
10
Com de «fina» és aquesta estimació? No us perdeu el proper • E (Y ) = a1 µ1 + · · · + an µn + b
tema! • Var (Y ) = a12 σ12 + · · · + an2 σn2
p
• σ(Y ) = a12 σ12 + · · · + an2 σn2

17 / 63 18 / 63

Cas X normal Teorema Central del Límit

Teorema Teorema
Sigui X1 , . . . , Xn una m.a.s. d’una v.a. X d’esperança µX i Sigui X1 , . . . , Xn una m.a.s. d’una v.a. X qualsevol d’esperança
desviació típica σX . Si X és N(µX , σX ), aleshores µX i desviació típica σX . Quan n → ∞,
 σX   σX 
X és N µX , √ X → N µX , √
n n

i per tant i per tant


X − µX X − µX
Z= √ és N(0, 1) Z= √ → N(0, 1)
σX / n σX / n
(Aquestes convergències refereixen a les distribucions.)

19 / 63 20 / 63
Teorema Central del Límit Distribució mostral de X
En resum, per una m.a.s.:
Histograma de notes de tests Histograma de la mostra de mitjanes

• Si X és normal, sempre:

20000
30

 σX 
X ∼ N µX , √

15000
n
Freqüències

Freqüències
20

10000
10

5000
• Si X no és normal però n és gran (n > 30 o 40),

σX 
0

0

0 20 40 60 80 100 40 45 50 55 60 65 70 X ≈ N µX , √
Notes dels tests Mitjanes n

Si la m.a. no és (pràcticament) simple, els dos resultats són


falsos

21 / 63 22 / 63

Distribució mostral de X Exemple


L’alçada d’una espècie de matolls té valor mitjà 115 cm, amb
Exemple: Tenim una v.a. X de mitjana µX = 3 i desv. típ. una desviació típica de 25. Prenem una m.a.s. de 100 matolls
σX = 0.2. Prenem mostres aleatòries simples de mida 100. d’aquesta espècie.
Llavors, la distribució de la mitjana mostral X és
aproximadament Quina és la probabilitat que la mitjana mostral de les alçades
sigui 6 110 cm?
0.2 
 √
N 3, √ = N(3, 0.02) X ≈ N(115, 25/ 100) = N(115, 2.5)
100
P(X 6 110) = pnorm(110,115,2.5) = 0.023

o bé
 X − 115 110 − 115 
P(X 6 110) = P 6
2.5 2.5
= P(Z 6 −2) = pnorm(-2) = 0.023

23 / 63 24 / 63
Exemple Exemple
Quina és la probabilitat que la mitjana mostral de les alçades L’alçada d’una espècie de matolls té valor mitjà 115 cm, amb
sigui 6 110 cm? una desviació típica de 25. Prenem una m.a.s. de 100 matolls

X ≈ N(115, 25/ 100) = N(115, 2.5) d’aquesta espècie.
P(X 6 110) = Quina és la probabilitat que la mitjana mostral de les alçades
estigui entre 113 cm i 117 cm?

25 / 63 26 / 63

Mitjana mostral sense reposició Mitjana mostral sense reposició


Si n és gran en relació a N, aleshores
Sigui X1 , . . . , Xn una m.a. sense reposició de mida n d’una v.a. r
X d’esperança µX i desviació típica σX . σX N −n
σX = √ ·
n N −1
Si n és petit en relació a la mida N de la població, tot r
funciona (per aproximació) com fins ara N −n
és el factor de població finita: el factor que passava
Si n és gran en relació a N, aleshores N −1
de la desviació típica d’una distribució binomial a la d’una
hipergeomètrica
r
σX N −n
E (X ) = µX , σX = √ ·
n N −1 • Si X ∼ B(n, p), Var (X ) = np(1 − p)
• Si X ∼ H(A, B, n), amb A + B = N i p = A/N,
El T.C.L. ja no val tal qual en aquest darrer cas nAB A+B −n
Var (X ) = 2
·
(A + B) A + B − 1
A N −A N −n N −n
=n· · · = np(1 − p) ·
N N N −1 N −1
27 / 63 28 / 63
Un experiment Proporció mostral
> mean ( tests )
[1] 55.43243 Sigui X una v.a. Bernoulli de paràmetre pX (1 èxit, 0 fracàs).
> set . seed (100) Sigui X1 , . . . , Xn una m.a.s. de mida n de X .
> mitjanes . norep = replicate (10^5 ,
Sigui S = ni=1 Xi el nombre d’èxits observats. És B(n, p).
P
mean ( sample ( tests ,40 , rep = FALSE ) ) )
> mean ( mitjanes . norep ) La proporció mostral és
[1] 55.42909
> sd ( mitjanes . norep ) S
[1] 2.991206 pbX =
> ( sd ( tests ) / sqrt (40) ) *
n
sqrt (( length ( tests ) -40) / ( length ( tests ) -1) ) i és un estimador de pX
[1] 3.009392
Fixau-vos que pbX és un cas particular de X , per tant val tot el
que hem dit fins ara per a mitjanes mostrals

29 / 63 30 / 63

Proporció mostral Proporció mostral

Teorema pX ) = pX : pbX serveix per estimar pX :


• E (b
Si X és una v.a. de Bernoulli amb probabilitat d’èxit Si repetíssim moltes vegades el procés de prendre una
(proporció o probabilitat poblacional) pX m.a.s. de mida n d’una v.a. de Bernoulli X i calcular-ne la
• E (b
pX ) = pX proporció mostral d’èxits, molt probablement la mitjana
r d’aquestes proporcions mostrals s’acostaria molt a pX
pX (1 − pX )
• Si la m.a. és simple, σ(b
pX ) = p
n • σ(bpX ) = pX (1 − pX )/n: la variabilitat dels resultats de
• Si la mostra és sense reposició i n és relativament gran pbX decreix amb n i tendeix a 0 quan n → ∞
per comparació amb la mida de la població N p
• (1 − pX )/n és l’error estàndard de pbX . L’estimam
pX p
amb pbX (1 − pbX )/n.
r r
pX (1 − pX ) N −n
σ(bpX ) = ·
n N −1

31 / 63 32 / 63
Proporció mostral Un experiment
Pel T.C.L.: > aprovs = rep (0 , length ( tests ) )
> aprovs [ which ( tests >=50) ]=1
«Teorema» > prop . table ( table ( aprovs ) )
Si n és gran (n > 30 o 40) i la mostra és aleatòria simple, aprovs
r ! 0 1
pX (1 − pX ) 0.4054054 0.5945946
pbX ≈ N pX , > p _ X = prop . table ( table ( aprovs ) ) [2]
n > set . seed (100)
> props . mostrals = replicate (10^5 ,
i per tant mean ( sample ( aprovs ,40 , rep = TRUE ) ) )
pb − pX > mean ( props . mostrals )
qX ≈ N(0, 1) [1] 0.5944708
pX (1−pX )
n > sd ( props . mostrals )
[1] 0.07769086
> sqrt ( p _ X * (1 - p _ X ) / 40)
[1] 0.07762922

33 / 63 34 / 63

Teorema Central del Límit Exemple


En una mostra més o menys aleatòria de 60 estudiants de la
Histograma de la mostra de proporcions
UIB del curs 2013-14, 37 varen ser dones. Estimau la fracció
25000

de dones entre els estudiants de la UIB


20000
15000
Freqüències

10000
5000
0

0.3 0.4 0.5 0.6 0.7 0.8 0.9

Proporcions mostrals

35 / 63 36 / 63
Exemple Variància mostral
Un 59.1% dels estudiants de la UIB són dones. Si prenem una
Sigui X1 , . . . , Xn una m.a.s. de mida n d’una v.a. X
m.a.s. de 60 estudiants, quina és la probabilitat que la
d’esperança µX i desviació típica σX
proporció mostral de dones sigui superior al 61.5%?
La variància mostral és
Pn
i=1 (Xi− X )2
SeX2 =
n−1
La desviació típica mostral és
q
SeX = + SeX2

A més, escriurem
Pn
(Xi − X )2 (n − 1) e2
q
2
SX = i=1 = SX i SX = + SX2
n n
37 / 63 38 / 63

Variància mostral: Propietats La distribució χ2n


La distribució χ2n (χ: en català, khi; en castellà, ji; en anglès,
Pn Pn
− X )2 Xi2

i=1 (Xi 2
• SX2 = = i=1
−X chi), on n són els graus de llibertat:
n n
 Pn • És la de
Xi2

n 2
X = Z12 + Z22 + · · · + Zn2
• SeX2 = i=1
−X
n−1 n
on Z1 , Z2 , . . . , Zn son v.a. independents N(0, 1)

Teorema • Amb R és chisq

Si la v.a. X és normal, aleshores E (SeX2 ) = σX2 i la v.a.


• Si Xχ2n és una v.a. amb distribució χ2n ,
(n − 1)SeX2 E (Xχ2n ) = n, Var (Xχ2n ) = 2n
σX2

• χ2n s’aproxima a una distribució normal N(n, 2n) per a n
té distribució χ2n−1 gran (n > 40 o 50)

39 / 63 40 / 63
La distribució χ2n Els graus de llibertat
Sigui y0 > 0. Si volem trobar x1 , . . . , xn tals que
Xn
Algunes khi quadrat Khi quadrat vs Normal
(xi − x)2 = y0 ,
Khi quadrat amb n=300
0.4

n=1
Normal
i=1

0.015
n=2
n=3
n=4
n=5
n=10 podem triar x1 , . . . , xn−1 qualssevol i llavors xn queda fixat (per
0.3

n=20

una equació quadràtica):

0.010
n
0.2

(xi − x)2 = y0
P
i=1

0.005
n
0.1

xi2 − (2n − 1)x 2 = y0


P
i=1
n n 2
0.0

0.000
P
n2 xi2 − (2n − 1) xi = n2 y0
P
0 5 10 15 20 25 30 150 200 250 300 350 400 450

i=1 i=1
n−1  n−1
P 2
2
P 2 2 2
n xi + n · xn − (2n − 1) xi
i=1 i=1
 n−1
P 
−2(2n − 1) xi xn − (2n − 1)xn2 = n2 y0
i=1
41 / 63 42 / 63

Els graus de llibertat Mitjana mostral, un altre cop


Sigui y0 > 0. Si volem trobar x1 , . . . , xn tals que
Sigui X ∼ N(µX , σX )
n
X Sigui X1 , . . . , Xn una m.a.s. de X , amb mitjana X i desviació
(xi − x)2 = y0 ,
i=1
típica mostral SeX

podem triar x1 , . . . , xn−1 qualssevol i llavors xn queda fixat (per Teorema


una equació quadràtica): En aquestes condicions, la v.a.

És a dir, el nombre de graus de llibertat amb què podem triar X − µX


n T = √
x1 , . . . , xn a fi que (xi − x)2 = y0 és n − 1
P
SeX / n
i=1
segueix una distribució t de Student amb n − 1 graus de
llibertat, tn−1

SeX / n: l’error√típic, o estàndard, de la mostra: estima l’error
estàndard σX / n de X
42 / 63 43 / 63
Distribució t de Student Distribució t de Student
La distribució t de Student amb ν graus de llibertat, tν : Algunes t de Student t vs Normal estàndard

0.4

0.4
Normal estàndard Normal estàndard
t amb n=2
t amb n=50
t amb n=3

• Amb R és t
t amb n=4
t amb n=5
t amb n=10

0.3

0.3
• Si Tν té distribució tν , E (Tν ) = 0 si ν > 1 i
ν
si ν > 2

0.2

0.2
Var (Tν ) =
ν−2

0.1

0.1
• La funció de densitat de Tν és simètrica respecte de 0
(com la d’una N(0, 1)):

0.0

0.0
−4 −2 0 2 4 −4 −2 0 2 4

P(Tν 6 −x) = P(Tν > x) = 1 − P(Tν 6 x)

• Si ν és gran, la seva distribució és aproximadament la de


N(0, 1) (però amb més variància: un poc més aplatada)

44 / 63 45 / 63

Distribució t de Student Desviació típica vs error típic


Indicarem amb tν,q el q-quantil d’una v.a. Tν que segueix una No confongueu:
distribució tν : • Desviació típica (estàndard) de una v.a.: El paràmetre
P(Tν 6 tν,q ) = q poblacional, normalment desconegut
Per simetria, tν,q = −tν,1−q • Desviació típica (estàndard) (mostral o no) d’una mostra:
L’estadístic que calculam sobre la mostra i que quantifica
la variabilitat de la mostra
• Error típic (estàndard) d’un estimador: La desviació típica
de la v.a. que defineix l’estimador, normalment
desconeguda
• Error típic (estàndard) d’una mostra: Estimació de l’error
típic de la mitjana mostral (o la proporció mostral) a
partir d’una mostra; servirà per calcular intervals de√
confiança. És la desviació típica mostral partit per n.

46 / 63 47 / 63
Estimadors no esbiaixats Estimadors no esbiaixats
Quan un estimador és bo? Exemples
Un estimador puntual θb d’un paràmetre poblacional θ és no • E (X ) = µX : X és estimador no esbiaixat de µX
esbiaixat quan el seu valor esperat és precisament el valor del
pX ) = pX : pbX és estimador no esbiaixat de pX
• E (b
paràmetre:
E (θ)
b =θ • E (SeX2 ) = σX2 si X és normal: SeX2 és estimador no esbiaixat
Es diu aleshores que l’estimació puntual és no esbiaixada. de σX2 quan X és normal
b −θ
El biaix de θb és E (θ) n−1 2
• E (SX2 ) = σX si X és normal; per tant SX2 és
n
esbiaixat, amb biaix
n−1 2 σ2
E (SX2 ) − σX2 = σX − σX2 = − X −→ 0
n n n→∞
• E (SeX ), E (SX ) 6= σX ni tan sols quan X és normal: SeX i
SX són estimadors esbiaixats de σX
48 / 63 49 / 63

Estimadors eficients Estimadors eficients


Quan un estimador és millor? Exemple: Sigui X una v.a. normal N(µX , σX )
Quan és no esbiaixat i té poca variabilitat (així és més Considerem la mediana Me = Q0.5 d’una m.a.s. de X com a
probable que aplicat a una m.a.s. doni prop del valor esperat) estimador puntual de µX = MedianaX
Error estàndard d’un estimador θ:
b la seva desviació típica
q E (Me) = µX ,
σθb = Var (θ)b π σX2 σX2
Var (Me) ≈ · ≈ 1.57 · = 1.57Var (X )
2 n n
Donats dos estimadors θb1 , θb2 no esbiaixats (o amb biaix −→0) Per tant, si X és normal, Me és un estimador no esbiaixat de
n→∞ µX , però menys eficient que X
del mateix paràmetre θ, direm que
θb1 és més eficient que θb2
quan
σθb1 < σθb2 , és a dir, quan Var (θb1 ) < Var (θb2 )
50 / 63 51 / 63
Estimadors eficients Estimadors eficients

• Si la població és normal, X és l’estimador no esbiaixat


Hem dit que si la població és normal, SeX2 és l’estimador no
més eficient de la mitjana poblacional µX esbiaixat més eficient de la variància poblacional
L’estimador «variància»
• Si la població és Bernoulli, pbX és l’estimador no esbiaixat
més eficient de la proporció poblacional pX (n − 1) e2
SX2 = SX
n
• Si la població és normal, SeX2 és l’estimador no esbiaixat
més eficient de la variància poblacional σX2 és més eficient, però té biaix −→0
n→∞

Si n és petit (6 30 o 40), és millor fer servir la variància


mostral SeX2 per estimar la variància, ja que el biaix influeix,
però si n és gran, el biaix ja no és tan important i es pot fer
servir SX2

52 / 63 53 / 63

Exemple: Estimació de poblacions Exemple: Estimació de poblacions


Exemple: Assegut en un bar del Passeig Marítim vaig apuntar
les llicències dels 40 primers taxis que passaren: Tenim una població numerada 1, 2, . . . , N
> taxis = c (1217 ,600 ,883 ,1026 ,150 ,715 ,297 ,137 , En prenem una m.a.s. x1 , . . . , xn ; sigui m = max(x1 , . . . , xn )
508 ,134 ,38 ,961 ,538 ,1154 ,314 ,1121 ,823 ,158 ,
940 ,99 ,977 ,286 ,1006 ,1207 ,264 ,1183 ,1120 , Teorema
498 ,606 ,566 ,1239 ,860 ,114 , 701 ,381 ,836 ,561 ,
494 ,858 ,187) L’estimador no esbiaixat més eficient de N és
> sort ( taxis )
m−n
[1] 38 99 114 134 137 150 158 Nb = m +
[8] 187 264 286 297 314 381 494 n
[15] 498 508 538 561 566 600 606
[22] 701 715 823 836 858 860 883
[29] 940 961 977 1006 1026 1120 1121 Un problema de rellevància històrica:
[36] 1154 1183 1207 1217 1239 http://en.wikipedia.org/wiki/German_tank_problem

Quants taxis hi ha a Palma?

54 / 63 55 / 63
Exemple: Estimació de poblacions Estimadors màxim versemblants
Exemple: Assegut en un bar del Passeig Marítim vaig apuntar
Un estimador d’un paràmetre és màxim versemblant (MV)
les llicències dels 40 primers taxis que passaren:
quan, per a cada m.a.s., la probabilitat d’observar-la és
> taxis = c (1217 ,600 ,883 ,1026 ,150 ,715 ,297 ,137 , màxima quan el paràmetre pren el valor de l’estimador aplicat
508 ,134 ,38 ,961 ,538 ,1154 ,314 ,1121 ,823 ,158 ,
940 ,99 ,977 ,286 ,1006 ,1207 ,264 ,1183 ,1120 ,
a la mostra
498 ,606 ,566 ,1239 ,860 ,114 , 701 ,381 ,836 ,561 , Exemple: Suposem que tenim una v.a. Bernoulli X de
494 ,858 ,187)
probabilitat d’èxit pX desconeguda
Suposaré que formen una m.a.s. dels taxis de Palma. Donada una m.a.s. x1 , . . . , xn de X , siguin pbx la seva proporció
Aleshores, estimo que el nombre de taxis de Palma era mostral i P(x1 , . . . , xn | p) la probabilitat d’obtenir la mostra
> max ( taxis ) +( max ( taxis ) - length ( taxis ) ) quan la probabilitat poblacional és p
/ length ( taxis )
[1] 1268.975 Teorema
En realitat, n’hi havia 1246 El valor de p per al qual P(x1 , . . . , xn | p) és màxim és pbx
http://www.caib.es/eboibfront/es/2014/10195/551436/
departamento-de-movilidad-seccion-de-transportes-r La proporció mostral pbX és un estimador MV de pX

56 / 63 57 / 63

Alguns estimadors MV Exemple: Marca-recaptura


• pbX és l’estimador MV del paràmetre pX d’una v.a. En una població hi ha N individus, en capturam K , els marcam
Bernoulli i els tornam a amollar. Ara en tornam a capturar n, dels quals
k estan marcats. A partir d’aquestes dades, volem estimar N.
• X és l’estimador MV del paràmetre λ d’una v.a. Poisson
Suposam que N i K no han canviat de la primera a la segona
• X és l’estimador MV del paràmetre µ d’una v.a. normal
captura
• SX2 (no SeX2 ) és l’estimador MV del paràmetre σ 2 d’una
K
v.a. normal X =«Un individu estigui marcat» és Be(p) amb p =
N
• El màxim (no N)
b és l’estimador MV de la N al problema
k
dels taxis x1 , . . . , xn la mostra capturada en segon lloc: pbX =
n

58 / 63 59 / 63
Exemple: Marca-recaptura Exemple: Marca-recaptura
pbX és estimador màxim versemblant de p: Estimam que Suposem que hem marcat 15 peixos del llac, i que en una
captura de 10 peixos, n’hi ha 4 de marcats. Quants peixos
K k n·K estimau que conté el llac?
= ⇒N =
N n k
Per tant, l’estimador 15 · 10
Nb = = 37.5
n·K 4
Nb =
k Per tant, estimam que hi haurà entre 37 i 38 peixos al llac
maximitza la probabilitat de l’observació «k marcats de n
capturats». És l’estimador màxim versemblant de N a partir
de K , k i n.

60 / 63 61 / 63

Exemple: Marca-recaptura Exemple: Marca-recaptura


K N−K
 
k
·
P(k marcats de n capturats) = N
n−k L’estimador
n n·K
> N =15:100 Nb =
k
> p = choose (15 ,4) * choose (N -15 ,6) / choose (N ,10)
> plot (N ,p , type = " h " , xaxp = c (15 ,100 ,17) ) és esbiaixat, amb biaix −→0
n→∞
0.30

L’estimador de Chapman
0.25

(n + 1) · (K + 1)
Nb = −1
0.20

k +1
0.15

és menys esbiaixat per a mostres petites, i no esbiaixat si


p

K + n > N (però no màxim versemblant)


0.10
0.05
0.00

15 25 35 45 55 65 75 85 95 62 / 63 63 / 63
N

You might also like