Professional Documents
Culture Documents
Villo Statisztika
Villo Statisztika
Csiszr Vill
2009. mjus 6.
1. Statisztikai mez
A statisztika egyik ga a ler statisztika. Ekkor a meggyelt adatokat ttekinthet formban brzoljuk, pl.
Msrszt az ada-
tokbl kiszmtunk nhny fontos, jellemz rtket, pl. az tlagot (mintakzepet), tapasztalati szrst,
szlsrtkeket.
A
de meggyelseket vgezve,
a meggyelsekbl szeretnnk r
Becslselmlet:
illetve a becsls hibjt meghatrozni. Minl pontosabb, megbzhatbb becslst keresnk. Pldk:
1. Egy munkltatt egy titkrn ltal gpelt szvegekben elfordul hibk szma rdekli. Pl. a hibk tlagos szma s a hibaszm szrsa. A munkltat
legpelt szvegben megszmolja a hibkat. sszer feltenni, hogy a hibk szma Poisson eloszls,
de az eloszls paramtere
()
-ra,
ebbl
rs mszak alatt egyszer sem szakad el. Ennek rdekben 20 fonalszl minde-
gyikrl feljegyzik, hogy mennyi id mlva szakad el. sszer feltenni, hogy a fonalak lettartama
exponencilis eloszls (rkifj tulajdonsg), de
3. Egy kosaraz 10-szer kosrra dob. Betall
dobsbl:
Ind(p),
ismeretlen.
4. Htftl pntekig naponta megnzzk egy vros ramfogyasztst. Ez feltehetleg normlis eloszls,
de
m,
ismeretlen.
[0, b]
intervallumon, ahol
Hipotzisvizsglat:
ismeretlen.
1.1. Denci.
A -agebra
Az
(, A, P)
hrmast
(esemnyek csaldja),
ahol
P = {P | },
ahol
A
valsznsgi mrtkek.
halmazt
paramtertrnek nevezzk.
Legtbbszr
1.2. Denci.
Egy
neveznk, ahol
a mintatr,
elemei.
Mi (majdnem) mindig olyan mintkkal fogunk foglalkozni, amikor ugyanazt a vletlen jelensget, egymstl
fggetlenl,
n-szer
1.3. Denci.
minta, ha
Xi -k
gyeljk meg.
X fggetlen elem
P szerint
az sszes
minta, ha
Xi -k
az sszes
szerint fggetlenek.
X azonos eloszls
azonos eloszlsak.
n
Y
F1; (xi ),
i=1
ahol
F1;
az
Xi
diszkrt esetben a
1.1. Plda.
szma.
(titkrn) A minta:
paramtertr
= (0, ) R,
30
Y
p1; (xi ) =
i=1
1.4. Denci.
2)
Az mintatren megadott
30
Y
i=1
T : X Rk
1.2. Plda.
1)
Xi
kirva
vltozt
ahol
az
i.
xi
xi !
30
Q
=e
xi !
T = T (X)
valsznsgi
n elem minta):
n
X
1
T (X) = X =
Xi az X minta mintatlaga.
n i=1
n
1X
2
T (X) = SX
=
(Xi X)2 az X minta tapasztalati szrsngyzete.
n i=1
(n)
(n)
(n)
(n)
xi
(n)
ha n pratlan
X
n+1
2
(n)
(n)
5) T (X) =
az X minta tapasztalati medinja.
X n + X n +1
2
2
ha n pros
2
3)
Xi P oisson(),
A valsznsgeket rszletesen
(n)
(n)
Xn
1.5. Denci.
Az (X1 , ..., Xn ) minta tapasztalati eloszlsa az a vletlen diszkrt eloszls, melynek lehetXi rtkek, az rtkekhez tartoz valsznsgek pedig a meggyelt relatv gyakorisgok.
x1 < x2 < < xm a meggyelt (klnbz) rtkeket (m n), ekkor az xj -hez tartoz
sges rtki az
Azaz jellje
valsznsg:
|{i|Xi = xj }|
1X
=
I(Xi = xj ),
n
n i=1
I(Xi = xj ) = 1, ha Xi = xj , s I(Xi = xj ) = 0, ha Xi 6= xj .
X minta tapasztalati eloszlsfggvnye a tapasztalati eloszlshoz
ahol
Az
tartoz eloszlsfggvny:
1X
Fn (x) =
I(Xi < x),
n i=1
x R.
Hogy nz ez ki?
n
n
4
n
3
n
2
n
1
n
0
k
Fn (x) =
b r
r
x X1 ,
ha
Xk
ha
Xn
(n)
< x Xk+1 ,
(n)
(n)
< x.
(n)
Xn
X1 , . . . , X n
(n)
ha
(n)
(n)
X1
(n) X4
X2,3
b
r
Fn
fggetlen, azonos
tapasztalati eloszlsfggvny
eloszlsfgg-
valsznsggel egyenletesen
azaz
P ( lim sup Fn (x) F (x) = 0) = 1.
n xR
A ttel jelentse az, hogy ha elg sok meggyelst vgznk, akkor tetszleges pontossggal visszakapjuk a
x R-re
P ( lim Fn (x) F (x) = 0) = 1,
supxR Fn (x) F (x)
1.1. Feladat.
I(Xi < x)
1/ n.
jt!
2)
20
Y
f1; (xi ) =
i=1
20
Y
exi = 20 e
xi
i=1
3. Xi az i. dobs pontszma.
10
X = {0, 1} , Xi Ind(), = [0, 1],
10
Y
p1; (xi ) =
i=1
10
Y
xi (1 )1xi =
xi
(1 )10
i=1
4. Xi az i. nap fogyasztsa.
X = R5+ , Xi N (1 , 2 ), = R R+ ,
5
Y
f1; (xi ) =
i=1
5
Y
i=1
1
p
e
2
22
(xi 1 )2
22
2
xi
5
Y
f1; (xi ) =
i=1
1.2. Feladat.
punk. Jellje
5
Y
1
1
(1)
I(0 xi ) = 5 I(x1 0
i=1
Vgezzk el
Xi ,
hogy az
(5)
x5 ).
x1
x2
x3
x4
x5
x6
x7
x8
rtk
valsznsg
2
8
3
8
2
8
1
8
mintatlag:
tapasztalati szrsngyzet:
mintaterjedelem:
tapasztalati medin:
19/8 = 2.38
95/64 = 1.48
4
2
b
b
b
r
(8)
x1,2
b
r
(8)
x3,4,5
(8)
x6,7
(8)
x8
1.3. Feladat.
Szmoljuk ki
Mo:
2. Elgsgessg
az igazi paramter. A P (X = x)
-tl (bizonyos -kra nagy a valsznsge, hogy ezt a mintt kapjuk, msokra kisebb). A
T (X) statisztika is hordoz informcit, hiszen a P (T (X) = t) valsznsg is fgg -tl. Az eredeti minta
Az
valsznsg fgg
ltalban tbb informcit tartalmaz a paramterrl, mint a belle kiszmolt statisztika. Pl. ha diszkrt
T (X)-ben
statisztika.
2.1. Denci.
hogy a
nem
2.1. Plda.
Legyen
Xi Ind(p),
ahol
0 p 1
ismeretlen paramter.
i Xi
Pl.
elgsges statisztika
p-re,
dobsokrl egyesvel feljegyezni, hogy melyik volt hatos, melyik nem, hanem elg feljegyezni, hogy sszesen
n
X
0
ha
xi 6= t
i=1
=nt
=t
n
z }|
{
z}|{
Q
X
P
P
n
n
xi
1xi
xi
n xi
X
Pp (X = x|
Xi = t) =
p
(1
p)
p
(1
p)
1
i=1
=
= n
ha
xi = t
n t
nt
i=1
n t
nt
t p (1 p)
t
i=1
p
(1
p)
|
{zP
}
binom;
p-tl.
Legyen
Ind
g (T (x)).
Bizonyts.
:
T (X)
h(x) g (t)
X
=
P (X = y)
P (X = x, T (X) = t)
=
P (T (X) = t)
P (X = x|T (X) = t) =
T (X)
y:T (y)=t
elgsges statisztika.
h(x) g (t)
X
h(y) g (T (y))
y:T (y)=t
h(x)
X
,
h(y)
ha
T (x) = t,
y:T (y)=t
egybknt pedig a feltteles valsznsg nulla.
A ttelnek az a jelentsge, hogy mdszert ad arra, hogyan lehet elgsges statisztikt tallni.
2.2. Plda.
Legyen
X1 , ..., Xn P oisson(),
pn; (x) = P (X = x) =
n
Y
-ra!
i=1
P
xi
xi
1
= en Qn
= Qn
e|n {z
x}i ,
xi !
xi !
X
i=1 xi !
| i=1
{z }
g (
xi )
h(x)
| {z }
:=T (x)
t-re 0
statisztikra a
{T (X) = t}
Neyman faktorizcis
ttele viszont egy olyan lltst fogalmaz meg, ami abszolt folytonos esetben is rtelmes, ha a valsznsg
helyett srsgfggvnyt runk.
2.2. Denci.
T (X)
Legyen
statisztika
elgsges
fn; (x). A
fn; (x) = h(x) g (T (x))
alak faktorizcija.
2.3. Plda.
Legyen
Xi E(0, b), b
fn;b (x) =
n
Y
f1;b (xi ) =
i=1
n
Y
1
i=1
1
(n)
I(0 xi b) = I(x1 0) n I(x(n)
n b),
|
{z
} |b
{z
}
h(x)
(n)
gb (xn )
teht
(n)
Xn
elgsges statisztika.
Mj.: Nyilvn, ha
olyan
minimlis elgsges
statisztikt keresnk.
2.1. Feladat.
1)
2)
3)
4)
5)
Geo(p)
Bin(m, p) m ismert
Exp()
N (m, )
P
E(a, a)
1)
Xi elgsges:
Xi
Xi
Xi
Xi
Xi
Mo:
pn;p (x) =
n
Y
(1 p)xi 1 p = (1 p)
xi n n
p .
i=1
2)
Xi
elgsges:
pn;p (x) =
n
Y
m
xi
i=1
3)
Xi
xi
mxi
p (1 p)
=p
xi
P
mn xi
(1 p)
n
Y
m
xi
i=1
elgsges:
fn; (x) =
n
Y
exi = n e
xi
i=1
4) Ha
(m, )
ismeretlen, akkor
fn;m, (x) =
n
Y
i=1
1
2 2
P
P
( Xi , Xi2 )
(xi m)2
2 2
elgsges:
n
1
2 2
e 22
(xi m)2
=
Ha
ismert, akkor
Xi
5)
n
1
2 2
e 22 (
x2i 2m
xi +nm2 )
elgsges:
fn;m (x) =
P
m ismert, akkor (Xi m)2
max |Xi | elgsges:
Ha
1
2 2
n
e 22
x2i
e 22 (nm
2m
xi )
elgsges.
n
Y
1
1
1
(n)
I(a < x < +a) =
I(|xi | < a i = 1, ..., n) =
I(|x|n < a).
n
n
2a
(2a)
(2a)
i=1
fn;a (x) =
3. Becslsek s jsguk
Legyen
a paramter
remlhetjk, hogy a pontos rtket eltalljuk, de azt igen, hogy jl meg tudjuk kzelteni.
3.1. Denci.
Azrt
mint
1)
2)
3)
()
mennyisg
3.2. Denci.
T (X)
becsls
torztatlan ()-ra, ha
E (T (X)) = () .
T (X)
ltalban a
3.1. Plda.
becsls
Legyen
X1 , ..., Xn F
() = E (Xi ).
n
E (X) = E (
Ekkor
1X
1X
Xi ) =
E (Xi ) = ().
n i=1
n i=1 | {z }
()
3.2. Plda.
nem
1
1
p -re! Belthat, hogy X
torztatlan, st, 1/p-t nem lehet torztatlanul becslni. Beltjuk ugyanis, hogy (p)-t akkor s csak
akkor lehet
(p) =
Legyen ugyanis
x{0,1}n
n-edfok
1) I(Xk = 1) (k n).
ez pedig legfeljebb
3.3. Denci.
polinomja
Tn (X1 , . . . , Xn )
p-nek.
Msrszt
pk
E (Tn (X1 , . . . , Xn )) ()
()-ra,
I(X1 = 1) I(X2 =
ha
-ra
(n ).
A gyakorlatban, ha elg nagy a minta, akkor ltalban egy aszimptotikusan torztatlan becsls is megfelel.
3.4. Denci.
ha
hatsosabb.
Mj:
Kt becsls nem biztos, hogy sszehasonlthat hatsossg szempontjbl, hiszen lehet, hogy
bizonyos
msokra viszont
akarhatjuk minimalizlni.
3.1. Ttel.
Ha
T1
T2
is hatsos, akkor
P (T1 = T2 ) = 1
minden
esetn.
Bizonyts.
A torztatlansg miatt
D2 (T2 ) minden -ra. Legyen most
T1 + T2
.
2
E (T ) = (), msrszt T1
T =
Egyrszt
is torztatlan, hiszen
D2 (T1 ) D2 (T ) =
azaz
1
1
1
D2 (T1 ) + D2 (T2 ) + 2cov (T1 , T2 ) = D2 (T1 ) + cov (T1 , T2 ),
4
2
2
tosztva kapjuk, hogy
miatt azonban
a=1
cov (T1 , T2 )
= R (T1 , T2 ),
D (T1 )D (T2 )
T1 = aT2 + b teljesl 1
b = 0 lehet csak.
hatsossga miatt
3.2. Ttel.
Legyen
Bizonyts.
Pn
Pn
i=1 ci
= 1.
Szmtsuk ki a szrsngyzeteket!
D2 (X) =
D2 (Xi )
,
n
X
X
X
D2 (
ci Xi ) =
D2 (ci Xi ) = (
c2i )D2 (Xi ).
X
1
c2i .
n
i=1
A szmtani s ngyzetes kzp kztti egyenltlensgbl
rP
c2i
3.3. Plda.
Legyen
Xi E(0, b),
ci
1
= ,
n
n
E(0, 1)
n tn1 , teht
c2i
n
1
= .
2
n
n
n + 1 (n)
Xn ,
n
b-re:
T2 = 2 X.
(n)
(n)
Xi = bYi , ahol Yi E(0, 1), ekkor Xn = bYn , teht
(n)
(n)
(n)
eloszlssal foglalkozni. Yn
eloszlsfggvnye: P (Yn
< t) = tn , Yn srsgfggvnye:
nyilvn torztatlan, s
elg az
T1 =
T2
azaz
T1
E(Yn(n) ) =
n
n+1
t ntn1 dt = n
1
n
=
.
n+1
n+1
Ebbl
Eb (T1 ) = b.
Db2 (T2 ) = 4
Db2 (Xi )
4 b2
b2
=
=
.
n
n 12
3n
Msrszt
(Yn(n) )
1
2
t nt
n1
dt
Tovbb
(n)
(n)
n
n+1
3.5. Denci.
(n ),
T1
n
=
n+2
2
n
=
n+1
n(n + 1)2 n2 (n + 2)
n
=
=
.
2
(n + 1) (n + 2)
(n + 1)2 (n + 2)
azaz
Db2 (T1 ) =
Kaptuk teht, hogy
2
hatsosabb
Tn (X1 , ..., Xn )
T2 -nl
n+1
n
2
(minden
becslssorozat
Db2 (Xn(n) ) =
b2
.
n(n + 2)
n-re).
konzisztens ()-ra,
azaz
ha
Tn ()
sztochasztikusan
3.4. Plda.
X E (Xi )
sztochasztikusan (ez a
b) Ha
s
D2 (Tn )
0.
2
Cseb
Xi E(0, ),
Tn =
n+1 (n)
n Xn . Ez a fentiek szerint konzisztens becslssorozat, hiszen
D2 (
2
n+1
Xn(n) ) =
0.
n
n(n + 1)
4. Fisher-informci
4.1. Denci.
4.2. Denci.
Az
elem,
Fn;
Fisher-informcija az
eloszlsfggvny minta
In () = E ([
ln Ln (X; )]2 )
Legyenek
likelihood fggvnyt
E (
Ekkor
ln L1 (X1 ; )) = 0.
In () = n I1 ().
Bizonyts.
A felttel miatt
E (
I1 () = D2 (
ln L1 (X1 ; )),
tovbb
n
n
Y
X
ln Ln (X; )) = E (
ln
L1 (Xi ; )) =
E (
ln L1 (Xi ; )) = 0.
i=1
{z
}
i=1 |
0
In () = D2 (
n
n
X
X
ln L1 (Xi ; )) = n I1 ().
ln Ln (X; )) = D2 (
ln L1 (Xi ; )) =
D2 (
{z
}
i=1
i=1 |
I1 ()
Mj: A felttel gyakran teljesl, mivel ez egy bederivlhatsg lruhba bjtatva. Tegyk fel mondjuk,
hogy a minta abszolt folytonos. Tudjuk, hogy
f1; (x) dx = 1
f1; (x) dx = 0.
0=
f1; (x) dx =
+
f1; (x)
f1; (x)
f1; (x) dx =
X
X
p1; (x1 ) =
p1; (x1 ).
x
x
1
4.1. Plda.
Legyen
Xi Ind(p).
Ekkor
amibl
x 1x
ln L1 (x, p) =
.
p
p
1p
Ellenrizzk a
p 1p
ln L1 (Xi , p) =
= 0.
p
p 1p
I1 (p) = Dp2
s
In (p) = n I1 (p) =
4.2. Plda.
Legyen
Xi
1
ln L1 (Xi , p) = Dp2
=
,
p
p(1 p)
p(1 p)
n
.
p(1 p)
Xi N (, 0 ),
ahol
ismert. Ekkor
L1 (x, ) = p
202
(x)2
2
20
Logaritmust vve
ln L1 (x, ) = ln p
202
Ellenrizzk a
(x )2
.
202
2(Xi )
E (
ln L1 (Xi , ) = E
= 0.
202
Ebbl
I1 () =
s
In () =
Mj:
D2
Xi
02
=
D2 (Xi )
1
= 2,
4
0
0
n
.
02
Nzhetnnk azt is, hogy a minta mennyi informcit tartalmaz a paramter valamely
()
foglalkozunk.
Bizonyts nlkl megjegyezzk a kvetkezt. Legyen
b legyen
T = T (X)
IT () IX (),
IT ().
IX ().
Tovb-
elgsges
p
L1 (x, ) folytonosan dierencilhat szerint,
> I1 () > 0, s I1 () folytonos -ban.
szp s j , pl.
ekkor teljesl a
A kvetkez ttel arrl szl, hogy egy torztatlan becsls nem lehet tetszlegesen pontos, a szrsngyzetre adhat egy als korlt, mely a mintban tallhat informci mennyisgtl fgg (azonban ez az
als korlt ltalban nem les).
10
4.2. Ttel. (Cramr-Rao egyenltlensg) Legyen X = (X1 , ..., Xn ) minta, s tegyk fel, hogy tel2
jeslnek a (*) ttel felttelei. Legyen mg T (X) olyan torztatlan becslse ()-nak, melyre D (T ) <
minden
-ra.
ln Ln (X; ) .
0 () = E T (X)
Ekkor
D2 (T )
Bizonyts.
( 0 ())2
In () teljesl minden
-ra.
S -re
D2 (T )
T -tl.
Legyen
ln Ln (X; ),
S =
E (S) = 0
(ez volt a
D2 (S) = In ().
Z
() = E (T ) =
T (x)fn; (x) dx .
0 () =
-ra,
( 0 ())2
In ()
T (x)
mennyisg neve
informcis hatr.
Ha
D2 (T ) =
( 0 ())2
In () teljesl minden
torztatlan becsls
() = ,
1/In ().
4.1. Feladat.
02 /n,
4.2. Feladat.
p(1 p)/n,
Legyen
ugyanakkor
Az informcis hatr
Legyen
informcis hatr
1/In () =
1/In (p) =
ugyanakkor
4.3. Feladat.
Legyen
Xi Exp(), () =
1
-t szeretnnk becslni. Tudjuk, hogy
torztatlan becsls.
Szrsngyzete
D2 (X) =
1
2
1
.
2 n
A Fisher-informci:
E
Ebbl
I1 () = D2
1
ln f1; (Xi ) = E
(ln Xi ) = E
Xi = 0.
Xi
= D2 (Xi ) =
Kaptuk, hogy
hatsos becsls
1
n
, In () =
.
2
2
2
12
1
=
.
n
n 2
2
1/-ra.
11
Most
() = 1/, 0 () = 1/2 .
Az
4.4. Feladat.
Legyen
4.5. Feladat.
Legyen
f1; (x)
Xi Poisson().
Xi E(0, ).
0x
f1; (x) =
ha
egybknt
"
I1 () = E
felhasznlva, hogy
In () = E
ln
hatsos becsls
mellett
"
2 #
2 #
2
1
1
1
ln L1 (X1 ; )
= E
ln
=
= 2,
szerint.
valsznsggel
1 n 2
-ra!
rgztett,
rgztett,
a vltoz
derivlhat. Ugyanakkor
a vltoz
6
f1; (x)
f1; (x)
itt nem
derivlhat
5. Becslsi mdszerek
5.1. Blackwellizls
X, Y diszkrt
valsznsgi vltozk, akkor X
P
Y = y felttel mellett E(X|Y = y) = x x P (X = x|Y = y) = V (y). Az X
az Y vltozra nzve pedig E(X|Y ) = V (Y ). Ez teht nem egy szm, hanem
feltteles vrhat
rtke az
feltteles vrhat
rtke
egy valsznsgi
E(c|Y ) = c
E(X1 + X2 |Y ) = E(X1 |Y ) + E(X2 |Y )
E(cX|Y ) = cE(X|Y )
X1 X2 E(X1 |Y ) E(X2 |Y ).
E (E(X|Y )) = E(V (Y )) =
V (y) P (Y = y) =
XX
x P (X = x|Y = y) P (Y = y) =
X X
X
x P (X = x) = E(X).
x
P (X = x|Y = y) P (Y = y) =
x
5) Kiemels:
P (X=x)
{z
magyarzat:
rgztse mellett
W (Y )
konstans, azaz
Teljes
szrsngyzet
E (X E(X|Y )) |Y
ttele:
D2 (X)
E D2 (X|Y ) + D2 (E(X|Y )),
ahol
D2 (X|Y )
Bizonyts:
D2 (X|Y ) = E X 2 2XE(X|Y ) + E(X|Y )2 |Y = E(X 2 |Y ) E (2XE(X|Y )|Y ) + E E(X|Y )2 |Y =
E(X 2 |Y ) 2E(X|Y )E(X|Y ) + E(X|Y )2 = E(X 2 |Y ) E(X|Y )2 .
12
E D2 (X|Y ) = E E(X 2 |Y ) E E(X|Y )2 = E(X 2 ) E(X)2 E E(X|Y )2 E(X)2 .
|
{z
} |
|
{z
}
{z
}
D 2 (X)
E(X 2 )
5.1. Plda.
Az
{Y = y}
D 2 (E(X|Y ))
D2 (E(X|Y )) D2 (X).
n-szer. Legyen X a hatosok szma, Y a pratlanok
Bin(n y, 1/3). Teht E(X|Y ) = (n Y )/3. Erre
eloszlsa
D2 (X|Y ) = (n Y )
n
n E(Y )
= ,
3
6
1 2
2(n Y )
=
,
3 3
9
E(X) =
n
.
6
E(D2 (X|Y )) =
n
.
9
szma.
Vgl
D2 (X) =
5n
,
36
Bizonyts.
-ra.
Ekkor
U = E(S|T )
diszkrt minta,
Mj:
torztatlan becslse
is torztatlan becsls
()-ra,
()-nak, T
S -nl.
pedig
s hatsosabb
-tl,
n
.
36
D2 (E(X|Y )) =
Azt, hogy
D2 (U ) = D2 (E (S|T )) D2 (S).
E(S|T )
torztatlan becsls hatsossgt javthatjuk azzal, ha egy elgsges statisztikra vett feltteles vrhat
rtkt kpezzk.
blackwellizls.
5.2. Plda.
Legyen
Xi Geo(p), p-t
szeretnnk becslni.
Elgsges statisztika:
T =
n
X
Xi .
Egy
i=1
egyszer torztatlan becsls:
S = I(X1 = 1).
U = E(S|T ) = V (T )
becslst!
n
X
Xi = `) =
i=1
Pn
Pp (X1 = 1 , i=1 Xi = `)
Pn
.
P ( i=1 Xi = `)
A szmll
Pp (X1 = 1,
n
X
X1 = `) = Pp (X1 = 1,
n
X
i=1
n
X
Xi = ` 1) = Pp (X1 = 1)Pp (
Xi = ` 1).
i=2
i=2
Pn
Azaz
Pn
n1
U = V ( i=1 Xi ) = Pn
i=1 Xi 1
i=1
lesz az
ls).
13
5.1. Feladat.
Legyen
Xi P oisson(),
() = e -ra
blackwellizls-
sal!
Els tlet:
eX ,
e = P (X1 = 0),
E (S|T = `) = P (X1 = 0|
S = I(X1 = 0)
azaz
n
X
Pn
i=1
Xi = `) =
Xi Poisson(n)
1
V =
1
n
Pn
i=2
P
Xi
T =
((n1))`
`!
(n)`
`!
e e(n1)
en
i=1
Felhasznltuk, hogy
j lesz. Tovbb
Xi Poisson((n 1)).
Pn
i=1
=
Xi
1
1
n
elgsges.
`
.
X
n
1
= 1
.
n
| {z }
e1
5.2. Feladat.
Legyen
Xi Ind(p),
(p) = p2 -re
blackwellizlssal!
X , de ez nem torztatlan.
Pn
S = I(X1 = 1, X2 = 1), T = i=1 Xi ,
Els tlet:
Ep (S|T = `) = Pp (X1 = 1, X2 = 1 |
n
X
Xi = `) =
i=1
P
azaz a megjavtott becsls
Xi
V =
n2 `2
(1
`2 p
n `
n`
` p (1 p)
pp
p)n
`(` 1)
,
n(n 1)
Xi 1
.
n1
Elmleti eloszls
Jellemz
vrhat rtk
szrsngyzet
terjedelem
eloszlsfggvny
E(X)
D2 (X)
sup{ x | F (x) < 1 } inf{ x | F (x) > 0 }
F (x) = P (X < x)
Tapasztalati
eloszls
P
1
n
1
n
Xi = X
2
i=1 (Xi X)
(n)
(n)
Xn X1
Pn
1
i=1 I(Xi < x)
n
Pi=1
n
= Sn2
= Fn (x)
5.1. Denci.
Legyen
X1 , ..., Xn
minta
F eloszlsbl, . Ekkor a
= max{Ln (X; ) : }.
Ln (X; )
ha
Ln (X; )
megoldst keressk.
5.3. Plda.
P
Qn
P
Xi Exp(). Ln (X; ) = i=1 eXi = n e Xi , ln Ln (X; ) = n ln Xi ,
P
n
1
n
= 1 .
Xi , ez akkor 0, ha = P
, azaz
=
ln Ln (X; ) =
Xi
X
X
5.4. Plda.
+ 1).
Xi
n
(n)
(n)
+ 1). Ln (X; ) = I( Xi + 1, i) 11h = I( Xi1 , Xn
Xn(n) 1, X (n) rtk ML
maximumhelye nem egyrtelm, minden
1
Egyenletes(,
Ennek a fggvnynek a
becsls.
14
5.2. Ttel.
Bizonyts.
ahol
5.3. Ttel.
Legyen
X1 , ..., Xn
minta az
eloszlsbl,
ML becslse pedig
Ekkor
()
szerepet a
ML becsls
()-ra.
Bizonyts.
5.4. Ttel.
konzisztens,
n-re
n (n ) N (m(), ())
torztatlan: m() = 0.
1
2
optimlis: () =
I1 () .
a)
b)
aszimptotikusan
c)
aszimptotikusan
ML becsls ltezik,
eloszlsban
(n ).
5.5. Plda.
Xi E(a,
nb), adjuk meg a paramterek ML becslst!
1
Ln (X; a, b) =
I(a Xi b i), azaz a legkisebb olyan [a, b]
ba
(n)
(n)
mindegyik meggyelst tartalmazza. Azaz a
= X1 , b = Xn .
5.6. Plda.
Ln (X; m, ) =
e
=
n e 22 ,
2
2
i=1
P
n
1
(Xi m)2
ln Ln (X; m, ) = ln
n ln
.
2 2
2
A likelihood egyenlet most kt egyenletbl ll:
P
(Xi m)2
ln
L
(X;
m,
)
=
= 0,
n
m
2P
n 2 (Xi m)2
=0
ln Ln (X; m, ) =
2 3
P
P
(1)
Xi = n m
m
= PnXi = X
P
(Xi m)2
(2)
(Xi m)2 = n 2 2 = P
n
Az eloszls
`.
(elmleti) momentuma:
` = E (Xi` )
3)
E (Xi` )
helybe
1
n
n
X
Xi` -et
i=1
5.7. Plda.
Xi E(a, b).
2
a+b
(b a)2
a+b
2
2
2
1 = Ea,b (Xi ) =
, 2 = Ea,b (Xi ) = Da,b (Xi ) + Ea,b (Xi ) =
+
2
12
2
Legyen
15
(b a)2
= 2 21
12
p
12(2 21 )
p
b = 1 + p3(2 21 )
a = 1 3(2 21 )
q
q
P 2
P 2
2
2
Xi X ) = X 3Sn , b = X + 3( n1
Xi X )X + 3Sn .
a
= X 3( n1
5.8. Plda.
Legyen
ba =
Xi E(a, a).
1 = Ea (Xi ) = 0
a2
2 = Ea (Xi2 ) =
3
32
q
P
a
= 3 n1 Xi2 .
a=
rtkkel becsltk meg. A pontbecsls bizonytalansgt a becsls szrsval fejezhetjk ki. Ha pldul
a becslsrl belthat, hogy aszimptotikusan normlis eloszls, akkor az igazi paramter kb.
valsznsggel a pontbecsls krli
2szrs
95%
lansgot kifejezhetjk gy is, hogy a paramtert nem egy rtkkel, hanem egy intervallummal becsljk.
5.2. Denci.
Legyen X = (X1 , ..., Xn ) minta F eloszlsbl, ahol vals paramter. Azt mondjuk,
(T1 (X), T2 (X)) intervallum legalbb 1 megbzhatsgi szint kondencia-intervallum -ra (rvKI(1 ), ha
P (T1 (X) < < T2 (X)) 1 .
hogy a
iden
inf { P ( (T1 , T2 )) } .
5.5. Ttel.
Ha
(T1 , T2 )
KI(1
) -ra,
akkor
(S1 , S2 )
S1 = inf { () | (T1 , T2 ) }
KI(1
) ()-ra,
ahol
S2 = sup { () | (T1 , T2 ) } .
Az egyik legfontosabb (s legszebb) eset a normlis eloszls vrhat rtkre KI konstrulsa, ismert
vagy ismeretlen szrs mellett. Nzzk meg ezeket!
5.9. Plda.
Legyen
Xi N (, ),
ahol
az az rtk, melyre
X N (, n ), azaz n
N (0, 1). Ezrt
X
< u = 1 ,
P n
2
ahol
ismert,
ismeretlen. Adjunk
(u ) = 1 ,
6
1
u 2
u 2
u
u
u
n
X < u 2 X < 2 X 2 < < X + 2 .
n
n
n
u
T1 = X 2 ,
n
u
T2 = X + 2 .
n
16
Ha a
eloszlst, a
szrs nem ismert, akkor nehezebb dolgunk van. A megoldshoz meg kell ismernnk kt j
2 -eloszlst
5.3. Denci.
s a
Legyenek
t-eloszlst.
Xi N (0, 1) fggetlenek, s Y =
Y 2n ,
akkor
E(Y ) = n
n
X
Xi2 .
D2 (Y ) = 2n.
Az
i=1
2n . Tovbb
n szabadsgfok
eloszlst
n 3,
n = 1-re
a srsgfggvny
X
X N (0, 1), Y n fggetlenek. Legyen Z = n . Ekkor a Z valsznsgi
Y
vltoz eloszlst n szabadsgfok t eloszlsnak, vagy n szabadsgfok Student eloszlsnak nevezzk, jells:
Z tn .
5.4. Denci.
tn
Legyen
eloszls srsgfggvnye is kiszmthat, de pontos alakjra nem lesz szksgnk. Knnyen ltszik,
n
n2
esetn a standard normlishoz tart, de vastagabb a farka (srsgfggvnye
Megmutathat, hogy
D2 (Z) =
nagy
6
vsz
tn ()
Xi N (, ),
Legyen
Xi N (, ).
Yi = (Xi )/ .
Ekkor
Ekkor
Sn2
fggetlenek, s
n
X
n Sn2
=
(Yi Y )2 .
2
i=1
n Sn2
2n1 .
2
Mivel az
(Yi Y )
Legyen Sn
1
n1
P
(Xi X)2
X
n
N(0, 1)
X
tn1 .
n
= n1
Sn
n 1 Sn
n1
X
n
< tn1 ( ) = 1 ,
Sn
2
ebbl a KI
T1 = X
Legyen
Xi Ind(p).
Azaz
5.11. Plda.
Adjunk
Sn tn1 ( 2 )
Adjunk
p-re
j becsls
T2 = X +
hozzvetleges (aszimptotikus)
p-re,
X p
n p
N(0, 1) P
p(1 p)
Sn tn1 ( 2 )
.
n
q
p(1p)
X N p,
,
n
p(1 p)
17
ha
KI(1 )-t!
n
elg nagy.
!
X p < u 2
1 .
p-re
X -et
runk, s a
helybe
X p < u 2
X(1 X)
egyenltlensget rendezzk t.
5.3. Feladat.
Legyen
5.4. Feladat.
Xi Exp().
Adjunk hozzvetleges
adatokat kaptuk:
10.10 8.94
9.61 10.00
10.32 10.26 10.32 10.74
10.42 10.33
9.98 10.23
10.68 9.25
9.88 9.89
Nz-
megvizsglunk, s ha legfeljebb 3 selejtes van kztk, akkor a felttelezst elfogadjuk. Ellenkez esetben a
felttelezst elvetjk. Krds, hogy j-e ez az eljrs?
Mivel dntsnk egy vletlenszeren vlasztott mintra pl, teljes bizonyossggal nem tudjuk eldnteni, hogy a felttelezsnk helyes-e. Ktfle hibt kvethetnk el:
Ha igaz a felttelezs, mgis elutastjuk, akkor
a selejtarnyt.
p 0.05.
Pp (elsfaj
hiba)
= Pp ( 4
selejt)
25
X
25
k=4
p = 0.05,
= sup Pp ( 4
selejt)
pk (1 p)25k .
= P0.05 ( 4
selejt)
= 0.034.
p0.05
Most tegyk fel, hogy a felttelezs hamis, azaz
Pp ( 3
selejt)
p > 0.05.
3
X
25
k=0
pldul ha a selejtarny
p = 0.1,
akkor
0.763
pk (1 p)25k ,
18
6.1. Denci.
(, A, P)
Legyen
P = {P : },
ahol
paramtertr.
Hipotzisek:
H0 : 0
H1 : 1 ,
= 0 1 a paramtertr
nullhipotzis:
ellenhipotzis:
ahol
diszjunkt felbontsa (0
1 = ).
Minta:
X = (X1 , ..., Xn )
mintatr.
Statisztikai prba:
elfogadsi tartomny:
Xe
Xk ,
X = Xe Xk a mintatr diszjunkt felbontsa (Xe Xk = ).
X Xe , akkor H0 -t elfogadjuk, ha X Xk , akkor H0 -t elutastjuk.
kritikus (elutastsi) tartomny:
ahol
Ha
Az bevezet pldban = [0, 1], 0 = [0, 0.05], 1 = (0.05, 1]. A minta: X = (X1 , . . . , X25 ), ahol
Xi = 1, ha az i-edik kivlasztott termk selejtes, Xi = 0, ha az i-edik kivlasztott termk hibtlan. Azaz
X = {0, 1}25 . A prbt meghatroz tartomnyok:
Xe = {x X :
25
X
xi 3},
Xk = {x X :
i=1
25
X
xi 4}.
i=1
Nagyon fontos, hogy a kt hipotzis szerepe ltalban nem egyenrang. Az alapfeltevst csak nagyon
indokolt esetben szeretnnk elutastani, ezrt az elsfaj hiba slyosabbnak szmt, mint a msodfaj. Az
elsfaj hiba maximlis valsznsgt szoks megadni, emellett termszetesen a msodfaj hiba eslynek
minimalizsra treksznk. Ebbl kifolylag a dntsek rtelmezse is klnbz:
H0 -t
H0 -t
elfogadjuk: nem jelenti azt, hogy igaz, csak azt, hogy nincs okunk elutastani.
elutastjuk: komoly bizonytkot talltunk arra, hogy
H0
nem igaz.
Pldul egy j gygyszer vizsglatnl a gygyszer hatsossgra keresnk bizonytkot, ezrt a hipotzisek:
H0 :
H1 :
Folytassuk a dencikat!
6.2. Denci.
Elsfaj hiba:
H0
P (X Xk ) 0 .
A prba terjedelme:
= sup P (X Xk ).
0
Msodfaj hiba:
H0
Ennek valsznsge:
P (X Xe ) 1 .
A prba
erfggvnye:
() = 1 P (X Xe ) = P (X Xk ) 1 .
Mskpp
(1 )
a prba ereje a
H1 : = 1
ellenhipotzissel szemben.
n -t
rhatunk.
6.1. Plda.
19
0.75
1+3t .
(t)
6
1
2
1
4
-t
kis t-re kicsi
a prba ereje
Mikor j a prba?
1) Torztatlan:
() 1 .
0
0
Az (Xe , Xk ) prba egyenletesen ersebb, mint a (Xe , Xk ) prba, ha
() = P (X Xk ) 0 () = P (X Xk0 ) 1 .
n
n
Az (Xe , Xk ) legfeljebb terjedelm konzisztens prbasorozat, ha
(terjedelem) n
n s
n
n () 1 1 .
2) Ers:
3) Konzisztens:
6.3. Denci.
(Xe , Xk )
6.4. Denci.
Ha
x X -et
akkor
(x)
valsznsggel utastjuk el
(x)
: X [0, 1]
: X {0, 1}
H0 -t.
egy fggvny.
Ha
Ekkor:
valsznsggel utastjuk el
H0 -t.
P (H0 -t
elutastjuk)
(x)P (X = x) = E ((X)).
x
gy
= sup0 E ((X)),
() = E ((X)) ( 1 ).
egy
1) Minden
2) A
H1 kt egyszer
Ln (0; x)
likelihood-fggvnye Ln (1; x),
n elem minta.
0<1
esetn ltezik
hipotzis:
Bizonyts.
Y =
Ln (1,x)
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)
(x) =
prba terjedelme
terjedelm prba
hogy a
1) Legyen
pontosan
ha
= c . Ekkor
<c
Ln (1;X)
Ln (0;X) . Ekkor a prba terjedelme
= P0 (Y > c) + P0 (Y = c) = 1 P0 (Y c) + P0 (Y = c),
20
>c
azaz
c = c0 ,
2) Legyen
P0 (Y c0 ) (1 )
P0 (Y = c0 )
(0 < 1).
A feltevs szerint
E0 (0 (X)) = E0 ((X)).
Azt
Rn
Ugyanis, ha fn;1 (x) c fn;0 (x) = 0, akkor az integrandus nulla. Ha fn;1 (x) c fn;0 (x) > 0, akkor
(x) = 1, viszont 0 (x) 1, gy (x) 0 (x) 0, teht az integrandus 0. Ha fn;1 (x) c fn;0 (x) < 0,
0
akkor (x) = 0, gy (x) (x) 0, teht az integrandus megint 0. Az (1) integrlt sztbontva,
Z
Z
Z
Z
0 fn;1 0 fn;1 c fn;0 +c 0 fn;0 = E1 ((X))E1 (0 (X))cE0 ((X))+cE0 (0 (X)).
6.2. Plda.
n 1 cn ,
ahol
Ennek inkbb
H1 : P (fej) = 16 . A mintatr: X =
{F F, F I, IF, II}, s a rvidsg kedvrt jellje a likelihoodokat L1 s L0 . A likelihoodok, illetve likelihoodEgy rmvel ktszer dobunk.
H0 : P (fej) =
1
2,
FF
FI
IF
II
1
36
1
4
1
9
5
36
1
4
5
9
5
36
1
4
5
9
25
36
1
4
25
9
hnyadosok tblzata:
L1
L0
L1
L0
Legyen elszr
L1
ha
L0
L1
ha
L0
L1
ha
L0
elfogadjuk.
1
viszont
9
a prba ereje?
= P1
L1
L1
25
10
26
> c + P1
=c =
+ 0.1
=
= 0.72.
L0
L0
36
36
36
21
6.3. Plda.
Egy urnban
db golybl
= 0.2
az
piros,
7k
zld.
H0 : k = 3, H1 : k = 4. Hrom golyt
= {0, 1, 2, 3}). Adjuk meg
3
x
L0 (x) =
4
3x
7
3
4
x
L1 (x) =
3
3x
7
3
.
Ezrt a tblzat:
L1
L0
L1
L0
1
35
4
35
1
4
12
35
18
35
2
3
18
35
12
35
3
2
4
35
1
35
3
1
12
2 . Tovbb a 0.2 = 35 + 35 egyenletbl = 0.5. Teht
ha legfeljebb egy piros golyt hzunk, akkor elfogadjuk a nullhipotzist, ha hrom piros golyt hzunk,
Mivel
1/2
1/2
valsznsggel
1 = P1 (H0 -t
elfogadjuk)
12 1 18
22
1
+
+
=
.
35 35 2 35
35
6.4. Plda.
L0 (x) =
1 1x
e 2 ,
2
L1 (x) =
1 1x
e 3 ,
3
H0 : =
1
2,
H1 : =
L1 (x)
2 x x
2 x
= e23 = e6 .
L0 (x)
3
3
Mivel a minta folytonos eloszls, vletlentsre nem lesz szksg. Kell teht:
1
= P0
8
2 X
e6 >c
3
3
3c
3c
3c
2
= P0 X > 6 ln
= 1 F0 6 ln
= e3 ln 2 =
.
2
2
3c
4
3 . Megkaptuk teht c-t, de igazbl nem ez a fontos, hanem az, hogy mikor utastjuk el
a nullhipotzist. A szmts mskpp:
Ebbl pedig
c=
1
= = P0
8
amibl
d = 6 ln 2 = 4.16.
d
2 X
e 6 > c = P0 (X > d) = 1 F0 (d) = e 2 ,
3
4.16
v.
0
minden H1
: = 1 (<
6.1. Feladat.
Adjuk meg az
= 0.05
6.2. Feladat.
Legyen
meg az
= 0.05
H0 : = 2 , H1 : = 1 .
Adjuk
22
u-prba.
t-prba.
F -prba.
A prbk ezen bell mg klnbzhetnek aszerint, hogy egymintsak vagy ktmintsak, illetve az ellenhipotzis jellege szerint (egyoldali vagy ktoldali ellenhipotzis). Ezek a prbk egyenletesen legersebbek
a legfeljebb ekkora terjedelm torztatlan prbk kztt.
Egymints
Legyen
X1 , ..., Xn N(m, )
ahol
ismert,
u-prba
ismeretlen.
b)
H0 : m m0
H1 : m > m0
A hipotzisek:
H0 : m m0
H1 : m < m0
(2)
(3)
a)
H 0 : m = m0
H1 : m 6= m0
c)
A prbastatisztika:
u=
Ezrt ha a kvnt terjedelem
ahol az
X m0 H0
n N (0, 1).
(u ) = 1 ,
ezt a
(x)
n (m) :=
mm0
n jellst.
X m0
X m0
n (m) = Pm (|u| > u 2 ) = Pm
n > u 2 = 1 Pm u 2 <
n < u 2 =
X m
X m
m m0
1Pm u 2 <
n+
n < u 2 = 1Pm u 2 n (m) <
n < u 2 n (m) =
1)
2)
3)
4)
Xm
n
hogy
7.1. Plda.
Legyen
0. = 0, 1
Egymints
u-prbt
H0 : m = 0, H1 : m 6=
0.95 = 1
A prbastatisztika:
Hipotziseink:
u=
0,10
1
16 = 0.4
.
::
tbl.
= (u 2 ) u 2 = 1.65.
2
Mivel
|0.4| 1.65,
u 2 = 0.4 (u 2 ) = 0.66 = 1
23
H0 -t.
elfogadjuk H0 -t!
elfogadjuk
= 0.34
= 0.68.
::::::::
2
2
Ktmints
Legyenek
m1 , m2
X1 , . . . , Xn1 N (m1 , 1 )
u-prba
Y1 , . . . , Yn2 N (m2 , 2 )
1 , 2
ismert,
ismeretlenek.
A hipotzisek:
H0 : m1 = m2
H1 : m1 6= m2
a)
b)
H0 : m1 m2
H1 : m1 > m2
c)
H0 : m1 m2
H1 : m1 < m2
(4)
A prbastatisztika:
X Y H0
N (0, 1).
u= q 2
1
22
+
n1
n2
Teht a kritikus tartomnyok ugyanazok, mint egymints esetben, azaz (3) adja meg ket.
Egymints t-prba
Legyen
X1 , . . . , Xn N (m, )
m,
ahol
ismeretlen.
u-prbnl
(2).
A prbastatisztika:
t=
ahol
Sn =
Jellje a
X m0 H0
n tn1 ,
Sn
1
n1
P
(Xi X)2 .
szbadsgi fokot f , teht f = n 1.
A kritikus tartomny:
tf ()
F (tf ()) = 1 ,
ha
jelli az
(5)
szabadsgi fok
t-eloszls
eloszlsfggvnyt.
A
tf ( 2 )-t
s a
tf ()-t
Ktmints t-prba
Legyenek
X1 , . . . , Xn1 N (m1 , )
Y1 , . . . , Yn2 N (m2 , )
m1 , m 2
meretlenek.
A hipotzisek: ugyanazok, mint a ktmints
u-prbnl
(4).
A prbastatisztika:
X Y
t= q
(n1
f,
1)Sn1 2
teht
+ (n2
1)Sn2 2
n1 n2 (n1 + n2 2) H0
tn1 +n2 2 .
n1 + n2
f = n1 + n2 2.
t-prbnl
m1 = m2
r
1
n1 n2
(X Y )
N (0, 1).
n1 + n2
a prbastatisztika. Egyrszt
azaz
i
1 h
2
2
(n
1)S
+
(n
1)S
2n1 1+n2 1 ,
1
2
n
n
1
2
2
24
esetn
is-
2n1 1
2n2 1
illetve
eloszlsak, s fggetlenek.
kpletben felrt valsznsgi vltozk fggetlenek is, hnyadosuk a szabadsgi fok gykvel beszorozva
valban
eloszls lesz.
Mj.: Ha a kt minta szrsa szigniknsan klnbzik, akkor a fenti prbt kiss mdostani kell, ezt
vagy szintn t-prbnak, vagy Welch-prbnak hvjk. A mdosts abbl ll, hogy most a prbastatisztika
t= q
ahol az
X Y
2
Sn
1
n1
tf ,
szabadsgi fok
f=
s
H0
2
Sn
2
n2
gi = Sni 2 /ni .
Ha
(g1 + g2 )2
g12
n1 1
7.1. Denci.
g22
n2 1
eloszlsra.
X f1
szabadsgi fok,
Ktmints
Legyenek
X1 , . . . , Xn1 N (m1 , 1 )
F -prba
Y1 , . . . , Yn2 N (m2 , 2 )
m1 , m 2
1 , 2
ismeretlenek.
A hipotzisek:
a)
H0 : 1 = 2
H1 : 1 6= 2
b)
H0 : 1 2
H1 : 1 > 2
c)
H0 : 1 2
H1 : 1 < 2
A prbastatisztika:
F =
Jellje a szbadsgi fokokat
f1 = n1 1
Sn1 2
Sn2 2
H0
Fn1 1,n2 1 .
f2 = n2 1.
A kritikus tartomny:
vagy
F > Ff1 ,f2 ( 2 )} b)Xk = {F > Ff1 ,f2 ()} c)Xk = {F < Ff1 ,f2 (1 )},
(6)
ahol az
Ff1 ,f2 ()
F -eloszls
ha
jelli az
(f1 , f2 )
szabadsgi fok
eloszlsfggvnyt.
A prbastatisztika
H0
melletti eloszlsa:
F =
Sn1 2
Sn2 2
1
n1 1
=
1
n2 1
2
(n1 1)Sn
1
12
2
(n2 1)Sn
2
22
Fn1 1,n2 1 .
1
1
<
Ff2 ,f1 ,
Ff1 ,f2 (1 /2)
F
ezrt
Xk =
1
> Ff2 ,f1 (/2)
F
vagy
25
F > Ff1 ,f2 (/2) .
1
.
Ff1 ,f2 (1 /2)
A gyakorlatban hasznlt
-kra
1-nl
a kritikus rtk
1/F
kzl a nagyobbikat
F 0 = max
2
2
Sn
Sn
1
2
2 , S 2
Sn
n1
2
statisztikt hasonltjuk ssze vagy az
vagy az
kritikus rtkekkel.
Egymints
Legyen
X1 , . . . , Xn N (m, )
ahol
m,
F -prba
(vagy
2 -prba)
ismeretlen.
A hipotzisek:
a)
H0 : = 0
H1 : 6= 0
b)
H0 : 0
H1 : > 0
A prbastatisztika:
2 = (n 1)
Jellje a szabadsgi fokot
c)
H0 : 0
H1 : < 0
Sn2 H0 2
n1 .
02
f = n 1.
A kritikus tartomny:
a)Xk = {2 < 2f (1 2 )
ahol a
2f ()
vagy
G(2f ()) = 1 ,
ha
jelli az
szabadsgi fok
2 -eloszls
eloszlsfggvnyt.
F =
statisztikra
F -prbt,
Sn2 H0
Fn1,
02
Fn1,
eloszls a
2n1
eloszls
tsklzott vltozata).
7.2. Plda.
hogy az altat mennyivel nvelte meg a betegek jszakai alvsidejt (rban mrve).
Beteg sorszma
A altat
B altat
klnbsg
1
2
3
4
5
6
7
8
9
10
1.9
0.8
1.1
0.1
0.1
4.4
5.5
1.6
4.6
3.4
0.7
1.6
0.2
1.2
0.1
3.4
3.7
0.8
0
2
1.2
2.4
1.3
1.3
0
1
1.8
0.8
4.6
1.2
H0 : m1 = m2 , H1 : m1 6= m2 .
= 0.01
terjedelem mellett)?
t-prbval a H0 : m = 0, H1 : m 6= 0 hipotziseket!
0
Sn = 1.23, X = 1.58, t = Xm
n = 4.06. A kritikus
S
n
rtk:
AB
t9 (0.005) = 3.35,
gy, mivel
2
2
SA
= 4, SB
= 3.8.
t-prba
vgezhet.
X = 2.33, Y = 0.75,
26
is
F -prbval: F 0 = 1.1,
= 1.78.
10 + 10
2
2
A kritikus rtk
Mivel
elfogadjuk
H0 -t,
8.
prbk
8.1. Ttel.
meggyelsbl jellje
az
Ai
A1 , A2 , ..., Ar
2 =
r
X
(i n pi )2
n pi
i=1
valsznsgi vltoz
talnosabban, ha a
pi
r1
s(< r 1)
esetn az
valsznsgek
2 =
szabadsgi fok
esetn az
r
X
(i n pi )2
n pi
rs1
szabadsgi fok
A ttel alapjn aszimptotikus prba vgezhet, ami azt jelenti, hogy a prba terjedelme kzeltleg
ha
l-
pi
i=1
valsznsgi vltoz
lesz,
elg nagy.
2 -prba
Legyen
A1 , A2 , ..., Ar
(tiszta eset)
teljes esemnyrendszer.
A hipotzisek:
H0 : P (Ai ) = pi
n
A prbastatisztika:
2 =
i = 1, ..., r,
az
Ai
esemny gyakorisgt.
r
X
(i n pi )2
n pi
i=1
Jellje a szabadsgi fokot
H1 : i : P (Ai ) 6= pi .
H0
2r1 .
f = r 1.
A kritikus tartomny:
Xk = {2 > 2f ()},
2
2
ahol a f () kritikus rtk olyan, hogy G(f ()) = 1 , ha G jelli az f szabadsgi fok
eloszlsfggvnyt.
2
A kritikus rtkeket a -prba kritikus rtkei cm tblzatbl keressk ki.
27
(7)
-eloszls
Vegyk szre, hogy a kritikus tartomnyba a prbastatisztika azon rtkeit tettk, melyek az ellenhipotzis esetn fordulnak inkbb el, azaz a nagy rtkeket.
2 -prba
Legyen
A1 , A2 , ..., Ar
(becslses eset)
teljes esemnyrendszer.
A hipotzisek:
H0 : : P (Ai ) = pi ()i,
ahol
egy
dimenzis paramtervektor.
paramtervektor ML becslse, s
A prbastatisztika:
2 =
r
X
(i n pi )2
n pi
i=1
Jellje a szabadsgi fokot
H1 : 6 : P (Ai ) = pi ()i,
.
pi = pi ()
az
Ai
esemny gyako-
H0
2rs1 .
f = r s 1.
Mj.: Mivel a prba aszimptotikus, vigyznunk kell arra, hogy a minta elemszma elg nagy legyen. Pl.
megkvetelhetjk, hogy az sszes vrt rtk (npi , ill.
n
pi )
8.1. Illeszkedsvizsglat
Khi-ngyzet prbval ellenrizhetjk, hogy egy minta egy adott eloszlsbl szrmazhat-e.
Mivel a
khi-ngyzet prbban egy vges teljes esemnyrendszer szerepel, a prbt inkbb diszkrt eloszlsok
illeszkedsnek vizsglathoz szoks hasznlni. Mindenesetre a felttelezett eloszls rtkkszlett vges
sok csoportra kell osztanunk, hogy a prbt elvgezhessk.
8.1. Plda.
H0 :
P (Ai ) = 61 ;
i = 1, . . . , 6.
= 60):
1
8
10
rtkek
i
n pi
2
3
4
5
7 14 12 10
10 10 10 10
6
9
10
A prbastatisztika:
2 =
(8 10)2
(7 10)2
(14 10)2
(12 10)2
(10 10)2
(9 10)2
+
+
+
+
+
= 3.4.
10
10
10
10
10
10
A kritikus rtk (f
Mivel
szablyosnak tekinthet.
8.2. Plda.
400-szor feljegyeztk, hogy egy hibs kapcsol hnyadik prblkozsra gyjtotta fel a villanyt.
H0 : Xi Geo(p)
valamilyen
p-re.
Az adatok:
1
324
2
57
3 4
14 5
1 324 + 2 57 + 3 14 + 4 5
500
5
=
= , ebbl a paramter ML becslse p =
400
400
4
1
=
X
0.8. A geometriai eloszls pozitv egsz rtkeket vehet fel, teht a lehetsges rtkek egy csoportostsa:
A minta tlaga:
X=
n pi
1
320
2
64
28
3
4
12.8 3.2
A prbastatisztika:
2 =
A szabadsgi fok:
22 (0.05) = 5.99,
(324 320)2
(57 64)2
(14 12.8)2
(5 3.2)2
+
+
+
= 1.95.
320
64
12.8
3.2
s mivel
kzelts srl).
pi
8.2. Fggetlensgvizsglat
Kt szempont szerint soroljuk osztlyokba a meggyelseket:
az 1. szempont szerint
a 2. szempont szerint
Nullhipotzisnk:
i, j -re.
egymstl, azaz
minden
az
Ai Bj
i =
s
X
ij
j=1
az
Ai
j =
r
X
ij a Bj gyakorisga.
i=1
Kt eset lehetsges aszerint, hogy az egyes szempontok osztlyainak valsznsgt ismerjk-e.
gyakorisga s
A) eset (ritkbb):
P (Ai ) = pi
P (Bj ) = qj
esemnyrendszert alkotnak,
2 =
B) eset:
pi , q j
r1
{Ai Bj }
esemnyek
elem teljes
darab
pi
i
,
n
qj =
paramtert. gy
2 =
j
.
n
pr = 1
Pr1
i=1
pi
mr addik), s
r X
s
r X
s
X
X
(ij in j )2 H0 2
(ij n pi qj )2
f ,
=
i j
n pi qj
n
i=1 j=1
i=1 j=1
f = r s (r 1 + s 1) 1 = (r 1)(s 1).
r = s = 2. Ekkor a prbastatisztika egyszerbb alakra
rs
s
r X
X
(ij n pi qj )2 H0 2
rs1 .
n pi q j
i=1 j=1
pi =
sszesen
ismertek. Mivel az
2 =
n (11 22 12 21 )2
.
1 2 1 2
29
hozhat:
s1
darab
qj
Legyen ugyanis
ij =
i j
n . Ekkor
11 + 12 = 1
Kaptuk, hogy
Teht a
11 + 12 =
12 12 = (11 11 ).
1 1
1 2
1
+
=
(1 + 2 ) = 1 .
n
n
n
Hasonlan,
21 21 = (11 11 )
22 22 = 11 11 .
11 11 = 11
A kzs szmll s
11 22 12 21
1
(11 + 12 )(11 + 21 ) =
.
n
n
1
1
1
n2
1
+
+
+
=
.
1 1
1 2
2 1
2 2
1 1 2 2
A fentieket sszerakva, pp a bizonytani kvnt kpletet kapjuk.
n(11 22 12 21 ) H0
1 2 1 2
N (0, 1),
u-prba
gy
H1 :
8.3. Plda.
H0 :
u-prbt
is
a szemszn s a hajszn
kk
ms
szke
30
70
100
20
80
100
ms
50
150
200
= 0.05)?
kk
ms
szke
25
75
25
75
ms
2
2 = 200(30807020)
= 2.67.
10010050150
(2 1) (2 1) = 1, kritikus rtk: 21 (0.05) = 3.84.
A prbastatisztika:
Szabadsgi fok:
= 0.05)?
200(30807020)
A prbastatisztika:
= 1.63.
10010050150
A kritikus rtk: u0.05 = 1.65.
Teht a szkk kztt nem szigniknsan tbb a kkszem (de majdnem :).
8.3. Homogenitsvizsglat
Legyen X s Y kt valsznsgi vltoz, s kzs rtkkszletket bontsuk fel az A1 , . . . , Ar osztlyokra.
H0 : X s Y eloszlsa megegyezik, azaz P (X Ai ) = P (Y Ai ) minden i-re.
Az X -et n-szer meggyelve, legyen i az Ai osztly gyakorisga. Hasonlan, Y -t m-szer meggyelve,
legyen i az Ai osztly gyakorisga.
i +i
Az i. osztly valsznsgnek ML becslse: p
i = n+m
.
A prbastatisztika:
r
2
X
(i n
pi )
i=1
n
pi
r
2
X
(i m
pi )
i=1
m
pi
H0
2f ,
nem becslt
le kell vonni.
r
X
i=1
2
mi
H0
n m 2r1 .
i + i
i
n
30
8.4. Plda.
= 0, 05)?
Az adatok:
1
7
16
rtk
i
i
(1. kocka)
(2. kocka)
2
3
11 8
11 20
4
5
10 8
19 18
6
6
16
r=6
n = 50
m = 100
A prbastatisztika:
6
X
i=1
A kritikus rtk:
i
100
i + i
i
50
Mivel
2
50 100 = 3.58.
tekinthet.
= 0 1
elem
mintbl szmolt
ltalnostott
sup{Ln (X; ) : }
.
sup{Ln (X; ) : 0 }
Ha a nullhipotzis teljesl, akkor ez kzel van 1-hez, mg ha nem, akkor a szmll jval nagyobb a
neveznl, ezrt a hnyados nagy. A nullhipotzis tesztelse teht gy trtnhet, hogy ha az ltalnostott
likelihood-hnyados statisztika nagyobb, mint valamely kritikus rtk, akkor
akkor
H0 -t
H0 -t
elvetjk, ha kisebb,
f0 ,
f1 ,
n f (X) o
max{f0 (X), f1 (X)}
1
= max 1,
.
f0 (X)
f0 (X)
Itt a msodik tag a NeymanPearson lemmbl ismers likelihood-hnyados, vagyis a klasszikus likelihood-hnyados prbt kapjuk, ha a kritikus rtk nagyobb 1-nl.
Az ltalnostott likelihood-hnyados statisztika
H0
tekintve nehz meghatrozni. Bizonyos felttelek mellett azonban hatreloszlsttelt tudunk bizonytani
r, amint a minta nagysga minden hatron tl n, s ezzel aszimptotikus prbt konstrulhatunk.
Az aszimptotikus vizsglathoz a fenti statisztika logaritmusnak a ktszerest tekintjk:
T = 2 sup log Ln (X; ) sup log Ln (X; ) .
Tegyk fel, hogy a paramterek kt csoportra vannak felosztva, az els csoportba tartozk vektort
jellje
Rq ,
a tbbiek
(p q)-dimenzis
vektort pedig
feladatot:
H0 : = 0 ,
tetszleges,
H1 : 6= 0 ,
2q .
tetszleges.
esetn a
statisztika hatreloszlsa
intervallum adhat.)
2 -prba
helyett alkalmazhat
prbk
Lttuk, hogy a
2 -prba
Azonban a
2 -prba
leg, gy felmerl a krds, hogy folytonos eloszls mintkra nem lehet-e jobb prbkat konstrulni. Az
albbiakban bemutatunk nhnyat ezek kzl.
31
10.1. Illeszkedsvizsglat
X1 , . . . , Xn valamilyen folytonos
H0 : F = F0 , H1 : F 6= F0 .
F ).
Kolmogorov-Szmirnov prba:
Ksztsk el a minta
Fn
Dn = sup Fn (x) F0 (x) .
xR
Dn H0
Megmutathat, hogy
i
tapasztalati eloszlsfggvny konstans
n , az
F0
F0
eloszlstl: mivel
(n)
Xi
(n)
Xi+1
kztt a
h
i
(n)
(n)
Dn = max max |F0 (Xi ) i/n|, |F0 (Xi+1 ) i/n| .
0in
Ennek
+
X
2 2
n
P ( nDn < y) K(y) =
(1)i e2i y
eloszlsfggvnye
F0 ,
akkor
(y > 0).
i=
A fenti
Kolmogorov eloszls.
H0 -t,
ha
Mj.: Vizsglhatjuk a
= 0.05
Azaz ha
kritikus rtkeket.
egyoldali ellenhipotziseket
Dn+ = sup Fn (x) F0 (x) ,
illetve
xR
H0
A fenti
K1
xR
meghatrozhat:
Dn = sup F0 (x) Fn (x) .
F0 -tl.
2
n
P ( nDn < y) K1 (y) = 1 e2y
H0 -t,
ha
ha pedig
nDn
aszimptotikus eloszlsa
(y > 0).
Szmirnov eloszlsnak.
Tovbb
10.2. Fggetlensgvizsglat
Legyen
Jellje a
H0 :
Kendall prba:
Tekintsk a kvetkez prbastatisztikt:
Kn =
n1
X
n
X
i=1 j=i+1
Szavakkal elmondva,
Kn
Kn H0 melletti
F, G marginlis eloszlsoktl. Ha ugyanis az (Xi , Yi ) minta helyett az (F (Xi ), G(Yi ))
mintbl szmolnnk ki Kn -et, ugyanazt az rtket kapnnk, hiszen F, G monoton nv fggvnyek.
Viszont F (Xi ) s G(Yi ) mr fggetlen E(0, 1) eloszlsak.
Megmutathat az is, hogy Kn aszimptotikusan normlis eloszls, azaz ha n elg nagy, akkor u-prba
vgezhet, ha pedig n kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
Az u-prbhoz
ktszer a rendezett ponptprok szma, mnusz az sszes pontpr szma. Belthat, hogy
eloszlsa nem fgg az
32
standardizlni kell
a)
Kn
Kn -et:
H0 mellett:
vrhat rtke
X
X
XX
D02 (Kn ) = cov0
ij ,
kl =
cov0 (ij , kl ).
Hasonlan,
b)
Kn
szrsngyzete
legyen
i<j
i<j k<l
k<l
ha
{i, j} {k, l} =
0
1
ha
i = k, j = l
Itt cov0 (ij , kl ) =
1/9 egybknt
n(n 1) 1 n(n 1)(n 2)
n(n 1)(2n + 5)
2
+
6=
.
Azaz D0 (Kn ) = 1
2
9
6
18
Mj.: a prba csak a 6= 0 tpus ellenhipotzisekre konzisztens, ahol
= 2P ((X1 X2 )(Y1 Y2 ) > 0) 1
a Kendall-fle fggsgi egytthat (| |
1,
ha
fggetlenek, akkor
= 0,
Blum-Kiefer-Rosenblatt prba:
Legyen
N1 (i) = |{ j
N2 (i) = |{ j
N3 (i) = |{ j
N4 (i) = |{ j
N` (i)
Azaz
6= i | Xj
6= i | Xj
6= i | Xj
6= i | Xj
< Xi
> Xi
< Xi
> Xi
s
s
s
s
Yj
Yj
Yj
Yj
< Yi }|
< Yi }|
> Yi }|
> Yi }|
(Xi , Yi )
N3 (i)
N4 (i)
(Xi ,Yi )
N1 (i)
N2 (i)
`.-ik
sknegyedbe.
Prbastatisztika:
Bn =
ahol
n, H
n
Fn , G
1X
n i=1
n
n
n
n
1X
n (Yi ))2 ,
(Hn (Xi , Yi ) Fn (Xi )G
n i=1
Belthat, hogy
B n H0
a tapasztalati eloszlsfggvnyek:
n (Xi , Yi ) = N1 (i)/n,
H
pedig
2
= 0.05
F, G
nBn
H0 -t,
ha
ha
10.3. Homogenitsvizsglat
X1 , . . . , Xn s Y1 , . . . , Ym
F , illetve G).
H0 : F = G, H1 : F =
6 G.
Mann-Whitney-Wilcoxon prba :
Tekintsk a kvetkez prbastatisztikt:
Wn,m =
n X
m
X
i=1 j=1
33
I(Xi Yj ).
10.1. Ttel.
(N )
(N )
N := n + m. Vegyk a Z1 < < ZN
(n)
rendezett mintt, s jellje ri , hogy Xi
hanyadik legkisebb elem ebben a rendezett mintban. Ekkor
n(n+1)
Wn,m = r1 + + rn 2 .
Legyen
Bizonyts.
(n)
X1
(n)
(n)
r1 1 db Yj -nl nagyobb, X2
ri i db Yj -nl nagyobb.
Wn,m H0
1/
n, m
Ez alapjn, ha
m X
n X
m
n X
m
n X
m
n X
X
X
X
cov0 (ij , lk ).
D02 (Wn,m ) = cov0
ij ,
lk =
i=1 j=1
l=1 k=1
0
ha
i 6= l, j 6= k
1/4 ha i = l, j = k
Itt cov0 (ij , lk ) =
1/12 ha i = l, j 6= k
1/12 ha i 6= l, j = k
1
1
1
n m(n + m + 1)
nm n+m+1
2
Azaz D0 (Wn,m ) = nm + nm(m 1)
+ mn(n 1)
=
=
.
4
12
12
12
4
3
nm
lenne, ha ij -k fggetlenek lennnek. Mj.: a prba csak a P (X > Y ) 6= 1/2 tpus ellenhipotzis
4
esetn konzisztens.
Kolmogorov-Szmirnov prba:
Ksztsk el a mintkbl az
m
|hatFn , G
tatisztikt:
m (x) .
Dn,m = sup Fn (x) G
xR
Megmutathat, hogy
Dn,m
Dn,m H0
mn
m+n
xR
n, m
100
(X, Y )
ktdimenzis valvltoz.
prosak
szmt
Y -t?
szeretnnk
34
hatosok
szmnak
lineris
fggvnyvel
kzelteni.
Elnevezs:
a magyarz vltoz.
Megolds:
0,
ha
a=
A kifejezst
0,
E(XY ) bE(X)
.
E(X 2 )
ha
b = E(Y ) aE(X).
A minimumot teht a kvetkez paramterek adjk:
a =
A
h2
hibt
cov(X, Y )
,
D2 (X)
b = E(Y ) a E(X).
magyarzza meg.
Ugyanezt a feladatot tekinthetjk tbb magyarz vltoz esetn is: legyen
(X1 , . . . , Xq , Y ) valvltoz, s
h2 = E[(Y (aT X + b))2 ]
Minimalizlni szeretnnk a
b = E(Y ) a E(X).
cov(Y, X) = (cov(Y, X1 ), . . . , cov(Y, Xq )) sorvektor, (X) pedig q q -as mtrix, melynek (i, j)-dik
cov(Xi , Xj ). (Tegyk fel, hogy a mtrix invertlhat.)
Itt most
eleme
Ez utbbi fellls arra az esetre is alkalmazhat, amikor egy magyarz vltoz van, de annak
polinomjval szeretnnk
Y -t
kzelteni.
Y pedig a sz hossza.
Y -ra: 1.02X 2 1.25X +4.38.
(a
X
+
b))
hibt szeretnnk minimalizlni. Ha a minta tapasztalati eloszlst
i
i
i=1
n
tekintjk, akkor az tlag a vrhat rtknek felel meg, azaz a megolds ugyanaz, mint az elbb, csak a
Az elz statisztikai megfelelje:
Most a
h2 =
felttelezzk,
hibk. Teht
Plda: egy ember slya a neme, letkora, magassga valamilyen lineris fggvnye, plusz mg az egyni
ingadozsbl szrmaz hiba.
ll: Ebben a modellben
ll: Ebben a modellben
a s b ML becslse
2 ML becslse:
pp a fenti
b ,
s a becslsek torztatlanok.
2 =
ez nem torztatlan, de
1X
(Yi (aT Xi + b))2 ,
n i=1
n
X
1
(Yi (aT Xi + b))2
n q 1 i=1
mr az.
35