You are on page 1of 35

Statisztika (jegyzet)

Csiszr Vill
2009. mjus 6.

1. Statisztikai mez
A statisztika egyik ga a ler statisztika. Ekkor a meggyelt adatokat ttekinthet formban brzoljuk, pl.

hisztogrammal (oszlopdiagrammal), krdiagrammal, egyb grakonokkal.

Msrszt az ada-

tokbl kiszmtunk nhny fontos, jellemz rtket, pl. az tlagot (mintakzepet), tapasztalati szrst,
szlsrtkeket.
A

matematikai statisztika alapfeladata:

gi vltoz eloszlst) nem ismerjk,

egy vletlen jelensg mechanizmust (pl. az t ler valszns-

de meggyelseket vgezve,

a meggyelsekbl szeretnnk r

kvetkeztetni. A kvetkez tmakrkkel fogunk foglalkozni:

Becslselmlet:

A valsznsgi vltoz valamilyen jellemzjt szeretnnk a mintbl megbecslni,

illetve a becsls hibjt meghatrozni. Minl pontosabb, megbzhatbb becslst keresnk. Pldk:
1. Egy munkltatt egy titkrn ltal gpelt szvegekben elfordul hibk szma rdekli. Pl. a hibk tlagos szma s a hibaszm szrsa. A munkltat

30 darab, kzel azonos hosszsg, a titkrn ltal

legpelt szvegben megszmolja a hibkat. sszer feltenni, hogy a hibk szma Poisson eloszls,
de az eloszls paramtere

()

ismeretlen. A meggyelsek alapjn szeretne kvetkeztetni

-ra,

ebbl

a vrhat rtk s a szrs mr kiszmolhat. Msrszt, a vrhat rtket s a szrst becslheti a


Poisson felttelezs nlkl is.
2. Egy fonalgyrban a fonalszakadsokat vizsgljk.
hogy a fonal egy

Annak a valsznsgt szeretnk megbecslni,

rs mszak alatt egyszer sem szakad el. Ennek rdekben 20 fonalszl minde-

gyikrl feljegyzik, hogy mennyi id mlva szakad el. sszer feltenni, hogy a fonalak lettartama
exponencilis eloszls (rkifj tulajdonsg), de
3. Egy kosaraz 10-szer kosrra dob. Betall
dobsbl:

Ind(p),

ahol a tallat valsznsge

ismeretlen.

1 pont, nem tall be

0 pont. Kapott pontszm egy

ismeretlen, ezt szeretnnk megbecslni.

4. Htftl pntekig naponta megnzzk egy vros ramfogyasztst. Ez feltehetleg normlis eloszls,
de

m,

ismeretlen.

5. Htftl pntekig megmrjk, hogy mennyit kell vrni a buszra.


eloszls

[0, b]

intervallumon, ahol

Hipotzisvizsglat:

Feltehet, hogy ez egyenletes

ismeretlen.

A jelensggel kapcsolatban van egy elzetes felttelezsnk, amelyet tesztelni sz-

eretnnk. Ha a meggyelseink sszeegyeztethetk a feltevssel, elfogadjuk azt, ha viszont ellentmondanak


neki, akkor elutastjuk a feltevst. J dntsi eljrst keresnk. Pldk:

egszsggyben: gygyszerek hatsossgnak bizonytsa;

ipar: selejtarny ellenrzse: le kell-e a gpsort cserlni?

irodalomtudomny: 2 szvegrl el kell dnteni, hogy ugyanaz rta-e ket;

szociolgia: prtok npszersge: van-e szignikns klnbsg?

szociolgia: prtpreferencia s iskolzottsg kztt van-e sszefggs?

1.1. Denci.
A -agebra

Az

(, A, P)

hrmast

(esemnyek csaldja),

statisztikai meznek hvjuk,

ahol

nemres halmaz (esemnytr),

pedig a szbajhet valsznsgi mrtkek csaldja. Azaz

P = {P | },
ahol
A

valsznsgi mrtkek.

halmazt

paramtertrnek nevezzk.

Legtbbszr

vges dimenzis euklideszi tr rszhalmaza, ekkor

azt mondjuk, hogy paramteres a feladat (pl.: 1.-5. paramteres feladatok).


pl.: ha

lehet ennl jval "nagyobb",

az sszes lehetsges valsznsgi mrtk, ekkor nemparamteres a feladat.

1.2. Denci.

Egy

neveznk, ahol

X = (X1 , . . . , Xn ) : X Rn valsznsgi vltozt (n elem) mintnak


n pedig a minta nagysga vagy elemszma. Az Xi koordintk a minta

a mintatr,

elemei.
Mi (majdnem) mindig olyan mintkkal fogunk foglalkozni, amikor ugyanazt a vletlen jelensget, egymstl
fggetlenl,

n-szer

1.3. Denci.
minta, ha

Xi -k

gyeljk meg.

X fggetlen elem
P szerint

az sszes

minta, ha

Xi -k

az sszes

szerint fggetlenek.

X azonos eloszls

azonos eloszlsak.

{Fn; | }, ahol Fn; (x1 , ..., xn ) = P (X1 < x1 , ..., Xn < xn ).


X n elem, fggetlen, azonos eloszls minta, akkor

A minta eloszlsfggvnyeinek csaldja


Ha

Fn; (x1 , ..., xn ) =

n
Y

F1; (xi ),

i=1
ahol

F1;

az

Xi

koordintk kzs eloszlsfggvnye. Emlkezznk r, hogy az eloszlsfggvny helyett

diszkrt esetben a

pn; (x1 , . . . , xn ) = P (X1 = x1 , X2 = x2 , ..., Xn = xn )


valsznsgeket, abszolt folytonos esetben pedig az

fn; (x1 , ..., xn )


srsgfggvnyt is hasznlhatjuk. Fggetlen elem minta esetn ezek is szorzatra bomlanak.

1.1. Plda.
szma.

(titkrn) A minta:

X = (X1 , . . . , X30 ) : N30


0 ,

paramtertr

= (0, ) R,

p30; (x1 , x2 , . . . , x30 ) =

30
Y

p1; (xi ) =

i=1

1.4. Denci.

2)

Az mintatren megadott

30
Y

i=1

T : X Rk

(k-dimenzis) statisztiknak nevezzk.

1.2. Plda.
1)

Xi

azaz egyparamteres feladatrl van sz.

kirva

vltozt

ahol

az

i.

szvegben tallt hibk

fggetlen, azonos eloszls minta, a mintaelemek szbajhet eloszlsai:

xi

xi !

30
Q

=e

xi !

fggvnyt, illetve magt a

T = T (X)

valsznsgi

Nhny gyakran hasznlt statisztika (X mindenhol

n elem minta):
n
X
1
T (X) = X =
Xi az X minta mintatlaga.
n i=1
n
1X
2
T (X) = SX
=
(Xi X)2 az X minta tapasztalati szrsngyzete.
n i=1
(n)

(n)

(n)

(n)

xi

T (X) = (X1 , X2 , ..., Xn ) az X minta rendezett mintja, ahol X1 X2


(pl. T (2, 4, 1, 3) = (1, 2, 3, 4)).
(n)
(n)
4) T (X) = Xn X1
az X minta mintaterjedelme.

(n)

ha n pratlan
X
n+1

2
(n)
(n)
5) T (X) =
az X minta tapasztalati medinja.
X n + X n +1

2
2

ha n pros
2

3)

Xi P oisson(),

A valsznsgeket rszletesen

(n)

(n)

Xn

1.5. Denci.

Az (X1 , ..., Xn ) minta tapasztalati eloszlsa az a vletlen diszkrt eloszls, melynek lehetXi rtkek, az rtkekhez tartoz valsznsgek pedig a meggyelt relatv gyakorisgok.
x1 < x2 < < xm a meggyelt (klnbz) rtkeket (m n), ekkor az xj -hez tartoz

sges rtki az
Azaz jellje

valsznsg:

|{i|Xi = xj }|
1X
=
I(Xi = xj ),
n
n i=1
I(Xi = xj ) = 1, ha Xi = xj , s I(Xi = xj ) = 0, ha Xi 6= xj .
X minta tapasztalati eloszlsfggvnye a tapasztalati eloszlshoz

ahol
Az

tartoz eloszlsfggvny:

1X
Fn (x) =
I(Xi < x),
n i=1

x R.

Hogy nz ez ki?
n
n

4
n
3
n
2
n
1
n

1.1. Ttel. (Glivenko:


F -hez,

0
k
Fn (x) =

b r
r

x X1 ,

ha

Xk

ha

Xn

(n)

< x Xk+1 ,

(n)

(n)

< x.

(n)
Xn

X1 , . . . , X n

A statisztika alapttele.) Legyenek


Ekkor az

(n)

ha

(n)
(n)
X1
(n) X4
X2,3

vny valsznsgi vltozk.


tart

b
r

Fn

fggetlen, azonos

tapasztalati eloszlsfggvny

eloszlsfgg-

valsznsggel egyenletesen

azaz





P ( lim sup Fn (x) F (x) = 0) = 1.
n xR

A ttel jelentse az, hogy ha elg sok meggyelst vgznk, akkor tetszleges pontossggal visszakapjuk a

x R-re




P ( lim Fn (x) F (x) = 0) = 1,

valdi eloszlst. Azt knny beltni, hogy minden rgztett

hiszen ez ppen a nagy szmok ers trvnye az


hogy a





supxR Fn (x) F (x)

1.1. Feladat.

I(Xi < x)

valsznsgi vltozkra. Megjegyezzk mg,

1/ n.

maximlis eltrs nagysgrendje

Az 2-5 pldkra adjuk meg a mintateret, a paramterteret, s a minta eloszlsainak csald-

jt!

X minta mindegyik pldban


Xi az i. fonalszl lettartama.
X = R20
+ , Xi Exp(), = (0, ),
Mo: az

fggetlen, azonos eloszls.

2)

f20; (x1 , ..., x20 ) =

20
Y

f1; (xi ) =

i=1

20
Y

exi = 20 e

xi

i=1

3. Xi az i. dobs pontszma.
10
X = {0, 1} , Xi Ind(), = [0, 1],

p10; (x1 , . . . , x10 ) =

10
Y

p1; (xi ) =

i=1

10
Y

xi (1 )1xi =

xi

(1 )10

i=1

4. Xi az i. nap fogyasztsa.
X = R5+ , Xi N (1 , 2 ), = R R+ ,

f5; (x1 , ..., x5 ) =

5
Y

f1; (xi ) =

i=1

5
Y
i=1

1
p

e
2

22

(xi 1 )2
22
2

xi

Xi az i. napon a vrakozsi id.


X = R5+ , Xi E(0, ), = (0, ),
5.

f5; (x1 , ..., x5 ) =

5
Y

f1; (xi ) =

i=1

1.2. Feladat.
punk. Jellje

5
Y
1
1
(1)
I(0 xi ) = 5 I(x1 0

i=1

8-szor a kvetkez ksrletet:


i. ksrletben hnyszor kellett

Vgezzk el

Xi ,

hogy az

(5)

x5 ).

addig dobunk egy rmvel, amg fejet nem kadobni. Az

minta egy konkrt realizcijra

adjuk meg a tapasztalati eloszlsfggvnyt, s szmtsuk ki az 1.2 Pldban szerepl statisztikkat!


Mo: Ha pldul a minta a kvetkez:
A tapasztalati eloszls:

x1

x2

x3

x4

x5

x6

x7

x8

rtk

valsznsg

2
8

3
8

2
8

1
8

mintatlag:
tapasztalati szrsngyzet:
mintaterjedelem:
tapasztalati medin:

19/8 = 2.38
95/64 = 1.48
4
2

b
b

b
r

(8)
x1,2

b
r

(8)
x3,4,5

(8)
x6,7

(8)
x8

1.3. Feladat.

Legyen X fggetlen, azonos eloszls minta, a koordintk kzs eloszlsfggvnye F .


Fn (x) vrhat rtkt s szrsngyzett!
p
nFn (x) Bin(n, F (x)). gy E(Fn (x)) = F (x) s D(Fn (x)) = F (x)(1 F (x))/n.

Szmoljuk ki
Mo:

2. Elgsgessg

az igazi paramter. A P (X = x)
-tl (bizonyos -kra nagy a valsznsge, hogy ezt a mintt kapjuk, msokra kisebb). A
T (X) statisztika is hordoz informcit, hiszen a P (T (X) = t) valsznsg is fgg -tl. Az eredeti minta
Az

minta informcit tartalmaz arrl, hogy melyik

valsznsg fgg

ltalban tbb informcit tartalmaz a paramterrl, mint a belle kiszmolt statisztika. Pl. ha diszkrt

P (X = x) valsznsgek sokflesge hordozza a -ra vonatkoz informcit. A


P (T (X) = t) valsznsgek sokflesgbl szrmazik. A {T (X) = t}
esemny felbomlik {X = x} esemnyekre, olyan x-ekre, melyekre T (x) = t. Az X -ben tartalmazott
pluszinformci teht a P (X = x|T (X) = t) valsznsgek sokflesgbl addik, olyan x-ekre, melyekre
T (x) = t. Ha a P (X = x|T (X) = t) feltteles valsznsgek mr nem fggnek -tl, akkor, mivel
P (X = x) = P (X = x|T (X) = T (x))P (T (X) = T (x)), a minta nem tartalmaz tbb informcit, mint a
mintt vesznk, akkor a

T (X)-ben

rejl informci pedig a

statisztika.

2.1. Denci.

Legyen X = (X1 , . . . , Xn ) diszkrt minta az (, A, P) statisztikai mezn. Azt mondjuk,


T (X) statisztika elgsges a paramterre, ha minden x, t prra a P (X = x|T (X) = t) valsznsg
fgg -tl.

hogy a
nem

2.1. Plda.

Legyen

Xi Ind(p),

ahol

0 p 1

ismeretlen paramter.

dengyikrl feljegyezzk, hogy hatos-e. Beltjuk, hogy

i Xi

Pl.

elgsges statisztika

100 kockadobs min-

p-re,

azaz nem kell a

dobsokrl egyesvel feljegyezni, hogy melyik volt hatos, melyik nem, hanem elg feljegyezni, hogy sszesen

p-rl. A denci alapjn szmolunk:

n
X

0
ha
xi 6= t

i=1

=nt

=t

n
z }|
{
z}|{
Q
X
P
P
n
n
xi
1xi
xi
n xi
X
Pp (X = x|
Xi = t) =
p
(1

p)
p
(1

p)
1
i=1




=
= n
ha
xi = t

n t
nt
i=1

n t

nt
t p (1 p)
t

i=1
p
(1

p)

|
{zP
}

hny hatos volt. Ezzel nem vesztnk informcit

binom;

Azaz a kapott feltteles valsznsg tnyleg nem fgg

2.1. Ttel. (Neyman faktorizcis ttele)

p-tl.

Legyen

akkor s csak akkor elgsges, ha tallhatk olyan

Ind

X diszkrt eloszls minta. A T (X) statisztika


g fggvnyek, melyekre P (X = x) = h(x)

g (T (x)).

Bizonyts.
:

Tegyk fel, hogy

T (X)

elgsges statisztika. Ekkor

P (X = x) = P (X = x|T (X) = T (x)) P (T (X) = T (x)) = h(x) g (T (x)),


-tl.
P (X = x) = h(x) g (T (x)),

felhasznlva, hogy az els tnyez nem fgg

Most tudjuk, hogy

h(x) g (t)
X
=
P (X = y)

P (X = x, T (X) = t)
=
P (T (X) = t)

P (X = x|T (X) = t) =

T (X)

meg kell mutatni, hogy

y:T (y)=t

elgsges statisztika.

h(x) g (t)
X

h(y) g (T (y))

y:T (y)=t

h(x)
X
,
h(y)

ha

T (x) = t,

y:T (y)=t
egybknt pedig a feltteles valsznsg nulla.
A ttelnek az a jelentsge, hogy mdszert ad arra, hogyan lehet elgsges statisztikt tallni.

2.2. Plda.

Legyen

X1 , ..., Xn P oisson(),

pn; (x) = P (X = x) =

n
Y

-ra!

keressnk elgsges statisztikt

i=1

P
xi
xi
1
= en Qn
= Qn
e|n {z
x}i ,
xi !
xi !
X
i=1 xi !
| i=1
{z }
g (
xi )
h(x)
| {z }
:=T (x)

azaz a mintaelemek sszege elgsges statisztika.


Abszolt folytonos mintra az elz denci nem mkdik, mivel sok
esemny minden

t-re 0

statisztikra a

valsznsg, gy a feltteles valsznsg nem rtelmes.

{T (X) = t}

Neyman faktorizcis

ttele viszont egy olyan lltst fogalmaz meg, ami abszolt folytonos esetben is rtelmes, ha a valsznsg
helyett srsgfggvnyt runk.

2.2. Denci.
T (X)

Legyen

statisztika

elgsges

fn; (x). A
fn; (x) = h(x) g (T (x))

abszolt folytonos minta, srsgfggvnyeinek csaldja legyen


a

paramterre, ha ltezik a srsgfggvnynek

alak faktorizcija.

2.3. Plda.

Legyen

Xi E(0, b), b

fn;b (x) =

n
Y

a paramter. Prbljunk faktorizlni!

f1;b (xi ) =

i=1

n
Y
1
i=1

1
(n)
I(0 xi b) = I(x1 0) n I(x(n)
n b),
|
{z
} |b
{z
}
h(x)

(n)

gb (xn )
teht

(n)

Xn

elgsges statisztika.

Mj.: Nyilvn, ha

olyan

elgsges, akkor annak egy klcsnsen egyrtelm

minimlis elgsges

fggvnye is az, st minden

kiszmolhat. A gyakorlatban minl egyszerbb, gynevezett

statisztikt keresnk.

Ennek a fogalomnak adhat precz matematikai denci, de

statisztika elgsges, amelybl

ezzel most nem foglalkozunk.

2.1. Feladat.
1)
2)
3)
4)
5)

Keressnk elgsges statisztikt a paramter(ek)re a kvetkez mintkbl:

Geo(p)
Bin(m, p) m ismert
Exp()
N (m, )
P
E(a, a)
1)
Xi elgsges:

Xi
Xi
Xi
Xi
Xi

Mo:

pn;p (x) =

n
Y

(1 p)xi 1 p = (1 p)

xi n n

p .

i=1
2)

Xi

elgsges:

pn;p (x) =

n  
Y
m

xi

i=1
3)

Xi

xi

mxi

p (1 p)

=p

xi

P
mn xi

(1 p)

n  
Y
m

xi

i=1

elgsges:

fn; (x) =

n
Y

exi = n e

xi

i=1
4) Ha

(m, )

ismeretlen, akkor

fn;m, (x) =

n
Y

i=1

1
2 2

P
P
( Xi , Xi2 )

(xi m)2
2 2

elgsges:

n

1
2 2

e 22

(xi m)2

=
Ha

ismert, akkor

Xi

5)

n

1
2 2

e 22 (

x2i 2m

xi +nm2 )

elgsges:

fn;m (x) =
P
m ismert, akkor (Xi m)2
max |Xi | elgsges:

Ha

1
2 2

n

e 22

x2i

e 22 (nm

2m

xi )

elgsges.

n
Y
1
1
1
(n)
I(a < x < +a) =
I(|xi | < a i = 1, ..., n) =
I(|x|n < a).
n
n
2a
(2a)
(2a)
i=1

fn;a (x) =

3. Becslsek s jsguk
Legyen

X1 , ..., Xn (fggetlen, azonos eloszls) minta az F eloszlsfggvny eloszlsbl. Szeretnnk


() fggvnyt becslni (gyakran magt a paramtert kell becslni, de nem mindig). Nem

a paramter

remlhetjk, hogy a pontos rtket eltalljuk, de azt igen, hogy jl meg tudjuk kzelteni.

3.1. Denci.
Azrt
mint
1)
2)
3)

()

mennyisg

becslse valamely T (X) statisztika.

be egy j elnevezst a T (X) statisztikra,


mert most gy gondolunk r,
() mennyisget jl kzelt becslsre.
Mit vrhatunk el a T (X) becslstl?
A T (X) becsls nagyjbl () krl ingadozzk.
A T (X) minl kevsb ingadozzk () krl, azaz a becsls legyen minl pontosabb.
Tegyk fel, hogy minden n mintaelemszmra van egy Tn becslsnk. Megkvetelhetjk a
Tn (X1 , ..., Xn ) () sztochasztikus konvergencit.
vezettnk

3.2. Denci.

T (X)

becsls

torztatlan ()-ra, ha
E (T (X)) = () .

T (X)

ltalban a

3.1. Plda.

becsls

Legyen

torztsa a bT () = E (T (X)) () fggvny.

X1 , ..., Xn F

() = E (Xi ).
n

E (X) = E (

Ekkor

torztatlan becsls, mivel

1X
1X
Xi ) =
E (Xi ) = ().
n i=1
n i=1 | {z }
()

Ez alkalmazhat pldul a Poisson vagy az indiktor eloszls paramternek becslsre.

3.2. Plda.
nem

1
1
p -re! Belthat, hogy X
torztatlan, st, 1/p-t nem lehet torztatlanul becslni. Beltjuk ugyanis, hogy (p)-t akkor s csak

akkor lehet

Indiktor eloszls mintnl keressnk torztatlan becslst

(p) =

n elem indiktor-mintbl torztatlanul becslni, ha (p) p-nek legfeljebb n-edfok polinomja.


T tetszleges becsls.
X
P
P
Ep (T (X1 , ..., Xn )) =
T (x1 , ..., xn ) p xi (1 p)n xi ,

Legyen ugyanis

x{0,1}n

n-edfok
1) I(Xk = 1) (k n).

ez pedig legfeljebb

3.3. Denci.

polinomja

Tn (X1 , . . . , Xn )

p-nek.

Msrszt

pk

egy torztatlan becslse:

aszimptotikusan torztatlan becslssorozat

E (Tn (X1 , . . . , Xn )) ()

()-ra,

I(X1 = 1) I(X2 =

ha

-ra

(n ).

A gyakorlatban, ha elg nagy a minta, akkor ltalban egy aszimptotikusan torztatlan becsls is megfelel.

3.4. Denci.
ha

Legyenek T1 , T2 torztatlanok ()-ra. Ekkor azt mondjuk, hogy T1 hatsosabb T2 -nl,


D2 (T1 ) D2 (T2 ) minden -ra. A T (torztatlan) becsls hatsos, ha minden torztatlan becslsnl

hatsosabb.
Mj:

Kt becsls nem biztos, hogy sszehasonlthat hatsossg szempontjbl, hiszen lehet, hogy

bizonyos

-kra D2 (T1 ) < D2 (T2 ),

msokra viszont

D2 (T1 ) > D2 (T2 ).

Mj: Nem torztatlan becslsek esetn az tlagos ngyzetes vesztesget, azaz az

E [(T ())2 ] mennyisget

akarhatjuk minimalizlni.

3.1. Ttel.

Ha

T1

T2

is hatsos, akkor

valsznsggel megegyeznek, azaz

P (T1 = T2 ) = 1

minden

esetn.

Bizonyts.

A torztatlansg miatt
D2 (T2 ) minden -ra. Legyen most

E (T1 ) = E (T2 ) = (), s mivel mindkt becsls hatsos, D2 (T1 ) =

T1 + T2
.
2
E (T ) = (), msrszt T1
T =

Egyrszt

is torztatlan, hiszen

D2 (T1 ) D2 (T ) =
azaz

D2 (T1 ) cov (T1 , T2 ).

 1
1
1
D2 (T1 ) + D2 (T2 ) + 2cov (T1 , T2 ) = D2 (T1 ) + cov (T1 , T2 ),
4
2
2
tosztva kapjuk, hogy

miatt azonban

a=1

cov (T1 , T2 )
= R (T1 , T2 ),
D (T1 )D (T2 )

T1 = aT2 + b teljesl 1
b = 0 lehet csak.

azaz az ismert ttel szerint

hatsossga miatt

valsznsggel. A vrhat rtkek s szrsok egyezse

3.2. Ttel.

X = (X1 , . . . , Xn ) fggetlen, azonos eloszls minta. Legyen () = E (XiP


), tovbb
n
D2 (Xi ) < minden -ra. Ekkor X hatsosabb becslse ()-nak minden i=1 ci Xi

Legyen

tegyk fel, hogy

alak torztatlan becslsnl.

Bizonyts.

Pn

i=1 ci Xi akkor s csak akkor torztatlan, ha

Vegyk elszr szre, hogy

Pn

i=1 ci

= 1.

Szmtsuk ki a szrsngyzeteket!

D2 (X) =

D2 (Xi )
,
n

X
X
X
D2 (
ci Xi ) =
D2 (ci Xi ) = (
c2i )D2 (Xi ).

Azt kell teht beltni, hogy

X
1

c2i .
n
i=1
A szmtani s ngyzetes kzp kztti egyenltlensgbl

rP

c2i

3.3. Plda.

Legyen

Xi E(0, b),

ci
1
= ,
n
n

E(0, 1)
n tn1 , teht

c2i

n
1
= .
2
n
n

n + 1 (n)
Xn ,
n

b-re:

T2 = 2 X.

(n)
(n)
Xi = bYi , ahol Yi E(0, 1), ekkor Xn = bYn , teht
(n)
(n)
(n)
eloszlssal foglalkozni. Yn
eloszlsfggvnye: P (Yn
< t) = tn , Yn srsgfggvnye:

nyilvn torztatlan, s

elg az

s vizsgljuk a kvetkez kt becslst

T1 =
T2

azaz

T1

is az: legyen ugyanis

E(Yn(n) ) =

n
n+1

t ntn1 dt = n

1
n
=
.
n+1
n+1

Ebbl

Eb (T1 ) = b.

Melyik becsls a hatsosabb?

Db2 (T2 ) = 4

Db2 (Xi )
4 b2
b2
=
=
.
n
n 12
3n

Msrszt

(Yn(n) )

1
2

t nt

n1


dt

Tovbb

(n)

(n)

Db2 (Xn ) = b2 Db2 (Yn ),

n
n+1

3.5. Denci.
(n ),

T1

n
=

n+2

2
n
=
n+1
n(n + 1)2 n2 (n + 2)
n
=
=
.
2
(n + 1) (n + 2)
(n + 1)2 (n + 2)

azaz

Db2 (T1 ) =
Kaptuk teht, hogy

2

hatsosabb

Tn (X1 , ..., Xn )

T2 -nl

n+1
n

2

(minden

becslssorozat

Db2 (Xn(n) ) =

b2
.
n(n + 2)

n-re).

konzisztens ()-ra,

azaz

P (|Tn ()| > ) 0 .

ha

Tn ()

sztochasztikusan

3.4. Plda.

a) A mintatlag konzisztens becsls a vrhat rtkre:

X E (Xi )

sztochasztikusan (ez a

nagy szmok gyenge trvnye).

E (Tn ) = () (azaz Tn torztatlan becsls, de


D2 (Tn ) 0 (n ), akkor Tn konzisztens, mivel

b) Ha
s

az is elg lenne, hogy aszimptotikusan torztatlan)

D2 (Tn )
0.
2

Cseb

P (|Tn ()| > )


c) Legyen

Xi E(0, ),

Tn =

n+1 (n)
n Xn . Ez a fentiek szerint konzisztens becslssorozat, hiszen

D2 (

2
n+1
Xn(n) ) =
0.
n
n(n + 1)

4. Fisher-informci

4.1. Denci.

Legyen az X = (X1 , . . . , Xn ) minta eloszlsfggvnyeinek csaldja Fn; .


Ekkor az
Ln (x; ) likelihood fggvnyt a kvetkezkppen deniljuk: abszolt folytonos minta esetn Ln (x; ) =
fn; (x), diszkrt minta esetn Ln (x; ) = pn; (x).

4.2. Denci.

Az

elem,

Fn;

Fisher-informcija az

eloszlsfggvny minta

In () = E ([

ln Ln (X; )]2 )

rtk, ha a derivlt ltezik, s ez a mennyisg vges.

4.1. Ttel. (*)

X1 , . . . , Xn fggetlen, azonos eloszls mintaelemek,


L1 (xi ; ). Tegyk fel, hogy I1 () < , tovbb hogy

Legyenek

likelihood fggvnyt

E (
Ekkor

s jellje egy mintaelem

ln L1 (X1 ; )) = 0.

In () = n I1 ().

Bizonyts.

A felttel miatt

E (

I1 () = D2 (
ln L1 (X1 ; )),

tovbb

n
n
Y
X

ln Ln (X; )) = E (
ln
L1 (Xi ; )) =
E (
ln L1 (Xi ; )) = 0.

i=1
{z
}
i=1 |
0

Ebbl kvetkezik, hogy

In () = D2 (

n
n
X
X

ln L1 (Xi ; )) = n I1 ().
ln Ln (X; )) = D2 (
ln L1 (Xi ; )) =
D2 (

{z
}
i=1
i=1 |
I1 ()

Mj: A felttel gyakran teljesl, mivel ez egy bederivlhatsg lruhba bjtatva. Tegyk fel mondjuk,
hogy a minta abszolt folytonos. Tudjuk, hogy

f1; (x) dx = 1

f1; (x) dx = 0.

Ha a derivls s integrls felcserlhet, azaz be lehet derivlni, akkor kapjuk, hogy

0=

f1; (x) dx =

+
f1; (x)

f1; (x)

f1; (x) dx =

ln f1; (x)f1; (x) dx = E (


ln f1; (X1 )).

Diszkrt esetben, hasonlan, a ttel felttele azzal ekvivalens, hogy

X
X
p1; (x1 ) =
p1; (x1 ).
x

x
1

Ez biztosan teljesl, ha a valsznsgi vltoz rtkkszlete vges.

4.1. Plda.

Legyen

Xi Ind(p).

Ekkor

L1 (x, p) = px (1 p)1x (x {0, 1}),

amibl

x 1x
ln L1 (x, p) =
.
p
p
1p
Ellenrizzk a

(*) Ttel felttelt!



Ep

p 1p
ln L1 (Xi , p) =
= 0.
p
p 1p

Teht az egyelem minta Fisher-informcija:

I1 (p) = Dp2
s

In (p) = n I1 (p) =

4.2. Plda.

Legyen





Xi
1
ln L1 (Xi , p) = Dp2
=
,
p
p(1 p)
p(1 p)

n
.
p(1 p)

Xi N (, 0 ),

ahol

ismert. Ekkor

L1 (x, ) = p

202

(x)2
2
20

Logaritmust vve

ln L1 (x, ) = ln p

202

Ellenrizzk a

(x )2
.
202

(*) Ttel felttelt!







2(Xi )
E (
ln L1 (Xi , ) = E
= 0.

202

Ebbl

I1 () =
s

In () =
Mj:

D2

Xi
02


=

D2 (Xi )
1
= 2,
4
0
0

n
.
02

Nzhetnnk azt is, hogy a minta mennyi informcit tartalmaz a paramter valamely

fggvnyre, illetve mennyi informcit tartalmaz egy paramtervektorra nzve.

()

Ezekkel most nem

foglalkozunk.
Bizonyts nlkl megjegyezzk a kvetkezt. Legyen
b legyen

T = T (X)

minta, a benne rejl informci

egy statisztika, a benne rejl informcit jellje

regularitsi felttelek mellett)

IT () IX (),

IT ().

IX ().

Tovb-

Belthat, hogy (bizonyos

s egyenlsg akkor s csak akkor van, ha

elgsges

statisztika. Pldul a kvetkez regularitsi feltteleket szoktk tenni:


1)
2)

p
L1 (x, ) folytonosan dierencilhat szerint,
> I1 () > 0, s I1 () folytonos -ban.

Ha ezek teljeslnek, akkor minden

szp s j , pl.

ekkor teljesl a

(*) ttel bederivlhatsgi felttele.

A kvetkez ttel arrl szl, hogy egy torztatlan becsls nem lehet tetszlegesen pontos, a szrsngyzetre adhat egy als korlt, mely a mintban tallhat informci mennyisgtl fgg (azonban ez az
als korlt ltalban nem les).

10

4.2. Ttel. (Cramr-Rao egyenltlensg) Legyen X = (X1 , ..., Xn ) minta, s tegyk fel, hogy tel2
jeslnek a (*) ttel felttelei. Legyen mg T (X) olyan torztatlan becslse ()-nak, melyre D (T ) <
minden

-ra.

Feltesszk mg a kvetkez bederivlhatsgi felttelt:




ln Ln (X; ) .
0 () = E T (X)

Ekkor

D2 (T )

Bizonyts.

( 0 ())2
In () teljesl minden

-ra.

Az tlet: tudjuk, hogy minden

S -re

cov (T, S)2 D2 (T )D2 (S)


Ez olyan

cov (T, S)2


.
D2 (S)

D2 (T )

vlasztssal ad hasznlhat korltot, melyre

cov (T, S) = E (T S) E (T )E (S) = E (T S) ()E (S)


nem fgg

T -tl.

Legyen

ln Ln (X; ),

S =

(*) Ttel egyik felttele), teht


msrszt

E (S) = 0

ez a felttel szerint j lesz. Egyrszt

(ez volt a

cov (T, S) = E (T S) = 0 (),

D2 (S) = In ().

Mj: Nzzk a felttelt!

Z
() = E (T ) =

T (x)fn; (x) dx .

Bederivlhatsg esetn ebbl

0 () =

Az als korlt, azaz a

-ra,

( 0 ())2
In ()

T (x)




fn; (x) dx = E T (X)


ln Ln (X; ) .

mennyisg neve

akkor azt mondjuk, hogy a

informcis hatr.

Ha

D2 (T ) =

( 0 ())2
In () teljesl minden

becsls elri az informcis hatrt. Nyilvn, ha a

torztatlan becsls

elri az informcis hatrt, akkor hatsos.


Specilisan, ha magt a paramtert akarjuk becslni, akkor

() = ,

azaz az informcis hatr

1/In ().

4.1. Feladat.

02 /n,

4.2. Feladat.
p(1 p)/n,

Xi N (, 0 ), -ra keressnk hatsos becslst!


D2 (X) = 02 /n, ezrt X hatsos becsls -ra.

Legyen

ugyanakkor

Az informcis hatr

Xi Ind(p), p-re keressnk hatsos becslst! Az


Dp2 (X) = p(1 p)/n, ezrt X hatsos becsls p-re.

Legyen

informcis hatr

1/In () =

1/In (p) =

ugyanakkor

4.3. Feladat.

Legyen

Xi Exp(), () =

1
-t szeretnnk becslni. Tudjuk, hogy

torztatlan becsls.

Szrsngyzete

D2 (X) =

1
2

1
.
2 n

A Fisher-informci:


E
Ebbl

I1 () = D2







1
ln f1; (Xi ) = E
(ln Xi ) = E
Xi = 0.

Xi

= D2 (Xi ) =

informcis hatr teht

Kaptuk, hogy

hatsos becsls

1
n
, In () =
.
2
2
2
12
1
=
.
n
n 2
2

1/-ra.
11

Most

() = 1/, 0 () = 1/2 .

Az

4.4. Feladat.

Legyen

4.5. Feladat.

Legyen

f1; (x)

Xi Poisson().

Xi E(0, ).

0x

nem folytonosan derivlhat


f1; (x) =

ha

egybknt

"
I1 () = E
felhasznlva, hogy

In () = E

ln

Mutassuk meg, hogy

hatsos becsls

Most nem teljeslnek a regularitsi felttelek, rgztett

mellett

"
2 #
2 # 
2

1
1
1
ln L1 (X1 ; )
= E
ln
=
= 2,

X1 < , azaz 1 valsznsggel L1 (X1 ; )


 n 2
n2
=
= 2 = n2 I1 ().

szerint.

valsznsggel

 
1 n 2

-ra!

rgztett,

rgztett,

a vltoz

derivlhat. Ugyanakkor

a vltoz

6
f1; (x)

f1; (x)
itt nem
derivlhat

5. Becslsi mdszerek
5.1. Blackwellizls

X, Y diszkrt
valsznsgi vltozk, akkor X
P
Y = y felttel mellett E(X|Y = y) = x x P (X = x|Y = y) = V (y). Az X
az Y vltozra nzve pedig E(X|Y ) = V (Y ). Ez teht nem egy szm, hanem

Elszr nzznk egy kis ismtlst! Ha

feltteles vrhat

rtke az

feltteles vrhat

rtke

egy valsznsgi

vltoz. Bizonyts nlkl eleventsk fel a kvetkez tulajdonsgokat:


1)
2)
3)
4)

E(c|Y ) = c
E(X1 + X2 |Y ) = E(X1 |Y ) + E(X2 |Y )
E(cX|Y ) = cE(X|Y )
X1 X2 E(X1 |Y ) E(X2 |Y ).

Ezeken kvl szksgnk lesz mg nhny tulajdonsgra:


5) Teljes vrhat rtk ttele:

E (E(X|Y )) = E(V (Y )) =

V (y) P (Y = y) =

XX

x P (X = x|Y = y) P (Y = y) =

X X
X
x P (X = x) = E(X).
x
P (X = x|Y = y) P (Y = y) =
x

5) Kiemels:

P (X=x)

E(XW (Y )|Y ) = W (Y )E(X|Y ),

{z

teljes valsznsg ttele

magyarzat:

rgztse mellett

W (Y )

konstans, azaz

kiemelhet a vrhat rtkbl


6)

Teljes

szrsngyzet

E (X E(X|Y )) |Y

ttele:

D2 (X)


E D2 (X|Y ) + D2 (E(X|Y )),

ahol

D2 (X|Y )

Bizonyts:



D2 (X|Y ) = E X 2 2XE(X|Y ) + E(X|Y )2 |Y = E(X 2 |Y ) E (2XE(X|Y )|Y ) + E E(X|Y )2 |Y =
E(X 2 |Y ) 2E(X|Y )E(X|Y ) + E(X|Y )2 = E(X 2 |Y ) E(X|Y )2 .

12

Vrhat rtket vve:







E D2 (X|Y ) = E E(X 2 |Y ) E E(X|Y )2 = E(X 2 ) E(X)2 E E(X|Y )2 E(X)2 .
|
{z
} |
|
{z
}
{z
}
D 2 (X)

E(X 2 )

Kvetkezmnyknt kapjuk, hogy

5.1. Plda.
Az

{Y = y}

D 2 (E(X|Y ))

D2 (E(X|Y )) D2 (X).
n-szer. Legyen X a hatosok szma, Y a pratlanok
Bin(n y, 1/3). Teht E(X|Y ) = (n Y )/3. Erre

Dobjunk fel egy szablyos kockt


felttel mellett

eloszlsa

E(E(X|Y )) = E((n Y )/3) =


Msrszt

D2 (X|Y ) = (n Y )

n
n E(Y )
= ,
3
6

1 2
2(n Y )
=
,
3 3
9

E(X) =

n
.
6

E(D2 (X|Y )) =

n
.
9

szma.

Vgl

D2 (X) =

5n
,
36

5.1. Ttel. (Rao-Blackwell ttel) Legyen X


elgsges statisztika

Bizonyts.

-ra.

Ekkor

U = E(S|T )

diszkrt minta,

Mj:

torztatlan becslse

is torztatlan becsls

()-ra,

()-nak, T
S -nl.

pedig

s hatsosabb

A feltteles vrhat rtk tulajdonsgaibl rgtn ktetkezik:

E (U ) = E (E (S|T )) = E (S) = (),

-tl,

n
.
36

D2 (E(X|Y )) =

Azt, hogy

D2 (U ) = D2 (E (S|T )) D2 (S).

elgsges statisztika, ott hasznltuk fel, hogy az

azaz a mintbl kiszmolhat mennyisg.

E(S|T )

vrhat rtk nem fgg

Az eljrsnak lnyege teht az, hogy egy akrmilyen

torztatlan becsls hatsossgt javthatjuk azzal, ha egy elgsges statisztikra vett feltteles vrhat
rtkt kpezzk.

Ennek az eljrsnak elnevezse

blackwellizls.

A ttelbl kvetkezik, hogy ha van

hatsos becsls, akkor az tetszleges elgsges statisztiknak fggvnye.

5.2. Plda.

Legyen

Xi Geo(p), p-t

szeretnnk becslni.

Elgsges statisztika:

T =

n
X

Xi .

Egy

i=1
egyszer torztatlan becsls:

S = I(X1 = 1).

Blackwellizljunk, azaz szmoljuk ki az

U = E(S|T ) = V (T )

becslst!

V (`) = Ep (S|T = `) = 0 Pp (S = 0|T = `) + 1 Pp (S = 1|T = `) = Pp (X1 = 1|

n
X

Xi = `) =

i=1

Pn
Pp (X1 = 1 , i=1 Xi = `)
Pn
.
P ( i=1 Xi = `)
A szmll

Pp (X1 = 1,

n
X

X1 = `) = Pp (X1 = 1,

n
X

i=1

n
X
Xi = ` 1) = Pp (X1 = 1)Pp (
Xi = ` 1).

i=2

i=2

Pn

Xi N egBin(n, p). Teht



Pn
`2 n1
p n2
p
(1 p)`n
Pp (X1 = 1)Pp ( i=2 Xi = ` 1)
n1
Pn
=
V (`) =
=
.

`1
n
`n
`1
P ( i=1 Xi = `)
n1 p (1 p)

A neveznl pedig azt hasznljuk, hogy

Azaz

Pn
n1
U = V ( i=1 Xi ) = Pn
i=1 Xi 1

i=1

lesz az

blackwellizltja (megmutathat, hogy ez hatsos becs-

ls).

13

5.1. Feladat.

Legyen

Xi P oisson(),

keressnk j torztatlan becslst

() = e -ra

blackwellizls-

sal!
Els tlet:

eX ,

de belthat, hogy ez nem torztatlan.

e = P (X1 = 0),

Vegyk szre, hogy

E (S|T = `) = P (X1 = 0|

S = I(X1 = 0)

azaz

n
X

Pn

i=1

Xi = `) =

Xi Poisson(n)


1

V =

1
n

Pn

i=2

P

Xi

T =

((n1))`
`!
(n)`
`!

e e(n1)
en

i=1
Felhasznltuk, hogy

j lesz. Tovbb

Xi Poisson((n 1)).

Pn

i=1


=

Xi

1
1
n

elgsges.

`
.

Azaz a megjavtott becsls:

X
n

1

= 1
.
n

| {z }
e1

5.2. Feladat.

Legyen

Xi Ind(p),

keressnk j torztatlan becslst

(p) = p2 -re

blackwellizlssal!

X , de ez nem torztatlan.
Pn
S = I(X1 = 1, X2 = 1), T = i=1 Xi ,
Els tlet:

Ep (S|T = `) = Pp (X1 = 1, X2 = 1 |

n
X

Xi = `) =

i=1

P
azaz a megjavtott becsls

Xi

V =

n2 `2
(1
`2 p

n `
n`
` p (1 p)

pp

p)n

`(` 1)
,
n(n 1)

Xi 1
.
n1

5.2. Tapasztalati becsls


A tapasztalati becsls azt jelenti, hogy az elmleti eloszls valamely jellemzjt a tapasztalati eloszls
megfelel jellemzjvel becsljk. Ezek a becslsek ltalban konzisztensek, mivel a tapasztalati eloszlsfggvny tart az elmletihez. A kvetkez tblzatban tapasztalati becslsre ltunk nhny pldt.

Elmleti eloszls

Jellemz
vrhat rtk
szrsngyzet
terjedelem
eloszlsfggvny

E(X)
D2 (X)
sup{ x | F (x) < 1 } inf{ x | F (x) > 0 }
F (x) = P (X < x)

Tapasztalati
eloszls
P
1
n
1
n

Xi = X
2
i=1 (Xi X)
(n)
(n)
Xn X1
Pn
1
i=1 I(Xi < x)
n
Pi=1
n

= Sn2
= Fn (x)

5.3. Maximum likelihood becsls

5.1. Denci.

Legyen

X1 , ..., Xn

minta

maximum likelihood (ML) becslse

F eloszlsbl, . Ekkor a
= max{Ln (X; ) : }.
Ln (X; )

ha

Lehet, hogy ilyen nem ltezik, vagy nem egyrtelm. Ha


csinlni:

ln Ln (X; ) = 0 likelihood egyenlet

Ln (X; )

"elg sima", akkor a kvetkezt szoks

megoldst keressk.

5.3. Plda.

P
Qn
P
Xi Exp(). Ln (X; ) = i=1 eXi = n e Xi , ln Ln (X; ) = n ln Xi ,
P
n
1

n
= 1 .
Xi , ez akkor 0, ha = P
, azaz
=
ln Ln (X; ) =
Xi
X
X

5.4. Plda.
+ 1).

Xi

n
(n)
(n)
+ 1). Ln (X; ) = I( Xi + 1, i) 11h = I( Xi1 , Xn
Xn(n) 1, X (n) rtk ML
maximumhelye nem egyrtelm, minden
1

Egyenletes(,

Ennek a fggvnynek a

becsls.

14

5.2. Ttel.
Bizonyts.

Ha ltezik ML becsls, akkor az megadhat a


A faktorizcis ttel alapjn

elgsges statisztika fggvnyeknt.

Ln (X; ) = h(X) g (T (X)),

ahol

szerinti maximumhely keressben. Azaz a maximumhelyek halmaza csak

5.3. Ttel.

Legyen

X1 , ..., Xn

minta az

eloszlsbl,

h(X) nem jtszik


T (X)-tl fgg.

ML becslse pedig

Ekkor

()

szerepet a

ML becsls

()-ra.

Bizonyts.

n (x; ) = sup { Ln (x; ) | () = } az induklt likelihood fggvny. Denci


L
s L
= Ln (x; )
.
n (x; ) maximumhelye -ben. L
n (x; ) Ln (x; )
n (x; ())
szerint () ML becslse L
n
o

Teht Ln (x; ()) = max


Ln (x; )
Legyen

A ML becsls ltalban nem torztatlan.

Azonban a kvetkez ttel szerint bizonyos ers felttelek

mellett a ML becslsnek  j aszimptotikus tulajdonsgai vannak.

Ez az egyik oka annak, hogy ez a

mdszer a legelterjedtebb a gyakorlatban.

5.4. Ttel.

Bizonyos (ers) regularitsi felttelek mellett elg nagy

konzisztens,

n-re

n (n ) N (m(), ())
torztatlan: m() = 0.
1
2
optimlis: () =
I1 () .

a)

aszimptotikusan normlis eloszls:

b)

aszimptotikusan

c)

aszimptotikusan

ML becsls ltezik,

eloszlsban

(n ).

5.5. Plda.

Xi E(a,
nb), adjuk meg a paramterek ML becslst!
1
Ln (X; a, b) =
I(a Xi b i), azaz a legkisebb olyan [a, b]
ba
(n)
(n)
mindegyik meggyelst tartalmazza. Azaz a
= X1 , b = Xn .

intervallumot keressk, amely

5.6. Plda.

Xi N(m, ), adjuk meg a paramterek ML becslst!



n
n
P
Y
(X m)2
(Xi m)2
1
1
1
i22

Ln (X; m, ) =
e
=
n e 22 ,

2
2
i=1 
P
n
1
(Xi m)2
ln Ln (X; m, ) = ln
n ln
.
2 2
2
A likelihood egyenlet most kt egyenletbl ll:
P
(Xi m)2

ln
L
(X;
m,
)
=
= 0,
n
m
2P
n 2 (Xi m)2

=0
ln Ln (X; m, ) =
2 3
P
P
(1)
Xi = n m
m
= PnXi = X
P
(Xi m)2
(2)
(Xi m)2 = n 2 2 = P
n

2 = n1 (Xi X)2 = Sn2


5.4. Momentumok mdszere
Ezt a mdszert akkor szoks alkalmazni, ha sok ismeretlen paramter van, s a ML becslst nehz
kiszmtani. Az eljrs a kvetkez.
Eljrs
1)

Az eloszls

`.

(elmleti) momentuma:

` = E (Xi` )

Felrunk annyi momentumot, amennyi meghatrozza az eloszlst.


2)

Kifejezzk az ismeretlen paramtereket a momentumok segtsgvel.

3)

E (Xi` )

helybe

1
n

n
X

Xi` -et

runk (ezek a tapasztalati momentumok).

i=1

5.7. Plda.

Xi E(a, b).

2
a+b
(b a)2
a+b
2
2
2
1 = Ea,b (Xi ) =
, 2 = Ea,b (Xi ) = Da,b (Xi ) + Ea,b (Xi ) =
+
2
12
2
Legyen

15

(b a)2
= 2 21
12

p
12(2 21 )
p
b = 1 + p3(2 21 )
a = 1 3(2 21 )
q
q

P 2
P 2
2
2
Xi X ) = X 3Sn , b = X + 3( n1
Xi X )X + 3Sn .
a
= X 3( n1

5.8. Plda.

Legyen

ba =

Xi E(a, a).

1 = Ea (Xi ) = 0
a2
2 = Ea (Xi2 ) =
3

32
q
P
a
= 3 n1 Xi2 .
a=

5.5. Intervallum becslsek


Eddig gynevezett

pontbecslsekkel foglalkoztunk, azaz a paramtert (vagy annak fggvnyt) egyetlen

rtkkel becsltk meg. A pontbecsls bizonytalansgt a becsls szrsval fejezhetjk ki. Ha pldul
a becslsrl belthat, hogy aszimptotikusan normlis eloszls, akkor az igazi paramter kb.
valsznsggel a pontbecsls krli

2szrs

sugar intervallumban van.

95%

A becslsben rejl bizonyta-

lansgot kifejezhetjk gy is, hogy a paramtert nem egy rtkkel, hanem egy intervallummal becsljk.

5.2. Denci.

Legyen X = (X1 , ..., Xn ) minta F eloszlsbl, ahol vals paramter. Azt mondjuk,
(T1 (X), T2 (X)) intervallum legalbb 1 megbzhatsgi szint kondencia-intervallum -ra (rvKI(1 ), ha
P (T1 (X) < < T2 (X)) 1 .

hogy a
iden

Mj: A KI pontos megbzhatsgi szintje

inf { P ( (T1 , T2 )) } .

5.5. Ttel.

Ha

(T1 , T2 )

KI(1

) -ra,

akkor

(S1 , S2 )

S1 = inf { () | (T1 , T2 ) }

KI(1

) ()-ra,

ahol

S2 = sup { () | (T1 , T2 ) } .

Az egyik legfontosabb (s legszebb) eset a normlis eloszls vrhat rtkre KI konstrulsa, ismert
vagy ismeretlen szrs mellett. Nzzk meg ezeket!

5.9. Plda.

Legyen

Xi N (, ),

Kiindulsknt vegyk szre, hogy

ahol

az az rtk, melyre

-re KI(1 )-t!


X

X N (, n ), azaz n
N (0, 1). Ezrt




X
< u = 1 ,
P n
2

ahol

ismert,

ismeretlen. Adjunk

(u ) = 1 ,

ezt tblzatbl nzhetjk ki.

6
1

u 2

u 2

Ebbl megkaphatjuk a KI als s fels hatrt:



u
u
u
n
X < u 2 X < 2 X 2 < < X + 2 .

n
n
n

Azaz kaptuk, hogy

u
T1 = X 2 ,
n

u
T2 = X + 2 .
n
16

Ha a

eloszlst, a

szrs nem ismert, akkor nehezebb dolgunk van. A megoldshoz meg kell ismernnk kt j

2 -eloszlst

5.3. Denci.

s a

Legyenek

t-eloszlst.

Xi N (0, 1) fggetlenek, s Y =

n szabadsgfok khi-ngyzet eloszlsnak


nevezzk, jells: Y

khi eloszlsnak nevezzk, jells: Y n .


Knny ltni, hogy ha

Y 2n ,

akkor

E(Y ) = n

n
X

Xi2 .

D2 (Y ) = 2n.

Az

i=1
2n . Tovbb

valsznsgi vltoz eloszlst

n szabadsgfok

A khi-ngyzet eloszls srsgfggvnye

is kiszmolhat, erre azonban nem lesz szksgnk. Csak megjegyezzk, hogy

1 ex/2 , n = 2-re pedig az Exp(1/2) eloszlst kapjuk. Ha


2x
monoton n, majd monoton cskken.

eloszlst

n 3,

n = 1-re

a srsgfggvny

akkor a srsgfggvny egy darabig

X
X N (0, 1), Y n fggetlenek. Legyen Z = n . Ekkor a Z valsznsgi
Y
vltoz eloszlst n szabadsgfok t eloszlsnak, vagy n szabadsgfok Student eloszlsnak nevezzk, jells:
Z tn .

5.4. Denci.

tn

Legyen

eloszls srsgfggvnye is kiszmthat, de pontos alakjra nem lesz szksgnk. Knnyen ltszik,

n
n2
esetn a standard normlishoz tart, de vastagabb a farka (srsgfggvnye

hogy a srsgfggvny szimmetrikus, azaz


(n

> 2). A tn eloszls n


x-re kb. cn x(n+1) ).

E(Z) = 0 (n > 1).

Megmutathat, hogy

D2 (Z) =

nagy

6
vsz
tn ()

5.6. Ttel (Fisher-Bartlett).


Mj: Legyen

Xi N (, ),

Legyen

Xi N (, ).

Yi = (Xi )/ .

Ekkor

Ekkor

Sn2

fggetlenek, s

n
X
n Sn2
=
(Yi Y )2 .
2
i=1

n Sn2
2n1 .
2
Mivel az

(Yi Y )

valsznsgi vltozk nem fggetlenek, cskken a szabadsgi fok.


Mj: A mintatlag s a tapasztalati szrsngyzet fggetlensge karakterizlja a normlis eloszlst.

5.10. Plda.qLegyen Xi N (, ), s most , ismeretlenek.

Legyen Sn

1
n1

P
(Xi X)2

X
n
N(0, 1)
X

tn1 .
n
= n1

Sn
n 1 Sn
n1




X
n
< tn1 ( ) = 1 ,

Sn
2

ebbl a KI

T1 = X

Legyen

Xi Ind(p).

Kiindulsknt vegyk szre, hogy

-re KI(1 )-t!

a korriglt tapasztalati szrs. Ekkor a Fisher-Bartlett ttel szerint

Azaz

5.11. Plda.

Adjunk

Sn tn1 ( 2 )

Adjunk

p-re

j becsls

T2 = X +

hozzvetleges (aszimptotikus)

p-re,

X p
n p
N(0, 1) P
p(1 p)

Sn tn1 ( 2 )

.
n

 q

p(1p)
X N p,
,
n

p(1 p)

17

ha

KI(1 )-t!
n

elg nagy.

!


X p < u 2

1 .

p-re

A zrjelben ll egyenltlensget kell most

X -et

runk, s a

trendezni. Ms mdszer: a nevezben lv

helybe



X p < u 2

X(1 X)

egyenltlensget rendezzk t.

5.3. Feladat.

Legyen

5.4. Feladat.

Egy cukorgyrban kockacukrokat gyrtanak.

Xi Exp().

Adjunk hozzvetleges

kifejezett lhosszsga kzeltleg normlis eloszls.

KI(1 )-t -ra!


Tegyk fel, hogy a cukrok millimterben

16 darab cukor lhosszsgt megmrve, a kvetkez

adatokat kaptuk:

10.10 8.94
9.61 10.00
10.32 10.26 10.32 10.74

10.42 10.33
9.98 10.23

10.68 9.25
9.88 9.89

10.06, tapasztalati szrsa 0.46.


m vrhat rtkre KI(0.95)-t, ha tudjuk, hogy a szrs = 0.5.
(b) Adjunk KI -t m-re, ha a szrs ismeretlen!
3
(c) Ismert s ismeretlen szrs mellett is adjunk KI(0.9)-t m -re, azaz egy tlagos kockacukor trfogatra
Az adatok tlaga

(a) Adjunk az lhossz

(ami nem egyenl a kockacukrok tlagos trfogatval)!

6. Statisztikai prbk s jsguk


A statisztikai prba olyan eljrs, mellyel eldntjk, hogy a meggyelseink alapjn egy elzetes
felttelezsnk (hipotzisnk) tarthat-e, vagy a meggyelsek ellentmondanak a felttelezsnek.

Nz-

znk egy pldt!


Tegyk fel, hogy egy gyrban minsgellenrzst vgznk, azaz megvizsgljuk, hogy a gyrtott termkek minsge megfelel-e.

Elzetes felttelezsnk szerint a gyrtsi folyamat rendben van, azaz a

termkek legfeljebb 5%-a selejtes.

A felttelezs ellenrzshez 25 vletlenszeren vlasztott termket

megvizsglunk, s ha legfeljebb 3 selejtes van kztk, akkor a felttelezst elfogadjuk. Ellenkez esetben a
felttelezst elvetjk. Krds, hogy j-e ez az eljrs?
Mivel dntsnk egy vletlenszeren vlasztott mintra pl, teljes bizonyossggal nem tudjuk eldnteni, hogy a felttelezsnk helyes-e. Ktfle hibt kvethetnk el:
Ha igaz a felttelezs, mgis elutastjuk, akkor

elsfaj hibt vtnk,


msodfaj hibt vtnk.

Ha nem igaz a felttelezs, mgis elfogadjuk, akkor


Mekkora ezen hibk valsznsge?

Kiszmtshoz az egyszersg kedvrt tegyk fel, hogy a mintt

visszatevssel vesszk. Tovbb jellje

a selejtarnyt.

Elszr tegyk fel, hogy a felttelezs igaz, azaz

p 0.05.

Pp (elsfaj

hiba)

= Pp ( 4

selejt)

25  
X
25
k=4

Ez a valsznsg akkor a legnagyobb, ha

p = 0.05,

= sup Pp ( 4

selejt)

pk (1 p)25k .

gy az elsfaj hiba valsznsge legfeljebb

= P0.05 ( 4

selejt)

= 0.034.

p0.05
Most tegyk fel, hogy a felttelezs hamis, azaz

Pp ( 3

selejt)

p > 0.05.

3  
X
25
k=0

pldul ha a selejtarny

p = 0.1,

akkor

0.763

A msodfaj hiba valsznsge

pk (1 p)25k ,

valsznsggel fogjuk a felttelezst tvesen elfogadni.

Deniljuk most formlisan az alapfogalmakat!

18

6.1. Denci.

(, A, P)

Legyen

paramteres statisztikai mez, teht

P = {P : },

ahol

paramtertr.
Hipotzisek:

H0 : 0
H1 : 1 ,
= 0 1 a paramtertr

nullhipotzis:

ellenhipotzis:
ahol

diszjunkt felbontsa (0

1 = ).

Minta:

X = (X1 , ..., Xn )

vektorvltoz (legtbbszr fggetlen, azonos eloszls),

lehetsges rtkeinek halmaza az

mintatr.

Statisztikai prba:
elfogadsi tartomny:

Xe

Xk ,
X = Xe Xk a mintatr diszjunkt felbontsa (Xe Xk = ).
X Xe , akkor H0 -t elfogadjuk, ha X Xk , akkor H0 -t elutastjuk.
kritikus (elutastsi) tartomny:
ahol

Ha

Az bevezet pldban = [0, 1], 0 = [0, 0.05], 1 = (0.05, 1]. A minta: X = (X1 , . . . , X25 ), ahol
Xi = 1, ha az i-edik kivlasztott termk selejtes, Xi = 0, ha az i-edik kivlasztott termk hibtlan. Azaz
X = {0, 1}25 . A prbt meghatroz tartomnyok:

Xe = {x X :

25
X

xi 3},

Xk = {x X :

i=1

25
X

xi 4}.

i=1

Nagyon fontos, hogy a kt hipotzis szerepe ltalban nem egyenrang. Az alapfeltevst csak nagyon
indokolt esetben szeretnnk elutastani, ezrt az elsfaj hiba slyosabbnak szmt, mint a msodfaj. Az
elsfaj hiba maximlis valsznsgt szoks megadni, emellett termszetesen a msodfaj hiba eslynek
minimalizsra treksznk. Ebbl kifolylag a dntsek rtelmezse is klnbz:

H0 -t
H0 -t

elfogadjuk: nem jelenti azt, hogy igaz, csak azt, hogy nincs okunk elutastani.
elutastjuk: komoly bizonytkot talltunk arra, hogy

H0

nem igaz.

Pldul egy j gygyszer vizsglatnl a gygyszer hatsossgra keresnk bizonytkot, ezrt a hipotzisek:

H0 :
H1 :

a gygyszer nem hatsos,


a gygyszer hatsos.

Folytassuk a dencikat!

6.2. Denci.

Elsfaj hiba:

H0

igaz, mgis elutastjuk. Ennek valsznsge:

P (X Xk ) 0 .

A prba terjedelme:

= sup P (X Xk ).
0
Msodfaj hiba:

H0

hamis, mgis elfogadjuk.

Ennek valsznsge:

P (X Xe ) 1 .

A prba

erfggvnye:

() = 1 P (X Xe ) = P (X Xk ) 1 .
Mskpp

(1 )

a prba ereje a

H1 : = 1

ellenhipotzissel szemben.

Ha egy prbasorozatot vizsglunk, azaz minden

denilt prbnk, akkor ezt jellhetjk a terjedelemben s az erfggvnyben

n -t

(Xen , Xkn ) tartomnyokkal


is: helyett n -t, helyett

mintaelemszmra van egy

rhatunk.

6.1. Plda.

Legyen X E(t, 1 + 2t) egyetlen meggyels, ahol t > 0 ismeretlen.


H0 : t = 0 (egyszer hipotzis  0 egyelem halmaz  nem kell sup a terjedelemben)
H1 : t > 0 (sszetett hipotzis  1 tbbelem halmaz).
A prba: Xe = (0.1, 0.85), (X = R).

= P0 (X Xk ) = 1 P0 (X Xe ) = 1 P0 (0.1 < X < 0.85) = 1 0.75 = 0.25


.
:::
erfggvny:

(t) = Pt (X Xk ) = 1 Pt (0.1 < X < 0.85) = 1

19

0.75
1+3t .

(t)
6

1
2
1
4

-t
kis t-re kicsi

nagy t-re nagy

a prba ereje

Mikor j a prba?
1) Torztatlan:

a prba ereje legalbb akkora, mint a terjedelme:

() 1 .
0
0
Az (Xe , Xk ) prba egyenletesen ersebb, mint a (Xe , Xk ) prba, ha
() = P (X Xk ) 0 () = P (X Xk0 ) 1 .
n
n
Az (Xe , Xk ) legfeljebb terjedelm konzisztens prbasorozat, ha
(terjedelem) n
n s
n
n () 1 1 .

2) Ers:
3) Konzisztens:

6.3. Denci.

(Xe , Xk )

prba egyenletesen legersebb, ha minden ms, legfeljebb ekkora terjedelm

prbnl egyenletesen ersebb.


Az egyenletesen legersebb prba olyasmi a hipotzisvizsglatban, mint a hatsos becsls a becslselmletben. Ilyen prbt ltalban nem knny konstrulni. Arra az esetre viszont tudunk egyenletesen
legersebb prbt adni, ha kt egyszer hipotzis kztt kell dnteni. Ehhez szksgnk lesz a vletlentett
prba fogalmra.

Eddigi prbk mskpp megfogalmazva: Legyen

x X -et gyeljk meg,


Xe = { x | (x) = 0 }
Xk = { x | (x) = 1 }

6.4. Denci.
Ha

x X -et

akkor

(x)

valsznsggel utastjuk el

Vletlentett prba: Legyen

gyeljk meg, akkor

(x)

: X [0, 1]

: X {0, 1}

H0 -t.

egy fggvny.

Ha

Ekkor:

egy fggvny (ennek neve prbafggvny).

valsznsggel utastjuk el

H0 -t.

Szmtsuk ki vletlentett prba esetn a hibavalsznsgeket (mondjuk diszkrt esetet vve)!

P (H0 -t

elutastjuk)

(x)P (X = x) = E ((X)).

x
gy

= sup0 E ((X)),

() = E ((X)) ( 1 ).

6.1. Ttel. (Neyman-Pearson lemma) Legyen H0


H0 : = 0 ,
H1 : = 1 ,
ahol

egy

1) Minden
2) A

H1 kt egyszer
Ln (0; x)
likelihood-fggvnye Ln (1; x),

vagy mskpp: a minta

n elem minta.
0<1

Tekintsk a kvetkez prbafggvnyt:

esetn ltezik

hipotzis:

Bizonyts.
Y =

Ln (1,x)
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)

(x) =

prba terjedelme
terjedelm prba

hogy a

prba egyenletesen legersebb az sszes

1) Legyen

vagy mskpp: a minta likelihood-fggvnye

pontosan

ha

= c . Ekkor
<c

kztt (s lnyegben egyrtelm).

Ln (1;X)
Ln (0;X) . Ekkor a prba terjedelme

= P0 (Y > c) + P0 (Y = c) = 1 P0 (Y c) + P0 (Y = c),
20

>c

azaz

1 = P0 (Y c) P0 (Y = c). Ha van olyan c0 , melyre P0 (Y c0 ) = 1 akkor a c = c0 , = 0


c0 , akkor is van olyan c0 , melyre P0 (Y < c0 ) 1 < P0 (Y c0 ).

vlaszts j lesz. Ha nem ltezik ilyen


Ekkor legyen

c = c0 ,
2) Legyen

P0 (Y c0 ) (1 )
P0 (Y = c0 )

egy msik prba prbafggvnye.

(0 < 1).

A feltevs szerint

E0 (0 (X)) = E0 ((X)).

Azt

E1 ( (X)) E1 ((X)) ll fenn. Tegyk fel, hogy a minta abszolt folytonos


eloszls, ekkor Ln (1; x) = fn;1 (x), ahol fn;1 (x) a minta egyttes srsgfggvnye a H1 mellett, hasonlan
Ln (0; x) = fn;0 (x), ahol fn;0 (x) a minta egyttes srsgfggvnye a H0 mellett. Megmutatjuk, hogy
Z
((x) 0 (x)) (fn;1 (x) c fn;0 (x)) dx 0.
(1)
kell beltni, hogy az erkre

Rn
Ugyanis, ha fn;1 (x) c fn;0 (x) = 0, akkor az integrandus nulla. Ha fn;1 (x) c fn;0 (x) > 0, akkor
(x) = 1, viszont 0 (x) 1, gy (x) 0 (x) 0, teht az integrandus 0. Ha fn;1 (x) c fn;0 (x) < 0,
0
akkor (x) = 0, gy (x) (x) 0, teht az integrandus megint 0. Az (1) integrlt sztbontva,
Z
Z
Z
Z
0 fn;1 0 fn;1 c fn;0 +c 0 fn;0 = E1 ((X))E1 (0 (X))cE0 ((X))+cE0 (0 (X)).

trendezve kapjuk, hogy

E1 ((X)) E1 (0 (X)) c [E0 ((X)) E0 (0 (X))] 0.


A prba neve: likelihood-hnyados prba.

Vletlentsre ltalban csak diszkrt mintk esetn van

szksg, hogy a teljes terjedelmet ki tudjuk hasznlni, s egyttal nveljk az ert.


elmleti, mint gyakorlati jelentsge van.
prba konzisztens, mivel

6.2. Plda.

n 1 cn ,

ahol

Ennek inkbb

Megmutathat, hogy (fggetlen, azonos elem mintkra) a

a kt likelihood fggvnytl fgg (egynl kisebb) konstans.

H1 : P (fej) = 16 . A mintatr: X =
{F F, F I, IF, II}, s a rvidsg kedvrt jellje a likelihoodokat L1 s L0 . A likelihoodok, illetve likelihoodEgy rmvel ktszer dobunk.

H0 : P (fej) =

1
2,

FF

FI

IF

II

1
36
1
4
1
9

5
36
1
4
5
9

5
36
1
4
5
9

25
36
1
4
25
9

hnyadosok tblzata:

L1
L0
L1
L0

= 0.25. A Neyman-Pearson lemma alapjn olyan , c prt keresnk, melyre a (x) =


>c
L1
1
= c prba terjedelme , azaz 0.25 = = 1 P0 ( L
L0 > c) + P0 ( L0 = c). A terjedelmet gy
<c
5 25
szedjk ssze, hogy a legnagyobb likelihood-hnyadostl, 25/9-tl indulunk. Ltszik, hogy c ( ,
9 9 ) j
lesz, s vletlentsre nincs szksg ( = 0), teht II esetn H0 -t elutastjuk, minden ms esetben H0 -t

Legyen elszr

L1
ha
L0
L1
ha
L0
L1
ha
L0

elfogadjuk.

= 0.3, akkor tovbb kell menni. Ha 95 < c < 25


9 , akkor az elsfaj hiba 0.25 < 0.3 ha
< c < 59 , akkor az elsfaj hiba 0.25 + 0.5 > 0.3. Teht c = 59 , s a megoldand egyenlet:
0.25 + 0.5 = 0.3, amibl = 0.1. Teht II esetn H0 -t elutastjuk, F F esetn H0 -t elfogadjuk, IF
vagy F I esetn vletlentnk: H0 -t 0.9 valsznsggel elfogadjuk, 0.1 valsznsggel elvetjk. Mekkora
Ha most

1
viszont
9

a prba ereje?


= P1




L1
L1
25
10
26
> c + P1
=c =
+ 0.1
=
= 0.72.
L0
L0
36
36
36

21

6.3. Plda.

Egy urnban

db golybl

kihzunk visszatevs nlkl, jellje

= 0.2

az

piros,

7k

zld.

H0 : k = 3, H1 : k = 4. Hrom golyt
= {0, 1, 2, 3}). Adjuk meg

a pirosak szmt a kihzottak kztt (X

terjedelm likelihood-hnyados prbt!

3
x

L0 (x) =

4
3x

7
3

4
x

L1 (x) =

3
3x

7
3


.

Ezrt a tblzat:

L1
L0
L1
L0

1
35
4
35
1
4

12
35
18
35
2
3

18
35
12
35
3
2

4
35
1
35

3
1
12
2 . Tovbb a 0.2 = 35 + 35 egyenletbl = 0.5. Teht
ha legfeljebb egy piros golyt hzunk, akkor elfogadjuk a nullhipotzist, ha hrom piros golyt hzunk,

Mivel

1/35 < 0.2, de 1/35 + 12/35 > 0.2, gy c =

akkor elvetjk a nullhipotzist, ha pedig kt piros golyt hzunk, akkor vletlentnk:


elvetjk,

1/2

1/2

valsznsggel

valsznsggel elfogadjuk a nullhipotzist.

A prba msodfaj hibja:

1 = P1 (H0 -t

elfogadjuk)

12 1 18
22
1
+
+
=
.
35 35 2 35
35

6.4. Plda.

Legyen X Exp() egy villanykrte lettartama (vekben kifejezve).


1
. Adjuk meg az = 1/8 terjedelm likelihood-hnyados prbt!
3
Most X = (0, ). A srsgfggvnyek s hnyadosuk:

L0 (x) =

1 1x
e 2 ,
2

L1 (x) =

1 1x
e 3 ,
3

H0 : =

1
2,

H1 : =

L1 (x)
2 x x
2 x
= e23 = e6 .
L0 (x)
3
3

Mivel a minta folytonos eloszls, vletlentsre nem lesz szksg. Kell teht:

1
= P0
8

2 X
e6 >c
3





 3
3c
3c
3c
2
= P0 X > 6 ln
= 1 F0 6 ln
= e3 ln 2 =
.
2
2
3c

4
3 . Megkaptuk teht c-t, de igazbl nem ez a fontos, hanem az, hogy mikor utastjuk el
a nullhipotzist. A szmts mskpp:
Ebbl pedig

c=

1
= = P0
8
amibl

d = 6 ln 2 = 4.16.


d
2 X
e 6 > c = P0 (X > d) = 1 F0 (d) = e 2 ,
3

Teht akkor utastjuk el a nullhipotzist, ha a villanykrte tovbb l, mint

4.16

v.

H0 : = 12 , H1 : < 12 hipotzisvizsglati feladatra, mivel


1
2 ) egyszer ellenhipotzisre ugyanez a prba a legersebb.

Mj.: a kapott prba egyenletesen legersebb a

0
minden H1

: = 1 (<

6.1. Feladat.

Legyen t elem mintnk

Adjuk meg az

= 0.05

6.2. Feladat.

Legyen

meg az

= 0.05

paramter Poisson eloszlsbl.

H0 : = 2 , H1 : = 1 .

terjedelm likelihood-hnyados prbt!

n elem mintnk az N (m, 1) normlis eloszlsbl. H0 : m = 0, H1 : m = 1.

Adjuk

terjedelm likelihood-hnyados prbt!

7. A normlis eloszls paramtereire vonatkoz prbk


Az egyik leggyakrabban elfordul eloszls a normlis eloszls, melyet a vrhat rtke s a szrsa
jellemez. Ezekre a paramterekre hrom tpus prbt tanulunk. Ezek a tpusok:
1. A vrhat rtkre vonatkoz prba, ha a szrs ismert

22

u-prba.

2. A vrhat rtkre vonatkoz prba, ha a szrs ismeretlen

t-prba.

3. A szrsra vonatkoz prba, ha a vrhat rtk ismeretlen (vagy akr ismert)

F -prba.

A prbk ezen bell mg klnbzhetnek aszerint, hogy egymintsak vagy ktmintsak, illetve az ellenhipotzis jellege szerint (egyoldali vagy ktoldali ellenhipotzis). Ezek a prbk egyenletesen legersebbek
a legfeljebb ekkora terjedelm torztatlan prbk kztt.

Egymints
Legyen

X1 , ..., Xn N(m, )

ahol

ismert,

u-prba

ismeretlen.

b)

H0 : m m0
H1 : m > m0

A hipotzisek:

H0 : m m0
H1 : m < m0

(2)

a) Xk = {|u| > u 2 } b) Xk = {u > u } c) Xk = {u < u }

(3)

a)

H 0 : m = m0
H1 : m 6= m0

c)

A prbastatisztika:

u=
Ezrt ha a kvnt terjedelem

ahol az

X m0 H0
n N (0, 1).

akkor a kritikus tartomny:

kritikus rtk olyan, hogy

(u ) = 1 ,

ezt a

(x)

fggvny tblzatbl keressk ki.

Mj.: (2)-ben az a) esetben ktoldali, a b) s c) esetekben egyoldali ellenhipotzisrl beszlnk.


Hogy nz ki a prba erfggvnye (ktoldali ellenhipotzisre)? Vezessk be a

n (m) :=

mm0
n jellst.






X m0
X m0


n (m) = Pm (|u| > u 2 ) = Pm
n > u 2 = 1 Pm u 2 <
n < u 2 =





X m
X m
m m0
1Pm u 2 <
n+
n < u 2 = 1Pm u 2 n (m) <
n < u 2 n (m) =

1 (u 2 n (m)) + (u 2 n (m)) = (u 2 + n (m)) + (u 2 n (m)),

1)
2)
3)
4)

Xm
n

N (0, 1). Az erfggvny kapott kpletbl leolvashat,


n (m) folytonos
n
n1 (m) < n (m) (m 6= m0 ) s n (m) 1 (a prba konzisztens)
n (m) > (m 6= m0 ) (er nagyobb mint a terjedelem - a prba torztatlan)
lim n (m) = 1

ahol felhasznltuk, hogy

hogy

7.1. Plda.

Legyen

X1 , ..., X16 N (m, 1) minta, melyre X = 0, 1.

0. = 0, 1

terjedelem mellett szeretnnk dnteni.

Egymints

u-prbt

H0 : m = 0, H1 : m 6=

kell vgezni, a kritikus rtk:

0.95 = 1
A prbastatisztika:

Hipotziseink:

u=

0,10
1

16 = 0.4
.
::

tbl.
= (u 2 ) u 2 = 1.65.
2

Mivel

|0.4| 1.65,

Keressk most meg a legnagyobb terjedelmet, ami mellett mg

u 2 = 0.4 (u 2 ) = 0.66 = 1

23

H0 -t.
elfogadjuk H0 -t!

elfogadjuk

= 0.34
= 0.68.
::::::::
2
2

Ktmints
Legyenek

m1 , m2

X1 , . . . , Xn1 N (m1 , 1 )

u-prba

Y1 , . . . , Yn2 N (m2 , 2 )

fggetlen mintk, ahol

1 , 2

ismert,

ismeretlenek.

A hipotzisek:

H0 : m1 = m2
H1 : m1 6= m2

a)

b)

H0 : m1 m2
H1 : m1 > m2

c)

H0 : m1 m2
H1 : m1 < m2

(4)

A prbastatisztika:

X Y H0
N (0, 1).
u= q 2
1
22
+
n1
n2
Teht a kritikus tartomnyok ugyanazok, mint egymints esetben, azaz (3) adja meg ket.

Egymints t-prba
Legyen

X1 , . . . , Xn N (m, )

m,

ahol

ismeretlen.

A hipotzisek: ugyanazok, mint az egymints

u-prbnl

(2).

A prbastatisztika:

t=
ahol

Sn =

Jellje a

X m0 H0
n tn1 ,
Sn

1
n1

P
(Xi X)2 .
szbadsgi fokot f , teht f = n 1.

A kritikus tartomny:

a) Xk = {|t| > tf ( 2 )} b) Xk = {t > tf ()} c) Xk = {t < tf ()}


ahol a

tf ()

kritikus rtk olyan, hogy

F (tf ()) = 1 ,

ha

jelli az

(5)

szabadsgi fok

t-eloszls

eloszlsfggvnyt.
A

tf ( 2 )-t

s a

tf ()-t

a  t-prba kritikus rtkei cm tblzatbl keressk ki, az oszlopok fltt kell

gyelni arra, hogy egyoldali vagy ktoldali prbnk van.

Ktmints t-prba
Legyenek

X1 , . . . , Xn1 N (m1 , )

Y1 , . . . , Yn2 N (m2 , )

fggetlen mintk, ahol

m1 , m 2

meretlenek.
A hipotzisek: ugyanazok, mint a ktmints

u-prbnl

(4).

A prbastatisztika:

X Y

t= q

(n1

Jellje a szbadsgi fokot

f,

1)Sn1 2
teht

+ (n2

1)Sn2 2

n1 n2 (n1 + n2 2) H0
tn1 +n2 2 .
n1 + n2

f = n1 + n2 2.

A kritikus tartomny ugyanaz, mint az egymints esetben (5).

Vezessk le, hogyan jn ki a ktmints

t-prbnl

X Y N (0, 2 /n1 + 2 /n2 ),

m1 = m2
r
1
n1 n2
(X Y )
N (0, 1).

n1 + n2

a prbastatisztika. Egyrszt

azaz

Msrszt teljesl, hogy

i
1 h
2
2
(n

1)S
+
(n

1)S
2n1 1+n2 1 ,
1
2
n
n
1
2
2
24

esetn

is-

mivel a tagok kln-kln

2n1 1

2n2 1

illetve

eloszlsak, s fggetlenek.

Mivel pedig az elz kt

kpletben felrt valsznsgi vltozk fggetlenek is, hnyadosuk a szabadsgi fok gykvel beszorozva
valban

eloszls lesz.

Mj.: Ha a kt minta szrsa szigniknsan klnbzik, akkor a fenti prbt kiss mdostani kell, ezt
vagy szintn t-prbnak, vagy Welch-prbnak hvjk. A mdosts abbl ll, hogy most a prbastatisztika

t= q
ahol az

X Y
2
Sn
1
n1

tf ,

szabadsgi fok

f=
s

H0

2
Sn
2
n2

gi = Sni 2 /ni .

Ha

(g1 + g2 )2
g12
n1 1

nem egsz, akkor kerektjk.

A szrsra vonatkoz prbhoz szksgnk lesz az

7.1. Denci.

g22
n2 1

eloszlsra.

Y pedig f2 szabadsgi fok, egymstl fggetlen, 2 eloszls


X/f1
valsznsgi vltozk, akkor a Z =
Y /f2 valsznsgi vloz (f1 , f2 ) szabadsgi fok F -eloszls, jel.
2
Ff1 ,f2 . Itt f1 a szmll szabadsgi foka, f2 a nevez szabadsgi foka. (E(Z) = f2f2
.)
Ha

X f1

szabadsgi fok,

Ktmints
Legyenek

X1 , . . . , Xn1 N (m1 , 1 )

F -prba

Y1 , . . . , Yn2 N (m2 , 2 )

fggetlen mintk, ahol

m1 , m 2

1 , 2

ismeretlenek.
A hipotzisek:

a)

H0 : 1 = 2
H1 : 1 6= 2

b)

H0 : 1 2
H1 : 1 > 2

c)

H0 : 1 2
H1 : 1 < 2

A prbastatisztika:

F =
Jellje a szbadsgi fokokat

f1 = n1 1

Sn1 2
Sn2 2

H0

Fn1 1,n2 1 .

f2 = n2 1.

A kritikus tartomny:

a)Xk = {F < Ff1 ,f2 (1 2 )

vagy

F > Ff1 ,f2 ( 2 )} b)Xk = {F > Ff1 ,f2 ()} c)Xk = {F < Ff1 ,f2 (1 )},
(6)

ahol az

Ff1 ,f2 ()

F -eloszls

kritikus rtk olyan, hogy

G(Ff1 ,f2 ()) = 1 ,

ha

jelli az

(f1 , f2 )

szabadsgi fok

eloszlsfggvnyt.

A kritikus rtkeket az  F -prba kritikus rtkei cm tblzatbl keressk ki.

A prbastatisztika

H0

melletti eloszlsa:

F =

Sn1 2
Sn2 2

1
n1 1

=
1
n2 1

2
(n1 1)Sn
1
12

2
(n2 1)Sn
2
22


 Fn1 1,n2 1 .

A prba praktikusabb formja ktoldali ellenhipotzisre:

F < Ff1 ,f2 (1 /2)

1
1
<
Ff2 ,f1 ,
Ff1 ,f2 (1 /2)
F

ezrt

Ff2 ,f1 (/2) =

gy a kritikus tartomny ekvivalens alakja:


Xk =

1
> Ff2 ,f1 (/2)
F

vagy

25


F > Ff1 ,f2 (/2) .

1
.
Ff1 ,f2 (1 /2)

A gyakorlatban hasznlt

-kra

1-nl

a kritikus rtk

nagyobb, ezrt elg

1/F

kzl a nagyobbikat

sszehasonltani a megfelel kritikus rtkkel.


A prba teht: az

Fn2 1,n1 1 (/2)

F 0 = max

2
2
Sn
Sn
1
2
2 , S 2
Sn
n1
2


statisztikt hasonltjuk ssze vagy az

vagy az

kritikus rtkekkel.

Egymints
Legyen

Fn1 1,n2 1 (/2)

X1 , . . . , Xn N (m, )

ahol

m,

F -prba

(vagy

2 -prba)

ismeretlen.

A hipotzisek:

a)

H0 : = 0
H1 : 6= 0

b)

H0 : 0
H1 : > 0

A prbastatisztika:

2 = (n 1)
Jellje a szabadsgi fokot

c)

H0 : 0
H1 : < 0

Sn2 H0 2
n1 .
02

f = n 1.

A kritikus tartomny:

a)Xk = {2 < 2f (1 2 )
ahol a

2f ()

vagy

2 > 2f ( 2 )} b)Xk = {2 > 2f ()} c)Xk = {2 < 2f (1 )},

kritikus rtk olyan, hogy

G(2f ()) = 1 ,

ha

jelli az

szabadsgi fok

2 -eloszls

eloszlsfggvnyt.

A kritikus rtkeket a  -prba kritikus rtkei cm tblzatbl keressk ki.


Ehelyett vgezhetnk az

F =
statisztikra

F -prbt,

Sn2 H0
Fn1,
02

azaz ekkor a kritikus tartomnyt (6) adja meg (az

Fn1,

eloszls a

2n1

eloszls

tsklzott vltozata).

7.2. Plda.

Ktfle altat (A s B) hatsossgt teszteltk 10 betegen. Az albbi tblzat azt mutatja,

hogy az altat mennyivel nvelte meg a betegek jszakai alvsidejt (rban mrve).
Beteg sorszma

A altat

B altat

klnbsg

1
2
3
4
5
6
7
8
9
10

1.9
0.8
1.1
0.1
0.1
4.4
5.5
1.6
4.6
3.4

0.7
1.6
0.2
1.2
0.1
3.4
3.7
0.8
0
2

1.2
2.4
1.3
1.3
0
1
1.8
0.8
4.6
1.2

Vajon van-e szignikns klnbsg a kt gygyszer hatsossga kztt (


Hipotzisek:

H0 : m1 = m2 , H1 : m1 6= m2 .

= 0.01

terjedelem mellett)?

A kt minta azonban nem fggetlen, mert ugyanazokon a

betegeken prbltk ki mind a kt gygyszert. Vegyk ezrt az

t-prbval a H0 : m = 0, H1 : m 6= 0 hipotziseket!

0
Sn = 1.23, X = 1.58, t = Xm
n = 4.06. A kritikus
S
n

rtk:

AB

klnbsget, s teszteljk egymints

t9 (0.005) = 3.35,

gy, mivel

|4.06| > 3.35,

nullhipotzist elvetjk, azaz a kt gygyszer hatsossga kztt szignikns klnbsg van.


Tegyk most fel, hogy a kt gygyszert ms-ms 10 betegen teszteltk (de tovbbra is a fenti tblzat
adatait hasznljuk).

2
2
SA
= 4, SB
= 3.8.

Ekkor a kt minta fggetlen, ktmints

t-prba

vgezhet.

X = 2.33, Y = 0.75,

A ktfle gygyszer hatsnak szrsai felttelezheten egyenlek, de ellenrizhetjk

26

is

F -prbval: F 0 = 1.1,

F9,9 (0.025) = 4.03. A t-prba prbastatisztikja:


r
X Y
10 10 (10 + 10 2)
t= q

= 1.78.
10 + 10
2
2

(10 1)S + (10 1)S


mg a kritikus rtk

A kritikus rtk

t18 (0.01/2) = 2.89.

Mivel

|1.78| < 2.89

elfogadjuk

H0 -t,

azaz nincs r bizonytk, hogy az

egyik gygyszer hatsosabb a msiknl.

8.

prbk

8.1. Ttel.

(biz. nlkl) Legyen

meggyelsbl jellje

az

Ai

A1 , A2 , ..., Ar

teljes esemnyrendszer, jel.

2 =

r
X
(i n pi )2

n pi

i=1

valsznsgi vltoz
talnosabban, ha a

pi

r1
s(< r 1)

esetn az

valsznsgek

paramterek ML-becslst. Ekkor a

2 =

szabadsgi fok

esetn az

eloszlshoz tart (eloszlsban).

r
X
(i n pi )2

n pi

rs1

szabadsgi fok

eloszlshoz tart (eloszlsban).

A ttel alapjn aszimptotikus prba vgezhet, ami azt jelenti, hogy a prba terjedelme kzeltleg
ha

l-

pi

db ismeretlen paramtertl fggenek, akkor jellje

i=1
valsznsgi vltoz

P (Ai ) = pi . n darab fggetlen

esemny gyakorisgt. Ekkor a

lesz,

elg nagy.

2 -prba
Legyen

A1 , A2 , ..., Ar

(tiszta eset)

teljes esemnyrendszer.

A hipotzisek:

H0 : P (Ai ) = pi
n

darab fggetlen meggyelsbl jellje

A prbastatisztika:

2 =

i = 1, ..., r,
az

Ai

esemny gyakorisgt.

r
X
(i n pi )2

n pi

i=1
Jellje a szabadsgi fokot

H1 : i : P (Ai ) 6= pi .

H0

2r1 .

f = r 1.

A kritikus tartomny:

Xk = {2 > 2f ()},
2
2
ahol a f () kritikus rtk olyan, hogy G(f ()) = 1 , ha G jelli az f szabadsgi fok
eloszlsfggvnyt.
2
A kritikus rtkeket a  -prba kritikus rtkei cm tblzatbl keressk ki.

27

(7)

-eloszls

Vegyk szre, hogy a kritikus tartomnyba a prbastatisztika azon rtkeit tettk, melyek az ellenhipotzis esetn fordulnak inkbb el, azaz a nagy rtkeket.

2 -prba
Legyen

A1 , A2 , ..., Ar

(becslses eset)

teljes esemnyrendszer.

A hipotzisek:

H0 : : P (Ai ) = pi ()i,
ahol

egy

dimenzis paramtervektor.

risgt, valamint legyen

darab fggetlen meggyelsbl jellje

paramtervektor ML becslse, s

A prbastatisztika:

2 =

r
X
(i n pi )2

n pi

i=1
Jellje a szabadsgi fokot

H1 : 6 : P (Ai ) = pi ()i,
.
pi = pi ()

az

Ai

esemny gyako-

H0

2rs1 .

f = r s 1.

A kritikus tartomny: (7), azaz ugyanaz, mint az elbb.

Mj.: Mivel a prba aszimptotikus, vigyznunk kell arra, hogy a minta elemszma elg nagy legyen. Pl.
megkvetelhetjk, hogy az sszes vrt rtk (npi , ill.

n
pi )

legalbb 5 legyen. Ha ez nem teljesl, akkor a

kis vrt gyakorisgokkal rendelkez esemnyeket sszevonjuk.

8.1. Illeszkedsvizsglat
Khi-ngyzet prbval ellenrizhetjk, hogy egy minta egy adott eloszlsbl szrmazhat-e.

Mivel a

khi-ngyzet prbban egy vges teljes esemnyrendszer szerepel, a prbt inkbb diszkrt eloszlsok
illeszkedsnek vizsglathoz szoks hasznlni. Mindenesetre a felttelezett eloszls rtkkszlett vges
sok csoportra kell osztanunk, hogy a prbt elvgezhessk.

8.1. Plda.

Kockval dobunk. Nullhipotzisnk:

A meggyelt gyakorisgok tblzata (n

H0 :

a kocka szablyos, azaz

P (Ai ) = 61 ;

i = 1, . . . , 6.

= 60):
1
8
10

rtkek

i
n pi

2
3
4
5
7 14 12 10
10 10 10 10

6
9
10

A prbastatisztika:

2 =

(8 10)2
(7 10)2
(14 10)2
(12 10)2
(10 10)2
(9 10)2
+
+
+
+
+
= 3.4.
10
10
10
10
10
10

A kritikus rtk (f

= r 1 = 5): 25 (0.1) = 9.24.

Mivel

3.4 < 9.24, H0 -t

elfogadjuk, azaz a kocka

szablyosnak tekinthet.

8.2. Plda.

400-szor feljegyeztk, hogy egy hibs kapcsol hnyadik prblkozsra gyjtotta fel a villanyt.

H0 : Xi Geo(p)

valamilyen

p-re.

Az adatok:

1
324

2
57

3 4
14 5

1 324 + 2 57 + 3 14 + 4 5
500
5
=
= , ebbl a paramter ML becslse p =
400
400
4

1
=
X
0.8. A geometriai eloszls pozitv egsz rtkeket vehet fel, teht a lehetsges rtkek egy csoportostsa:

A minta tlaga:

X=

A1 = {1}, A2 = {2}, A3 = {3}, A4 = {4, . . .}.

A ngy csoport becslt valsznsge:

p1 = 0.8, p2 = 0.2 0.8 = 0.16, p3 = 0.22 0.8 = 0.032, p4 = 1 p1 p2 p3 = 0.008.


A vrt rtkek tblzata teht:

n pi

1
320

2
64
28

3
4
12.8 3.2

A prbastatisztika:

2 =
A szabadsgi fok:

22 (0.05) = 5.99,

(324 320)2
(57 64)2
(14 12.8)2
(5 3.2)2
+
+
+
= 1.95.
320
64
12.8
3.2

f = r s 1 = 4 1 1 = 2. Ha a terjedelem = 0.05, akkor a kritikus rtk


1.95 < 5.99, gy H0 -t elfogadjuk. (Tulajdonkppen mg a harmadik s negyedik

s mivel

csoportot is ssze lehetne vonni.)


Ha a felttelezett eloszls folytonos, akkor a teljes szmegyenest kell intervallumokra, illetve flegyenesekre bontani. Az intervallumok megvlasztshoz nhny j tancs:
1)Az intervallumok szma ne legyen se tl kevs (nem elg ers a prba, a mintban lv informci nagy
rsze elveszik), se tl sok (a

kzelts srl).

2) Az osztpontokat gy vlasszuk, hogy az intervallumok

pi

valsznsgei kzel egyformk legyenek.

sszefoglalva, az illeszkedsvizsglat lpsei:


1) Ha becslses esettel van dolgunk, akkor a paramtereket megbecsljk a mintbl ML mdszerrel.
2) A lehetsges rtkkszletet vges sok csoportba osztjuk (TER-t hozunk ltre).
3) Kiszmoljuk a csoportok vrt gyakorisgt.
4) Ha vannak kicsi (pl. 5-nl kisebb) vrt gyakorisgok, akkor sszevonunk csoportokat.
5) Kiszmoljuk a prbastatisztikt, kikeressk a szabadsgi foknak s a terjedelemnek megfelel kritikus
rtket.
6) sszehasonltva a kettt, levonjuk a kvetkeztetst.

8.2. Fggetlensgvizsglat
Kt szempont szerint soroljuk osztlyokba a meggyelseket:

r osztly van: A1 , ..., Ar ,


s osztly van: B1 , ..., Bs .
H0 : a kt szempont fggetlen

az 1. szempont szerint
a 2. szempont szerint
Nullhipotzisnk:

i, j -re.

egymstl, azaz

P (Ai Bj ) = P (Ai ) P (Bj )

minden

Az ellenhipotzis pedig az, hogy a kt szempont sszefgg.

n darab fggetlen meggyelsbl jellje ij

az

Ai Bj

esemny gyakorisgt, valamint legyen

i =

s
X

ij

j=1
az

Ai

j =

r
X

ij a Bj gyakorisga.
i=1
Kt eset lehetsges aszerint, hogy az egyes szempontok osztlyainak valsznsgt ismerjk-e.
gyakorisga s

A) eset (ritkbb):

P (Ai ) = pi

P (Bj ) = qj

esemnyrendszert alkotnak,

2 =
B) eset:

pi , q j

r1

{Ai Bj }

esemnyek

elem teljes

nem ismertek. Ekkor elszr megbecsljk ket a mintbl ML-mdszerrel:

darab

pi

i
,
n

qj =

paramtert becsltnk (mivel

paramtert. gy

2 =

j
.
n

pr = 1

Pr1
i=1

pi

mr addik), s

r X
s
r X
s

X
X
(ij in j )2 H0 2
(ij n pi qj )2
f ,
=
i j
n pi qj
n
i=1 j=1
i=1 j=1

f = r s (r 1 + s 1) 1 = (r 1)(s 1).
r = s = 2. Ekkor a prbastatisztika egyszerbb alakra

ahol a szabadsgi fok:


Mj.: Legyen

rs

s
r X
X
(ij n pi qj )2 H0 2
rs1 .
n pi q j
i=1 j=1

pi =
sszesen

ismertek. Mivel az

2 =

n (11 22 12 21 )2
.
1 2 1 2

29

hozhat:

s1

darab

qj

Legyen ugyanis

ij =

i j
n . Ekkor

11 + 12 = 1
Kaptuk, hogy
Teht a

11 + 12 =

12 12 = (11 11 ).

1 1
1 2
1
+
=
(1 + 2 ) = 1 .
n
n
n

Hasonlan,

21 21 = (11 11 )

22 22 = 11 11 .

statisztika mind a ngy tagjban ugyanaz a szmll, mghozz (ngyzetreemels eltt):

11 11 = 11
A kzs szmll s

11 22 12 21
1
(11 + 12 )(11 + 21 ) =
.
n
n

kiemelse utn marad:

1
1
1
n2
1
+
+
+
=
.
1 1
1 2
2 1
2 2
1 1 2 2
A fentieket sszerakva, pp a bizonytani kvnt kpletet kapjuk.

Mj.: Gykt vonva,

n(11 22 12 21 ) H0

1 2 1 2

N (0, 1),

u-prba

gy

is vgezhet. Akr egyoldali

vgezhetnk, ha az ellenhipotzis adott irny sszefggsre vonatkozik. (Pl.:


fggetlen,

H1 :

8.3. Plda.

H0 :

u-prbt

is

a szemszn s a hajszn

a szkek nagyobb esllyel kkszemek.)

200 emberrl feljegyeztk, hogy szke-e, s hogy kkszem-e.


haj/szem

kk

ms

szke

30
70
100

20
80
100

ms

a) Fggetlennek tekinthet-e a hajszn s a szemszn (

50
150
200

= 0.05)?

A vrt rtkek tblzata:


haj/szem

kk

ms

szke

25
75

25
75

ms
2

2 = 200(30807020)
= 2.67.
10010050150
(2 1) (2 1) = 1, kritikus rtk: 21 (0.05) = 3.84.

A prbastatisztika:
Szabadsgi fok:

Teht a szemszn s a hajszn fggetlennek tekinthet.


b) Mondhatjuk-e, hogy a szkk kztt tbb a kkszem (

= 0.05)?

200(30807020)

A prbastatisztika:
= 1.63.
10010050150
A kritikus rtk: u0.05 = 1.65.
Teht a szkk kztt nem szigniknsan tbb a kkszem (de majdnem :).

8.3. Homogenitsvizsglat
Legyen X s Y kt valsznsgi vltoz, s kzs rtkkszletket bontsuk fel az A1 , . . . , Ar osztlyokra.
H0 : X s Y eloszlsa megegyezik, azaz P (X Ai ) = P (Y Ai ) minden i-re.
Az X -et n-szer meggyelve, legyen i az Ai osztly gyakorisga. Hasonlan, Y -t m-szer meggyelve,
legyen i az Ai osztly gyakorisga.
i +i
Az i. osztly valsznsgnek ML becslse: p
i = n+m
.
A prbastatisztika:

r
2
X
(i n
pi )
i=1

n
pi

r
2
X
(i m
pi )
i=1

m
pi

H0

2f ,

f = (r 1) + (r 1) (r 1) = r 1, hiszen mindkt sszeg


paramterek lennnek) r 1, viszont r 1 paramtert becsltnk, amit

ahol a szabadsgi fok:

szabadsgi foka (ha

nem becslt

le kell vonni.

A fenti statisztika talaktsa utn kapjuk, hogy

r
X
i=1

2
mi
H0
n m 2r1 .
i + i

i
n

30

8.4. Plda.

Kt kockval dobunk. Tekinthet-e a kt kocka egyformnak (

= 0, 05)?

Az adatok:

1
7
16

rtk

i
i

(1. kocka)
(2. kocka)

2
3
11 8
11 20

4
5
10 8
19 18

6
6
16

r=6
n = 50
m = 100

A prbastatisztika:

6
X
i=1

A kritikus rtk:

261 (0.05) = 11.1.

i
100
i + i

i
50

Mivel

2
50 100 = 3.58.

3.58 < 11.1, H0 -t

elfogadjuk, a kt kocka egyformnak

tekinthet.

9. ltalnostott likelihood-hnyados prba


Tekintsk a

= 0 1

hipotzisvizsglati feladatot. Egy

elem

likelihood-hnyados statisztika alatt a kvetkez mennyisget rtjk:

mintbl szmolt

ltalnostott

sup{Ln (X; ) : }
.
sup{Ln (X; ) : 0 }
Ha a nullhipotzis teljesl, akkor ez kzel van 1-hez, mg ha nem, akkor a szmll jval nagyobb a
neveznl, ezrt a hnyados nagy. A nullhipotzis tesztelse teht gy trtnhet, hogy ha az ltalnostott
likelihood-hnyados statisztika nagyobb, mint valamely kritikus rtk, akkor
akkor

H0 -t

H0 -t

elvetjk, ha kisebb,

elfogadjuk, egyenlsg esetn pedig, ha szksges, randomizlunk.

Ha mind a nullhipotzis, mind az ellenhipotzis egyszer, azaz a hipotzisnk szerint a srsgfggvny

f0 ,

az ellenhipotzis szerint pedig

f1 ,

akkor a statisztika a kvetkez alakot lti:

n f (X) o
max{f0 (X), f1 (X)}
1
= max 1,
.
f0 (X)
f0 (X)
Itt a msodik tag a NeymanPearson lemmbl ismers likelihood-hnyados, vagyis a klasszikus likelihood-hnyados prbt kapjuk, ha a kritikus rtk nagyobb 1-nl.
Az ltalnostott likelihood-hnyados statisztika

H0

melletti eloszlst  nhny kivteles esettl el-

tekintve  nehz meghatrozni. Bizonyos felttelek mellett azonban hatreloszlsttelt tudunk bizonytani
r, amint a minta nagysga minden hatron tl n, s ezzel aszimptotikus prbt konstrulhatunk.
Az aszimptotikus vizsglathoz a fenti statisztika logaritmusnak a ktszerest tekintjk:



T = 2 sup log Ln (X; ) sup log Ln (X; ) .

Tegyk fel, hogy a paramterek kt csoportra vannak felosztva, az els csoportba tartozk vektort
jellje

Rq ,

a tbbiek

(p q)-dimenzis

vektort pedig

Tekintsk a kvetkez hipotzisvizsglati

feladatot:

H0 : = 0 ,

tetszleges,

H1 : 6= 0 ,

Megmutathat, hogy bizonyos regularitsi felttelek mellett

2q .

gy khi-ngyzet prba vgezhet. (Illetve a

tetszleges.
esetn a

statisztika hatreloszlsa

paramterre  amennyiben egy dimenzis  kondencia-

intervallum adhat.)

10. Folytonos eloszls mintra a

2 -prba

helyett alkalmazhat

prbk
Lttuk, hogy a

2 -prba

hromfle feladat tesztelsre alkalmas.

folytonos eloszls mintkra, ha azokat diszkretizljuk.

Azonban a

Mindhrom tpus alkalmazhat

2 -prba

alapveten diszkrt jel-

leg, gy felmerl a krds, hogy folytonos eloszls mintkra nem lehet-e jobb prbkat konstrulni. Az
albbiakban bemutatunk nhnyat ezek kzl.

31

10.1. Illeszkedsvizsglat

X1 , . . . , Xn valamilyen folytonos
H0 : F = F0 , H1 : F 6= F0 .

eloszlsbl vett minta (a mintaelemek eloszlsfggvnyt jellje

F ).

Kolmogorov-Szmirnov prba:
Ksztsk el a minta

Fn

tapasztalati eloszlsfggvnyt, s tekintsk a kvetkez prbastatisztikt:





Dn = sup Fn (x) F0 (x) .
xR

Dn H0

Megmutathat, hogy

melletti eloszlsa nem fgg az

i
tapasztalati eloszlsfggvny konstans
n , az

F0

F0

eloszlstl: mivel

(n)

Xi

(n)

Xi+1

kztt a

eloszlsfggvny pedig monoton n, kapjuk, hogy

h

i
(n)
(n)
Dn = max max |F0 (Xi ) i/n|, |F0 (Xi+1 ) i/n| .
0in

H0 melletti eloszlsapedig valban nem fgg F0 -tl, hiszen ha Xi


F0 (Xi ) E(0, 1). Tovbb nDn aszimptotikus eloszlsa meghatrozhat:

Ennek

+
X

2 2
n
P ( nDn < y) K(y) =
(1)i e2i y

eloszlsfggvnye

F0 ,

akkor

(y > 0).

i=
A fenti

eloszlsfggvnyhez tartoz eloszls az n.

Kolmogorov eloszls.

Kolmogorov eloszlsbl szmolhatunk kritikus rtket (pl.

H0 -t,

ha

nDn > 1.36),

Mj.: Vizsglhatjuk a

= 0.05

Azaz ha

elg nagy, akkor a

terjedelem mellett akkor utastjuk el

ha pedig n kicsi, akkor kln tblzat tartalmazza a


H1 : F (x) > F0 (x) x vagy a H1 : F (x) < F0 (x) x

kritikus rtkeket.
egyoldali ellenhipotziseket

is, ekkor a prbastatisztika



Dn+ = sup Fn (x) F0 (x) ,

illetve

xR

H0

Ezekre is igaz, hogy

A fenti

K1

xR

melletti eloszlsuk nem fgg

meghatrozhat:



Dn = sup F0 (x) Fn (x) .
F0 -tl.

2
n
P ( nDn < y) K1 (y) = 1 e2y

eloszlsfggvnyhez tartoz eloszlst nevezhetjk

H0 -t,

ha

nDn > 1.22),

ha pedig

nDn

aszimptotikus eloszlsa

(y > 0).

Szmirnov eloszlsnak.

akkor a Szmirnov eloszlsbl szmolhatunk kritikus rtket (pl.


el

Tovbb

Azaz ha n elg nagy,


= 0.05 terjedelem mellett akkor utastjuk

kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.

10.2. Fggetlensgvizsglat

(Xi , Yi ) (i = 1, . . . , n) egy folytonos H(x, y) eloszlsfggvny eloszlsbl szrmaz minta.


H -hoz tartoz marginlis eloszlsokat F (x) = limw H(x, w) s G(y) = limz H(z, y).
kt koordinta fggetlen, azaz H(x, y) = F (x)G(y) x, y .

Legyen
Jellje a

H0 :

Kendall prba:
Tekintsk a kvetkez prbastatisztikt:

Kn =

n1
X

n
X

[I((Xi Xj )(Yi Yj ) 0) I((Xi Xj )(Yi Yj ) < 0)] .

i=1 j=i+1
Szavakkal elmondva,

Kn

a rendezett ponptprok szma, mnusz a nem rendezett pontprok szma, azaz

Kn H0 melletti
F, G marginlis eloszlsoktl. Ha ugyanis az (Xi , Yi ) minta helyett az (F (Xi ), G(Yi ))
mintbl szmolnnk ki Kn -et, ugyanazt az rtket kapnnk, hiszen F, G monoton nv fggvnyek.
Viszont F (Xi ) s G(Yi ) mr fggetlen E(0, 1) eloszlsak.
Megmutathat az is, hogy Kn aszimptotikusan normlis eloszls, azaz ha n elg nagy, akkor u-prba
vgezhet, ha pedig n kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
Az u-prbhoz

ktszer a rendezett ponptprok szma, mnusz az sszes pontpr szma. Belthat, hogy
eloszlsa nem fgg az

32

standardizlni kell
a)

Kn

Kn -et:
H0 mellett:

vrhat rtke

E0 (I((Xi Xj )(Yi Yj ) 0)) = P0 ((Xi Xj )(Yi Yj ) 0) = P0 (Xi Xj 0 s Yi Yj 0)+


P0 (Xi Xj 0 s Yi Yj 0) = 0.5 0.5 + 0.5 0.5 = 0.5.
E0 (I((Xi Xj )(Yi Yj ) < 0)) = 0.5, azaz E0 (Kn ) = 0.
H0 mellett:
ij = [I((Xi Xj )(Yi Yj ) 0) I((Xi Xj )(Yi Yj ) < 0)].

X
X
XX
D02 (Kn ) = cov0
ij ,
kl =
cov0 (ij , kl ).

Hasonlan,
b)

Kn

szrsngyzete

legyen

i<j

i<j k<l

k<l

ha
{i, j} {k, l} =
0
1
ha
i = k, j = l
Itt cov0 (ij , kl ) =

1/9 egybknt
n(n 1) 1 n(n 1)(n 2)
n(n 1)(2n + 5)
2
+
6=
.
Azaz D0 (Kn ) = 1
2
9
6
18
Mj.: a prba csak a 6= 0 tpus ellenhipotzisekre konzisztens, ahol
= 2P ((X1 X2 )(Y1 Y2 ) > 0) 1
a Kendall-fle fggsgi egytthat (| |

1,

ha

fggetlenek, akkor

= 0,

de fordtva nem igaz).

Blum-Kiefer-Rosenblatt prba:
Legyen

N1 (i) = |{ j
N2 (i) = |{ j
N3 (i) = |{ j
N4 (i) = |{ j
N` (i)

Azaz

6= i | Xj
6= i | Xj
6= i | Xj
6= i | Xj

< Xi
> Xi
< Xi
> Xi

darab pont esik az

s
s
s
s

Yj
Yj
Yj
Yj

< Yi }|
< Yi }|
> Yi }|
> Yi }|

(Xi , Yi )

N3 (i)

N4 (i)
(Xi ,Yi )
N1 (i)
N2 (i)

osztpont ltal meghatrozott

`.-ik

sknegyedbe.

Prbastatisztika:

Bn =
ahol

n, H
n
Fn , G

1X
n i=1

N1 (i) N4 (i) N2 (i) N3 (i)

n
n
n
n

1X
n (Yi ))2 ,
(Hn (Xi , Yi ) Fn (Xi )G
n i=1

Belthat, hogy

B n H0

Fn (Xi ) = (N1 (i) + N3 (i))/n,

melletti eloszlsa nem fgg az

aszimptotikus eloszlsa meghatrozhat. Azaz ha


hatunk kritikus rtket (pl.

a tapasztalati eloszlsfggvnyek:

n (Xi , Yi ) = N1 (i)/n,
H

pedig

2

= 0.05

F, G

n (Yi ) = (N1 (i) + N2 (i))/n.


G
marginlis eloszlsoktl, tovbb

nBn

elg nagy, akkor az aszimptotikus eloszlsbl szmol-

terjedelem mellett akkor utastjuk el

H0 -t,

ha

nBn > 0.058),

ha

kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.

10.3. Homogenitsvizsglat

X1 , . . . , Xn s Y1 , . . . , Ym
F , illetve G).
H0 : F = G, H1 : F =
6 G.

fggetlen mintk valamilyen folytonos eloszlsokbl (az eloszlsfggvnyek

Mann-Whitney-Wilcoxon prba :
Tekintsk a kvetkez prbastatisztikt:

Wn,m =

n X
m
X
i=1 j=1

33

I(Xi Yj ).

10.1. Ttel.

(N )
(N )
N := n + m. Vegyk a Z1 < < ZN
(n)
rendezett mintt, s jellje ri , hogy Xi
hanyadik legkisebb elem ebben a rendezett mintban. Ekkor
n(n+1)
Wn,m = r1 + + rn 2 .
Legyen

az egyestett minta, ennek elemszma

Bizonyts.
(n)

X1

(n)

(n)

r1 1 db Yj -nl nagyobb, X2

r2 2 db Yj -nl nagyobb, s ltalban, Xi

ri i db Yj -nl nagyobb.

Ezeket sszeadva kapjuk az lltst.


Megmutathat, hogy

Wn,m H0

melletti eloszlsa nem fgg a kt minta kzs eloszlstl, s aszimp-

H0 mellett az X -ek s Y -ok minden sorrendje



n+m
a valsznsge annak, hogy az X -ek adott rangokat foglalnak el, Wn,m
n
pedig ezeknek a rangoknak a fggvnye. A msodik llts pedig azrt igaz, mert az I(Xi Yj ) vltozk,

totikusan normlis eloszls. Az els llts azrt igaz, mert


egyformn valszn, azaz

1/

br nem fggetlenek, viszonylag gyenge sszefggst mutatnak.

n, m

Ez alapjn, ha

u-prba vgezhet, ha pedig n, m


u-prbhoz standardizlni kell Wn,m -et:

elg nagyok, akkor

tartalmazza a kritikus rtkeket. Az

kicsi, akkor kln tblzat

a) Wm,n vrhat rtke H0 mellett:


E0 (I(Xi Yj )) = P0 (Xi Yj ) = 21 E0 (Wn,m ) = nm
2
b) Wn,m szrsngyzete H0 mellett:
legyen ij = I(Xi Yj ).

m X
n X
m
n X
m
n X
m
n X
X
X
X
cov0 (ij , lk ).
D02 (Wn,m ) = cov0
ij ,
lk =

i=1 j=1

i=1 j=1 l=1 k=1

l=1 k=1

0
ha
i 6= l, j 6= k
1/4 ha i = l, j = k
Itt cov0 (ij , lk ) =
1/12 ha i = l, j 6= k

1/12 ha i 6= l, j = k
1
1
1
n m(n + m + 1)
nm n+m+1
2
Azaz D0 (Wn,m ) = nm + nm(m 1)
+ mn(n 1)
=
=

.
4
12
12
12
4
3
nm
lenne, ha ij -k fggetlenek lennnek. Mj.: a prba csak a P (X > Y ) 6= 1/2 tpus ellenhipotzis
4
esetn konzisztens.

Kolmogorov-Szmirnov prba:
Ksztsk el a mintkbl az

m
|hatFn , G

tatisztikt:

tapasztalati eloszlsfggvnyeket, s tekintsk a kvetkez prbas-




m (x) .
Dn,m = sup Fn (x) G
xR

Megmutathat, hogy

Dn,m

Dn,m H0

melletti eloszlsa nem fgg a kt minta kzs eloszlstl, s

mn
m+n

n, m elg nagyok, akkor a Kolmogorov eloszlsbl


n, m kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
H1 : F (x) > G(x) x egyoldali ellenhipotzist is, ekkor a prbastatisztika


+
m (x) .
Dn,m
= sup Fn (x) G

aszimptotikusan Kolmogorov eloszls. Azaz ha

szmolhatunk kritikus rtket , ha pedig


Mj.: Vizsglhatjuk a

xR

H0 melletti eloszlsa nem fgg a kt minta kzs eloszlstl. Ebben az esetben


mn
+
m+n Dn,m aszimptotikusan Szmirnov eloszls. Azaz ha n, m elg nagyok, akkor a Szmirnov eloszlsbl

Erre is igaz, hogy

szmolhatunk kritikus rtket, ha pedig

n, m

kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.

11. Lineris regresszi, lineris modellek


Legyen
Krds:
Pl.:

100

(X, Y )

ktdimenzis valvltoz.

milyen lineris fggvnye kzelti legjobban


kockadobsbl

prosak

szmt

Y -t?

szeretnnk

34

hatosok

szmnak

lineris

fggvnyvel

kzelteni.
Elnevezs:

a magyarz vltoz.

A kzelts hibjt mrje a

h2 = E[(Y (aX + b))2 ]

mennyisg, ezt szeretnnk minimalizlni.

Megolds:

h2 = E(X 2 )a2 + b2 + 2E(X)ab 2E(XY )a 2E(Y )b + E(Y 2 )


A kifejezst

szerint derivlva, akkor lesz

0,

ha

a=
A kifejezst

szerint derivlva, akkor lesz

0,

E(XY ) bE(X)
.
E(X 2 )

ha

b = E(Y ) aE(X).
A minimumot teht a kvetkez paramterek adjk:

a =
A

h2

hibt

cov(X, Y )
,
D2 (X)

b = E(Y ) a E(X).

szrsngyzetvel osztva megkapjuk, hogy a regresszi a szrsngyzet hny szzalkt

magyarzza meg.
Ugyanezt a feladatot tekinthetjk tbb magyarz vltoz esetn is: legyen

X = (X1 , . . . , Xq ) a magyarz vltozkat.


T
mennyisget, ahol a = (a1 , . . . , aq ) vektor.
jellje

(X1 , . . . , Xq , Y ) valvltoz, s
h2 = E[(Y (aT X + b))2 ]

Minimalizlni szeretnnk a

A feladat az egy-dimenzishoz hasonlan oldhat meg, s

a = cov(Y, X)1 (X),

b = E(Y ) a E(X).

cov(Y, X) = (cov(Y, X1 ), . . . , cov(Y, Xq )) sorvektor, (X) pedig q q -as mtrix, melynek (i, j)-dik
cov(Xi , Xj ). (Tegyk fel, hogy a mtrix invertlhat.)

Itt most
eleme

Ez utbbi fellls arra az esetre is alkalmazhat, amikor egy magyarz vltoz van, de annak
polinomjval szeretnnk

Y -t

kzelteni.

Pl. Egy teve legel Erzsi nni hts kertjben.


Ebbl a mondatbl vletlenszeren vlasztva egy szt, legyen
A legjobb lineris kzelts

Y -ra: 0.82X +4.06.

Y pedig a sz hossza.
Y -ra: 1.02X 2 1.25X +4.38.

az e betk szma,

A legjobb msodfok kzelts

Feladat: szmoljuk ki a kt kzelts hibjt!

(Xi1 , . . . , Xiq , Yi ), i = 1, . . . , n fggetlen, azonos eloszls minta.


Pn
1
T
2
(Y

(a
X
+
b))
hibt szeretnnk minimalizlni. Ha a minta tapasztalati eloszlst
i
i
i=1
n
tekintjk, akkor az tlag a vrhat rtknek felel meg, azaz a megolds ugyanaz, mint az elbb, csak a
Az elz statisztikai megfelelje:

Most a

h2 =

megfelel tapasztalati mennyisgeket kell berni.


A fentiekben teljes ltalnossgban megkerestk a legjobb lineris kzeltst.

Yi = aT Xi + b + i , ahol Xi ugyanaz, mint fent, de most ismertnek


2
az Yi meggyelsek pedig Xi lineris fggvnyei, hibval terhelten. Itt i fggetlen N (0, )
T
2
Yi N (a Xi + b, ) eloszls, s fggetlenek.
Lineris modell:

felttelezzk,
hibk. Teht

Plda: egy ember slya a neme, letkora, magassga valamilyen lineris fggvnye, plusz mg az egyni
ingadozsbl szrmaz hiba.
ll: Ebben a modellben
ll: Ebben a modellben

a s b ML becslse
2 ML becslse:

pp a fenti

b ,

s a becslsek torztatlanok.

2 =
ez nem torztatlan, de

1X
(Yi (aT Xi + b))2 ,
n i=1
n

X
1
(Yi (aT Xi + b))2
n q 1 i=1
mr az.

35

You might also like