Villo Statisztika

Statisztika (jegyzet)
Csiszr Vill
2009. mjus 6.
1. Statisztikai mez
A statisztika egyik ga a ler statisztika. Ekkor a meggyelt adatokat ttekinthet formban brzoljuk, pl.
hisztogrammal (oszlopdiagrammal), krdiagrammal, egyb grakonokkal.
Msrszt az ada-
tokbl kiszmtunk nhny fontos, jellemz rtket, pl. az tlagot (mintakzepet), tapasztalati szrst,
szlsrtkeket.
A
matematikai statisztika alapfeladata:
gi vltoz eloszlst) nem ismerjk,
egy vletlen jelensg mechanizmust (pl. az t ler valszns-
de meggyelseket vgezve,
a meggyelsekbl szeretnnk r
kvetkeztetni. A kvetkez tmakrkkel fogunk foglalkozni:
Becslselmlet:
A valsznsgi vltoz valamilyen jellemzjt szeretnnk a mintbl megbecslni,
illetve a becsls hibjt meghatrozni. Minl pontosabb, megbzhatbb becslst keresnk. Pldk:
1. Egy munkltatt egy titkrn ltal gpelt szvegekben elfordul hibk szma rdekli. Pl. a hibk tlagos szma s a hibaszm szrsa. A munkltat
30 darab, kzel azonos hosszsg, a titkrn ltal
legpelt szvegben megszmolja a hibkat. sszer feltenni, hogy a hibk szma Poisson eloszls,
de az eloszls paramtere
()
ismeretlen. A meggyelsek alapjn szeretne kvetkeztetni
-ra,
ebbl
a vrhat rtk s a szrs mr kiszmolhat. Msrszt, a vrhat rtket s a szrst becslheti a

Poisson felttelezs nlkl is.
2. Egy fonalgyrban a fonalszakadsokat vizsgljk.
hogy a fonal egy
Annak a valsznsgt szeretnk megbecslni,
rs mszak alatt egyszer sem szakad el. Ennek rdekben 20 fonalszl minde-
gyikrl feljegyzik, hogy mennyi id mlva szakad el. sszer feltenni, hogy a fonalak lettartama
exponencilis eloszls (rkifj tulajdonsg), de
3. Egy kosaraz 10-szer kosrra dob. Betall
dobsbl:
Ind(p),
ahol a tallat valsznsge
ismeretlen.
1 pont, nem tall be
0 pont. Kapott pontszm egy
ismeretlen, ezt szeretnnk megbecslni.
4. Htftl pntekig naponta megnzzk egy vros ramfogyasztst. Ez feltehetleg normlis eloszls,
de
m,
ismeretlen.
5. Htftl pntekig megmrjk, hogy mennyit kell vrni a buszra.

eloszls
[0, b]
intervallumon, ahol
Hipotzisvizsglat:
Feltehet, hogy ez egyenletes
ismeretlen.
A jelensggel kapcsolatban van egy elzetes felttelezsnk, amelyet tesztelni sz-
eretnnk. Ha a meggyelseink sszeegyeztethetk a feltevssel, elfogadjuk azt, ha viszont ellentmondanak

neki, akkor elutastjuk a feltevst. J dntsi eljrst keresnk. Pldk:
egszsggyben: gygyszerek hatsossgnak bizonytsa;
ipar: selejtarny ellenrzse: le kell-e a gpsort cserlni?
irodalomtudomny: 2 szvegrl el kell dnteni, hogy ugyanaz rta-e ket;
szociolgia: prtok npszersge: van-e szignikns klnbsg?
szociolgia: prtpreferencia s iskolzottsg kztt van-e sszefggs?
1.1. Denci.
A -agebra
Az
(, A, P)
hrmast
(esemnyek csaldja),
statisztikai meznek hvjuk,
ahol
nemres halmaz (esemnytr),
pedig a szbajhet valsznsgi mrtkek csaldja. Azaz
P = {P | },
ahol
A
valsznsgi mrtkek.
halmazt
paramtertrnek nevezzk.
Legtbbszr
vges dimenzis euklideszi tr rszhalmaza, ekkor
azt mondjuk, hogy paramteres a feladat (pl.: 1.-5. paramteres feladatok).

pl.: ha
lehet ennl jval "nagyobb",
az sszes lehetsges valsznsgi mrtk, ekkor nemparamteres a feladat.
1.2. Denci.
Egy
neveznk, ahol
X = (X1 , . . . , Xn ) : X Rn valsznsgi vltozt (n elem) mintnak

n pedig a minta nagysga vagy elemszma. Az Xi koordintk a minta
a mintatr,
elemei.
Mi (majdnem) mindig olyan mintkkal fogunk foglalkozni, amikor ugyanazt a vletlen jelensget, egymstl
fggetlenl,
n-szer
1.3. Denci.
minta, ha
Xi -k
gyeljk meg.
X fggetlen elem
P szerint
az sszes
minta, ha
Xi -k
az sszes
szerint fggetlenek.
X azonos eloszls
azonos eloszlsak.
{Fn; | }, ahol Fn; (x1 , ..., xn ) = P (X1 < x1 , ..., Xn < xn ).

X n elem, fggetlen, azonos eloszls minta, akkor
A minta eloszlsfggvnyeinek csaldja

Ha
Fn; (x1 , ..., xn ) =
n
Y
F1; (xi ),
i=1
ahol
F1;
az
Xi
koordintk kzs eloszlsfggvnye. Emlkezznk r, hogy az eloszlsfggvny helyett
diszkrt esetben a
pn; (x1 , . . . , xn ) = P (X1 = x1 , X2 = x2 , ..., Xn = xn )

valsznsgeket, abszolt folytonos esetben pedig az
fn; (x1 , ..., xn )

srsgfggvnyt is hasznlhatjuk. Fggetlen elem minta esetn ezek is szorzatra bomlanak.
1.1. Plda.
szma.
(titkrn) A minta:
X = (X1 , . . . , X30 ) : N30

0 ,
paramtertr
= (0, ) R,
p30; (x1 , x2 , . . . , x30 ) =
30
Y
p1; (xi ) =
i=1
1.4. Denci.
2)
Az mintatren megadott
30
Y
i=1
T : X Rk
(k-dimenzis) statisztiknak nevezzk.
1.2. Plda.
1)
Xi
azaz egyparamteres feladatrl van sz.
kirva
vltozt
ahol
az
i.
szvegben tallt hibk
fggetlen, azonos eloszls minta, a mintaelemek szbajhet eloszlsai:
xi
xi !
30
Q
=e
xi !
fggvnyt, illetve magt a
T = T (X)
valsznsgi
Nhny gyakran hasznlt statisztika (X mindenhol
n elem minta):
n
X
1
T (X) = X =
Xi az X minta mintatlaga.
n i=1
n
1X
2
T (X) = SX
=
(Xi X)2 az X minta tapasztalati szrsngyzete.
n i=1
(n)
(n)
(n)
(n)
xi
T (X) = (X1 , X2 , ..., Xn ) az X minta rendezett mintja, ahol X1 X2

(pl. T (2, 4, 1, 3) = (1, 2, 3, 4)).
(n)
(n)
4) T (X) = Xn X1
az X minta mintaterjedelme.
(n)
ha n pratlan
X
n+1
2
(n)
(n)
5) T (X) =
az X minta tapasztalati medinja.
X n + X n +1
2
2
ha n pros
2
3)
Xi P oisson(),
A valsznsgeket rszletesen
(n)
(n)
Xn
1.5. Denci.
Az (X1 , ..., Xn ) minta tapasztalati eloszlsa az a vletlen diszkrt eloszls, melynek lehetXi rtkek, az rtkekhez tartoz valsznsgek pedig a meggyelt relatv gyakorisgok.
x1 < x2 < < xm a meggyelt (klnbz) rtkeket (m n), ekkor az xj -hez tartoz
sges rtki az
Azaz jellje
valsznsg:
|{i|Xi = xj }|
1X
=
I(Xi = xj ),
n
n i=1
I(Xi = xj ) = 1, ha Xi = xj , s I(Xi = xj ) = 0, ha Xi 6= xj .
X minta tapasztalati eloszlsfggvnye a tapasztalati eloszlshoz
ahol
Az
tartoz eloszlsfggvny:
1X
Fn (x) =
I(Xi < x),
n i=1
x R.
Hogy nz ez ki?
n
n
4
n
3
n
2
n
1
n
1.1. Ttel. (Glivenko:

F -hez,
0
k
Fn (x) =
b r
r
x X1 ,
ha
Xk
ha
Xn
(n)
< x Xk+1 ,
(n)
(n)
< x.
(n)
Xn
X1 , . . . , X n
A statisztika alapttele.) Legyenek

Ekkor az
(n)
ha
(n)
(n)
X1
(n) X4
X2,3
vny valsznsgi vltozk.

tart
b
r
Fn
fggetlen, azonos
tapasztalati eloszlsfggvny
eloszlsfgg-
valsznsggel egyenletesen
azaz

P ( lim sup Fn (x) F (x) = 0) = 1.
n xR
A ttel jelentse az, hogy ha elg sok meggyelst vgznk, akkor tetszleges pontossggal visszakapjuk a
x R-re

P ( lim Fn (x) F (x) = 0) = 1,
valdi eloszlst. Azt knny beltni, hogy minden rgztett
hiszen ez ppen a nagy szmok ers trvnye az

hogy a

supxR Fn (x) F (x)
1.1. Feladat.
I(Xi < x)
valsznsgi vltozkra. Megjegyezzk mg,
1/ n.
maximlis eltrs nagysgrendje
Az 2-5 pldkra adjuk meg a mintateret, a paramterteret, s a minta eloszlsainak csald-
jt!
X minta mindegyik pldban

Xi az i. fonalszl lettartama.
X = R20
+ , Xi Exp(), = (0, ),
Mo: az
fggetlen, azonos eloszls.
2)
f20; (x1 , ..., x20 ) =
20
Y
f1; (xi ) =
i=1
20
Y
exi = 20 e
xi
i=1
3. Xi az i. dobs pontszma.
10
X = {0, 1} , Xi Ind(), = [0, 1],
p10; (x1 , . . . , x10 ) =
10
Y
p1; (xi ) =
i=1
10
Y
xi (1 )1xi =
xi
(1 )10
i=1
4. Xi az i. nap fogyasztsa.
X = R5+ , Xi N (1 , 2 ), = R R+ ,
f5; (x1 , ..., x5 ) =
5
Y
f1; (xi ) =
i=1
5
Y
i=1
1
p
e
2
22
(xi 1 )2
22
2
xi
Xi az i. napon a vrakozsi id.

X = R5+ , Xi E(0, ), = (0, ),
5.
f5; (x1 , ..., x5 ) =
5
Y
f1; (xi ) =
i=1
1.2. Feladat.
punk. Jellje
5
Y
1
1
(1)
I(0 xi ) = 5 I(x1 0
i=1
8-szor a kvetkez ksrletet:

i. ksrletben hnyszor kellett
Vgezzk el
Xi ,
hogy az
(5)
x5 ).
addig dobunk egy rmvel, amg fejet nem kadobni. Az
minta egy konkrt realizcijra
adjuk meg a tapasztalati eloszlsfggvnyt, s szmtsuk ki az 1.2 Pldban szerepl statisztikkat!

Mo: Ha pldul a minta a kvetkez:
A tapasztalati eloszls:
x1
x2
x3
x4
x5
x6
x7
x8
rtk
valsznsg
2
8
3
8
2
8
1
8
mintatlag:
tapasztalati szrsngyzet:
mintaterjedelem:
tapasztalati medin:
19/8 = 2.38
95/64 = 1.48
4
2
b
b
b
r
(8)
x1,2
b
r
(8)
x3,4,5
(8)
x6,7
(8)
x8
1.3. Feladat.
Legyen X fggetlen, azonos eloszls minta, a koordintk kzs eloszlsfggvnye F .

Fn (x) vrhat rtkt s szrsngyzett!
p
nFn (x) Bin(n, F (x)). gy E(Fn (x)) = F (x) s D(Fn (x)) = F (x)(1 F (x))/n.
Szmoljuk ki
Mo:
2. Elgsgessg
az igazi paramter. A P (X = x)
-tl (bizonyos -kra nagy a valsznsge, hogy ezt a mintt kapjuk, msokra kisebb). A
T (X) statisztika is hordoz informcit, hiszen a P (T (X) = t) valsznsg is fgg -tl. Az eredeti minta
Az
minta informcit tartalmaz arrl, hogy melyik
valsznsg fgg
ltalban tbb informcit tartalmaz a paramterrl, mint a belle kiszmolt statisztika. Pl. ha diszkrt
P (X = x) valsznsgek sokflesge hordozza a -ra vonatkoz informcit. A

P (T (X) = t) valsznsgek sokflesgbl szrmazik. A {T (X) = t}
esemny felbomlik {X = x} esemnyekre, olyan x-ekre, melyekre T (x) = t. Az X -ben tartalmazott
pluszinformci teht a P (X = x|T (X) = t) valsznsgek sokflesgbl addik, olyan x-ekre, melyekre
T (x) = t. Ha a P (X = x|T (X) = t) feltteles valsznsgek mr nem fggnek -tl, akkor, mivel
P (X = x) = P (X = x|T (X) = T (x))P (T (X) = T (x)), a minta nem tartalmaz tbb informcit, mint a
mintt vesznk, akkor a
T (X)-ben
rejl informci pedig a
statisztika.
2.1. Denci.
Legyen X = (X1 , . . . , Xn ) diszkrt minta az (, A, P) statisztikai mezn. Azt mondjuk,

T (X) statisztika elgsges a paramterre, ha minden x, t prra a P (X = x|T (X) = t) valsznsg
fgg -tl.
hogy a
nem
2.1. Plda.
Legyen
Xi Ind(p),
ahol
0 p 1
ismeretlen paramter.
dengyikrl feljegyezzk, hogy hatos-e. Beltjuk, hogy
i Xi
Pl.
elgsges statisztika
100 kockadobs min-
p-re,
azaz nem kell a
dobsokrl egyesvel feljegyezni, hogy melyik volt hatos, melyik nem, hanem elg feljegyezni, hogy sszesen
p-rl. A denci alapjn szmolunk:
n
X
0
ha
xi 6= t
i=1
=nt
=t
n
z }|
{
z}|{
Q
X
P
P
n
n
xi
1xi
xi
n xi
X
Pp (X = x|
Xi = t) =
p
(1
p)
p
(1
p)
1
i=1

=
= n
ha
xi = t
n t
nt
i=1
n t
nt
t p (1 p)
t
i=1
p
(1
p)
|
{zP
}
hny hatos volt. Ezzel nem vesztnk informcit
binom;
Azaz a kapott feltteles valsznsg tnyleg nem fgg
2.1. Ttel. (Neyman faktorizcis ttele)
p-tl.
Legyen
akkor s csak akkor elgsges, ha tallhatk olyan
Ind
X diszkrt eloszls minta. A T (X) statisztika

g fggvnyek, melyekre P (X = x) = h(x)
g (T (x)).
Bizonyts.
:
Tegyk fel, hogy
T (X)
elgsges statisztika. Ekkor
P (X = x) = P (X = x|T (X) = T (x)) P (T (X) = T (x)) = h(x) g (T (x)),

-tl.
P (X = x) = h(x) g (T (x)),
felhasznlva, hogy az els tnyez nem fgg
Most tudjuk, hogy
h(x) g (t)
X
=
P (X = y)
P (X = x, T (X) = t)
=
P (T (X) = t)
P (X = x|T (X) = t) =
T (X)
meg kell mutatni, hogy
y:T (y)=t
elgsges statisztika.
h(x) g (t)
X
h(y) g (T (y))
y:T (y)=t
h(x)
X
,
h(y)
ha
T (x) = t,
y:T (y)=t
egybknt pedig a feltteles valsznsg nulla.
A ttelnek az a jelentsge, hogy mdszert ad arra, hogyan lehet elgsges statisztikt tallni.
2.2. Plda.
Legyen
X1 , ..., Xn P oisson(),
pn; (x) = P (X = x) =
n
Y
-ra!
keressnk elgsges statisztikt
i=1
P
xi
xi
1
= en Qn
= Qn
e|n {z
x}i ,
xi !
xi !
X
i=1 xi !
| i=1
{z }
g (
xi )
h(x)
| {z }
:=T (x)
azaz a mintaelemek sszege elgsges statisztika.

Abszolt folytonos mintra az elz denci nem mkdik, mivel sok
esemny minden
t-re 0
statisztikra a
valsznsg, gy a feltteles valsznsg nem rtelmes.
{T (X) = t}
Neyman faktorizcis
ttele viszont egy olyan lltst fogalmaz meg, ami abszolt folytonos esetben is rtelmes, ha a valsznsg
helyett srsgfggvnyt runk.
2.2. Denci.
T (X)
Legyen
statisztika
elgsges
fn; (x). A
fn; (x) = h(x) g (T (x))
abszolt folytonos minta, srsgfggvnyeinek csaldja legyen

a
paramterre, ha ltezik a srsgfggvnynek
alak faktorizcija.
2.3. Plda.
Legyen
Xi E(0, b), b
fn;b (x) =
n
Y
a paramter. Prbljunk faktorizlni!
f1;b (xi ) =
i=1
n
Y
1
i=1
1
(n)
I(0 xi b) = I(x1 0) n I(x(n)
n b),
|
{z
} |b
{z
}
h(x)
(n)
gb (xn )
teht
(n)
Xn
elgsges statisztika.
Mj.: Nyilvn, ha
olyan
elgsges, akkor annak egy klcsnsen egyrtelm
minimlis elgsges
fggvnye is az, st minden
kiszmolhat. A gyakorlatban minl egyszerbb, gynevezett
statisztikt keresnk.
Ennek a fogalomnak adhat precz matematikai denci, de
statisztika elgsges, amelybl
ezzel most nem foglalkozunk.
2.1. Feladat.
1)
2)
3)
4)
5)
Keressnk elgsges statisztikt a paramter(ek)re a kvetkez mintkbl:
Geo(p)
Bin(m, p) m ismert
Exp()
N (m, )
P
E(a, a)
1)
Xi elgsges:
Xi
Xi
Xi
Xi
Xi
Mo:
pn;p (x) =
n
Y
(1 p)xi 1 p = (1 p)
xi n n
p .
i=1
2)
Xi
elgsges:
pn;p (x) =
n
Y
m
xi
i=1
3)
Xi
xi
mxi
p (1 p)
=p
xi
P
mn xi
(1 p)
n
Y
m
xi
i=1
elgsges:
fn; (x) =
n
Y
exi = n e
xi
i=1
4) Ha
(m, )
ismeretlen, akkor
fn;m, (x) =
n
Y
i=1
1
2 2
P
P
( Xi , Xi2 )
(xi m)2
2 2
elgsges:
n
1
2 2
e 22
(xi m)2
=
Ha
ismert, akkor
Xi
5)
n
1
2 2
e 22 (
x2i 2m
xi +nm2 )
elgsges:
fn;m (x) =
P
m ismert, akkor (Xi m)2
max |Xi | elgsges:
Ha
1
2 2
n
e 22
x2i
e 22 (nm
2m
xi )
elgsges.
n
Y
1
1
1
(n)
I(a < x < +a) =
I(|xi | < a i = 1, ..., n) =
I(|x|n < a).
n
n
2a
(2a)
(2a)
i=1
fn;a (x) =
3. Becslsek s jsguk
Legyen
X1 , ..., Xn (fggetlen, azonos eloszls) minta az F eloszlsfggvny eloszlsbl. Szeretnnk

() fggvnyt becslni (gyakran magt a paramtert kell becslni, de nem mindig). Nem
a paramter
remlhetjk, hogy a pontos rtket eltalljuk, de azt igen, hogy jl meg tudjuk kzelteni.
3.1. Denci.
Azrt
mint
1)
2)
3)
()
mennyisg
becslse valamely T (X) statisztika.
be egy j elnevezst a T (X) statisztikra,

mert most gy gondolunk r,
() mennyisget jl kzelt becslsre.
Mit vrhatunk el a T (X) becslstl?
A T (X) becsls nagyjbl () krl ingadozzk.
A T (X) minl kevsb ingadozzk () krl, azaz a becsls legyen minl pontosabb.
Tegyk fel, hogy minden n mintaelemszmra van egy Tn becslsnk. Megkvetelhetjk a
Tn (X1 , ..., Xn ) () sztochasztikus konvergencit.
vezettnk
3.2. Denci.
T (X)
becsls
torztatlan ()-ra, ha
E (T (X)) = () .
T (X)
ltalban a
3.1. Plda.
becsls
Legyen
torztsa a bT () = E (T (X)) () fggvny.
X1 , ..., Xn F
() = E (Xi ).
n
E (X) = E (
Ekkor
torztatlan becsls, mivel
1X
1X
Xi ) =
E (Xi ) = ().
n i=1
n i=1 | {z }
()
Ez alkalmazhat pldul a Poisson vagy az indiktor eloszls paramternek becslsre.
3.2. Plda.
nem
1
1
p -re! Belthat, hogy X
torztatlan, st, 1/p-t nem lehet torztatlanul becslni. Beltjuk ugyanis, hogy (p)-t akkor s csak
akkor lehet
Indiktor eloszls mintnl keressnk torztatlan becslst
(p) =
n elem indiktor-mintbl torztatlanul becslni, ha (p) p-nek legfeljebb n-edfok polinomja.

T tetszleges becsls.
X
P
P
Ep (T (X1 , ..., Xn )) =
T (x1 , ..., xn ) p xi (1 p)n xi ,
Legyen ugyanis
x{0,1}n
n-edfok
1) I(Xk = 1) (k n).
ez pedig legfeljebb
3.3. Denci.
polinomja
Tn (X1 , . . . , Xn )
p-nek.
Msrszt
pk
egy torztatlan becslse:
aszimptotikusan torztatlan becslssorozat
E (Tn (X1 , . . . , Xn )) ()
()-ra,
I(X1 = 1) I(X2 =
ha
-ra
(n ).
A gyakorlatban, ha elg nagy a minta, akkor ltalban egy aszimptotikusan torztatlan becsls is megfelel.
3.4. Denci.
ha
Legyenek T1 , T2 torztatlanok ()-ra. Ekkor azt mondjuk, hogy T1 hatsosabb T2 -nl,

D2 (T1 ) D2 (T2 ) minden -ra. A T (torztatlan) becsls hatsos, ha minden torztatlan becslsnl
hatsosabb.
Mj:
Kt becsls nem biztos, hogy sszehasonlthat hatsossg szempontjbl, hiszen lehet, hogy
bizonyos
-kra D2 (T1 ) < D2 (T2 ),
msokra viszont
D2 (T1 ) > D2 (T2 ).
Mj: Nem torztatlan becslsek esetn az tlagos ngyzetes vesztesget, azaz az
E [(T ())2 ] mennyisget
akarhatjuk minimalizlni.
3.1. Ttel.
Ha
T1
T2
is hatsos, akkor
valsznsggel megegyeznek, azaz
P (T1 = T2 ) = 1
minden
esetn.
Bizonyts.
A torztatlansg miatt
D2 (T2 ) minden -ra. Legyen most
E (T1 ) = E (T2 ) = (), s mivel mindkt becsls hatsos, D2 (T1 ) =
T1 + T2
.
2
E (T ) = (), msrszt T1
T =
Egyrszt
is torztatlan, hiszen
D2 (T1 ) D2 (T ) =
azaz
D2 (T1 ) cov (T1 , T2 ).
1
1
1
D2 (T1 ) + D2 (T2 ) + 2cov (T1 , T2 ) = D2 (T1 ) + cov (T1 , T2 ),
4
2
2
tosztva kapjuk, hogy
miatt azonban
a=1
cov (T1 , T2 )
= R (T1 , T2 ),
D (T1 )D (T2 )
T1 = aT2 + b teljesl 1
b = 0 lehet csak.
azaz az ismert ttel szerint
hatsossga miatt
valsznsggel. A vrhat rtkek s szrsok egyezse
3.2. Ttel.
X = (X1 , . . . , Xn ) fggetlen, azonos eloszls minta. Legyen () = E (XiP

), tovbb
n
D2 (Xi ) < minden -ra. Ekkor X hatsosabb becslse ()-nak minden i=1 ci Xi
Legyen
tegyk fel, hogy
alak torztatlan becslsnl.
Bizonyts.
Pn
i=1 ci Xi akkor s csak akkor torztatlan, ha
Vegyk elszr szre, hogy
Pn
i=1 ci
= 1.
Szmtsuk ki a szrsngyzeteket!
D2 (X) =
D2 (Xi )
,
n
X
X
X
D2 (
ci Xi ) =
D2 (ci Xi ) = (
c2i )D2 (Xi ).
Azt kell teht beltni, hogy
X
1
c2i .
n
i=1
A szmtani s ngyzetes kzp kztti egyenltlensgbl
rP
c2i
3.3. Plda.
Legyen
Xi E(0, b),
ci
1
= ,
n
n
E(0, 1)
n tn1 , teht
c2i
n
1
= .
2
n
n
n + 1 (n)
Xn ,
n
b-re:
T2 = 2 X.
(n)
(n)
Xi = bYi , ahol Yi E(0, 1), ekkor Xn = bYn , teht
(n)
(n)
(n)
eloszlssal foglalkozni. Yn
eloszlsfggvnye: P (Yn
< t) = tn , Yn srsgfggvnye:
nyilvn torztatlan, s
elg az
s vizsgljuk a kvetkez kt becslst
T1 =
T2
azaz
T1
is az: legyen ugyanis
E(Yn(n) ) =
n
n+1
t ntn1 dt = n
1
n
=
.
n+1
n+1
Ebbl
Eb (T1 ) = b.
Melyik becsls a hatsosabb?
Db2 (T2 ) = 4
Db2 (Xi )
4 b2
b2
=
=
.
n
n 12
3n
Msrszt
(Yn(n) )
1
2
t nt
n1

dt
Tovbb
(n)
(n)
Db2 (Xn ) = b2 Db2 (Yn ),
n
n+1
3.5. Denci.
(n ),
T1
n
=
n+2
2
n
=
n+1
n(n + 1)2 n2 (n + 2)
n
=
=
.
2
(n + 1) (n + 2)
(n + 1)2 (n + 2)
azaz
Db2 (T1 ) =
Kaptuk teht, hogy
2
hatsosabb
Tn (X1 , ..., Xn )
T2 -nl
n+1
n
2
(minden
becslssorozat
Db2 (Xn(n) ) =
b2
.
n(n + 2)
n-re).
konzisztens ()-ra,
azaz
P (|Tn ()| > ) 0 .
ha
Tn ()
sztochasztikusan
3.4. Plda.
a) A mintatlag konzisztens becsls a vrhat rtkre:
X E (Xi )
sztochasztikusan (ez a
nagy szmok gyenge trvnye).
E (Tn ) = () (azaz Tn torztatlan becsls, de

D2 (Tn ) 0 (n ), akkor Tn konzisztens, mivel
b) Ha
s
az is elg lenne, hogy aszimptotikusan torztatlan)
D2 (Tn )
0.
2
Cseb
P (|Tn ()| > )

c) Legyen
Xi E(0, ),
Tn =
n+1 (n)
n Xn . Ez a fentiek szerint konzisztens becslssorozat, hiszen
D2 (
2
n+1
Xn(n) ) =
0.
n
n(n + 1)
4. Fisher-informci
4.1. Denci.
Legyen az X = (X1 , . . . , Xn ) minta eloszlsfggvnyeinek csaldja Fn; .

Ekkor az
Ln (x; ) likelihood fggvnyt a kvetkezkppen deniljuk: abszolt folytonos minta esetn Ln (x; ) =
fn; (x), diszkrt minta esetn Ln (x; ) = pn; (x).
4.2. Denci.
Az
elem,
Fn;
Fisher-informcija az
eloszlsfggvny minta
In () = E ([
ln Ln (X; )]2 )
rtk, ha a derivlt ltezik, s ez a mennyisg vges.
4.1. Ttel. (*)
X1 , . . . , Xn fggetlen, azonos eloszls mintaelemek,

L1 (xi ; ). Tegyk fel, hogy I1 () < , tovbb hogy
Legyenek
likelihood fggvnyt
E (
Ekkor
s jellje egy mintaelem
ln L1 (X1 ; )) = 0.
In () = n I1 ().
Bizonyts.
A felttel miatt
E (
I1 () = D2 (
ln L1 (X1 ; )),
tovbb
n
n
Y
X
ln Ln (X; )) = E (
ln
L1 (Xi ; )) =
E (
ln L1 (Xi ; )) = 0.
i=1
{z
}
i=1 |
0
Ebbl kvetkezik, hogy
In () = D2 (
n
n
X
X
ln L1 (Xi ; )) = n I1 ().
ln Ln (X; )) = D2 (
ln L1 (Xi ; )) =
D2 (
{z
}
i=1
i=1 |
I1 ()
Mj: A felttel gyakran teljesl, mivel ez egy bederivlhatsg lruhba bjtatva. Tegyk fel mondjuk,
hogy a minta abszolt folytonos. Tudjuk, hogy
f1; (x) dx = 1
f1; (x) dx = 0.
Ha a derivls s integrls felcserlhet, azaz be lehet derivlni, akkor kapjuk, hogy
0=
f1; (x) dx =
+
f1; (x)
f1; (x)
f1; (x) dx =
ln f1; (x)f1; (x) dx = E (

ln f1; (X1 )).
Diszkrt esetben, hasonlan, a ttel felttele azzal ekvivalens, hogy
X
X
p1; (x1 ) =
p1; (x1 ).
x
x
1
Ez biztosan teljesl, ha a valsznsgi vltoz rtkkszlete vges.
4.1. Plda.
Legyen
Xi Ind(p).
Ekkor
L1 (x, p) = px (1 p)1x (x {0, 1}),
amibl
x 1x
ln L1 (x, p) =
.
p
p
1p
Ellenrizzk a
(*) Ttel felttelt!

Ep
p 1p
ln L1 (Xi , p) =
= 0.
p
p 1p
Teht az egyelem minta Fisher-informcija:
I1 (p) = Dp2
s
In (p) = n I1 (p) =
4.2. Plda.
Legyen

Xi
1
ln L1 (Xi , p) = Dp2
=
,
p
p(1 p)
p(1 p)
n
.
p(1 p)
Xi N (, 0 ),
ahol
ismert. Ekkor
L1 (x, ) = p
202
(x)2
2
20
Logaritmust vve
ln L1 (x, ) = ln p
202
Ellenrizzk a
(x )2
.
202
(*) Ttel felttelt!

2(Xi )
E (
ln L1 (Xi , ) = E
= 0.
202
Ebbl
I1 () =
s
In () =
Mj:
D2
Xi
02

=
D2 (Xi )
1
= 2,
4
0
0
n
.
02
Nzhetnnk azt is, hogy a minta mennyi informcit tartalmaz a paramter valamely
fggvnyre, illetve mennyi informcit tartalmaz egy paramtervektorra nzve.
()
Ezekkel most nem
foglalkozunk.
Bizonyts nlkl megjegyezzk a kvetkezt. Legyen
b legyen
T = T (X)
minta, a benne rejl informci
egy statisztika, a benne rejl informcit jellje
regularitsi felttelek mellett)
IT () IX (),
IT ().
IX ().
Tovb-
Belthat, hogy (bizonyos
s egyenlsg akkor s csak akkor van, ha
elgsges
statisztika. Pldul a kvetkez regularitsi feltteleket szoktk tenni:

1)
2)
p
L1 (x, ) folytonosan dierencilhat szerint,
> I1 () > 0, s I1 () folytonos -ban.
Ha ezek teljeslnek, akkor minden
szp s j , pl.
ekkor teljesl a
(*) ttel bederivlhatsgi felttele.
A kvetkez ttel arrl szl, hogy egy torztatlan becsls nem lehet tetszlegesen pontos, a szrsngyzetre adhat egy als korlt, mely a mintban tallhat informci mennyisgtl fgg (azonban ez az
als korlt ltalban nem les).
10
4.2. Ttel. (Cramr-Rao egyenltlensg) Legyen X = (X1 , ..., Xn ) minta, s tegyk fel, hogy tel2
jeslnek a (*) ttel felttelei. Legyen mg T (X) olyan torztatlan becslse ()-nak, melyre D (T ) <
minden
-ra.
Feltesszk mg a kvetkez bederivlhatsgi felttelt:

ln Ln (X; ) .
0 () = E T (X)
Ekkor
D2 (T )
Bizonyts.
( 0 ())2
In () teljesl minden
-ra.
Az tlet: tudjuk, hogy minden
S -re
cov (T, S)2 D2 (T )D2 (S)

Ez olyan
cov (T, S)2

.
D2 (S)
D2 (T )
vlasztssal ad hasznlhat korltot, melyre
cov (T, S) = E (T S) E (T )E (S) = E (T S) ()E (S)

nem fgg
T -tl.
Legyen
ln Ln (X; ),
S =
(*) Ttel egyik felttele), teht

msrszt
E (S) = 0
ez a felttel szerint j lesz. Egyrszt
(ez volt a
cov (T, S) = E (T S) = 0 (),
D2 (S) = In ().
Mj: Nzzk a felttelt!
Z
() = E (T ) =
T (x)fn; (x) dx .
Bederivlhatsg esetn ebbl
0 () =
Az als korlt, azaz a
-ra,
( 0 ())2
In ()
T (x)

fn; (x) dx = E T (X)

ln Ln (X; ) .
mennyisg neve
akkor azt mondjuk, hogy a
informcis hatr.
Ha
D2 (T ) =
( 0 ())2
In () teljesl minden
becsls elri az informcis hatrt. Nyilvn, ha a
torztatlan becsls
elri az informcis hatrt, akkor hatsos.

Specilisan, ha magt a paramtert akarjuk becslni, akkor
() = ,
azaz az informcis hatr
1/In ().
4.1. Feladat.
02 /n,
4.2. Feladat.
p(1 p)/n,
Xi N (, 0 ), -ra keressnk hatsos becslst!

D2 (X) = 02 /n, ezrt X hatsos becsls -ra.
Legyen
ugyanakkor
Az informcis hatr
Xi Ind(p), p-re keressnk hatsos becslst! Az

Dp2 (X) = p(1 p)/n, ezrt X hatsos becsls p-re.
Legyen
informcis hatr
1/In () =
1/In (p) =
ugyanakkor
4.3. Feladat.
Legyen
Xi Exp(), () =
1
-t szeretnnk becslni. Tudjuk, hogy
torztatlan becsls.
Szrsngyzete
D2 (X) =
1
2
1
.
2 n
A Fisher-informci:

E
Ebbl
I1 () = D2

1
ln f1; (Xi ) = E
(ln Xi ) = E
Xi = 0.
Xi
= D2 (Xi ) =
informcis hatr teht
Kaptuk, hogy
hatsos becsls
1
n
, In () =
.
2
2
2
12
1
=
.
n
n 2
2
1/-ra.
11
Most
() = 1/, 0 () = 1/2 .
Az
4.4. Feladat.
Legyen
4.5. Feladat.
Legyen
f1; (x)
Xi Poisson().
Xi E(0, ).
0x
nem folytonosan derivlhat

f1; (x) =
ha
egybknt
"
I1 () = E
felhasznlva, hogy
In () = E
ln
Mutassuk meg, hogy
hatsos becsls
Most nem teljeslnek a regularitsi felttelek, rgztett
mellett
"
2 #
2 #
2
1
1
1
ln L1 (X1 ; )
= E
ln
=
= 2,
X1 < , azaz 1 valsznsggel L1 (X1 ; )

n 2
n2
=
= 2 = n2 I1 ().
szerint.
valsznsggel

1 n 2
-ra!
rgztett,
rgztett,
a vltoz
derivlhat. Ugyanakkor
a vltoz
6
f1; (x)
f1; (x)
itt nem
derivlhat
5. Becslsi mdszerek
5.1. Blackwellizls
X, Y diszkrt
valsznsgi vltozk, akkor X
P
Y = y felttel mellett E(X|Y = y) = x x P (X = x|Y = y) = V (y). Az X
az Y vltozra nzve pedig E(X|Y ) = V (Y ). Ez teht nem egy szm, hanem
Elszr nzznk egy kis ismtlst! Ha
feltteles vrhat
rtke az
feltteles vrhat
rtke
egy valsznsgi
vltoz. Bizonyts nlkl eleventsk fel a kvetkez tulajdonsgokat:

1)
2)
3)
4)
E(c|Y ) = c
E(X1 + X2 |Y ) = E(X1 |Y ) + E(X2 |Y )
E(cX|Y ) = cE(X|Y )
X1 X2 E(X1 |Y ) E(X2 |Y ).
Ezeken kvl szksgnk lesz mg nhny tulajdonsgra:

5) Teljes vrhat rtk ttele:
E (E(X|Y )) = E(V (Y )) =
V (y) P (Y = y) =
XX
x P (X = x|Y = y) P (Y = y) =
X X
X
x P (X = x) = E(X).
x
P (X = x|Y = y) P (Y = y) =
x
5) Kiemels:
P (X=x)
E(XW (Y )|Y ) = W (Y )E(X|Y ),
{z
teljes valsznsg ttele
magyarzat:
rgztse mellett
W (Y )
konstans, azaz
kiemelhet a vrhat rtkbl

6)
Teljes
szrsngyzet
E (X E(X|Y )) |Y
ttele:
D2 (X)

E D2 (X|Y ) + D2 (E(X|Y )),
ahol
D2 (X|Y )
Bizonyts:

D2 (X|Y ) = E X 2 2XE(X|Y ) + E(X|Y )2 |Y = E(X 2 |Y ) E (2XE(X|Y )|Y ) + E E(X|Y )2 |Y =
E(X 2 |Y ) 2E(X|Y )E(X|Y ) + E(X|Y )2 = E(X 2 |Y ) E(X|Y )2 .
12
Vrhat rtket vve:

E D2 (X|Y ) = E E(X 2 |Y ) E E(X|Y )2 = E(X 2 ) E(X)2 E E(X|Y )2 E(X)2 .
|
{z
} |
|
{z
}
{z
}
D 2 (X)
E(X 2 )
Kvetkezmnyknt kapjuk, hogy
5.1. Plda.
Az
{Y = y}
D 2 (E(X|Y ))
D2 (E(X|Y )) D2 (X).
n-szer. Legyen X a hatosok szma, Y a pratlanok
Bin(n y, 1/3). Teht E(X|Y ) = (n Y )/3. Erre
Dobjunk fel egy szablyos kockt

felttel mellett
eloszlsa
E(E(X|Y )) = E((n Y )/3) =

Msrszt
D2 (X|Y ) = (n Y )
n
n E(Y )
= ,
3
6
1 2
2(n Y )
=
,
3 3
9
E(X) =
n
.
6
E(D2 (X|Y )) =
n
.
9
szma.
Vgl
D2 (X) =
5n
,
36
5.1. Ttel. (Rao-Blackwell ttel) Legyen X

elgsges statisztika
Bizonyts.
-ra.
Ekkor
U = E(S|T )
diszkrt minta,
Mj:
torztatlan becslse
is torztatlan becsls
()-ra,
()-nak, T
S -nl.
pedig
s hatsosabb
A feltteles vrhat rtk tulajdonsgaibl rgtn ktetkezik:
E (U ) = E (E (S|T )) = E (S) = (),
-tl,
n
.
36
D2 (E(X|Y )) =
Azt, hogy
D2 (U ) = D2 (E (S|T )) D2 (S).
elgsges statisztika, ott hasznltuk fel, hogy az
azaz a mintbl kiszmolhat mennyisg.
E(S|T )
vrhat rtk nem fgg
Az eljrsnak lnyege teht az, hogy egy akrmilyen
torztatlan becsls hatsossgt javthatjuk azzal, ha egy elgsges statisztikra vett feltteles vrhat
rtkt kpezzk.
Ennek az eljrsnak elnevezse
blackwellizls.
A ttelbl kvetkezik, hogy ha van
hatsos becsls, akkor az tetszleges elgsges statisztiknak fggvnye.
5.2. Plda.
Legyen
Xi Geo(p), p-t
szeretnnk becslni.
Elgsges statisztika:
T =
n
X
Xi .
Egy
i=1
egyszer torztatlan becsls:
S = I(X1 = 1).
Blackwellizljunk, azaz szmoljuk ki az
U = E(S|T ) = V (T )
becslst!
V (`) = Ep (S|T = `) = 0 Pp (S = 0|T = `) + 1 Pp (S = 1|T = `) = Pp (X1 = 1|
n
X
Xi = `) =
i=1
Pn
Pp (X1 = 1 , i=1 Xi = `)
Pn
.
P ( i=1 Xi = `)
A szmll
Pp (X1 = 1,
n
X
X1 = `) = Pp (X1 = 1,
n
X
i=1
n
X
Xi = ` 1) = Pp (X1 = 1)Pp (
Xi = ` 1).
i=2
i=2
Pn
Xi N egBin(n, p). Teht

Pn
`2 n1
p n2
p
(1 p)`n
Pp (X1 = 1)Pp ( i=2 Xi = ` 1)
n1
Pn
=
V (`) =
=
.

`1
n
`n
`1
P ( i=1 Xi = `)
n1 p (1 p)
A neveznl pedig azt hasznljuk, hogy
Azaz
Pn
n1
U = V ( i=1 Xi ) = Pn
i=1 Xi 1
i=1
lesz az
blackwellizltja (megmutathat, hogy ez hatsos becs-
ls).
13
5.1. Feladat.
Legyen
Xi P oisson(),
keressnk j torztatlan becslst
() = e -ra
blackwellizls-
sal!
Els tlet:
eX ,
de belthat, hogy ez nem torztatlan.
e = P (X1 = 0),
Vegyk szre, hogy
E (S|T = `) = P (X1 = 0|
S = I(X1 = 0)
azaz
n
X
Pn
i=1
Xi = `) =
Xi Poisson(n)

1
V =
1
n
Pn
i=2
P
Xi
T =
((n1))`
`!
(n)`
`!
e e(n1)
en
i=1
Felhasznltuk, hogy
j lesz. Tovbb
Xi Poisson((n 1)).
Pn
i=1

=
Xi
1
1
n
elgsges.
`
.
Azaz a megjavtott becsls:
X
n

1
= 1
.
n
| {z }
e1
5.2. Feladat.
Legyen
Xi Ind(p),
keressnk j torztatlan becslst
(p) = p2 -re
blackwellizlssal!
X , de ez nem torztatlan.
Pn
S = I(X1 = 1, X2 = 1), T = i=1 Xi ,
Els tlet:
Ep (S|T = `) = Pp (X1 = 1, X2 = 1 |
n
X
Xi = `) =
i=1
P
azaz a megjavtott becsls
Xi
V =
n2 `2
(1
`2 p

n `
n`
` p (1 p)
pp
p)n
`(` 1)
,
n(n 1)
Xi 1
.
n1
5.2. Tapasztalati becsls

A tapasztalati becsls azt jelenti, hogy az elmleti eloszls valamely jellemzjt a tapasztalati eloszls
megfelel jellemzjvel becsljk. Ezek a becslsek ltalban konzisztensek, mivel a tapasztalati eloszlsfggvny tart az elmletihez. A kvetkez tblzatban tapasztalati becslsre ltunk nhny pldt.
Elmleti eloszls
Jellemz
vrhat rtk
szrsngyzet
terjedelem
eloszlsfggvny
E(X)
D2 (X)
sup{ x | F (x) < 1 } inf{ x | F (x) > 0 }
F (x) = P (X < x)
Tapasztalati
eloszls
P
1
n
1
n
Xi = X
2
i=1 (Xi X)
(n)
(n)
Xn X1
Pn
1
i=1 I(Xi < x)
n
Pi=1
n
= Sn2
= Fn (x)
5.3. Maximum likelihood becsls
5.1. Denci.
Legyen
X1 , ..., Xn
minta
maximum likelihood (ML) becslse
F eloszlsbl, . Ekkor a
= max{Ln (X; ) : }.
Ln (X; )
ha
Lehet, hogy ilyen nem ltezik, vagy nem egyrtelm. Ha

csinlni:
ln Ln (X; ) = 0 likelihood egyenlet
Ln (X; )
"elg sima", akkor a kvetkezt szoks
megoldst keressk.
5.3. Plda.
P
Qn
P
Xi Exp(). Ln (X; ) = i=1 eXi = n e Xi , ln Ln (X; ) = n ln Xi ,
P
n
1
n
= 1 .
Xi , ez akkor 0, ha = P
, azaz
=
ln Ln (X; ) =
Xi
X
X
5.4. Plda.
+ 1).
Xi
n
(n)
(n)
+ 1). Ln (X; ) = I( Xi + 1, i) 11h = I( Xi1 , Xn
Xn(n) 1, X (n) rtk ML
maximumhelye nem egyrtelm, minden
1
Egyenletes(,
Ennek a fggvnynek a
becsls.
14
5.2. Ttel.
Bizonyts.
Ha ltezik ML becsls, akkor az megadhat a

A faktorizcis ttel alapjn
elgsges statisztika fggvnyeknt.
Ln (X; ) = h(X) g (T (X)),
ahol
szerinti maximumhely keressben. Azaz a maximumhelyek halmaza csak
5.3. Ttel.
Legyen
X1 , ..., Xn
minta az
eloszlsbl,
h(X) nem jtszik

T (X)-tl fgg.
ML becslse pedig
Ekkor
()
szerepet a
ML becsls
()-ra.
Bizonyts.
n (x; ) = sup { Ln (x; ) | () = } az induklt likelihood fggvny. Denci

L
s L
= Ln (x; )
.
n (x; ) maximumhelye -ben. L
n (x; ) Ln (x; )
n (x; ())
szerint () ML becslse L
n
o
Teht Ln (x; ()) = max

Ln (x; )
Legyen
A ML becsls ltalban nem torztatlan.
Azonban a kvetkez ttel szerint bizonyos ers felttelek
mellett a ML becslsnek j aszimptotikus tulajdonsgai vannak.
Ez az egyik oka annak, hogy ez a
mdszer a legelterjedtebb a gyakorlatban.
5.4. Ttel.
Bizonyos (ers) regularitsi felttelek mellett elg nagy
konzisztens,
n-re
n (n ) N (m(), ())
torztatlan: m() = 0.
1
2
optimlis: () =
I1 () .
a)
aszimptotikusan normlis eloszls:
b)
aszimptotikusan
c)
aszimptotikusan
ML becsls ltezik,
eloszlsban
(n ).
5.5. Plda.
Xi E(a,
nb), adjuk meg a paramterek ML becslst!
1
Ln (X; a, b) =
I(a Xi b i), azaz a legkisebb olyan [a, b]
ba
(n)
(n)
mindegyik meggyelst tartalmazza. Azaz a
= X1 , b = Xn .
intervallumot keressk, amely
5.6. Plda.
Xi N(m, ), adjuk meg a paramterek ML becslst!

n
n
P
Y
(X m)2
(Xi m)2
1
1
1
i22
Ln (X; m, ) =
e
=
n e 22 ,
2
2
i=1
P
n
1
(Xi m)2
ln Ln (X; m, ) = ln
n ln
.
2 2
2
A likelihood egyenlet most kt egyenletbl ll:
P
(Xi m)2
ln
L
(X;
m,
)
=
= 0,
n
m
2P
n 2 (Xi m)2
=0
ln Ln (X; m, ) =
2 3
P
P
(1)
Xi = n m
m
= PnXi = X
P
(Xi m)2
(2)
(Xi m)2 = n 2 2 = P
n
2 = n1 (Xi X)2 = Sn2

5.4. Momentumok mdszere
Ezt a mdszert akkor szoks alkalmazni, ha sok ismeretlen paramter van, s a ML becslst nehz
kiszmtani. Az eljrs a kvetkez.
Eljrs
1)
Az eloszls
`.
(elmleti) momentuma:
` = E (Xi` )
Felrunk annyi momentumot, amennyi meghatrozza az eloszlst.

2)
Kifejezzk az ismeretlen paramtereket a momentumok segtsgvel.
3)
E (Xi` )
helybe
1
n
n
X
Xi` -et
runk (ezek a tapasztalati momentumok).
i=1
5.7. Plda.
Xi E(a, b).

2
a+b
(b a)2
a+b
2
2
2
1 = Ea,b (Xi ) =
, 2 = Ea,b (Xi ) = Da,b (Xi ) + Ea,b (Xi ) =
+
2
12
2
Legyen
15
(b a)2
= 2 21
12
p
12(2 21 )
p
b = 1 + p3(2 21 )
a = 1 3(2 21 )
q
q
P 2
P 2
2
2
Xi X ) = X 3Sn , b = X + 3( n1
Xi X )X + 3Sn .
a
= X 3( n1
5.8. Plda.
Legyen
ba =
Xi E(a, a).
1 = Ea (Xi ) = 0
a2
2 = Ea (Xi2 ) =
3
32
q
P
a
= 3 n1 Xi2 .
a=
5.5. Intervallum becslsek

Eddig gynevezett
pontbecslsekkel foglalkoztunk, azaz a paramtert (vagy annak fggvnyt) egyetlen
rtkkel becsltk meg. A pontbecsls bizonytalansgt a becsls szrsval fejezhetjk ki. Ha pldul
a becslsrl belthat, hogy aszimptotikusan normlis eloszls, akkor az igazi paramter kb.
valsznsggel a pontbecsls krli
2szrs
sugar intervallumban van.
95%
A becslsben rejl bizonyta-
lansgot kifejezhetjk gy is, hogy a paramtert nem egy rtkkel, hanem egy intervallummal becsljk.
5.2. Denci.
Legyen X = (X1 , ..., Xn ) minta F eloszlsbl, ahol vals paramter. Azt mondjuk,
(T1 (X), T2 (X)) intervallum legalbb 1 megbzhatsgi szint kondencia-intervallum -ra (rvKI(1 ), ha
P (T1 (X) < < T2 (X)) 1 .
hogy a
iden
Mj: A KI pontos megbzhatsgi szintje
inf { P ( (T1 , T2 )) } .
5.5. Ttel.
Ha
(T1 , T2 )
KI(1
) -ra,
akkor
(S1 , S2 )
S1 = inf { () | (T1 , T2 ) }
KI(1
) ()-ra,
ahol
S2 = sup { () | (T1 , T2 ) } .
Az egyik legfontosabb (s legszebb) eset a normlis eloszls vrhat rtkre KI konstrulsa, ismert
vagy ismeretlen szrs mellett. Nzzk meg ezeket!
5.9. Plda.
Legyen
Xi N (, ),
Kiindulsknt vegyk szre, hogy
ahol
az az rtk, melyre
-re KI(1 )-t!

X
X N (, n ), azaz n
N (0, 1). Ezrt

X
< u = 1 ,
P n
2

ahol
ismert,
ismeretlen. Adjunk
(u ) = 1 ,
ezt tblzatbl nzhetjk ki.
6
1
u 2
u 2
Ebbl megkaphatjuk a KI als s fels hatrt:

u
u
u
n
X < u 2 X < 2 X 2 < < X + 2 .
n
n
n
Azaz kaptuk, hogy
u
T1 = X 2 ,
n
u
T2 = X + 2 .
n
16
Ha a
eloszlst, a
szrs nem ismert, akkor nehezebb dolgunk van. A megoldshoz meg kell ismernnk kt j
2 -eloszlst
5.3. Denci.
s a
Legyenek
t-eloszlst.
Xi N (0, 1) fggetlenek, s Y =
n szabadsgfok khi-ngyzet eloszlsnak

nevezzk, jells: Y
khi eloszlsnak nevezzk, jells: Y n .

Knny ltni, hogy ha
Y 2n ,
akkor
E(Y ) = n
n
X
Xi2 .
D2 (Y ) = 2n.
Az
i=1
2n . Tovbb
valsznsgi vltoz eloszlst
n szabadsgfok
A khi-ngyzet eloszls srsgfggvnye
is kiszmolhat, erre azonban nem lesz szksgnk. Csak megjegyezzk, hogy
1 ex/2 , n = 2-re pedig az Exp(1/2) eloszlst kapjuk. Ha

2x
monoton n, majd monoton cskken.
eloszlst
n 3,
n = 1-re
a srsgfggvny
akkor a srsgfggvny egy darabig
X
X N (0, 1), Y n fggetlenek. Legyen Z = n . Ekkor a Z valsznsgi
Y
vltoz eloszlst n szabadsgfok t eloszlsnak, vagy n szabadsgfok Student eloszlsnak nevezzk, jells:
Z tn .
5.4. Denci.
tn
Legyen
eloszls srsgfggvnye is kiszmthat, de pontos alakjra nem lesz szksgnk. Knnyen ltszik,
n
n2
esetn a standard normlishoz tart, de vastagabb a farka (srsgfggvnye
hogy a srsgfggvny szimmetrikus, azaz

(n
> 2). A tn eloszls n

x-re kb. cn x(n+1) ).
E(Z) = 0 (n > 1).
Megmutathat, hogy
D2 (Z) =
nagy
6
vsz
tn ()
5.6. Ttel (Fisher-Bartlett).

Mj: Legyen
Xi N (, ),
Legyen
Xi N (, ).
Yi = (Xi )/ .
Ekkor
Ekkor
Sn2
fggetlenek, s
n
X
n Sn2
=
(Yi Y )2 .
2
i=1
n Sn2
2n1 .
2
Mivel az
(Yi Y )
valsznsgi vltozk nem fggetlenek, cskken a szabadsgi fok.

Mj: A mintatlag s a tapasztalati szrsngyzet fggetlensge karakterizlja a normlis eloszlst.
5.10. Plda.qLegyen Xi N (, ), s most , ismeretlenek.
Legyen Sn
1
n1
P
(Xi X)2
X
n
N(0, 1)
X
tn1 .
n
= n1
Sn
n 1 Sn
n1

X
n
< tn1 ( ) = 1 ,

Sn
2
ebbl a KI
T1 = X
Legyen
Xi Ind(p).
Kiindulsknt vegyk szre, hogy
-re KI(1 )-t!
a korriglt tapasztalati szrs. Ekkor a Fisher-Bartlett ttel szerint
Azaz
5.11. Plda.
Adjunk
Sn tn1 ( 2 )
Adjunk
p-re
j becsls
T2 = X +
hozzvetleges (aszimptotikus)
p-re,
X p
n p
N(0, 1) P
p(1 p)
Sn tn1 ( 2 )
.
n
q

p(1p)
X N p,
,
n
p(1 p)
17
ha
KI(1 )-t!
n
elg nagy.
!

X p < u 2
1 .
p-re
A zrjelben ll egyenltlensget kell most
X -et
runk, s a
trendezni. Ms mdszer: a nevezben lv
helybe

X p < u 2
X(1 X)
egyenltlensget rendezzk t.
5.3. Feladat.
Legyen
5.4. Feladat.
Egy cukorgyrban kockacukrokat gyrtanak.
Xi Exp().
Adjunk hozzvetleges
kifejezett lhosszsga kzeltleg normlis eloszls.
KI(1 )-t -ra!

Tegyk fel, hogy a cukrok millimterben
16 darab cukor lhosszsgt megmrve, a kvetkez
adatokat kaptuk:
10.10 8.94
9.61 10.00
10.32 10.26 10.32 10.74
10.42 10.33
9.98 10.23
10.68 9.25
9.88 9.89
10.06, tapasztalati szrsa 0.46.

m vrhat rtkre KI(0.95)-t, ha tudjuk, hogy a szrs = 0.5.
(b) Adjunk KI -t m-re, ha a szrs ismeretlen!
3
(c) Ismert s ismeretlen szrs mellett is adjunk KI(0.9)-t m -re, azaz egy tlagos kockacukor trfogatra
Az adatok tlaga
(a) Adjunk az lhossz
(ami nem egyenl a kockacukrok tlagos trfogatval)!
6. Statisztikai prbk s jsguk

A statisztikai prba olyan eljrs, mellyel eldntjk, hogy a meggyelseink alapjn egy elzetes
felttelezsnk (hipotzisnk) tarthat-e, vagy a meggyelsek ellentmondanak a felttelezsnek.
Nz-
znk egy pldt!

Tegyk fel, hogy egy gyrban minsgellenrzst vgznk, azaz megvizsgljuk, hogy a gyrtott termkek minsge megfelel-e.
Elzetes felttelezsnk szerint a gyrtsi folyamat rendben van, azaz a
termkek legfeljebb 5%-a selejtes.
A felttelezs ellenrzshez 25 vletlenszeren vlasztott termket
megvizsglunk, s ha legfeljebb 3 selejtes van kztk, akkor a felttelezst elfogadjuk. Ellenkez esetben a
felttelezst elvetjk. Krds, hogy j-e ez az eljrs?
Mivel dntsnk egy vletlenszeren vlasztott mintra pl, teljes bizonyossggal nem tudjuk eldnteni, hogy a felttelezsnk helyes-e. Ktfle hibt kvethetnk el:
Ha igaz a felttelezs, mgis elutastjuk, akkor
elsfaj hibt vtnk,

msodfaj hibt vtnk.
Ha nem igaz a felttelezs, mgis elfogadjuk, akkor

Mekkora ezen hibk valsznsge?
Kiszmtshoz az egyszersg kedvrt tegyk fel, hogy a mintt
visszatevssel vesszk. Tovbb jellje
a selejtarnyt.
Elszr tegyk fel, hogy a felttelezs igaz, azaz
p 0.05.
Pp (elsfaj
hiba)
= Pp ( 4
selejt)
25
X
25
k=4
Ez a valsznsg akkor a legnagyobb, ha
p = 0.05,
= sup Pp ( 4
selejt)
pk (1 p)25k .
gy az elsfaj hiba valsznsge legfeljebb
= P0.05 ( 4
selejt)
= 0.034.
p0.05
Most tegyk fel, hogy a felttelezs hamis, azaz
Pp ( 3
selejt)
p > 0.05.
3
X
25
k=0
pldul ha a selejtarny
p = 0.1,
akkor
0.763
A msodfaj hiba valsznsge
pk (1 p)25k ,
valsznsggel fogjuk a felttelezst tvesen elfogadni.
Deniljuk most formlisan az alapfogalmakat!
18
6.1. Denci.
(, A, P)
Legyen
paramteres statisztikai mez, teht
P = {P : },
ahol
paramtertr.
Hipotzisek:
H0 : 0
H1 : 1 ,
= 0 1 a paramtertr
nullhipotzis:
ellenhipotzis:
ahol
diszjunkt felbontsa (0
1 = ).
Minta:
X = (X1 , ..., Xn )
vektorvltoz (legtbbszr fggetlen, azonos eloszls),
lehetsges rtkeinek halmaza az
mintatr.
Statisztikai prba:
elfogadsi tartomny:
Xe
Xk ,
X = Xe Xk a mintatr diszjunkt felbontsa (Xe Xk = ).
X Xe , akkor H0 -t elfogadjuk, ha X Xk , akkor H0 -t elutastjuk.
kritikus (elutastsi) tartomny:
ahol
Ha
Az bevezet pldban = [0, 1], 0 = [0, 0.05], 1 = (0.05, 1]. A minta: X = (X1 , . . . , X25 ), ahol
Xi = 1, ha az i-edik kivlasztott termk selejtes, Xi = 0, ha az i-edik kivlasztott termk hibtlan. Azaz
X = {0, 1}25 . A prbt meghatroz tartomnyok:
Xe = {x X :
25
X
xi 3},
Xk = {x X :
i=1
25
X
xi 4}.
i=1
Nagyon fontos, hogy a kt hipotzis szerepe ltalban nem egyenrang. Az alapfeltevst csak nagyon
indokolt esetben szeretnnk elutastani, ezrt az elsfaj hiba slyosabbnak szmt, mint a msodfaj. Az
elsfaj hiba maximlis valsznsgt szoks megadni, emellett termszetesen a msodfaj hiba eslynek
minimalizsra treksznk. Ebbl kifolylag a dntsek rtelmezse is klnbz:
H0 -t
H0 -t
elfogadjuk: nem jelenti azt, hogy igaz, csak azt, hogy nincs okunk elutastani.
elutastjuk: komoly bizonytkot talltunk arra, hogy
H0
nem igaz.
Pldul egy j gygyszer vizsglatnl a gygyszer hatsossgra keresnk bizonytkot, ezrt a hipotzisek:
H0 :
H1 :
a gygyszer nem hatsos,

a gygyszer hatsos.
Folytassuk a dencikat!
6.2. Denci.
Elsfaj hiba:
H0
igaz, mgis elutastjuk. Ennek valsznsge:
P (X Xk ) 0 .
A prba terjedelme:
= sup P (X Xk ).
0
Msodfaj hiba:
H0
hamis, mgis elfogadjuk.
Ennek valsznsge:
P (X Xe ) 1 .
A prba
erfggvnye:
() = 1 P (X Xe ) = P (X Xk ) 1 .
Mskpp
(1 )
a prba ereje a
H1 : = 1
ellenhipotzissel szemben.
Ha egy prbasorozatot vizsglunk, azaz minden
denilt prbnk, akkor ezt jellhetjk a terjedelemben s az erfggvnyben
n -t
(Xen , Xkn ) tartomnyokkal

is: helyett n -t, helyett
mintaelemszmra van egy
rhatunk.
6.1. Plda.
Legyen X E(t, 1 + 2t) egyetlen meggyels, ahol t > 0 ismeretlen.

H0 : t = 0 (egyszer hipotzis 0 egyelem halmaz nem kell sup a terjedelemben)
H1 : t > 0 (sszetett hipotzis 1 tbbelem halmaz).
A prba: Xe = (0.1, 0.85), (X = R).
= P0 (X Xk ) = 1 P0 (X Xe ) = 1 P0 (0.1 < X < 0.85) = 1 0.75 = 0.25

.
:::
erfggvny:
(t) = Pt (X Xk ) = 1 Pt (0.1 < X < 0.85) = 1
19
0.75
1+3t .
(t)
6
1
2
1
4
-t
kis t-re kicsi
nagy t-re nagy
a prba ereje
Mikor j a prba?
1) Torztatlan:
a prba ereje legalbb akkora, mint a terjedelme:
() 1 .
0
0
Az (Xe , Xk ) prba egyenletesen ersebb, mint a (Xe , Xk ) prba, ha
() = P (X Xk ) 0 () = P (X Xk0 ) 1 .
n
n
Az (Xe , Xk ) legfeljebb terjedelm konzisztens prbasorozat, ha
(terjedelem) n
n s
n
n () 1 1 .
2) Ers:
3) Konzisztens:
6.3. Denci.
(Xe , Xk )
prba egyenletesen legersebb, ha minden ms, legfeljebb ekkora terjedelm
prbnl egyenletesen ersebb.

Az egyenletesen legersebb prba olyasmi a hipotzisvizsglatban, mint a hatsos becsls a becslselmletben. Ilyen prbt ltalban nem knny konstrulni. Arra az esetre viszont tudunk egyenletesen
legersebb prbt adni, ha kt egyszer hipotzis kztt kell dnteni. Ehhez szksgnk lesz a vletlentett
prba fogalmra.
Eddigi prbk mskpp megfogalmazva: Legyen
x X -et gyeljk meg,

Xe = { x | (x) = 0 }
Xk = { x | (x) = 1 }
6.4. Denci.
Ha
x X -et
akkor
(x)
valsznsggel utastjuk el
Vletlentett prba: Legyen
gyeljk meg, akkor
(x)
: X [0, 1]
: X {0, 1}
H0 -t.
egy fggvny.
Ha
Ekkor:
egy fggvny (ennek neve prbafggvny).
valsznsggel utastjuk el
H0 -t.
Szmtsuk ki vletlentett prba esetn a hibavalsznsgeket (mondjuk diszkrt esetet vve)!
P (H0 -t
elutastjuk)
(x)P (X = x) = E ((X)).
x
gy
= sup0 E ((X)),
() = E ((X)) ( 1 ).
6.1. Ttel. (Neyman-Pearson lemma) Legyen H0

H0 : = 0 ,
H1 : = 1 ,
ahol
egy
1) Minden
2) A
H1 kt egyszer
Ln (0; x)
likelihood-fggvnye Ln (1; x),
vagy mskpp: a minta
n elem minta.
0<1
Tekintsk a kvetkez prbafggvnyt:
esetn ltezik
hipotzis:
Bizonyts.
Y =
Ln (1,x)
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)
Ln (1,x)
ha
Ln (0;x)
(x) =
prba terjedelme
terjedelm prba
hogy a
prba egyenletesen legersebb az sszes
1) Legyen
vagy mskpp: a minta likelihood-fggvnye
pontosan
ha
= c . Ekkor
<c
kztt (s lnyegben egyrtelm).
Ln (1;X)
Ln (0;X) . Ekkor a prba terjedelme
= P0 (Y > c) + P0 (Y = c) = 1 P0 (Y c) + P0 (Y = c),
20
>c
azaz
1 = P0 (Y c) P0 (Y = c). Ha van olyan c0 , melyre P0 (Y c0 ) = 1 akkor a c = c0 , = 0

c0 , akkor is van olyan c0 , melyre P0 (Y < c0 ) 1 < P0 (Y c0 ).
vlaszts j lesz. Ha nem ltezik ilyen

Ekkor legyen
c = c0 ,
2) Legyen
P0 (Y c0 ) (1 )
P0 (Y = c0 )
egy msik prba prbafggvnye.
(0 < 1).
A feltevs szerint
E0 (0 (X)) = E0 ((X)).
Azt
E1 ( (X)) E1 ((X)) ll fenn. Tegyk fel, hogy a minta abszolt folytonos

eloszls, ekkor Ln (1; x) = fn;1 (x), ahol fn;1 (x) a minta egyttes srsgfggvnye a H1 mellett, hasonlan
Ln (0; x) = fn;0 (x), ahol fn;0 (x) a minta egyttes srsgfggvnye a H0 mellett. Megmutatjuk, hogy
Z
((x) 0 (x)) (fn;1 (x) c fn;0 (x)) dx 0.
(1)
kell beltni, hogy az erkre
Rn
Ugyanis, ha fn;1 (x) c fn;0 (x) = 0, akkor az integrandus nulla. Ha fn;1 (x) c fn;0 (x) > 0, akkor
(x) = 1, viszont 0 (x) 1, gy (x) 0 (x) 0, teht az integrandus 0. Ha fn;1 (x) c fn;0 (x) < 0,
0
akkor (x) = 0, gy (x) (x) 0, teht az integrandus megint 0. Az (1) integrlt sztbontva,
Z
Z
Z
Z
0 fn;1 0 fn;1 c fn;0 +c 0 fn;0 = E1 ((X))E1 (0 (X))cE0 ((X))+cE0 (0 (X)).
trendezve kapjuk, hogy
E1 ((X)) E1 (0 (X)) c [E0 ((X)) E0 (0 (X))] 0.

A prba neve: likelihood-hnyados prba.
Vletlentsre ltalban csak diszkrt mintk esetn van
szksg, hogy a teljes terjedelmet ki tudjuk hasznlni, s egyttal nveljk az ert.

elmleti, mint gyakorlati jelentsge van.
prba konzisztens, mivel
6.2. Plda.
n 1 cn ,
ahol
Ennek inkbb
Megmutathat, hogy (fggetlen, azonos elem mintkra) a
a kt likelihood fggvnytl fgg (egynl kisebb) konstans.
H1 : P (fej) = 16 . A mintatr: X =
{F F, F I, IF, II}, s a rvidsg kedvrt jellje a likelihoodokat L1 s L0 . A likelihoodok, illetve likelihoodEgy rmvel ktszer dobunk.
H0 : P (fej) =
1
2,
FF
FI
IF
II
1
36
1
4
1
9
5
36
1
4
5
9
5
36
1
4
5
9
25
36
1
4
25
9
hnyadosok tblzata:
L1
L0
L1
L0
= 0.25. A Neyman-Pearson lemma alapjn olyan , c prt keresnk, melyre a (x) =

>c
L1
1
= c prba terjedelme , azaz 0.25 = = 1 P0 ( L
L0 > c) + P0 ( L0 = c). A terjedelmet gy
<c
5 25
szedjk ssze, hogy a legnagyobb likelihood-hnyadostl, 25/9-tl indulunk. Ltszik, hogy c ( ,
9 9 ) j
lesz, s vletlentsre nincs szksg ( = 0), teht II esetn H0 -t elutastjuk, minden ms esetben H0 -t
Legyen elszr
L1
ha
L0
L1
ha
L0
L1
ha
L0
elfogadjuk.
= 0.3, akkor tovbb kell menni. Ha 95 < c < 25

9 , akkor az elsfaj hiba 0.25 < 0.3 ha
< c < 59 , akkor az elsfaj hiba 0.25 + 0.5 > 0.3. Teht c = 59 , s a megoldand egyenlet:
0.25 + 0.5 = 0.3, amibl = 0.1. Teht II esetn H0 -t elutastjuk, F F esetn H0 -t elfogadjuk, IF
vagy F I esetn vletlentnk: H0 -t 0.9 valsznsggel elfogadjuk, 0.1 valsznsggel elvetjk. Mekkora
Ha most
1
viszont
9
a prba ereje?

= P1

L1
L1
25
10
26
> c + P1
=c =
+ 0.1
=
= 0.72.
L0
L0
36
36
36
21
6.3. Plda.
Egy urnban
db golybl
kihzunk visszatevs nlkl, jellje
= 0.2
az
piros,
7k
zld.
H0 : k = 3, H1 : k = 4. Hrom golyt
= {0, 1, 2, 3}). Adjuk meg
a pirosak szmt a kihzottak kztt (X
terjedelm likelihood-hnyados prbt!
3
x
L0 (x) =
4
3x

7
3
4
x
L1 (x) =
3
3x

7
3

.
Ezrt a tblzat:
L1
L0
L1
L0
1
35
4
35
1
4
12
35
18
35
2
3
18
35
12
35
3
2
4
35
1
35
3
1
12
2 . Tovbb a 0.2 = 35 + 35 egyenletbl = 0.5. Teht
ha legfeljebb egy piros golyt hzunk, akkor elfogadjuk a nullhipotzist, ha hrom piros golyt hzunk,
Mivel
1/35 < 0.2, de 1/35 + 12/35 > 0.2, gy c =
akkor elvetjk a nullhipotzist, ha pedig kt piros golyt hzunk, akkor vletlentnk:

elvetjk,
1/2
1/2
valsznsggel
valsznsggel elfogadjuk a nullhipotzist.
A prba msodfaj hibja:
1 = P1 (H0 -t
elfogadjuk)
12 1 18
22
1
+
+
=
.
35 35 2 35
35
6.4. Plda.
Legyen X Exp() egy villanykrte lettartama (vekben kifejezve).

1
. Adjuk meg az = 1/8 terjedelm likelihood-hnyados prbt!
3
Most X = (0, ). A srsgfggvnyek s hnyadosuk:
L0 (x) =
1 1x
e 2 ,
2
L1 (x) =
1 1x
e 3 ,
3
H0 : =
1
2,
H1 : =
L1 (x)
2 x x
2 x
= e23 = e6 .
L0 (x)
3
3
Mivel a minta folytonos eloszls, vletlentsre nem lesz szksg. Kell teht:
1
= P0
8
2 X
e6 >c
3

3
3c
3c
3c
2
= P0 X > 6 ln
= 1 F0 6 ln
= e3 ln 2 =
.
2
2
3c
4
3 . Megkaptuk teht c-t, de igazbl nem ez a fontos, hanem az, hogy mikor utastjuk el
a nullhipotzist. A szmts mskpp:
Ebbl pedig
c=
1
= = P0
8
amibl
d = 6 ln 2 = 4.16.

d
2 X
e 6 > c = P0 (X > d) = 1 F0 (d) = e 2 ,
3
Teht akkor utastjuk el a nullhipotzist, ha a villanykrte tovbb l, mint
4.16
v.
H0 : = 12 , H1 : < 12 hipotzisvizsglati feladatra, mivel

1
2 ) egyszer ellenhipotzisre ugyanez a prba a legersebb.
Mj.: a kapott prba egyenletesen legersebb a
0
minden H1
: = 1 (<
6.1. Feladat.
Legyen t elem mintnk
Adjuk meg az
= 0.05
6.2. Feladat.
Legyen
meg az
= 0.05
paramter Poisson eloszlsbl.
H0 : = 2 , H1 : = 1 .
n elem mintnk az N (m, 1) normlis eloszlsbl. H0 : m = 0, H1 : m = 1.
Adjuk
7. A normlis eloszls paramtereire vonatkoz prbk

Az egyik leggyakrabban elfordul eloszls a normlis eloszls, melyet a vrhat rtke s a szrsa
jellemez. Ezekre a paramterekre hrom tpus prbt tanulunk. Ezek a tpusok:
1. A vrhat rtkre vonatkoz prba, ha a szrs ismert
22
u-prba.
2. A vrhat rtkre vonatkoz prba, ha a szrs ismeretlen
t-prba.
3. A szrsra vonatkoz prba, ha a vrhat rtk ismeretlen (vagy akr ismert)
F -prba.
A prbk ezen bell mg klnbzhetnek aszerint, hogy egymintsak vagy ktmintsak, illetve az ellenhipotzis jellege szerint (egyoldali vagy ktoldali ellenhipotzis). Ezek a prbk egyenletesen legersebbek
a legfeljebb ekkora terjedelm torztatlan prbk kztt.
Egymints
Legyen
X1 , ..., Xn N(m, )
ahol
ismert,
u-prba
ismeretlen.
b)
H0 : m m0
H1 : m > m0
A hipotzisek:
H0 : m m0
H1 : m < m0
(2)
a) Xk = {|u| > u 2 } b) Xk = {u > u } c) Xk = {u < u }
(3)
a)
H 0 : m = m0
H1 : m 6= m0
c)
A prbastatisztika:
u=
Ezrt ha a kvnt terjedelem
ahol az
X m0 H0
n N (0, 1).
akkor a kritikus tartomny:
kritikus rtk olyan, hogy
(u ) = 1 ,
ezt a
(x)
fggvny tblzatbl keressk ki.
Mj.: (2)-ben az a) esetben ktoldali, a b) s c) esetekben egyoldali ellenhipotzisrl beszlnk.

Hogy nz ki a prba erfggvnye (ktoldali ellenhipotzisre)? Vezessk be a
n (m) :=
mm0
n jellst.

X m0
X m0

n (m) = Pm (|u| > u 2 ) = Pm
n > u 2 = 1 Pm u 2 <
n < u 2 =

X m
X m
m m0
1Pm u 2 <
n+
n < u 2 = 1Pm u 2 n (m) <
n < u 2 n (m) =
1 (u 2 n (m)) + (u 2 n (m)) = (u 2 + n (m)) + (u 2 n (m)),
1)
2)
3)
4)
Xm
n
N (0, 1). Az erfggvny kapott kpletbl leolvashat,

n (m) folytonos
n
n1 (m) < n (m) (m 6= m0 ) s n (m) 1 (a prba konzisztens)
n (m) > (m 6= m0 ) (er nagyobb mint a terjedelem - a prba torztatlan)
lim n (m) = 1
ahol felhasznltuk, hogy
hogy
7.1. Plda.
Legyen
X1 , ..., X16 N (m, 1) minta, melyre X = 0, 1.
0. = 0, 1
terjedelem mellett szeretnnk dnteni.
Egymints
u-prbt
H0 : m = 0, H1 : m 6=
kell vgezni, a kritikus rtk:
0.95 = 1
A prbastatisztika:
Hipotziseink:
u=
0,10
1
16 = 0.4
.
::
tbl.
= (u 2 ) u 2 = 1.65.
2
Mivel
|0.4| 1.65,
Keressk most meg a legnagyobb terjedelmet, ami mellett mg
u 2 = 0.4 (u 2 ) = 0.66 = 1
23
H0 -t.
elfogadjuk H0 -t!
elfogadjuk
= 0.34
= 0.68.
::::::::
2
2
Ktmints
Legyenek
m1 , m2
X1 , . . . , Xn1 N (m1 , 1 )
u-prba
Y1 , . . . , Yn2 N (m2 , 2 )
fggetlen mintk, ahol
1 , 2
ismert,
ismeretlenek.
A hipotzisek:
H0 : m1 = m2
H1 : m1 6= m2
a)
b)
H0 : m1 m2
H1 : m1 > m2
c)
H0 : m1 m2
H1 : m1 < m2
(4)
A prbastatisztika:
X Y H0
N (0, 1).
u= q 2
1
22
+
n1
n2
Teht a kritikus tartomnyok ugyanazok, mint egymints esetben, azaz (3) adja meg ket.
Egymints t-prba
Legyen
X1 , . . . , Xn N (m, )
m,
ahol
ismeretlen.
A hipotzisek: ugyanazok, mint az egymints
u-prbnl
(2).
A prbastatisztika:
t=
ahol
Sn =
Jellje a
X m0 H0
n tn1 ,
Sn
1
n1
P
(Xi X)2 .
szbadsgi fokot f , teht f = n 1.
A kritikus tartomny:
a) Xk = {|t| > tf ( 2 )} b) Xk = {t > tf ()} c) Xk = {t < tf ()}

ahol a
tf ()
F (tf ()) = 1 ,
ha
jelli az
(5)
szabadsgi fok
t-eloszls
eloszlsfggvnyt.
A
tf ( 2 )-t
s a
tf ()-t
a t-prba kritikus rtkei cm tblzatbl keressk ki, az oszlopok fltt kell
gyelni arra, hogy egyoldali vagy ktoldali prbnk van.
Ktmints t-prba
Legyenek
X1 , . . . , Xn1 N (m1 , )
Y1 , . . . , Yn2 N (m2 , )
m1 , m 2
meretlenek.
A hipotzisek: ugyanazok, mint a ktmints
u-prbnl
(4).
A prbastatisztika:
X Y
t= q
(n1
Jellje a szbadsgi fokot
f,
1)Sn1 2
teht
+ (n2
1)Sn2 2
n1 n2 (n1 + n2 2) H0
tn1 +n2 2 .
n1 + n2
f = n1 + n2 2.
A kritikus tartomny ugyanaz, mint az egymints esetben (5).
Vezessk le, hogyan jn ki a ktmints
t-prbnl
X Y N (0, 2 /n1 + 2 /n2 ),
m1 = m2
r
1
n1 n2
(X Y )
N (0, 1).
n1 + n2
a prbastatisztika. Egyrszt
azaz
Msrszt teljesl, hogy
i
1 h
2
2
(n
1)S
+
(n
1)S
2n1 1+n2 1 ,
1
2
n
n
1
2
2
24
esetn
is-
mivel a tagok kln-kln
2n1 1
2n2 1
illetve
eloszlsak, s fggetlenek.
Mivel pedig az elz kt
kpletben felrt valsznsgi vltozk fggetlenek is, hnyadosuk a szabadsgi fok gykvel beszorozva
valban
eloszls lesz.
Mj.: Ha a kt minta szrsa szigniknsan klnbzik, akkor a fenti prbt kiss mdostani kell, ezt
vagy szintn t-prbnak, vagy Welch-prbnak hvjk. A mdosts abbl ll, hogy most a prbastatisztika
t= q
ahol az
X Y
2
Sn
1
n1
tf ,
szabadsgi fok
f=
s
H0
2
Sn
2
n2
gi = Sni 2 /ni .
Ha
(g1 + g2 )2
g12
n1 1
nem egsz, akkor kerektjk.
A szrsra vonatkoz prbhoz szksgnk lesz az
7.1. Denci.
g22
n2 1
eloszlsra.
Y pedig f2 szabadsgi fok, egymstl fggetlen, 2 eloszls

X/f1
valsznsgi vltozk, akkor a Z =
Y /f2 valsznsgi vloz (f1 , f2 ) szabadsgi fok F -eloszls, jel.
2
Ff1 ,f2 . Itt f1 a szmll szabadsgi foka, f2 a nevez szabadsgi foka. (E(Z) = f2f2
.)
Ha
X f1
szabadsgi fok,
Ktmints
Legyenek
X1 , . . . , Xn1 N (m1 , 1 )
F -prba
Y1 , . . . , Yn2 N (m2 , 2 )
m1 , m 2
1 , 2
ismeretlenek.
A hipotzisek:
a)
H0 : 1 = 2
H1 : 1 6= 2
b)
H0 : 1 2
H1 : 1 > 2
c)
H0 : 1 2
H1 : 1 < 2
A prbastatisztika:
F =
Jellje a szbadsgi fokokat
f1 = n1 1
Sn1 2
Sn2 2
H0
Fn1 1,n2 1 .
f2 = n2 1.
a)Xk = {F < Ff1 ,f2 (1 2 )
vagy
F > Ff1 ,f2 ( 2 )} b)Xk = {F > Ff1 ,f2 ()} c)Xk = {F < Ff1 ,f2 (1 )},
(6)
ahol az
Ff1 ,f2 ()
F -eloszls
G(Ff1 ,f2 ()) = 1 ,
ha
jelli az
(f1 , f2 )
szabadsgi fok
eloszlsfggvnyt.
A kritikus rtkeket az F -prba kritikus rtkei cm tblzatbl keressk ki.
A prbastatisztika
H0
melletti eloszlsa:
F =
Sn1 2
Sn2 2
1
n1 1
=
1
n2 1
2
(n1 1)Sn
1
12
2
(n2 1)Sn
2
22

Fn1 1,n2 1 .
A prba praktikusabb formja ktoldali ellenhipotzisre:
F < Ff1 ,f2 (1 /2)
1
1
<
Ff2 ,f1 ,
Ff1 ,f2 (1 /2)
F
ezrt
Ff2 ,f1 (/2) =
gy a kritikus tartomny ekvivalens alakja:

Xk =
1
> Ff2 ,f1 (/2)
F
vagy
25

F > Ff1 ,f2 (/2) .
1
.
Ff1 ,f2 (1 /2)
A gyakorlatban hasznlt
-kra
1-nl
a kritikus rtk
nagyobb, ezrt elg
1/F
kzl a nagyobbikat
sszehasonltani a megfelel kritikus rtkkel.

A prba teht: az
Fn2 1,n1 1 (/2)
F 0 = max
2
2
Sn
Sn
1
2
2 , S 2
Sn
n1
2

statisztikt hasonltjuk ssze vagy az
vagy az
kritikus rtkekkel.
Egymints
Legyen
Fn1 1,n2 1 (/2)
X1 , . . . , Xn N (m, )
ahol
m,
F -prba
(vagy
2 -prba)
ismeretlen.
A hipotzisek:
a)
H0 : = 0
H1 : 6= 0
b)
H0 : 0
H1 : > 0
A prbastatisztika:
2 = (n 1)
Jellje a szabadsgi fokot
c)
H0 : 0
H1 : < 0
Sn2 H0 2
n1 .
02
f = n 1.
a)Xk = {2 < 2f (1 2 )
ahol a
2f ()
vagy
2 > 2f ( 2 )} b)Xk = {2 > 2f ()} c)Xk = {2 < 2f (1 )},
G(2f ()) = 1 ,
ha
jelli az
szabadsgi fok
2 -eloszls
eloszlsfggvnyt.
A kritikus rtkeket a -prba kritikus rtkei cm tblzatbl keressk ki.

Ehelyett vgezhetnk az
F =
statisztikra
F -prbt,
Sn2 H0
Fn1,
02
azaz ekkor a kritikus tartomnyt (6) adja meg (az
Fn1,
eloszls a
2n1
eloszls
tsklzott vltozata).
7.2. Plda.
Ktfle altat (A s B) hatsossgt teszteltk 10 betegen. Az albbi tblzat azt mutatja,
hogy az altat mennyivel nvelte meg a betegek jszakai alvsidejt (rban mrve).
Beteg sorszma
A altat
B altat
klnbsg
1
2
3
4
5
6
7
8
9
10
1.9
0.8
1.1
0.1
0.1
4.4
5.5
1.6
4.6
3.4
0.7
1.6
0.2
1.2
0.1
3.4
3.7
0.8
0
2
1.2
2.4
1.3
1.3
0
1
1.8
0.8
4.6
1.2
Vajon van-e szignikns klnbsg a kt gygyszer hatsossga kztt (

Hipotzisek:
H0 : m1 = m2 , H1 : m1 6= m2 .
= 0.01
terjedelem mellett)?
A kt minta azonban nem fggetlen, mert ugyanazokon a
betegeken prbltk ki mind a kt gygyszert. Vegyk ezrt az
t-prbval a H0 : m = 0, H1 : m 6= 0 hipotziseket!
0
Sn = 1.23, X = 1.58, t = Xm
n = 4.06. A kritikus
S
n
rtk:
AB
klnbsget, s teszteljk egymints
t9 (0.005) = 3.35,
gy, mivel
|4.06| > 3.35,
nullhipotzist elvetjk, azaz a kt gygyszer hatsossga kztt szignikns klnbsg van.

Tegyk most fel, hogy a kt gygyszert ms-ms 10 betegen teszteltk (de tovbbra is a fenti tblzat
adatait hasznljuk).
2
2
SA
= 4, SB
= 3.8.
Ekkor a kt minta fggetlen, ktmints
t-prba
vgezhet.
X = 2.33, Y = 0.75,
A ktfle gygyszer hatsnak szrsai felttelezheten egyenlek, de ellenrizhetjk
26
is
F -prbval: F 0 = 1.1,
F9,9 (0.025) = 4.03. A t-prba prbastatisztikja:

r
X Y
10 10 (10 + 10 2)
t= q
= 1.78.
10 + 10
2
2
(10 1)S + (10 1)S

mg a kritikus rtk
A kritikus rtk
t18 (0.01/2) = 2.89.
Mivel
|1.78| < 2.89
elfogadjuk
H0 -t,
azaz nincs r bizonytk, hogy az
egyik gygyszer hatsosabb a msiknl.
8.
prbk
8.1. Ttel.
(biz. nlkl) Legyen
meggyelsbl jellje
az
Ai
A1 , A2 , ..., Ar
teljes esemnyrendszer, jel.
2 =
r
X
(i n pi )2
n pi
i=1
valsznsgi vltoz
talnosabban, ha a
pi
r1
s(< r 1)
esetn az
valsznsgek
paramterek ML-becslst. Ekkor a
2 =
szabadsgi fok
esetn az
eloszlshoz tart (eloszlsban).
r
X
(i n pi )2
n pi
rs1
szabadsgi fok
eloszlshoz tart (eloszlsban).
A ttel alapjn aszimptotikus prba vgezhet, ami azt jelenti, hogy a prba terjedelme kzeltleg
ha
l-
pi
db ismeretlen paramtertl fggenek, akkor jellje
i=1
valsznsgi vltoz
P (Ai ) = pi . n darab fggetlen
esemny gyakorisgt. Ekkor a
lesz,
elg nagy.
2 -prba
Legyen
A1 , A2 , ..., Ar
(tiszta eset)
teljes esemnyrendszer.
A hipotzisek:
H0 : P (Ai ) = pi
n
darab fggetlen meggyelsbl jellje
A prbastatisztika:
2 =
i = 1, ..., r,
az
Ai
esemny gyakorisgt.
r
X
(i n pi )2
n pi
i=1
H1 : i : P (Ai ) 6= pi .
H0
2r1 .
f = r 1.
Xk = {2 > 2f ()},
2
2
ahol a f () kritikus rtk olyan, hogy G(f ()) = 1 , ha G jelli az f szabadsgi fok
eloszlsfggvnyt.
2
A kritikus rtkeket a -prba kritikus rtkei cm tblzatbl keressk ki.
27
(7)
-eloszls
Vegyk szre, hogy a kritikus tartomnyba a prbastatisztika azon rtkeit tettk, melyek az ellenhipotzis esetn fordulnak inkbb el, azaz a nagy rtkeket.
2 -prba
Legyen
A1 , A2 , ..., Ar
(becslses eset)
teljes esemnyrendszer.
A hipotzisek:
H0 : : P (Ai ) = pi ()i,
ahol
egy
dimenzis paramtervektor.
risgt, valamint legyen
darab fggetlen meggyelsbl jellje
paramtervektor ML becslse, s
A prbastatisztika:
2 =
r
X
(i n pi )2
n pi
i=1
H1 : 6 : P (Ai ) = pi ()i,
.
pi = pi ()
az
Ai
esemny gyako-
H0
2rs1 .
f = r s 1.
A kritikus tartomny: (7), azaz ugyanaz, mint az elbb.
Mj.: Mivel a prba aszimptotikus, vigyznunk kell arra, hogy a minta elemszma elg nagy legyen. Pl.
megkvetelhetjk, hogy az sszes vrt rtk (npi , ill.
n
pi )
legalbb 5 legyen. Ha ez nem teljesl, akkor a
kis vrt gyakorisgokkal rendelkez esemnyeket sszevonjuk.
8.1. Illeszkedsvizsglat
Khi-ngyzet prbval ellenrizhetjk, hogy egy minta egy adott eloszlsbl szrmazhat-e.
Mivel a
khi-ngyzet prbban egy vges teljes esemnyrendszer szerepel, a prbt inkbb diszkrt eloszlsok
illeszkedsnek vizsglathoz szoks hasznlni. Mindenesetre a felttelezett eloszls rtkkszlett vges
sok csoportra kell osztanunk, hogy a prbt elvgezhessk.
8.1. Plda.
Kockval dobunk. Nullhipotzisnk:
A meggyelt gyakorisgok tblzata (n
H0 :
a kocka szablyos, azaz
P (Ai ) = 61 ;
i = 1, . . . , 6.
= 60):
1
8
10
rtkek
i
n pi
2
3
4
5
7 14 12 10
10 10 10 10
6
9
10
A prbastatisztika:
2 =
(8 10)2
(7 10)2
(14 10)2
(12 10)2
(10 10)2
(9 10)2
+
+
+
+
+
= 3.4.
10
10
10
10
10
10
A kritikus rtk (f
= r 1 = 5): 25 (0.1) = 9.24.
Mivel
3.4 < 9.24, H0 -t
elfogadjuk, azaz a kocka
szablyosnak tekinthet.
8.2. Plda.
400-szor feljegyeztk, hogy egy hibs kapcsol hnyadik prblkozsra gyjtotta fel a villanyt.
H0 : Xi Geo(p)
valamilyen
p-re.
Az adatok:
1
324
2
57
3 4
14 5
1 324 + 2 57 + 3 14 + 4 5
500
5
=
= , ebbl a paramter ML becslse p =
400
400
4
1
=
X
0.8. A geometriai eloszls pozitv egsz rtkeket vehet fel, teht a lehetsges rtkek egy csoportostsa:
A minta tlaga:
X=
A1 = {1}, A2 = {2}, A3 = {3}, A4 = {4, . . .}.
A ngy csoport becslt valsznsge:
p1 = 0.8, p2 = 0.2 0.8 = 0.16, p3 = 0.22 0.8 = 0.032, p4 = 1 p1 p2 p3 = 0.008.

A vrt rtkek tblzata teht:
n pi
1
320
2
64
28
3
4
12.8 3.2
A prbastatisztika:
2 =
A szabadsgi fok:
22 (0.05) = 5.99,
(324 320)2
(57 64)2
(14 12.8)2
(5 3.2)2
+
+
+
= 1.95.
320
64
12.8
3.2
f = r s 1 = 4 1 1 = 2. Ha a terjedelem = 0.05, akkor a kritikus rtk

1.95 < 5.99, gy H0 -t elfogadjuk. (Tulajdonkppen mg a harmadik s negyedik
s mivel
csoportot is ssze lehetne vonni.)

Ha a felttelezett eloszls folytonos, akkor a teljes szmegyenest kell intervallumokra, illetve flegyenesekre bontani. Az intervallumok megvlasztshoz nhny j tancs:
1)Az intervallumok szma ne legyen se tl kevs (nem elg ers a prba, a mintban lv informci nagy
rsze elveszik), se tl sok (a
kzelts srl).
2) Az osztpontokat gy vlasszuk, hogy az intervallumok
pi
valsznsgei kzel egyformk legyenek.
sszefoglalva, az illeszkedsvizsglat lpsei:

1) Ha becslses esettel van dolgunk, akkor a paramtereket megbecsljk a mintbl ML mdszerrel.
2) A lehetsges rtkkszletet vges sok csoportba osztjuk (TER-t hozunk ltre).
3) Kiszmoljuk a csoportok vrt gyakorisgt.
4) Ha vannak kicsi (pl. 5-nl kisebb) vrt gyakorisgok, akkor sszevonunk csoportokat.
5) Kiszmoljuk a prbastatisztikt, kikeressk a szabadsgi foknak s a terjedelemnek megfelel kritikus
rtket.
6) sszehasonltva a kettt, levonjuk a kvetkeztetst.
8.2. Fggetlensgvizsglat
Kt szempont szerint soroljuk osztlyokba a meggyelseket:
r osztly van: A1 , ..., Ar ,

s osztly van: B1 , ..., Bs .
H0 : a kt szempont fggetlen
az 1. szempont szerint
a 2. szempont szerint
Nullhipotzisnk:
i, j -re.
egymstl, azaz
P (Ai Bj ) = P (Ai ) P (Bj )
minden
Az ellenhipotzis pedig az, hogy a kt szempont sszefgg.
n darab fggetlen meggyelsbl jellje ij
az
Ai Bj
esemny gyakorisgt, valamint legyen
i =
s
X
ij
j=1
az
Ai
j =
r
X
ij a Bj gyakorisga.
i=1
Kt eset lehetsges aszerint, hogy az egyes szempontok osztlyainak valsznsgt ismerjk-e.
gyakorisga s
A) eset (ritkbb):
P (Ai ) = pi
P (Bj ) = qj
esemnyrendszert alkotnak,
2 =
B) eset:
pi , q j
r1
{Ai Bj }
esemnyek
elem teljes
nem ismertek. Ekkor elszr megbecsljk ket a mintbl ML-mdszerrel:
darab
pi
i
,
n
qj =
paramtert becsltnk (mivel
paramtert. gy
2 =
j
.
n
pr = 1
Pr1
i=1
pi
mr addik), s
r X
s
r X
s

X
X
(ij in j )2 H0 2
(ij n pi qj )2
f ,
=
i j
n pi qj
n
i=1 j=1
i=1 j=1
f = r s (r 1 + s 1) 1 = (r 1)(s 1).
r = s = 2. Ekkor a prbastatisztika egyszerbb alakra
ahol a szabadsgi fok:

Mj.: Legyen
rs
s
r X
X
(ij n pi qj )2 H0 2
rs1 .
n pi q j
i=1 j=1
pi =
sszesen
ismertek. Mivel az
2 =
n (11 22 12 21 )2
.
1 2 1 2
29
hozhat:
s1
darab
qj
Legyen ugyanis
ij =
i j
n . Ekkor
11 + 12 = 1
Kaptuk, hogy
Teht a
11 + 12 =
12 12 = (11 11 ).
1 1
1 2
1
+
=
(1 + 2 ) = 1 .
n
n
n
Hasonlan,
21 21 = (11 11 )
22 22 = 11 11 .
statisztika mind a ngy tagjban ugyanaz a szmll, mghozz (ngyzetreemels eltt):
11 11 = 11
A kzs szmll s
11 22 12 21
1
(11 + 12 )(11 + 21 ) =
.
n
n
kiemelse utn marad:
1
1
1
n2
1
+
+
+
=
.
1 1
1 2
2 1
2 2
1 1 2 2
A fentieket sszerakva, pp a bizonytani kvnt kpletet kapjuk.
Mj.: Gykt vonva,
n(11 22 12 21 ) H0
1 2 1 2
N (0, 1),
u-prba
gy
is vgezhet. Akr egyoldali
vgezhetnk, ha az ellenhipotzis adott irny sszefggsre vonatkozik. (Pl.:

fggetlen,
H1 :
8.3. Plda.
H0 :
u-prbt
is
a szemszn s a hajszn
a szkek nagyobb esllyel kkszemek.)
200 emberrl feljegyeztk, hogy szke-e, s hogy kkszem-e.

haj/szem
kk
ms
szke
30
70
100
20
80
100
ms
a) Fggetlennek tekinthet-e a hajszn s a szemszn (
50
150
200
= 0.05)?
A vrt rtkek tblzata:

haj/szem
kk
ms
szke
25
75
25
75
ms
2
2 = 200(30807020)
= 2.67.
10010050150
(2 1) (2 1) = 1, kritikus rtk: 21 (0.05) = 3.84.
A prbastatisztika:
Szabadsgi fok:
Teht a szemszn s a hajszn fggetlennek tekinthet.

b) Mondhatjuk-e, hogy a szkk kztt tbb a kkszem (
= 0.05)?
200(30807020)
A prbastatisztika:
= 1.63.
10010050150
A kritikus rtk: u0.05 = 1.65.
Teht a szkk kztt nem szigniknsan tbb a kkszem (de majdnem :).
8.3. Homogenitsvizsglat
Legyen X s Y kt valsznsgi vltoz, s kzs rtkkszletket bontsuk fel az A1 , . . . , Ar osztlyokra.
H0 : X s Y eloszlsa megegyezik, azaz P (X Ai ) = P (Y Ai ) minden i-re.
Az X -et n-szer meggyelve, legyen i az Ai osztly gyakorisga. Hasonlan, Y -t m-szer meggyelve,
legyen i az Ai osztly gyakorisga.
i +i
Az i. osztly valsznsgnek ML becslse: p
i = n+m
.
A prbastatisztika:
r
2
X
(i n
pi )
i=1
n
pi
r
2
X
(i m
pi )
i=1
m
pi
H0
2f ,
f = (r 1) + (r 1) (r 1) = r 1, hiszen mindkt sszeg

paramterek lennnek) r 1, viszont r 1 paramtert becsltnk, amit
ahol a szabadsgi fok:
szabadsgi foka (ha
nem becslt
le kell vonni.
A fenti statisztika talaktsa utn kapjuk, hogy
r
X
i=1
2
mi
H0
n m 2r1 .
i + i
i
n
30
8.4. Plda.
Kt kockval dobunk. Tekinthet-e a kt kocka egyformnak (
= 0, 05)?
Az adatok:
1
7
16
rtk
i
i
(1. kocka)
(2. kocka)
2
3
11 8
11 20
4
5
10 8
19 18
6
6
16
r=6
n = 50
m = 100
A prbastatisztika:
6
X
i=1
A kritikus rtk:
261 (0.05) = 11.1.
i
100
i + i
i
50
Mivel
2
50 100 = 3.58.
3.58 < 11.1, H0 -t
elfogadjuk, a kt kocka egyformnak
tekinthet.
9. ltalnostott likelihood-hnyados prba

Tekintsk a
= 0 1
hipotzisvizsglati feladatot. Egy
elem
likelihood-hnyados statisztika alatt a kvetkez mennyisget rtjk:
mintbl szmolt
ltalnostott
sup{Ln (X; ) : }
.
sup{Ln (X; ) : 0 }
Ha a nullhipotzis teljesl, akkor ez kzel van 1-hez, mg ha nem, akkor a szmll jval nagyobb a
neveznl, ezrt a hnyados nagy. A nullhipotzis tesztelse teht gy trtnhet, hogy ha az ltalnostott
likelihood-hnyados statisztika nagyobb, mint valamely kritikus rtk, akkor
akkor
H0 -t
H0 -t
elvetjk, ha kisebb,
elfogadjuk, egyenlsg esetn pedig, ha szksges, randomizlunk.
Ha mind a nullhipotzis, mind az ellenhipotzis egyszer, azaz a hipotzisnk szerint a srsgfggvny
f0 ,
az ellenhipotzis szerint pedig
f1 ,
akkor a statisztika a kvetkez alakot lti:
n f (X) o
max{f0 (X), f1 (X)}
1
= max 1,
.
f0 (X)
f0 (X)
Itt a msodik tag a NeymanPearson lemmbl ismers likelihood-hnyados, vagyis a klasszikus likelihood-hnyados prbt kapjuk, ha a kritikus rtk nagyobb 1-nl.
Az ltalnostott likelihood-hnyados statisztika
H0
melletti eloszlst nhny kivteles esettl el-
tekintve nehz meghatrozni. Bizonyos felttelek mellett azonban hatreloszlsttelt tudunk bizonytani
r, amint a minta nagysga minden hatron tl n, s ezzel aszimptotikus prbt konstrulhatunk.
Az aszimptotikus vizsglathoz a fenti statisztika logaritmusnak a ktszerest tekintjk:

T = 2 sup log Ln (X; ) sup log Ln (X; ) .
Tegyk fel, hogy a paramterek kt csoportra vannak felosztva, az els csoportba tartozk vektort
jellje
Rq ,
a tbbiek
(p q)-dimenzis
vektort pedig
Tekintsk a kvetkez hipotzisvizsglati
feladatot:
H0 : = 0 ,
tetszleges,
H1 : 6= 0 ,
Megmutathat, hogy bizonyos regularitsi felttelek mellett
2q .
gy khi-ngyzet prba vgezhet. (Illetve a
tetszleges.
esetn a
statisztika hatreloszlsa
paramterre amennyiben egy dimenzis kondencia-
intervallum adhat.)
10. Folytonos eloszls mintra a
2 -prba
helyett alkalmazhat
prbk
Lttuk, hogy a
2 -prba
hromfle feladat tesztelsre alkalmas.
folytonos eloszls mintkra, ha azokat diszkretizljuk.
Azonban a
Mindhrom tpus alkalmazhat
2 -prba
alapveten diszkrt jel-
leg, gy felmerl a krds, hogy folytonos eloszls mintkra nem lehet-e jobb prbkat konstrulni. Az
albbiakban bemutatunk nhnyat ezek kzl.
31
10.1. Illeszkedsvizsglat
X1 , . . . , Xn valamilyen folytonos
H0 : F = F0 , H1 : F 6= F0 .
eloszlsbl vett minta (a mintaelemek eloszlsfggvnyt jellje
F ).
Kolmogorov-Szmirnov prba:
Ksztsk el a minta
Fn
tapasztalati eloszlsfggvnyt, s tekintsk a kvetkez prbastatisztikt:

Dn = sup Fn (x) F0 (x) .
xR
Dn H0
Megmutathat, hogy
melletti eloszlsa nem fgg az
i
tapasztalati eloszlsfggvny konstans
n , az
F0
F0
eloszlstl: mivel
(n)
Xi
(n)
Xi+1
kztt a
eloszlsfggvny pedig monoton n, kapjuk, hogy
h

i
(n)
(n)
Dn = max max |F0 (Xi ) i/n|, |F0 (Xi+1 ) i/n| .
0in
H0 melletti eloszlsapedig valban nem fgg F0 -tl, hiszen ha Xi

F0 (Xi ) E(0, 1). Tovbb nDn aszimptotikus eloszlsa meghatrozhat:
Ennek
+
X
2 2
n
P ( nDn < y) K(y) =
(1)i e2i y
eloszlsfggvnye
F0 ,
akkor
(y > 0).
i=
A fenti
eloszlsfggvnyhez tartoz eloszls az n.
Kolmogorov eloszls.
Kolmogorov eloszlsbl szmolhatunk kritikus rtket (pl.
H0 -t,
ha
nDn > 1.36),
Mj.: Vizsglhatjuk a
= 0.05
Azaz ha
elg nagy, akkor a
terjedelem mellett akkor utastjuk el
ha pedig n kicsi, akkor kln tblzat tartalmazza a

H1 : F (x) > F0 (x) x vagy a H1 : F (x) < F0 (x) x
kritikus rtkeket.
egyoldali ellenhipotziseket
is, ekkor a prbastatisztika

Dn+ = sup Fn (x) F0 (x) ,
illetve
xR
H0
Ezekre is igaz, hogy
A fenti
K1
xR
melletti eloszlsuk nem fgg
meghatrozhat:

Dn = sup F0 (x) Fn (x) .
F0 -tl.
2
n
P ( nDn < y) K1 (y) = 1 e2y
eloszlsfggvnyhez tartoz eloszlst nevezhetjk
H0 -t,
ha
nDn > 1.22),
ha pedig
nDn
aszimptotikus eloszlsa
(y > 0).
Szmirnov eloszlsnak.
akkor a Szmirnov eloszlsbl szmolhatunk kritikus rtket (pl.

el
Tovbb
Azaz ha n elg nagy,

= 0.05 terjedelem mellett akkor utastjuk
kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
10.2. Fggetlensgvizsglat
(Xi , Yi ) (i = 1, . . . , n) egy folytonos H(x, y) eloszlsfggvny eloszlsbl szrmaz minta.

H -hoz tartoz marginlis eloszlsokat F (x) = limw H(x, w) s G(y) = limz H(z, y).
kt koordinta fggetlen, azaz H(x, y) = F (x)G(y) x, y .
Legyen
Jellje a
H0 :
Kendall prba:
Tekintsk a kvetkez prbastatisztikt:
Kn =
n1
X
n
X
[I((Xi Xj )(Yi Yj ) 0) I((Xi Xj )(Yi Yj ) < 0)] .
i=1 j=i+1
Szavakkal elmondva,
Kn
a rendezett ponptprok szma, mnusz a nem rendezett pontprok szma, azaz
Kn H0 melletti
F, G marginlis eloszlsoktl. Ha ugyanis az (Xi , Yi ) minta helyett az (F (Xi ), G(Yi ))
mintbl szmolnnk ki Kn -et, ugyanazt az rtket kapnnk, hiszen F, G monoton nv fggvnyek.
Viszont F (Xi ) s G(Yi ) mr fggetlen E(0, 1) eloszlsak.
Megmutathat az is, hogy Kn aszimptotikusan normlis eloszls, azaz ha n elg nagy, akkor u-prba
vgezhet, ha pedig n kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
Az u-prbhoz
ktszer a rendezett ponptprok szma, mnusz az sszes pontpr szma. Belthat, hogy
eloszlsa nem fgg az
32
standardizlni kell
a)
Kn
Kn -et:
H0 mellett:
vrhat rtke
E0 (I((Xi Xj )(Yi Yj ) 0)) = P0 ((Xi Xj )(Yi Yj ) 0) = P0 (Xi Xj 0 s Yi Yj 0)+

P0 (Xi Xj 0 s Yi Yj 0) = 0.5 0.5 + 0.5 0.5 = 0.5.
E0 (I((Xi Xj )(Yi Yj ) < 0)) = 0.5, azaz E0 (Kn ) = 0.
H0 mellett:
ij = [I((Xi Xj )(Yi Yj ) 0) I((Xi Xj )(Yi Yj ) < 0)].
X
X
XX
D02 (Kn ) = cov0
ij ,
kl =
cov0 (ij , kl ).
Hasonlan,
b)
Kn
szrsngyzete
legyen
i<j
i<j k<l
k<l
ha
{i, j} {k, l} =
0
1
ha
i = k, j = l
Itt cov0 (ij , kl ) =
1/9 egybknt
n(n 1) 1 n(n 1)(n 2)
n(n 1)(2n + 5)
2
+
6=
.
Azaz D0 (Kn ) = 1
2
9
6
18
Mj.: a prba csak a 6= 0 tpus ellenhipotzisekre konzisztens, ahol
= 2P ((X1 X2 )(Y1 Y2 ) > 0) 1
a Kendall-fle fggsgi egytthat (| |
1,
ha
fggetlenek, akkor
= 0,
de fordtva nem igaz).
Blum-Kiefer-Rosenblatt prba:
Legyen
N1 (i) = |{ j
N2 (i) = |{ j
N3 (i) = |{ j
N4 (i) = |{ j
N` (i)
Azaz
6= i | Xj
6= i | Xj
6= i | Xj
6= i | Xj
< Xi
> Xi
< Xi
> Xi
darab pont esik az
s
s
s
s
Yj
Yj
Yj
Yj
< Yi }|
< Yi }|
> Yi }|
> Yi }|
(Xi , Yi )
N3 (i)
N4 (i)
(Xi ,Yi )
N1 (i)
N2 (i)
osztpont ltal meghatrozott
`.-ik
sknegyedbe.
Prbastatisztika:
Bn =
ahol
n, H
n
Fn , G
1X
n i=1
N1 (i) N4 (i) N2 (i) N3 (i)
n
n
n
n
1X
n (Yi ))2 ,
(Hn (Xi , Yi ) Fn (Xi )G
n i=1
Belthat, hogy
B n H0
Fn (Xi ) = (N1 (i) + N3 (i))/n,
melletti eloszlsa nem fgg az
aszimptotikus eloszlsa meghatrozhat. Azaz ha

hatunk kritikus rtket (pl.
a tapasztalati eloszlsfggvnyek:
n (Xi , Yi ) = N1 (i)/n,
H
pedig
2
= 0.05
F, G
n (Yi ) = (N1 (i) + N2 (i))/n.

G
marginlis eloszlsoktl, tovbb
nBn
elg nagy, akkor az aszimptotikus eloszlsbl szmol-
terjedelem mellett akkor utastjuk el
H0 -t,
ha
nBn > 0.058),
ha
10.3. Homogenitsvizsglat
X1 , . . . , Xn s Y1 , . . . , Ym
F , illetve G).
H0 : F = G, H1 : F =
6 G.
fggetlen mintk valamilyen folytonos eloszlsokbl (az eloszlsfggvnyek
Mann-Whitney-Wilcoxon prba :
Tekintsk a kvetkez prbastatisztikt:
Wn,m =
n X
m
X
i=1 j=1
33
I(Xi Yj ).
10.1. Ttel.
(N )
(N )
N := n + m. Vegyk a Z1 < < ZN
(n)
rendezett mintt, s jellje ri , hogy Xi
hanyadik legkisebb elem ebben a rendezett mintban. Ekkor
n(n+1)
Wn,m = r1 + + rn 2 .
Legyen
az egyestett minta, ennek elemszma
Bizonyts.
(n)
X1
(n)
(n)
r1 1 db Yj -nl nagyobb, X2
r2 2 db Yj -nl nagyobb, s ltalban, Xi
ri i db Yj -nl nagyobb.
Ezeket sszeadva kapjuk az lltst.

Megmutathat, hogy
Wn,m H0
melletti eloszlsa nem fgg a kt minta kzs eloszlstl, s aszimp-
H0 mellett az X -ek s Y -ok minden sorrendje

n+m
a valsznsge annak, hogy az X -ek adott rangokat foglalnak el, Wn,m
n
pedig ezeknek a rangoknak a fggvnye. A msodik llts pedig azrt igaz, mert az I(Xi Yj ) vltozk,
totikusan normlis eloszls. Az els llts azrt igaz, mert

egyformn valszn, azaz
1/
br nem fggetlenek, viszonylag gyenge sszefggst mutatnak.
n, m
Ez alapjn, ha
u-prba vgezhet, ha pedig n, m

u-prbhoz standardizlni kell Wn,m -et:
elg nagyok, akkor
tartalmazza a kritikus rtkeket. Az
kicsi, akkor kln tblzat
a) Wm,n vrhat rtke H0 mellett:

E0 (I(Xi Yj )) = P0 (Xi Yj ) = 21 E0 (Wn,m ) = nm
2
b) Wn,m szrsngyzete H0 mellett:
legyen ij = I(Xi Yj ).
m X
n X
m
n X
m
n X
m
n X
X
X
X
cov0 (ij , lk ).
D02 (Wn,m ) = cov0
ij ,
lk =
i=1 j=1
i=1 j=1 l=1 k=1
l=1 k=1
0
ha
i 6= l, j 6= k
1/4 ha i = l, j = k
Itt cov0 (ij , lk ) =
1/12 ha i = l, j 6= k
1/12 ha i 6= l, j = k
1
1
1
n m(n + m + 1)
nm n+m+1
2
Azaz D0 (Wn,m ) = nm + nm(m 1)
+ mn(n 1)
=
=
.
4
12
12
12
4
3
nm
lenne, ha ij -k fggetlenek lennnek. Mj.: a prba csak a P (X > Y ) 6= 1/2 tpus ellenhipotzis
4
esetn konzisztens.
Kolmogorov-Szmirnov prba:
Ksztsk el a mintkbl az
m
|hatFn , G
tatisztikt:
tapasztalati eloszlsfggvnyeket, s tekintsk a kvetkez prbas-

m (x) .
Dn,m = sup Fn (x) G
xR
Megmutathat, hogy
Dn,m
Dn,m H0
melletti eloszlsa nem fgg a kt minta kzs eloszlstl, s
mn
m+n
n, m elg nagyok, akkor a Kolmogorov eloszlsbl

n, m kicsi, akkor kln tblzat tartalmazza a kritikus rtkeket.
H1 : F (x) > G(x) x egyoldali ellenhipotzist is, ekkor a prbastatisztika

+
m (x) .
Dn,m
= sup Fn (x) G
aszimptotikusan Kolmogorov eloszls. Azaz ha
szmolhatunk kritikus rtket , ha pedig

Mj.: Vizsglhatjuk a
xR
H0 melletti eloszlsa nem fgg a kt minta kzs eloszlstl. Ebben az esetben

mn
+
m+n Dn,m aszimptotikusan Szmirnov eloszls. Azaz ha n, m elg nagyok, akkor a Szmirnov eloszlsbl
Erre is igaz, hogy
szmolhatunk kritikus rtket, ha pedig
n, m
11. Lineris regresszi, lineris modellek

Legyen
Krds:
Pl.:
100
(X, Y )
ktdimenzis valvltoz.
milyen lineris fggvnye kzelti legjobban

kockadobsbl
prosak
szmt
Y -t?
szeretnnk
34
hatosok
szmnak
lineris
fggvnyvel
kzelteni.
Elnevezs:
a magyarz vltoz.
A kzelts hibjt mrje a
h2 = E[(Y (aX + b))2 ]
mennyisg, ezt szeretnnk minimalizlni.
Megolds:
h2 = E(X 2 )a2 + b2 + 2E(X)ab 2E(XY )a 2E(Y )b + E(Y 2 )

A kifejezst
szerint derivlva, akkor lesz
0,
ha
a=
A kifejezst
szerint derivlva, akkor lesz
0,
E(XY ) bE(X)
.
E(X 2 )
ha
b = E(Y ) aE(X).
A minimumot teht a kvetkez paramterek adjk:
a =
A
h2
hibt
cov(X, Y )
,
D2 (X)
b = E(Y ) a E(X).
szrsngyzetvel osztva megkapjuk, hogy a regresszi a szrsngyzet hny szzalkt
magyarzza meg.
Ugyanezt a feladatot tekinthetjk tbb magyarz vltoz esetn is: legyen
X = (X1 , . . . , Xq ) a magyarz vltozkat.

T
mennyisget, ahol a = (a1 , . . . , aq ) vektor.
jellje
(X1 , . . . , Xq , Y ) valvltoz, s
h2 = E[(Y (aT X + b))2 ]
Minimalizlni szeretnnk a
A feladat az egy-dimenzishoz hasonlan oldhat meg, s
a = cov(Y, X)1 (X),
b = E(Y ) a E(X).
cov(Y, X) = (cov(Y, X1 ), . . . , cov(Y, Xq )) sorvektor, (X) pedig q q -as mtrix, melynek (i, j)-dik
cov(Xi , Xj ). (Tegyk fel, hogy a mtrix invertlhat.)
Itt most
eleme
Ez utbbi fellls arra az esetre is alkalmazhat, amikor egy magyarz vltoz van, de annak
polinomjval szeretnnk
Y -t
kzelteni.
Pl. Egy teve legel Erzsi nni hts kertjben.

Ebbl a mondatbl vletlenszeren vlasztva egy szt, legyen
A legjobb lineris kzelts
Y -ra: 0.82X +4.06.
Y pedig a sz hossza.
Y -ra: 1.02X 2 1.25X +4.38.
az e betk szma,
A legjobb msodfok kzelts
Feladat: szmoljuk ki a kt kzelts hibjt!
(Xi1 , . . . , Xiq , Yi ), i = 1, . . . , n fggetlen, azonos eloszls minta.

Pn
1
T
2
(Y
(a
X
+
b))
hibt szeretnnk minimalizlni. Ha a minta tapasztalati eloszlst
i
i
i=1
n
tekintjk, akkor az tlag a vrhat rtknek felel meg, azaz a megolds ugyanaz, mint az elbb, csak a
Az elz statisztikai megfelelje:
Most a
h2 =
megfelel tapasztalati mennyisgeket kell berni.

A fentiekben teljes ltalnossgban megkerestk a legjobb lineris kzeltst.
Yi = aT Xi + b + i , ahol Xi ugyanaz, mint fent, de most ismertnek

2
az Yi meggyelsek pedig Xi lineris fggvnyei, hibval terhelten. Itt i fggetlen N (0, )
T
2
Yi N (a Xi + b, ) eloszls, s fggetlenek.
Lineris modell:
felttelezzk,
hibk. Teht
Plda: egy ember slya a neme, letkora, magassga valamilyen lineris fggvnye, plusz mg az egyni
ingadozsbl szrmaz hiba.
ll: Ebben a modellben
ll: Ebben a modellben
a s b ML becslse
2 ML becslse:
pp a fenti
b ,
s a becslsek torztatlanok.
2 =
ez nem torztatlan, de
1X
(Yi (aT Xi + b))2 ,
n i=1
n
X
1
(Yi (aT Xi + b))2
n q 1 i=1
mr az.
35

Villo Statisztika

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Villo Statisztika

Uploaded by

Copyright:

Available Formats

Statisztika (jegyzet)

hisztogrammal (oszlopdiagrammal), krdiagrammal, egyb grakonokkal.

matematikai statisztika alapfeladata:

gi vltoz eloszlst) nem ismerjk,

egy vletlen jelensg mechanizmust (pl. az t ler valszns-

kvetkeztetni. A kvetkez tmakrkkel fogunk foglalkozni:

A valsznsgi vltoz valamilyen jellemzjt szeretnnk a mintbl megbecslni,

30 darab, kzel azonos hosszsg, a titkrn ltal

ismeretlen. A meggyelsek alapjn szeretne kvetkeztetni

a vrhat rtk s a szrs mr kiszmolhat. Msrszt, a vrhat rtket s a szrst becslheti a

Annak a valsznsgt szeretnk megbecslni,

ahol a tallat valsznsge

1 pont, nem tall be

0 pont. Kapott pontszm egy

ismeretlen, ezt szeretnnk megbecslni.

5. Htftl pntekig megmrjk, hogy mennyit kell vrni a buszra.

Feltehet, hogy ez egyenletes

A jelensggel kapcsolatban van egy elzetes felttelezsnk, amelyet tesztelni sz-

eretnnk. Ha a meggyelseink sszeegyeztethetk a feltevssel, elfogadjuk azt, ha viszont ellentmondanak

egszsggyben: gygyszerek hatsossgnak bizonytsa;

ipar: selejtarny ellenrzse: le kell-e a gpsort cserlni?

irodalomtudomny: 2 szvegrl el kell dnteni, hogy ugyanaz rta-e ket;

szociolgia: prtok npszersge: van-e szignikns klnbsg?

szociolgia: prtpreferencia s iskolzottsg kztt van-e sszefggs?

statisztikai meznek hvjuk,

nemres halmaz (esemnytr),

pedig a szbajhet valsznsgi mrtkek csaldja. Azaz

vges dimenzis euklideszi tr rszhalmaza, ekkor

azt mondjuk, hogy paramteres a feladat (pl.: 1.-5. paramteres feladatok).

lehet ennl jval "nagyobb",

az sszes lehetsges valsznsgi mrtk, ekkor nemparamteres a feladat.

X = (X1 , . . . , Xn ) : X Rn valsznsgi vltozt (n elem) mintnak

{Fn; | }, ahol Fn; (x1 , ..., xn ) = P (X1 < x1 , ..., Xn < xn ).

A minta eloszlsfggvnyeinek csaldja

Fn; (x1 , ..., xn ) =

koordintk kzs eloszlsfggvnye. Emlkezznk r, hogy az eloszlsfggvny helyett

pn; (x1 , . . . , xn ) = P (X1 = x1 , X2 = x2 , ..., Xn = xn )

fn; (x1 , ..., xn )

X = (X1 , . . . , X30 ) : N30

p30; (x1 , x2 , . . . , x30 ) =

(k-dimenzis) statisztiknak nevezzk.

azaz egyparamteres feladatrl van sz.

szvegben tallt hibk

fggetlen, azonos eloszls minta, a mintaelemek szbajhet eloszlsai:

fggvnyt, illetve magt a

Nhny gyakran hasznlt statisztika (X mindenhol

T (X) = (X1 , X2 , ..., Xn ) az X minta rendezett mintja, ahol X1 X2

1.1. Ttel. (Glivenko:

A statisztika alapttele.) Legyenek

vny valsznsgi vltozk.

valdi eloszlst. Azt knny beltni, hogy minden rgztett

hiszen ez ppen a nagy szmok ers trvnye az

valsznsgi vltozkra. Megjegyezzk mg,

maximlis eltrs nagysgrendje

Az 2-5 pldkra adjuk meg a mintateret, a paramterteret, s a minta eloszlsainak csald-

X minta mindegyik pldban

fggetlen, azonos eloszls.

f20; (x1 , ..., x20 ) =

p10; (x1 , . . . , x10 ) =

f5; (x1 , ..., x5 ) =

Xi az i. napon a vrakozsi id.

f5; (x1 , ..., x5 ) =

8-szor a kvetkez ksrletet:

addig dobunk egy rmvel, amg fejet nem kadobni. Az

hisztogrammal (oszlopdiagrammal), krdiagrammal, egyb grakonokkal.

ismeretlen. A meggyelsek alapjn szeretne kvetkeztetni

eretnnk. Ha a meggyelseink sszeegyeztethetk a feltevssel, elfogadjuk azt, ha viszont ellentmondanak

szociolgia: prtok npszersge: van-e szignikns klnbsg?

p-rl. A denci alapjn szmolunk:

Ennek a fogalomnak adhat precz matematikai denci, de