You are on page 1of 8

Alkalmazott matematikus MSc

Operációkutatás szakirány
Sztochasztikus programozás, BMETE93MM05

7. Előadás

További példák logkonkáv mértékekre

(vi) Wishart eloszlás. Ha egy m-változós, C kovarianciamátrixú normális eloszlásból


n-elemű mintát veszünk, és képezzük a tapasztalati kovariancia mátrixot, akkor a
fődiagonálisában és afölött álló elemeinek az együttes valószínűségeloszlását Wis-
hart eloszlásnak nevezzük. Ha n > m, akkor ez 21 m(m + 1) valószínűségi változó
folytonos eloszlását jelenti. Ennek az eloszlásnak ez együttes sűrűségfüggvényét
f(X)-szel fogjuk leírni, ahol X m × m-es szimmetrikus mátrix, mely elemei megfe-
lelnek a tapasztalati kovarianci mátrix elemeinek.

Ez a sűrűségfüggvény a következő analitikus kifejezéssel bír:

n−1 1 1 −1 X
f(X) = c(n − 1, m)|C|− 2 |X| 2 (n−m−2) e− 2 TrC ,

ha X pozitív definit és f(X) = 0 különben, ahol


p  
1 kp p(p−1) Y k−i+1
=2 π
2 4 Γ .
c(k, p) i=1
2

Legyen X1 , X2 két m × m méretű, pozitív definit mátrix és 0 < λ < 1. Ekkor


a λX1 + (1 − λ)X2 mátrix szintén pozitív definit, és akkor egy jól ismert, először
Minkowski által bizonyított egyenlőtlenég szerint tudjuk, hogy

|λX1 + (1 − λ)X2 | ≥ |X1 |λ |X2 |(1−λ) .

1
Ezért, ha n ≥ m + 2, akkor f(X) a pozitív definit mátrixok halmazán logkonkáv
függvény és ez maga után vonja, hogy logkonkáv a teljes 12 m(m + 1) dimenziós tér
fölött is. Ha n = m + 1, akkor f(X) logkonvex afölött a konvex halmaz fölött, ahol
f(X) > 0.

További példák ismertetése előtt általánosítjuk a logkonkáv mértékek alaptételét (6.


előadás 1. tétele). Legyen f egy valószínűségi sűrűségfüggvény az Rm téren és tegyük fel,
hogy valamely rögzített α-ra (−∞ ≤ α ≤ ∞) rendelkezik azzal a tulajdonsággal, hogy
minden olyan esetben, amikor f(x) > 0, f(y) > 0, akkor minden 0 < λ < 1 esetén

1
f(λx + (1 − λ)y) ≥ [λfα (x) + (1 − λ)fα (y)] α . (1)

Vegyük észre, hogy a fenti egyenlőtlenség jobboldala folytonos határátmenettel értel-


mezhető az α = −∞, α = ∞, α = 0 esetekben is, így eset szétbontással azt kapjuk,
hogy

1

 [λfα (x) + (1 − λ)fα (y)] α , ha − ∞ < α < 0





 vagy 0 < α < ∞


1
[λfα (x) + (1 − λ)fα (y)] α = min [f(x), f(y)] , ha α = −∞



 max [f(x), f(y)] ,

 ha α = ∞



 fλ (x)f1−λ (y), ha α = 0

Az α → −∞ határátmenet vizsgálatához először tekintsük a következő átalakítást:

1 1 α (x)+(1−λ)fα (y)]
lim [λfα (x) + (1 − λ)fα (y)] α = lim e α log[λf
α→−∞ α→−∞

2
majd a kitevő határértékének meghatározására a L’Hospital szabályt alkalmazva:
λ log f(x)fα (x) + (1 − λ) log f(y)fα (y)
log[λfα (x) + (1 − λ)fα (y)] λfα (x) + (1 − λ)fα (y)
lim = lim
α→−∞ α α→−∞ 1
 α  α
f(x) f(y)
λ log f(x) + (1 − λ) log f(y)
min{f(x), f(y)} min{f(x), f(y)}
= lim  α  α
α→−∞ f(x) f(y)
λ + (1 − λ)
min{f(x), f(y)} min{f(x), f(y)}

  α
 f(y)


 λ log f(x)1 + (1 − λ) log f(y)
α

 f(x)

 lim  α = log f(x), ha min{f(x), f(y)} = f(x)



α→−∞
α
f(y)

 λ1 + (1 − λ)

 f(x)
=

  α

 f(x)


 λ log f(x) + (1 − λ) log f(y)1α

 f(y)


 lim  α = log f(y), ha min{f(x), f(y)} = f(y)

 α→−∞ f(x) α
 λ + (1 − λ)1
f(y)
tehát valóban

1
 elog f(x) , ha min{f(x), f(y)} = f(x)
lim [λfα (x)+(1−λ)fα (y)] α = = min{f(x), f(y)}
α→−∞  elog f(y) , ha min{f(x), f(y)} = f(y)
Az α → 0 és az α → ∞ határátmeneteket ugyanilyen módon lehet vizsgálni, ezektől
eltekintünk.

Érdemes áttekinteni, hogy az egyes esetekben mit jelent az f függvényre nézve az (1)
egyenlőtlenség.

a) α = −∞. Ebben az esetben az (1) egyenlőtlenség azt jelenti, hogy

f[λx + (1 − λ)y] ≥ min{(f(x), f(y))},

ez pedig automatikusan teljesül azokban az esetekben is, amikor f(x)f(y) = 0.


Ezért ebben az esetben az f függvény kvázikonkáv az egész Rm téren.

b) −∞ < α < 0. Ha D = {x|f(x) > 0}, akkor az (1) egyenlőtlenségből következik,


hogy D konvex halmaz. Ha x, y ∈ D, akkor teljesül az

fα (λx + (1 − λ)y) ≤ λfα (x) + (1 − λ)fα (y),

3
egyenlőtlenség, ami azt jelenti, hogy fα konvex a D halmazon. Mivel a D halmazon
kívül fα a ∞ értéket veszi fel (α negatív), az előző egyenlőtlenség igaz marad
minden x, y esetén, és így azt mondhatjuk, hogy fα konvex függvény az egész Rn
téren.

c) α = 0. Ekkor azt kapjuk, hogy

f[λx + (1 − λ)y] ≥ [f(x)]λ [f(y)]1−λ ,

ami triviálisan teljesül, ha f(x)f(y) = 0. Ezért f logkonkáv az egész Rm téren.

d) 0 < α < ∞. Legyen D = {x|f(x) > 0}, akkor a b) esethez hasonlóan belátható,
hogy D konvex halmaz és fα konkáv függvény a D konvex halmaz felett.

e) α = ∞. Ebben az esetben az (1) egyenlőtlenség azt jelenti, hogy

f[λx + (1 − λ)y] ≥ max{(f(x), f(y))}.

Most is látható, hogy az a D halmaz, ahol f pozitív, konvex halmaz és ekkor a fenti
egyenlőtlenség miatt f = állandó a D halmazon.

Most a logkonkáv mértékek alaptételének egy általánosítását fogjuk bebizonyítani.


Ehhez az alaptétel bizonyításához hasonlóan szükségünk van egy integrál egyenlőtlen-
ségre, amit a következő tételben bizonyítás nélkül adunk meg.

1. Tétel: Ha g és h nemnegatív, Borel mérhető függvények az Rm téren, akkor tetsző-


leges 0 < λ < 1 állandó esetén

1

 [λg α
(x) + (1 − λ)h α
(y)] α , ha − ∞ < α < 0





 vagy 0 < α < ∞


rα (x, y) = min [g(x), h(y)] , ha α = −∞





 max [g(x), h(y)] , ha α = ∞



 gλ (x)h1−λ (y), ha α = 0

Lebesgue mérhető függvény, mellyel képezhetjük az:

rα (t) = sup rα (x, y),


(x,y)|t=λx+(1−λ)y

4
függvényt, ahol a supremum x és y-ra veendő. Ez a függvény szintén Lebesgue mérhető
és ha még g és h az Rm fölött nullától különböző integrállal bírnak, valamint 1 + mα ≥ 0,
akkor teljesül az alábbi integrálegyenlőtlenség:
  γ  γ  γ1
Z  Z Z 
rα (t)dt ≥ λ  g(x)dx + (1 − λ)  h(y)dy , (2)
 
Rm Rm Rm
α
ahol γ = . Az α = − m1 , α = 0 és α = ∞ eseteket most is folytonos határátme-
1 + mα
nettel lehet értelmezni.

Ezután a logkonkáv mértékek alaptételének általánosítása a következő tétel:

2. Tétel: Legyen f olyan valószínűségi sűrűségfüggvény Rm -en, amely teljesíti az (1)


egyenlőtlenséget minden olyan x, y esetén, amelyekre f(x) > 0, f(y) > 0, ahol 1 + mα ≥
0. Legyen továbbá P az f által generált valószínűségi mérték. Ekkor minden olyan
A, B ⊂ Rm konvex halmazpárra, melyre P(A) > 0, P(B) > 0 teljesül, igaz a következő
egyenlőtlenség
1
P(λA + (1 − λ)B) ≥ {λ [P(A)]γ + (1 − λ) [P(B)]γ } γ , (3)
α
ahol 0 < λ < 1 tetszőleges állandó, γ = és a γ = −∞, γ = 0, γ = ∞ eseteket
1 + mα
folytonos határátmenettel értelmezhetjük.

Bizonyítás: Legyen most A, B ⊂ Rm két tetszőleges Borel mérhető halmaz, 0 < λ < 1
rögzített, és definiáljuk az f1 , f2, f3 függvényeket a következőképpen:

f1 (x) = f(x), x ∈ A, és 0 különben,


f2 (x) = f(x), x ∈ B, és 0 különben,
f3 (x) = f(x), x ∈ λA + (1 − λ)B, és 0 különben.
Ekkor nyilván
R
P(A) = f1 (x)dx
Rm

R
P(B) = f2 (x)dx
Rm

R
P(λA + (1 − λ)B) = f3 (x)dx
Rm

5
Ha t = λx + (1 − λ)y és f1 (x) > 0, f2(y) > 0, akkor (1) miatt teljesül, hogy
1
f3 (t) ≥ [λfα1 (x) + (1 − λ)fα2 (y)] α ,

és ugyanez nyilván igaz marad a jobboldal szuprémumát véve is:


1
f3 (t) ≥ sup [λfα1 (x) + (1 − λ)fα2 (y)] α ,
(x,y)|t=λx+(1−λ)y

Ezért az 1. Tétel alkalmazható g = f1 , h = f2 választással és a (3) egyenlőtlenség követ-


kezik a (2) egyenlőtlenségből.

Ha 0 < α < ∞, akkor (amint megmutattuk) f logkonkáv függvény és visszakapjuk
a logkonkáv mértékek alaptételét, hiszen a (3) egyenlőtlenség jobboldalára alkalmazva
számtani és mértani közepek közt fennálló egyenlőtlenséget, megkapjuk a P valószínű-
ségi mérték logkonkávitását. α = 0 esetén pedig a (3) egyenlőtlenség pontosan a P
valószínűségi mérték logkonkávitását adja.

Érdekességként megjegyezzük, hogy az 1. Tétel bizonyításához nem szükséges annak a


feltételezése, hogy f valószínűségi sűrűségfüggvény, azaz hogy az Rm tér fölötti integrálja
eggyel egyenlő. Az állítás mindig igaz, ha az f függvény tetszőleges, nem azonosan
nulla mértéket generál. Ha például f(x ≡ 1) Rm fölött, akkor a generált mérték a
Lebesgue mérték, amit P helyett jelöljünk inkább µ-vel. Ekkor az α = ∞ eset, amikor
1
határátmenettel γ = m
, a (3) egyenlőtlenség azt jelenti, hogy
1 1 1
µ m (λA + (1 − λ)B) ≥ λµ m (A) + (1 − λ)µ m (B).

Ez pedig a mértékelméletből jól ismert Brunn-Minkowski egyenlőtlenség. Ezért a log-


konkáv mértékek alaptételének a fenti álatlánosítása úgy is tekinthető, mint a Brunn-
Minkowski egyenlőtlenség általánosítása.

A logkonkávitás alaptételének fenti általánosítása a legfontosabb új eredményeket


abban az esetben jelenti, amikor − m1 ≤ α < 0. Az α = − m1 esetre mint következményt,
külön is megfogalmazzuk a tételt.
1
1. Következmény: Ha egy Rm tér feletti f sűrűségfüggvényről azt tudjuk, hogy f− m
konvex az egész téren, akkor a generált P valószínűségi mértékre teljesül a

P(λA + (1 − λ)B) ≥ min {P(A)P(B)} ,

6
azaz P kvázikonkáv mérték.

Néhány példa olyan valószínűségeloszlásokra, melyek kvázikonkávitását ennek a kö-


vetkezménynek a segítségével lehet belátni.

(i) Legyenek ξ1 , . . . , ξm nulla várható értékre és egy szórásra standardizált, de egy-


mással korrelált normális eloszlású valószínűségi változók. Jelölje a korreláció mát-
rixukat R. Legyen továbbá η egy további, a ξ1 , . . . , ξm valószínűségi változóktól
független, ν szabadságfokú, χ eloszlású valószínűségi változó. Ekkor a

νξj
ζj = , j = 1, . . . , m
η
valószínűségi változók együttes eloszlását többváltozós Student-féle t-eloszlásnak
nevezzük. Ennek az eloszlásnak az együttes sűrűségfüggvénye:
− 12 (ν+m)
Γ ( 21 (ν + m))

1 ′ −1
f(x) = 1 1 1+ xR x ,
(πν) 2 m Γ ( 1 ν)|R| 2 ν
2
1
∀x ∈ Rm -re. Mivel f− m az egész Rm tér felett konvex függvény, azért a következ-
mény szerint a generált valószínűségeloszlás kvázikonkáv.

A speciális m = 1 és ν = 1 esetben ez az eloszlás a Cauchy-eloszlás lesz, melynek


a sűrűségfüggvénye
1 1
f(x) = .
π 1 + x2
Ezért a Cauchy-eloszlás is kvázikonkáv.

(ii) Az egyváltozós Pareto-eloszlás sűrűségfüggvénye:

f(x) = aθa x−(a+1) , ha x > θ

és f(x) = 0 különben, ahol a egy pozitív állandó. Az f függvény logkonvex azon a


végtelen intervallumon, ahol pozitív. Mivel f−1 konvex R1 -en, következik, hogy a
megfelelő valószínűségeloszlás kvázikonkáv.

Ennek az eloszlásnak egy többváltozós általánosítása a következő:


m
!−1 m !−(a+m)
Y X
f(x) = a(a + 1) · · · (a + m − 1) θj θ−1
j xj − m + 1 ,
j=1 j=1

7
ha xj > θj , j = 1, . . . , m és f(x) = 0 különben, ahol θ1 , . . . , θm és a pozitív állandók.
1
Mivel f− m konvex az Rm tér fölött, a megfelelő valószínűségeloszlás kvázikonkáv.

You might also like