Eload 5

Alkalmazott matematikus MSc
Operációkutatás szakirány
Sztochasztikus programozás, BMETE93MM05
5. Előadás
A konvex függvények általánosításai, II.
Definiáljuk a szigorúan pszeudokonkáv függvény fogalmát és megmutatjuk, hogy a

szigorúan pszeudokonkávitásból következik az erősen kvázikonkávitás, vagyis szigorúan
pszeudokonkáv függvényekre is igaz a velük felépített optimalizálási feladatok szempont-
jából fontos állítás, hogy konvex halmaz fölött a lokális maximum pontjuk egyúttal
egyedüli globális maximumpont is.
1. Definíció: Legyen f : C → R, folytonosan differenciálható függvény az Rn tér egy C

nemüres, nyílt, konvex halmazán. Azt mondjuk, hogy az f függvény szigorúan pszeudo-
konkáv, ha minden egymástól különböző x ∈ C-re és y ∈ C-re
∇f(x)(y − x) ≤ 0 esetén f(y) < f(x).
Az f függvényt szigorúan pszeudokonvexnek nevezzük, ha −f szigorúan pszeudokonkáv.
Más szavakkal ez a definíció azt is jelenti, hogy ha egymástól különböző x ∈ C-re és

y ∈ C-re f(y) ≥ f(x), akkor ∇f(x)(y − x) > 0.
1. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen az f : C → R

függvény C fölött differenciálható és szigorúan pszeudokonkáv. Ekkor f erősen kvázikon-
káv.
1
Bizonyítás: Tegyük fel indirekt módon, hogy léteznek egymástól különböző x, y ∈ C
pontok és λ ∈ (0, 1), hogy f(xλ ) ≤ min{f(x), f(y)}, ahol xλ = λx + (1 − λ)y. Mivel
f(x) ≥ f(xλ ), azért f szigorú pszeudokokonkávitása miatt ∇f(xλ )(x − xλ ) > 0. Ezért
0 < ∇f(xλ )(x − xλ )

= ∇f(xλ ) [x − λx − (1 − λ)y]
= ∇f(xλ ) [(1 − λ)(x − y)]
= (1 − λ)∇f(xλ )(x − y)
és így a pozitív (1 − λ)-val osztva:
∇f(xλ )(x − y) > 0. (1)
Hasonlóan, mivel f(y) ≥ f(xλ ), azért f szigorú pszeudokokonkávitása miatt ∇f(xλ )(y −
xλ ) > 0. Ezért
0 < ∇f(xλ )(y − xλ )
= ∇f(xλ ) [y − λx − (1 − λ)y]
= ∇f(xλ ) [λ(y − x)]
= λ∇f(xλ )(y − x)
és így a pozitív λ-val osztva:
∇f(xλ )(y − x) > 0. (2)
Az (1) és a (2) egyenlőtlenségek egymásnak ellentmondanak, ezért az f függvénynek

szigorúan kvázikonkávnak kell lenni.

Az egyes általánosított konkávitási tulajdonságok közti kapcsolati rendszert a követ-

kező ábra szemlélteti.
Asztochasztikus programozási modellekből származtatott nemlineáris programozási

feladatok szempontjából tehát összefoglalva azt szeretjük, ha a maximalizálandó feladat
nemlineáris célfüggvénye pszeudokonkáv, a nemlineáris függvényekre vonatkozó nagyobb
vagy egyenlő típusú feltételekkel előírt korlátokban pedig a függvények kvázikonkávak.
Ekkor ugyanis
• A megengedett megoldások halmaza konvex.
2
szigorú konkávitás konkávitás
differenciálható esetben differenciálható esetben
szigorú pszeudokonkávitás pszeudo konkávitás
er sen kvázikonkávitás szigorú kvázikonkávitás
fels szemi folytonosság

esetén
kvázikonkávitás
1. ábra. Az általánosított konkávitási tulajdonságok közti kapcsolati rendszer
• Az összes lokális optimum pont egyúttal globális optimum pont is.
• A Kuhn-Tucker optimalitási feltételek nem csak szükségesek, hanem elégségesek is.
Fontos, hogy a maximalizálandó célfüggvényben szereplő nemlineáris függvény psze-

udokonkáv legyen, ha ugyanis csak a kvázikonkávitást követelnénk meg, az általában
nemkonvex optimalizálási feladatra vezetne, mikoris lehetnének olyan lokális optimum
pontok, amelyek nem globális optimum pontok.
Azt is meg kell jegyezni, hogy bár a kvázikonkáv függvényekre vonatkozó nagyobb
vagy egyenlő típusú feltételek konvex halmazt definiálnak, a megoldó algoritmusok szem-
szögéből mégis kívánatosabb ezekre a nemlineáris függvényekre is megkövetelni a psze-
udokonkávitást, mert ekkor például a Slater-regularitást elég kikötni a Kuhn-Tucker
optimalitási feltételek szükségességéhez. Ez pedig sokkal könnyebben ellenőrizhető, mint
a különben szükséges Kuhn-Tucker regularitási feltétel.
A továbbiakban két függvény hányadosának a pszeudokonkávitására mondunk ki egy

hasznos tételt.
3
2. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen az f és g két
szigorúan pozitív függvény a C fölött. Tegyük fel, hogy mindkét függvény folytonosan
differenciálható. Ha még f konkáv és g konvex, akkor
f(x)
h(x) =
g(x)
pszeudokonkáv C fölött.
Bizonyítás: Legyen x ∈ C és y ∈ C, és tegyük fel, hogy ∇h(x)(y − x) ≤ 0 teljesül.

Ebből egyszerű számolással következik:
g(x)∇f(x)(y − x) − f(x)∇g(x)(y − x) ≤ 0.
Felhasználva f konkávitását, g konvexitását és f és g pozitivitását, azt kapjuk, hogy
f(y) − f(x) ≤ ∇f(x)(y − x)

g(y) − g(x) ≥ ∇g(x)(y − x)
g(x)[f(y) − f(x)] ≤ g(x)[∇f(x)(y − x)]
−f(x)[g(y) − g(x)] ≤ −f(x)[∇g(x)(y − x)]
g(x)(f(y) − f(x)) − f(x)(g(y) − g(x))
≤ g(x)∇f(x)(y − x) − f(x)∇g(x)(y − x) ≤ 0,
azaz
g(x)f(y) − g(x)f(x) − f(x)g(y) + f(x)g(x) ≤ 0
és így
g(x)f(y) − f(x)g(y) ≤ 0,
Ebből pedig g(x)g(y) > 0-lal osztás után következik, hogy h(y) − h(x) ≤ 0, azaz
h(y) ≤ h(x).

Hasznos a pszeudokonkáv függvények transzformáltjára vonatkozó következő állítás

is.
3. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen g folytonosan

differenciálható pszeudokonkáv, vagy pszeudokonvex függvény a C fölött. Legyen f : R →
4
R folytonosan differenciálható, szigorúan monoton növekedő függvény, melyre f′ (x) 6= 0
minden x ∈ R esetén. Ekkor h(x) = f(g(x)) pszeudokonkáv, vagy pszeudokonvex C
fölött.
Bizonyítás: A h gradiensére nyilvánvalóan igaz, hogy ∇h(x) = f′ (g(x))∇g(x). Te-

gyük fel például, hogy g pszeudokonkáv, a pszeudokonvex esetre ugyanúgy történhet a
bizonyítás. Legyen x ∈ C, y ∈ C és ∇h(x)(y − x) ≤ 0. Ebből, a feltevéseinket felhasz-
nálva azt kapjuk, hogy ∇g(x)(y − x) ≤ 0. g pszeudokonkávitása miatt g(y) ≤ g(x) és
végül f monotonitása azt eredményezi, hogy h(y) ≤ h(x) .

Gyakran fordul elő olyan nemlineáris programozási feladat, amelyben a célfüggvény

egy lineáris és egy pszeudokonkáv függvény összege. Sajnos azonban az ilyen
összegfüggvény nem lesz szükségképpen pszeudokonkáv, azaz az ilyen nemlineáris
programozási feladatok nem feltétlen rendelkeznek azzal a tulajdonsággal, hogy min-
den lokális optimum pont egyben globális optimum pont is lenne. Tekintsük például
az f1 (x) = −x és az f2 (x) = x + x3 függvényeket. Könnyen ellenőrizhető, hogy f2 (x)
pszeudokonkáv, míg f1 (x) nyilván lineáris, mégis az összegük, f1 (x) + f2 (x) = x3 nem
pszeudokonkáv. Kétváltozós példaként legyen f(x1 , x2 ) = x1 + x31 + x2 + x32 . Ez a függ-
vény nyilvánvalóan két pszeudokonkáv függvény összege, ő maga mégsem pszeudokonkáv,
amint az akár a grafikonjából, akár a szintvonal seregéből könnyen látható:
-2
-4
-4 -2 0 2 4
2. ábra. Az f(x1 , x2 ) = x1 + x31 + x2 + x32 függvény grafikonja és szintvonalai
További fontos általánosított konkávitási tulajdonság a logaritmikusan konkávitás

(logkonkávitás).
5
2. Definíció: Legyen f : C → R nemnegatív függvény az Rn tér egy C nemüres, konvex
halmazán.
• Azt mondjuk, hogy az f függvény logkonkáv, ha az
f(λx + (1 − λ)y) ≥ [f(x)]λ [f(y)]1−λ
egyenlőtlenség teljesül minden x ∈ C, y ∈ C-re és λ ∈ (0, 1) valós számra.
• Az f függvényt logkonvexnek nevezzük, ha a fenti egyenlőtlenség ellenkező irányban

teljesül.
Megjegyezzük, hogy ha a logkonkáv f függvény szigorúan pozitív a C nemüres, konvex

halmaz fölött, akkor tudjuk a definícióban szereplő egyenlőtlenség logaritmusát venni,
mikoris azt kapjuk, hogy
log f(λx + (1 − λ)y) ≥ λ log f(x) + (1 − λ) log f(y),
vagyis az f függvény logkonkávitása éppen a függvény logaritmusának a konkávitását

jelenti.
Ennek az észrevételnek a segítségével könnyen igazolható a következő állítás:
4. Tétel: Legyen C az Rn egy nemüres, konvex halmaza és legyenek az fi , i = 1, . . . , n

Q
függvények szigorúan pozitívak és logkonkávok C fölött. Ekkor f(x) = ni=1 fi (x) szintén
logkonkáv függvény C fölött.
Pn
Bizonyítás: Az állítás abból következik, hogy log f(x) = i=1 log fi (x) és hogy konkáv
függvények összege szintén konkáv.

A logkonkáv függvények egy további fontos tulajdonsága a következő.
5. Tétel: Legyen f logkonkáv függvény Rn -en. Ekkor g(x) = f(x + y) is logkonkáv

függvény Rn -en bármely rögzített y) ∈ Rn -re. Továbbá, h(x, y) = f(x + y) is logkonkáv
függvény R2n -en.
6
Bizonyítás: Mivel tetszőleges u, v ∈ Rn és 0 < λ < 1 esetén g(λu + (1 − λ)v) =
f(λ(u + y) + (1 − λ)(v + y)), azért az első állítás azonal következik. A logkonkávitás
definíciójából hasonlóan könnyen következik a második állítás.

Differenciálható esetben a szigorúan pozitív logkonkáv függvények a pszeudokonkáv

függvények osztályának egy részhalmazát alkotják:
6. Tétel: Legyen f folytonosan differenciálható, szigorúan pozitív, logkonkáv függvény

Rn egy C nyílt, konvex halmazán. Ekkor f pszeudokonkáv C fölött.
Bizonyítás: Legyen x, y ∈ C és λ ∈ [0, 1] és tegyük fel, hogy ∇f(x)(y − x) ≤ 0

1
teljesül. Ekkor ∇ log f(x)(y − x) = f(x)
∇f(x)(y − x) ≤ 0 szintén teljesül. Mivel pedig
logf(x) konkáv függvény, azért pszeudokonkáv is, ami miatt logf(y) ≤ logf(x), amiből
a logaritmus függvény szigorúan monoton növekedése miatt f(y) ≤ f(x) is és ez igazolja
az állításunkat.

Végül a sztochasztikus optimalizálási modellből származtatott nemlineáris programo-

zási feladatok egy szokásos átalakításának a veszélyeire hívjuk fel a figyelmet. Legyen a
sztochasztikus modellből közvetlenül származtatott nemlineáris programozási feladat a
következő:
max c′ x + f(x)
feltéve, hogy
x ∈ C,
ahol C az Rn tér egy nemüres, konvex halmaza. Gyakori az, hogy ehelyett a nemlineáris
programozási feladat helyett az alábbi, vele ekvivalens feladatot akarjuk megoldani:
max c′ x + z
feltéve, hogy
f(x) − z ≥ 0
x ∈ C.
Ha f konkáv függvény, akkor a fenti feladat nyilvánvalóan konvex programozási fel-

adat. Ha azonban f csak pszeudokonkáv, ez már nem feltétlen igaz. Például az
7
f(x) = x + x3 pszeudokonkáv függvény esetén könnyen ellenőrizhető, hogy x + x3 − z
nem kvázikonkáv függvény, ezért a fenti nemlineáris programozási feladat megengedett
megoldásainak a halmaza nem konvex! Az erősebb logkonkávitási tulajdonság megköve-
telése sem segít a helyzeten, hiszen ekkor tekinthetjük például az f(x) = ex függvényt,
amely nyilvánvalóan logkonkáv. Ugyanakkor ex − z egy nemlineáris, konvex függvény és
így az {(x, z)|ex − z ≥ 0} halmaz nem konvex!

Eload 5

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Eload 5

Uploaded by

Copyright:

Available Formats

Alkalmazott matematikus MSc

A konvex függvények általánosításai, II.

Deﬁniáljuk a szigorúan pszeudokonkáv függvény fogalmát és megmutatjuk, hogy a

1. Definíció: Legyen f : C → R, folytonosan diﬀerenciálható függvény az Rn tér egy C

∇f(x)(y − x) ≤ 0 esetén f(y) < f(x).

Az f függvényt szigorúan pszeudokonvexnek nevezzük, ha −f szigorúan pszeudokonkáv.

Más szavakkal ez a deﬁníció azt is jelenti, hogy ha egymástól különböző x ∈ C-re és

1. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen az f : C → R

0 < ∇f(xλ )(x − xλ )

és így a pozitív (1 − λ)-val osztva:

∇f(xλ )(x − y) > 0. (1)

Az (1) és a (2) egyenlőtlenségek egymásnak ellentmondanak, ezért az f függvénynek

Az egyes általánosított konkávitási tulajdonságok közti kapcsolati rendszert a követ-

Asztochasztikus programozási modellekből származtatott nemlineáris programozási

• A megengedett megoldások halmaza konvex.

differenciálható esetben differenciálható esetben

szigorú pszeudokonkávitás pszeudo konkávitás

er sen kvázikonkávitás szigorú kvázikonkávitás

fels szemi folytonosság

1. ábra. Az általánosított konkávitási tulajdonságok közti kapcsolati rendszer

• Az összes lokális optimum pont egyúttal globális optimum pont is.

• A Kuhn-Tucker optimalitási feltételek nem csak szükségesek, hanem elégségesek is.

Fontos, hogy a maximalizálandó célfüggvényben szereplő nemlineáris függvény psze-

A továbbiakban két függvény hányadosának a pszeudokonkávitására mondunk ki egy

Bizonyítás: Legyen x ∈ C és y ∈ C, és tegyük fel, hogy ∇h(x)(y − x) ≤ 0 teljesül.

Felhasználva f konkávitását, g konvexitását és f és g pozitivitását, azt kapjuk, hogy

f(y) − f(x) ≤ ∇f(x)(y − x)

Hasznos a pszeudokonkáv függvények transzformáltjára vonatkozó következő állítás

3. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen g folytonosan

Bizonyítás: A h gradiensére nyilvánvalóan igaz, hogy ∇h(x) = f′ (g(x))∇g(x). Te-

Gyakran fordul elő olyan nemlineáris programozási feladat, amelyben a célfüggvény

2. ábra. Az f(x1 , x2 ) = x1 + x31 + x2 + x32 függvény graﬁkonja és szintvonalai

További fontos általánosított konkávitási tulajdonság a logaritmikusan konkávitás

• Azt mondjuk, hogy az f függvény logkonkáv, ha az

f(λx + (1 − λ)y) ≥ [f(x)]λ [f(y)]1−λ

egyenlőtlenség teljesül minden x ∈ C, y ∈ C-re és λ ∈ (0, 1) valós számra.

• Az f függvényt logkonvexnek nevezzük, ha a fenti egyenlőtlenség ellenkező irányban

Megjegyezzük, hogy ha a logkonkáv f függvény szigorúan pozitív a C nemüres, konvex

log f(λx + (1 − λ)y) ≥ λ log f(x) + (1 − λ) log f(y),

vagyis az f függvény logkonkávitása éppen a függvény logaritmusának a konkávitását

Ennek az észrevételnek a segítségével könnyen igazolható a következő állítás:

4. Tétel: Legyen C az Rn egy nemüres, konvex halmaza és legyenek az fi , i = 1, . . . , n

A logkonkáv függvények egy további fontos tulajdonsága a következő.

5. Tétel: Legyen f logkonkáv függvény Rn -en. Ekkor g(x) = f(x + y) is logkonkáv

Diﬀerenciálható esetben a szigorúan pozitív logkonkáv függvények a pszeudokonkáv

6. Tétel: Legyen f folytonosan diﬀerenciálható, szigorúan pozitív, logkonkáv függvény

Bizonyítás: Legyen x, y ∈ C és λ ∈ [0, 1] és tegyük fel, hogy ∇f(x)(y − x) ≤ 0

Végül a sztochasztikus optimalizálási modellből származtatott nemlineáris programo-

Ha f konkáv függvény, akkor a fenti feladat nyilvánvalóan konvex programozási fel-

You might also like