You are on page 1of 8

Alkalmazott matematikus MSc

Operációkutatás szakirány
Sztochasztikus programozás, BMETE93MM05

5. Előadás

A konvex függvények általánosításai, II.

Definiáljuk a szigorúan pszeudokonkáv függvény fogalmát és megmutatjuk, hogy a


szigorúan pszeudokonkávitásból következik az erősen kvázikonkávitás, vagyis szigorúan
pszeudokonkáv függvényekre is igaz a velük felépített optimalizálási feladatok szempont-
jából fontos állítás, hogy konvex halmaz fölött a lokális maximum pontjuk egyúttal
egyedüli globális maximumpont is.

1. Definíció: Legyen f : C → R, folytonosan differenciálható függvény az Rn tér egy C


nemüres, nyílt, konvex halmazán. Azt mondjuk, hogy az f függvény szigorúan pszeudo-
konkáv, ha minden egymástól különböző x ∈ C-re és y ∈ C-re

∇f(x)(y − x) ≤ 0 esetén f(y) < f(x).

Az f függvényt szigorúan pszeudokonvexnek nevezzük, ha −f szigorúan pszeudokonkáv.

Más szavakkal ez a definíció azt is jelenti, hogy ha egymástól különböző x ∈ C-re és


y ∈ C-re f(y) ≥ f(x), akkor ∇f(x)(y − x) > 0.

1. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen az f : C → R


függvény C fölött differenciálható és szigorúan pszeudokonkáv. Ekkor f erősen kvázikon-
káv.

1
Bizonyítás: Tegyük fel indirekt módon, hogy léteznek egymástól különböző x, y ∈ C
pontok és λ ∈ (0, 1), hogy f(xλ ) ≤ min{f(x), f(y)}, ahol xλ = λx + (1 − λ)y. Mivel
f(x) ≥ f(xλ ), azért f szigorú pszeudokokonkávitása miatt ∇f(xλ )(x − xλ ) > 0. Ezért

0 < ∇f(xλ )(x − xλ )


= ∇f(xλ ) [x − λx − (1 − λ)y]
= ∇f(xλ ) [(1 − λ)(x − y)]
= (1 − λ)∇f(xλ )(x − y)

és így a pozitív (1 − λ)-val osztva:

∇f(xλ )(x − y) > 0. (1)

Hasonlóan, mivel f(y) ≥ f(xλ ), azért f szigorú pszeudokokonkávitása miatt ∇f(xλ )(y −
xλ ) > 0. Ezért
0 < ∇f(xλ )(y − xλ )
= ∇f(xλ ) [y − λx − (1 − λ)y]
= ∇f(xλ ) [λ(y − x)]
= λ∇f(xλ )(y − x)
és így a pozitív λ-val osztva:
∇f(xλ )(y − x) > 0. (2)

Az (1) és a (2) egyenlőtlenségek egymásnak ellentmondanak, ezért az f függvénynek


szigorúan kvázikonkávnak kell lenni.


Az egyes általánosított konkávitási tulajdonságok közti kapcsolati rendszert a követ-


kező ábra szemlélteti.

Asztochasztikus programozási modellekből származtatott nemlineáris programozási


feladatok szempontjából tehát összefoglalva azt szeretjük, ha a maximalizálandó feladat
nemlineáris célfüggvénye pszeudokonkáv, a nemlineáris függvényekre vonatkozó nagyobb
vagy egyenlő típusú feltételekkel előírt korlátokban pedig a függvények kvázikonkávak.
Ekkor ugyanis

• A megengedett megoldások halmaza konvex.

2
szigorú konkávitás konkávitás

differenciálható esetben differenciálható esetben

szigorú pszeudokonkávitás pszeudo konkávitás

er sen kvázikonkávitás szigorú kvázikonkávitás

fels szemi folytonosság


esetén

kvázikonkávitás

1. ábra. Az általánosított konkávitási tulajdonságok közti kapcsolati rendszer

• Az összes lokális optimum pont egyúttal globális optimum pont is.

• A Kuhn-Tucker optimalitási feltételek nem csak szükségesek, hanem elégségesek is.

Fontos, hogy a maximalizálandó célfüggvényben szereplő nemlineáris függvény psze-


udokonkáv legyen, ha ugyanis csak a kvázikonkávitást követelnénk meg, az általában
nemkonvex optimalizálási feladatra vezetne, mikoris lehetnének olyan lokális optimum
pontok, amelyek nem globális optimum pontok.

Azt is meg kell jegyezni, hogy bár a kvázikonkáv függvényekre vonatkozó nagyobb
vagy egyenlő típusú feltételek konvex halmazt definiálnak, a megoldó algoritmusok szem-
szögéből mégis kívánatosabb ezekre a nemlineáris függvényekre is megkövetelni a psze-
udokonkávitást, mert ekkor például a Slater-regularitást elég kikötni a Kuhn-Tucker
optimalitási feltételek szükségességéhez. Ez pedig sokkal könnyebben ellenőrizhető, mint
a különben szükséges Kuhn-Tucker regularitási feltétel.

A továbbiakban két függvény hányadosának a pszeudokonkávitására mondunk ki egy


hasznos tételt.

3
2. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen az f és g két
szigorúan pozitív függvény a C fölött. Tegyük fel, hogy mindkét függvény folytonosan
differenciálható. Ha még f konkáv és g konvex, akkor

f(x)
h(x) =
g(x)

pszeudokonkáv C fölött.

Bizonyítás: Legyen x ∈ C és y ∈ C, és tegyük fel, hogy ∇h(x)(y − x) ≤ 0 teljesül.


Ebből egyszerű számolással következik:

g(x)∇f(x)(y − x) − f(x)∇g(x)(y − x) ≤ 0.

Felhasználva f konkávitását, g konvexitását és f és g pozitivitását, azt kapjuk, hogy

f(y) − f(x) ≤ ∇f(x)(y − x)


g(y) − g(x) ≥ ∇g(x)(y − x)
g(x)[f(y) − f(x)] ≤ g(x)[∇f(x)(y − x)]
−f(x)[g(y) − g(x)] ≤ −f(x)[∇g(x)(y − x)]
g(x)(f(y) − f(x)) − f(x)(g(y) − g(x))
≤ g(x)∇f(x)(y − x) − f(x)∇g(x)(y − x) ≤ 0,

azaz
g(x)f(y) − g(x)f(x) − f(x)g(y) + f(x)g(x) ≤ 0

és így
g(x)f(y) − f(x)g(y) ≤ 0,

Ebből pedig g(x)g(y) > 0-lal osztás után következik, hogy h(y) − h(x) ≤ 0, azaz
h(y) ≤ h(x).


Hasznos a pszeudokonkáv függvények transzformáltjára vonatkozó következő állítás


is.

3. Tétel: Legyen C az Rn egy nemüres, nyílt, konvex halmaza és legyen g folytonosan


differenciálható pszeudokonkáv, vagy pszeudokonvex függvény a C fölött. Legyen f : R →

4
R folytonosan differenciálható, szigorúan monoton növekedő függvény, melyre f′ (x) 6= 0
minden x ∈ R esetén. Ekkor h(x) = f(g(x)) pszeudokonkáv, vagy pszeudokonvex C
fölött.

Bizonyítás: A h gradiensére nyilvánvalóan igaz, hogy ∇h(x) = f′ (g(x))∇g(x). Te-


gyük fel például, hogy g pszeudokonkáv, a pszeudokonvex esetre ugyanúgy történhet a
bizonyítás. Legyen x ∈ C, y ∈ C és ∇h(x)(y − x) ≤ 0. Ebből, a feltevéseinket felhasz-
nálva azt kapjuk, hogy ∇g(x)(y − x) ≤ 0. g pszeudokonkávitása miatt g(y) ≤ g(x) és
végül f monotonitása azt eredményezi, hogy h(y) ≤ h(x) .


Gyakran fordul elő olyan nemlineáris programozási feladat, amelyben a célfüggvény


egy lineáris és egy pszeudokonkáv függvény összege. Sajnos azonban az ilyen
összegfüggvény nem lesz szükségképpen pszeudokonkáv, azaz az ilyen nemlineáris
programozási feladatok nem feltétlen rendelkeznek azzal a tulajdonsággal, hogy min-
den lokális optimum pont egyben globális optimum pont is lenne. Tekintsük például
az f1 (x) = −x és az f2 (x) = x + x3 függvényeket. Könnyen ellenőrizhető, hogy f2 (x)
pszeudokonkáv, míg f1 (x) nyilván lineáris, mégis az összegük, f1 (x) + f2 (x) = x3 nem
pszeudokonkáv. Kétváltozós példaként legyen f(x1 , x2 ) = x1 + x31 + x2 + x32 . Ez a függ-
vény nyilvánvalóan két pszeudokonkáv függvény összege, ő maga mégsem pszeudokonkáv,
amint az akár a grafikonjából, akár a szintvonal seregéből könnyen látható:

-2

-4
-4 -2 0 2 4

2. ábra. Az f(x1 , x2 ) = x1 + x31 + x2 + x32 függvény grafikonja és szintvonalai

További fontos általánosított konkávitási tulajdonság a logaritmikusan konkávitás


(logkonkávitás).

5
2. Definíció: Legyen f : C → R nemnegatív függvény az Rn tér egy C nemüres, konvex
halmazán.

• Azt mondjuk, hogy az f függvény logkonkáv, ha az

f(λx + (1 − λ)y) ≥ [f(x)]λ [f(y)]1−λ

egyenlőtlenség teljesül minden x ∈ C, y ∈ C-re és λ ∈ (0, 1) valós számra.

• Az f függvényt logkonvexnek nevezzük, ha a fenti egyenlőtlenség ellenkező irányban


teljesül.

Megjegyezzük, hogy ha a logkonkáv f függvény szigorúan pozitív a C nemüres, konvex


halmaz fölött, akkor tudjuk a definícióban szereplő egyenlőtlenség logaritmusát venni,
mikoris azt kapjuk, hogy

log f(λx + (1 − λ)y) ≥ λ log f(x) + (1 − λ) log f(y),

vagyis az f függvény logkonkávitása éppen a függvény logaritmusának a konkávitását


jelenti.

Ennek az észrevételnek a segítségével könnyen igazolható a következő állítás:

4. Tétel: Legyen C az Rn egy nemüres, konvex halmaza és legyenek az fi , i = 1, . . . , n


Q
függvények szigorúan pozitívak és logkonkávok C fölött. Ekkor f(x) = ni=1 fi (x) szintén
logkonkáv függvény C fölött.

Pn
Bizonyítás: Az állítás abból következik, hogy log f(x) = i=1 log fi (x) és hogy konkáv
függvények összege szintén konkáv.


A logkonkáv függvények egy további fontos tulajdonsága a következő.

5. Tétel: Legyen f logkonkáv függvény Rn -en. Ekkor g(x) = f(x + y) is logkonkáv


függvény Rn -en bármely rögzített y) ∈ Rn -re. Továbbá, h(x, y) = f(x + y) is logkonkáv
függvény R2n -en.

6
Bizonyítás: Mivel tetszőleges u, v ∈ Rn és 0 < λ < 1 esetén g(λu + (1 − λ)v) =
f(λ(u + y) + (1 − λ)(v + y)), azért az első állítás azonal következik. A logkonkávitás
definíciójából hasonlóan könnyen következik a második állítás.


Differenciálható esetben a szigorúan pozitív logkonkáv függvények a pszeudokonkáv


függvények osztályának egy részhalmazát alkotják:

6. Tétel: Legyen f folytonosan differenciálható, szigorúan pozitív, logkonkáv függvény


Rn egy C nyílt, konvex halmazán. Ekkor f pszeudokonkáv C fölött.

Bizonyítás: Legyen x, y ∈ C és λ ∈ [0, 1] és tegyük fel, hogy ∇f(x)(y − x) ≤ 0


1
teljesül. Ekkor ∇ log f(x)(y − x) = f(x)
∇f(x)(y − x) ≤ 0 szintén teljesül. Mivel pedig
logf(x) konkáv függvény, azért pszeudokonkáv is, ami miatt logf(y) ≤ logf(x), amiből
a logaritmus függvény szigorúan monoton növekedése miatt f(y) ≤ f(x) is és ez igazolja
az állításunkat.


Végül a sztochasztikus optimalizálási modellből származtatott nemlineáris programo-


zási feladatok egy szokásos átalakításának a veszélyeire hívjuk fel a figyelmet. Legyen a
sztochasztikus modellből közvetlenül származtatott nemlineáris programozási feladat a
következő:
max c′ x + f(x)
feltéve, hogy
x ∈ C,
ahol C az Rn tér egy nemüres, konvex halmaza. Gyakori az, hogy ehelyett a nemlineáris
programozási feladat helyett az alábbi, vele ekvivalens feladatot akarjuk megoldani:

max c′ x + z
feltéve, hogy
f(x) − z ≥ 0
x ∈ C.

Ha f konkáv függvény, akkor a fenti feladat nyilvánvalóan konvex programozási fel-


adat. Ha azonban f csak pszeudokonkáv, ez már nem feltétlen igaz. Például az

7
f(x) = x + x3 pszeudokonkáv függvény esetén könnyen ellenőrizhető, hogy x + x3 − z
nem kvázikonkáv függvény, ezért a fenti nemlineáris programozási feladat megengedett
megoldásainak a halmaza nem konvex! Az erősebb logkonkávitási tulajdonság megköve-
telése sem segít a helyzeten, hiszen ekkor tekinthetjük például az f(x) = ex függvényt,
amely nyilvánvalóan logkonkáv. Ugyanakkor ex − z egy nemlineáris, konvex függvény és
így az {(x, z)|ex − z ≥ 0} halmaz nem konvex!

You might also like