You are on page 1of 49

Deriválás normált terekben

1 Folytonos lineáris operátorok


Definı́ció 1 Ha X egy K fölötti vektortér (K mindig vagy R vagy C), akkor egy
k·k : X → R+ függvényt (K fölötti) normának mondunk, ha minden x, y ∈ X és
α ∈ K esetén
1.
kxk = 0 =⇒ x = 0X ;
2.
kα · xk = |α| · kxk ;
3.
kx + yk ≤ kxk + kyk .

Ekkor azt is mondjuk, hogy (X, k·k) normált tér K fölött.


Megjegyzés 2 Ha (X, k·k) normált tér C fölött, akkor természetes módon valós
normált tér is (tehát minden komplex norma egyúttal valós norma is), hiszen R ⊆ C.
A továbbiakban tetszőleges K fölötti (X, k·k) normált térben jelölje
BX := {x ∈ X : kxk ≤ 1} = B (0X , 1) .
A BX halmazt az (X, k·k) normált tér zárt egységgömbjének mondjuk. Azonnal
látható, hogy bármely x ∈ X és r > 0 esetén az x-től legfeljebb r távolságra levő
vektorok halmaza
B (x, r) = x + r · B ,
amelyet az x közepű r sugarú k·k-gömbnek is nevezünk.
A továbbiakban legyenek (X, k·k1 ) és (Y, k·k2 ) normált terek K fölött. Mivel az X
és Y tereknek egyaránt van vektortér- és metrikus struktúrájuk, kézenfekvő vizsgálni
azt az esetet, mikor egy A : X → Y leképezés egyidejűleg folytonos és lineáris.
Például az R → R lineáris leképezések (számmal való szorzások) folytonosak.
Definı́ció 3 Egy f : X → Y függvény folytonos egy x ∈ X pontban, ha ∀ε > 0
számhoz ∃δ > 0 szám, hogy bármely y ∈ X, ky − xk1 ≤ δ esetén kf (y) − f (x)k2 ≤
ε. Másképpen fogalmazva: f folytonos x-ben, ha ∀ε > 0 számhoz ∃δ > 0 szám, hogy
bármely y ∈ x + δ · BX esetén f (y) ∈ f (x) + ε · BY . Ha f minden x ∈ X pontban
folytonos, akkor folytonos függvény.
Hasonlóan: egy X-beli (xk ) sorozat konvergál egy x ∈ X vektorhoz, ha lim kxk − xk =
k→+∞
0. Egy (xk ) ⊆ X sorozat korlátos, ha a (kxk k) valós sorozat korlátos. Egy (xk ) ⊆ X
sorozat pedig Cauchy-sorozat, ha ∀ε > 0 számhoz ∃N ∈ N küszöbindex, hogy
bármely k, ` ≥ N indexekre kxk − x` k ≤ ε.
Egy normált térben általában nem esnek egybe a Cauchy-sorozatok és a kon-
vergens sorozatok. (R, |·|)-ben tudjuk, hogy igen. Amely normált térben ez az
egybeesés fennáll, azt Banach-tér nek szokás nevezni.
Mostantól fogva – elkerülendő a jelölésekből adódó félreértéseket – az X-ről Y -ba
menő összes lineáris leképezés halmazát Hom (X, Y )-nal jelöljük, mı́g az L (X, Y )
jelölést azon lineáris leképezések halmazára tartjuk fönn, amelyek folytonosak is.

1
Definı́ció 4 Jelölje

L (X, Y ) := {A ∈ Hom (X, Y ) : A folytonos }

az X → Y folytonos lineáris operátorok halmaza. Speciálisan

X ∗ := L (X, K)

az X-en értelmezett folytonos lineáris funkcionálok összesége. X ∗ -ot az (X, k·k1 )


normált tér topológiai duálisának mondjuk.

Tétel 5 Legyen A ∈ Hom (X, Y ) . Ekkor a következők ekvivalensek:

1. A ∈ L (X, Y ) , azaz A folytonos;

2. A folytonos a 0X pontban;

3. létezik α ≥ 0, hogy minden x ∈ X esetén

kAxk2 ≤ α · kxk2 .

Bizonyı́tás: 1. ⇒ 2. triviális.
2. ⇒ 3.: az A 0X -beli folytonossága miatt az ε = 1 számhoz van olyan δ > 0,
hogy minden x ∈ X, kxk1 = kx − 0X k1 ≤ δ esetén

kAxk2 = kAx − 0Y k2 = kAx − A0X k2 ≤ 1.

Jelölje α := 1δ . Ekkor minden x ∈ X, x 6= 0X esetén


° °
δ ° δ °
· x ∈ X, ° · x ° = δ · kxk = δ,
kxk1 ° kxk1 °1 kxk1 1

ahonnan ° ° ° µ ¶°
δ ° δ ° ° δ °
· kAxk2 = °
° · Ax°
° =°
° A ·x °
° ≤ 1,
kxk1 kxk1 2
kxk1 2
tehát
kxk1
kAxk2 ≤ = α · kxk1
δ
minden x ∈ X, x 6= 0X esetén. Ez utóbbi egyenlőtlenség viszont triviálisan x = 0X
esetén is fennáll.
3. ⇒ 1.: tegyük föl, hogy 3. teljesül egy alkalmas α ≥ 0 számmal. Ekkor
ε ε
tetszőleges x ∈ X és ε > 0 esetén minden y ∈ x + α+1 · B számra ky − xk1 ≤ α+1 ,
innen
ε
kAy − Axk2 = kA (y − x)k2 ≤ α · ky − xk1 ≤ α · < ε,
α+1
tehát azt mutattuk meg, hogy
ε
y ∈x+ · BX =⇒ kAy − Axk2 < ε,
α+1
ami éppen azt jelenti, hogy A folytonos. ¤

Következmény 6 A ∈ L (X, Y ) esetén

{kAxk2 : x ∈ X, kxk1 ≤ 1} ⊆ R

korlátos halmaz.

2
Definı́ció 7 Jelölje A ∈ L (X, Y ) esetén

kAk := sup {kAxk2 : x ∈ X, kxk1 ≤ 1} = sup kAxk2


x∈X, kxk1 ≤1

az A ∈ L (X, Y ) leképezés operátornormája (még nem tudjuk, hogy valóban norma!).

Állı́tás 8 Legyen A ∈ L (X, Y ) . Ekkor minden x ∈ X vektorra

kAxk2 ≤ kAk · kxk1 .

Bizonyı́tás: kAk definı́ciója alapján minden x ∈ X, kxk1 ≤ 1 esetén

kAxk2 ≤ kAk .

Legyen most x ∈ X, x 6= 0X , ekkor


° °
° 1 ° 1
° °
° kxk · x° = kxk · kxk1 = 1,
1 1 1

innen ° ° ° µ ¶°
1 ° 1 ° ° 1 °
°
· kAxk2 = ° ° °
· Ax° = °A ·x °
kxk1 kxk1 kxk1 ° ≤ kAk ,
2 2
ahonnan
kAxk2 ≤ kAk · kxk1 ,
és ez utóbbi egyenlőtlenség triviálisan x = 0X esetén is fennáll. ¤

Állı́tás 9 Ha A ∈ Hom (X, Y ) és α ≥ 0, melyekre minden x ∈ X esetén

kAxk2 ≤ α · kxk1 ,

akkor A ∈ L (X, Y ) és


kAk ≤ α.
Ha mindezeken felül van egy x0 ∈ X, kx0 k1 = 1 tulajdonságú vektor, melyre

kAx0 k2 = α,

akkor kAk = α.

Bizonyı́tás: Ha minden x ∈ X esetén kAxk2 ≤ α · kxk1 , akkor egy fenti tétel


alapján A ∈ L (X, Y ) , továbbá

kAk = sup kAxk2 ≤ sup α · kxk1 ≤ α.


x∈X, kxk1 ≤1 x∈X, kxk1 ≤1

Az állı́tás második része kAk definı́ciója alapján nyilvánvaló. ¤

Következmény 10 Ha X, Y, Z normált terek K fölött és A ∈ L (X, Y ) ,


B ∈ L (Y, Z) , akkor B · A ∈ L (X, Z) , továbbá

kB · Ak ≤ kBk · kAk .

Bizonyı́tás: Tetszőleges x ∈ X-re k(B · A) xk = kB (Ax)k ≤


≤ kBk · kAxk ≤ (kBk · kAk) · kxk . Innen az állı́tás nyilvánvaló. ¤

3
Feladat .1 Mutassuk meg, hogy az [a, b] intervallumon értelmezett folytonos valós
függvények C [a, b] vektorterén a

kf kC := max |f (t)|
t∈[a,b]

egyenlőség normát definiál!

Rb
Példa 11 A (C [a, b] , k·kC ) normált téren értelmezett : C [a, b] → R lineáris
a
funkcionálra minden f ∈ C [a, b] esetén
¯ b ¯
¯Z ¯ Zb Zb
¯ ¯
¯ f ¯ ≤ |f | ≤ kf k = (b − a) · kf k ,
¯ ¯ C C
¯ ¯
a a a
° °
továbbá az id0 ∈ C [a, b] 1 értékű konstans függvényre °id0 °C = 1 és
¯ b ¯
¯Z ¯ Zb
¯ ¯
¯ id ¯ = 1 dt = b − a,
0
¯ ¯
¯ ¯
a a

tehát ° b°
Zb °Z °
° °
∈ C [a, b]∗ és ° °=b−a.
° °
° °
a a

Tétel 12 Legyenek (X, k·k1 ) és (Y, k·k2 ) normált terek K fölött. Ekkor
L (X, Y ) altere Hom (X, Y )-nak, továbbá a k·k : L (X, Y ) → R+ ,

kAk := sup kAxk2


x∈X, kxk1 ≤1

leképezés norma az L (X, Y ) vektortéren. Ha (Y, k·k2 ) Banach-tér, akkor (L (X, Y ) , k·k)
is Banach-tér.

Bizonyı́tás: Először három dolgot jegyzünk meg:

1. 0Hom(X,Y ) nyilván eleme L (X, Y )-nak. Ha pedig A ∈ L (X, Y ) olyan operátor,


amelyre kAk = 0, akkor minden x ∈ X-re kAxk2 ≤ kAk · kxk1 = 0 miatt A
azonosan 0Y .

2. Tetszőleges A ∈ L (X, Y ) és α ∈ K esetén minden x ∈ X-re

k(α · A) xk2 = kα · Axk2 = |α| · kAxk2 ≤ (|α| · kAk) · kxk1 ,

innen az egyik fenti állı́tás miatt α · A ∈ L (X, Y ) és


1
kα · Ak ≤ |α| · kAk . Ha most α 6= 0, akkor a kapottakat az α
számra és az
α · A operátorra alkalmazva azt kapjuk, hogy
° °
°1 ° 1
kAk = ° °
° α · α · A° ≤ |α| · kα · Ak ,

ahonnan kα · Ak ≥ |α| · kAk , ezt pedig a fentiekkel összevetve kα · Ak =


|α| · kAk . Ez utóbbi egyenlőség persze α = 0 esetén is igaz.

4
3. k·k2 norma volta és az egyik fenti állı́tás miatt tetszőleges A, B ∈ L (X, Y )
esetén minden x ∈ X-re

k(A + B) xk2 = kAx + Bxk2 ≤ kAxk2 + kBxk2 ≤


≤ kAk · kxk1 + kBk · kxk1 = (kAk + kBk) · kxk1

alapján A + B ∈ L (X, Y ) és kA + Bk ≤ kAk + kBk .

A fentiek miatt L (X, Y ) triviálisan altere Hom (X, Y )-nak. Az 1., 2. és 3. pon-
tokból a k·k operátornormára vonatkozó három normaaxióma is azonnal leolvasható.
Tehát (L (X, Y ) , k·k) normált tér K fölött.
Tegyük most föl, hogy (Y, k·k2 ) Banach-tér. Legyen (An ) ⊆ L (X, Y ) k·k-Cauchy-
sorozat. Ekkor (An ) korlátos is, azaz létezik L ≥ 0 szám, hogy minden n ∈ N esetén

kAn k ≤ L .

Másrészt kAn x − Am xk2 = k(An − Am ) xk2 ≤ kAn − Am k · kxk1 alapján minden


rögzı́tett x ∈ X esetén (An x) egy k·k2 -Cauchy-sorozat. Mivel Y teljes, ezért minden
x ∈ X esetén (An x) konvergens sorozat Y -ban. Jelölje

A : X→Y ,
A (x) : = lim An x .
n→+∞

A normált térbeli sorozatok összegének és számszorosának konvergenciájára vonatkozó


tétel alapján azonnal adódik, hogy A lineáris. Továbbá minden x ∈ X esetén
kAn xk2 ≤ L · kxk1 miatt
° °
° °
°
kAxk2 = ° lim An x° ° = lim kAn xk2 ≤ L · kxk1 ,
n→+∞ n→+∞
2

tehát A ∈ L (X, Y ) . Legyen ε > 0. Mivel (An ) k·k-Cauchy-sorozat, ezért van olyan
N ∈ N küszöbindex, hogy minden m, n ≥ N esetén

kAn − Am k ≤ ε ,

következésképpen minden x ∈ X-re

kAn x − Am xk2 ≤ kAn − Am k · kxk1 ≤ ε · kxk1 .

Legyen n ≥ N rögzı́tett. Ekkor m → +∞ határátmenettel minden x ∈ X esetén a


fentiek miatt
° °
° °
k(An − A) xk2 = kAn x − Axk2 = ° °
° lim (An x − Am x)° = lim kAn x − Am xk2 ≤ ε·kxk1 ,
m→+∞ m→+∞
2

ami egy korábbi állı́tás alapján azt jelenti, hogy kAn − Ak ≤ ε minden n ≥ N
k·k
esetén. Ezzel megmutattuk, hogy An −→ A. Tehát (L (X, Y ) , k·k) Banach-tér K
fölött. ¤

1.1 Neumann-sorok
Az alábbiakban legyen X Banach-tér a K test fölött és A ∈ L (X) transzformáció.
Az alábbi állı́tás a mértani sorok összegére vonatkozó tétel általánosı́tása lineáris
transzformációkra.

5
P
Állı́tás 13 Ha kAk < 1, akkor az L (X)-beli Ak sor abszolút konvergens, továbbá
I − A-nak létezik L (X)-beli inverze és
+∞
X
−1
(I − A) = Ak .
k=0

Bizonyı́tás: A szorzatleképezés normájára vonatkozó becslés (kBAk °


≤ kBk
° ·
kAk) alapján teljes indukcióval azonnal adódik, hogy minden k ∈ N-re A ≤ ° k°
P
kAkk . Másrészt kAk <P1 miatt a kAkk mértani sor konvergens. Ezekből együtt
az következik, hogy aP Ak sor abszolút konvergens. Mivel L (X) a legutóbbi tétel
alapján teljes, ezért Ak konvergens is. Namost
n
X +∞
X
k
Sn := A és S := Ak
k=0 k=0

jelöléssel lim Sn = S, továbbá

k(I − A) · Sn − (I − A) · Sk = k(I − A) · (Sn − S)k ≤ kI − Ak · kSn − Sk → 0


P
alapján lim ((I − A) · Sn ) = (I − A) · S = (I − A) · +∞ k
k=0 A . Másrészt triviálisan

(I − A) · Sn = I − An+1 ,

ahonnan kAn+1 k ≤ kAkn+1 → 0 miatt

lim (I − A) · Sn = I .

Összevetve
+∞
X
(I − A) · Ak = I .
k=0
P+∞ k
Hasonlóan adódik, hogy k=0 A · (I − A) = I. Mindez éppen a bizonyı́tandó
egyenlőséget jelenti. ¤
A fenti állı́tás fontos szerepet játszik a matematikai közgazdaságtanban. Különösen
az a speciális eset, mikor X = Rn (és ı́gy L (X) természetes módon azonosul Rn×n -
nel). Ezen belül is fontos eset az, mikor az A ∈ Rn×n mátrix elemei nemnegatı́v
számok. Ekkor persze minden k-ra Ak elemei is nemnegatı́vak, ı́gy a sorösszeg elemei
is azok. A fenti állı́tás értelmében tehát ekkor (I − A)−1 nemnegatı́v elemű mátrix.
Az (I − A)−1 mátrixot egyébként a közgazdászok az A mátrix Leontyiev-inverzének
szokták nevezni. A most elmondottakat tehát a közgazdászok úgy szokták idézni,
hogy ha egy nemnegatı́v elemű A ∈ Rn×n mátrixra kAk < 1, akkor van nemnegatı́v
Leontyiev-inverze.

1.2 Véges dimenziós normált terek


A következőkben az Rn teret végig az
° °
° a(1) ° v
° ° uX
° a(2) ° u n
° ° 2
° .. ° := t (a(j) )
° . °
° ° j=1
° a(n) °
e

6
euklideszi normával tekintjük. A konvergens valós sorozatok négyzetére, összegére
és négyzetgyökére vonatkozó ismereteinkből azonnal adódik, hogy egy (xk ) ⊆ Rn
sorozat pontosan akkor konvergál egy x ∈ Rn vektorhoz, ha minden 1 ≤ j ≤ n
(j)
esetén xk konvergál x(j) -hez (midőn k → +∞), ugyanis
v
uX
u n ³ (j) ´2
kxk − xke = t xk − x(j) .
j=1

Innen az is triviális, hogy az (xk ) sorozat pontosan akkor korlátos, ha a komponensei


mint valós sorozatok korlátosak.
³ ´ ³ ´ ³ ´
(1) (2) (n)
Lemma 14 Legyen xk , xk , . . . , xk n darab korlátos valós sorozat. Ekkor
³ ´ ³ ´ ³ ´
(1) (2) (n)
van olyan (végtelen) k` indexsorozat, hogy az xk` , xk` , . . . , xkl (rész)sorozatok
mindegyike konvergens.

Bizonyı́tás: Az R-beli Bolzano-Weierstraß-tételből n-re vonatkozó teljes in-


dukcióval azonnal adódik. (Az n + 1-re vonatkozó lépés pl. az alábbi módon igazol-
ható: az első n darab sorozatra alkalmazzuk az indukciós feltevést; majd a kapott
indexsorozatra az n + 1-edik sorozatot is szűkı́tsük le. Ekkor van n darab konver-
gens és egy n + 1-edik korlátos sorozatunk. Alkalmazzuk ezen n + 1-edik sorozatra a
Bolzano-Weierstraß-tételt. Ezzel egy olyan indexsorozatot nyerünk, amely mentén
az n+1-edik sorozat is konvergens. Namost erre az indexsorozatra a már konvergens
első n darab sorozatot tovább szűkı́thetjük. Mivel konvergens sorozatok az index-
sorozat ritkı́tásával konvergensek maradnak, ezért a legutóbb kapott indexsorozat
mentén már mind az n + 1 darab sorozat konvergens lesz.) ¤

Következmény 15 Az (Rn , k·ke ) normált térben minden korlátos sorozatnak van


konvergens részsorozata.

Bizonyı́tás: A fenti lemmából következik az annakelőtte tett megállapı́tások


alapján. ¤
Ha az Olvasó korábbi tanulmányaiban nem szerepelt a kompakt halmaz fogalma,
akkor a továbbiakban egy X normált tér egy M részhalmazát kompaktnak nevezzük,
ha minden M -ből vett sorozatnak van konvergens részsorozata, és annak határértéke
is M -hez tartozik.

Következmény 16 Az (Rn , k·ke ) normált térben a korlátos zárt halmazok kompak-


tak.

Bizonyı́tás: Legyen M ⊆ Rn tetszőleges korlátos és zárt halmaz. Legyen (xk )


tetszőleges M -ből vett sorozat. Ez persze korlátos sorozat, ı́gy a fentiek szerint
van konvergens (xk` ) részsorozata. Node M zárt is; ezért az M -ből vett konvergens
sorozat határértéke M -hez tartozik. ¤

Következmény 17 Az Rn tér egységgömbje kompakt.

Megjegyzés 18 Ha (X, k·k) normált tér K fölött és M ⊆ X kompakt halmaz,


akkor minden f : M → R folytonos függvény fölveszi mind a maximumát mind a
minimumát az M halmazon.

7
Bizonyı́tás: Jelölje α az f függvény felső határát az M halmazon (ami elvileg
+∞ is lehet). Nyilván az f értékkészletéből vehetünk egy α-hoz tartó sorozatot, azaz
van olyan (xn ) ⊆ M sorozat, amelyre f (xn ) → α. Mivel M kompakt, ezért (xn )-nek
van egy valamely x ∈ M ponthoz konvergáló (xnk ) részsorozata. Mivel f folytonos,
ezért persze f (xnk ) → f (x) . Node f (xnk ) → α is fennáll, tehát f (x) = α, ahonnan
azonnal adódik, hogy f az x helyen fölveszi a maximumát.
A minimum fölvételének igazolása hasonlóan történik. ¤
Legyen mostantól (X, k·k) tetszőleges valós normált tér.

Állı́tás 19 Minden A ∈ Hom (Rn , X) leképezés folytonos (azaz Hom (Rn , X) =


L (Rn , X) ).
 
a1
 a2 
 
Bizonyı́tás: Tetszőleges  ..  ∈ Rn esetén a normatulajdonságok és a Cauchy-
 . 
an
egyenlőtlenség miatt
°  °
° a °
° 1 ° ° Ã n !° ° n °
°  a2 ° ° X ° °X ° X n
°  ° ° ° ° °
°A  .. ° = °A ak · ek ° = ° ak · Aek ° ≤ kak · Aek k =
°  . ° ° ° ° °
° ° k=1 k=1 k=1
° an °
v v
n u n u n
X uX uX
≤ |ak | · kAek k ≤ t a2k · t kAek k2 ,
k=1 k=1 k=1
s
P
n
ı́gy L := kAek k2 választással
k=1
°  ° ° °
° a1 ° ° a1 °
° ° ° °
°  a2 ° ° a2°
°  ° ° °
°A   ..° ≤ L · ° ° ,
..
°  .° ° °
.
° ° ° °
° an ° ° an °e

ami azt jelenti, hogy A folytonos. ¤

Tétel 20 Minden A : Rn → X izomorfizmusra A és A−1 is folytonos.

Bizonyı́tás: Az A folytonosságát már tudjuk. Tekintsük Rn -nek az

S := {x ∈ Rn : kxke = 1}

ún. egységszféráját. Ez nyilván zárt, hiszen (xk ) ⊆ S, x ∈ Rn , xk → x esetén

|kxke − kxk ke | ≤ kx − xk ke → 0 ,

tehát 1 ≡ kxk ke → kxke , amiért is kxke = 1, azaz x ∈ S. Az S halmaz korlátos is,


tehát Rn már ismert tulajdonsága miatt kompakt. Namost a k·k ◦ A, x 7→ kAxk
függvény folytonos, ı́gy a Weierstraß-féle tétel értelmében az S halmazon fölveszi a
minimumát. Node S elemei nemnullák, ı́gy A izomorfizmus volta miatt S elemeinek
A-képei sem nullák, tehát ezek normái is mind pozitı́vak. Emiatt

L := min kAxk > 0 ,


x∈S

8
ahonnan azonnal adódik, hogy minden x ∈ Rn esetén kAxk ≥ L·kxke . Innen minden
u ∈ X esetén (x = A−1 u választással) kuk ≥ L · kA−1 uke , azaz
° −1 °
°A u° ≤ 1 · kuk ,
e L
következésképpen A−1 folytonos. ¤

Tétel 21 Legyenek (X, k·k1 ) és (Y, k·k2 ) normált terek K fölött. Ha X véges di-
menziós, akkor minden A : X → Y lineáris leképezés folytonos.

Bizonyı́tás: X és Y mindenképpen tekinthetők valós normált tereknek, és


X mint valós vektortér is véges dimenziós (ha X komplex tér, akkor dimR X =
2 dimC X). Továbbá A mindenképpen R-lineáris. Legyen dimR X = n, ekkor létezik
C : Rn → X izomorfizmus. A fenti tétel értelmében C −1 : X → Rn folytonos,
a megelőző tétel szerint pedig A · C : Rn → Y folytonos lineáris operátor. Így
A = (A · C) ◦ C −1 is folytonos. ¤

Következmény 22 Ha X és Y véges dimenziós normált terek K fölött, akkor min-


den A : X → Y izomorfizmus folytonos, továbbá nyı́lt halmazt nyı́lt halmazba, zárt
halmazt zárt halmazba, kompakt halmazt pedig kompakt halmazba visz.

Bizonyı́tás: A és A−1 mindegyike folytonos. ¤

Megjegyzés 23 Ha A ∈ L (X, Y ) , akkor triviálisan minden korlátos halmazt korlátos


halmazba visz.

Következmény 24 Ha X véges dimenziós normált tér K fölött, akkor X-nek egy


részhalmaza pontosan akkor kompakt, ha korlátos és zárt. Következésképpen minden
korlátos X-beli sorozatnak van X-ben konvergens részsorozata.

Bizonyı́tás: n := dimR X jelöléssel létezik A : Rn → X R-izomorfizmus. A bi-


zonyı́tandó állı́tás igaz az (Rn , k·ke ) normált térben, innen a legutóbbi következményt
A-ra és A−1 -re alkalmazva azonnal adódik, hogy igaz X-ben is. ¤

Következmény 25 Tetszőleges K fölötti X normált térben minden M ≤ X véges


dimenziós altér zárt.

Bizonyı́tás: Legyen (xk ) ⊆ M, x ∈ X, xk → x. Persze ekkor (xk ) korlátos is.


Tekintsük M -et az X-beli norma leszűkı́tésével. Ezzel M véges dimenziós normált
tér, és ebben (xk ) korlátos sorozat. A fentiek miatt van olyan (xk` ) részsorozat,
amely M -ben konvergál egy y ∈ M vektorhoz. Ekkor (xk` ) X-ben is konvergál
y-hoz, node x-hez is, emiatt x = y, azaz x ∈ M. ¤

Feladat .2 (*) Igazoljuk, hogy tetszőleges X normált téren értelmezett lineáris funkcionál
pontosan akkor folytonos, ha magtere zárt!

Feladat .3 (*) Igazoljuk, hogy tetszőleges normált térben egy zárt altér és egy véges
dimenziós altér összege zárt!

9
1.3 Euklideszi térbeli transzformációk normája
Az alábbiakban legyenek X és Y véges (nem 0) dimenziós skalárszorzatos terek K
fölött.

Állı́tás 26 Tetszőleges A ∈ L (X, Y ) operátorra kA∗ k = kAk .

Bizonyı́tás: Tetszőleges x ∈ X vektorra

kAxk2 = hAx | Axi = hA∗ Ax | xi ≤ kA∗ Axk · kxk ≤ kA∗ k · kAxk · kxk ,

ahonnan
kAxk ≤ kA∗ k · kxk ,
innen triviálisankAk ≤ kA∗ k . A kapott eredményt A helyett A∗ -ra alkalmazva
kA∗ k ≤ kAk . Összevetve kA∗ k = kAk . ¤
Az alábbi állı́tás alapvető szereppel bı́r a véges dimenziós skalárszorzatos terek
leképezései normáinak vizsgálatában. Matematika-szerte ezt az állı́tást C ∗ -feltétel
néven ismerik:

Állı́tás 27 Legyenek X és Y véges dimenziós skalárszorzatos terek K fölött. Ekkor


tetszőleges A ∈ L (X, Y ) esetén

kA∗ · Ak = kA · A∗ k = kAk2 .

Bizonyı́tás: A szorzatleképezés normájára vonatkozó egyik korábbi következmény


miatt
kA∗ · Ak ≤ kA∗ k · kAk = kAk · kAk = kAk2 .
Másrészt tetszőleges x ∈ X, kxk ≤ 1 vektorra

kAxk2 = hAx | Axi = hA∗ Ax | xi ≤ kA∗ Axk · kxk ≤ kA∗ Ak · kxk · kxk ≤ kA∗ Ak ,
p
azaz kAxk ≤ kA∗ Ak, innen
p
kAk = sup kAxk ≤ kA∗ Ak ,
x∈X, kxk≤1

ahonnan kAk2 ≤ kA∗ Ak . Összevetve

kA∗ Ak = kAk2 .

A kapott eredményt A helyett A∗ -ra alkalmazva a már látottak miatt

kAA∗ k = kA∗∗ A∗ k = kA∗ k2 = kAk2 .

¤
A következőkben az önadjungált operátorok spektrálfelbontásának az operátornormára
vonatkozó konzekvenciáit vizsgáljuk.

Tétel 28 Legyen A ∈ L (X) önadjungált operátor (K = C esetén normális is lehet)


és λ ∈ K az A transzformáció maximális abszolút értékű sajátértéke. Ekkor

kAk = |λ| = sup |hAx | xi| .


kxk≤1

10
Bizonyı́tás: A spektrálfelbontás és a Parseval-formula alapján minden x ∈ X
esetén (használva a spektrálfelbontás jelöléseit)
n
X n
X
2 2 2
kAxk = |λk | · |hx | uk i| ≤ |λ|2 · |hx | uk i|2 =
k=1 k=1
n
X
= |λ|2 · |hx | uk i|2 = |λ|2 · kxk2 ,
k=1

tehát
kAxk ≤ |λ| · kxk .
Másrészt λ sajátérték volta miatt létezik u ∈ X, kuk = 1, melyre

kAuk = kλ · uk = |λ| · kuk = |λ| .

Mindezek éppen azt jelentik, hogy kAk = |λ| .


Így viszont

kAk = |λ| = |λ · hu | ui| = |hλ · u | ui| = |hAu | ui| ≤


≤ sup |hAx | xi| ≤ sup kAxk · kxk ≤ sup kAxk = kAk ,
kxk≤1 kxk≤1 kxk≤1

tehát
kAk = sup |hAx | xi| .
kxk≤1

Következmény 29 Ha A ∈ L (X, Y ) tetszőleges, akkor A∗ · A minden sajátértéke


nemnegatı́v valós szám, továbbá kAk megegyezik az A∗ ·A (illetve az A·A∗ ) legnagyobb
sajátértékének a négyzetgyökével.

Bizonyı́tás: A∗ · A önadjungált. Ha α ∈ K tetszőleges sajátértéke A∗ · A-nak


egy u ∈ X sajátvektorral, akkor

α · hu | ui = hα · u | ui = hA∗ Au | ui = hAu | Aui ∈ R+

alapján α ∈ R+ . Jelölje λ ∈ K az A∗ · A transzformáció legnagyobb sajátértékét.


Ekkor a legutóbbi tétel és a C∗ -feltétel alapján

λ = kA∗ · Ak = kAk2 ,

ami éppen a bizonyı́tandó állı́tást jelenti. ¤

Feladat .4 Határozzuk meg az


· ¸
1 1 ¡ ¢
∈ L R2
0 2
transzformáció normáját!

Tétel 30 Legyen A ∈ L (X) önadjungált, és jelölje m az A legkisebb, M pedig a


legnagyobb sajátértékét. Ekkor

m · kxk2 ≤ hAx | xi ≤ M · kxk2 .

Ezenfelül
kAk = max {|m| , |M |} .

11
Bizonyı́tás: max {|m| , |M |} az A sajátértékei abszolútértékeinek maximuma,
ı́gy egy előző tétel miatt
kAk = max {|m| , |M |} ,
Namost a spektrálfelbontási tétel alapján (és használva annak jelöléseit) minden
1 ≤ k ≤ n esetén
m ≤ λk ≤ M,
ı́gy minden x ∈ H-ra

m · |hx | uk i|2 ≤ λk · |hx | uk i|2 ≤ M · |hx | uk i|2 ,

ezt k-ban összegezve


n
X n
X n
X
2 2
m· |hx | uk i| ≤ λk · |hx | uk i| ≤ M · |hx | uk i|2 ,
k=1 k=1 k=1

ami a Parseval-formula és a spektrálfelbontás szerint éppen azt jelenti, hogy

m · kxk2 ≤ hAx | xi ≤ M · kxk2 .

2 A derivált bevezetése
Az alábbiakban ha X és Y valós normált terek, az f : X ½ Y kifejezés azt je-
lenti, hogy f az X egy nyı́lt részhalmazán értelmezett Y -ba menő leképezés. Az f
értelmezési tartományát Df -fel jelöljük.

2.1 Parciális deriváltak


Mese: Általában mindenki tudja, hogy az f : R3 → R,

f (x, y, z) := x2 z + xyz + z 2

függvény parciális deriváltjai

∂1 f (x, y, z) = 2xz + yz, ∂2 f (x, y, z) = xz, ∂3 f (x, y, z) = x2 + xy + 2z .

Emögött tudva vagy tudatlanul a következő gondolat húzódik meg: például a ∂1 f (x, y, z)
értéket úgy kapjuk meg, hogy lederiváljuk az R-ből R-be menő t 7→ f (t, y, z)
függvényt, és a deriváltat vesszük az x helyen. Ezt a gondolatot az alábbiakban
formálisan is megfogalmazzuk:
Legyen f : Rn ½ R, x = (x1 , x2 , . . . , xn ) ∈ Df és 1 ≤ k ≤ n. Ha az R-ből R-be
menő

f (x1 , x2 , . . . , xk−1 , ·, xk+1 , . . . , xn ) : R ½ R,


t 7→ f (x1 , x2 , . . . , xk−1 , t, xk+1 , . . . , xn )

függvény deriválható az xk helyen, akkor azt mondjuk, hogy f -nek az x helyen


létezik a k-adik parciális deriváltja; és ezesetben jelölje

∂k f (x) := [f (x1 , x2 , . . . , xk−1 , ·, xk+1 , . . . , xn )]0 (xk ) =


· ¸
d
= f (x1 , x2 , . . . , xk−1 , t, xk+1 , . . . , xn ) .
dt t=xk

12
A ∂k f (x) valós számot az f függvény x helyen vett k-adik parciális deriváltjának
nevezzük.
Ha az f függvénynek minden x ∈ Df helyen létezik a k-adik parciális deriváltja,
akkor az

∂k f : Df → R,
x 7→ ∂k f (x)

függvényt az f k-adik parciális deriváltfüggvényének mondjuk.

2.2 Iránymenti deriváltak


Valós számokon értelmezett, de normált térbe menő függvények deriválása a klasszikus
módon értelmezhető:
Legyen X valós normált tér és f : R ½ X függvény. Azt mondjuk, hogy f
deriválható egy t0 ∈ Df pontban, ha létezik az X normájában vett
f (t0 + h) − f (t0 )
lim ∈X
h→0 h
határérték. Ezesetben ezt a határértéket az f függvény t0 -beli deriváltjának nevezzük
és f 0 (t0 )-lal jelöljük.
Tehát egy A ∈ X vektor pontosan akkor t0 -beli deriváltja f -nek, ha
° °
° f (t0 + h) − f (t0 ) °
lim ° − A °=0.
h→0 ° h °

Az alábbiakban legyenek X és Y valós normált terek és f : X ½ Y függvény.

Definı́ció 31 Jelölje tetszőleges x ∈ Df és v ∈ X esetén fx,v azon

fx,v (t) := f (x + t · v)

egyenlőséggel értelmezett valós változós függvényt, melynek értelmezési tartománya


a {t ∈ R : x + t · v ∈ Df } nyı́lt halmaz.
Ha az fx,v függvény deriválható a 0-ban, akkor jelölje

0 f (x + h · v) − f (x)
(dv f ) (x) := fx,v (0) = lim .
h→0 h
A (dv f ) (x) ∈ Y vektort az f függvény x-ben vett v irányú iránymenti deriváltjának
nevezzük.

Megjegyzés 32 A definı́cióból azonnal látható, hogy tetszőleges t ∈ R számra


0
(dv f ) (x + t · v) pontosan akkor létezik, ha fx,v (t) , és persze ekkor
0
(dv f ) (x + t · v) = fx,v (t) .

Példa 33 Nézzük meg, hogy a most bevezetett fogalom miképpen viszonyul a klasszikushoz:
legyen f : R ½ R egy x ∈ R pontban deriválható függvény. Ekkor tetszőleges v ∈ R
esetén a kompozı́ciófüggvény deriválási szabálya miatt az fx,v : t 7→ f (x + t · v)
0
függvény is deriválható 0-ban és fx,v (0) = f 0 (x) · v, ezért

(dv f ) (x) = f 0 (x) · v .

Figyeljük meg, hogy (dv f ) (x) mint v függvénye lineáris, s ezt a lineáris függvényt
jellemzi az f 0 (x) érték.

13
Példa 34 Legyen most f : Rn ½ R, x ∈ Rn és 1 ≤ k ≤ n, melyre létezik ∂k f (x) .
Legyen (e1 , e2 , . . . , en ) az Rn -beli standard bázis. Ekkor

∂k f (x) = [f (x1 , x2 , . . . , xk−1 , ·, xk+1 , . . . , xn )]0 (xk ) =

f (x1 , x2 , . . . , xk−1 , xk + h, xk+1 , . . . , xn ) − f (x1 , x2 , . . . , xk−1 , xk , xk+1 , . . . , xn )


= lim =
h→0 h
f (x + h · ek ) − f (x)
= lim = (dek f ) (x) ,
h→0 h
tehát (dek f ) (x) és ∂k f (x) ugyanazt jelenti.

A fenti példán felbuzdulva bevezethetjük a parciális deriváltnak az eddiginél


absztraktabb fogalmát:

Definı́ció 35 Legyen X véges dimenziós valós normált tér egy rögzı́tett U = (u1 , u2 , . . . , un ) ⊆
X bázissal. Legyen f : X ½ R olyan függvény, amelynek egy x ∈ X pontban létezik
valamely uk irányú iránymenti deriváltja. Ekkor a (duk f ) (x) értéket az f függvény
x helyen vett, (U bázisbeli) k-adik parciális deriváltjának nevezzük, és ∂k f (x)-szel
jelöljük.

2.3 Frèchet-derivált
Az eddigiekben a klasszikus deriváltfogalomnak a többváltozós függvényekre való
kiterjesztésének technikai jellegű lehetőségeit vizsgáltuk. Nevezetesen: a vektorváltozós
függvényeket mindig valós változósra próbáltuk meg ,, visszajátszani”. Ezek láthatólag
féllábas próbálkozások, és azért van rájuk szükség, mert a valós függvények de-
riválásából nem adódik teljesen természetes módon ,, a” többváltozós analogon.
A fentiekkel szemben most a deriváltfogalom eredeti alapgondolatához nyúlunk
vissza: a lineáris függvénnyel való ,, jól” közelı́thetőséghez (vö. érintőapproximáció-
tétel).
Az alábbiakban legyenek X és Y valós normált terek, r : X ½ Y függvény és
a ∈ Dr .

Definı́ció 36 Azt mondjuk, hogy a r függvény kisrendű az a helyen, ha van olyan


q : Dr → Y függvény, amelyre

1. q folytonos a-ban;
2. q (a) = 0Y ;
3. minden x ∈ Dr esetén r (x) = kx − ak · q (x) .

Megjegyzés 37 r nyilván pontosan akkor kisrendű a-ban, ha


kr (x)k
r (a) = 0Y és lim =0.
x→a kx − ak

Példa 38 Legyen X véges dimenziós valós euklideszi tér és A ∈ L (X) önadjungált.
Ekkor a QA : X → R kvadratikus alak kisrendű 0X -ben, hiszen QA (0X ) = 0, és
|QA (x)| |hAx | xi| kAxk · kxk
= ≤ = kAxk −→ 0 ,
kxk kxk kxk
midőn x → 0X .

14
Megjegyzés 39 Legyen r : X ½ Y az a ∈ X helyen kisrendű függvény. Ekkor
minden v ∈ X vektorra
r (a + h · v)
−→ 0Y (h → 0) .
h
Bizonyı́tás: v 6= 0X esetén
° °
° r (a + h · v) ° kr (a + h · v)k kr (a + h · v)k
° °= = kvk · ,
° h ° |h| ka + h · v − ak

ami h → 0-val tart a 0-hoz. v = 0X esetén az állı́tás nyilvánvaló. ¤

Definı́ció 40 Azt mondjuk, hogy egy f : X ½ Y függvény (Frèchet-) deriválható


egy a ∈ X pontban, ha van olyan A ∈ L (X, Y ) operátor és r : Df → Y az a helyen
kisrendű függvény, melyekre

f (x) − f (a) = A (x − a) + r (x)

minden x ∈ Df vektorra.

Állı́tás 41 Ha f deriválható az a ∈ X pontban, akkor a fenti definı́ció jelöléseivel


minden v ∈ X esetén
(dv f ) (a) = Av .

Bizonyı́tás:

f (a + h · v) − f (a) A (a + h · v − a) + r (a + h · v) r (a + h · v)
= = Av + ;
h h h
a fenti megjegyzés alapján a jobboldal tart Av-hez, midőn h → 0. Ez éppen azt
jelenti, hogy
f (a + h · v) − f (a)
(dv f ) (a) = lim = Av
h→0 h
minden v ∈ X esetén. ¤

Következmény 42 Ha f deriválható az a ∈ X pontban, akkor a definı́cióban sz-


ereplő A ∈ L (X, Y ) operátor egyértelmű (és ı́gy r is egyértelmű).

Már van deriválhatóságunk, de deriváltunk még nincs.

Megjegyzés 43 Legyen H véges dimenziós valós euklideszi tér. Riesz tétele alapján
tudjuk, hogy minden A : H → R lineáris leképezés hm | ·i alakba ı́rható (m ∈ H).
Ez alapján egy f : H ½ R függvény a-beli deriválhatósága pontosan azt jelenti, hogy
van olyan m ∈ H vektor és r : Df → R az a helyen kisrendű függvény, hogy

f (x) − f (a) = hm | x − ai + r (x)

minden x ∈ Df vektorra.

Definı́ció 44 (*) Legyen H véges dimenziós valós euklideszi tér és f : H ½ R az


a ∈ H pontban deriválható függvény, azaz alkalmas m ∈ H vektorral és az a helyen
kisrendű r : Df → R függvénnyel

f (x) − f (a) = hm | x − ai + r (x)

15
minden x ∈ Df esetén. Ekkor az m ∈ H vektort (mely egyértelműen létezik) az f
függvény a-beli deriváltjának nevezzük és f 0 (a)-val jelöljük.
Ha az f függvény deriválható minden x ∈ Df pontban, akkor jelölje

f 0 : Df → H ,
x 7→ f 0 (x) .

Az f 0 függvényt az f deriváltfüggvényének nevezzük.

Következmény 45 Ha az f : H ½ R függvény deriválható az a ∈ H pontban,


akkor egy alkalmas a-ban kisrendű r : Df → R függvénnyel

1. minden x ∈ Df -re

f (x) − f (a) = hf 0 (a) | x − ai + r (x) .

2. minden v ∈ H-ra
(dv f ) (a) = hf 0 (a) | vi .

Vegyük észre, hogy a fenti definı́ció H = R esetén visszaadja a klasszikus de-


riváltfogalmat, hiszen abban a derivált a közelı́tő egyenes meredeksége. Jelenesetben
pedig az hm | ·i függvény ,, meredeksége” éppen m.
Más a helyzet akkor, ha az f függvény két tetszőleges normált tér között hat.
Ugyanis egy A : X → Y lineáris operátor meredekségén általában nincs mit értenünk;
hacsak nem magát az A operátort. Éppen ezt fogjuk tenni. Persze ı́gy H-ból R-be
menő függvényekre két deriváltfogalmunk is lesz, de az ezek közötti megfeleltetés is
nyilvánvaló.
Legyenek X, Y valós normált terek és f : X ½ Y függvény.

Definı́ció 46 (**) Legyen f deriválható az a ∈ X pontban, azaz alkalmas A ∈


L (X, Y ) operátorral és az a helyen kisrendű r : Df → R függvénnyel

f (x) − f (a) = A (x − a) + r (x)

minden x ∈ Df esetén. Ekkor az A ∈ L (X, Y ) operátort (mely egyértelműen létezik)


az f függvény a-beli deriváltjának nevezzük és f 0 (a)-val jelöljük.
Ha az f függvény deriválható minden x ∈ Df pontban, akkor jelölje

f 0 : Df → L (X, Y ) ,
x 7→ f 0 (x) .

Az f 0 függvényt az f deriváltfüggvényének nevezzük.

Következmény 47 Ha az f : X ½ Y függvény deriválható az a ∈ H pontban,


akkor egy alkalmas a-ban kisrendű r : Df → Y függvénnyel

1. minden x ∈ Df -re

f (x) − f (a) = [f 0 (a)] (x − a) + r (x) .

2. minden v ∈ H-ra
(dv f ) (a) = [f 0 (a)] v .

16
3. ha speciálisan X véges dimenziós valós normált tér egy rögzı́tett U = (u1 , u2 , . . . , un ) ⊆
X bázissal és Y = R, akkor minden 1 ≤ k ≤ n esetén
³ ´(k)
[f 0 (a)]U,(1) = [f 0 (a)] uk = (duk f ) (a) = ∂k f (a) ,

tehát az [f 0 (a)] funkcionál U és (1) bázisokhoz tartozó (sor)mátrixa

[ ∂1 f (a) , ∂2 f (a) , . . . , ∂n f (a) ] .

Ezt a sorvektort az f függvény a helyen vett U bázisbeli gradiensvektorának is


szokás nevezni.

Megjegyzés 48 A fentiekből az is következik, hogy ha f : Rn ½ R az a ∈ Rn


pontban deriválható függvény, akkor

f 0 (a) = [ ∂1 f (a) , ∂2 f (a) , . . . , ∂n f (a) ] .

Megjegyzés 49 Ne feledjük, hogy ha f : X ½ Y deriválható függvény, akkor f 0 :


X ½ L (X, Y ) . Ha H véges dimenziós euklideszi tér és f : H ½ R deriválható
függvény, akkor Definı́ció(∗) értelmében f 0 : H ½ H, mı́g Definı́ció(∗∗) értelmében
f 0 : H ½ H ∗.

2.4 A deriválás alaptulajdonságai


A továbbiakban legyenek X és Y valós normált terek.

Állı́tás 50 Ha A ∈ L (X, Y ) , akkor A mint X → Y függvény deriválható, és min-


den x ∈ X helyen
A0 (x) = A
(tehát az A0 : X → L (X, Y ) függvény konstans).

Bizonyı́tás: Minden y ∈ X esetén

A (y) − A (x) = A (y − x) + 0Y ,

és tudjuk, hogy a 0Y értékű konstans függvény kisrendű x-ben. Eszerint A kielégı́ti
az x-beli deriválhatóság feltételeit, és A0 (x) = A. ¤

Állı́tás 51 Ha f : X ½ Y az a ∈ X pontban deriválható függvény, akkor folytonos


is a-ban.

Bizonyı́tás: A definı́ció szerint alkalmas a-ban kisrendű r : Df → Y függvénnyel

f (x) − f (a) = [f 0 (a)] (x − a) + r (x) ,

és a jobboldal x → a esetén triviálisan tart 0Y -hoz. Ez éppen azt jelenti, hogy f
folytonos a-ban. ¤

Feladat .5 Mutassuk meg, hogy az f : R2 → R,


½
1, ha y = x2 és x 6= 0
f (x, y) :=
0 egyébként
függvénynek a (0, 0) pontban minden iránymenti deriváltja létezik, de f még csak
nem is folytonos (0, 0)-ban ( tehát nem is deriválható).

17
Megjegyzés 52 Legyen G ⊆ X nyı́lt halmaz és a ∈ G. Az Y -beli norma háromszög-
egyenlőtlenségéből triviálisan adódik, hogy két, a-ban kisrendű függvény összege is
kisrendű a-ban. Az is azonnal látható, hogy ha Z egy további normált tér, A ∈
L (Y, Z) és r : G → Y a-ban kisrendű függvény, akkor A ◦ r is kisrendű a-ban.

Állı́tás 53 Legyenek f, g : X ½ Y az a ∈ X pontban deriválható függvények.


Ekkor f + g is deriválható a-ban, továbbá

(f + g)0 (a) = f 0 (a) + g 0 (a) .

Ha Z egy további normált tér és A ∈ L (Y, Z) , akkor A ◦ f is deriválható a-ban, és

(A ◦ f )0 (a) = A · f 0 (a) .

Következésképpen minden α ∈ R esetén α · f is deriválható a-ban, és

(α · f )0 (a) = α · f 0 (a) .

Bizonyı́tás: a ∈ Df ∩ Dg , és mind f -et, mind g-t tekinthetjük csak a G :=


Df ∩ Dg nyı́lt halmazon. A feltételből adódóan vannak olyan r1 , r2 : G → Y a-ban
kisrendű függvények, hogy minden x ∈ G-re

f (x) − f (a) = [f 0 (a)] (x − a) + r1 (x)

és
g (x) − g (a) = [g 0 (a)] (x − a) + r2 (x) .
Innen minden x ∈ G-re

(f + g) (x) − (f + g) (a) = [f 0 (a) + g 0 (a)] (x − a) + (r1 + r2 ) (x) ,

ahonnan r1 + r2 a-beli kisrendű volta miatt f + g deriválható a-ban, és a derivált


nem más, mint a fenti egyenlőségben szereplő lineáris operátor, azaz f 0 (a) + g 0 (a) .
Az A ◦ f -re vonatkozó állı́tás az

Af (x) − Af (a) = [A · f 0 (a)] (x − a) + (A ◦ r1 ) (x)

egyenlőség alapján hasonlóan adódik. ¤

2.5 A régi konvenció továbbra is hatékony


Megjegyzés 54 Legyen X valós normált tér és f : R ½ X, a ∈ Df . Vegyük
észre, hogy az f függvény a-beli deriválhatóságát és deriváltját eddig kétféleképpen
is definiáltuk: először a különbségi hányados határértékeként, majd később a Frèchet-
derivált definı́ciójában szereplő érintőapproximációs egyenlőséggel. A két deriváltfogalom
nem is hajszálra azonos, de lényegében mégis. Azonosı́tsuk az X teret az L (R, X)
térrel az
x ←→ x
b : t 7→ t · x
beazonosı́tás alapján. (Nyilván x és x b kölcsönösen meghatározzák egymást.) Ezen
beazonosı́tással X és L (R, X) mint normált terek is azonosak, hiszen minden x ∈ X-
re
kb
xk = sup {kb x (t)k : |t| ≤ 1} = sup {kt · xk : |t| ≤ 1} = kxk .

18
Namost f az a pontban pontosan akkor Frèchet-deriválható, ha van olyan Φ ∈
L (R, X) és r : Df → X kisrendű, hogy minden x ∈ Df -re

f (x) − f (a) = Φ (x − a) + r (x) .

A fenti beazonosı́tás alapján ekkor Φ azonosul egy p ∈ X vektorral: Φt = t · p. Így


minden x ∈ Df -re
f (x) − f (a) = (x − a) · p + r (x) .
Ez pedig tényleg azzal ekvivalens, hogy

f (x) − f (a)
lim =p
x→a x−a
(a fordı́tott irány esetén r (x) := f (x) − f (a) (x − a) · p választással). Tehát az
X = L (R, X) azonosı́tással a két deriváltfogalom egybeesik. Ezen beazonosı́tás nélkül
viszont már a korábbi lineáris algebrabeli dolgaink is a fejükre állnának.

Példa 55 Legyenek f1 , f2 , . . . , fn : R → R deriválható függvények. Ekkor


   
f1 f1 (t)
 f2   f2 (t) 
  n  
f =  ..  : R → R , t 7−→  .. 
 .   . 
fn fn (t)

választással f is a klasszikus értelemben deriválható, hiszen a különbségi hányados


és a határérték komponensenként vehető (ez nagyon könnyen látszik, ha a differ-
enciahányados és a vélt határérték különbsége normájának a négyzetét vesszük).
Továbbá minden t ∈ R-re  
f10 (t)
 f 0 (t) 
0  2 
f (t) =  ..  .
 . 
0
fn (t)
Innen a fentiek alapján f -nek a Frèchet-értelemben vett deriváltja is ugyanez (pon-
tosabban az őt számmal való szorzás). Vegyük észre, hogy a deriváltat akár Rn -
belinek, akár L (R, Rn )-belinek tekintjük, ugyanúgy a fenti oszlopvektorhoz jutunk,
hiszen ez a vektor egyaránt jelent Rn -beli és Rn×1 -beli elemet.

2.6 A kompozı́ciófüggvény deriválása


A továbbiakban legyenek X, Y és Z valós normált terek.

Lemma 1 Legyen f : X ½ Y deriválható egy a ∈ X pontban és r : Y ½ Z


kisrendű f (a)-ban. Ekkor r ◦ f kisrendű a-ban.

Bizonyı́tás: r ◦ f nyilván értelmezett az a ∈ X pont egy alkalmas nyı́lt G


környezetében. (Például G = Df ∩ int f −1 (Dr ) .) f a-beli deriválhatósága miatt
van olyan r1 : Df → Y a-ban kisrendű függvény, hogy minden x ∈ Df -re

f (x) − f (a) = [f 0 (a)] (x − a) + r1 (x) .

19
A kisrendűség definı́ciója miatt vannak olyan q : Dr → Z és q1 : Df → Y függvények,
hogy q1 folytonos a-ban, q1 (a) = 0Y és minden x-re r1 (x) = kx − ak·q1 (x) , valamint
q folytonos f (a)-ban, q (f (a)) = 0Z és minden y-ra r (y) = ky − f (a)k · q (y). Innen
minden x ∈ G, x 6= a esetén
kr (f (x))k kkf (x) − f (a)k · q (f (x))k kf (x) − f (a)k · kq (f (x))k
= = =
kx − ak kx − ak kx − ak
k[f 0 (a)] (x − a) + kx − ak · q1 (x)k · kq (f (x))k
= ≤
kx − ak
(k[f 0 (a)] (x − a)k + kkx − ak · q1 (x)k) · kq (f (x))k
≤ ≤
kx − ak
(kf 0 (a)k · kx − ak + kx − ak · kq1 (x)k) · kq (f (x))k
≤ =
kx − ak
= (kf 0 (a)k + kq1 (x)k) · kq (f (x))k ,

ami x → a esetén tart a 0-hoz, hiszen az utolsó egyenlőtlenségjel utáni rész két
a-ban folytonos valós értékű függvény szorzata (folytonos függvények többszörös
összetételéről van szó!), továbbá e szorzat értéke az a-ban 0. Ezenfelül nyilván
(r ◦ f ) (a) = 0Z . Mindebből következik, hogy r ◦ f kisrendű a-ban. ¤

Tétel 56 Legyen f : X ½ Y deriválható egy a ∈ X pontban és g : Y ½ Z


deriválható f (a)-ban. Ekkor g ◦ f is deriválható a-ban és

(g ◦ f )0 (a) = g 0 (f (a)) · f 0 (a) .

Bizonyı́tás: g ◦ f nyilván értelmezett az a ∈ X pont egy alkalmas nyı́lt G


környezetében. A feltételek alapján minden x ∈ Df -re

f (x) − f (a) = [f 0 (a)] (x − a) + r1 (x)

és minden y ∈ Dg -re

g (y) − g (f (a)) = [g 0 (f (a))] (y − f (a)) + r2 (y) ,

ahol r1 : Df → Y kisrendű a-ban és r2 : Dg → Z kisrendű f (a)-ban. Innen minden


x ∈ G-re (y = f (x) választással)

(g ◦ f ) (x)−(g ◦ f ) (a) = g (f (x))−g (f (a)) = [g 0 (f (a))] (f (x) − f (a))+r2 (f (x)) =

= [g 0 (f (a))] ([f 0 (a)] (x − a) + r1 (x)) + r2 (f (x)) =


= [g 0 (f (a)) · f 0 (a)] (x − a) + [g 0 (f (a))] r1 (x) + r2 (f (x)) =
= [g 0 (f (a)) · f 0 (a)] (x − a) + R (x) ,

ahol R : G → Z, R (x) := [g 0 (f (a))] r1 (x) + r2 (f (x)) . Ezen utóbbi összeg második


tagja a fenti lemma szerint kisrendű a-ban, az első tag pedig a

k[g 0 (f (a))] r1 (x)k ≤ kg 0 (f (a))k · kr1 (x)k

egyenlőtlenség alapján triviálisan kisrendű a-ban. Ezért ezek összege, az R függvény


is kisrendű a-ban. Ez alapján a fenti egyenlőség pontosan azt jelenti, hogy g ◦ f
deriválható a-ban és
(g ◦ f )0 (a) = g 0 (f (a)) · f 0 (a) .
¤

20
Példa 57 Legyenek f1 , f2 , . . . , fn : R → R deriválható függvények és g : Rn → R is
deriválható függvény. Ekkor az
 
f1
 f2 
 
f =  ..  : R → Rn
 . 
fn

függvény is deriválható, továbbá az eddigiek alapján a g ◦ f : R → R függvény is


deriválható és minden t ∈ R esetén

(g ◦ f )0 (t) = g 0 (f (t)) · f 0 (t) ,

azaz
 
f10 (t)
d  f20 (t)  Xn
 
g (f (t)) = [∂1 g (f (t)) , ∂2 g (f (t)) , . . . , ∂n g (f (t))]· .. = ∂k g (f (t))·fk0 (t) .
dt  .  k=1
fn0 (t)

2.7 Koordináta-függvények
Legyen X valós normált tér és Y véges dimenziós valós euklideszi tér egy U =
(u1 , u2 , . . . , un ) ortonormált bázissal. Legyen G ⊆ X nyı́lt halmaz és f1 , f2 , . . . , fn :
G → R. Jelölje f : G → Y,
n
X
f (x) := fk (x) · uk .
k=1

Definı́ció 58 A fenti f1 , f2 , . . . , fn függvényeket az f függvény U bázisbeli koordináta-


függvényeinek nevezzük.

Megjegyzés 59 A fennti gondolatot megfordı́tva, ha most egy tetszőleges f : X ½


Y függvényből indulunk ki, akkor az ortonormált bázisok tulajdonságai miatt

fk (x) := hf (x) | uk i (x ∈ X, k = 1, 2, . . . , n)

definı́cióval f1 , f2 , . . . , fn éppen f -nek a koordináta-függvényei.

Állı́tás 60 Legyen f : X ½ Y és legyenek f1 , f2 , . . . , fn az f koordináta-függvényei.


Az f függvény pontosan akkor deriválható egy a ∈ X pontban, ha f1 , f2 , . . . , fn
deriválhatók a-ban; ezesetben minden v ∈ X esetén
n
X
0
[f (a)] v = ([fk0 (a)] v) · uk .
k=1

Bizonyı́tás: Tetszőleges p1 , p2 , . . . , pn ∈ X ∗ funkcionálokra és x ∈ X vektorra


A : X → Y,
X n
Av := pk (v) · uk
k=1

definı́cióval az Y -beli Parseval-formula alapján

kf (x) − f (a) − A (x − a)k2

21
° °2 ¯* +¯2
° n
X ° n ¯
X n
X ¯
° ° ¯ ¯
°f (x) − f (a) − pk (x − a) · uk ° = ¯ f (x) − f (a) − pj (x − a) · uk | uk ¯ =
° ° ¯ ¯
k=1 k=1 j=1
n
X
= |fk (x) − fk (a) − pk (x − a)|2 ,
k=1

ami alapján azonnal adódik, hogy az x 7→ f (x)−f (a)−A (x − a) függvény pontosan


akkor kisrendű a-ban, ha minden 1 ≤ k ≤ n esetén az x 7→ fk (x)−fk (a)−pk (x − a)
függvény a-ban kisrendű (mindkét oldalt osszuk el kx − ak2 -tel!). Ez éppen azt
jelenti, hogy egyrészt f pontosan akkor deriválható a-ban, ha f1 , f2 , . . . , fn mind
deriválhatók a-ban; továbbá ilyenkor

f 0 (a) = A és fk0 (a) = pk (k = 1, 2, . . . , n) .

Innen minden v ∈ X esetén


n
X n
X
[f 0 (a)] v = Av = pk (v) · uk = ([fk0 (a)] v) · uk .
k=1 k=1

Következmény 61 A fenti állı́tás feltételei mellett (ha f deriválható a-ban) min-


den v ∈ X esetén
   
f1 (x) [f10 (a)] x
 f2 (x)   [f 0 (a)] x 
  0  2 
[f (x)]U =  ..  és [[f (a)] x]U =  ..  .
 .   . 
0
fn (x) [fn (a)] x

2.8 A deriváltmátrix
Legyenek X és Y véges dimenziós valós euklideszi terek U = (u1 , u2 , . . . , un ) ⊆ X
és V = (v1 , v2 , . . . , vm ) ⊆ Y ortonormált bázisokkal.

Állı́tás 62 Legyen f : X ½ Y az a ∈ X pontban deriválható függvény. Ekkor


 
∂1 f1 (a) ∂2 f1 (a) · · · ∂n f1 (a)
 ∂1 f2 (a) ∂2 f2 (a) · · · ∂n f2 (a) 
 
[f 0 (a)]U,V =  .. .. ... ..  ,
 . . . 
∂1 fm (a) ∂2 fm (a) · · · ∂n fm (a)

ahol f1 , f2 , . . . , fn az f koordináta-függvényei.

Bizonyı́tás: Minden 1 ≤ k ≤ m és 1 ≤ ` ≤ n esetén U és V ortonormált bázis


volta miatt a legutóbbi állı́tás alapján
³ ´(k)
0
[f (a)]U,V = h[f 0 (a)] u` | vk i = [fk0 (a)] u` = (du` fk ) (a) = ∂` fk (a) .
(`)

Definı́ció 63 A fenti tételben szereplő [f 0 (a)]U,V mátrixot az f függvény a pontbeli,


U, V bázisokban felı́rt Jacobi-mátrixának nevezzük.

22
Megjegyzés 64 Ha f : Rn → Rm az a ∈ Rn pontban deriválható, akkor
 
∂1 f1 (a) ∂2 f1 (a) · · · ∂n f1 (a)
 ∂1 f2 (a) ∂2 f2 (a) · · · ∂n f2 (a) 
 
f 0 (a) =  .. .. . . ..  ,
 . . . . 
∂1 fm (a) ∂2 fm (a) · · · ∂n fm (a)

ahol f1 , f2 , . . . , fn az f koordináta-függvényei. Tehát ilyenkor az f függvény a-beli


deriváltja és a-beli Jacobi-mátrixa ugyanazt jelenti.

Példa 65 Az f : R2 → R3 ,
 
x+y
f (x, y) :=  x2 + y 2 
y

leképezés koordináta-függvényei

f1 (x, y) = x + y, f2 (x, y) = x2 + y 2 , f3 (x, y) = y .

Mivel a P1 , P2 : R2 → R, P1 (x, y) := x, P1 (x, y) := y leképezések lineárisak, ı́gy


deriválhatók, ezért
¡ ¢ ¡ ¢
f1 = P1 + P2, f2 = id2 ◦ P1 + id2 ◦ P2 , f3 = P2

miatt f1 , f2 és f3 is deriválhatók. Következésképpen f is deriválható és


 
1 1
f 0 (x, y) =  2x 2y  .
0 1

Folytatás

Lemma 2 (Lagrange) Legyen X véges dimenziós valós normált tér egy U = (u1 , u2 , . . . , un )
bázissal és 1 ≤ k ≤ n rögzı́tett. Legyen f : X ½ R olyan függvény, melynek egy
B (a, r) ⊆ X gömb pontjaiban létezik az U szerinti k-ik parciális deriváltja. Ekkor
minden x ∈ X, t ∈ R, x, x + t · uk ∈ B (a, r) esetén létezik olyan z ∈ B (a, r) vektor,
melyre
f (x + t · uk ) − f (x) = ∂k f (z) · t .

Bizonyı́tás: A Lagrange-féle középértéktételt fogjuk alkalmazni az fx,uk függ-


vényre a 0 és t között. Mondjuk legyen t > 0 (a t < 0 eset ugyanı́gy megy, a
t = 0 eset pedig z = a-val nyilvánvaló). Mivel minden 0 ≤ s ≤ t esetén x + s · uk
konvex kombinációja 0-nak és x + t · uk -nak, másrészt B (a, r) konvex halmaz, ezért
x + s · uk ∈ B (a, r); tehát fx,uk értelmezve van [0, t]-n. Minden s ∈ [0, t]-re definı́ció
szerint
0
∂k f (x + s · uk ) = duk f (x + s · uk ) = fx,uk
(s)
(tehát fx,uk deriválható [0, t]-n). Így a Lagrange-középértéktétel szerint ∃0 < ξ < t,
hogy
0
f (x + t · uk ) − f (x) = fx,uk (t) − fx,uk (0) = (t − 0) · fx,uk
(ξ) = t · ∂k f (x + ξ · uk ) ,

ami z := x + ξ · uk választással éppen az, amit igazolni akartunk. ¤

23
Tétel 66 Legyen X véges dimenziós valós euklideszi tér egy U = (u1 , u2 , . . . , un )
ortonormált bázissal és f : X ½ R olyan függvény, melynek léteznek a ∂1 f, ∂2 f, . . . , ∂n f
parciális deriváltjai és egy a ∈ Df pontban folytonosak. Ekkor f deriválható a-ban
és * +
n
X
f 0 (a) = · | ∂k f (a) · uk
k=1
P
n
(azaz Definı́ció(∗) értelmében f 0 (a) = ∂k f (a) · uk ).
k=1

Bizonyı́tás: Elegendő megmutatnunk, hogy az R : Df → R,


* n
+ n
X X
R (x) := f (x)−f (a)− x − a | ∂k f (a) · uk = f (x)−f (a)− ∂k f (a)·hx − a | uk i
k=1 k=1

függvény kisrendű a-ban. Nyilván R (a) = 0. Legyen most ε > 0. Ekkor a folytonossági
feltétel szerint ∃r > 0, hogy minden x ∈ B (a, r) és minden 1 ≤ k ≤ n esetén
ε
|∂k f (x) − ∂k f (a)| ≤ √ .
n

Legyen x ∈ B (a, r) , x 6= a rögzı́tett. Jelölje 1 ≤ k ≤ n esetén


k
X
xk := a + hx − a | uj i · uj
j=1

és x0 := a. Mivel U ortonormált bázis, ezért


n
X
xn = a + hx − a | uj i · uj = a + x − a = x,
j=1

továbbá minden 1 ≤ k ≤ n-re

xk = xk−1 + hx − a | uk i · uk

és a Bessel-egyenlőtlenségből
° k °2
°X ° k
X
2 ° °
kxk − ak = ° hx − a | uj i° = |hx − a | uj i|2 ≤ kx − ak2 ≤ r2 ,
° °
j=1 j=1

ezért xk ∈ B (a, r) . Így a fenti lemmát is alkalmazva


n
X
f (x) − f (a) = f (xn ) − f (x0 ) = (f (xk ) − f (xk−1 )) =
k=1
n
X n
X
= (f (xk−1 + hx − a | uk i · uk ) − f (xk−1 )) = ∂k f (zk ) · hx − a | uk i ,
k=1 k=1

ahol z1 , z2 , . . . , zn ∈ B (a, r) alkalmas vektorok. Innen ε választása miatt


¯ ¯
¯ Pn ¯
¯f (x) − f (a) − ∂ f (a) · hx − a | u i ¯
|R (x)| ¯ k k ¯
k=1
= =
kx − ak kx − ak

24
¯ n ¯
¯P P
n ¯
¯ ∂k f (zk ) · hx − a | uk i − ∂k f (a) · hx − a | uk i¯¯
¯
k=1 k=1
= =
kx − ak
¯ n ¯
¯P ¯ P
n
¯ (∂k f (zk ) − ∂k f (a)) · hx − a | uk i¯ |∂k f (zk ) − ∂k f (a)| · |hx − a | uk i|
¯ ¯
k=1 k=1
= ≤ ≤
kx − ak kx − ak
s s
P
n
2 P
n
|∂k f (zk ) − ∂k f (a)| · |hx − a | uk i|2
k=1 k=1
≤ =
kx − ak
s
P
n
v v
|∂k f (zk ) − ∂k f (a)|2 · kx − ak u n u n
k=1 uX uX ε2
= =t |∂k f (zk ) − ∂k f (a)| ≤ t
2
= ε.
kx − ak k=1 k=1
n

Tehát azt kaptuk, hogy minden x ∈ B (a, r) , x 6= a esetén

|R (x)|
≤ε,
kx − ak

amiből következik, hogy


|R (x)|
lim =0,
x→a kx − ak

tehát R kisrendű a-ban. ¤

25
2.9 Másodrendű deriváltak
Mese: Legyenek X és Y valós normált terek, ekkor L (X, Y ) is valós normált tér.
Legyen f : X ½ Y olyan deriválható függvény, melyre az f 0 : X ½ L (X, Y )
deriváltfüggvény maga is deriválható. Ekkor formálisan
0
f 00 = (f 0 ) : X ½ L (X, L (X, Y )) .

Ezt már nehéz ı́gy kezelni. De bizonyos speciális esetben, speciális definı́cióval
könnyebben kezelhetővé válik a második derivált fogalma.

Definı́ció 67 Legyen H véges dimenziós valós euklideszi tér. Egy f : H ½ R


függvényt egy a ∈ H pontban kétszer deriválhatónak mondunk, ha f deriválható az a
egy környezetében, továbbá Definı́ció(∗) szerinti f 0 : H ½ H függvény is deriválható
az a pontban. Ekkor az f 0 függvény Definı́ció(∗∗) szerinti Frèchet-deriváltját az f
függvény második deriváltjának mondjuk az a pontban:
0
f 00 (a) := (f 0 ) (a) .

Itt természetesen Definı́ció(∗∗) értelmében f 00 (a) = (f 0 )0 (a) ∈ L (H) . Később


látni fogjuk, hogy f 00 (a) ezenfelül még önadjungált is, az ilyenek meg éppenséggel
,, kézre vannak” nekünk. Ha most f az értelmezési tartománya minden pontjában
deriválható, akkor kétszer deriválható függvénynek mondjuk, ekkor persze a második
deriváltfüggvény

f 00 : H ½ L (H) ,
x 7→ f 00 (x) .

Megjegyezzük, hogy Definı́ció(∗) értelmében egy alkalmas r : Df → R kisrendű


függvénnyel minden x ∈ Df -re

f (x) − f (a) = hx − a | f 0 (a)i + r (x)

(tehát egyszerűen az [f 0 (a)] u = hu | f 0 (a)i azonosı́tással élünk), ı́gy most minden


v ∈ H esetén
(dv f ) (a) = hv | f 0 (a)i = hf 0 (a) | vi .
A továbbiakban legyen H véges dimenziós valós euklideszi tér.

Állı́tás 68 Legyen f : H ½ R egy a ∈ H pontban kétszer deriválható. Ekkor


minden u, v ∈ H esetén

h[f 00 (a)] u | vi = du (dv f ) (a) .

Bizonyı́tás:
­£ 0 0 ¤ ®
h[f 00 (a)] u | vi = (f ) (a) u | v = hdu (f 0 ) (a) | vi =
¿ À ¿ 0 À
f 0 (a + h · u) − f 0 (a) f (a + h · u) − f 0 (a)
= lim | v = lim |v =
h→0 h h→0 h
hf 0 (a + h · u) | vi − hf 0 (a) | vi
= lim =
h→0 h
(dv f ) (a + h · u) − (dv f ) (a)
= lim = du (dv f ) (a) .
h→0 h
¤

26
Következmény 69 Legyen U = (u1 , u2 , . . . , un ) ortonormált bázis és f : H ½ R
egy a ∈ H pontban kétszer deriválható függvény. Ekkor minden 1 ≤ k, l ≤ n esetén
(k)
([f 00 (a)]U )(l) = h[f 00 (a)] ul | uk i = dul (duk f ) (a) = ∂l (∂k f ) (a) ,

tehát  
∂1 (∂1 f ) (a)∂2 (∂1 f ) (a) . . . ∂n (∂1 f ) (a)
 ∂1 (∂2 f ) (a) ∂2 (∂2 f ) (a) . . . ∂n (∂2 f ) (a) 
00  
[f (a)]U =  .. .. ... ..  .
 . . . 
∂1 (∂n f ) (a) ∂2 (∂n f ) (a) · · · ∂n (∂n f ) (a)

Definı́ció 70 A fenti [f 00 (a)]U mátrixot az f függvény a helyen vett U bázisbeli


Hesse-mátrixának nevezzük.

Állı́tás 71 Legyen f : H ½ R, a, v ∈ H és t ∈ R, melyekre f kétszer deriválható


a + t · v-ben. Ekkor az fa,v : R ½ R függvény kétszer deriválható t-ben és
00
fa,v (t) = h[f 00 (a + t · v)] v | vi .

Bizonyı́tás: A legutóbbi állı́tás alapján

h[f 00 (a + t · v)] v | vi = dv (dv f ) (a + t · v) =


(dv f ) (a + t · v + h · v) − (dv f ) (a + t · v)
= lim =
h→0 h
0 0
fa,v (t + h) − fa,v (t) 00
= lim = fa,v (t) .
h→0 h
¤

Következmény 72 Ha f : H ½ R kétszer deriválható a-ban, akkor minden v ∈ H


esetén
00
fa,v (0) = h[f 00 (a)] v | vi .

Tétel 73 Legyen U = (u1 , u2 , . . . , un ) ortonormált bázis és f : H ½ R egy olyan


függvény, melynek másodrendű parciális deriváltjai léteznek és folytonosak. Ekkor f
kétszer deriválható.

Bizonyı́tás: Mivel minden 1 ≤ k, l ≤ n esetén ∂l (∂k f ) tetszőleges x ∈ Df


pontban folytonos, ezért ∂k f mindegyik parciális deriváltja létezik és folytonos x-
ben. Így egy korábbi tétel szerint ∂k f deriválható x-ben és
n
X
0
(∂k f ) (x) = ∂l (∂k f ) (x) · uk (∀x ∈ Df ) .
l=1

Ekkor ∂k f folytonos is ∀x ∈ Df pontban ∀1 ≤ k ≤ n esetén, ı́gy ismét a már


hivatkozott tétel szerint f deriválható is ∀x ∈ Df pontban és
n
X
0
f (x) = ∂k f (x) · uk (∀x ∈ Df ) .
k=1

Eszerint ∂1 f, ∂2 f, . . . , ∂n f éppen f 0 koordinátafüggvényei. Ezek deriválhatósága mi-


att az f 0 függvény tetszőleges x ∈ Df pontban deriválható, azaz f kétszer de-
riválható. ¤

27
Állı́tás 74 Legyen A ∈ L (H) önadjungált operátor. Ekkor a QA : H → R,

QA (x) := hAx | xi

kvadratikus alak kétszer deriválható és minden x ∈ H-ra

Q0A (x) = 2Ax


Q00A (x) = 2A.

Bizonyı́tás: Minden x, y ∈ H esetén v = y − x választással

QA (y) − QA (x) = QA (x + v) − QA (x) = hA (x + v) | x + vi − hAx | xi =


= hAx | xi + hAv | xi + hAx | vi + hAv | vi − hAx | xi =
= hv | Axi + hv | Axi + hAv | vi = hy − x | 2Axi + QA (y − x) .

Mivel QA kisrendű 0H -ban, ezért az y 7→ QA (y − x) függvény kisrendű x-ben, ami


azt jelenti, hogy QA deriválható x-ben, és a Definı́ció(∗) szerinti x-beli derivált

Q0A (x) = 2Ax.

Megjegyzés 75 Ha A ∈ L (H) tetszőleges (nem feltétlenül önadjungált) operátor,


akkor minden v ∈ H esetén triviálisan
¿ À
A + A∗
hAv | vi = v|v ,
2
A+A∗
ezért 2
önadjungált volta miatt a fentiekből a QA (x) := hAx | xi leképexésre

Q0A (x) = (A + A∗ ) x és Q00A (x) = A + A∗ .

Lemma 3 Legyen f : H ½ R egy a ∈ H pontban kétszer deriválható olyan függ-


vény, melyre f 0 (a) = 0H és minden v ∈ H-ra h[f 00 (a)] v | vi = 0. Ekkor

f (a + u + v) − f (a + u) − h[f 00 (a)] u | vi
lim =0.
u,v→0H (kuk + kvk)2

Bizonyı́tás: A feltétel szerint az f 0 : H ½ H függvény deriválható a-ban.


Eszerint van olyan q : H ½ H a-ban folytonos függvény, melyre q (a) = 0H és
minden x ∈ Df -re

f 0 (x) = f 0 (x) − f 0 (a) = [f 00 (a)] (x − a) + kx − ak · q (x) .

Legyen ε > 0. A q függvény a-beli folytonossága miatt létezik olyan ¡ r > ¢0 szám,
r
hogy minden x ∈ B (a, r) esetén |q (x)| < ε. Legyenek most u, v ∈ B 0H , 2 . Ekkor
az fa+u,v : [0, 1] → R függvény deriválható és minden t ∈ [0, 1] esetén
0
fa+u,v (t) = hf 0 (a + u + t · v) | vi .

Így a Lagrange-féle középértéktétel alapján ∃0 < ξ < 0, hogy

f (a + u + v) − f (a + u) =

28
0
= fa+u,v (1) − fa+u,v (0) = fa+u,v (ξ) = hf 0 (a + u + ξ · v) | vi =
= h[f 00 (a)] (u + ξ · v) + ku + ξ · vk · q (a + u + ξ · v) | vi =
= h[f 00 (a)] u | vi + ξ · h[f 00 (a)] v | vi + ku + ξ · vk · hq (a + u + ξ · v) | vi =
= h[f 00 (a)] u | vi + ku + ξ · vk · hq (a + u + ξ · v) | vi .

Innen
|f (a + u + v) − f (a + u) − h[f 00 (a)] u | vi| =

= ku + ξ · vk · |hq (a + u + ξ · v) | vi| ≤ (kuk + ξ · kvk) · kq (a + u + ξ · v)k · kvk ≤


≤ (kuk + kvk) · ε · kvk ≤ ε · (kuk + kvk)2 .
¡ ¢
Tehát minden u, v ∈ B 0H , 2r , kuk + kvk 6= 0 esetén

|f (a + u + v) − f (a + u) − h[f 00 (a)] u | vi|


≤ε,
(kuk + kvk)2

amiből következik az állı́tás. ¤

Következmény 76 A fenti lemma feltételei esetén tetszőleges v ∈ H esetén

f (a + t · v) − f (a)
lim =0.
t→0 t2
Bizonyı́tás: Az állı́tás v 6= 0H esetén a lemmából következik v helyére t · v-t és
u helyére 0H -t ı́rva, v = 0H esetén pedig triviális. ¤

Tétel 77 Legyen f : H ½ R egy a ∈ H pontban kétszer deriválható függvény.


Ekkor f 00 (a) ∈ L (H) önadjungált (Young tétele). Továbbá létezik olyan g : Df → R
|g(x)|
függvény, melyre g (a) = 0 és lim kx−ak 2 = 0, valamint minden x ∈ Df esetén
x→a

1
f (x) = f (a) + hf 0 (a) | x − ai + h[f 00 (a)] (x − a) | x − ai + g (x)
2
(másodrendű közelı́tés).

Bizonyı́tás: Jelölje értelemszerűen

g : Df → R,
1
g (x) : = f (x) − f (a) − hf 0 (a) | x − ai − h[f 00 (a)] (x − a) | x − ai .
2
g a feltételek szerint nyilván deriválható és a korábbiak alapján minden x ∈ Df -re

1 £ 00 ∗¤
g 0 (x) = f 0 (x) − f 0 (a) − f (a) + (f 00 (a)) (x − a) ,
2
következésképpen g 0 (a) = 0H . Továbbá g 0 is deriválható a-ban és
1 £ 00 ∗¤ 1 £ 00 ∗¤
g 00 (a) = f 00 (a) − f (a) + (f 00 (a)) = f (a) − (f 00 (a)) ,
2 2
innen azonnal következik, hogy minden v ∈ H-ra

h[g 00 (a)] v | vi = 0 .

29
Tehát g-re fennállnak a lemma feltételei. Így ( v = x − a és u = 0H választással)

g (x) − g (a) g (x)


0 = lim 2 = lim ,
x→a kx − ak x→a kx − ak2

ami g definı́ciója miatt bizonyı́tja a tétel második állı́tását. Ugyancsak a lemma


szerint tetszőleges u, v ∈ H nemnulla vektorokra

g (a + t · u + t · v) − g (a + t · u) − h[g 00 (a)] (t · u) | t · vi
0 = lim =
t→0 (kt · uk + kt · vk)2
g (a + t · u + t · v) − g (a + t · u) − t2 · h[g 00 (a)] u | vi
= lim =
t→0 t2 · (kuk + kvk)2
g (a + t · (u + v)) − g (a) g (a + t · u) − g (a) h[g 00 (a)] u | vi
= lim − lim − .
t→0 t2 · (kuk + kvk)2 t→0 t2 · (kuk + kvk)2 (kuk + kvk)2
h[g 00 (a)]u|vi
A lemma következménye szerint innen (kuk+kvk)2
= 0, azaz

h[g 00 (a)] u | vi = 0

minden u, v ∈ H-ra (ha u vagy v nullvektor, akkor ez az egyenlőség triviális). Esze-


rint g 00 (a) = 0L(H) , azaz f 00 (a) = (f 00 (a))∗ . ¤

Következmény 78 Legyen U = (u1 , u2 , . . . , un ) ortonormált bázis és f : H ½ R.


Ha f kétszer deriválható egy a ∈ H pontban, akkor minden 1 ≤ k, l ≤ n esetén
∂k (∂l f ) (a) = ∂l (∂k f ) (a) . Ha f -nek a másodrendű parciális deriváltjai léteznek és
folytonosak, akkor ∂k (∂l f ) = ∂l (∂k f ) .

A továbbiakban a
∂lk f (a) = ∂l (∂k f ) (a)
és a
∂k2 f (a) = ∂k (∂k f ) (a)
egyszerűsı́tő jelölésekkel fogunk élni. Megjegyezzük, hogy a Young-tétel alatt legtöbben
általában a ∂lk f (a) = ∂kl f (a) egyenlőséget szokták érteni (a megfelelő feltételek
mellett).

2.10 Függvények konvexitásának egy kritériuma


Az alábbiakban legyen X valós normált tér és f : X ½ R olyan függvény, melynek
Df értelmezési tartománya nyı́lt konvex halmaz X-ben.

Lemma 79 Az f függvény pontosan akkor konvex, ha minden x ∈ Df és v ∈ X


esetén fx,v konvex függvény.

Bizonyı́tás: Először jegyezzük meg, hogy minden v ∈ X esetén az fx,v függvény


értelmezési tartománya egy a 0-t tartalmazó nyı́lt intervallum. Namost tegyük föl,
hogy f konvex. Ekkor tetszőleges x ∈ Df és v ∈ X esetén az

f (x + (λ · t + (1 − λ) s)) = f (λ · (x + t · v) + (1 − λ) · (x + s · v))

egyenlőséget felhasználva adódik, hogy fx,v is konvex függvény.

30
Most azt tegyük föl, hogy minden x ∈ Df és v ∈ X esetén fx,v konvex. Ekkor
tetszőleges x, y ∈ Df pontokra v = y − x választással f (x) = fx,v (0) és f (y) =
fx,v (1) (innen persze fx,v értelmezve van [0, 1]-en), ahonnan fx,v konvex volta miatt

f (λ · x + (1 − λ) · y) = f (x + (1 − λ) · v) = fx,v (1 − λ) =

= fx,v (λ · 0 + (1 − λ) · 1) = λ · fx,v (0) + (1 − λ) · fx,v (1) = λ · f (x) + (1 − λ) · f (y) ,


amivel igazoltuk, hogy f konvex függvény. ¤
Most legyen H véges dimenziós valós euklideszi tér és f : H ½ R olyan függvény,
melyre Df nyı́lt konvex halmaz.

Tétel 80 Tegyük föl, hogy f kétszer deriválható. Az f függvény pontosan akkor


konvex, ha minden x ∈ Df mellett f 00 (x) pozitı́v szemidefinit.

Bizonyı́tás: Először tegyük föl, hogy f konvex. Legyen x ∈ Df .Ekkor min-


den v ∈ H esetén fx,v kétszer deriválható valós változós konvex függvény, amely
00
értelmezett a 0-ban; emiatt fx,v (0) ≥ 0. Azaz
00
0 ≤ fx,v (0) = h[f 00 (x)] v | vi

minden v ∈ H esetén, tehát f 00 (x) pozitı́v szemidefinit.


Most azt tegyük föl, hogy minden x ∈ Df esetén f 00 (x) pozitı́v szemidefinit.
00
Ekkor minden x ∈ Df és v ∈ H esetén tetszőleges t ∈ Dfx,v számra fx,v kétszer
deriválható t-ben és
00
fx,v (t) = h[f 00 (x + t · v)] v | vi ≥ 0 .

Tehát fx,v második deriváltja nemnegatı́v, emiatt fx,v konvex függvény. Mivel ez
minden x ∈ Df és v ∈ H mellett igaz, ezért a fenti lemma alapján f is konvex. ¤

2.11 Szélsőértékekre vonatkozó feltételek


Legyen X valós normált tér és f : X ½ R függvény és a ∈ Df . Azt mondjuk,
hogy f -nek a-ban minimuma van, ha minden x ∈ Df esetén f (x) ≥ f (a) . Azt
mondjuk, hogy f -nek a-ban szigorú minimuma van, ha minden x ∈ Df \ {a} esetén
f (x) > f (a) . Azt mondjuk, hogy f -nek a-ban lokális minimuma van, ha a-nak van
olyan U környezete, hogy az f|U függvénynek a-ban minimuma van. Azt mondjuk,
hogy f -nek a-ban szigorú lokális minimuma van, ha a-nak van olyan U környezete,
hogy f|U -nak a-ban szigorú minimuma van.
Hasonlóan definiálható a maximum, a szigorú maximum, a lokális maximum és a
szigorú lokális maximum fogalma. Maximumra és minimumra egyaránt szélsőérték ként
hivatkozunk; ı́gy beszélhetünk egy f függvény a pontbeli szigorú szélsőértékéről,
lokális szélsőértékéről vagy éppen szigorú lokális szélsőértékéről.

Állı́tás 81 Legyen f : X ½ R az a ∈ X pontban deriválható függvény. Ha f -nek


a-ban lokális szélsőértéke van, akkor f 0 (a) = 0X ∗ .

Bizonyı́tás: Tegyük föl, hogy f -nek a-ban lokális minimuma van. Ekkor tetszőleges
v ∈ X esetén az fa,v függvénynek 0-ban lokális minimuma van, ugyanis a feltétel
szerint létezik r > 0, hogy minden x ∈ B (a, r) esetén f (x) ≥ f (a) ; emiatt aztán
r
minden t ∈ R, |t| ≤ kvk+1 esetén

fa,v (t) = f (a + t · v) ≥ f (a) = fa,v (0) .

31
Mivel fa,v közismerten deriválható 0-ban, ezért a Fermat-tétel miatt

[f 0 (a)] v = fa,v
0
(0) = 0

minden v ∈ X-re, tehát f 0 (a) = 0X ∗ . ¤


Konvex függvényekre a fentinél élesebb állı́tás is megfogalmazható:

Tétel 82 Legyen f : X ½ R az a ∈ X pontban deriválható konvex függvény. f -nek


a-ban pontosan akkor van lokális minimuma, ha f 0 (a) = 0X ∗ . Ekkor a minimum
globális is.

Bizonyı́tás: A fenti állı́tás miatt csak az egyik irányt kell igazolnunk. Tegyük
hát föl, hogy f 0 (a) = 0X ∗ . Legyen x ∈ Df . Ekkor v = x − a választással fa,v egy
nyı́lt intervallumon értelmezett konvex függvény, mely deriválható a 0-ban. Ezért
fa,v -nek a 0 helyhez tartozó különbségihányados-függvénye monoton növő, emiatt

fa,v (1) − fa,v (0)


0 = [f 0 (a)] v = fa,v
0
(0) ≤ = f (a + v) − f (a) = f (x) − f (a) ,
1−0
tehát f (x) ≥ f (a) minden x ∈ Df mellett. ¤
A továbbiakban legyen H véges dimenziós valós euklideszi tér.

Állı́tás 83 Legyen f : H ½ R az a ∈ X pontban kétszer deriválható függvény. Ha


f -nek a-ban lokális minimuma van, akkor f 0 (a) = 0H és f 00 (a) pozitı́v szemidefinit.

Bizonyı́tás: Az állı́tás első fele az előző állı́tásból adódik a Definı́ció(∗) szerinti


f (a) ≡ hf 0 (a) | ·i beazonosı́tással. Namármost egy korábbi megjegyzés alapján az
0

fa,v függvény kétszer is deriválható 0-ban és


00
fa,v (0) = dv (dv f ) (a) = h[f 00 (a)] v | vi .

Az előző állı́tásban igazoltak szerint f -nek lokális minimuma van 0-ban. Így a
00
megfelelő klasszikus tétel szerint fa,v (0) ≥ 0, azaz
00
0 ≤ fa,v (0) = h[f 00 (a)] v | vi

minden v ∈ H-ra, tehát az f 00 (a) ∈ L (H) operátor pozitı́v szemidefinit. ¤

Tétel 84 Legyen f : H ½ R az a ∈ X pontban kétszer deriválható függvény. Ha


f 0 (a) = 0H és f 00 (a) pozitı́v definit, akkor f -nek a-ban szigorú lokális minimuma
van.

Bizonyı́tás: Jelölje m az f 00 (a) ∈ L (H) önadjungált operátor legkisebb sajátértékét.


Egy korábbi tétel szerint m > 0 és minden v ∈ H-ra

h[f 00 (a)] v | vi ≥ m · kvk2 .

Egy másik tétel szerint az a-beli kétszeri deriválhatóság miatt van olyan g : Df → R
|g(x)|
függvény, melyre g (a) = 0 és lim kx−ak 2 = 0, valamint minden x ∈ Df esetén
x→a

1
f (x) = f (a) + hf 0 (a) | x − ai + h[f 00 (a)] (x − a) | x − ai + g (x) =
2
1
= f (a) + h[f 00 (a)] (x − a) | x − ai + g (x) .
2

32
Az ε := m4 pozitı́v számhoz ekkor létezik olyan r > 0 szám, hogy minden x ∈ B (a, r)
\ {a} esetén
|g (x)| m
2 ≤ ,
kx − ak 4
ezért
1 1 m
f (x)−f (a) = h[f 00 (a)] (x − a) | x − ai+g (x) ≥ ·m·kx − ak2 − ·kx − ak2 > 0 ,
2 2 4
azaz f (x) > f (a) minden x ∈ B (a, r) \ {a} esetén, ami azt jelenti, hogy f -nek
a-ban szigorú lokális minimuma van. ¤

Feltételes szélsőérték
A matematikai közgazdaságtan oktatásának nagy dilemmája, hogy a közgaz-
dasági problémák már a kezdetek kezdetén is komoly matematikai apparátust igényelnek,
amelynek ismeretét nem túl könnyű elsajátı́tani. Így aztán nyilvánvalóan a mikroökonómiai
tanulmányok megkezdéséig (pláne) nem lehet megtanı́tani és megtanulni a szükséges
nemlineáris funkcionálanalı́zisbeli alapokat. Ez kétszeresen is rossz: egyrészt a
megfelelő matematikai eszközök hiánya nagyon megnehezı́ti a közgazdasági mod-
ell megértését, másrészt a modell nem ismerése vagy nem értése esetén a hallgatók
elképzelni sem tudják, hogy miért éppen olyan az analı́zis-tananyag, mint amilyen.
Tudniillik az alkalmazások mérik meg az apparátus értékét. Ha pedig a két dolog
között nincsen kapcsolat, akkor magyarán mondva a kecske is éhen marad és a
káposzta is kárba vész.
A közgazdaságtan igényeinek a matematikaoktatás lehetőségeivel való megfelelő
összehangolása néha lehetetlennek tűnik. Olyan ez, mintha valakiket egy széles folyó
választana el egymástól, és nem tudnának hidat verni rajta. Ez a néhány oldalnyi
papı́r most a folyó forrásvidékére invitálja a parton lakókat, hogy ott próbáljanak
hidat verni, ahol a folyó még keskeny. Ezen keskeny folyószakasz egyik partját
éppen a többváltozós deriválás eddig tárgyalt eszközei jelentik. A másikat pedig
a legelemibb mikro- ill. makroökonómia. A hı́dépı́tésre pedig talán elég lesz ez a
néhány papı́rlap.
Matematikai szempontból mindez elsősorban feltételes szélsőértékfeladatokat,
mégpedig deriválható függvényekre vonatkozó feltételes szélsőértékfeladatokat je-
lent, illetve ezekre vonatkozó szükséges feltételeket (Lagrange-féle multiplikátorelvek).
Elsőre talán meglepő, hogy ezek közül az ún. ,,tiszta egyenlőtlenségi” tı́pusú felada-
tokra vonatkozó állı́tás technikailag jóval egyszerűbb, mint az ún. ,,egyenlőségi”
tı́pusúakra vonatkozó. Az előbbinek az igazolása deriválási szempontból szinte
súlytalan, lényegi részét lieáris algebrabeli eszközök jelentik. Az utóbbi viszont
erőteljesen támaszkodik az ún. implicitfüggvény-tételre.
Jelen fejezetben tehát először a tiszta egyenlőtlenségi feltételű feladatokat tárgyaljuk,
majd a modern analı́zisben alapvető fontosságú implicitfüggvény-tételt és az egyenlőségi
feltételű Lagrange-féle multiplikátorelvekre való alkalmazásait vesszük sorra. A
kapott tételeken keresztül viszont már vizsgálható néhány közgazdasági jellegű fela-
dat.
Természetesen mindezzel távolról sem oldjuk meg a fentiekben vázolt problémákat.
Komolyabb közgazdasági feladatok esetén nem lehet kikerülni sem a nemlineáris
analı́zis jóval erőteljesebb eszközeit, sem a közgazdasági folyamatok mélyebb vizsgálatát.
A tiszta egyenlőtlenségi feltételű feladatok előtt közbeiktatunk egy lineáris alge-
brai kitérőt.

33
3 A Farkas-tétel és szektoroid változata
A továbbiakban jelölje R− := (−∞, 0] és Ro− := (−∞, 0) .
Tétel 85 (Farkas) Legyen X valós vektortér és ϕ, ϕ1 , ϕ2 , . . . , ϕm ∈ X 0 lineáris
funcionálok. Ha
m
\
ϕ−1
k (R− ) ⊆ ϕ
−1
(R− ) ,
k=1
akkor ϕ előáll a ϕ1 , ϕ2 , . . . , ϕm funkcionálok nemnegatı́v kombinációjaként.
Bizonyı́tás: m-re vonatkozó teljes indukcióval bizonyı́tunk.
m = 1-re: Legyen X valós vektortér és tegyük föl, hogy ϕ, ϕ1 ∈ X 0 és ϕ−1
1 (R− ) ⊆
ϕ−1 (R− ) . Minden x ∈ ker ϕ1 esetén ebből ϕx ≤ 0, ugyanezt −x-re is alkalmazva
ϕx = 0, tehát ker ϕ1 ⊆ ker ϕ. Így alkalmas c ∈ R számmal ϕ = c · ϕ1 . Ha most
ϕ1 = 0, akkor nincs mit bizonyı́tanunk. Ellenkező esetben van olyan v ∈ X vektor,
amelyre ϕ1 v < 0. Innen a tartalmazási feltevés miatt ϕv ≤ 0, ahonnan
ϕv
c= ≥0.
ϕ1 v
Ezzel az m = 1 eset kész.
Most tegyük föl, hogy az állı́tás m-re igaz, és ebből bizonyı́tsunk m+1-re. Legyen
hát X valós vektortér és ϕ, ϕ1 , ϕ2 , . . . , ϕm+1 ∈ X 0 olyan lineáris funcionálok, ame-
lyekre
m+1
\
ϕ−1k (R− ) ⊆ ϕ
−1
(R− ) .
k=1
T
m
Ha most ϕ−1
k (R− ) ⊆ ϕ
−1
(R− ) is fennáll, akkor az indukciós feltevés alapján
k=1
készen vagyunk. Ellenkező esetben van olyan v ∈ X vektor, amelyre ϕ1 v, . . . , ϕm v ≤
0, de ϕv > 0, és ı́gy persze ϕm+1 v > 0. Legyen most L := ker ϕm+1 . Alkalmazzuk az
indukciós feltevést a leszűkı́tett ϕ |L , ϕ1 |L , . . . , ϕm |L funkcionálokra: nyilván
m
\ m
\ m+1
\
−1
(ϕk |L ) (R− ) = L ∩ ϕ−1
k (R− ) = L ∩ ϕ−1
k (R− ) ⊆
k=1 k=1 k=1
−1 −1
⊆ L∩ϕ (R− ) = (ϕ |L ) (R− ) ,
ı́gy az indukciós feltételµmiatt vannak ¶
olyan λ1 , λ2 , . . . , λm ≥ 0 skalárok, hogy ϕ |L =
Pm Pm
λk · ϕk |L , ahonnan ϕ − λk ϕk |L azonosan nulla. Eszerint
k=1 k=1
à m
!
X
ker ϕm+1 = L ⊆ ker ϕ − λk ϕk .
k=1

Így aztán van olyan c ∈ R szám, hogy


m
X
ϕ− λk ϕk = c · ϕm+1 .
k=1

P
m
Ekkor persze ϕv − λk ϕk v = c · ϕm+1 v. Mivel ϕv > 0 ≥ ϕ1 v, . . . , ϕm v, ı́gy a
k=1
baloldal pozitı́v, tehát c · ϕm+1 v > 0, ahonnan ϕm+1 v > 0 miatt c > 0, ı́gy
m
X
ϕ= λk ϕk + cϕm+1
k=1

34
nemnegatı́v együtthatójú előállı́tás. Ezzel az állı́tás m+1-re igazolt, amivel tételünk
bizonyı́tást nyert. ¤

Következmény 86 Legyen E euklideszi tér és C = cone (a1 , a2 , . . . , am ) ⊆ E


véges kúp. Tetszőleges a ∈ C −− = {a1 , a2 , . . . , am }−− esetén a Farkas-tételt az
h· | ai , h· | a1 i , . . . , h· | am i funkcionálokra alkalmazva éppen azt kapjuk, hogy a ∈ C,
ahonnan C −− = C minden C véges kúpra. Ez utóbbi a Farkas-tétel egyik leggyakrab-
ban megfogalmazott alakja.

Definı́ció 87 Az x1 , x2 , . . . , xn ∈ X vektorokat szektoroid helyzetűeknek mond-


juk, ha 0X nem áll elő nemtriviális nemnegatı́v kombinációjukként:
n
X
α1 , α2 , . . . , αn ≥ 0, αk xk = 0X =⇒ α1 = α2 = · · · = αn = 0 .
k=1

A szektoroid helyzetűség a lineáris függetlenségnél persze jóval gyengébb tula-


jdonság. (Pl. a sı́k egy origó csúcsú α < π szögű szögtartományba eső akárhány
vektor szektoroid helyzetű.) Megjegyezzük, hogy az x1 , x2 , . . . , xn ∈ X vektorok
pontosan akkor szektoroid helyzetűek, ha konvex burkuk nem tartalmazza az origót,
vagy ami nemnulla vektorok esetén ezzel ekvivalens: kúpburkuk nem tartalmaz
egyenest.

Lemma 88 Legyenek ϕ1 , ϕ2 , . . . , ϕm ∈ X 0 szektoroid helyzetű funcionálok. Ekkor


T
m ¡ o¢
ϕ−1
k R− 6= ∅.
k=1

Bizonyı́tás: Először gondoljuk meg, hogy minden 1 ≤ p ≤ m indexre


m
\
ϕ−1
k (R− ) * ker ϕp .
k=1

Ugyanis ellenkező esetben


m
\ ¡ ¢
ϕ−1
k (R− ) ⊆ ker ϕp ⊆ −ϕp (R− ) ,
k=1

ı́gy a Farkas-tétel miatt −ϕp benne volna ϕ1 , ϕ2 , . . . , ϕm kúpburkában, ellentmondva


ϕ1 , ϕ2 , . . . , ϕm szektoroiditásának. Ezért hát minden 1 ≤ p ≤ m esetén létezik
m
\
vp ∈ ϕ−1
k (R− ) \ ker ϕp
k=1

vektor. Mivel ı́gy minden 1 ≤ k, p ≤ m esetén ϕk vp ≤ 0 és ϕk vk < 0, ezért


w := v1 + · · · + vm választással minden k-ra ϕk w < 0, azaz
m
\ ¡ o¢
w∈ ϕ−1
k R− .
k=1

¤
Most pedig következzék a Farkas-tétel szektoroid változata.

35
Tétel 89 Legyenek ϕ1 , ϕ2 , . . . , ϕm ∈ X 0 szektoroid helyzetű funkcionálok. Ha egy
további ϕ ∈ X 0 funkcionálra
m
\ ¡ o¢
ϕ−1
k R− ⊆ ϕ−1 (R− ) ,
k=1

akkor ϕ előáll a ϕ1 , ϕ2 , . . . , ϕm funkcionálok nemnegatı́v kombinációjaként.

Bizonyı́tás: Csak a Farkas-tétel feltételét kell leellenőriznünk. A fenti lemma


T
m ¡ o¢ Tm
miatt létezik w ∈ ϕ−1
k R − vektor. Namost tetszőleges x ∈ ϕ−1
k (R− ) és t > 0
k=1 k=1
esetén triviálisan minden k-ra

ϕk (x + tw) = ϕk x + t · ϕk w < 0 ,

tehát m
\ ¡ o¢
x + tw ∈ ϕ−1
k R− ⊆ ϕ−1 (R− ) ,
k=1

azaz ϕx + t · ϕw = ϕ (x + tw) ≤ 0, ahonnan t → 0 határátmenettel ϕx ≤ 0. Ezzel


megmutattuk, hogy
m
\
ϕ−1
k (R− ) ⊆ ϕ
−1
(R− ) ,
k=1

amit akartunk. ¤

4 A sima programozási feladat


Megjegyzés 90 Legyen g : R ½ R a 0-ban deriválható függvény, továbbá g 0 (0) <
0. Ekkor 0-nak egy alkalmas nyı́lt jobboldali környezetében g kisebb, mint g (0).

Legyen X valós normált tér, G ⊆ X nyı́lt halmaz, m1 , m2 , . . . , mn ∈ R, továbbá


f, f1 , . . . , fn : G → R függvények. Tekintsük az

 f (x) → max
(1) x∈G

f1 (x) ≤ m1 , f2 (x) ≤ m2 , · · · , fn (x) ≤ mn

szélsőértékfeladatot. Ezen feladat megoldásán értelemszerűen egy olyan x ∈ G


vektort értünk, melyre igaz, hogy

K := {y ∈ G : f1 (y) ≤ m1 , f2 (y) ≤ m2 , · · · , fn (y) ≤ mn }

definı́cióval x ∈ K, továbbá K bármely y elemére

f (x) ≥ f (y) .

K elemeit az (1) feladat megengedett megoldásainak, az f függvényt a feladat


célfüggvényének, a sup f számot a feladat értékének, a feladat megoldásait pedig
K
optimális megoldásoknak is szokás nevezni.

36
Tétel 91 Tegyük fel, hogy a ∈ G megoldása az (1) feladatnak, továbbá f, f1 , . . . , fn
deriválhatók a-ban és az
(fk0 (a) : 1 ≤ k ≤ n, fk (a) = mk )
vektorrendszer szektoroid helyzetű. Ekkor vannak olyan λ1 , λ2 , . . . , λn nemnegatı́v
skalárok, hogy
Xn
0
f (a) = λk fk0 (a) ,
k=1

továbbá minden 1 ≤ k ≤ n esetén λk · (fk (a) − mk ) = 0 (komplementaritási


feltételek).
Bizonyı́tás: Jelölje A az fk (a) = mk tulajonságú
T k0 indexek összességét, B pedig
−1 ¡ o ¢
az fk (a) < mk tulajdonságúakét. Legyen v ∈ [fk (a)] R− . Ekkor minden
k∈A
0
k ∈ A esetén [fk0 (a)] v < 0, azaz az fk,a,v : t 7→ fk (a + tv) függvényre fk,a,v (0) < 0,
és persze fk,a,v (0) = fk (a) . Így minden k ∈ A-ra a fenti megjegyzés miatt van 0-nak
olyan nyı́lt jobbkörnyezete, hogy a benne levő t-kre fk (a + tv) = fk,a,v (t) kisebb,
mint fk (a) = mk . Innen A véges volta miatt 0-nak olyan nyı́lt H1 jobbkörnyezete is
van, hogy minden t ∈ H1 és k ∈ A esetén fk (a + tv) < mk .
Ugyanakkor minden k ∈ B-re fk a-beli folytonossága és fk (a) < mk miatt a 0
egy alkalmas nyı́lt jobbkörnyezetében levő t-kre fk (a + tv) < mk . Innen B véges
volta miatt 0-nak olyan nyı́lt H2 jobbkörnyezete is van, hogy minden t ∈ H2 és
k ∈ B esetén fk (a + tv) < mk .
Namost minden t ∈ H1 ∩ H2 esetén a + tv ∈ G, továbbá minden 1 ≤ k ≤ n
mellett
fk (a + tv) < mk ,
ı́gy mivel a megoldása (1)-nek, ezért f (a) ≥ f (a + tv) . Mivel ez minden t ∈ H1 ∩H2 -
re fennáll, ı́gy a fa,v : t 7→ f (a + tv) függvénynek 0-ban lokális jobbróli maximuma
0
van, ezért e függvény 0-beli deriválhatósága miatt triviálisan fa,v (0) ≤ 0, azaz
[f 0 (a)] v ≤ 0 ,
tehát v ∈ [f 0 (a)]−1 (R− ) . Ezzel megmutattuk, hogy
\ −1 ¡ o ¢ −1
[fk0 (a)] R− ⊆ [f 0 (a)] (R− ) ,
k∈A

ı́gy az fk0 (a) (k ∈ A) funkcionálok szektoroiditása alapján a legutóbbi tétel miatt


f 0 (a) előáll az {fk0 (a)P
: k ∈ A} funkcionálok nemnegatı́v kombinációjaként. Azaz
0 0
f (a) előáll f (a) = λk fk0 (a) alakban, ahol λk ≥ 0 (k ∈ A) . Namost k ∈ B
k∈A
esetén λk = 0 választással azonnal adódik az állı́tás. ¤
Megjegyzés 92 A feltételi függvények gradienseinek szektoroiditására vonatkozó
feltétel önmagában nem hagyható el. n = 1 esetén f (x, y) = x − y 2 és f1 (x, y) = x2 ,
m1 = 0 választással (1)-nek megoldása (0, 0) , de f 0 (0, 0) = [1, 0] , ami nem függ
lineárisan f10 (0, 0) = [0, 0]-tól.
Példa 93 Oldjuk meg a

 xy + yz → max
(2) x2 − y 2 + z 2 ≤ 2
 2
x + y 2 + z 2 ≤ 10
feladatot!

37
Megoldás: Vegyük észre, hogy létezik megengedett megoldás (már az origó is az),
továbbá a második egyenlőtlenség egy kompakt gömbre lokalizálja a feladatot, ame-
lynek ı́gy a Weierstraß-tétel miatt biztosan létezik optimális megoldása is. Legyen
(x, y, z) egy tetszőleges optimális megoldás.
Most (x, y, z) kétféle lehet: vagy teljesı́ti a fenti tételben állı́tott nemnegatı́v
előállı́tási feltételt, vagy a feltételi függvények rajta vett gradiensvektorai nem szek-
toroidok. Ez utóbbi eset azt jelenti, hogy [2x, −2y, 2z] és [2x, 2y, 2z] egymásnak
nempozitı́v számszorosai, ahonnan rövid kalkulációval x = z = 0. Az ilyen tulaj-
donságú megengedett megoldásokon a célfüggvényérték 0.
Most tekintsük a visszamaradó esetet, tehát amelyben az (x, y, z)-beli feltételi
függvények gradiensvektorai szektoroidok. Ekkor a fenti tétel értelmében (x, y, z)-
ban a célfüggvény gradiense előáll a feltételi függvények gradiensének nemnegatı́v
kombinációjanként, és a komplementaritási feltételek is teljesülnek, azaz
y = (λ1 + λ2 ) · 2x
x + z = (λ2 − λ1 ) · 2y
y = (λ1 + λ2 ) · 2z
λ1 , λ 2 ≥ 0
λ1 · (x2 − y 2 + z 2 − 2) = 0
λ2 · (x2 + y 2 + z 2 − 10) = 0
I. eset: x + z = 0. Ezeken a vektorokon a célfüggvényérték 0.
II. eset: x + z 6= 0. Ekkor λ1 6= λ2 (⇒ λ1 + λ2 > 0) és y 6= 0, ahonnan pedig
x, z 6= 0. Innen viszont x = z. Ebből pedig y = (λ1 + λ2 ) q · 2x és 2x = (λ2 − λ1 ) · 2y
¡ 2 ¢
alapján y = λ2 − λ1 · 2y, tehát λ2 − λ1 = 21 . Innen λ2 = 12 + λ21 > 0. Innen pedig
2 2 2

a komplementaritásból x2 + y 2 + z 2 √= 10. √
II/a eset: λ1 = 0. Ekkor λ2 = 22 és y = 2x, ahonnan az eddigiekből x2 +
q
2x + x = 10, innen pedig x = ± 52 . Tehát (x, y, z) erre az esetre kapott értékei
2 2
³q √ q ´ ³ q √ q ´ √
5 5 5 5
2
, 5, 2
és − 2
, − 5, − 2
. Ezeken a célfüggvényérték 5 2.
II/b eset: λ1 > 0. Ekkor újra a komplementaritásból x2 − y 2 + z 2 = 2 (és per-
sze továbbra¡√is x2 +√y 2¢+¡√
z 2 = 10).√ Innen
¢ ¡ √ y 2 = 4, tehát
√ ¢ ¡x = √z miatt √a szóbajöhető
¢
megoldások 3, 2, 3 , 3, −2, 3 , − 3, 2, − 3 , − 3, −2, − 3 közül kerülhetnek
√ √ √ √
ki. Ezeken a célfüggvényérték rendre 4 3, −4 3, −4 √ 3, 4 3.
³qA kapott eseteket összevetve aq
√ q5´ ³ q5 √
feladat
´ értéke 5 2, és az optimális megoldások
5 5
2
, 5, 2 és − 2 , − 5, − 2 .

Megjegyzés 94 Tekintsük azt a feladatot, amely az (1) feladatból úgy keletkezik,


hogy az egyenlőtlenségek helyett mindenütt egyenlőséget követelünk meg. Ezzel már
egy egészen más természetű feladathoz jutunk. Ha valaki azt gondolná, hogy – a
lineáris programozásban szokásoshoz hasonló módon – vezessük vissza ezt a feladatot
a már ismertre, az fk (x) = mk feltételeket kicserélve az fk (x) ≤ mk és −fk (x) ≤
−mk feltételek együttesére (ı́gy összesen 2n számú feltételhez jutva) és az ı́gy kapott
feladatra alkalmazzuk a fentieket, ez bizony ı́gy nem megy. Tudniillik most a
(fk0 (a) , : 1 ≤ k ≤ n, fk (a) = mk ) ∪ (−fk0 (a) , : 1 ≤ k ≤ n, fk (a) = mk )
vektorrendszer szektoroid helyzetű voltát kellene megkı́vánnunk, márpedig ez ellentett
vektorpárokból áll. A szektoroiditás ugyanis pontosan azt jelenti, hogy a szóbanforgó
vektorok kúpburkában nincsenek egymással szembenéző vektorok.
Az egyenlőségi feltételű szélsőértékfeladatokhoz szükségünk lesz az ún. implic-
itfüggvény-tételre, amely az eddigieknél jóval súlyosabb analı́zisbeli eszközt jelent.

38
5 Az implicitfüggvény-tétel egy változata
A különböző, matematikai modelleket alkalmazó tudományokban (fizika, közgazda-
ságtan, stb.) gyakran találkozunk a következő tı́pusú sokváltozós egyenlettel:
f (x1 , x2 , . . . , xn ) = m,
ahol m egy adott vektortér egy eleme. Az ilyen egyenletek megoldása sokszor nem
egyértelmű, sőt a megoldáshalmaz sokszor nem is véges, tehát a megoldásokat sem
tudjuk felsorolni. Ilyenkor a megoldáshalmazt már akkor is adottnak tekintjük, ha
az n darab változó közül bizonyosakat ki tudunk fejezni a többi változó segı́tségével,
azaz bizonyos változókat a többi - már szabad - változó valamilyen g függvényeként
adunk meg, s az ı́gy előálló szám-n-esek képezik a megoldáshalmazt.
Tekintsük például a kétváltozós f : R2 → R,
f (x, y) := p · x + q · y függvényt, ahol p, q ∈ R adott számok. Gondoljunk
(ismét) arra, hogy p és q kétféle termék egységárát jelenti, s valaki erre a két
termékre akarja rákölteni a jól meghatározott m mennyiségű jövedelmét. Ekkor
a választási lehetőségeit a p · x + q · y = m egyenlet adja meg. (Az f most éppen
a költségfüggvény.) Ha q 6= 0, akkor ezen egyenlet megoldásaira y = m−px q
, azaz
m−px
g (x) := q definı́cióval az (x, g (x)) alakú párok szolgáltatják a megoldáshalmazt,
azaz az illető személy választási lehetőségeit, ezen lehetőségek feltételi halmazát.
Látjuk, hogy ez a probléma a költségfüggvény linearitása miatt nagyon egyszerűen
tárgyalható.
Nemlineáris esetben a helyzet valamivel bonyolultabb, de a lineáris esettel telje-
sen analóg, ha lineárisról deriválható függvényekre térünk át. Ekkor az apparátus
természetéből fakadóan az illető egyenletnek nyilván csak lokális megoldásait vizsgáljuk.
Ilyen megoldások létezését garantálja az ún. implicitfüggvény-tétel, amely a
matematikai analı́zis egyik leggyakrabban használt tétele. Ehhez szükségünk lesz
némi előkészületre.
Tétel 95 (Banach-féle fixponttétel) Legyen (X, d) teljes metrikus tér, x0 ∈ X
és r > 0, valamint h : B (x0 , r) → X olyan függvény, amelyre minden x, y ∈ B (x0 , r)
esetén
1
d (h (x) , h (y)) ≤ d (x, y) ,
2
r
továbbá d (x0 , h (x0 )) ≤ 2 . Ekkor létezik egy és csak egy olyan x∗ ∈ B (x0 , r) pont,
amelyre h (x∗ ) = x∗ .
Bizonyı́tás: Az egyértelműség
1
d (x∗ , y∗ ) = d (h (x∗ ) , h (y∗ )) ≤ d (x∗ , y∗ )
2
alapján triviális. A létezéshez definiáljuk rekurzióval a d (xn , xn−1 ) ≤ 2rn és d (xn , x0 ) ≤
¡ ¢
1 − 21n r tulajdonságú (xn ) ⊆ B (x0 , r) sorozatot: x1 := h (x0 ) , és ı́gy persze
d (x1 , x0 ) ≤ 2r ; ha pedig már xn definiált, akkor legyen xn+1 := h (xn ) , ekkor
1 r
d (xn+1 , xn ) = d (h (xn ) , h (xn−1 )) ≤ d (xn , xn−1 ) ≤ n+1 ,
2 2
r
¡ ¢ ¡ ¢
innen pedig d (xn+1 , x0 ) ≤ d (xn+1 , xn )+d (xn , x0 ) ≤ 2n+1 + 1 − 21n r = 1 − 2n+1
1
r.
Ezzel a kı́vánt tulajdonságú (xn ) sorozat jóldefiniált. E tulajdonságok alapján
tetszőleges m < n természetes számokra
n
X n
X r r
d (xn , xm ) ≤ d (xk , xk−1 ) ≤ k
< m ,
k=m+1 k=m+1
2 2

39
ahonnan azonnal adódik, hogy (xn ) Cauchy-sorozat. Mivel d teljes, ezért (xn ) tart
egy x∗ ∈ X ponthoz. Mivel pedig mindegyik xn eleme a zárt B (x0 , r) gömbnek,
ezért x∗ is. ¤
o
Lemma 96 Legyen X valós Hilbert-tér és f : r · B X → X olyan folytonos, r · BX -en
deriválható függvény, amelyre minden x ∈ r · BX o
esetén kI − f 0 (x)k ≤ 12 , továbbá
kf (0)k ≤ 2r . Ekkor létezik egy és csak egy olyan x ∈ r · B X pont, amelyre f (x) = 0.
o
Bizonyı́tás: h := I − f is deriválható r · BX -en és minden itteni x-re kh0 (x)k =
kI − f 0 (x)k ≤ 21 . Ekkor minden x, y ∈ r · B X esetén a Lagrange-középértéktételt a
p (t) := hh (x) − h (y) | h (tx + (1 − t) y)i függvényre alkalmazva alkalmas 0 < ξ < 1
számmal

kh (x) − h (y)k2 = p (1) − p (0) = p0 (ξ) = hh (x) − h (y) | [h0 (ξx + (1 − ξ) y)] (x − y)i ≤
≤ kh (x) − h (y)k · kh0 (ξx + (1 − ξ) y)k · kx − yk ≤
1
≤ kh (x) − h (y)k · · kx − yk ,
2
ahonnan kh (x) − h (y)k ≤ 12 kx − yk . Így a h függvényre az x0 = 0 pont vonatkozásában
fennállnak a Banach-féle fixponttétel feltételei. Ezért létezik egy és csak egy olyan
x ∈ r · B X pont, amelyre h (x) = x, azaz f (x) = 0. ¤
A továbbiakban legyen X valós normált tér és Y valós Hilbert-tér. A

k(x, y)kX×Y := kxkX + kykY

normával triviálisan X × Y is normált tér. Legyen továbbá f : X × Y ½ Y adott


függvény. Jelölje (x, y) ∈ X × Y esetén

∂X f (x, y) := (f (·, y))0 (x) ,

amennyiben ez utóbbi derivált létezik, illetve

∂Y f (x, y) := (f (x, ·))0 (y) ,

amennyiben ez utóbbi derivált létezik. Persze ∂X f (x, y) ∈ L (X, Y ) , mı́g ∂Y f (x, y) ∈


L (Y ) .

Tétel 97 (implicitfüggvény-tétel) Tegyük fel, hogy a ∂X f és ∂Y f függvények


léteznek a (0, 0) ∈ X ×Y pont egy környezetében és (0, 0)-ban folytonosak is, továbbá
f (0, 0) = 0 és ∂Y f (0, 0) ∈ L (Y ) folytonos inverzű izomorfizmus. Ekkor léteznek
o
olyan δ és r pozitı́v számok, valamint
¡ g ¢: δ · BX → r · B Y 0-ban deriválható függvény,
o
hogy minden (x, y) ∈ (δ · BX ) × r · B Y esetén

f (x, y) = 0 ⇐⇒ y = g (x) .
o
Ebből adódólag tehát minden x ∈ δ · BX esetén f (x, g (x)) = 0, továbbá

g(0) = 0 és g 0 (0) = − [∂Y f (0, 0)]−1 · ∂X f (0, 0) .

Bizonyı́tás: Feltehető, hogy ∂Y f (0, 0) = I (ellenkező esetben térjünk f felyett


e
az f := [∂Y f (0, 0)]−1 ◦ f függvényre). ∂Y f (0, 0)-beli folytonossága miatt van olyan
r > 0 szám,¡hogy minden
¢ ¡ ¢
(x, y) ∈ r · B X × r · B Y esetén
1
kI − ∂Y f (x, y)k ≤ .
2

40
Továbbá f (·, 0) 0-beli folytonossága miatt van olyan 0 < δ ≤ r szám, hogy minden
kxk < δ mellett
r
kf (x, 0)k ≤ .
2
o
Mindez pontosan azt jelenti, hogy minden x ∈ δ · BX esetén az f (x, ·) függvényre
o
fennállnak a fenti lemma feltételei. Ezért minden x ∈ δ · BX vektorhoz létezik
egy és csak egy olyan yx ∈ r · B Y vektor, amellyel f (x, yx ) = 0. Ez pontosan azt
o
jelenti, hogy a g : ¡δ · BX ¢→ r · B X , g (x) := yx függvényre teljesül, hogy minden
o
(x, y) ∈ (δ · BX ) × r · B X esetén

f (x, y) = 0 ⇐⇒ y = g (x) .

Meg kell mutatnunk, hogy g deriválható a 0-ban. Ehhez elegendő megmutatnunk,


o
hogy a g + f (·, 0) függvény 0-ban kisrendű. E célból tetszőleges rögzı́tett x ∈ δ · BX
esetén jelölje q : [0, 1] → R,

q (s) := hg (x) + f (x, 0) | f (x, s · g (x) + (s − 1) · f (x, 0))i .

Ekkor q-ra alkalmazható a Lagrange-középértéktétel, eszerint alkalmas 0 < ξ < 1


számmal

hg (x) + f (x, 0) | −f (x, −f (x, 0))i = q (1) − q (0) = q 0 (ξ) =≥

= hg (x) + f (x, 0) | [∂Y f (x, ξ · g (x) + (ξ − 1) · f (x, 0))] (g (x) + f (x, 0))i =
= kg (x) + f (x, 0)k2 + hg (x) + f (x, 0) | [∂Y f (x, ξ · g (x) + (ξ − 1) · f (x, 0)) − I] (g (x) + f (x, 0))i ≥
≥ kg (x) + f (x, 0)k2 − kg (x) + f (x, 0)k · k∂Y f (x, ξ · g (x) + (ξ − 1) · f (x, 0))k · kg (x) + f (x, 0)k ≥
1 1
≥ kg (x) + f (x, 0)k2 − kg (x) + f (x, 0)k2 = kg (x) + f (t, 0)k2 ,
2 2
ahonnan
1
kg (x) + f (x, 0)k · kf (x, −f (x, 0))k ≥ kg (x) + f (x, 0)k2 ,
2
tehát
kg (x) + f (x, 0)k ≤ 2 kf (x, −f (x, 0))k .
Az x 7→ f (x, −f (x, 0)) függvény persze 0-ban deriválható és deriváltja 0 (∂Y f (0, 0) =
I miatt), tehát e függvény 0-ban kisrendű. Így a legutóbbi egyenlőtlenség miatt
g + f (·, 0) is kisrendű a 0-ban, tehát f (·, 0) deriválhatósága miatt g is deriválható
a 0-ban, továbbá g(0) = 0, és

g 0 (0) = − (f (·, 0))0 (0) = −∂X f (0, 0) ,

ami ∂Y f (0, 0) = I miatt bizonyı́tja is az állı́tást. ¤

Következmény 98 Tegyük fel, hogy a ∂X f és ∂Y f függvények léteznek és folytonosak


az (a, b) ∈ X × Y pont egy környezetében, továbbá f (a, b) = 0 és ∂Y f (a, b) ∈ L (Y )
folytonos inverzű izomorfizmus. Ekkor léteznek olyan δ és r pozitı́v számok, valamint
o o
¢ X → r · B Y deriválható függvény, hogy minden (x, y) ∈ (a + δ · BX ) ×
¡g : a + δ · B
b + r · B Y esetén
f (x, y) = 0 ⇐⇒ x = g (y) .
o
Ebből adódólag tehát minden x ∈ (a + δ · BX ) esetén f (x, g (x)) = 0, továbbá

g(a) = b és g 0 (x) = − [∂Y f (x, g (x))]−1 · ∂X f (x, g (x)) .

41
P
+∞
Bizonyı́tás: Triviálisan látható, hogy A ∈ L (Y ) , kI − Ak < 1 esetén a (I − A)k
k=0
sor L (Y )-ben konvergens és összege éppen inverze A-nak. Innen rövid kalkulációval
1
adódik, hogy k∂Y f (a, b) − Ak < [∂ f (a,b)] esetén is van folytonos inverze A-nak.
k X −1
k
Így ∂Y f folytonossága miatt (a, b) egy alkalmas nyı́lt környezetében levő (x, y)-okra
létezik [∂Y f (x, y)]−1 ∈ L (Y ) . Feltehető, hogy f eleve csak ebben a környezetben
értelmezett. Namost alkalmazzuk a fenti tételt először az (x, y) 7→ f (a + x, b + y)
o
függvényre, eszerint léteznek olyan δ és r pozitı́v számok, valamint
¡ gb :¢ δ ·BX → r ·B Y
o
0-ban deriválható függvény, hogy minden (x, y) ∈ (δ · BX ) × r · B Y esetén

f (a + x, b + y) = 0 ⇐⇒ y = gb (x) .
o
¡ ¢
Persze g (x) := b + gb (x − a) választással minden (x, y) ∈ (a + δ · BX ) × b + r · BY
esetén
f (x, y) = 0 ⇐⇒ y = g (x) .
o
Vegyük észre, hogy tetszőleges x ∈ a+δ·BX esetén az f1 : (u, y) 7→ f (u + x, y + g (x))
függvényre is teljesülnek a fenti tétel feltételei. Így e tétel szerint létezik a 0-ban
deriválható g1 : X ½ Y függvény, hogy (0, 0) egy környezetében levő (u, y)-okra

f1 (u, y) = 0 ⇐⇒ y = g1 (u) .

Ugyanakkor g választása miatt 0 egy alkalmas környezetében

0 = f (u + x, g (u + x)) = f1 (u, g (u + x) − g (x)) ,

ahonnan a g1 -re vonatkozó egyértelműségi feltétel miatt

g (u + x) − g (x) = g1 (u) ,

ami miatt g deriválható x-ben és újra a fenti tétel alapján

g 0 (x) = g10 (0) = − [∂Y f1 (0, 0)]−1 ·∂X f1 (0, 0) = − [∂Y f (x, g (x))]−1 (∂X f (x, g (x))) .

Megjegyzés 99 A közgazdászok között szokásos formalizmus természetszerűleg eltér


a matematikai bizonyı́tásokhoz csiszolódott nyelvezettől. A kettő közötti átjárhatóság
megvilágı́tása érdekében fogalmazzuk át a tételt a közgazdászok által használt formálisabb
nyelvre. Az implicitfüggvény-tétel lényegében azt mondja, hogy az f (x, y) = 0 tu-
lajdonságú (x, y) párok halmazában az y vektor függvénye az x vektornak. Ezért
egyszerűen sokszor csak y-t ı́runk g (x) helyett és y 0 -t g 0 (x) helyett (tehát magát a
függvényt is éppúgy y-nal jelöljük, mint az Y -ra eső vetületet). Persze ennek csak
az f (x, y) = 0 feltétel szem előtt tartása mellett van értelme. Ekkor úgy is fogal-
mazhatunk, hogy y függvénye x-nek az f (x, y) = 0 feltételre nézve. Ezzel a
formalizmussal az implicitfüggvény-tétel alapján a következő mondható: a megfelelő
feltételek mellett az (a, b) pont körül az f (x, y) = 0 feltételre nézve y függvénye
x-nek, továbbá

y 0 = − [∂Y f (x, y)]−1 · ∂X f (x, y) és (x = a ⇒ y = b) .


dy
y 0 helyett dx is szokásos jelölés.
Szokás továbbá élni a – lineáris algebrában amúgy is megszokott – következő
szemléletes elnevezésekkel: az X tér elemeit a tétel alkalmazása során szabad változóknak,

42
magát az X teret a szabad változók terének, az Y tér elemeit kötött változóknak,
magát az Y teret pedig a kötött változók terének mondjuk.
Ebben a szövegösszefüggésben az implicit függvény deriváltjára vonatkozó fenti
tételbeli formula (véges dimenzióban) technikailag a következőképpen ragadható meg:

A kötött változók szabad változók szerinti parciális


deriváltjaiból álló mátrix ı́gy kapható;
A feltételi egyenletrendszer együtthatófüggvényének képezzük
a kötött változók szerinti deriváltmátrixát; majd e mátrix
inverzét; végül ezzel az inverzzel szorozzuk meg az
együtthatófüggvény szabad változók szerinti deriváltmátrixát,
és az egészet szorozzuk be − 1-gyel.

1 + 1 dimenzióban persze (X = Y = R esetén) ez arra egyszerűsödik, hogy pl.


a második (kötött) változónak az első (szabad) változó szerinti deriváltja a megfelelő
helyen vett parciális deriváltak hányadosának ellentettje:

∂1 f (x, y)
y0 = − .
∂2 f (x, y)

Példa 100 Tekintsük a sı́kon (ekkor X = Y = R) az

f (x, y) = ex+y + x + y − 1 = 0

egyenletet. Világos, hogy f (0, 0) = 0 és ∂2 f (0, 0) = 2, ı́gy az origóban teljesülnek


az implicitfüggvény-tétel feltételei. Tehát található egyetlen olyan folytonosan de-
riválható y = g(x) függvény a 0 pont egy környezetében, amelyre a fenti egyenlet
azonosság. Erre a függvényre a tételből a fenti formalizmussal

ex+y + 1
y0 = − = −1 és (x = 0 ⇒ y = 0)
ex+y + 1
adódik, azaz y = −x, amelyet az f (x, y) = 0 egyenletbe ı́rva valóban azonossághoz
jutunk.
Az y változó kifejezhetőségét általában persze nem algebrai értelemben kell értenünk,
tehát előfordulhat, hogy a g függvény létezését igazolni tudjuk, de azt algebrai átalakı́-
tásokkal a fenti egyenletből nem tudjuk előállı́tani. (Amikor igen, az általában túl
átlátszó dolog, miként e példa is.) Sőt az implicitfüggvény-tétel úgyszólván éppen az
algebrailag kifejezhetetlen esetekről szól.

Példa 101 Tekintsük például az

ex+y − 2 cos y + 1 = 0

egyenletet. Az implicitfüggvény-tétel szerint ez az egyenlet az origó egy alkalmas


téglalap alakú környezetében egy folytonosan deriválható függvényt definiál, azaz ott
létezik pontosan egy olyan g folytonosan deriválható függvény, amelyre g(0) = 0, és

ex+g(x) − 2 cos g (x) + 1 = 0

minden x esetén, de az y változó (vagy ami ugyanaz: g (x)) az egyenletből algebrai


átalakı́tásokkal nem fejezhető ki.

43
Megjegyzés 102 Kettőnél több változó esetén különösen gyakori eset, hogy az im-
plicitfüggvény-tétel feltételei fennállnak, de maguk az implicit függvényeket alge-
brai átalakı́tásokkal nem tudjuk (vagy túl bonyolult) kifejezni, ám ehhez képest de-
riváltjaik mégiscsak egyszerűbben számolhatók ki. Ilyenkor a sok fölösleges számolás
helyett egyszerűen ellenőrizzük az implicitfüggvény-tétel feltételeit, majd a kötött
változókat a szabad változók függvényének tekintve számolunk a kötött változóknak
a szabad változók szerinti deriváltjaival, a fenti ,,recept” szerint.

Példa 103 A hatváltozós


y 2 − z + u − v − w3 = −1
−2x + y − z 2 + u + v 3 − w = −3
x2 + z − u − v + w3 = 3

egyenletrendszernek P = (x, y, z, u, v, w) = (1, 1, 0, −1, 0, 1) persze megoldása. A


rendszert egyetlen (vektor-) egyenletnek tekintve a baloldal egy hatváltozós, háromértékű
f függvény. A P pontban ekkor
 
1 −1 −3
∂(u,v,w) (1, 1, 0, −1, 0, 1) =  1 0 −1  ,
1 −1 3

ami reguláris, tehát (1, 1, 0) egy környezetében tényleg egyértelműen létezik deriválható
g : R3 ½ R3 , g (1, 1, 0) = (−1, 0, 1) tulajdonságú implicitfüggvény. Tehát P egy
környezetében az u, v, w kötött változók deriválható függvényei az, x, y, z szabad
változóknak. Ám messze nem triviális, hogyan néz ki ez a függés. Ugyanakkor
u, v és w – mint x, y, z függvényei – (1, 1, 0)-beli parciális deriváltjai egyszerűen
£ ¤−1 ¡ ¢
számolhatók. Például az x szerinti deriváltak − ∂(u,v,w) f (P ) ∂(x,y,z) f (P ) első
oszlopában jelentkeznek:
£ ¤−1 ¡ ¢ £ ¤−1 ¡ ¢
− ∂(u,v,w) f (P ) ∂(x,y,z) f (P ) e1 = − ∂(u,v,w) f (P ) ∂(x) f (P ) =
 −1        
1 −1 −3 0 1 −6 −1 0 5
1 1
= − 1 0 −1  ·  −2  =  4 −6 2  ·  −2  =  8  ,
6 3
1 −1 3 2 1 0 −1 2 −1
azaz
du 5 dv 8 dw 1
(1, 1, 0) = , (1, 1, 0) = , (1, 1, 0) = − .
dx 3 dx 3 dx 3
Megjegyzés 104 Többváltozós függvények formális implicit deriválása során az
ember gyakran szı́vesen eltekintene az implicitfüggvény-tétel ∂Y f (a, b) regularitására
vonatkozó feltételének leellenőrzésétől. Ez minden további nélkül azonban nem tehető
meg. Az f (x, y) = x2 függvény (0, 0)-ban 0, de nyilvánvalóan nem létezik hozzá im-
plicit függvény: bármely g-re f (x, g (x)) = x2 , ami persze nem azonosan 0. Az
f (x, y) = x − y 2 függvényhez (0, 0)-ban már van implicit függvény, de deriválható
implicit függvény nincsen. Persze mindkét esetben ∂2 f (0, 0) = 0.

6 Egyenlőségi feltételi halmazú szélsőértékfeladatok


A következőkben az implicitfüggvény-tétellel felfegyverkezve rátérhetünk az egyenlőségi
tı́pusú feltételes szélsőértékfeladatokat vizsgálatára.
Legyen X normált tér, Y Hilbert-tér, G ⊆ X × Y nyı́lt halmaz, m0 ∈ Y, továbbá
f : G → R deriválható és F : G → Y folytonosan deriválható függvény.

44
Tekintsük a következő ún. feltételes szélsőértékfeladatot:

 f (x) → max
(1) x∈G

F (x) = m0 .
Ezen feladat megoldásán értelemszerűen egy olyan x ∈ G vektort értünk, melyre
igaz, hogy
K := {y ∈ G : F (y) = m0 }
definı́cióval x ∈ K, továbbá K bármely y elemére
f (x) ≥ f (y) .
K elemeit az (1) feladat megengedett megoldásainak, az f függvényt a feladat
célfüggvényének, a sup f számot a feladat értékének, a feladat megoldásait pedig op-
K
timális megoldásoknak is szokás nevezni. Ilyen tı́pusú feladatra fontos példa a tiszta
egyenlőtlenségi feladatnál
Pn már emlı́tett közgazdasági probléma ,,egyenlőségi
Pn tı́pusú”
verziója, tehát ha a k=1 pk ·xk ≤ m0 feltétel helyett egyszerűen a k=1 pk ·xk = m0
feltételre térve.
Mivel általában nem teljesül, hogy az (1) feladat egy megoldása a K halmaz
belsejében van, ı́gy az f 0 (x) = 0(X×Y )∗ alakú szükséges feltétel sem lesz feltétlenül
igaz. Valamit azonban mégis tudunk mondani, nevezetesen az f és F függvények
x-beli deriváltja között egy jól használható kapcsolatot adunk meg. (Ezen kapc-
solatnak a fent emlı́tett közgazdasági feladatra kivetı́tett jelentését a tétel után
vizsgáljuk.) Az ilyen, ún. deriválható tı́pusú Lagrange-féle multiplikátorelvek közül
az egyik legegyszerűbb esetet tárgyaljuk az alábbi tételben.
Tétel 105 Tegyük fel, hogy (a, b) ∈ G megoldása az (1) feladatnak, továbbá ∂Y F (a, b) ∈
L (Y ) folytonos inverzű izomorfizmus. Ekkor létezik olyan ` ∈ Y ∗ , melyre
f 0 (a, b) = ` · F 0 (a, b) .
Bizonyı́tás: Alkalmazzuk az implicifüggvény-tételt (a következményét) az F −
m0 függvényre. Eszerint léteznek olyan δ és r pozitı́v számok, valamint g : a + δ ·
o o
BX → r·B Y deriválható függvény, hogy minden x ∈ (a + δ · BX ) esetén F (x, g (x)) =
m0 , továbbá
g(a) = b és g 0 (a) = − [∂Y F (a, b)]−1 · ∂X F (a, b) .
o o
Jelölje h : a + δ · BX → R, h(x) := f (x, g (x)). Ekkor minden x ∈ a + δ · BX esetén
az a pont megoldás volta miatt
h (a) = f (a, b) ≥ f (x, g (x)) = h (x) ,
tehát h-nak az a pontban lokális maximuma van.
Másrészt f deriválható, ezért a kompozı́ciófüggvényre vonatkozó deriválási szabály
alapján h is deriválható, ı́gy a Fermat-féle tétel szerint h0 (a) = 0, tehát
0 = h0 (0) = ∂X f (a, b)+∂Y f (a, b)·g 0 (a) = ∂X f (a, b)−∂Y f (a, b)·[∂Y F (a, b)]−1 ·∂X F (a, b) ,
azaz ` := ∂Y f (a, b) · [∂Y F (a, b)]−1 választással e legutóbbi egyenlőségből
∂X f (a, b) = ` · ∂X F (a, b) ,
másrészt közvetlenül ` definı́ciójából
∂Y f (a, b) = ` · ∂Y F (a, b) .
Ezekből azonnal f 0 (a, b) = ` · F 0 (a, b) . ¤

45
Definı́ció 106 Az (1) feladat feltételei esetén jelölje

L:G×Y∗ →R,

L (x, `) := f (x) − `(F (x) − m0 ).

Az L függvényt az (1) feladathoz tartozó Lagrange-függvénynek nevezzük.

Következmény 107 Ha (a, b) ∈ G megoldása (1)-nek, akkor létezik olyan λ ∈ R,


melyre
∂X×Y L ((a, b) , `) = (L (·, `))0 (a) = 0X ∗ .

Megjegyzés 108 A fenti tételben (és következményben) szereplő λ ∈ R számot


Lagrange-multiplikátornak (illetve néha az (1) feladathoz tartozó határhaszonnak
( marginal value)) is szokás nevezni. (Nemsokára megvilágı́tjuk ezen elnevezés hátterét.)

A következőkben a Lagrange-elv egy olyan alakját fogalmazzuk meg, amelyben


a ,,megengedett” vektorok normált tere nem feltétlenül ,,szorzattér alakban” adott.
Az alábbi megjegyzés triviális lineáris algebrai kalkulációval adódik.

Megjegyzés 109 Legyen X valós normált tér és Y véges dimenziós euklideszi tér.
Ha létezik szürjektı́v A ∈ L (X, Y ) operátor, akkor létezik olyan C : X → (ker A)×Y
folytonos izomorfizmus, amelynek az inverze is folytonos, továbbá minden x ∈ ker A
esetén Cx = (x, 0) .

Mostantól legyen X normált tér, Y véges dimenziós euklideszi tér, G ⊆ X nyı́lt


halmaz, m0 ∈ Y, továbbá f : G → R deriválható és F : G → Y folytonosan
deriválható függvény.
Tekintsük a következő ún. feltételes szélsőértékfeladatot:

 f (x) → max
(2) x∈G

F (x) = m0 .

A legutóbbi megjegyzésből az azt megelőző tételből triviálisan adódik az alábbi


tétel:

Tétel 110 Tegyük fel, hogy a ∈ G megoldása az (2) feladatnak, továbbá im F 0 (a) =
Y . Ekkor létezik olyan ` ∈ Y ∗ , amelyre

f 0 (a) = ` · F 0 (a) .

Bizonyı́tás: A legutóbbi megjegyzés szerint létezik olyan C : X → (ker F 0 (a))×


Y folytonos izomorfizmus, amelynek az inverze is folytonos, továbbá minden x ∈
ker F 0 (a) esetén Cx = (x, 0) . Persze ı́gy egy y ∈ Y vektorra (0, y) pontosan akkor
esik ker (F 0 (a) · C −1 ) = (ker F 0 (a)) × {0}-ba, ha y = 0. Ugyanakkor triviálisan
£ ¡ ¢ ¤ £ ¤
∂Y F ◦ C −1 (C (a)) y = F 0 (a) · C −1 (0, y) ,

tehát ker ∂Y (F ◦ C −1 ) (C (a)) = {0} , azaz ∂Y (F ◦ C −1 ) (C (a)) véges dimenziós


izomorfizmus. Ezzel az f ◦ C −1 és F ◦ C −1 függvényekre a C (a) pontban fennállnak
a legutóbbi tétel feltételei. Ebből pedig éppen a kı́vánt állı́tás adódik. ¤

46
Megjegyzés 111 A fenti eredmény a következőképpen is fogalmazható: legyen X
valós normált tér, G ⊆ X nyı́lt halmaz, m1 , m2 , . . . , mn ∈ R, továbbá f : G → R
deriválható és f1 , . . . , fn : G → Y folytonosan deriválható függvények. Tekintsük a

 f (x) → max
(20 ) x∈G

f1 (x) = m1 , f2 (x) = m2 , · · · , fn (x) = mn

szélsőértékfeladatot. Az ehhez tartozó Lagrange-függvény

L : G × Rn → R ,
n
X
L (x, λ1 , λ2 , . . . , λn ) := f (x) − λk · (fk (x) − mk ) .
k=1

Ha most x megoldása (20 )-nek és f10 (x) , f20 (x) , . . . , fn0 (x) lineárisan függetlenek,
akkor a
d
L (x, λ1 , λ2 , . . . , λn ) = 0X ∗
dx
d
L (x, λ1 , λ2 , . . . , λn ) = 0
dλ1
..
.
d
L (x, λ1 , λ2 , . . . , λn ) = 0
dλn
egyenletrendszert az x vektor alkalmas λ1 , λ2 , . . . , λn ∈ R számokkal együtt kielégı́ti.
(Ezek közül az első (vektor)egyenlet a gyakorlatban persze legtöbbször maga is több
egyenletből álló rendszer, amelyekben az egyenlőségek baloldalát képező külső függvények
az L függvénynek az x komponensei szerinti parciális deriválással adódnak. A többi
egyenlet pedig éppen a feltételi egyenleteket jelenti.) A fenti egyenletrendszer egyen-
leteit Lagrange-feltételeknek is szokás mondani.

Megjegyzés 112 A feltételi függvények gradienseinek lineáris függetlenségére vonatkozó


feltétel önmagában nem hagyható el, éppúgy mint a szektoroiditás sem volt elhagy-
ható az egyenlőtlenségi feltételű feladatra vonatkozó tételben. n = 1 esetén f (x, y) =
x − y 2 és f1 (x, y) = x2 , m1 = 0 választással (1)-nek megoldása (0, 0) , de f 0 (0, 0) =
[1, 0] , ami nem függ lineárisan f10 (0, 0) = [0, 0]-tól.

Megjegyzés 113 Most megkı́séreljük a Lagrange-szorzó határhaszon elnevezésének


közgazdaságtani hátterét megvilágı́tani, de csak a legegyszerűbb esetben.
Az (1) ill. (2) feladatban az F (x) = m0 feltétel általában egy valamilyen fel-
használandó pénzmennyiség rögzı́tett voltára utal. Ettől feltételes a szélsőértékfel-
adat. Persze sokszor előfordulhat, hogy ez a rendelkezésre álló összeg is változik.
De az optimalizálás mindig egy rögzı́tett összegre nézve történik. Vizsgáljuk meg,
hogyan módosul az eredeti feladat a feltételi halmaz ilyetén változtatása során. Az
elhangzottakból kitűnik, hogy nem maga az F függvény változik ilyenkor, csak az
F (x) = m0 feltétel módosul valamilyen F (x) = m alakúra.
Tekintsük tetszőleges m ∈ Y esetén a következő feladatot:

 f (x) → max
(2m ) x∈G

F (x) = m.

47
A (2m ) feladatok együttesét a (2) feladat perturbációs feladatrendszerének nevezzük.
Nyilván m = m0 esetén kapjuk vissza az eredeti (2) feladatot.
Tegyük föl, hogy m0 egy U környezetében fekvő m-ekre van (2m )-nek megoldása,
sőt létezik A : U → X deriválható függvény, melyre A(m) megoldása (2m )-nek. Azt
is tegyük föl az egyszerűség kedvéért, hogy mindegyik F 0 (x) szürjektı́v.
A (2m ) feladat optimális értékét jelölje V (m), azaz V (m) := sup{f (x) : F (x) =
m}.Ezzel definiáltunk egy V : U → R függvényt, amelyet a (2) feladathoz tartozó
értékfüggvénynek nevezünk. Persze az A(m) megoldás volta miatt most minden m-re

V (m) = f (A(m)).

Így V deriválható és minden m-re

V 0 (m) = f 0 (A(m)) · A0 (m) .

Másrészt a (2m ) feladatra alkalmazva tételünket, nyerjük, hogy létezik olyan `(m) ∈
Y ∗ funkcionál, melyre
f 0 (A(m)) = `(m) · F 0 (A(m)) .
Innen
V 0 (m) = `(m) · [F 0 (A(m)) · A0 (m)] .
Ugyanakkor A(m)megoldás volta miatt

F (A(m)) = m,

ebből pedig deriválással


F 0 (A(m)) · A0 (m) = IY .
Ezen utóbbi három formula miatt

V 0 (m) = λ(m) · IY = `(m) .

Tehát a ` (m) Lagrange-szorzóvektor nem más, mint az értékfüggvény m-ben vett de-
riváltja. Így a (2) feladathoz tartozó ` Lagrange-szorzóvektor éppen az értékfüggvény
m0 -beli deriváltja. Ezek szerint a ` vektor azt méri, hogy az anyagi erőforrások
megváltozása esetén milyen intenzitással változik meg az optimális haszon.

Példa 114 Oldjuk meg tetszőleges m > 0 esetén a



 x · y → max
(3) (x, y) ∈ R2
 2
x + y2 = m

feladatot és határozzuk meg a hozzá tartozó értékfüggvényt!

Megoldás: Az (1) feladat jelöléseivel f (x, y) = x · y és F (x, y) = x2 + y 2 . Így


∂1 f (x, y) = y és ∂2 f (x, y) = x, továbbá ∂1 F (x, y) = 2x és ∂2 F (x, y) = 2y. Ezért ha
(a, b) megoldása (3)-nak, akkor a Lagrange-elv szerint létezik λ ∈ R, hogy

[b, a] = λ · [2a, 2b].

Az a szám nyilván nem lehet 0, mivel ekkor b is 0 lenne, ellentmondásban az a2 +b2 =


m > 0 feltétellel. Így

a = λ · 2b = λ · 2 · λ · 2a = 4λ2 · a

48
alapján 4λ2 = 1. Innen λ = ± 21 , tehát a = b vagy a = −b. Behelyettesı́tve az
egyenlőség-feltételbe, mindenképpen azt kapjuk, hogy 2a2 = m, azaz a megoldások
csak
µr r ¶ µ r r ¶ µr r ¶ µ r r ¶
m m m m m m m m
, , − ,− , ,− , − ,
2 2 2 2 2 2 2 2
közül kerülhetnek ki. Az f függvény értéke az első két helyen m2 , a második két
helyen − m2 . Mivel kompaktsági megfontolások miatt (3)-nak úgyis van megoldása,
ezért a fenti első két számpár valóban a megoldásokat szolgáltatja. Tehát (3) op-
timális értéke m2 , azaz az értékfüggvényre
m
V (m) = .
2
Példa 115 Oldjuk meg a
 2
 (y + z − 3) → min
(4) x2 + y + z = 2

x + y 2 + 2z = 2
feladatot!
Megoldás: Vegyük észre, hogy van megengedett megoldás, pl. x = y = 1, z = 0,
amelyen a célfüggvény értéke 4. Az optimális megoldás(ok)hoz nyilván elegendő azon
megengedett megoldásokat vizsgálnunk, amelyeken a célfüggvény értéke legfeljebb 4.
E megoldások halmazán y +z korlátos halmazt fut be, következésképp x is, ahonnan
könnyen látható, hogy y is. Tehát van olyan R3 -beli korlátos zárt (=kompakt)
halmaz, amelyre (4)-et leszűkı́tve a kapott feladat optimális megoldásai egybeesnek
az eredeti (4) feladat optimális megoldásaival. A leszűkı́tett feladatnak a Weierstraß-
tétel miatt van optimális megoldása, ı́gy (4)-nek is van.
(4) minden optimális megoldása vagy kielégı́ti a Lagrange-feltételeket, vagy a
feltételi függvények rajta vett gradiensvektorai lineárisan összefüggnek. Ez utóbbi
eset azt jelenti, hogy [2x, 1, 1] és [1, 2y, 2] lineárisan összefüggnek. Ekkor x = 14 ,
y = 1. Ezekhez viszont nincs olyan z érték, amellyel mindkét feltételi egyenlet
fennállna. Ez azt jelenti, hogy minden szóbajöhető optimális megoldás kielégı́ti a
legutóbbi tétel feltételeit, ezért aztán a Lagrange-feltételeket is. Ezek:
0 = 2λ1 x + λ2
2y + 2z − 6 = λ1 + 2λ2 y
2y + 2z − 6 = λ1 + 2λ2
x2 + y + z = 2
x + y 2 + 2z = 2
Innen azonnal λ2 y = λ2 .
I. eset: λ2 = 0. Ha most λ1 = 0 is fennáll, akkor y + z = 3, ami a negyedik
egyenlet miatt nem teljesülhet. Ha viszont λ1 6= 0, akkor x = 0, továbbá y + z = 2
és y 2 + 2z = 2, ahonnan y 2 − 2y = −2, aminek nincs megoldása. Ebből az esetből
tehát nincs megoldás.
II. eset: λ2 6= 0. Ekkor y = 1. Innen x2 +z = 1 és x+2z = 1, ahonnan 2x2 −x = 1.
Ennek megoldásai x1 = 1 és x2 = − 12 .
Ha x = 1, akkor z = 0 (és persze y = 1).
Ha x = − 12 , akkor z = 43 (és y = 1).
Mivel a feladatnak van optimális megoldása, ezért az optimális megoldások
ez
¡ 1utóbbi ¢ kettő között vannak. Behelyettesı́tve a célfüggvénybe, (1, 1, 0)-nál 4,
3 25 25
¡− 21 , 1, 43 ¢-nél pedig 16 adódik.Tehát a feladat értéke 16 és a megoldás (x, y, z) =
− 2 , 1, 4 .

49

You might also like