You are on page 1of 156

Kozma László

Matematikai alapok

2. kiegészı́tett kiadás

Debrecen, 2004
Egyetemi jegyzet, kézirat, 2004
2. kiegészı́tett kiadás

Kiadó: Studium ’96 Bt., Debrecen


Nyomda: Alföldi Nyomda Rt., Debrecen
Az összeállı́tás olyan I. éves hallgatók számára készült, akik nem főszakként
tanulják a matematikát (közgazdász, programtervező, mérnök, stb. szakos hall-
gatók), de mégis alapos matematikai ismeretekre van szükségük tanulmányaikhoz.
A bemutatott anyag az analı́zis és a lineáris algebra alapvető fogalmait és
összefüggéseit tárgyalja, illetve bevezetésként néhány, a matematika minden
területén használatos fogalmat. Szemléltető példákkal, kidolgozott feladatokkal
az összeállı́tást nem bővı́tettük, ezért az előadások és szemináriumok látogatása
melegen javasolt.

Egy matematikai elmélet alapfogalmakból, axiómákból, definı́ciókból, tételek-


ből és bizonyı́tásokból áll. Az alapfogalmakat nem definiáljuk, hanem éppen az
axiómák által — a kiindulási pontként igaznak elfogadott kijelentések által —
vannak meghatározva. Éppen annyi tulajdonságot, összefüggést tudunk róluk,
amennyit az axiómák kifejeznek. Az elmélet kiépı́tése során a már ismert fogalmak
segı́tségével újabb fogalmakat határozunk meg, idegen szóval definiálunk. A
fogalmak közötti összefüggésekre állı́tásokat mondunk ki. Az elméletben egy
állı́tás (kijelentés) akkor igaz — s ilyenkor az elmélet tételének tekintjük, — ha
bebizonyı́tható, azaz logikailag helyes következtetési módszerekkel levezethető az
axiómákból, s a már ismert tételekből.
Nem célunk, és nincs is arra lehetőségünk, hogy ilyen ún. axiomatikus mate-
matikai elméleteket fejtsünk ki. Csak a módszer néhány vonását alkalmazzuk a
pontosabb matematikai gondolkozás fejlesztése érdekében. Állı́tásaink legtöbbször
”ha ...(feltétel) ..., akkor ...(következmény)...” tı́pusúak, ami azt jelenti, hogy
a feltétel teljesülése esetén a következmény is teljesül. A bizonyı́tás módszere
lehet ún. direkt, amikor a feltételből helyes logikai következtetési lépésekkel
jutunk el a következményhez, vagy lehet ún. indirekt, amikor a következmény
tagadásából (hamis voltának feltételezéséből) jutunk ellentmondásra. Amennyiben
az állı́tásunk azt fejezi ki, hogy valamely kijelentés minden természetes számra
teljesül, akkor alkalmazhatjuk az ún. teljes indukciós bizonyı́tást: először belátjuk,
hogy az állı́tás teljesül n = 1 esetén, majd azt, hogy ha tetszőleges n-re igaz az
állı́tás, akkor n + 1 esetén is.
Gyakran használjuk a következő jelöléseket és rövidı́téseket:
N — a természetes számok halmaza
Z — az egész számok halmaza
Q — a racionális számok halmaza
R — a valós számok halmaza
A matematikai állı́tások megfogalmazásakor alkalmazzuk a következő logikai
jeleket:
∀ — minden, bármely, teszőleges
∃ — létezik, van olyan

3
4
Tartalomjegyzék

1. Halmazok és relációk 9


1.1 Halmazműveletek . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Függvény – leképezés . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Halmazok számossága . . . . . . . . . . . . . . . . . . . . . . . . . 12

2. A valós számokról 13

3. Komplex számok 17
3.1 A komplex számsı́k . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Komplex szám n-edik gyöke . . . . . . . . . . . . . . . . . . . . . . 20

4. Sorozatok konvergenciája 23
4.1 Műveletek konvergens sorozatokkal . . . . . . . . . . . . . . . . . . 24
4.2 A konvergencia monotonitása . . . . . . . . . . . . . . . . . . . . . 25
4.3 Valós számsorozat tágabb értelemben vett határértéke . . . . . . . 26
4.4 Nevezetes határértékek . . . . . . . . . . . . . . . . . . . . . . . . . 26

5. Számsorok és hatványsorok 31


5.1 Számsorok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.2 Pozitı́v tagú sorok konvergenciakritériumai . . . . . . . . . . . . . 32
5.3 Hatványsorok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

6. Függvények határértéke és folytonossága 37


6.1 Határérték . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6.2 Folytonosság . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.3 Folytonos függvények tulajdonságai . . . . . . . . . . . . . . . . . . 40
6.4 Elemi függvények folytonossága . . . . . . . . . . . . . . . . . . . . 42
6.5 Néhány függvény határértéke . . . . . . . . . . . . . . . . . . . . . 43
6.6 A határérték fogalom kiterjesztése . . . . . . . . . . . . . . . . . . 44

7. Differenciálás 47
7.1 Differenciálhányados és deriváltfüggvény . . . . . . . . . . . . . . . 47
7.2 A monotonitás és a differenciálhatóság kapcsolata . . . . . . . . . . 50
7.3 L’Hospital szabály . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5
6 TARTALOMJEGYZÉK

7.4 Magasabb rendű deriváltak . . . . . . . . . . . . . . . . . . . . . . 56


7.5 Konvexitás és a deriváltak kapcsolata . . . . . . . . . . . . . . . . 56
7.6 Taylor polinom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.7 A függvény szélsőértéke létezésének feltételei . . . . . . . . . . . . 60

8. Többváltozós függvények 63
8.1 Rn metrikus fogalmai . . . . . . . . . . . . . . . . . . . . . . . . . 63
8.2 Határérték és folytonosság . . . . . . . . . . . . . . . . . . . . . . . 64
8.3 Többváltozós függvények differenciálhatósága . . . . . . . . . . . . 65
8.4 Magasabb rendű parciális deriváltak . . . . . . . . . . . . . . . . . 67
8.5 Kétváltozós függvények szélsőértéke . . . . . . . . . . . . . . . . . 68
8.6 Feltételes szélsőérték-számı́tás . . . . . . . . . . . . . . . . . . . . . 69

9. Határozatlan integrál 75
9.1 Alapintegrálok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
9.2 Integrálási szabályok . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.3 Racionális törtfüggvények integrálása . . . . . . . . . . . . . . . . . 78

10. Határozott integrál 81


10.1 Alapfogalom és tulajdonságok . . . . . . . . . . . . . . . . . . . . . 81
10.2 Newton-Leibniz tétel . . . . . . . . . . . . . . . . . . . . . . . . . . 84
10.3 Integrálási szabályok . . . . . . . . . . . . . . . . . . . . . . . . . . 85
10.4 Alkalmazások . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
10.5 Improprius integrálok . . . . . . . . . . . . . . . . . . . . . . . . . 89

11. Kettős integrál 91


11.1 A kettős integrál fogalma . . . . . . . . . . . . . . . . . . . . . . . 91
11.2 Szukcesszı́v integrálás . . . . . . . . . . . . . . . . . . . . . . . . . 93
11.3 Többszörös integrál . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

12. Differenciálegyenletek 97
12.1 Elsőrendű differenciálegyenlet . . . . . . . . . . . . . . . . . . . . . 97
12.2 Szétválasztható differenciálegyenletek . . . . . . . . . . . . . . . . 99
12.3 Lineáris differenciálegyenlet . . . . . . . . . . . . . . . . . . . . . . 100

13. Vektorterek 103


13.1 Lineáris függőség . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
13.2 Bázis és dimenzió . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
13.3 Altér és rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

14. Determinánsok 109


14.1 Kifejtési tétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
14.2 Rangszámtétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
TARTALOMJEGYZÉK 7

15. Lineáris egyenletrendszerek 117


15.1 Gauss elimináció . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
15.2 Mátrixszámı́tás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
15.21. Mátrixműveletek . . . . . . . . . . . . . . . . . . . . . . . . 121
15.3 Lineáris egyenletrendszerek megoldhatósága . . . . . . . . . . . . . 122
15.4 A lineáris egyenletrendszer megoldáshalmaza . . . . . . . . . . . . 124

16. Euklideszi terek 127


16.1 A belső szorzat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
16.2 Ortogonalitás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
16.3 Legkisebb négyzetek módszere . . . . . . . . . . . . . . . . . . . . . 133

17. Lineáris transzformációk 135


17.1 Lineáris leképezés, defektus és rang . . . . . . . . . . . . . . . . . . 135
17.2 Lineáris transzformáció mátrixa . . . . . . . . . . . . . . . . . . . . 137
17.3 Sajátérték-probléma . . . . . . . . . . . . . . . . . . . . . . . . . . 139

18. Az euklideszi terek transzformációi 143


18.1 Szimmetrikus és ortogonális mátrixok . . . . . . . . . . . . . . . . 143
18.2 Szimmetrikus és ortogonális transzformációk . . . . . . . . . . . . . 144
18.3 Kvadratikus formák . . . . . . . . . . . . . . . . . . . . . . . . . . 147

19. Lineáris programozás 149


8 TARTALOMJEGYZÉK
1. Halmazok és relációk

A halmaz és a halmaz elemének fogalma alapfogalom. Szemléletesen mondhatjuk,


hogy a halmaz bizonyos tulajdonságokkal rendelkező dolgok összessége, a halmaz
elemeiből áll, vagy hogy egy halmaz elemei által van meghatározva. A halmazokat
legtöbbször latin nagy betűvel, az elemeit pedig latin kis betűvel jelöljük. Az
a ∈ A jelölés annak a rövidı́tése, hogy az a eleme az A halmaznak.
A halmazokat legtöbbször az elemeit jellemző tulajdonság kijelölésével adjuk
meg. Véges sok elemet tartalmazó halmaz esetében egyszerűbb a halmaz elemeinek
felsorolása. Pl. A = {1, 2, 3, 4}. Amennyiben egy tulajdonság kijelölésével adunk
meg egy halmazt, annak eldöntése, hogy egy adott dolog a halmazhoz tartozik-e,
sokszor kisebb-nagyobb nehézséget okoz, vagy éppen megoldhatatlan probléma.
Pl. A = {x|x ∈ N, x osztója 1993 − nak}. Egy halmaznak természetesen nemcsak
számok lehetnek az elemei, hanem bármi, pl. függvények, sőt halmazok is. Az
olyan halmazt, amelynek egyetlen eleme sincs, üres halmaznak nevezzük, jele: ∅.
Két halmazt egyenlőnek mondunk, ha elemeik ugyanazok. Az A halmazt a B
halmaz részhalmazának nevezzük, ha A minden eleme B-nek is eleme. Jelölése:
A ⊂ B. Így minden halmaz önmagának részhalmaza, s az üres halmaz is minden
halmaznak részhalmaza. A valódi részhalmaza B-nek, ha A ⊂ B, de A 6= B. A
részhalmaz fogalmát felhasználva mondhatjuk, hogy két halmaz pontosan akkor
egyenlő, ha mindkettő része a másiknak, azaz bármelyikük minden eleme a másik
halmaznak is eleme.

1.1 Halmazműveletek
Megadott halmazokból újabb halmazokat képezhetünk a következő műveletekkel:
Definı́ció. Az A és B halmazok unióján (másszóval egyesı́tésén) azt a A ∪ B-
vel jelölt halmazt értjük, melynek elemei A és B közül legalább az egyiknek
elemei. A és B metszete az a A ∩ B-vel jelölt halmaz, melynek elemei mind
A-nak, mind B-nek elemei. Ha A ⊂ B, akkor az A halmaz B-re vonatkozó
komplementerének (kiegészı́tő halmazának) nevezzük azt a A-vel jelölt halmazt,
mely B olyan elemeiből áll, amelyek nincsenek A-ban.

9
10 1. HALMAZOK ÉS RELÁCIÓK

Megjegyzés.

1. A komplementerképzés jelében célszerű lenne kifejezni, hogy a B alaphal-


mazra vonatkozóan történik, de nem szokás. Az alaphalmaz kijelölése mindig
szükséges, ha komplementert kı́vánunk képezni. Ha sok halmazzal dolgo-
zunk, kézenfekvő olyan alaphalmazt választani, amely az összeset tartal-
mazza. Nyilvánvalóan A ⊂ B és A = A teljesül.

2. A fenti alapműveletek segı́tségével újabb műveletek is definiálhatók, pl. a


különbségképzés: A \ B := A ∩ B, stb.

3. Ha két halmaz metszete az üres halmaz, azaz A ∩ B = ∅, akkor


diszjunktaknak (idegeneknek) mondjuk őket. Ilyenkor A-nak és B-nek nincs
közös eleme.

4. Jelekkel e definiciókat ı́gy fejezhetjük ki:

A∪B := {x| x ∈ A vagy x ∈ B}


A∩B := {x| x ∈ A és x ∈ B}

5. Több halmaz — akár végtelen sok is — metszetét, illetve egyesı́tését is e


definı́ciónak megfelelően értelmezhetjük:

∩∞
i=1 Ai = {x| ∀i esetén x ∈ Ai }

∪∞
i=1 Ai = {x| ∃i hogy x ∈ Ai }

A halmazműveletekre vonatkozóan teljesülnek a következő azonosságok:

Állı́tás.
A∪B = B∪A A∩B = B∩A
(A ∪ B) ∪ C = A ∪ (B ∪ C) (A ∩ B) ∩ C = A ∩ (B ∩ C)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A ∩ (A ∪ B) = A A ∪ (A ∩ B) = A
A∪A = A A∩A = A
A∪B = A∩B A∩B = A∪B

Megjegyzés.

1. A fenti számolási szabályok az ún. Boole algebrák axiómái. Ez azt jelenti,


hogy egy alaphalmaz összes részhalmazai a halmazok fent definiált szokásos
műveleteivel Boole algebrát alkotnak. Az utolsó két azonosságot de Morgan
azonosságnak nevezzük.
1.1. HALMAZMŰVELETEK 11

2. Megfigyelhetjük, hogy ha a baloldali azonosságcsoportban a metszet- és az


unióképzés jelét felcseréljük, akkor a jobboldali azonosságokhoz jutunk. Ezt
nevezik a Boole algebrák dualitási tulajdonságának. Ez azzal a következ-
ménnyel is jár, hogy ha egy, a halmazok műveleteire levezetett összefüggés-
ben felcseréljük a metszet- és unióképzés jelét, akkor egy újabb, ’duális’
összefüggéshez jutunk.

Definı́ció. Az A és B halmazok Descartes szorzatán (direkt szorzatán) azt a


halmazt értjük, amelynek elemei az A és B elemeiből képezhető rendezett párok;
jele: A × B.

Megjegyzés.

1. A Descartes szorzat képzésében résztvevő két halmaz lehet azonos is.


Ilyen esetben az {(a, a)|a ∈ A} ⊂ A × A halmazt a Descartes szorzat
diagonálisának mondjuk.

2. Véges sok A1 , . . . , An halmaz Descartes szorzatát hasonlóképpen értelmezzük:


A1 × . . . × An az olyan (a1 , . . . , an ) rendezett n-esek halmaza, amelyekre
ai ∈ Ai minden i = 1, . . . , n esetén. Ha ezen n db halmaz mindegyike
ugyanaz a halmaz, akkor a tömörebb An jelölést alkalmazzuk.

Definı́ció. Relációnak nevezzük két halmaz Descartes szorzatának egy részhal-


mazát. Az A halmazon értelmezett ekvivalenciarelációról beszélünk, ha A × A-nak
olyan R részhalmaza adott, amely teljesı́ti a következő tulajdonságokat:

• minden a ∈ A esetén (a, a) ∈ R (reflexı́v)

• ha (a, b) ∈ R, akkor (b, a) ∈ R (szimmetrikus)

• ha (a, b) ∈ R és (b, c) ∈ R, akkor (a, c) ∈ R (tranzitı́v)

Megjegyzés.

1. Ekvivalenciarelációra legegyszerűbb példa az elemek egyenlősége. Kevésbé


triviális példát kapunk ekvivalenciára pl. az egész számok körében, ha két
egész számot ekvivalensnek tekintünk, ha 5-tel osztva ugyanazt a maradékot
adják.

2. Ha adott az A halmazon egy ekvivalenciareláció, az A halmaz diszjunkt


részhalmazokra, ún. osztályokra bomlik úgy, hogy egy osztályba az egymás-
sal ekvivalens elemek tartoznak. Az utolsó példában 5 maradékosztály van.
12 1. HALMAZOK ÉS RELÁCIÓK

1.2 Függvény – leképezés


Definı́ció. Az A és B halmazok közötti F relációt függvénynek (vagy leképezés-
nek) mondjuk, ha bármely a ∈ A esetén pontosan egy olyan b ∈ B létezik, melyre
(a, b) ∈ F . Azt mondjuk, hogy b a-nak a képe: F (a) = b, a függvény szokásos
jelölése pedig F : A → B. Az A halmazt az F függvény értelmezési tartományának
nevezzük, B-t pedig F értékkészletének mondjuk. F képtere B azon elemeiből áll,
amelyek szerepelnek valamelyik (a, b) ∈ F párban.

Megjegyzés.
1. A függvény (leképezés) tehát kapcsolatot létesı́t az értelmezési tartományt
alkotó halmaz elemei és az értékkészlet elemei között. Az értelmezési
tartomány minden eleméhez hozzátartozik az értékkészlet valamely eleme,
de fordı́tva nem szükségképpen. A képtér az értékkészlet azon elemeiből áll,
amlyek a leképezés során ’képpé válnak.’
2. Egy leképezést kölcsönösen egyértelműnek (idegen szóval injektı́vnek) mon-
dunk, ha az értelmezési tartomány különböző elemeinek a képei különböző-
ek. Ha képtér egybeesik az értékkészlettel, akkor a leképezést szürjektı́vnek
nevezzük. Az egyaránt injektı́v és szürjektı́v leképezéseket bijektı́vnek mond-
juk. Az ilyen függvények invertálhatók, azaz a függvényt alkotó relációban a
párok felcserélésével előálló (b, a) párok halmaza is függvény. Ezt a függvényt
inverz függvénynek nevezzük, jele: F −1 : B → A.
Nyilvánvalóan F −1 (F (a)) = a és F (F −1 (b)) = b teljesül minden a ∈ A, b ∈ B
esetén.

1.3 Halmazok számossága

Definı́ció. Két halmazt egyenlő számosságúnak (vagy ekvivalensnek) mondunk,


ha létesı́thető közöttük bijektı́v leképezés. A természetes számok halmazával
egyenlő számosságú halmazokat megszámlálhatóan végtelennek mondjuk, a többi
végtelen halmazt nem megszámlálhatónak.
A számosságok elméletéből csak két egyszerű, de fontos állı́tást emlı́tünk:
– A racionális számok Q halmaza megszámlálhatóan végtelen.
– A valós számok R halmaza nem megszámlálható.
2. A valós számokról

A valós számok R halmaza a racionális és irracionális számokból áll. Tizedes tört
alakjukat tekintve a racionális számok véges vagy végtelen, de szakaszos tizedes
törtként állı́thatók elő, mı́g az irracionális számok nem szakaszos végtelen tizedes
törtként.
A valós számok körében az összeadás és a szorzás művelete értelmezett, s
teljesı́ti a következő tulajdonságokat (az ún. testaxiómákat):

a+b = b+a ab = ba
(a + b) + c = a + (b + c) (a b) c = a (b c)
a+0 = a a1 = a
1
a + (−a) = 0 a = 1
a
a (b + c) = a b + a c

R rendezett halmaz, azaz a valós számpárok összehasonlı́thatók, s e ren-


dezés harmónikus kapcsolatban van a műveletekkel; teljesülnek a következő tu-
lajdonságok:

a≤a

a ≤ b, b ≤ c =⇒ a ≤ c
a ≤ b =⇒ a + c ≤ b + c
a ≥ 0, b ≥ 0 =⇒ a b ≥ 0
A valós számok egy A részhalmazát felülről korlátosnak mondjuk, ha létezik
hozzá olyan b valós szám, melyre a ≤ b teljesül minden a ∈ A esetén. b-t ilyenkor
A egy felső korlátjának mondjuk. Hasonlóan, A-t alulról korlátosnak mondjuk, ha
∃ b ∈ R (alsó korlát), melyre b ≤ a teljesül ∀a ∈ A esetén. Az alulról és felülről is
korlátos halmazokat korlátosnak mondjuk.
Az A ⊂ R halmaz pontos felső korlátja egy olyan b felső korlát, melynél
kisebb felső korlátja A-nak nincsen. Jele: b = supA. Nevezik felső határnak,
idegen szóval szupremumnak is. Hasonlatosan, az A halmaz pontos alsó korlátja
egy olyan alsó korlát, melynél nagyobb alsó korlátja A-nak nincs. Szinonim

13
14 2. A VALÓS SZÁMOKRÓL

2
kifejezés: alsó határ,
√ infinum,√ jele: inf A. Például A = {a ∈ R| a < 2}
esetén inf A = − 2, supA = 2. A valós számhalmaz igen fontos tulajdonsága
(teljességi axiómája) az ún. felső határ-tulajdonság: A valós számok bármely
felülről (alulról) korlátos részhalmazának van pontos felső (alsó) korlátja. Ez
a tulajdonság különbözteti meg a valós számok halmazát a racionális számok
halmazától.
Állı́tás. Legyen adott minden n természetes szám esetén egy [an , bn ] zárt
intervallum, s tegyük fel, hogy ez az intervallumrendszer fogyó, azaz minden n ∈ N-
re [an+1 , bn+1 ] ⊂ [an , bn ]. Ekkor ezen intervallumrendszer metszete nem üres, azaz
van olyan valós szám, amely mindegyik megadott intervallumban benne van.
Bizonyı́tás. Legyen A = {an |n ∈ N}, B = {bn |n ∈ N}, és a = supA, illetve
b = inf B. Azt kell belátnunk, hogy a ≤ b. Tegyük fel indirekten, hogy a > b.
Ekkor van olyan c, hogy b < c < a. Ez a c nem felső korlátja A-nak, s nem
alsó korlátja B-nek, ezért van olyan n1 , illetve n2 index, hogy an1 > c, illetve
bn2 < c. n1 és n2 közül válasszuk ki a nagyobbat, legyen ez pl. n1 . Ekkor
bn1 ≤ bn2 < c < an1 teljesül. Ez viszont lehetetlen, ellentmondás. Q. E. D.
Egy a valós szám ε sugarú nyı́lt környezetén az (a − ε, a + ε) nyı́lt intervallumot
értjük, ahol ε tetszőleges pozitı́v valós számot jelöl. Jele: G(a, ε). Ezt megadhatjuk
a következőképp is:
G(a, ε) = {x ∈ R| |x − a| < ε}
(Ez utóbbi megadás lehetőséget ad arra is, hogy ily módon a komplex számok
körében is értelmezzük a nyı́lt környezet fogalmát, sőt olyan terekben is, ahol az
abszolút érték tulajdonságaival rendelkező távolságfüggvény van megadva.)
Definı́ció. Ha adott egy A részhalmaz, azt mondjuk, hogy az a ∈ A szám
belső pontja az A halmaznak, ha van olyan G(a, ε) nyı́lt környezete a-nak, melyre
G(a, ε) ⊂ A. Azokat a halmazokat, amelyeknek minden pontja belső pont,
nyı́ltaknak nevezzük. Egy A halmazt zártnak nevezünk, ha komplementere nyı́lt.
Az A halmaz torlódási pontjának nevezzük az olyan a ∈ R számot, melynek minden
nyı́lt környezetében az A halmaznak végtelen sok eleme található.
Könnyen látható, hogy a torlódási pont definı́ciójában elegendő lenne azt
megkövetelni, hogy a bármely nyı́lt környezete tartalmazza A-nak legalább egy a-
tól különböző elemét. Ugyanis, ha az ε sugarú nyı́lt környezetben van egy a1 ∈ A,
mely a-tól különbözik, tekintsük ε1 = |a1 − a|-et. A ε1 sugarú környezetben
is található valamely a2 ∈ A, melyre a2 6= a. Újra ezek távolságát képezve
(ε2 ),stb.ismételve a lépéseket, A-nak végtelen sok elemét találjuk az első ε sugarú
környezetben.
Állı́tás. Egy A halmaz pontosan akkor zárt, ha tartalmazza mindegyik torlódási
pontját.
Bizonyı́tás. Ha zárt egy halmaz, akkor komplementere nyı́lt, ezért a komple-
menter minden pontja belső pontja a komplementernek, ezért a komplementer
egyik pontja sem lehet torlódási pontja A-nak, hiszen van olyan környezete, amely
15

csak a komplementerből tartalmaz pontokat. Így A torlódási pontjai csak A-ban


lehetnek.
Fordı́tva, ha az A halmaz tartalmazza az összes torlódási pontját, akkor a
komplementer egyik pontja sem torlódási pontja A-nak, ezért a komplementer
bármelyik pontjához lehet találni olyan nyı́lt környezetét, amely nem tartalmazza
A-nak egyik pontját sem, azaz e környezetek a komplementerben vannak. Ez azt
jelenti, hogy a komplementer minden pontja belső pont, tehát a komplementer
nyı́lt halmaz, az eredeti ı́gy zárt. Q. E. D.

Bolzano – Weierstraß tétel:


Állı́tás. A valós számhalmaz bármely korlátos végtelen részhalmazának van
torlódási pontja.
Bizonyı́tás. A korlátosság miatt a korlátos A halmaz elemei mind egy [a1 , b1 ]
a1 + b 1
zárt intervallumban vannak. Felezzük meg ezt az intervallumot, s az [a1 , ],
2
a1 + b 1
illetve [ , b1 ] intervallumok közül válasszuk ki azt (vagy azok közül egyiket),
2
amelyik A-nak végtelen sok elemét tartalmazza. Jelöljük ezt [a2 , b2 ]-vel. Felezve
ezt az intervallumot, s ı́gy folytatva az eljárást, egy zárt intervallumokból álló
[an , bn ] fogyó intervallumrendszerhez jutunk. Ezen intervallumok metszete nem
üres. Legyen c a metszetnek egy eleme. Megmutatjuk, hogy c torlódási pontja az
A halmaznak. Tekintsünk egy tetszőleges pozitı́v ε-t. Ehhez meghatározható egy
1 ε
olyan n0 természetes szám, hogy n0 < . Az n0 -dik intervallum hossza
2 2(b1 − a1 )
b 1 − a1
< ε, ezért [an0 , bn0 ] ⊂ G(c, ε). Az n0 -dik intervallum végtelen sok elemét
2n0 −1
tartalmazza A-nak, ı́gy G(c, ε) is, tehát c torlódási pontja A-nak. Q. E. D.
16 2. A VALÓS SZÁMOKRÓL
3. Komplex számok

A valós számok körében a negatı́v számoknak nincs négyzetgyökük, s emiatt


bizonyos másodfokú egyenleteknek nincs megoldásuk. E hiányosságok kiküszöbölé-
sére a komplex számok fogalmát épı́tjük ki.
Definı́ció. Komplex számoknak nevezzük a valós számokból képzett rendezett
(a, b) számpárok halmazát, ha közöttük az összeadást és a szorzást következőkép-
pen értelmezzük:
(a, b) + (c, d) := (a + c, b + d)

(a, b)(c, d) := (ac − bd, bc + ad)


a-t a z = (a, b) komplex szám valós részének, mı́g b-t a képzetes (imaginárius)
részének nevezzük.Jelölésük: Re(z) és Im(z). Két komplex szám pontosan akkor
egyenlő, ha valós és képzetes részeik megegyeznek. A komplex számhalmaz jele:
C.

Állı́tás. A komplex számok C halmaza a fent definiált összeadása és szorzása


teljesı́ti a testaxiómákat.
Bizonyı́tás. A valós számok tulajdonságaira épı́tve, a szorzás invertálhatóságát
kivéve, a testaxiómák ellenőrzése egyszerű számolás. Ha z = (a, b) 6= 0, akkor
az a és b valós számok közül legalább az egyik nem nulla, ezért a2 + b2 > 0.
a b
Megmutatjuk, hogy z = (a, b) inverze az ( 2 ,− 2 ) komplex szám lesz:
a + b2 a + b2
  2
a + b2 ba − ab
 
a b
(a, b) , − = , = (1, 0).
a2 + b 2 a2 + b 2 a2 + b 2 a2 + b 2

Láthatjuk, hogy az egységelem az (1, 0) komplex szám, a zéruselem pedig a (0, 0)


komplex szám lesz. Q. E. D.
Megjegyzés.

1. Nyilvánvaló, hogy (a, 0) + (b, 0) = (a + b, 0) és (a, 0) (b, 0) = (ab, 0) teljesül.


Emiatt az (a, 0) komplex számot azonosı́thatjuk az a valós számmal, s ı́gy a
valós számtest a komplex számok egy részhalmazát alkotják.

17
18 3. KOMPLEX SZÁMOK

2. Ha i-vel jelöljük a (0, 1) komplex számot és 1-gyel az (1, 0) egységelemet,


akkor i2 = −1. E jelölésekkel (a, b) = a + bi, hiszen

a + bi = (a, 0) + (b, 0)(0, 1) = (a, 0) + (0, b) = (a, b)

A továbbiakban az a + bi klasszikus jelölést alkalmazzuk.


3. Ha z = a + bi, ahol a és b valós szám, akkor a z = a − bi komplex számot z
konjugáltjának nevezzük. A konjugált képzése a következő tulajdonságokkal
rendelkezik:
• z+w =z+w
• zw = z w
• z + z = 2 Re(z) és z − z = 2 Im(z)i
• z z pozitı́v valós szám, kivéve z = 0-t.
4. Nem egészen triviális két komplex szám hányadosát képezni, azaz klasszikus
alakban kifejezni. Célszerű a nevező konjugáltjával bővı́teni a törtet. Pl.
3 + 4i (3 + 4i)(4 − 2i) 1
= =1+ i
4 + 2i (4 + 2i)(4 − 2i) 2

5. A z komplex szám abszolút értékének


√ nevezzük z z nemnegatı́v négyzet-
gyökét, jelölése: |z|. Így |z| = a2 + b2 . Az abszolút érték következő
tulajdonságokkal rendelkezik:
• |z| > 0, ha z 6= 0, és |0| = 0
• |z| = |z|
• |zw| = |z| |w|
• |Re(z)| ≤ |z|
• |Im(z)| ≤ |z|
• |z + w| ≤ |z| + |w|
A harmadik összefüggés igazolásához legyen z = a + bi, w = c + di, ahol
a, b, c, d valós számok. Ekkor

|zw|2 = (ac − bd)2 + (ad + bc)2 = (a2 + b2 ) (c2 + d2 ) = |z|2 |w|2 .

Az utolsó igazolásához azt figyeljük meg, hogy zw és zw egymás konjugáltja,


ezért zw + zw = 2 Re(zw). Így

|z + w|2 = (z + w)(z + w) = zz + zw + zw + ww =
= |z|2 + 2Re(zw) + |w|2 ≤
≤ |z|2 + 2|zw| + |w|2 =
= |z|2 + 2|z| |w| + |w|2 = (|z| + |w|)2 .
3.1. A KOMPLEX SZÁMSÍK 19

3.1 A komplex számsı́k


Amennyiben a sı́k egy Descartes-féle (derékszögű) koordinátarendszerében a
z = a + bi komplex számhoz hozzárendeljük az (a, b) koordinátájú pontot, egy
kölcsönösen egyértelmű megfeleltetést kapunk a sı́k pontjai és a komplex számok
halmaza között. Az a + 0i alakú (valós) komplex számoknak az x tengely pontjai,
mı́g a tisztán képzetes (0 + b i alakú) komplex számoknak az y tengely pontjai
felelnek meg. Ha a z = (a, b) = a + b i komplex számot az origóból induló (a, b)
végpontú vektorral szemléltetjük, a komplex számok összeadásának a vektorok
összeadása felel meg, a konjugálásnak az x tengelyre való tükrözés, mı́g a komplex
szám abszolút értéke a megfelelő vektor hossza. A szorzás szemléletes jelentése az
ún. trigonometrikus alak segı́tségével lesz könnyen látható.
Amennyiben ϕ jelöli a z = (a, b) = a + b i komplex számnak, mint vektornak a
pozitı́v irányú x tengellyel bezárt forgásszögét, s r = |z| az abszolút értéket, akkor
látható, hogy
a = r cos ϕ, b = r sin ϕ
Tehát z = a + b i = r(cos ϕ + i sin ϕ). Az utóbbit nevezzük a komplex szám
trigonometrikus alakjának, ϕ-t a z komplex szám argumentumának (vagy irány-
szögének), jele: ϕ = arg z. A klasszikus algebrai alakból√a trigonometrikus alak
előállı́tásához r és ϕ kiszámı́tása ı́gy történhet: r = |z| = a2 + b2 , s b ≥ 0 esetén
ϕ-t a cos ϕ = ar összefüggésből, mı́g b ≤ 0 esetén ϕ = 2π − ϕ0 , ahol cos ϕ0 = ar .

z = a + bi
b

r = |z|
i
ϕ

1 a

Szorozzuk össze a z1 = r1 (cos ϕ1 +i sin ϕ1 ) és z2 = r2 (cos ϕ2 +i sin ϕ2 ) komplex


számokat. Ekkor

z1 z2 = r1 r2 [(cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 ) + i(sin ϕ1 cos ϕ2 + cos ϕ1 sin ϕ2 )]

A trigonometrikus függvények ismert addı́ciós képlete alapján:

z1 z2 = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ))

Innen láthatjuk, hogy szorzásnál az argumentumok összeadódnak, az abszolút


értékek pedig összeszorzódnak. Egy adott komplex számmal való szorzás ezért
20 3. KOMPLEX SZÁMOK

úgy szemléltethető, mint origó körüli arg ϕ szögű elforgatás és r = |z| arányú
nyújtás együttese.

z1 · z2

ϕ1 + ϕ2
z2
z1
ϕ2
ϕ1

A szorzásra vonatkozó képletből adódik, hogy trigonometrikus alakban a hat-


ványozás elvégzése nagyon leegyszerűsödik.

z n = Rn (cos(nϕ) + i sin(nϕ)), n ∈ N

(Moivre képlet)
1
Az osztás formulájának megtalálásához előbb -t állı́tjuk elő trigonometrikus
z
alakban:
1 1
= (cos(−ϕ) + i sin(−ϕ))
z r
Ezért
z1 1 1
= z1 = r1 (cos ϕ1 + i sin ϕ1 ) (cos(−ϕ2 ) + i sin(−ϕ2 )) =
z2 z2 r2
r1
= (cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 )).
r2

3.2 Komplex szám n-edik gyöke

Definı́ció. Az z = r(cos ϕ + i sin ϕ) komplex szám n-edik gyökén olyan komplex


számot értünk, amelynek n-edik hatványa z-vel egyenlő.
Ha tehát w z-nek az n-edik gyöke, akkor wn = z. Tegyük fel, hogy w =
t(cos ψ + i sin ψ), akkor a hatványozás miatt

tn (cos nψ + i sin nψ) = r(cos ϕ + i sin ϕ)


3.2. KOMPLEX SZÁM N-EDIK GYÖKE 21

Két komplex szám akkor egyenlő, ha abszolút értékeik megegyeznek, irányszögeik


pedig 2π egész számú többszörösében különböznek egymástól. Ezért

tn = r, nψ − ϕ = k 2π

ahol k egész szám. Mivel t és r nemnegatı́v,



t = n r, ψ = (ϕ + k 2π)/n

A Moivre képlet alapján látható, hogy w valóban n-edik gyök. w-nek ezen
előállı́tásában ugyan végtelen sok k érték szerepel, de könnyen látható, hogy a
k = 0, 1, . . . , n − 1 választással n különböző w számot kapunk, s a további k
értékek nem adnak újabb gyököt. Ez azt jelenti tehát, hogy minden komplex
számnak — a 0-át kivéve,— pontosan n darab n-edik gyöke van. Speciálisan
minden komplex számnak (s köztük a valós számoknak is ), a 0-t kivéve, a komplex
számok körében mindig pontosan két négyzetgyökük van, s a valós együtthatós
másodfokú egyenleteknek is mindig van megoldása komplex számok körében, vagy
két valós (esetleg egybeeső), vagy két konjugált komplex szám.
Az 1 komplex szám n-dik gyökeit n-dik egységgyököknek nevezzük.
n=6
ε2 ε1

ε3 ε0
1

ε4 ε5
22 3. KOMPLEX SZÁMOK
4. Sorozatok konvergenciája

Definı́ció. A természetes számok N halmazán értelmezett függvényeket


sorozatoknak nevezzük. Amennyiben az értékkészlet a valós számok halmaza,
valós számsorozatról beszélünk, mı́gha az értékkészlet a komplex számok halmaza,
akkor komplex (értékű) sorozatról. A f : N → R függvényjelölés helyett gyakoribb
az an jelölés alkalmazása, ahol an a függvényértékeket jelöli (an = f (n) ∀n ∈
N esetén), melyeket a sorozat tagjainak mondunk. Egy valós vagy komplex
számsorozatot korlátosnak mondunk, ha a sorozat tagjai korlátos halmazt alkotnak
R-ben, illetve C-ben, azaz ha van a 0-nak olyan ε sugarú környezete, amely
tartalmazza a sorozat minden tagját.
Egy an valós(!) számsorozatot monoton növekvőnek mondunk, ha an ≤ an+1
teljesül minden n ∈ N-re. Szigorúan monoton növekvő az an sorozat, ha an < an+1
teljesül minden n ∈ N-re. Analóg módon értelmezzük a monoton csökkenő, illetve
szigorúan monoton csökkenő sorozatok fogalmát.

Megjegyzés. Szigorúan monoton növekvő sorozatra példa az an = 1− n12 sorozat,


monoton csökkenő például a bn = [ 100
n ] sorozat. Ezek korlátosak is, de pl. nem
korlátos a cn = log2 n, vagy a dn = (−1)n n sorozat.
Definı́ció. Egy an sorozat torlódási pontján olyan a számot értünk, melynek
tetszőleges ε > 0 sugarú nyı́lt környezetében a sorozatnak végtelen sok tagja
található. Azt mondjuk, hogy az an sorozat konvergens és határértéke a, ha a-nak
bármely ε > 0 sugarú nyı́lt környezete a sorozat összes tagját tartalmazza véges
sok kivételével, azaz ha bármely ε > 0-hoz létezik olyan n0 ∈ N küszöbszám, hogy
minden n > n0 esetén |an − a| < ε. Ilyenkor azt is mondjuk, hogy an konvergál
(vagy tart) a-hoz, jelben: an → a, vagy lim an = a.
n→∞
Természetesen, ha a határértéke az an sorozatnak, akkor torlódási pontja is, de
általában fordı́tva nem teljesül. Viszont ha an korlátos, s csak egyetlen torlódási
ponttal rendelkezik, akkor konvergens is, és határértéke az egyetlen torlódási pont
lesz.
Konvergens sorozatnak csak egyetlen határértéke van, hiszen ha a1 és a2 is az
volna, akkor diszjunkt környezeteiket tekintve, mindkét környezetnek a sorozat
összes tagját kellene tartalmazni véges sok kivételével, ami lehetetlen.
A konvergens sorozatok korlátosak, hiszen pl. a 1 sugarú környezete
tartalmazza a sorozat összes tagját véges sok kivételével, a kintmaradtak közül az

23
24 4. SOROZATOK KONVERGENCIÁJA

a-tól legtávolabbinak a-tól mért távolságát d-vel jelölve, nyilvánvaló, hogy minden
n-re a − d ≤ an ≤ a + d teljesül.
1
Példa konvergens sorozatra: an = . Ez a sorozat konvergens, s határértéke
n
0, hiszen ha teszőleges ε > 0-t választunk, hozzá lehet találni olyan küszöbindexet,
1 1
pl. n0 = + 1-et, melyre bármely n > n0 esetén valóban |an − 0| = < ε. Nem
ε n
1
konvergens viszont, pl. az bn = (−1)n + sorozat, hiszen két torlódási pontja is
n
van.
Az alkalmazások szempontjából fontos a következő egyszerű tétel:
Állı́tás. Valós, monoton növekvő korlátos sorozat konvergál a pontos felső
korlátjához. Valós, monoton csökkenő korlátos sorozat konvergál a pontos alsó
korlátjához.
Bizonyı́tás. Az an monoton növekvő korlátos sorozat pontos felső korlátját
jelölje a, s tekintsünk egy tetszőleges pozı́tı́v ε-t. a − ε nem felső korlátja a sorozat
elemeinek, ezért van olyan n0 ∈ N, hogy an0 > a − ε. A monotonitás miatt ekkor
minden n > n0 esetén a ≥ an > a − ε, tehát |an − a| < ε. Hasonló érvelés adható
monoton csökkenő sorozat esetén is. Q. E. D.

4.1 Műveletek konvergens sorozatokkal


Sorozatokkal ugyanazon műveleteket végezhetjük, mint a valós, illetve a komplex
számokkal: Az an és bn sorozatok összegének, szorzatának, illetve ha bn 6= 0, akkor
an
hányadosának nevezzük rendre az an + bn , an bn , sorozatokat.
bn
Állı́tás.

• Ha an → 0 és bn korlátos, akkor an bn → 0.

• Ha an → a és bn → b, akkor an + bn → a + b.

• Ha an → a és bn → b, akkor an bn → ab.


an a
• Ha an → a, bn → b és bn 6= 0, b 6= 0, akkor → .
bn b

Bizonyı́tás. Jelölje K a bn sorozat egy korlátját: bn ≤ K. Tetszőleges ε > 0


ε
esetén an → 0 miatt van olyan n0 , hogy ha n > n0 , akkor |an | < . Ezért
K
ε
|an bn | = |an | |bn | < K = ε.
K
A második igazolásához is tetszőleges ε > 0-ból indulunk ki. an és bn
konvergenciája miatt ε/2-höz van olyan n1 és n2 , hogy n > n1 , illetve n > n2 esetén
4.2. A KONVERGENCIA MONOTONITÁSA 25

|an − a| < ε/2, illetve |bn − b| < ε/2 teljesedik. Ekkor minden n > max{n1 , n2 }
esetén
|(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < ε/2 + ε/2 = ε.
Szorzat esetében a következő átalakı́tást végezzük el:

|an bn − ab| = |an bn − an b + an b − ab| ≤ |an | |bn − b| + |b| |an − a|

Az an sorozat korlátos, hiszen konvergens, tehát |an | ≤ K valamely K ∈ R-ra.


an → a miatt létezik olyan n1 , hogy ha n > n1 , akkor |an − a| < ε/2|b|. Másrészt,
bn → b miatt létezik olyan n2 , hogy ha n > n2 , akkor |bn − b| < ε/2K. Ha
n > max{n1 , n2 }, akkor a fenti becslést is figyelembe véve |an bn − ab| < ε adódik.
A hányadosra vonatkozó állı́tás bizonyı́tásához előbb azt figyeljük meg, hogy a
bn sorozatnak 0 nem torlódási pontja, hiszen konvergens sorozatnak nem lehet két
torlódási pontja. Ezért 0 valamely nyı́lt környezetében nincs a sorozatnak egyetlen
tagja sem. Ez azt jelenti, hogy van olyan K pozitı́v valós szám, hogy |bn | ≥ K.
Végezzük el a következő átalakı́tásokat:

an a |an b − ab + ab − abn | |an − a| |a| |b − bn |


| − |=| ≤ +
bn b |bn | |b| |bn | |b| |bn |

an → a miatt létezik olyan n1 , hogy ha n > n1 , akkor |an − a| < Kε/2. Másrészt,
|b|
bn → b miatt létezik olyan n2 , hogy ha n > n2 , akkor |bn − b| < K ε/2. Ha
|a|
an a
n > max{n1 , n2 }, akkor a fenti átalakı́tást kihasználva kapjuk, hogy | − | < ε.
bn b
Q. E. D.

4.2 A konvergencia monotonitása

Állı́tás. Ha an → a, bn → b és an ≤ bn minden n ∈ N-re, akkor a ≤ b.


a−b
Bizonyı́tás. Tegyük fel indirekten, hogy a > b. Legyen ε = . an → a
2
miatt van olyan n1 , hogy ha n > n1 , akkor an ∈ (a − ε, a + ε). Hasonlóan
bn → b miatt van olyan n2 , hogy ha n > n2 , akkor bn ∈ (b − ε, b + ε). Ezért, ha
n > max{n1 , n2 } teljesül, akkor

a+b
bn < b + ε = = a − ε < an .
2
Ez ellentmond állı́tásunk feltételének. Q. E. D.
Megjegyzés. Ha a feltételben szigorú egyenlőtlenség teljesül, a következményben
mégsem állı́tható, hogy a < b. Ezt mutatja az an = 0, bn = n1 sorozatok példája.
Állı́tás. (Rendőrelv) Ha an → a, bn → a, és an ≤ cn ≤ bn minden n ∈ N-re,
akkor cn → a.
26 4. SOROZATOK KONVERGENCIÁJA

Bizonyı́tás. Tetszőleges ε > 0 esetén an → a miatt van olyan n1 , hogy ha


n > n1 , akkor an ∈ (a − ε, a + ε). Hasonlóan bn → a miatt van olyan n2 , hogy
ha n > n2 , akkor bn ∈ (a − ε, a + ε). Ezért minden n > max{n1 , n2 } esetén
an ≤ cn ≤ bn miatt cn ∈ (a − ε, a + ε) is teljesül. Q. E. D.

4.3 Valós számsorozat tágabb értelemben vett


határértéke
Definı́ció. Azt mondjuk, hogy az an sorozat tart a végtelenhez, ha bármely K
valós számhoz van olyan n0 ∈ N, hogy ha n > n0 , akkor an > K. Jele: an → ∞,
vagy lim an = ∞. Hasonlatosan, az an sorozat tart a mı́nusz végtelenhez, ha
n→∞
bármely K valós számhoz van olyan n0 ∈ N, hogy ha n > n0 , akkor an < K. Jele:
an → −∞, vagy lim an = −∞.
n→∞

Megjegyzés.
1. A műveletekkel kapcsolatosan majdnem ugyanazon tulajdonságok érvénye-
sek, mint a szűkebben értelmezett konvergencia esetében, pl.:
Ha an → ∞, bn → ∞, akkor an + bn → ∞.
Ha an → −∞, bn → −∞, akkor an + bn → −∞.
Ha an → ∞, bn → ∞, akkor an bn → ∞.
Ha an → ∞, bn → b > 0, akkor an bn → ∞.
1 1
2. Ha |an | → ∞, és an 6= 0, akkor → 0. Ugyanis, adott ε > 0 esetén K = -
an ε
1 1
hoz van olyan n0 ∈ N, hogy ha n > n0 , akkor |an | > K = , azaz | | < ε.
ε an
1
Fordı́tva viszont an → 0-ból következik | | → ∞, hasonló érveléssel.
an

4.4 Nevezetes határértékek


pr nr + pr−1 nr−1 + . . . + p1 n + p0
Állı́tás. Legyen an = .
qs ns + qs−1 ns−1 + . . . + q1 n + q0
pr
Ha r = s, akkor an → .
qr
Ha r < s, akkor an → 0.
pr pr
Ha r > s, akkor > 0 esetén an → ∞, mı́g < 0 esetén an → −∞.
qs qs
Bizonyı́tás. r = s
Osszuk el a számlálót és a nevezőt is nr -el:
pr + pr−1 n1 + . . . + p1 nr−1
1
+ p0 n1r
qr + qr−1 n1 + . . . + q1 nr−1
1
+ q0 n1r
4.4. NEVEZETES HATÁRÉRTÉKEK 27

1
A számlálóban és a nevezőben szereplő i tagok mindegyike 0-hoz tart, s
n
kihasználva a műveletek és a határátmenet sorrendjének felcserélhetőségét,
pr
valóban an → .
qr
r<s
Most ns -el osztjuk a számlálót, s nevezőt is:

pr ( n1 )r−s + . . . + p0 ( n1 )s
an =
qs + qs−1 n1 + . . . + q0 ( n1 )s

Ugyanazon érveléssel a számláló nullához tart, a nevező qs -hez, összességében


an → 0.
r>s
ns -el egyszerűsı́tve, s kiemelve nr−s -et:
1
pr + pr−1 n1 + . . . + p1 nr−1 + p0 n1r
nr−s 1
qs + qs−1 n1 + . . . + q1 ns−1 + q0 n1s
pr
nr−s → ∞, mı́g a tört hez tart, ezért szorzatuk végtelenhez vagy mı́nusz
qs
pr
végtelenhez tart előjelének megfelelően. Q. E. D.
qs
Állı́tás. Legyen an = an , ahol a ∈ R konstans.
Ha a > 1, akkor an → ∞.
Ha a = 1, akkor an → 1.
Ha −1 < a < 1, akkor an → 0.
Bizonyı́tás. Ha a > 1, akkor a = 1 + h alakban ı́rható, ahol h > 0. A Bernoulli
egyenlőtlenség miatt an = an = (1 + h)n ≥ 1 + nh, ezért ha adott K esetén
n > n0 = [ K−1
h ] + 1, akkor

K −1
an ≥ 1 + nh > 1 + h = K.
h
1 1 1
Ha −1 < a < 1, a 6= 0, akkor | | > 1, ezért | | = | |n → ∞. Egy előző
a an a
állı́tásunk miatt an → 0. Q. E. D.
Megjegyzés.
Ha a = −1, akkor an nem konvergens sorozat.
Ha a < −1, akkor an nem konvergens, tágabb értelemben sem.
 n
1
Állı́tás. Az an = 1 + sorozat konvergens.
n
Bizonyı́tás. Megmutatjuk, hogy az an sorozat szigorúan monoton növekvő, és
korlátos sorozat. Ebből már a következik a sorozat konvergenciája.
28 4. SOROZATOK KONVERGENCIÁJA

A) an szigorúan monoton nő:


Ekvivalens átalakı́tásokkal a bizonyı́tandó an < an+1 egyenlőtlenségből kapjuk,
hogy
 n  n+1
1 1
1+ < 1+
n n+1
 n  n+1
n+1 n+2
<
n n+1
 n
n+1 n(n + 2)
<
n+2 (n + 1)2
 n
1 1
1− < 1−
n+2 (n + 1)2
A Bernoulli egyenlőtlenség alapján ez viszont mindig teljesül, hiszen
 n
1 n 1 1
1− ≥1− =1− 1 >1− .
(n + 1)2 (n + 1)2 n+2+ n
n+2

B) an korlátos:
A binomiális tétel szerint kifejtve, majd becsléseket alkalmazva kapjuk, hogy
 n
1 1 n(n − 1) 1 n(n − 1)(n − 2) 1 1
an = 1 + =1+n + + + ... + n =
n n 2! n2 3! n3 n

1 1 1 1 1 2 1 1 2 n−1
= 1+ + (1 − ) + (1 − )(1 − ) + . . . + (1 − )(1 − ) . . . (1 − )<
1! 2! n 3! n n n! n n n
1 1 1 1 1 1 1
<1+ + + + ... + < 1 + 1 + + 2 + . . . + n−1 < 3.
1! 2! 3! n! 2 2 2
Q. E. D.

Megjegyzés.
1 1
1. Az an = (1 + )n sorozat határértékét e-vel jelöljük: e = lim (1 + )n .
n n→∞ n
Belátható, hogy ez a szám a bizonyı́tásban szereplő másik sorozattal is
1 1 1 1
előállı́tható: e = lim (1 + + + + . . . + ).
n→∞ 1! 2! 3! n!
2. Bebizonyı́tható, és az alkalmazásokban gyakran szükséges, hogy ha egy bn
sorozat olyan, hogy |bn | → ∞, akkor

1 bn
lim (1 + ) = e.
n→∞ bn
4.4. NEVEZETES HATÁRÉRTÉKEK 29

Függelék
Bernoulli egyenlőtlenség:
Állı́tás. Bármely n ∈ N és h ≥ −1 esetén teljesül a

(1 + h)n ≥ 1 + nh

egyenlőtlenség.
Bizonyı́tás. A bizonyı́tást n szerinti teljes indukcióval végezzük. n = 1 esetén
nyilván teljesül az állı́tás. Tegyük fel, hogy igaz valamely n-re: (1 + h)n ≥ 1 + nh.
1 + h ≥ 0, ezért vele szorozva az egyenlőtlenséget, kapjuk, hogy

(1 + h)n+1 ≥ (1 + nh)(1 + h) = 1 + (n + 1)h + nh2 ≥ 1 + (n + 1)h.

Tehát n + 1 esetén is teljesül az állı́tás. Q. E. D.


Binomiális tétel:
Állı́tás. Bármely a, b számok esetén tetszőleges n ∈ N-re
n  
n
X n i n−i
(a + b) = ab
i=0
i
 
n n!
ahol = az ún. binomiális együttható, s n! = 1 · 2 · . . . n (ejtsd: n
i i!(n − i)!
faktoriális).
Bizonyı́tás. n szerinti teljes indukcióval történhet a bizonyı́tás. n = 1 esetén
triviálisan teljesül az állı́tás. Tegyük fel, hogy n esetén igaz, s számı́tsuk ki
(a + b)n+1 -et. Az indukciós feltevést is kihasználva kapjuk, hogy
n   n   n  
!
n+1
X n i n−i X n i+1 n−i X n i n+1−i
(a + b) = ab (a + b) = a b + ab
i=0
i i=0
i i=0
i

Részletesebben kiı́rva láthatjuk, hogy a két szummában


  szerepelnek
  azonos

i n+1−i n n n+1
ab alakú tagok is, ezek együtthatóira viszont + =
i i−1 i
összefüggés érvényes, ezért ı́gy folytathatjuk:
n     n+1
X n + 1
n+1
X n n i n+1−i n+1
=b + ( + )a b +a = ai bn+1−i
i=1
i i 1 i=0
i

Q. E. D.
30 4. SOROZATOK KONVERGENCIÁJA
5. Számsorok és
hatványsorok

A sor szemléletesen szólva végtelen sok tagú összeg. Számsorról beszélünk, ha


végtelen sok számot kell összeadnunk. A hatványsor a függvénysor speciális esete,
amikor is az összeadandó függvények mind hatványfüggvények. Az alapprobléma
az, hogy mikor beszélhetünk ilyen végtelen tagú összeg összegéről, s mit értsünk
rajta.

5.1 Számsorok

P
Definı́ció. Az a1 + a2 + . . . + ak + . . . = ak végtelen sok tagú összeget
k=1

P
számsornak (vagy numerikus sornak) nevezzük. A ak számsort konvergensnek
k=1
n
P
mondjuk, ha a részletösszegek sn = ak sorozatának létezik határértéke, ezt a
k=1
határértéket a számsor összegének nevezzük.

X n
X
ak = lim ak
n→∞
k=1 k=1

Egyébként a sort divergensnek mondjuk.


q k mértani sor konvergens, ha |q| < 1. Ugyanis
P
Példa. Az ún.
k=1

n
X q n−1 − 1
sn = qk = q
q−1
k=1

a mértani sorozatok ismert összegzési képlete alapján, s ı́gy



X q
q k = lim sn = .
n→∞ 1−q
k=1

31
32 5. SZÁMSOROK ÉS HATVÁNYSOROK

Divergens viszont a

X 1 1 1
= 1 + + + ...
k 2 3
k=1

ún. harmónikus sor, ugyanis


   
1 1 1 1 1 1 1 1
sn = 1 + + . . . + > 1 + + + + + ...+ + ...+
2 n 2 3 4 5 8 n

alapján sn felülről nem korlátos, hiszen a zárójelezett tagok összege minden esetben
nagyobb, mint 1/2.
P∞
Megjegyzés. Ha a k=1 ak sor konvergens, akkor limn→∞ an = 0. Ugyanis, ha
A-val jelöljük a sor összegét, akkor bármely 2ε > 0-hoz van olyan n0 ∈ N, hogy
n > n0 esetén |sn − A| < 2ε . Ez igaz sn+1 -re is, ezért

|an+1 | = |sn+1 − sn | ≤ |sn+1 − A| + |sn − A| ≤ ε.

Figyeljük meg, hogy


P 1ez a feltétel ugyan szükséges a sor konvergenciájához, de nem
elegendő, mint a k harmónikus sor esete mutatja.
Egy további feltétellel — a váltakozó előjelűség feltételével, — viszont már
elegendő a sor konvergenciájához.
Állı́tás.
P∞(Leibniz tétel). Ha an monoton csökkenő és nullához tartó sorozat,
akkor a k=1 (−1)k+1 ak számsor konvergens.
Bizonyı́tás. Látható, hogy az s2n részletösszegek sorozata monoton nő, felülről
korlátos, ezért konvergens, és az s2n+1 részletösszegek sorozata monoton csökken,
alulról korlátos, de a két határérték megegyezik, hiszen
sn+1 − sn = an+1 → 0. Q. E. D.
Példa. A Leibniz tétel alapján pl. a harmónikus sorból előjelezéssel keletkező
ún. Leibniz sor konvergens:
1 1 1
1− + − + . . . < ∞.
2 3 4

Megjegyzés. Láthattuk, hogy egy sorban az előjeleket megváltoztatva megvál-


tozhat a sor konvergenciája. Az olyan P sorokat, amelyekkel ez nem fordulhat P elő,
abszolút konvergensnek mondjuk: egy ak sor abszolút konvergens, ha a |ak |
sor konvergens. Az abszolút konvergens sorok viselkednek igazán jól: bennük a
tagok sorrendje tetszőlegesen felcserélhető, az összeg nem változik.

5.2 Pozitı́v tagú sorok konvergenciakritériumai


Most olyan számsorokkal foglalkozunk, amelyek tagjai pozı́tı́v számok. Olyan
elegendő feltéleket adunk meg, amelyekből következik a sor konvergenciája vagy
5.3. HATVÁNYSOROK 33

divergenciája. Bár ezek a feltételek általában nem szükségesek a konvergenciához,


szokás őket kritériumoknak nevezni.
P
Állı́tás. (Majoráns kritérium)
P Ha 0 < ak ≤ bk teljesül minden
P k ∈ N-re, és bk
sor
P konvergens, akkor a k is. Ha viszont 0 < a k ≤ b k és a k divergens, akkor a
bk sor is divergens.
Bizonyı́tás. Pozitı́v tagú sor részletösszegei monoton növekvő sorozatot
alkotnak, másrészt a megfelelő részletösszegekre: san ≤ sbn . Ezért ha lim sbn véges
határérték, akkor lim san is az. De ha lim san = ∞, akkor lim sbn = ∞ is teljesül.
Q. E. D.
P
Állı́tás. (Hányadoskritérium) Egy pozitı́v tagú ak sor esetén
ak+1 P
ha minden k ∈ N-re ≤ q < 1, akkor ak konvergens,
ak
ak+1 P
ha minden k ∈ N-re ≥ 1, akkor ak divergens.
ak
Bizonyı́tás.
P Azk−1 első esetben láthatjuk, hogy P ak ≤ a1 q k−1 teljesül minden k ∈ N-
re. Ezért a a1 q mértani sor majorálja a ak sort, ezért az konvergens.
P∞ A második esetben a 1P≥ a k teljesül minden k ∈ N esetén, ezért a divergens
a
k=1 1 sor minorálja a a k sort. Q. E. D.
P
Állı́tás. (Gyökkritérium) Egy pozitı́v tagúP ak sor esetén

ha minden k ∈ N-re k ak ≤ q < 1, P akkor ak konvergens,
ha minden k ∈ N-re ak ≥ 1, akkor ak divergens.
k
PBizonyı́tás.
k
P krtériumot használjuk: a feltétel alapján ak ≤ q , és
A majoráns
a q konvergens, ezért ak is az.
P P
Ha ak ≥ 1, akkor nyilván a ak sor tagjai a divergens 1 sor tagjainál
nagyobbak (vagy egyenlők). Q. E. D.
Megjegyzés. Ha az előző kritériumokban szereplő feltételek egyike sem teljesül,

pl. limk→∞ k ak = 1 (növekedve), akkor akár a konvergencia akár a divergencia
bekövetkezhet.

5.3 Hatványsorok
Előbb a függvénysort értelmezzük, melynek speciális esete a hatványsor.
Legyenek f1 , f2 , . . . , fk , . . . függvények mind ugyanazon az I ⊂ R intervallumon
értelmezettek. Az

X
f1 (x) + f2 (x) + . . . + fk (x) + . . . = fk (x)
k=1

végtelen
P∞ tagú összeget függvénysornak nevezzük. A függvénysor x-ban konvergens,
ha a k=1 fk (x) számsor konvergens. Azon pontok halmazát, amelyekben a
függvénysor konvergens, a függvénysor konvergenciatartományának nevezzük.
34 5. SZÁMSOROK ÉS HATVÁNYSOROK

A függvénysorokkal kapcsolatban is számos fontos érdekes kérdés merül


fel; hol konvergensek, az összegfüggvény tulajdonságaira (folytonosság, diffe-
renciálhatóság, integrálhatóság) hogyan következtethetünk a sor tagjainak tula-
jdonságaiból.
P∞ k
A k=0 ak x függvénysort hatványsornak nevezzük. (Most az index 0-
tól, indul, hogy konstans tag is lehessen.) A hatványsort úgy tekinthetjük,
mint végtelen sok tagú polinomot. A hatványsor konvergenciatartományával
kapcsolatban a következőket mondhatjuk:
Állı́tás. Tekintsük a ∞ k
P
k=0 ak x hatványsort, és együtthatóikból képezzük az
p
bk = k |ak | k ∈ N

számsorozatot.
Ha (bk ) nem korlátos, akkor a hatványsor csak x = 0-ban konvergens.
Ha (bk ) korlátos és a legnagyobb torlódási pontja a 6= 0, akkor a hatványsor
abszolút konvergens minden |x| < a1 esetén.
Ha (bk ) korlátos, és csak a = 0 a torlódási pontja, akkor minden x ∈ R esetén
abszolút konvergens a hatványsor.
Bizonyı́tás. Ha (bk ) nem korlátos, akkor bármely x 6= 0 esetén végtelen sok
1
p
k-ra k |ak | > |x| , azaz |ak xk | > 1. Ez azt jelenti, hogy a sor általános tagja nem
tart nullához, tehát a sor x 6= 0 esetén nem konvergens.
Második esetben bármely |x| < a1 esetén legyen x0 olyan, hogy |x| < x0 < a1 .
Ekkor véges sok k kivételével
 k
p 1 1 x
k
|ak | < < , azaz |ak xk | < < 1.
x0 |x| x0

ak xk sor abszolút konvergens.


P
Így a majoráns kritérium alapján a
Harmadjára bármely x 6= 0 esetén véges sok k kivételével
p 1 1
k
|ak | < , azaz |ak xk | < k ,
2|x| 2

ak xk hatványsor abszolút konvergens.


P
ezért a Q. E. D.
Megjegyzés. Kimutatható, hogy a hatványsorok a konvergenciatartomány
belsejében jól viselkednek: 1) A hatványsor összegfüggvénye a konvergenciatar-
tomány minden belső pontjában folytonos, 2) az összegfüggvény differenciálható,
s deriváltja megegyezik a tagok deriváltjaiból álló hatványsor összegfüggvényével,
3) a hatványsor tagonként integrálható a konvergenciatartomány bármely belső
intervallumán.

Példa. A geometriai sor


1
= 1 + x + x2 + . . . + xk + . . .
1−x
5.3. HATVÁNYSOROK 35

bármely |x| < 1-re konvergens. (−x)-re alkalmazva


1
= 1 − x + x2 + . . . + (−1)k xk + . . .
1+x
Integráljuk a [0, x] intervallumon, ha |x| < 1.

x2 x3 xk+1
ln (1 + x) = x − + − . . . + (−1)k + ...
2 3 k+1
Ez a sor x = 1-nél is konvergens, s ı́gy
1 1 1
ln 2 = 1 − + − + ...
2 3 4
36 5. SZÁMSOROK ÉS HATVÁNYSOROK
6. Függvények határértéke
és folytonossága

A valós számhalmaz részhalmazain értelmezett, valós értékű függvények határérté-


két és folytonosságát értelmezzük és vizsgáljuk. Ezek a fogalmak nemcsak ebben
az esetben értelmezhetők, hanem mindakkor, ha az értelmezési tartományban és
az értékkészletben is a konvergencia fogalma adott.
Egy f : D ⊂ R → R függvényt korlátosnak nevezünk, ha a függvényértékek
halmaza korlátos. Ha f (x) ≤ f (x0 ) teljesül minden x ∈ D esetén, akkor
x0 -at a függvény maximumhelyének mondjuk, f (x0 )-at pedig az (abszolút)
maximumértékének. f (x) ≤ f (x0 ) esetén minimumhelyről és minimumértékről
beszélünk. x0 -at f helyi minimumhelyének (maximumhelyének) mondjuk, ha van
x0 -nak olyan G környezete, hogy minden x ∈ G ∩ D esetén f (x) ≥ f (x0 ) (illetve
f (x) ≤ f (x0 )).
A f függvényt monoton növekedőnek (csökkenőnek) nevezzük, ha bármely
x1 < x2 , x1 , x2 ∈ D esetén f (x1 ) ≤ f (x2 ) (f (x1 ) ≥ f (x2 )). Szigorú monotonitásról
beszélünk, ha az utóbbi egyenlőtlenségekben a szigorú egyenlőtlenség jele (<) áll.

6.1 Határérték
Definı́ció. Tekintsük az f : D ⊂ R → R függvény értelmezési tartományának
egy x0 torlódási pontját. Az f függvény x0 -beli határértékének nevezünk egy a
számot, ha bármely x0 -hoz konvergáló xn ∈ D, xn 6= x0 sorozat esetében az f (xn )
sorozat konvergál a-hoz.

Megjegyzés.

1. Értelmezési tartományként, illetve értékkészletként a valós számhalmaz


helyett szerepelhet egyik, vagy mindkét helyen a komplex számok halmaza is,
a definı́ció ugyanı́gy hangzik. Ezért beszélhetünk komplex változós és/vagy
komplex értékű függvény határértékéről is.

2. Ahhoz, hogy a függvény egy x0 -beli határértékét vizsgáljuk nem szükséges,


hogy x0 -ban f értelmezve legyen (sőt a lényegesebb esetekben nincs is ott

37
38 6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA

értelmezve), csak az, hogy x0 az értelmezési tartománynak torlódási pontja


legyen. Ha az értelmezési tartomány intervallum, akkor ez azt jelenti, hogy
x0 vagy az intervallum belső pontja vagy a végpontok egyike.
3. Az f függvénynek x0 -ban csak egyetlen határértéke lehet, ugyanis ha
xn → x0 esetén f (xn ) → a1 , mı́g x̃n → x0 esetén f (x̃n ) → a2 , akkor az
x1 , x̃1 , x2 , x̃2 , . . . sorozat esetén a függvényértékek sorozata nem konvergens.
1
Nem létezik pl. határértéke 0-ban az f (x) = sin függvénynek.
x

sin x1

A függvény határértékének alternatı́v definiálási lehetőségére mutat rá a


következő állı́tás.
Állı́tás. Legyen x0 az f : D ⊂ R → R függvény értelmezési tartományának egy x0
torlódási pontja. Annak szükséges és elégséges feltétele, hogy f x0 -beli határértéke
a legyen, az, hogy a-nak bármely nyı́lt G(a, ε) környezetéhez létezzen x0 -nak olyan
nyı́lt G(x0 , δ) környezete, hogy ha x ∈ G(x0 , δ) ∩ D, x 6= x0 , akkor f (x) ∈ G(a, ε).

Bizonyı́tás. A mondott feltétel elégséges: Legyen xn ∈ D, xn 6= x0 olyan


sorozat, hogy lim xn = x0 . Azt kell belátnunk, hogy f (xn ) → a. Tekintsük
n→∞
a-nak egy tetszőleges G(a, ε) nyı́lt környezetét, a feltétel miatt van olyan δ > 0
sugarú környezete x0 -nak, hogy ha x ∈ G(x0 , δ)∩D, x 6= x0 . akkor f (x) ∈ G(a, ε).
xn → x0 miatt ezen δ > 0-hoz van olyan n0 ∈ N, hogy bármely n > n0 -ra
xn ∈ G(x0 , δ). Ekkor f (xn ) ∈ G(a, ε) minden n > n0 esetén, azaz f (xn ) → a.
A feltétel szükséges: Indirekt módon bizonyı́tunk. Tegyük fel, hogy van egy
olyan ε > 0 sugarú G(a, ε) nyı́lt környezete a-nak, melyhez x0 -nak egyetlen
G(x0 , δ) nyı́lt környezete sem jó. Ekkor bármely n ∈ N esetén van olyan
xn ∈ G(x0 , n1 ) ∩ D, (xn 6= x0 ), hogy f (xn ) 6∈ G(a, ε). Ez azt jelenti, hogy bár
xn → x0 , de f (xn ) nem konvergál a-hoz. Ez ellentmond annak, hogy f x0 -beli
határértéke a. Q. E. D.
A függvény x0 -beli határértékének fogalma a függvények műveleteivel, s az
egyenlőtlenségekkel hasonló harmónikus kapcsolatban áll, mint a sorozat határér-
tékének fogalma.
6.2. FOLYTONOSSÁG 39

Állı́tás. Legyen lim f (x) = a és lim g(x) = b. Ekkor


x→x0 x→x0

• limx→x0 (f (x) + g(x)) = a + b

• limx→x0 (f (x) g(x)) = a b


f (x) a
• ha g(x) 6= 0 és b 6= 0, akkor lim = .
x→x0 g(x) b
• ha f (x) ≤ g(x) minden x ∈ D-re, akkor lim f (x) ≤ lim g(x)
x→x0 x→x0

• ha lim f (x) = lim g(x) = a és f (x) ≤ h(x) ≤ g(x) minden x ∈ D-re,
x→x0 x→x0
akkor lim h(x) = a.
x→x0

Bizonyı́tás. Az összeg esetében, tekintsünk egy tetszőleges xn ∈ D, xn 6= x0 ,


x0 -hoz konvergáló sorozatot: xn → x0 . Ilyenkor az f (xn ) sorozat konvergál a-hoz,
a g(xn ) sorozat konvergál b-hez, ezért a sorozatok konvergenciájának megfelelő
tulajdonsága miatt f (xn ) + g(xn ) konvergál a + b-hez.
A többi állı́tás is ezen séma alapján igazolható. Q. E. D.
Állı́tás. Legyenek adottak az f : D1 ⊂ R → R és g: D2 ⊂ R → R függvények
úgy, hogy f (D1 ) ⊂ D2 . Ha lim f (x) = a, a 6∈ f (D1 ), és lim g(x) = b, akkor
x→x0 x→a
lim g(f (x)) = b.
x→x0

Bizonyı́tás.
xn → x0 =⇒ f (xn ) → a =⇒ g(f (xn )) → b.
Q. E. D.

6.2 Folytonosság
Definı́ció. Az f : D ⊂ R → R függvényt folytonosnak nevezzük az értelmezési
tartományának x0 torlódási pontjában, ha lim f (x) = f (x0 ).
x→x0

Megjegyzés.

1. A definı́ciót közvetlenül, a határtérték fogalma nélkül is megadhattuk volna:


f folytonos x0 ∈ D-ben, ha bármely xn ∈ D, xn → x0 esetén f (xn ) → f (x0 ).
Ha ugyanis x0 nem torlódási pontja D-nek, akkor f (xn ) → f (x0 ) mindig
teljesül, hiszen ilyenkor xn → x0 csak úgy lehet, ha xn = x0 minden n-re
legfeljebb véges sok kivételével.

2. Környezetek segı́tségével a folytonosság ı́gy fogalmazható meg:


f : D ⊂ R → R pontosan akkor folytonos x0 -ban, ha f (x0 ) bármely nyı́lt
G(f (x0 ), ε) környezetéhez van x0 -nak olyan G(x0 , δ) nyı́lt környezete, hogy
40 6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA

minden x ∈ G(x0 , δ)-ra f (x) ∈ G(f (x0 ), ε). Az abszolút érték jelével ezt
gyakran formálisan ı́gy fejezik ki:

∀ ε > 0 ∃ δ > 0 : ∀x ∈ D : |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε.

y
y = f (x)

f (x0 ) 2ε

x0
x
x0 − δ x0 + δ

3. A folytonosság fogalma ugyanı́gy definiálható akár komplex változós, akár


komplex értékű függvények esetében is.

4. A határérték és a műveletek kapcsolatát kifejező állı́tások következménye-


ként azonnal adódik, hogy

• ha f és g folytonos x0 -ban, akkor f + g is folytonos x0 -ban.


• ha f és g folytonos x0 -ban, akkor f g is folytonos x0 -ban.
f
• ha f és g folytonos x0 -ban, g(x0 ) 6= 0, akkor is folytonos x0 -ban.
g
• ha f folytonos x0 -ban és g folytonos f (x0 )-ban, akkor a g ◦ f összetett
függvény is folytonos x0 -ban.

6.3 Folytonos függvények tulajdonságai


Egy f függvényt folytonosnak mondunk, ha értelmezési tartományának minden
pontjában folytonos. Az [a, b] zárt intervallumon értelmezett folytonos valós
függvények egy-két tulajdonságára mutatunk rá.
Állı́tás. Ha f : [a, b] → R függvény folytonos, akkor korlátos is, és felveszi
abszolút maximumát és minimumát.
Bizonyı́tás. Indirekten tegyük fel, hogy f nem korlátos, pl. felülről nem
korlátos. Akkor minden n ∈ N-hez van olyan xn ∈ [a, b], hogy f (xn ) > n. Világos,
hogy lim f (xn ) → ∞. Mivel {xn | n ∈ N} ⊂ R korlátos végtelen halmaz, ezért
n→∞
Bolzano-Weierstraß tétele miatt van torlódási pontja, legyen ez x0 . Mivel [a, b]
zárt, x0 ∈ [a, b]. Az xn sorozatból kiválasztható olyan részsorozat, amely x0 -hoz
6.3. FOLYTONOS FÜGGVÉNYEK TULAJDONSÁGAI 41

konvergál, jelölje ezt x̃k = xnk , k ∈ N. Ilyenkor tehát x̃k → x0 , de f (x̃k ) → ∞.


Ez ellentmond f x0 -beli folytonosságának.
A függvényértékek {f (x) | x ∈ [a, b]} halmaza tehát korlátos, tekintsük pontos
alsó, illetve pontos felső korlátját, K1 és K2 . Belátjuk, hogy létezik x1 ∈ [a, b]
(és x2 ∈ [a, b]), hogy f (x1 ) = K1 (és f (x2 ) = K2 ). Mivel K1 pontos alsó korlát,
1
bármely n ∈ N esetén van olyan xn ∈ [a, b], hogy K1 ≤ f (xn ) < K1 + . xn -ből
n
ismét kiválasztható egy x̃k → x0 ∈ [a, b] konvergens részsorozat. Ekkor viszont
f (x̃k ) → K1 és f (x̃k ) → f (x0 ) is teljesül, ezért K1 = f (x0 ). Q. E. D.
A folytonos függvények jeltartók és felvesznek minden közbülső értéket:

Állı́tás. A) Ha f : D ⊂ R → R függvény folytonos x0 -ban és f (x0 ) 6= 0, akkor


a függvény jeltartó x0 -ban, azaz van x0 -nak olyan G(x0 , δ) nyı́lt környezete, hogy
az e környezetből választott x-ekre f (x) állandó előjelű.
B) Ha f : [a, b] → R folytonos függvény és f (a) < f (b), akkor bármely y0 -hoz,
melyre f (a) ≤ y0 ≤ f (b), van olyan x0 ∈ [a, b], hogy f (x0 ) = y0 .

|f (x0 )|
Bizonyı́tás. A) ε = -höz van olyan G(x0 , δ) nyı́lt környezet, hogy
2
ha x ∈ G(x0 , δ), akkor f (x) ∈ G(f (x0 ), ε), azaz, ha pl. f (x0 ) > 0, akkor
f (x) > f (x0 ) − ε > 0 minden x ∈ G(x0 , δ)-ra.
B) Feltehetjük, hogy f (a) < y0 < f (b). Legyen A = {x ∈ [a, b] | f (x) < y0 }.
A felülről korlátos, nem üres, ezért van pontos felső korlátja: x0 = sup A. Ha
f (x0 ) > y0 , akkor f (x) − y0 jeltartó tulajdonsága miatt x0 egy környezetében
is f (x) − y0 > 0 teljesülne, de ekkor x0 nem lehet felső korlát, csak ha x0 = a.
De ekkor f (a) > y0 következne, ami ellentmondás. Ha f (x0 ) < y0 lenne, akkor
f (x) < y0 teljesülne szinén x0 egy környezetében, s ı́gy nem lehet x0 felső korlát,
csak ha x0 = b. De ekkor f (b) < y0 következne, ami lehetetlen. Tehát csak
f (x0 ) = y0 lehetséges. Q. E. D.

Állı́tás. Ha f : [a, b] → [c, d] folytonos bijektı́v függvény, akkor szigorúan


monoton és az inverz f −1 : [c, d] → [a, b] függvény is folytonos.

Bizonyı́tás. Tegyük fel, hogy f nem szigorúan monoton, azaz pl. van olyan
x1 < x2 < x3 , hogy f (x1 ) < f (x2 ) és f (x2 ) > f (x3 ). Legyen y0 olyan valós
szám, hogy max{f (x1 ), f (x3 )} < y0 < f (x2 ). Folytonos függvény felvesz minden
közbülső értéket, tehát van olyan x̃1 és x̃2 , hogy x̃1 ∈ (x1 , x2 ), x̃2 ∈ (x2 , x3 ), s
f (x̃1 ) = y0 = f (x̃2 ). Az injektivitás miatt viszont ez nem lehetséges.
Legyen yn ∈ [c, d] valamely y0 ∈ [c, d]-hoz konvergáló sorozat. Azt kell
megmutatni, hogy az xn = f −1 (yn ) sorozat konvergál f −1 (y0 )-hoz. Az xn sorozat
korlátos, ezért van egy x0 torlódási pontja, s ehhez konvergáló részsorozata: xnk →
x0 . f folytonossága miatt ilyenkor f (xnk ) → f (x0 ), de f (xnk ) = ynk → y0 , tehát
f (x0 ) = y0 , azaz x0 = f −1 (y0 ). Ebből következik, hogy az f −1 (yn ) sorozatnak
x0 = f −1 (y0 )-on kı́vül más torlódási pontja nincs, tehát f −1 (yn ) → f −1 (y0 ), azaz
f −1 folytonos y0 -ban. Q. E. D.
42 6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA

6.4 Elemi függvények folytonossága


Elemi függvénynek nevezzük a konstans 1, az x, az exponenciális ax , (a > 0),
a sin x függvényekből a műveletekkel (összeadás, kivonás, szorzás, osztás), az
inverzképzéssel és az összetett függvény képzésével adódó függvényeket. Mindezek
a lépések folytonos függvényekből kiindulva folytonos függvényt eredményeznek.
1, x, ax , sin x folytonosságát belátva kapjuk majd, hogy az elemi függvények
mind folytonosak, speciálisan pl. az összes polinomfüggvény, a logaritmusfügg-
vény, a gyökvonás függvénye, a trigonometrikus függvény és inverzeik, stb. mind
folytonosak.
Állı́tás.
a) f : R → R, x 7→ c függvény folytonos (c konstans)
b) f : R → R, x 7→ x függvény folytonos
c) f : R → R, x 7→ ax függvény folytonos (a > 0 konstans)
d) f : R → R, x 7→ sin x függvény folytonos
Bizonyı́tás. a) és b) triviálisan teljesül.
c)-hez előbb belátjuk azt, hogy ha a > 0, bn → 0, akkor abn → 1. Ugyanis, ha
1 1
speciálisan bn = , a > 1, akkor a n = 1 + hn , hn ≥ 0 felbontással
n
 1 n
a = an = (1 + hn )n ≥ 1 + n hn

teljesül a Bernoulli egyenlőtlenség miatt. Ebből


a−1
≥ hn
n
1 1
következik, amiből hn → 0, a n → 1 adódik. 0 < a < 1 esetében -ra alkalmazva
1
a
a most bizonyı́tottat, azonnal adódik az a n → 1 konvergencia. Tetszőleges
bn > 0, bn → 0 sorozat esetében feltehetjük, hogy bn < 1. Ekkor minden n ∈ N-hez
van olyan kn ∈ N, hogy
1 1
≤ bn <
kn + 1 kn
Könnyen látható, hogy bn → 0 miatt kn → ∞. Az egyenlőtlenségből a > 1 miatt
1 1
a kn +1 ≤ abn < a kn
1
A baloldalon és a jobboldalon szereplő sorozatok részsorozatai az a n sorozatnak,
ezért 1-hez konvergálnak, s ı́gy a közrefogott abn sorozat is. Vegyes előjelű
bn sorozat esetében bontsuk fel egy pozı́tı́v tagú cn és egy negatı́v tagú dn
részsorozatra az eredetit. A pozitı́v tagúra, illetve negatı́v tagú (−1)-szeresére
1
alkalmazva a most bizonyı́tottat: acn → 1 és a−dn → 1. A másodikból dn → 1,
a
s reciprokát véve adn → 1. E szerint abn mindkét részsorozata 1-hez tart, ezért
abn → 1.
6.5. NÉHÁNY FÜGGVÉNY HATÁRÉRTÉKE 43

Az ax függvény x0 -beli folytonosságának bizonyı́tásához tekintsünk egy xn →


x0 sorozatot. Ilyenkor xn − x0 → 0, ezért axn −x0 → 1. Tetszőlegesen választott
ε
ε > 0-hoz van olyan n0 ∈ N, hogy |axn −x0 − 1| < x0 , ha n > n0 . Ilyen n-ekre
a
xn x0 x0 xn −x0 ε
|a − a | = a |a − 1| < ax0 x0 = ε
a
teljesül, ami axn → ax0 konvergenciát jelenti.
c) A sin x függvény x0 -beli folytonosságának igazolásához az ε − δ-s bizonyı́tási
módot alkalmazzuk. Ismert trigonometriai képletet alkalmazva, a geometriailag
nyilvánvaló | sin x| < |x| egyenlőtlenség miatt

x − x0 x + x0
| sin x − sin x0 | = 2 sin cos ≤ |x − x0 |.
2 2
Ez azt jelenti, hogy tetszőleges ε > 0-hoz a δ = ε választás jó: ha |x − x0 | < δ = ε,
akkor | sin x − sin x0 | < ε. Q. E. D.

6.5 Néhány függvény határértéke


1
1. lim (1 + x) x = e.
x→0
Bizonyı́tás. Tegyük fel, hogy xn → 0, és 0 < xn < 1. A többi eset erre
könnyen visszavezethető. Ekkor minden n ∈ N-hez van olyan kn ∈ N, hogy
1 1
≥ xn ≥
kn kn + 1
azaz
1 1
1+ ≥ 1 + xn ≥ 1 +
kn kn + 1
Ezért
 kn +1  kn
1 k +1 1 1
1+ ≥ (1 + xn ) n ≥ (1 + xn ) xn ≥ 1 +
kn kn + 1
 kn +1  kn  
A baloldali sorozat 1 + k1n = 1 + k1n 1 + k1n → e, s hasonlóan
a jobboldali is, ezért a közrefogott sorozat is e-hez konvergál. Q. E. D.
ax − 1
2. lim = ln a.
x→0 x
Bizonyı́tás. A következő átalakı́tást végezzük el:
ax − 1 ax − 1 ln a
= =
x ln ax 1
ln [1 + (ax − 1)] ax −1
ln a
ax folytonos 0-ban, azaz ax → 1, ax − 1 → 0, ha x → 0. Ezért a nevezőben
ln mögötti függvény e-hez tart, s a log függvény folytonosságát kihasználva
kapjuk az állı́tást. Q. E. D.
44 6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA

sin x
3. lim = 1.
x→0 x
π
Bizonyı́tás. Geometriai ismereteinkből kapjuk, hogy 0 < x < 2 esetén

sin x < x < tg x


x 1
1< <
sin x cos x
x → 0 esetén a cos függvény folytonosságából adódóan cos x → 1, azaz a
x sin x
”rendőrelv” alapján → 1, s ı́gy → 1. Q. E. D.
sin x x

6.6 A határérték fogalom kiterjesztése


Definı́ció. Az f : D ⊂ R → R függvény értelmezési tartományának x0 torlódási
pontjában a határértéke végtelen, ha bármely xn → x0 , xn ∈ D, xn 6= x0 sorozat
esetén f (xn ) → ∞. Jele: lim f (x) = ∞.
x→x0

Megjegyzés.
1. Itt is megadható a környezetekkel történő definı́ció analógiája: f x0 -beli
határértéke végtelen, ha bármely K ∈ R számhoz van olyan G(x0 , δ)
nyı́lt környezete x0 -nak, hogy minden ebből vett, de x0 -tól különböző x-re
f (x) > K.
2. Hasonlatosan értelmezhető a mı́nusz végtelenhez való tartás is.
3. E kibővı́tett értelmű határértékről is egyszerű tulajdonságok fogalmazhatók
meg. Pl.:
• ha lim f (x) = ∞ és lim g(x) = ∞, akkor lim (f (x) + g(x)) = ∞ és
x→x0 x→x0 x→x0
lim (f (x) g(x)) = ∞
x→x0

• ha limx→x0 f (x) = ∞ és limx→x0 g(x) > 0, akkor


limx→x0 (f (x) g(x)) = ∞.
1
4. Például lim =∞
x→0 x2

Definı́ció. Legyen adott az olyan f : D ⊂ R → R függvény, melynek értelmezési


tartománya felülről nem korlátos. Azt mondjuk, hogy az f függvény határértéke
a végtelenben az a szám, ha bármely xn ∈ D, xn → ∞ sorozat esetén f (xn ) → a.
Jele: lim f (x) = a. Alulról nem korlátos értelmezési tartomány esetében
x→∞
értelmezhetjük a mı́nusz végtelenben a függvény határértékét: lim f (x) = a,
x→−∞
ha bármely xn ∈ D, xn → −∞ esetén f (xn ) → a.
6.6. A HATÁRÉRTÉK FOGALOM KITERJESZTÉSE 45

Megjegyzés.
1. E definı́ciókat környezetek segı́tségével is megadhattuk volna, pl.:
lim f (x) = a, ha ∀ ε > 0 ∃ K ∈ R, hogy ∀ x ∈ D, x > K-ra |f (x) − a| < ε.
x→∞

2. A függvény határértéke a végtelenben ( vagy a mı́nusz végtelenben) lehet


akár végtelen, akár mı́nusz végtelen is: pl. lim f (x) = ∞ akkor teljesül, ha
x→∞
minden xn → ∞ esetén f (xn ) → ∞.
1
3. Példa: lim = 0, lim log2 x = ∞.
x→∞ x x→∞

Számos esetben előfordul, hogy a függvények értelmezési tartományának egy


x0 torlódási pontjában nincs határértéke, de csak jobbról vagy csak balról közelı́tve
x0 -hoz, a függvényértékek konvergálnak. A jobboldali vagy baloldali határérték is
lehet véges, vagy — tágabb értelemben — ∞ vagy −∞. Ugyanezt alkalmazhatjuk
a folytonosság kérdésére is. Példaképpen mutatunk be két definı́ciót, a többi
hasonlóan értelmezhető akár sorozatok, akár környezetek segı́tségével.
Definı́ció. Legyen D = [a, b], s a < x0 < b. Az f : D → R függvény x0 -
beli jobboldali határértéke végtelen, ha bármely xn ∈ D, xn > x0 , xn → x0
sorozat esetén f (xn ) → ∞. A jobboldali határérték jele: lim f (x), a baloldalié:
x→x0 +0
lim f (x).
x→x0 −0
Az f : D ⊂ R → R függvény balról folytonos x0 -ban, ha bármely ε > 0-hoz van
olyan δ > 0, hogy ha x ∈ (x0 − δ, x0 ), akkor |f (x) − f (x0 )| < ε.
1
Példa: lim= ∞, lim tg x = ∞, az f (x) = [x] egész-rész függvény
x→0+0x x→π/2−0
1-ben jobbról folytonos, de balról nem.
Megjegyzés. Ha az f függvénynek x0 -ban létezik baloldali és jobboldali
(véges) határértéke, de ott nem folytonos, akkor x0 -at elsőfajú szakadási
pontnak nevezzük. Ha ott jobboldali és baloldali határértékük megegyezik,
sin x
akkor megszüntethető szakadásnak mondjuk. Pl. 0-ban megszüntethető
x
szakadással rendelkezik. Az egyéb nem folytonossági helyeket másodfajú szakadási
1 1
helynek mondjuk, pl. 0-ban, vagy sin 0-ban.
x x
46 6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA


2
π
2 x
7. Differenciálás

7.1 Differenciálhányados és deriváltfüggvény


Definı́ció. Az f : D ⊂ R → R függvényt értelmezési tartományának egy x0
pontjában differenciálhatónak mondjuk, ha a
f (x) − f (x0 )
lim
x→x0 x − x0
df
határérték létezik. E határértéket f ′ (x0 )-al (vagy régiesebben (x0 )-al)
dx
jelöljük, és f x0 -beli differenciálhányadosának vagy deriváltjának nevezzük.
f deriváltfüggvénye az az f ′ -al jelölt függvény, mely f differenciálhatósági
pontjaiban van értelmezve, s melynek x-beli értéke f x-beli differenciálhányadosát
adja meg.

f (x)

f (x) − f (x0 )

f (x0 )
x − x0

x0 x

Megjegyzés.
1. A differenciálhányados értelmezéséhez szükséges, hogy x0 az értelmezési
tartománynak nemcsak pontja, hanem torlódási pontja is legyen. Ha
tipikusan D intervallum, ez semmilyen megszorı́tást nem jelent.

47
48 7. DIFFERENCIÁLÁS

2. Ahol egy függvény differenciálható, ott folytonos is. Ugyanis, ha f diffe-


renciálható x0 -ban, akkor bármely xn → x0 esetén
f (xn ) − f (x0 )
dn = − f ′ (x0 ) → 0
xn − x0
ezért,
f (xn ) − f (x0 ) = (xn − x0 )(f ′ (x0 ) + dn ) → 0

3. Ha a függvény grafikonját (görbéjét) tekintjük, láthatjuk, hogy a diffe-


renciálhányados definı́ciójában szereplő hányados az (x0 , f (x0 )) és az
(x, f (x)) pontokat összekötő szelő meredekségét, iránytangensét adja meg.
Ha x → x0 , szemléletesen szólva, a szelő az (x0 , f (x0 ))-beli érintőbe megy
át. Ezért mondhatjuk, hogy az x0 -beli differenciálhányados a függvénygör-
be ottani érintőjének meredekségét adja meg. A differenciálhatóság pedig
azt jelenti, hogy a szelők határhelyzete egyértelmű, abban a pontban csak
egyetlen ’érintő’ húzható.
4. Nem differenciálható, pl. 0-ban az |x| függvény, hiszen ha x < 0, akkor
f (xn ) − f (x0 )
az hányados −1, mı́g x > 0 esetén +1. Ebben az esetben
xn − x0
a hányadosnak van 0-ban baloldali és jobboldali határértéke is, de nem
egyenlők. Láthatjuk, hogy lehetne értelmezni a baloldali, illetve jobboldali
differenciálhányados fogalmát is, mint ahogy a függvény határértéke és
folytonossága esetén tettük.
Az f (x) = x sin x1 , f (0) = 0 függvény esetén 0-ban nem differenciálható f ,
sőt sem baloldali, sem jobboldali differenciálhányadosa nem létezik.

x sin x1

√ f (xn ) − f (x0 )
Az f = x függvény sem differenciálható 0-ban, mivel a
xn − x0
hányados végtelenhez tart, nem konvergál x → 0 esetén.
7.1. DIFFERENCIÁLHÁNYADOS ÉS DERIVÁLTFÜGGVÉNY 49

5. Ha a függvény x változóját időnek gondoljuk, a differenciálhányados a


függvényértékek változásának pillanatnyi sebességét adja meg, hiszen a
f (xn ) − f (x0 )
hányados az [x0 , x] alatti átlagsebességet jelenti.
xn − x0

Állı́tás. Tegyük fel, hogy f és g differenciálható x0 -ban. Ekkor


• f + g is differenciálható x0 -ban, és

(f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 )

• f · g is differenciálható x0 -ban, és

(f · g)′ (x0 ) = f ′ (x0 ) g(x0 ) + f (x0 ) g ′ (x0 )

f
• ha g(x0 ) 6= 0, akkor is differenciálható x0 -ban, és
g
 ′
f f ′ (x0 ) g(x0 ) − f (x0 ) g ′ (x0 )
(x0 ) =
g g 2 (x0 )

A szorzatfüggvény deriváltjára vonatkozó képletet Leibniz szabálynak nevezik.


Bizonyı́tás. Az összegre vonatkozó állı́tás az f + g-hez tartozó hányadosfügg-
vény felbontásából következik:
(f + g)(x) − (f + g)(x0 ) f (x) − f (x0 ) g(x) − g(x0 )
= +
x − x0 x − x0 x − x0
Szorzat esetében a következőképp bonthatjuk fel határértékkel rendelkező
függvények összegére:
f (x) g(x) − f (x0 ) g(x0 ) f (x) − f (x0 ) g(x) − g(x0 )
= g(x) + f (x0 ) →
x − x0 x − x0 x − x0
→ f ′ (x0 ) g(x0 ) + f (x0 ) g ′ (x0 )
f és g hányadosa x0 -beli deriváltjának képzése a következő átalakı́tásból
adódik:
f (x) f (x0 )
−  
g(x) g(x0 ) 1 f (x) − f (x0 ) g(x) − g(x0 )
= g(x) − f (x0 )
x − x0 g(x)g(x0 ) x − x0 x − x0
Q. E. D.
Állı́tás. Legyen f és g olyan, hogy g ◦ f értelmezett, és f differenciálható x0 -ban,
g differenciálható f (x0 )-ban. Ekkor g ◦ f differenciálható x0 -ban, és

(g ◦ f )′ (x0 ) = g ′ (f (x0 )) f ′ (x0 )


50 7. DIFFERENCIÁLÁS

Ha f invertálható és folytonos x0 egy környezetében és x0 -ban differenciálható,


f ′ (x0 ) 6= 0, akkor az inverz f −1 függvény is differenciálható y0 = f (x0 )-ban, és
1
(f −1 )′ (y0 )) =
f ′ (f −1 (y 0 ))

Az összetett függvény deriválási szabályát ’láncszabálynak’ is nevezik.


Bizonyı́tás. Az összetett függvény esetében egy bővı́téssel máris eredményre
jutunk, ha xn → x0 olyan sorozat, hogy véges sok n kivételével f (xn ) 6= f (x0 ):

g(f (xn )) − g(f (x0 )) g(f (xn )) − g(f (x0 )) f (xn ) − f (x0 )
= → g ′ (f (x0 )) f ′ (x0 )
xn − x0 f (xn ) − f (x0 ) x − x0

kihasználva, hogy xn → x0 esetén f (xn ) → f (x0 ) is teljesül. Ha viszont, xn → x0


olyan, hogy végtelen sok n-re f (xn ) = f (x0 ), akkor f ′ (x0 ) = 0. Ezekre az n-ekre
g(f (xn )) − g(f (x0 ))
a = 0, mı́g a többiek alkotta részsorozat esetében a fenti
xn − x0
bővı́tés alkalmazható, s f ′ (x0 ) = 0 miatt (g ◦ f )′ (x0 ) = 0 is teljesül.
Inverz függvény képzésénél folytonos függvény inverze is folytonos, ezért ha
yn → y0 , akkor f −1 (yn ) → f −1 (y0 ). Így

f −1 (yn ) − f −1 (y0 ) 1
lim = lim yn − y0 =
n→∞ yn − y0 n→∞
f −1 (yn ) − f −1 (y0 )

1 1 1
= = ′ = ′ −1
f (xn ) − f (x0 ) f (x0 ) f (f (y0 ))
limn→∞
xn − x0
Q. E. D.

7.2 A monotonitás és a differenciálhatóság kap-


csolata
Állı́tás.

• Ha f differenciálható x0 -ban, és f monoton növekvő x0 egy környezetében,


akkor f ′ (x0 ) ≥ 0.

• Ha f differenciálható x0 -ban, és f monoton csökkenő x0 egy környezetében,


akkor f ′ (x0 ) ≤ 0.

• Ha f differenciálható D egy x0 belső pontjában, és f -nek ott helyi


szélsőértéke van, akkor f ′ (x0 ) = 0.
7.2. A MONOTONITÁS ÉS A DIFFERENCIÁLHATÓSÁG
KAPCSOLATA 51
y

x0 x

f (x) − f (x0 )
Bizonyı́tás. Ha f monoton nő, akkor a függvény minden x 6= x0 -
x − x0
ra nemnegatı́v , ezért határértéke, az x0 -beli differenciálhányados is nemnegatı́v
szám. Hasonlóan érvelhetünk monoton csökkenő függvény esetében is.
f (x) − f (x0 )
Ha f -nek x0 -ban pl. helyi minimuma van, akkor x < x0 esetén a
x − x0
függvény nempozitı́v, mı́g x > x0 esetén nemnegatı́v, ezért az x0 -beli határértéke,
mely feltételünk szerint létezik, csak 0 lehet. Q. E. D.

Ezek az állı́tások közvetlenül nem fordı́thatók meg, csak ha egy egész


intervallumon követeljük meg a differenciálhatóságot és a derivált pozitivitását,
illetve negativitását. Bizonyı́tásukhoz felhasználjuk az egyszerű, de az elméletben
igen jelentős Rolle- és Lagrange-féle középértéktételt.

Állı́tás. Rolle tétel: Ha az f : [a, b] → R folytonos függvény differenciálható


az (a, b) nyı́lt intervallum minden pontjában, és f (a) = f (b), akkor van olyan
ξ ∈ (a, b), hogy f ′ (ξ) = 0.

Bizonyı́tás. Ha f konstans, akkor nyilván minden ξ ∈ (a, b) esetén teljesül


f ′ (ξ) = 0.
Ha f nem konstans, akkor a folytonosság miatt felveszi abszolút minimumát
és abszolút maximumát. Legalább az egyik szélsőértékhely nem az intervallum
végpontjában, jelölje ezt ξ. Itt f ′ (ξ) = 0. Q. E. D.

Állı́tás. Lagrange tétel: Ha az f : [a, b] → R folytonos függvény differenciálható


az (a, b) nyı́lt intervallum minden pontjában, akkor van olyan ξ ∈ (a, b), hogy

f (b) − f (a)
= f ′ (ξ)
b−a
52 7. DIFFERENCIÁLÁS

f (b)

f (a)

a ξ b x
f (b) − f (a)
Bizonyı́tás. Alkalmazzuk Rolle tételét a h(x) = f (x) − (x − a)
b−a
függvényre. Van olyan ξ ∈ (a, b), hogy h′ (ξ) = 0. Átrendezéssel kapjuk az állı́tást.
Q. E. D.
Megjegyzés. E két tételnek igen szemléletes jelentése van. Rolle tétele azt
mondja, hogy a diffenciálható függvénynek valahol vı́zszintes érintője van, mı́g
Lagrange tétele szerint a húrral párhuzamos érintőt is lehet húzni.
Állı́tás. Legyen f differenciálható az (a, b) intervallumon. Ekkor
• ha f ′ ≥ 0 minden x ∈ (a, b)-re, akkor f monoton növekvő,
• ha f ′ ≤ 0 minden x ∈ (a, b)-re, akkor f monoton csökkenő,
• ha f ′ = 0 minden x ∈ (a, b)-re, akkor f konstans.

Bizonyı́tás. Indirekten bizonyı́tunk: ha f nem monoton növekvő, akkor van


olyan x1 < x2 (a, b)-ben, hogy f (x1 ) > f (x2 ). Lagrange középérték tétele
miatt van olyan ξ ∈ (x1 , x2 ), hogy f ′ (ξ) = f (xx22)−f
−x1
(x1 )
< 0. Ez ellentmond
feltételünknek.
A második állı́tást kapjuk, ha −f -re alkalmazzuk az elsőt, mı́g a harmadik az
első kettőből azonnal következik. Q. E. D.

Elemi függvények differenciálhatósága


Az alábbiakban láthatjuk, hogy az elemi függvények az értelmezési tar-
tományuk minden belső pontjában differenciálhatók. Ez következik már abból,
ha belátjuk a konstans, a hatványfüggvények, az exponenciális függvények, a
trigonometrikus függvények differenciálhatóságát.
Állı́tás.
• (xn )′ = n xn−1 , ahol n ∈ N természetes szám.
• (sin x)′ = cos x
7.2. A MONOTONITÁS ÉS A DIFFERENCIÁLHATÓSÁG
KAPCSOLATA 53
• (ax )′ = ln a ax , ahol a > 0.

Bizonyı́tás. Közismert azonosságot, illetve xn folytonosságát kihasználva


láthatjuk, hogy xk → x0 esetén

xnk − xn0 (xk − x0 )(xn−1 + xn−2 x0 + . . . + xn−1


0 )
= =
xk − x0 xk − x0

= xn−1 + xn−2 x0 + . . . + xn−1


0 → n xn−1
0

Trigonometriai azonosságot, és a cos x folytonosságát alkalmazva adódik, hogy


xn → x0 esetén

sin xn − sin x0 2 sin xn −x


2
0
cos xn +x
2
0

= → cos x0
xn − x0 xn − x0
sin x
hiszen lim = 1.
x→0 x
Az exponenciális esetben emeljünk ki ax0 -at:

ax n − ax 0 axn −x0 − 1
= ax 0 → ax0 ln a
xn − x0 xn − x0
ax − 1
hiszen már láttuk, hogy lim = ln a. Q. E. D.
x→0 x
Megjegyzés.
1. Ezek után könnyen adódik a többi trigonometrikus függvény deriváltja:
π π
(cos x)′ = (sin( − x))′ = − cos( − x) = − sin x
2 2
 ′
sin x cos x cos x + sin x sin x 1
(tg x)′ = = =
cos x cos2 x cos2 x
′
− 12

′ 1 1
(ctg x) = = cos2 x = − 2
tg x tg x sin x
2. Láthatjuk, hogy különösen egyszerű az ex deriváltfüggvényének képzése:
(ex )′ = ex . A természetes alapú logaritmus függvény deriváltja:
1 1
(ln x)′ = =
e ln x x

3. Tetszőleges α kitevőjű hatványfüggvény deriváltja ugyanúgy számı́tható,


mint a természetes szám kitevőjűé:
′ 1
(xα )′ = eαln x = eαln x α = α xα−1

x
54 7. DIFFERENCIÁLÁS

7.3 L’Hospital szabály


Gyakorlati alkalmazásokban játszik szerepet a következő tételcsoport. Pontosab-
ban csak 2 reprezentánsát fogalmazzuk meg:
Állı́tás. Tegyük fel, hogy az (x0 , b) nyı́lt intervallumon értelmezett, s ott
differenciálható f és g függvényekre lim f (x) = 0 és lim g(x) = 0, továbbá
x→x0 +0 x→x0 +0
g ′ (x) 6= 0 teljesül. Ha a
f ′ (x)
lim =A
x→x0 +0 g ′ (x)

határérték létezik, akkor a


f (x)
lim
x→x0 +0 g(x)
határérték is létezik, s e két határérték egyenlő.
Bizonyı́tás. Feltehetjük, hogy f és g is x0 -ban is értelmezett, s ott 0 értéket
vesznek fel. Rögzı́tett x-re tekintsük a h(t) = f (t) − fg(x)
(x)
g(t) függvényt minden
t ∈ [x0 , x]-re. h(x0 ) = 0 és h(x) = 0, alkalmazhatjuk Rolle tételét: van olyan
ξ ∈ (x0 , x), hogy h′ (ξ) = 0, azaz

f (x) f ′ (ξ)
= ′ .
g(x) g (ξ)

Ha xn → x0 , akkor az xn -hez a fentiek szerint hozzátartozó ξn sorozatra is ξn → x0


teljesül. Ezért
f (xn ) f ′ (ξn )
= ′ → A.
g(xn ) g (ξn )
Q. E. D.
Állı́tás. Tegyük fel, hogy az (x0 , b) nyı́lt intervallumon értelmezett, s ott
differenciálható f és g függvényekre lim f (x) = ∞ és lim g(x) = ∞. Ha a
x→x0 +0 x→x0 +0

f ′ (x)
lim =A
x→x0 +0 g ′ (x)

határérték létezik, akkor a


f (x)
lim
x→x0 +0 g(x)
határérték is létezik, s e két határérték egyenlő.
Bizonyı́tás. A feltétel miatt tetszőleges ε > 0-hoz van olyan δ1 > 0 szám, hogy
ha x0 < x < x0 + δ1 , akkor ′
f (x) ε

g ′ (x) − A <
2
7.3. L’HOSPITAL SZABÁLY 55

Legyen x, y olyan, hogy x0 < x < y < x0 + δ1 . Alkalmazzuk Rolle tételét a


h(t) = f (t) (g(x) − g(y)) − (f (x) − f (y)) g(t) függvényre (t ∈ [x, y]). Ekkor van
olyan ξ ∈ (x, y), hogy h′ (ξ) = 0, azaz

f (x) − f (y) f ′ (ξ)


= ′ .
g(x) − g(y) g (ξ)

Ezért
f (x) − f (y) ε
g(x) − g(y) − A < 2

Felbontjuk az abszolút értékjelet, szorzunk (g(x) − g(y))-nal, osztunk g(x)-el


(ezekről feltehetjük, hogy pozitı́vak, ha már x0 < x < x0 + δ2 ):

ε ε g(y) f (y) f (x) ε ε g(y) f (y)


− − (A − ) + < − A < − (A + ) +
2 2 g(x) g(x) g(x) 2 2 g(x) g(x)
ε ε
A baloldalon − mellett, illetve a jobboldalon mellett álló függvények rögzı́tett
2 2
ε
y mellett tartanak 0-hoz, ezért abszolút értékben -nál kisebbek, ha x0 < x <
2
x0 + δ3 . Ha δ = min{δ1 , δ2 , δ3 }, akkor minden x0 < x < x0 + δ esetén

f (x)

g(x) − A <ε

Q. E. D.
Megjegyzés.

1. Mindkét fenti állı́tás akkor is igaz, ha a határérték kiterjesztett értelemben


létezik, azaz ha A = ∞, vagy A = −∞. A bizonyı́tást megfelelően kell
módosı́tani.
2. Az állı́tások akkor is érvényesek, ha x0 helyett a végtelenben (vagy mı́nusz
végtelenben) vett határértékeit vizsgáljuk a függvényeknek. (Ugyanis egy
x = 1t helyettesı́téssel a függvényeknek az értelmezési tartományát ”ki-
befordı́thatjuk”.) Természetesen ilyenkor a szóban forgó függvényeknek egy
(a, ∞), illetve (−∞, a) intervallumon kell értelmezettnek lenni.
3. A bizonyı́tott állı́tások — feltételek teljesülése esetén — ún. 00 , illetve

∞ tı́pusú határértékek meghatározására ad módot. Ezekre az esetekre
visszevezethetők a 0 · ∞, a 00 , a ∞0 , a 1∞ , a ∞ − ∞ tı́pusú határértékek,
pl. a negyedik esetben az

ln f (x)
1
(f (x))g(x) = e g(x)

átalakı́tás segı́tségével.
56 7. DIFFERENCIÁLÁS

7.4 Magasabb rendű deriváltak

Amennyiben egy f függvény D értelmezési tartományának minden pontjá-


ban differenciálható (vagy legalábbis x0 ∈ D egy környezetében), vizsgálhat-
juk az f ′ deriváltfüggvény x0 -beli differenciálhányadosát. Ha egy x0 -ban f ′
differenciálható, akkor f ′ x0 -beli differenciálhányadosát f ′′ (x0 )-al jelöljük, és f
x0 -beli második differenciálhányadosának vagy deriváltjának nevezzük. Ilyenkor
azt is mondjuk, hogy f kétszer differenciálható x0 -ban. Ha f ′′ (x0 ) létezik
minden x0 ∈ D-ben, akkor az f ′′ : x0 ∈ D 7→ f ′′ (x0 ) függvényt f második
deriváltfüggvényének mondjuk. Az f ′′ függvény differenciálhatóságát vizsgálva
kaphatjuk f harmadik differenciálhányadosát, illetve deriváltfüggvényét, majd
továbbhaladva, a negyedik, stb. deriváltakat. Jelölése: f (k) (x0 ), azaz szóban,
f k-adik differenciálhányadosa x0 -ban, vagy ami ugyanaz: f k-adik deriváltjának
x0 -beli értéke.
Példa. Az elemi függvényeknek létezik k-adik deriváltfüggvénye minden
k ∈ N esetén, hiszen az újabb deriválások során mindig elemi függvényhez
jutunk. Konkrét előállı́tásuk azonban mégsem mindig egyszerű, csak ha a
deriváltfügvények sorozatában valamilyen szabályszerűség mutatkozik.
Pl. (ex )(k) = ex , (sin x)(2k+1) = (−1)k+1 cos x, (sin x)(2k) = (−1)k sin x,
(ln x)(k) = (−1)k+1 (k − 1)!x−k . Viszont nem létezik pl. második differenciál-
hányadosa az

f (x) = x2 x≥0
−x2 x<0

függvénynek x = 0-ban, hiszen első deriváltja f ′ (x) = 2|x|.

7.5 Konvexitás és a deriváltak kapcsolata

Mı́g a függvény első deriváltjának előjele a függvény monotonitásával van szoros


kapcsolatban, addig a második derivált a függvény konvexitásával.

Definı́ció. Egy [a, b] intervallumon értelmezett f függvényt (alulról) konvexnek


mondunk, ha bármely a ≤ x1 < x2 ≤ b esetén minden λ ∈ [0, 1]-re

f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 )

teljesül. f konkáv [a, b]-n, ha (−f ) konvex.


7.5. KONVEXITÁS ÉS A DERIVÁLTAK KAPCSOLATA 57

y
f konvex

x1 x2 x
λx1 + (1 − λ)x2

A konvexitás szemléletesen nyilvánvalóan azt jelenti, hogy az [x1 , x2 ] interval-


lum feletti függvénygörbe az x1 -hez és x2 -höz tartozó görbepontokat öszekötő húr
alatt halad.
Az [a, b]-n differenciálható függvények esetében a konvexitás a deriváltfüggvény
monotonitásával függ össze, ezért kétszeri differenciálhatóság esetén a második
derivált előjelével.
Állı́tás. Legyen f : [a, b] → R egy differenciálható függvény.
f pontosan akkor konvex, ha f ′ monoton nő.
f pontosan akkor konkáv, ha f ′ monoton csökken.
x2 − x
Bizonyı́tás. λ = helyettesı́téssel a konvexitás feltétele
x2 − x1
(x2 − x)f (x1 ) + (x − x1 )f (x2 )
f (x) ≤
x2 − x1
alakba ı́rható. Szorzás, kiemelés, osztás útján a következőhöz jutunk:
f (x) − f (x1 ) f (x2 ) − f (x1 )

x − x1 x2 − x1
illetve más kiemeléssel:
f (x2 ) − f (x1 ) f (x2 ) − f (x)

x2 − x1 x2 − x
(Ezen egyenlőtlenségek szemléletes jelenése az, hogy a konvex függvénygörbe 3
húrjának meredeksége hogyan viszonyul egymáshoz.) Képezve az első baloldalának
x1 -beli határértékét, illetve a második jobboldalának x2 -beli határértékét az
f (x2 ) − f (x1 )
f ′ (x1 ) ≤ ≤ f ′ (x2 )
x2 − x1
bizonyı́tandó egyenlőtlenséghez jutunk.
58 7. DIFFERENCIÁLÁS

Viszafelé, f ′ monoton növekedése esetén alkalmazva Lagrange tételét az [x1 , x],


illetve [x, x2 ] intervallumra, azt kapjuk, hogy

f (x) − f (x1 ) f (x2 ) − f (x)


= f ′ (ξ1 ) ≤ f ′ (ξ2 ) = .
x − x1 x2 − x

Ebből átrendezéssel adódik az


(x2 − x)f (x1 ) + (x − x1 )f (x2 )
f (x) ≤
x2 − x1

egyenlőtlenség, ami f konvexitását jelenti.


A konkáv eset úgy adódik, hogy (−f )-re — amely konvex — alkalmazzuk a
most bizonyı́tottat. Q. E. D.
Következmény. Egy kétszer differenciálható f : [a, b] → R függvény pontosan
akkor konvex, ha f ′′ ≥ 0, illetve pontosan akkor konkáv, ha f ′′ ≤ 0.
Például az f (x) = x2 függvény bármely intervallumon konvex, mı́g a sin x
függvény a [0, π] intervallumon konkáv, a [π, 2π] intervallumon pedig konvex.
Az olyan x ∈ D pontokat, amely egy baloldali környezetében a függvény
konvex (konkáv), egy jobboldali környezetében pedig konkáv (konvex), azaz f
konvexitása x0 -ban ”vált”, inflexiós pontnak nevezzük. Például a sin x függvény
esetén 0, π, 2π, . . . inflexiós pontok.

7.6 Taylor polinom


Függvények polinommal való közelı́tése hasznosnak látszik, hiszen a polinomok
nagyon jó tulajdonságú függvények, folytonosak, akárhányszor differenciálhatók
és értékei könnyen kiszámı́thatók. Erre ad lehetőséget a magasabb rendű
deriváltakkal képzett Taylor polinom.
Definı́ció. Az n-szer differenciálható f : [a, b] → R függvény x0 ∈ (a, b)-beli n-
edrendű Taylor polinomjának nevezzük az
n
X f (k) (x0 )
Tn (x) = (x − x0 )k
k!
k=0

n-edfokú polinomot, ahol f (0) = f .


A Taylor polinom hasznosságára az ad reményt, hogy az f függvény és Taylor
polinomjának legfeljebb n-edrendű deriváltjai x0 -ban megegyeznek: f (k) (x0 ) =
(k)
Tn (x0 ) k = 0, 1, . . . , n.
A közelı́tés ”jóságát” a Taylor polinomnak az f függvénytől való eltérése, az
Rn (x) = f (x) − Tn (x) ún. maradéktag tulajdonságai jelzik. Ennek vizsgálatához
hasznos a maradéktag speciális előállı́tása.
7.6. TAYLOR POLINOM 59

Állı́tás. Ha f (n + 1)-szer differenciálható x0 egy környezetében, akkor az


n-edrendű Taylor polinom maradéktagja

f (n+1) (ξ)
Rn (x) = (x − x0 )n+1
(n + 1)!

alakban adható meg, ahol ξ x0 és x közötti, x-től is függő érték.


Bizonyı́tás. Jelölje M azt a számot, melyre adott x0 és x esetén

Rn (x) = M (x − x0 )n+1

Az egyszerűség kedvéért tegyük fel, hogy x0 < x. Tekintsük a


g: [x0 , x] → R, t 7→ g(t) = Rn (t) − M (t − x0 )n+1 függvényt. Megmutatjuk, hogy
g (n+1) (ξ) = 0 valamely ξ ∈ (x0 , x)-re.
(k)
Nyilvánvalóan f (k) (x0 ) = Tn (x0 ) minden k = 0, 1, . . . , n-re, ezért
(k)
Rn (x0 ) = 0, s ı́gy g (k) (x0 ) = 0 minden k = 0, 1, . . . , n-re. g(x0 ) = 0
és g(x) = 0, ezért Rolle tétele szerint van olyan ξ1 ∈ (x0 , x), hogy g ′ (ξ1 ) = 0.
g ′ -re alkalmazva a Rolle tételt a (x0 , ξ1 ) intervallumon, az adódik, hogy van olyan
ξ2 ∈ (x0 , ξ1 ), melyre g ′′ (ξ2 ) = 0. E lépést újra és újra alkalmazva, utoljára g (n) -
re alkalmazva a Rolle tételt a (x0 , ξn ) intervallumon, azt kapjuk, hogy valamely
(n+1)
ξ ∈ (x0 , ξn ) ⊂ (x0 , x)-re g (n+1) (ξ) = 0. Ez azt jelenti, hogy Rn (ξ) = (n + 1)! M .
(n+1)
(n+1) f (ξ)
No de Rn (ξ) = f (n+1) (ξ). Ezért M = , tehát az Rn (x) maradéktagra
(n + 1)!
teljesül az állı́tás. Q. E. D.
Megjegyzés.

1. Azt a speciális esetet, amikor x0 = 0, MacLaurin polinomnak is nevezik.

2. Néhány függvény esetében könnyen felı́rható a függvény Taylor polinomja,


pl.:

• ex függvény esetében az x0 = 0-beli Taylor (MacLaurin) polinom

x2 x3 xn
Tn (x) = 1 + x + + + ...+
2! 3! n!

• a sin x függvény x0 = 0-beli Taylor (MacLaurin) polinomja

x3 x5 x2k+1
T2k+1 (x) = x − + + . . . + (−1)k
3! 5! (2k + 1)!

• az ln x függvény x0 = 1-beli Taylor polinomja

(x − 1)2 (x − 1)3 (x − 1)n


Tn (x) = (x − 1) − + + . . . + (−1)n−1
2 3 n
60 7. DIFFERENCIÁLÁS

3. A Taylor polinom a függvényértékek közelı́tő kiszámı́tására használható.


A függvényértéktől való eltérés — a hiba — a maradéktag vizsgálatával
becsülhető, pl. a sin x függvény esetében a harmadrendű T3 (x) = T4 (x)
MacLaurin polinom 0, 01 pontossággal adja meg sin x értékét az |x| < 1
intervallumban, hiszen

sin(5) (ξ) 1
|R4 (x)| = x < |x|

5! 100

7.7 A függvény szélsőértéke létezésének feltételei


Már láttuk, hogy ha egy f függvénynek x0 -ban helyi szélsőértéke van, és x0 -ban
differenciálható, akkor ott differenciálhányadosa 0. Tehát az
f ′ (x0 ) = 0 feltétel szükséges ahhoz, hogy x0 -ban helyi szélsőérték legyen. Azonban
nem elegendő hiszen pl. az f (x) = x3 függvény esetében f ′ (0) = 0, de 0-
ban mégsincs szélsőértéke. Az értelmezési tartomány olyan x0 pontjait, ahol
f ′ (x0 ) = 0, a függvény stacionárius helyeinek nevezzük. E fogalommal élve tehát
azt mondhatjuk, hogy a helyi szélsőértékhelyek mindig stacionárius helyek, de
egy stacionárius hely nem mindig ad helyi szélsőértékhelyet. A magasabb rendű
deriváltak segı́tségével meg lehet fogalmazni olyan feltételeket, amelyek elégségesek
a szélsőérték létezéséhez.
Állı́tás. Legyen f (n + 1)-szer folytonosan differenciálható x0 -ban, és tegyük fel,
hogy
f ′ (x0 ) = 0, . . . , f (n) (x0 ) = 0, f (n+1) (x0 ) 6= 0.
Ha n+1 páros szám, akkor f (n+1) (x0 ) > 0 esetén f -nek x0 -ban helyi minimuma
van, mı́g f (n+1) (x0 ) < 0 esetén helyi maximuma van.
Ha n + 1 páratlan szám, akkor f -nek x0 -ban nincs helyi szélsőértéke.
Bizonyı́tás. A Taylor polinom maradéktagjának előállı́tás alapján, figyelembe
véve, hogy a feltételek fennállása esetén Tn (x) = f (x0 ), kapjuk, hogy

f (n+1) (ξ)
f (x) − f (x0 ) = (x − x0 )n+1
(n + 1)!

Ha f (n+1) (x0 ) > 0, akkor a folytonos differenciálhatóság miatt van x0 -nak olyan
környezete, hogy onnan választott összes ξ-re f (n+1) (ξ) > 0. Ezért ha n + 1
páros szám, akkor f (x) − f (x0 ) ≥ 0, tehát f -nek x0 -ban helyi minimuma van.
Hasonlóanf (n+1)(x0 ) < 0 esetén páros n + 1 mellett f -nek helyi maximuma van.
Ha n + 1 páratlan, és pl. f (n+1) (x0 ) > 0, akkor x > x0 esetén f (x) − f (x0 ) > 0,
mı́g x < x0 esetén f (x)−f (x0 ) < 0, azaz f -nek nincs x0 -ban szélsőértéke. Q. E. D.
Megjegyzés.
1. Fontos megjegyezni, hogy a helyi szélsőérték létezésének e tételben mondott
1
feltételei nem mind szükségesek. Ezt mutatja az e− x2 függvény példája,
7.7. A FÜGGVÉNY SZÉLSŐÉRTÉKE LÉTEZÉSÉNEK FELTÉTELEI 61

melynek ugyan szélsőértéke van 0-ban, de ott magasabb rendű deriváltjai


mind 0-ák.
2. Gyakori (és szerencsés) esetben már a második derivált vizsgálata is
elegendő: Ha f ′ (x0 ) = 0, és f ′′ (x0 ) > 0, akkor f -nek x0 -ban helyi minimuma
van, mı́g f ′ (x0 ) = 0, f ′′ (x0 ) < 0 esetén helyi maximuma.
62 7. DIFFERENCIÁLÁS
8. Többváltozós függvények

A többváltozós függvények vizsgálta céljából előbb Rn metrikus struktúráját


vizsgáljuk meg, majd segı́tségével definiáljuk a folytonosságot és differenciálható-
ságot. Végül a kétváltozós függvények esetében a szélsőértékkeresés problémájával
foglalkozunk.

8.1 Rn metrikus fogalmai


Az Rn -ben szokásos skaláris szozat, vagy norma segétségével két Rn -beli x és y
vektor távolságát ı́gy definiáljuk:
p p
d(x, y) = kx − yk = (x − y, x − y) = (x1 − y1 )2 + . . . + (xn − yn )2

A távolságfogalom rendelkezik az alábbi tulajdonságokkal:


1. d(x, y) > 0 ha x 6= y és d(x, x) = 0
2. d(x, y) = d(y, x)
3. d(x, y) ≤ d(x, z) + d(z, y)
Az utóbbi háromszög-egyenlőtlenségnek nevezett tulajdonság a bizonyı́tott
Minkowski egyenlőtlenség egyszerű következménye.
Megjegyzés. Ha egy tetszőleges nemüres X halmazon valamiképp adott egy
d: X × X → R leképezés, amely teljesı́ti a fent felsorolt 3 tulajdonságot, akkor X-
et metrikus térnek szokás nevezni, d(x, y)-t pedig x és y távolságának. Általános
metrikus térben is definiálhatók a most következő fogalmak, mint pl. a környezet,
nyı́lt halmaz, sorozat konvergenciájának fogalma.
Legyen most x0 ∈ Rn , s ε > 0. x0 ε sugarú nyı́lt környezetének nevezzük a

G(x0 , ε) = {y ∈ Rn | d(x0 , y) < ε}

halmazt. Láthatjuk, hogy e fogalom meghatározása ugyanúgy történik, mint


a valós számok R halmaza esetén történt, csak az abszolútértékkel definiált
távolságfogalom helyett az Rn -ben érvényes távolságfogalmat alkalmazzuk. Ennek
megfelelően azokat a fogalmakat definiálhatjuk és használhatjuk most is, amelyeket
a valós számok esetében a környezetfogalommal adtunk meg. Pl. A ⊂ Rn
tetszőleges részhalmazának egy x0 ∈ A pontját A belső pontjának nevezzük, ha
van x0 -nak olyan ε > 0 sugarú nyı́lt G(x0 , ε) környezete, hogy G(x0 , ε) ⊂ A. A-t

63
64 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK

nyı́ltnak mondjuk, ha bármely pontja belső pontja. A zárt, ha a komplementere


nyı́lt. Az A halmaz torlódási pontja az x0 ∈ Rn pont, ha x0 -nak bármely nyı́lt
környezetében az A halmaznak végtelen sok pontja található. Az xk ∈ Rn
sorozat konvergens és határértéke (határpontja) az x0 pont, ha x0 -nak bármely
nyı́lt környezetében a sorozatnak az összes tagja benne van véges sok kivételével,
másszóval ha bármely ε > 0-hoz van olyan k0 ∈ N küszöbindex, hogy minden
k > k0 esetén xk ∈ G(x0 , ε), azaz kxk − x0 k < ε. A korlátos, ha van olyan G(x0 , ε)
nyı́lt környezet, hogy G(x0 , ε) ⊃ A. Most is szinte ugyanúgy, mint a valós esetben
belátható, hogy egy sorozat pontosan akkor konvergens, ha korlátos és egyetlen
egy torlódási ponttal rendelkezik.
Állı́tás. Egy xk ∈ Rn sorozat pontosan akkor konvergens, ha az i-dik
komponesekből képzett sorozat konvergens minden i = 1, 2, . . . , n esetén.
(1) (n)
Bizonyı́tás. Legyen xk ∈ Rn konvergens. Az xk = (xk , . . . , xk )
(i) (i)
jelöléssel |xk − x0 | < kxk − x0 k nyilván teljesül. Ezért ha adott ε > 0-hoz k > k0
esetén
(i) (i)
kxk − x0 k < ε, akkor |xk − x0 | < kxk − x0 k < ε.
(i)
Fordı́tva, ha nε -hoz minden i = 1, 2, . . . , n esetén van olyan k0 , hogy
(i) (i)
|xk − x0 | < nε , akkor
v
u n r
uX (i) (i) 2 ε2
kxk − x0 k = t (xk − x0 ) < n = ε.
i=1
n

(1) (n)
hacsak k > max(k0 , . . . , k0 ). Q. E. D.
Példa. A G(x0 , ε) nyı́lt környezet nyı́lt halmaz, torlódási pontjait az {y ∈
Rn | ky − xk ≤ ε} halmaz elemei jelentik. Az xk = ( k1 , 1 + k12 ) R2 -beli sorozat
konvergens, s határpontja a (0, 1) pont. Zárt halmazra példa az 1 pontból álló
{x0 } részhalmaz, vagy a {x ∈ Rn | kxk ≥ 1} ”lyukas” sı́k.
Az Rn euklideszi téren most értelmezett nyı́lt halmaz, zárt halmaz, torlódási
pont, konvergencia, stb. fogalmak bevezetése szinte szó szerinti ismétlése a
valós számok körében megismert fogalmaknak. Az ott felsorolt tulajdonságok,
összefüggések most is érvényesek. A bizonyı́tások is majd’ szószerint átvihetők.
Érvényes a Bolzano-Weierstraß tétel is.

8.2 Határérték és folytonosság


Definı́ció. Legyen x0 ∈ Rn az f : D ⊂ Rn → R függvény értelmezési
tartományának torlódási pontja. f x0 -beli határértéke A ∈ R, ha A bármely ε > 0
sugarú nyı́lt környezetéhez van x0 -nak olyan δ > 0 sugarú nyı́lt környezete, hogy
bármely x ∈ G(x0 , δ) x 6= x0 , x ∈ D esetén f (x) ∈ G(A, ε). Jele: lim f (x) = A.
x→x0

Ekvivalens definiálási lehetőség: f x0 -beli határértéke A, ha bármely x0 -hoz


konvergáló D ∋ xk 6= x0 sorozat esetén az f (xk ) sorozat konvergál A-hoz.
8.3. TÖBBVÁLTOZÓS FÜGGVÉNYEK DIFFERENCIÁLHATÓSÁGA 65

Az egyváltozós függvények körében bizonyı́tott állı́tásokhoz teljesen analóg


állı́tások igazolhatók a függvények összeadása, szorzása, osztása vonatkozásában.
Ugyanez érvényes a folytonosság fogalmára is.
Definı́ció. Az f : D ⊂ Rn → R függvény az értelmezési tartományának egy
x0 ∈ D pontjában folytonos, ha bármely xk ∈ D, xk → x0 sorozat esetén
f (xk ) → f (x0 ).

Megjegyzés. A folytonosságra vonatkozó állı́tások közül több változatlan


tartalommal kiterjeszthető: Rn korlátos, zárt részhalmazán értelmezett folytonos
függvény felveszi maximumát és minimumát, továbbá összefüggő, zárt, korlátos
tartomány esetében felvesz minden közbenső értéket. Minden folytonos függvény
jeltartó. A bizonyı́tások alapgondolata is ugyanaz lehet. Nem értelmezhető vi-
szont most a monoton függvény fogalma, hiszen Rn -ben nincs értelmezve a kisebb-
nagyobb reláció.
Példa. Könnyen belátható, hogy többváltozós függvények esetében is
folytonosak az ún. elemi függvények értelmezési tartományuknak minden pontjában.
Legyen pl. f : R2 \ {0} → R az a kétváltozós függvény, melyre
xy
f (x, y) =
x2 + y2

Látható, hogy az f függvénynek (0, 0)-ban nem létezik határértéke. Az f (x, y) =


1
x2 +y 2 függvénynek kiterjesztett értelemben van határértéke:
1
lim = ∞.
(x,y)→(0,0) x2 + y 2

Definı́ció. Az Rn tér egy A részhalmazát konvexnek mondjuk, ha bármely két


x, y ∈ A pontja esetén tartalmazza az x kezdőpontú y végpontú szakasz minden
pontját.

Megjegyzés.

1. Az [x, y] szakasz minden pontja z = λx + (1 − λ)y alakban adható meg, ahol


0 ≤ λ ≤ 1.

2. Konvex halmazra példa a nyı́lt vagy a zárt gömb, félsı́k, stb. Konvex halmaz
lehet akár nyı́lt, akár zárt, vagy egyik se.

3. Bármely két konvex halmaz metszete szintén konvex.

8.3 Többváltozós függvények differenciálhatósága


f (x) − f (x0 )
Az egyváltozós függvények differenciálhatóságát a lim függvény-
x→x0 x − x0
határértékkel definiáltuk, s szemléletes jelentése abban mutatkozott meg, hogy a
függvényt legjobban közelı́tő egyenes iránytangense éppen a differenciálhányados
66 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK

értéke. A legjobb közelı́tés itt most azt jelentette, hogy a lineáris függvénynek (az
egyenesnek) az eltérése a függvénytől (a függvény görbéjétől) oly annyira kicsi,
hogy még x − x0 -al osztva is nullához tart. A többváltozós függvények esetében
is ilyen, legjobban közelı́tő, lineáris függvényyel akarjuk közelı́teni a függvényt. A
lineáris függvények Rn -en (a, x) alakban adhatók meg.
Definı́ció. Legyen f : D ⊂ Rn → R és x0 ∈ D. Az f függvényt x0 -ban
differenciálhatónak mondjuk, ha van olyan a ∈ Rn , hogy

f (x) − f (x0 ) − (a, x − x0 )


lim = 0.
x→x0 kx − x0 k

Iyenkor a-t f x0 -beli differenciálhányadosának vagy deriváltjának modjuk és


Df (x0 )-al jelöljük.

Megjegyzés. A differenciálhatóság szemléletesen azt jelenti pl. kétváltozós


függvény esetében, hogy a z = f (x, y) felülethez érintősı́k illeszthető az
(x0 , y0 , f (x0 , y0 )) pontjában. Ez a sı́k a z = a1 x + a2 y + f (x0 , y0 ) egyenletű sı́k,
ahol (a1 , a2 ) = Df (x0 , y0 ) a deriváltvektor koordinátái.
Definı́ció. Az f : D ⊂ Rn → R függvény i-dik parciális differenciálhányadossal
rendelkezik x0 ∈ Rn -ban, ha a

f (x0 + tei ) − f (x0 )


lim
t→0 t
határérték létezik, ahol e1 , . . . , en Rn természetes bázisa. Ezt a határértéket
∂i f (x0 )-al jelöljük, és x0 -beli i-dik parciális differenciálhányadosnak, vagy parciális
deriváltnak nevezzük.
Ha minden i = 1, . . . , n esetén létezik a függvény x0 -beli parciális diffe-
renciálhányadosa, akkor f -et x0 -ban parciálisan differenciálhatónak mondjuk. Más
∂f
szokásos jelölések: (x0 ), Di f (x0 ).
∂xi
Megjegyzés.

1. A definı́ció alapján látható, hogy a parciális differenciálhányados értelme-


zésében az f függvénynek csak az x0 + tei egyenes mentén felvett értékei
számı́tanak. Ilyenkor az fi (t) = f (x0 + tei ) egyváltozós függvényt képezzük,
s ennek t = 0-beli deriváltja adja f x0 -beli parciális differenciálhányadosát.

2. Szemlétesen adódik a parciális differenciálhányados jelentése: kétváltozós


f (x, y) függvény esetében az (x0 , y0 )-on átmenő x tengellyel (e1 -el) párhuzamos
és függőleges (z tengellyel párhuzamos) sı́kkal metszve a z = f (x, y)
felületet, egy görbét kapunk, mely érintőjének iránytangense (az x tengel-
lyel bezárt szögének tangense) adja az x szerinti (azaz első) parciális diffe-
renciálhányadost.
8.4. MAGASABB RENDŰ PARCIÁLIS DERIVÁLTAK 67

A függvény differenciálhatóságát, szembeállı́tva a parciális differenciálhatóság-


gal, szokták totális differenciálhatóságnak is nevezni. Ugyanis, e két fogalom szoros
kapcsolatban áll, de nem azonos. A totális differenciálhatóságból következik a
parciális, de fordı́tva csak akkor, ha a parciális deriváltfüggvények folytonosak is.
Állı́tás. Ha az f : D ⊂ Rn → R függvény x0 -ban differenciálható, akkor létezik
minden i = 1, . . . , n esetén a ∂i f (x0 ) x0 -beli parciális differenciálhányados is, és

Df (x0 ) = (∂1 f (x0 ), . . . , ∂n f (x0 )).

Bizonyı́tás.
f (x0 + tei ) − f (x0 ) f (x0 + tei ) − f (x0 ) − (Df (x0 ), tei )
lim = lim + (Df (x0 ), ei ) =
t→0 t t→0 t
f (x0 + tei ) − f (x0 ) − (Df (x0 ), tei )
= lim + (Df (x0 ), ei ) = (Df (x0 ), ei )
x0 +tei →x0 ktei k
Q. E. D.
Állı́tás. Ha f : D ⊂ Rn → R függvény x0 ∈ D egy környezetében parciálisan
differenciálható és a parciális deriváltfüggvények x0 -ban folytonosak, akkor f x0 -
ban totálisan is differenciálható.
Bizonyı́tás. Kétváltozós függvény esetében ı́rjuk le a bizonyı́tást.
Legyen (x0 , y0 ) ∈ D ⊂ R2 . Megmutatjuk, hogy
Df (x0 , y0 ) = (∂1 f (x0 , y0 ), ∂2 f (x0 , y0 )). Ugyanis az abszolútérték tulajdonságai, s
|h| ≤ k(h, k)k, |k| ≤ k(h, k)k alapján a Lagrange tétel kétszeri alkalmazásával:
|f (x0 + h, y0 + k) − f (x0 , y0 ) − ∂1 f (x0 , y0 )h − ∂2 f (x0 , y0 )k|

k(h, k)k
|f (x0 + h, y0 + k) − f (x0 , y0 + k) − ∂1 f (x0 , y0 )h|
≤ +
|h|
|f (x0 , y0 + k) − f (x0 , y0 ) − ∂2 f (x0 , y0 )k|
+ =
|k|
= |∂1 f (x0 + h′ , y0 ) − ∂1 f (x0 , y0 )| + |∂2 f (x0 , y0 + k′ ) − ∂2 f (x0 , y0 )|
A parciális deriváltak folytonosságából adódik állı́tásunk. Q. E. D.

8.4 Magasabb rendű parciális deriváltak


Amennyiben x0 ∈ Rn egy környezetében mindenütt értelmezett valamely
parciális derivált, akkor mint e környezeten értelmezett n-változós függvényt
parciálisan újra differenciálhatjuk. Ekkor kapjuk a másodrendű parciális
differenciálhányadosokat. Jelölése: ∂11 f jelenti a ∂1 f függvénynek az első, x1
szerinti parciális deriváltját, ∂12 f jelentése: a ∂1 f függvénynek a második, x2
szerinti parciális deriváltja. Továbbhaladva, még magasabb rendű (többszörös)
parciális deriváltak is értelmezhetők. Pl. ∂213 f harmadrendű parciális derivált,
68 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK

sorrendben a második, majd első, majd harmadik változó szerint. A magasabb


rendű deriváltak képzésében a változók sorrendje nem számı́t:
Állı́tás. Ha az f : D ⊂ Rn → R függvény x0 ∈ D egy környezetében kétszer
parciálisan differenciálható és a másodrendű parciális deriváltfüggvények x0 -ban
folytonosak, akkor a másodrendű vegyes parciális deriváltak x0 -ban megegyeznek.
Pl. ∂12 f (x0 ) = ∂21 f (x0 ).
A bizonyı́tást mellőzzük.

8.5 Kétváltozós függvények szélsőértéke


Definı́ció. Az f : D ⊂ R2 → R kétváltozós függvénynek helyi szélsőértéke
van (x0 , y0 )-ban, ha van (x0 , y0 )-nak olyan G((x0 , y0 ), ε) nyı́lt környezete, hogy
bármely (x, y) ∈ D ∩ G((x0 , y0 ), ε)-ra f (x, y) ≤ f (x0 , y0 ) (helyi maximum) vagy
bármely (x, y) ∈ D ∩ G((x0 , y0 ), ε)-ra f (x, y) ≥ f (x0 , y0 ) (helyi minimum) .

Állı́tás. Ha f -nek helyi szélsőértéke van (x0 , y0 )-ban és parciálisan deriválható
(x0 , y0 )-ban, akkor a parciális deriváltak ott eltűnnek:

∂1 f (x0 , y0 ) = 0 és ∂2 f (x0 , y0 ) = 0.

Ez nyilvánvalóan következik abból, hogy az f1 (t) = f ((x0 , y0 ) + te1 ) illetve az


f2 (t) = f ((x0 , y0 ) + te2 ) függvénynek szélsőértéke van t = 0-ban.
A most mondott feltétel — hasonlóan az egyváltozós függvények esetéhez —
szükséges, de nem elegendő feltétel. Ugyanis, pl. az f (x, y) = xy függvénynek
(0, 0)-ban nincs szélsőértéke, noha ∂1 f (0, 0) = 0, ∂2 f (0, 0) = 0.
Egy elégséges feltétel megfogalmazásához használjuk a másodrendű parciális
deriváltakkal képzett kétváltozós R2 -ön értelmezett
Q(h, k) = ∂11 f (x0 , y0 )h2 + 2∂12 f (x0 , y0 )hk + ∂22 f (x0 , y0 )k 2 kvadratikus formát.
Állı́tás. Ha azf : D ⊂ R2 → R kétváltozós függvény értelmezési tartományának
egy belső (x0 , y0 ) ∈ D pontjában a másodrendű parciális deriváltak folytonosak,
az elsőrendű parciális deriváltak értéke nulla: ∂1 f (x0 , y0 ) = 0 és ∂2 f (x0 , y0 ) = 0,
és a Q(h, k) kvadratikus forma pozitı́v definit, akkor az f függvénynek (x0 , y0 )-ban
helyi minimuma van.
Bizonyı́tás. Legyen ϕ(t) = f (x0 + th, y0 + tk), 0 ≤ t ≤ 1. Alkalmazzuk ϕ-re 0-
ban a Taylor polinommal való közelı́tést. Ekkor a maradéktag előállı́tása alapján:
1
ϕ(1) = ϕ(0) + ϕ′ (0) + ϕ′′ (t)
2
valamely 0 ≤ t ≤ 1-re. Figyeljük meg először, hogy

ϕ′ (t) = ∂1 f (x0 + th, y0 + tk)h + ∂2 f (x0 + th, y0 + tk)k


8.6. FELTÉTELES SZÉLSŐÉRTÉK-SZÁMÍTÁS 69

(Ezt az előző bizonyı́táshoz hasonlóan lehetne igazolni.) Ebből adódóan

ϕ′′ (t) = ∂11 f (x0 + th, y0 + tk)h2 + 2∂12 f (x0 + th, y0 + tk)hk + ∂22 f (x0 + th, y0 + tk)k2

A feltétel miatt most ϕ′ (0) = 0, s ı́gy


f (x0 + h, y0 + k) − f (x0 , y0 ) =

1
= (∂11 f (x0 + th, y0 + tk)h2 + 2∂12 f (x0 + th, y0 + tk)hk + ∂22 f (x0 + th, y0 + tk)k2 )
2
Mivel Q(h, k) > 0 (h, k) 6= 0 esetén, a másodrendű parciális deriváltak
folytonossága miatt

f (x0 + h, y0 + k) − f (x0 , y0 ) > 0.

(x0 , y0 )-nak egy (elegendően kis) környezetében. Q. E. D.


Megjegyzés.

1. Ha a tételben a Q kvadratikus forma negatı́v definit, akkor a további


feltételek teljesülése esetén f -nek (x0 , y0 )-ban helyi maximuma van.

2. Egy kétváltozós Q(h, k) = a11 h2 + 2a12 hk + a22 k 2 kvadratikus forma


pozitı́v
 (negatı́v)definitsége — könnyen igazolhatóan — eldönthető a11 és
a11 a12
det = a11 a22 − a212 előjele alapján: Q pontosan akkor pozitı́v
a21 a22
(negatı́v) definit, ha a11 > 0 (a11 < 0) és a11 a22 − a212 > 0.

3. Belátható az is, hogy ha Q indefinit, azaz mind pozı́tı́v, mind negatı́v


értékeket felvesz, akkor f -nek nincs helyi szélsőértéke (x0 , y0 )-ban.

4. Ha Q-ra nem teljesülnek a fenti feltételek egyike sem, attól még f -nek lehet
ott helyi szélsőértéke. Ilyenkor további vizsgálat szükséges.

Példa. Az f (x, y) = x2 + xy + y 2 függvény esetében ∂1 f (0, 0) = 0 és


∂2 f (0, 0) = 0 teljesül, továbbá ∂11 f (0, 0) = 2, ∂12 f (0, 0) = 1, ∂22 f (0, 0) = 2, ezért
∂11 f (0, 0)∂22 f (0, 0) − (∂12 f (0, 0))2 > 0 és ∂11 f (0, 0) > 0 miatt f -nek (0, 0)-ban
helyi minimuma van.

8.6 Feltételes szélsőérték-számı́tás


Amennyiben egy két-, vagy többváltozós függvény szélsőértékeit keressük azzal a
megszorı́tással, hogy a változók között egy, vagy több összefüggést feltételezünk,
akkor feltételes szélsőérték-számı́tásról beszélünk.
A legegyszerűbb esetben f (x, y) kétváltozós függvény, s egyetlen feltétel
van: g(x, y) = 0, melyet a változóknak teljesı́teniük kell. Az f (x, y)
függvényt tulajdonképpen csak azon (x, y) változópárokra tekintjük, amelyek
megengedettek, azaz teljesı́tik a g(x, y) = 0 feltételt.
70 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK

Általánosabban, azaz három-, vagy még többváltozós függvény esetében lehet


akár egy, akár több – de kevesebb, mint a változók száma – korlátozó feltétel
a változókra. A Lagrange-féle multiplikátoros eljárás olyan módszert ad, amely
segı́thet a szélsőértékhelyek megkeresésében.

A) Kétváltozós függvény feltételes szélsőértéke egy feltétel mellett


Legyenek adottak az f, g: D ⊂ R2 → R kétváltozós függvények. Jelölje S a
feltételi halmazt:
S = {(x, y) ∈ R2 | g(x, y) = 0 }.
Az f|S S-re megszorı́tott függvény helyi szélsőértékhelyeit nevezzük az f (x, y)
függvény g(x, y) = 0 feltétel melletti feltételes szélsőértékhelyeinek. Pontosabban,
(x0 , y0 ) ∈ D helyi feltételes minimumhelye f -nek, ha (x0 , y0 )-nak létezik olyan δ >
0 sugarú környezete, hogy minden (x, y) ∈ G(x0 , y0 ) ∩ S esetén f (x, y) ≥ f (x0 , y0 ).
Maximumhely esetén az utolsó egyenlőtlenség fordı́tva szerepel.
A Lagrange multiplikátoros eljárás alapja a következő tétel, mely — ugyan
csak szükséges feltételeket ad a helyi szélsőérték létezésére, — a gyakorlati
problémákban azonban jól alkalmazható.
Állı́tás. Ha f, g: D ⊂ R2 → R parciálisan differenciálható függvények, és f -
nek (x0 , y0 )-ban feltételes szélsőértéke van a g(x, y) = 0 feltétel mellett, továbbá
Dg(x0 , y0 ) 6= (0, 0), akkor van olyan λ0 ∈ R, hogy az

L(x, y, λ) = f (x, y) + λg(x, y)

függvénynek (x0 , y0 , λ0 ) stacionárius helye, azaz L mindegyik (x0 , y0 , λ0 )-beli


parciális deriváltja nulla.
A tételben szereplő L függvényt Lagrange függvénynek, λ-t pedig multip-
likátornak szokták nevezni.
Bizonyı́tás. A bizonyı́tásban kihasználjuk a kétváltozós függvényekből képzett
összetett függvények derivációs, n. láncszabályát. Eszerint, ha f : R2 → R, és
ϕ1 , ϕ2 : R → R tı́pus függvények, akkor az

F : R → R, F (x) = f (ϕ1 (x), ϕ2 (x))

összetett függvény deriváltját a következőképpen kapjuk:

F ′ (x) = ∂1 f (x, ϕ(x))ϕ′1 + ∂2 f (x, ϕ(x))ϕ′2 (x),

ahol most ∂1 f , illetve ∂2 f az f függvény parciális deriváltjait jelöli.


Esetünkben a g(x, y) = 0 implicit egyenletből a tétel feltételei miatt kifejezhető
az egyik változó, mondjuk y excplit y = ϕ(x) alakban, legalábbis x0 egy
környezetében. Ekkor természetesen g(x, ϕ(x)) = 0, s ı́gy ezt deriválva x0 -ban

∂1 g(x0 , y0 ) + ∂2 g(x0 , y0 )ϕ′ (x0 ) = 0


8.6. FELTÉTELES SZÉLSŐÉRTÉK-SZÁMÍTÁS 71

adódik. Másrészt, a g(x, y) = 0 görbe mentén tekintve csupán f -et, az F (x) =


f (x, ϕ(x)) függvénynek helyi szélsőértéke van x0 -ban. Ezért F ′ (x0 ) = 0, s ı́gy

∂1 f (x0 , y0 ) + ∂2 f (x0 , y0 )ϕ′ (x0 ) = 0.

A fenti két egyenletből


∂1 g(x0 , y0 ) ∂1 f (x0 , y0 )
ϕ′ (x0 ) = − és ϕ′ (x0 ) = −
∂2 g(x0 , y0 ) ∂2 f (x0 , y0 )
adódik. Ezeket egyenlővé téve, átrendezve kapjuk, hogy
∂1 f (x0 , y0 ) ∂2 f (x0 , y0 )
= .
∂1 g(x0 , y0 ) ∂2 g(x0 , y0 )
Ezt a közös értéket −λ0 -lal jelölve,

∂1 f (x0 , y0 ) + λ0 ∂1 g(x0 , y0 ) = 0

∂2 f (x0 , y0 ) + λ0 ∂2 g(x0 , y0 ) = 0
adódik, mely ekvivalens a
∂1 L(x0 , y0 , λ0 ) = 0
∂2 L(x0 , y0 , λ0 ) = 0
feltételrendszerrel. L harmadik parciális deriváltjára automatikusan teljesül

∂3 L(x0 , y0 , λ0 ) = 0,

ugyanis az tulajdonképpen a feltételi egyenlet: g(x0 , y0 ) = 0.


Q. E. D.
A módszert gy alkalmazzuk, hogy képezzük az

L(x, y, λ) = f (x, y) + λg(x, y)

Lagrange függvényt, és keressük ennek stacionárius helyeit. Ehhez megoldjuk a 3


ismeretlenes 3 egyenletből álló egyenletrendszert:

∂1 f (x, y) + λ∂1 g(x, y) = 0

∂2 f (x, y) + λ∂2 g(x, y) = 0


g(x0 , y0 ) = 0.
A kapott megoldások lehetnek csak szélsőértékhelyek. Legtöbbször a feladat
sajátosságából adódik, hogy valóban azok és milyen minőségűek (maximum vagy
minimum).

Példa. Legyen a célfüggvény f (x, y) = 2ln x + 3ln y alak, s feltételi egyenlet


pedig 4x + 5y = p, ahol p egy valós (pozitı́v) paramétert jelent.
72 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK

f teljes értelmezési tartománya D = {(x, y) | x > 0, y > 0 }. A feltételi egyenlet


most egy egyenest jelent, de a D-re vonatkozó korlátok miatt annak csak egy (nyı́lt)
szakaszát. A Lagrange függvény alakja:

L(x, y, λ) = 2ln x + 3ln y + λ(4x + 5y − p).

Kiszámı́tjuk L parciális deriváltjait:


2
∂x L(x, y, λ) = x + 4λ
3
∂y L(x, y, λ) = y + 5λ
∂λ L(x, y, λ) = 4x + 5y − p.

Tehát a megoldandó egyenletrendszer:


2
+ 4λ = 0
x
3
+ 5λ = 0
x
4x + 5y − p = 0.
p
A megoldás: x = 10 , y = 3p 5
25 , λ = − p . A talált (x, y) számpárban nyilván
maximum van, hiszen a célfüggvény alulról nem korlátos.

B) Többváltozós függvény feltételes szélsőértéke több feltétel mellett

n változós f (x1 , x2 , . . . , xn ) célfüggvény esetén több korlátozó feltétel is lehet.


A feltételek száma azonban nem haladhatja meg f változóinak számát. A feltételi
halmazt (másszóval, megengedett tartományt) k darab (k < n) egyenlet adja
meg:
S = {x ∈ Rn | g1 (x) = 0, . . . , gk (x) = 0 }.
A feltételes szélsőérték keresése most is az f|S S-re megszorı́tott függvény
szélsőértékeinek keresését jelenti. A következő tétel a feltételes szélsőérték
létezésének egy szükséges feltételét adja meg.

Állı́tás. Ha f, g1 , g2 , . . . , gk : D ⊂ Rn → R parciálisan differenciálható függ-


vények, és f -nek x0 -ban feltételes szélsőértéke van a g1 (x) = 0, . . . , gk (x) = 0
feltételek mellett (k < n), továbbá Dg1 (x0 ), . . . , Dgk (x0 ) lineárisan függetlenek,
akkor van olyan λ10 , . . . , λk0 ∈ R, hogy az

L(x, λ1 , . . . , λk ) = f (x) + λ1 g1 (x) + . . . + λk gk (x)

függvénynek (x0 , λ10 , . . . , λk0 ) stacionárius helye, azaz ott L mindegyik parciális
deriváltja nulla.
A tételben szereplő L függvényt Lagrange függvénynek, λ1 , . . . , λk -kat pedig
multiplikátoroknak szokták nevezni.
8.6. FELTÉTELES SZÉLSŐÉRTÉK-SZÁMÍTÁS 73

A tétel bizonyı́tását mellőzzük. A szélsőértékhelyek kereséséhez ilyenkor a


Lagrange függvény parciális deriváltját képezzük először az n darab x1 , x2 , . . . , xn
változó szerint, majd a k darab λ1 , . . . , λk segédváltozó szerint. Az utóbbiak most
is a g1 , . . . , gk függvények lesznek. Tehát a megoldandó egyenletrendszer alakja:

∂1 f (x1 , . . . , xn ) + λ1 ∂1 g1 (x1 , . . . , xn ) + . . . + λk ∂1 gk (x1 , . . . , xn ) =0


..
.
∂n f (x1 , . . . , xn ) + λ1 ∂n g1 (x1 , . . . , xn ) + . . . + λk ∂n gk (x1 , . . . , xn ) =0
g1 (x1 , . . . , xn )=0
..
.
gk (x1 , . . . , xn ) = 0.

Alkalmazásképpen bemutatjuk a számtani és mértani közép közötti egyenlőtlenség


egyik bizonyı́tási lehetőségét.

A célfüggvény: f (x1 , x2 , . . . , xn ) = n x1 x2 · · · xn , ahol x1 ≥ 0, . . . , xn ≥ 0.
Egy feltétel adott: x1 + x2 + . . . + xn = a, ahol a ∈ R rögzı́tett pozitı́v szám.
A Lagrange függvény:

L(x1 , x2 , . . . , xn , λ) = n
x1 x2 · · · xn + λ(x1 + x2 + . . . + xn − a).

Ennek xi szerinti parciális deriváltja:


√n
x1 x2 · · · xn
+λ=0
nxi
minden i = 1, 2, . . . , n-re. Emiatt x1 = x2 = . . . = xn következik. A feltétel miatt
x1 = x2 = . . . = xn = na . Ezen a helyen csak maximum lehet, hiszen nemnegatı́vak
a változók, tehát a minimumérték nulla. Ebből adódóan minden más (a feltételt
teljesı́tő x1 , x2 , . . . , xn esetén
a a a a
f (x1 , x2 , . . . , xn ) ≤ f ( , , . . . , ) = ,
n n n n
azaz x1 + x2 + . . . + xn = a miatt
√ x1 + x2 + . . . + xn
n
x1 x2 · · · xn ≤ .
n
74 8. TÖBBVÁLTOZÓS FÜGGVÉNYEK
9. Határozatlan integrál

A deriválás egy mindenütt differenciálható függvényhez hozzárendeli a de-


riváltfüggvényét. A határozatlan integrál keresése a deriválásnak az ellentett-
je. Most megadott f egyváltozós valós függvényhez keresünk olyan F ugyanott
értelmezett és mindenütt differenciálható függvényt, amelynek a deriváltfüggvé-
nye éppen f : F ′ = f . Az ilyen F függvényt f primitı́v függvényének nevezzk, s
f primitı́v
R függvényeinek
R halmazát f határozatlan integráljának mondjuk. Jele:
F = f vagy F (x) = f (x)dx. Ilyenkor f -et integrandusnak is mondjuk. A
’határozatlan’ jelző arra utal, hogy f -nek — ha egyáltalán van, — nemcsak egy
primitı́v függvénye van. Ugyanis, ha F primitı́v függvénye f -nek, akkor F (x) + C
is az, (ahol C egy valós konstans függvényt jelöl,) hiszen a konstans függvény
deriváltja nulla. f -nek más primitı́v függvénye viszont már nincs is, hiszen ha
F ′ = G′ = f , akkor G − F = C (konstans) következik. Összefoglalva, ha egy
f függvénynek van egy F primitı́v függvénye, akkor végtelen sok is van, de azok
F -től csak egy konstansban térnek el.
A függvények deriválása során számos elemi függvénynek megismertük a
deriváltfüggvényét. Ennek alapján azonnal adódik néhány függvény határozat-
lan integrálja.

9.1 Alapintegrálok
Az alapintegrálok felsorolásában C tetszőleges konstans valós számot jelöl.

xα+1
Z
xα dx = + C, ha α 6= −1.
α+1
1
Z
dx = ln |x| + C
x
ax
Z Z
x
a dx = + C, speciálisan ex dx = ex + C
ln a
Z
sin xdx = − cos x + C
Z
cos xdx = sin x + C

75
76 9. HATÁROZATLAN INTEGRÁL

1
Z
dx = tg x + C
cos2 x
1
Z
dx = −ctg x + C
sin2 x
1
Z
√ dx = arc sin x + C
1 − x2
1
Z
dx = arc tg x + C
1 + x2

9.2 Integrálási szabályok


A deriválás tulajdonságaiból könnyen adódnak az alábbi integrálási szabályok:
(A továbbiakban mindig feltételezzük, hogy a szóbanforgó határozatlan
integrálok léteznek.)
Z Z Z
(f + g) = f + g
Z Z
λf = λ f

ahol λ ∈ R konstans. A szorzatfüggvény deriválási szabályából kapjuk az


ún. parciális integrálás szabályát:
Állı́tás. Z Z
f ′g = f g − f g′

Bizonyı́tás. A jobboldalon szereplő függvény deriváltját képezzük:


Z
(f g − f g ′ )′ = (f g)′ − f g ′ = f ′ g + f g ′ − f g ′ = f ′ g.

Q. E. D.
A parciális integrálás szabályát akkor célszerű alkalmazni az f ′ g alakú
integrandus határozatlan integráljának meghatározására, ha f g ′ határozatlan
integráljának felismerése könnyebbnek tűnik.
Példa. 1) Az x cos x függvény határozatlan integráljának megkereséséhez
célszerű cos x-et deriváltfüggvénynek tekinteni, mert a parciális integrálás során
a másik (az x függvény) fokszáma csökken. Tehát f (x) = x, g ′ (x) = cos x
választással g(x) = sin x, ı́gy
Z Z
x cos xdx = x sin x − 1 · sin xdx = x sin x + cos x + C

2) Az ln x függvény határozatlan integráljának megkeresésére is alkalmazhatjuk


a parciális integrálás módszerét. f (x) = ln x, g ′ (x) = 1 választással
1
Z Z
ln xdx = ln x · 1dx = xln x − xdx = xln x − x + C
x
9.2. INTEGRÁLÁSI SZABÁLYOK 77

3) Néha a parciális integrálás többszöri alkalmazása vezet eredményre. Például


Z Z
ex sin xdx = ex sin x − ex cos xdx =

Z Z
= ex sin x − (ex cos x + ex sin xdx) = ex (sin x − cos x) − ex sin xdx

alapján
1 x
Z
ex sin xdx = e (sin x − cos x) + C
2
Az összetett függvényderiválási szabályának megfelelője a helyettesı́téssel való
integrálás.
Állı́tás. Z Z
f (x)dx = f (g(t)) g ′ (t)dt (g −1 (x))

(A jobboldali integrálfüggvény t változójába g −1 (x) van helyettesı́tve.)


Bizonyı́tás. A jobboldalon szereplő függvény deriváltját képezzük az összetett
függvény deriválási szabálya és az inverz függvény deriválási szabálya alapján:
Z ′
f (g(t)) g ′ (t)dt (g −1 (x)) =

1
= f (g(g −1 (x))) g ′ (g −1 (x)) · = f (x)
g ′ (g −1 (x))
Q. E. D.
A helyettesı́téssel való integrálás módszere a következő lépésekből áll:
1) kiválasztjuk az x helyére helyettesı́tendő g(t) függvényt, meghatározzuk a
g ′ (t) deriváltfüggvényt,
2) f (x)dx-ben x helyébe g(t)-t, dx helyébe g ′ (t)dt-t ı́runk és kiszámı́tjuk a
R

most adódó határozatlan integrált (ennek t a változója),


3) végül t helyére visszahelyettesı́tjük a g −1 (x) függvényt, s ezzel megkapjuk
az x függvényeként adódó keresett határozatlan integrált.
R√
Példa. Meghatározandó 1 − x2 dx. Alkalmazzuk az x = g(t) = sin t
helyettesı́tést. Most g (x) = arc sin x, és g ′ (t) = cos t. Így
−1

Z p Z p Z
1 − x2 dx = 1 − sin2 t cos tdt = cos2 tdt =

1 + cos 2t t sin 2t 1 1
Z p
= dt = + = (t + sin t cos t) = (arc sin x + x 1 − x2 )
2 2 4 2 2

A helyettesı́téses integrálás egyszerűbb eseteit gyakran alkalmazhatjuk:


78 9. HATÁROZATLAN INTEGRÁL

1) Ha f -nek F primitı́v függvénye, akkor

F (ax + b)
Z
f (ax + b)dx = +C
a

2)
f ′ (x)
Z
dx = ln |f (x)| + C
f (x)
3)
1
Z
f α (x) f ′ (x)dx = f α+1 (x) + C ha α 6= −1.
α+1
Példa.
x 1 2x 1
Z Z
dx = dx = ln (1 + x2 ) + C
1 + x2 2 1 + x2 2
− sin x
Z Z
tg xdx = − dx = −ln | cos x| + C
cos x
3
Z p Z
1 4
2x 1 + x dx = 2x(1 + x2 ) 3 dx = (1 + x2 ) 3 · + C
3
2
4

9.3 Racionális törtfüggvények integrálása


Azokat a függvényeket nevezzük racionális törtfüggvényeknek, amelyek két
polinom hányadosaként állnak elő:

ak xk + . . . a1 x + a0
f (x) = .
bn xn + . . . b1 x + b0
Az ilyen függvények határozatlan integráljai mindig meghatározhatók az ún. par-
ciális (vagy elemi) törtekre bontás segı́tségével. A módszert teljes általánosságában
nem ismertetjük, most csak néhány példán mutatjuk be.
Először is a korábbiakból tudjuk, hogy speciális törtfüggvények esetében:
1
Z
dx = ln |x − a| + C
x−a
1 1/(1 − α)
Z
α
dx = +C
(x − a) (x − a)α−1
1
Z
dx = arc tg x + C
1 + x2
x 1
Z
2
dx = ln (1 + x2 ) + C
1+x 2
1
Z
Az dx alakú határozatlan integrál kiszámı́tásához 3 esetet tárgya-
ax2 + bx + c
lunk:
9.3. RACIONÁLIS TÖRTFÜGGVÉNYEK INTEGRÁLÁSA 79

• D = b2 − 4ac = 0. Ilyenkor
1 1 1
Z Z
2
dx = 2
dx = − +C
ax + bx + c a(x − x0 ) a(x − x0 )

• D = b2 − 4ac > 0. Ekkor a nevezőben szereplő polinomnak két különböző


gyöke van. Az integrandus
 
1 1 A B
= +
a(x − x1 )(x − x2 ) a x − x1 x − x2

ún. parciális törtekre bontható, ahol az

A+B =0

−Ax2 − Bx1 = −1
1 1
összefüggéseknek kell teljesülni. Innen A = x2 −x 1
és B = x1 −x 2
következik.
Tehát most
Z  
1 1 1/(x2 − x1 ) 1/(x1 − x2 )
Z
dx = + dx =
ax2 + bx + c a x − x1 x − x2
 
1 1 1
= ln |x − x1 | + ln |x − x2 | + C
a x2 − x1 x1 − x2

D = b2 − 4ac < 0. Most nincs gyöke a nevezőnek. Átalakı́tással az


• Z
1
dx alapintegrálra vezetjük vissza a keresendőt.
1 + x2
1 1
Z Z
2
dx = b D
dx =
ax + bx + c a(x + 2a )2 − 4a

4a 1 2 2a b
Z
=− 2a b
dx = √ arc tg ( √ x+ √ ) + C.
D ( −D x + −D ) + 1
√ √ 2 −D −D −D

A második esetben bemutatott parciális törtekre bontás bonyolultabb esetek-


ben is lehetséges, amennyiben a Znevezőben szereplő polinom gyökeit ismerjük.
3x2 − 1
Példa. Meghatározandó az dx határozatlan integrál.
(x − 1)(x2 + 1)
A Bx + C
Az integrandust most + 2 alakban kı́vánjuk fölbontani. Ekkor
x−1 x +1
szükségképpen
3x2 − 1 = A(x2 + 1) + (Bx + C)(x − 1),
azaz
A+B =3
C −B =0
80 9. HATÁROZATLAN INTEGRÁL

A − C = −1
ahonnan A = 1, B = 2, C = 2 adódik. Így

3x2 − 1 1 2x 1
Z Z Z Z
2
dx = dx + 2
dx + 2
dx =
(x − 1)(x + 1) x−1 x +1 x +1

= ln |x − 1| + ln (x2 + 1) + 2arc tg x.
10. Határozott integrál

10.1 Alapfogalom és tulajdonságok

A határozott integrál a függvénygörbe alatti területfogalmát általánosı́tja. Egy


adott [a, b] intervallumon értelmezett függvényhez hozzárendelünk egy számot,
mely pozitı́v függvény esetében éppen az x tengely és az [a, b]-nek megfelelő
függvénygörbe közötti tartomány területét adja. Látni fogjuk, hogy a határozott
integrál fogalma a függvények összeadásával, számmal való szorzásával természetes
kapcsolatban van. A Newton-Leibniz szabály szerint a határozott integrál
kiszámı́tása f határozatlan integrálja segı́tségével történhet.
A pontos részletes definı́ciót csak folytonos f függvény esetében adjuk meg.
Legyen az f függvény [a, b]-n értelmezett folytonos függvény. Tekintsük az [a, b]
intervallum egy 2n egyenlő részre történő beosztását. Ilyenkor az osztópontok:

b−a
xi = a + i , i = 0, 1, . . . , 2n .
2n

Az egyes részintervallumok hossza b−a 2n . Jelölje mi az i-dik részintervallumban a


függvényértékek minimumát (ezt felveszi a függvény, hiszen folytonos):

mi = min {f (x) | x ∈ [xi−1 , xi ] }

Ehhez a beosztáshoz képezzük az ún. (alsó) közelı́tő összeget:

n
2
X
sn = mi (xi − xi−1 )
i=1

sn szemléletes jelentése (pozitı́v függvény esetében) nem más, mint az adott


beosztáshoz tartozó beı́rható téglalapok területösszege.

81
82 10. HATÁROZOTT INTEGRÁL

y
f (x)

a b x

Állı́tás. Az sn sorozat konvergens.


Bizonyı́tás. Először azt mutatjuk meg, hogy sn felülről korlátos. Ugyanis,
jelölje M a f függvény egy felső korlátját. Nyilván mi ≤ M . Ezért
n n
2
X 2
X
sn = mi (xi − xi−1 ) ≤ M (xi − xi−1 ) = M (b − a)
i=1 i=1

Másodjára belátjuk, hogy sn monoton nő. Ha egy intervallumon egy folytonos


függvény minimuma m, akkor az intervallum felezésével adódó két részintervallum
mindegyikén a függvény minimuma legalább m. Emiatt az sn+1 előállı́tásában
szereplő két-két tag sn egy-egy tagjával alulról becsülhető:
b−a b−a b−a
sn+1 = . . . + m′2i−1 n+1
+ m′2i n+1 + . . . ≥ . . . + mi n + . . . = sn
2 2 2
Tehát sn monoton növekvő és felülről korlátos, ezért konvergens. Q. E. D.
Definı́ció. Az sn alsó közelı́tő összegek sorozatának határértéket az f függvény
[a, b] intervallumra vonatkozó határozott integráljának nevezzük. Jelölése:

Z b Z b
f (x) dx vagy f.
a a

Megjegyzés.
1. A fentiekhez hasonlóan — minimumok helyett maximumokkal — értelmez-
hető a felső közelı́tő összegek Sn sorozata is, amelyről belátható, hogy
monoton csökken, alulról korlátos, ezért szintén konvergens. Sőt folytonos
függvény esetében igazolható, hogy sn és Sn határértéke megegyezik.
2. Nem folytonos, de korlátos függvény esetében a határozott integrál ı́gy nem
értelmezhető. Ekkor minimumok és maximumok helyett az alsó, illetve a
10.1. ALAPFOGALOM ÉS TULAJDONSÁGOK 83

felső közelı́tő összegek képzésében a pontos alsó korlát és a pontos felső korlát
fogalmát használjuk:

mi = inf {f (x) | x ∈ [xi−1 , xi ] }

Mi = sup {f (x) | x ∈ [xi−1 , xi ] }


s ezekkel képezzük az s és S alsó, illetve felső közelı́tő összegeket. Tekintsük
az [a, b] intervallum összes lehetséges beosztásához (nemcsak az egyenlő
részekre való felosztásokhoz) tartozó alsó és felső közelı́tő összegeket. Akkor
mondjuk f -et [a, b]-n integrálhatónak, ha az alsó közelı́tő összegek pontos
felső korlátja megegyezik a felső közelı́tő összegek pontos alsó korlátjával,
azaz csak egy olyan szám van, amely nagyobb vagy egyenlő bármely alsó
közelı́tő összegnél, és kisebb vagy egyenlő bármely felső közelı́tő összegnél.
Ezt a számot nevezzük f [a, b]-re vonatkozó határozott integráljának. Ezt
az integrálfogalmat Riemann-integrálnak is nevezik.
3. Ez utóbbi értelemben természetesen nem minden függvény integrálható, de
a tipikusak, pl. a folytonosak, a monotonak bizonyı́thatóan igen. Nem
integrálható függvényre példa az a [0, 1]-en értelmezett függvény, amely
minden racionális x szám esetén 0-át vesz fel értékként, s 1-et minden
irracionális x szám esetén. Ennél a függvénynél nyilván minden alsó közelı́tő
összeg 0, s minden felső közelı́tő összeg 1.
A határozott integrál értelmezéséből könnyen adódnak az alábbi tulajdonságok:
1) ha f és g [a, b]-n folytonos, akkor
Z b Z b Z b
(f + g) = f+ g
a a a

2) ha f folytonos és λ ∈ R konstans, akkor


Z b Z b
λf = λ f
a a

3) ha f folytonos és c ∈ (a, b), akkor


Z b Z c Z b
f= f+ f
a a c

4) ha m ≤ f (x) ≤ M minden x ∈ [a, b]-re, akkor


Z b
m(b − a) ≤ f ≤ M (b − a)
a

Megjegyzés.
Ra Ra Rb
1. Megállapodás szerint a
f = 0 és b
f =− a
f.
84 10. HATÁROZOTT INTEGRÁL

2. A 4) tulajdonság miatt
b
1
Z
m≤ f ≤ M,
b−a a

ı́gy folytonos f esetén m-nek a függvény minimumát, M -nek pedig a


maximumát választva következik, hogy van olyan ξ ∈ (a, b), hogy
b
1
Z
f (ξ) = f
b−a a

Ez utóbbi értéket az f függvény [a, b] intervallumra vonatkozó integrálköze-


pének is nevezik.

10.2 Newton-Leibniz tétel


A most bizonyı́tandó formula azt fejezi ki, hogy a határozott integrál könnyen
kifejezhető f egy primitı́v függvényének ismeretében: a primitı́v függvénynek
a végpontokban felvett értékeinek a különbsége. Ez lényegesen megkönnyı́ti a
határozott integrálok kiszámı́tását.
Előbb azt látjuk be, hogy ha a határozott integrál esetében a felső határt
változónak tekintjük, akkor tulajdonképpen f egy primitı́v függvényét kapjuk.
Legyen Z x
T (x) = f (x ∈ [a, b])
a

Elnevezése: területmérő függvény vagy integrálfüggvény.

y
f (x)

T (x)

a x x

Állı́tás. Ha f folytonos [a, b]-n, akkor a T : [a, b] → R területmérő függvény


mindenütt differenciálható, és T ′ = f , azaz T primitı́v függvénye (határozatlan
integrálja) f -nek.
10.3. INTEGRÁLÁSI SZABÁLYOK 85

Bizonyı́tás. x0 ∈ [a, b]-ben vizsgáljuk a differenciálhatóságot. Az egyszerűség


kedvéért tegyük fel, hogy x > x0 . A határozott integrál tulajdonságait kihasználva
Z x Z x0 
T (x) − T (x0 ) 1
= f− f =
x − x0 x − x0 a a
Z x
1
= f = f (ξ)
x − x0 x0
ahol ξ ∈ (x0 , x). Ezért
T (x) − T (x0 )
lim = f (x0 ),
x→x0 x − x0
azaz T ′ (x0 ) = f (x0 ). Q. E. D.
A fenti állı́tást szokás az integrálszámı́tás alaptételének is nevezni. Nem
folytonos függvény esetében az állı́tás nem igaz. Általában a T területmérő
függvény csak folytonos, és azokban az x0 pontokban differenciálható, ahol f
folytonos.
Állı́tás. (Newton-Leibniz szabály) Ha F primitı́v függvénye az f [a, b]-n
folytonos függvénynek, akkor
Z b
f (x) dx = F (b) − F (a).
a

Rx
Bizonyı́tás. Az előbb láttuk, hogy a T (x) = a f területmérő függvény is
primitı́v függvénye f -nek, ezért F (x) = T (x) + C, ahol C ∈ R konstans. Így
T (a) = 0 miatt
Z b
f = T (b) − T (a) = F (b) − F (a).
a
Q. E. D.
A jobboldali kifejezésre gyakran a tömörı́tett [F (x)]ba jelölést alkalmazzuk.
R π/2
Példa.R Számı́tsuk ki a 0 sin x dx határozott integrált!
Mivel sin x dx = − cos x + C,
π/2
π
Z
π/2
sin x dx = [− cos x]0 = − cos + cos 0 = 1.
0 2
Ezzel megkaptuk a szinusz ”félhullám’ alatti területet.

10.3 Integrálási szabályok


A parciális integrálás és a helyettesı́téses integrálás szabályát határozott in-
tegrálokra is kiterjeszthetjük. A bizonyı́tásban kihasználjuk a határozatlan in-
tegrálra már bizonyı́tott összefüggéseket a Newton-Leibniz szabályon keresztül.
86 10. HATÁROZOTT INTEGRÁL

f ′ g és
R
RÁllı́t ás. Ha f és g [a, b]-n differenciálható függvények és léteznek az
f g ′ határozatlan integrálok, akkor
Z b Z b
f ′ (x)g(x) dx = f (b)g(b) − f (a)g(a) − f (x)g ′ (x) dx
a a

Bizonyı́tás. A Newton-Leibniz szabály alapján


Z b Z b
f ′ (x)g(x) dx = f ′ (x)g(x) dx =
a a

 Z b Z b

= f (x)g(x) − f (x)g (x) dx = f (b)g(b) − f (a)g(a) − f (x)g ′ (x) dx
a a

Q. E. D.

Megjegyzés. A határozott integrálokra vonatkozó fenti szabály akkor is érvényes,


ha a szóban forgó határozatlan integrálok nem léteznek. Ilyenkor természetesen a
fenti bizonyı́tás nem jó.

Állı́tás. Ha f [a, b]-n folytonos, van primitı́v függvénye és g: [α, β] → [a, b]
bijektı́v differenciálható függvény, g(α) = a, g(β) = b, akkor
Z b Z β
f (x) dx = f (g(t))g ′ (t) dt.
a α

Bizonyı́tás.
Z b Z b Z b
′ −1
f (x) dx = f (x) dx = f (g(t))g (t) dt (g (x)) =
a a a

Z β Z β
= f (g(t))g ′ (t) dt = f (g(t))g ′ (t) dt.
α α

Q. E. D.
1
ex
Z
Példa. Számı́tsuk ki az 2x
dx határozott integrált!
0 1+e
Az x = g(t) = ln t, t = ex helyettesı́tést választjuk. Most g ′ (t) = 1t , s
g(1) = 0, g(e) = 1, ezért
1 e e
ex t 1 1 π
Z Z Z
e
dx = dt = dt = [arc tg t]1 = arc tg e − .
0 1 + e2x 1 1 + t2 t 1 1 + t2 4
10.4. ALKALMAZÁSOK 87

10.4 Alkalmazások
A határozott integrál legegyszerűbb alkalmazásai a geometriai motivációhoz
kötődnek. Mint a fogalom kialakı́tásakor is jeleztük, a határozott integrál az
f (x) függvénygörbe alatti területet jelenti, amennyiben f (x) ≥ 0 [a, b]-n. Ahol
a függvény negatı́v, ott a függvénygörbe feletti x tengelyig terjedő terület −1-
szeresét kapjuk.
A) Tegyük fel most, hogy két függvény görbéje zár közre egy sı́ktartományt,
úgy, hogy f (a) = g(a) és f (b) = g(b), továbbá f (x) ≥ g(x) minden x ∈ [a, b]-re.
Ilyenkor a két függvény görbe közötti sı́ktartomány területe nyilván
Z b
(f (x) − g(x)) dx.
a

Példaképp számı́tsuk ki a kör területét!
√ A felső félkört az y = R2 − x2
függvény ı́rja le, mı́g az alsót az y = − R2 − x2 függvény. A
Z R p
T = 2 R2 − x2 dx
−R

határozott integrált kell kiszámı́tani. Az x = g(t) = R sin t helyettesı́tést


alkalmazzuk; most g ′ (t) = R cos t és g(−π/2) = −R, g(π/2) = R. Így
Z R p Z π/2
T = 2 2
2 R − x dx = 2 R2 cos2 tdt =
−R −π/2

π/2  π/2
cos 2t
Z
2 2
=R (1 + cos 2t) dt = R t+ = R2 π.
−π/2 2 −π/2

B) Egy függvénygörbe ı́vhosszát is meghatározhatjuk integrállal. Tegyük fel,


hogy [a, b]-n egy f folytonosan differenciálható függvény adott. Ilyenkor az [a, b]-
hez tartozó függvénygörbe ı́vhossza
Z bp
1 + (f ′ (x))2 dx
a

amennyiben a szóbanforgó integrál létezik.


Ugyanis a görbe ı́vhosszát közelı́thetjük az [a, b] egy beosztásához tartozó
töröttvonallal, melynek hossza
n
X n p
X
d(Pi−1 Pi ) = (xi − xi−1 )2 + (f (xi ) − f (xi−1 ))2
i=1 i=1

Lagrange tétele szerint f (xi ) − f (xi−1 ) = f ′ (ξi )(xi − xi−1 ) valamilyen ξi ∈


(xi , xi−1 )-kel, ı́gy
n
X n p
X
d(Pi−1 Pi ) = 1 + (f ′ (ξi ))2 (xi − xi−1 )
i=1 i=1
88 10. HATÁROZOTT INTEGRÁL

Láthatjuk, hogy a töröttvonal hossza a szóbanforgó határozott integrált közelı́ti,


a beosztás finomı́tásával tetszőleges pontossággal.
C) Forgástestek felszı́nét és térfogatát is meghatározhatjuk integrállal. Ha
az y = f (x) folytonosan differenciálható függvénygörbe [a, b] között részét
megforgatjuk az x tengely körül, akkor a kapott forgásfelület felszı́ne:
Z b p
F = 2π f (x) 1 + (f ′ (x))2 dx
a

illetve folytonos f esetén a forgástest térfogata


Z b
V =π f 2 (x) dx.
a

Az első szabály a csonkakúp palástjának felszı́nére vonatkozó összefüggés alkal-


mazásával igazolható, a második majd’ nyilvánvaló.

f (x)

a b x
z

Példa. Vezessük
√ le a gömb felszı́nére és térfogatára vonatkozó képleteket!
Most f (x) = R2 − x2 , ı́gy f ′ (x) = √R−x
2 −x2
.

R
r
x2
Z p
F = 2π R2 − x2 1+ dx =
−R R2 − x2
Z R
= 2π R dx = 2π[Rx]R 2
−R = 4πR .
−R

R R
x3 4πR3
Z 
2 2 2
V =π (R − x ) dx = π R x − = .
−R 3 −R 3
10.5. IMPROPRIUS INTEGRÁLOK 89

10.5 Improprius integrálok


Az integrálfogalom egyfajta kiterjesztését teszik lehetővé az improprius integrálok;
egyik esetben nem véges intervallumra, másik esetben pedig nem korlátos
függvényekre.
A) Tegyük fel, hogy az f (x) folytonos függvény értelmezve van minden x ≥ a-
ra. Tekintsük a
Z b
T (b) = f (x) dx
a

határozott integrált. Ha a T függvénynek van véges határértéke a végtelenben,


akkor azt mondjuk, hogy f -nek az [a, ∞) intervallumon létezik az improprius
integrálja. Jelölése:
Z ∞ Z b
f (x) dx = lim f (x) dx
a b→∞ a

Most, mint látjuk, ezt az integrált nem közelı́tő összegek segı́tségével definiáltuk,
hanem korlátos intervallumon vett határozott integrálok határértékeként.
Egy balról végtelen (∞, a] intervallumon folytonos f függvény improprius
integrálja az előbbihez hasonlóan értelmezhető:
Z a Z a
f (x) dx = lim f (x) dx
−∞ b→−∞ b

Legyen most f az egész számegyenesen Ra folytonos Rfüggvény. Ekkor ha



valamilyen a ∈ R mellett létezik az −∞ f (x) dx és az a f (x) dx improprius
integrál, akkor az f függvény egész számegyenesen vett improprius integrálja:
Z ∞ Z a Z ∞
f (x) dx = f (x) dx + f (x) dx
−∞ −∞ a

Könnyen látható, hogy az ı́gy értelmezett integrál nem függ az a szám megválasz-
tásától.
Példa. Számı́tsuk ki az Z ∞
1
2
dx
−∞ 1 + x

improprius integrált!

f (x)

x
90 10. HATÁROZOTT INTEGRÁL

a = 0-nál bontjuk:

1 π
Z
dx = lim [arc tg x]b0 =
0 1 + x2 b→∞ 2

A szimmetriából adódóan a baloldali rész is ugyanannyi, ı́gy


Z ∞
1 π π
2
dx = + = π.
−∞ 1 + x 2 2

B) A függvény, melynek integrálját akarjuk értelmezni, legyen most olyan, hogy


csupán (a, b]-n értelmezett (és folytonos), de nem feltétlenül korlátos. Ilyenkor az
Z b
f (x) dx
a

improprius integrálon a következő határértéket értjük, ha létezik:


Z b
lim f (x) dx.
y→a+0 y

Hasonlóan értelmezendő az improprius integrál, ha az f függvény b-ben nincs


értelmezve. Z 1
1
Példa. Számı́tsuk ki a √ dx improprius integrált!
0 x
1 1  √ 1
1 1 √
Z Z
√ dx = lim √ dx = lim 2 x y = lim (2 − 2 y) = 2.
0 x y→0 y x y→0 y→0

Nem létezik viszont pl. a következő improprius integrál:


Z 1 Z 1
1 1
dx = lim dx = lim [ln x]1y = lim (−ln y) = ∞.
0 x y→0 y x y→0 y→0

Ilyenkor azt is mondjuk ez az integrál nem konvergens.


11. Kettős integrál

Kétváltozós függvények adott sı́ktartomány feletti határozott integrálját az


egyváltozós esethez hasonlóan definiáljuk. Pozitı́v függvény esetében szemléle-
tesen a határozott kettős integrál nem más, mint a függvény által meghatáro-
zott felület alatti, az [x, y] sı́kig terjedő térrész térfogata. Az a sı́ktartomány,
amely felett integrálunk, egyszerűbb esetben téglalap, általában azonban nem;
de akkor is szükséges, hogy a területe jól meghatározott legyen. A kettős in-
tegrálok kiszámı́tását visszevezetjük egyváltozósokéra, amennyiben az integrációs
tartomány jól leı́rható, ún. normáltartomány. Az eljárást szukcesszı́v integrálásnak
nevezik. A kettős integrálokra részletesen elmondandó dolgok kiterjeszthetők több
(3,4, stb.) változós függvényekre is. Ilyenkor többszörös integrálokról beszélünk.

11.1 A kettős integrál fogalma


Legyen f : D ⊂ R2 → R kétváltozós valós értékű folytonos függvény, s tegyük fel
először az egyszerűség kedvéért, hogy D = [a, b] × [c, d] zárt téglalap. Tetszőleges
n ∈ N természetes szám esetén készı́tsük el az [a, b] és a [c, d] intervallum 2n egyenlő
részre való fölbontását, az osztópontokat jelölje:
b−a
xi = a + i , i = 0, 1, . . . , 2n .
2n
illetve
d−c
yi = c + i , i = 0, 1, . . . , 2n .
2n
Ezáltal a D téglalapot 22n darab kis téglalapra osztóttuk. A kis téglalapok
területeit jelölje
tij = (xi − xi−1 ) · (yj − yj−1 )
és az egyes téglalapokon a függvényértékek minimumát jelölje mij . Képezzük az
ún. alsó közelı́tő összeget:
X2n
sn = mij tij
i,j=1

Az egyváltozós függvények esetéhez hasonlóan látható most is, hogy az alsó


közelı́tő összegek sorozata monoton növekvő, felülről korlátos, s ı́gy konvergens

91
92 11. KETTŐS INTEGRÁL

sorozat. E sorozat határértékét nevezzük az f kétváltozós függvény D integrációs


tartományon vett határozott kettős integráljának. Szokták területi integrálnak is
nevezni Jele: Z Z b d Z
f (x, y) dxdy vagy f.
a c D

Megjegyzés.
1. Mint egyváltozós esetben, most is megjegyezzük, hogy minimumok helyett
maximumokkal képezve a felső közelı́tő Sn összeget, határértékként ugyanah-
hoz az integrálfogalomhoz jutunk. Nem folytonos, de korlátos függvények
esetében az integrálhatóság kérdése merül fel. Részleteket illetően lásd az
egyváltozós esetet.
2. Ha a D integrációs tartomány nem feltétlenül téglalap, de korlátos, akkor
belefoglalhatjuk egy bővebb D̃ = [a, b] × [c, d] téglalapba, s az f függvényt
kiterjesztjük D̃-ra:

f (x, y) ha (x, y) ∈ D
f˜(x, y) =
0 ha (x, y) ∈ D̃ \ D.

f˜ általában nem folytonos, mégha f az is, de a korlátosság a kiterjesztés során


megmarad. f D-n vett integrálját most a kiterjesztett függvény integráljával
értelmezhetjük:
Z Z bZ d
f (x, y) dxdy = f˜(x, y) dxdy
a c

Belátható, hogy ha maga a D tartomány mérhető és f folytonos D-n, akkor


az integrál ı́gy valóban definiálható.
(Egy D sı́ktartomány mérhetősége azt jelenti, hogy bármely ε > 0-hoz
van egy olyan D-t tartalmazó sokszög és egy D-ben lévő sokszög, amelyek
területkülönbsége kisebb, mint ε.)
3. Ha egy D tartományon az f (x, y) = K konstans függvényt integráljuk,
K · t(D) adódik, ahol t(D) a D tartomány területét jelenti. Ezért a terület
kiszámı́tására is alkalmas a kettős integrál:
Z
t(D) = f (x, y) dxdy.

4. A kettős integrálok tulajdonságai a függvények műveleteivel kapcsolatban


lényegében ugyanazok, mint az egyváltozós függvények esetében. Az
integrációs tartomány fölbontása most is lehetséges: ha D = D1 ∪ D2 úgy,
hogy D1 és D2 zárt, mérhető, továbbá D1 és D2 belsejének metszete üres,
akkor Z Z Z
f= f+ f
D D1 D2
(Ennek igazolása mélyebb meggondolásokat igényelne.)
11.2. SZUKCESSZÍV INTEGRÁLÁS 93

11.2 Szukcesszı́v integrálás


A kettős integrálok kiszámı́tását az teszi lehetővé, hogy visszavezethetjük
egyváltozós, de paraméteres függvények határozott integráljainak kiszámı́tására.
Állı́tás. Ha a D = [a, b] × [c, d] téglalapon az f függvény integrálható, továbbá
Rd
minden x ∈ [a, b] esetén létezik az c f (x, y) dy integrál, akkor
Z Z b Z d
f (x, y) dxdy = ( f (x, y) dy)dx.
D a c

Rb
Ha pedig bármely y ∈ [c, d] esetén létezik az a f (x, y) dx integrál, akkor
Z Z d Z b
f (x, y) dxdy = ( f (x, y) dx)dy.
D c a

Rd
Bizonyı́tás. A bizonyı́táshoz legyen g(x) = c f (x, y) dy és az [xi−1 , xi ]
intervallumon jelölje g(x) értékeinek pontos alsó, illetve felső korlátját m′i illetve
Rb Rd
Mi′ . Az a ( c f (x, y) dy)dx integrál alsó és felső közelı́tő összegeit jelöli s′n illetve
Sn′ :
X
s′n = m′i (xi − xi−1 )
i
X
Sn′ = Mi′ (xi − xi−1 )
i

Ha x ∈ [xi−1 , xi ], akkor
Z d XZ yj X
g(x) f (x, y) dy = f (x, y) dy ≤ Mij (yj − yj−1 )
c j yj−1 j

ezért X
Mi′ ≤ Mij (yj − yj−1 ),
j

s ı́gy Sn′ ≤ Sn . Hasonlóan adódik sn ≤ s′n . Az integrálhatóság miatt lim sn =


lim Sn , ezért a
lim sn ≤ lim s′n ≤ lim Sn′ ≤ lim Sn
egyenlőtlenségsorban mindenütt egyenlőség áll. Ez azt jelenti, hogy a szóban forgó
integrálok egyenlők. Q. E. D.
Megjegyzés.

1. A tételt úgy is kifejezhetjük, hogy a kettős integrálás visszavezethető két


’egyszeres’ integrálásra, s az integrálás sorrendje nem számı́t.
94 11. KETTŐS INTEGRÁL

2. Amennyiben f (x, y) = g(x)h(y) szorzatalakú függvény, akkor nyilvánvalóan


Z bZ d Z b Z d
f (x, y) dxdy = g(x) dx h(y) dy
a c a c

x2 y dxdy integrált, ahol D = { 1 ≤ x ≤ 2, 2 ≤ y ≤ 3 }


R
Példa. Számı́tsuk ki a
téglalap alakú tartomány!
2 3 2 3 2  3 2
x2 y 2 5x2

5x 35
Z Z Z Z Z
2 2
x y dxdy = ( x y dy) dx = dx = dx = = .
1 2 1 2 2 1 2 6 1 6
Másik sorrendben végezve a szukcesszı́v integrálást
Z 3 Z 2 Z 3  3 3 Z 3  2 3
x y 7y 7y 35
Z
x2 y dxdy = ( x2 y dx) dy = dy = dy = = .
2 1 2 3 2 2 3 6 2 6

Nem téglalap alakú integrációs tartományok esetén a szukcesszı́v integrálás na-


gyobb figyelmet érdemel: A D ⊂ R2 sı́ktartományt elsőfajú normáltartománynak
nevezzük, ha vannak olyan ϕ1 , ϕ2 : [a, b] → R folytonos függvények, hogy

D = { (x, y) ∈ R2 | a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) }

D másodfajú normáltartomány, ha valamely ψ1 , ψ2 : [c, d] → R folytonos függvényekre

D = { (x, y) ∈ R2 | c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y) }

Normáltartomány pl. egy kör, elsőfajú, de nem másodfajú normáltartomány


pl. két érintkező egymás melletti körlemez. Nem normáltartomány pl. egy
körgyűrű.
A normáltartományokon értelmezett kétváltozós folytonos függvényekre érvényes
a következő tétel, amely egyszerű következménye az előbbi állı́tásnak és a D tar-
tományon vett kettős integrál definı́ciójának.
Állı́tás. Ha f : D ⊂ R2 → R és D elsőfajú normáltartomány, akkor
!
Z Z Z b ϕ2 (x)
f (x, y) dxdy = f (x, y) dy dx.
D a ϕ1 (x)

Ha D másodfajú normáltartomány, akkor


!
Z Z d Z ψ2 (y)
f (x, y) dxdy = f (x, y) dx dy.
D c ψ1 (y)

(x2 + y 2 ) dxdy kettős integrált a


R
Példa. Számı́tsuk ki a D

D = { (x, y) | 0 ≤ x ≤ 1, 0 ≤ y ≤ 2x }
11.3. TÖBBSZÖRÖS INTEGRÁL 95

háromszögtartomány felett!
Most D elsőfajú normáltartomány (is), ϕ1 (x) = 0, ϕ2 (x) = 2x.
1 2x 1 2x
y3
Z Z Z  Z 
(x2 + y 2 ) dxdy = (x2 + y 2 ) dx dx = x2 y + dx =
D 0 0 0 3 0

1 1
8x3 14x4

14
Z
= (2x3 + ) dx = = .
0 3 12 0 12

11.3 Többszörös integrál


Ha R3 vagy Rn (n ≥ 3) valamely D tartományán értelmezett f folytonos
függvényről van szó, hasonlóan a fentiekhez értelmezhető az f függvény D feletti
határozott integrálja, melyet n = 3 esetén szoktak térfogati integrálnak, vagy
hármas integrálnak, többváltozós függvény esetében pedig többszörös integrálnak
nevezni.
Az Rn -beli téglatestek térfogatát az egy csúcsból induló n él hosszainak
szorzataként kapjuk. A D tartomány felosztásához tartozó kis résztéglatestek
térfogatmértékeit szorozva a függvényértékek minimumával, kapjuk az alsó
közelı́tő összegeket, s innentől a felépı́tés ugyanúgy megy tovább.
Példa. Számı́tsuk ki az R3 -beli egységkockán az f (x, y, z) = xy 2 z 3 függvény
integrálját!
Z 1Z 1Z 1 Z 1 Z 1 Z 1
xy 2 z 3 dxdydz = ( ( xy 2 z 3 dx) dy) dz =
0 0 0 0 0 0

1 Z 1 Z 1
1 11 111 1
Z
= ( ( y 2 z 3 ) dy) dz = ( z 3 ) dz = = .
0 0 2 0 2 3 2 3 4 24
96 11. KETTŐS INTEGRÁL
12. Differenciálegyenletek

Ebben a fejezetben az elsőrendű differenciálegyenletekkel ismerkedünk meg, s


néhány elemi úton megoldható, nevezetesen a szeparábilis és a lineáris diffe-
renciálegyenleteket vizsgáljuk meg.
A differenciálegyenletek a természetben és a társadalomban lejátszódó folya-
matok széles körének leı́rásában és vizsgálatában alkalmazható. Olyankor
beszélünk differenciálegyenletről, ha a folyamatot leı́ró függvényre valamely olyan
összefüggés teljesül, amelyben a független x változón és az y(x) függvényen kı́vül
a függvény deriváltja is szerepel. Ha csak az első derivált, akkor elsőrendű
differenciálegyenletről van szó.
Mint minden függvényekre vonatkozó egyenlet esetében jellemzően két alapvető
kérdés van: 1) van-e megoldása vagy megoldásai az egyenletnek,
2) hogyan számı́thatjuk ki a megoldást, vagy megoldásokat. A differenciálegyen-
letek vizsgálatában a két kérdésre más módszerrel adható válasz. A megoldá-
s(ok) létezésének igazolása a differenciálegyenletek egy igen széles osztályára
lehetséges. A megoldások explicit meghatározásának módja viszont csak
szűk, speciális egyenletosztályokra ismert, ezek közül is csak a legegyszerűbbet
ismertetjük. Konkrét differenciálegyenletek esetében sokszor az is elegendő,
hogyha a megoldások meghatározása nélkül a megoldások tulajdonságait, a
megoldó függvények viselkedését tudjuk csak meghatározni. Ez utóbbi kérdésbe
nincs módunk részletesebben belemenni.

12.1 Elsőrendű differenciálegyenlet


Elsőrendű differenciálegyenletnek nevezzük az

y ′ = f (x, y)

egyenletet, ahol f : I × J ⊂ R × R → R kétváltozós folytonos függvény, I, J


nyı́lt intervallumok. Az y: I ∗ ⊂ R → R függvény megoldása az előbbi diffe-
renciálegyenletnek, ha I ∗ ⊂ I, y(I ∗ ) ⊂ J és minden x ∈ I esetén

y ′ (x) = f (x, y(x)).

97
98 12. DIFFERENCIÁLEGYENLETEK

Megjegyzés.

1. Az elsőrendű differenciálegyenlet, illetve a megoldás fogalmát geometriailag


az ún. iránymezővel szemléltethetjük: ha minden (x, y) ∈ I × J pontban
tekintjük azt az irányt, amelynek iránytangense éppen f (x, y), akkor az y(x)
függvény akkor lesz megoldás, ha a függvénygörbe mentén ezek az irányok
éppen a függvénygörbe érintői.

2. Esetünkben a differenciálegyenlet az egyváltozós y(x) függvényre vonatko-


zik. Ilyenkor közönséges differenciálegyenletről beszélünk. Amennyiben az
ismeretlen függvény többváltozós, akkor parciális differenciálegyenletről van
szó.

3. Magasabb rendű differenciálegyenletről, akkor volna szó, ha az egyenletben


az ismeretlen függvény magasabb rendű deriváltjai is szerepelnének.

4. Egy elsőrendű differenciálegyenletnek általában végtelen sok megoldása


van, ezeket azonban sokszor nem a szokásos explicit y(x) alakban kapjuk,
hanem egyenlet formájában. Pl. az yy ′ + x = 0 differenciálegyenlet
2 2
megoldásai x + y = C alakúak, ahol C tetszőleges nemnegatı́v valós szám.
Ebből a kapcsolatból y majdnem egyértelműen, azaz előljeltől eltekintve
egyértelműen határozható
√ meg x függvényeként.
√ Ekkor tulajdonképpen a
megoldás az y = C − x2 és az y = − √C − x2 függvények egyesı́tése.
A megoldás lényegében tehát egy kör, a C sugarú kör. C különböző
értékei esetén más-más köröket kapunk, melyek mind a differenciálegyenlet
megoldásait jelentik. A megoldásgörbéket szokták integrálgörbéknek is
nevezni.

Példa. Tegyük fel, hogy valamely y(x) mennyiség változásának sebessége


(pl. a GNP változásának sebessége) az x időpillanatban arányos a mennyiség x
időpontbeli mennyiségével:
y ′ = ay.
Hogyan változik y az idő függvényében? Feltesszük, hogy a konstans, az időtől nem
függő adott érték. (Ez azt jelenti, pl. hogy a GNP évről évre azonos százalékkal nő
avagy csökken). Könnyen látható, hogy a differenciálegyenletünket megoldják az
y(x) = Ceax függvények, ahol C tetszőleges pozitı́v konstans. (Később láthatjuk,
hogy más megoldás nincs is.) Ez azt jelenti, hogy a mennyiség exponenciálisan
nő, vagy csökken az idő függvényében. Az ilyen függvénnyel leı́rható folyamatokat
evolúciós folyamatoknak nevezik.
Kezdeti érték problémáról beszélünk, ha a differenciálegyenletünk mellett adott
egy (x0 , y0 ) értékpár, s a differenciálegyenletnek olyan y(x) megoldását keressük,
melyre y(x0 ) = y0 . Ez azt jelenti, hogy a differenciálegyenlet végtelen sok
meggoldása közül azt kell kiválasztanunk, amely egy adott x0 -nál a megadott
y0 értéket veszi fel.
12.2. SZÉTVÁLASZTHATÓ DIFFERENCIÁLEGYENLETEK 99

Egy differenciálegyenlet két megoldása már akkor is különböző, ha értelmezé-


si tartományaik nem azonosak, bár ezek közös részére való leszűkı́tésük egyenlő.
Ezért a megoldás egyértelműségét a következőképp értelmezzük: az (x0 , y0 ) kezdeti
érték probléma megoldása egyértelmű, ha van a differenciálegyenletnek olyan
megoldása, hogy az (x0 , y0 ) kezdeti érték probléma bármely más megoldása ennek
leszűkı́tése. Az ilyen megoldást maximális megoldásnak nevezzük (tulajdonképp
az értelmezési tartománya a maximális). A következő, a differenciálegyenletek
elmélete alaptételének nevezett tételt nem bizonyı́tjuk.
Állı́tás. Ha differenciálegyenletben szereplő f függvénynek létezik a ∂2 f parciális
deriváltfüggvénye, amely folytonos az egész I × J halmazon, akkor tetszőleges
(x0 , y0 ) ∈ I × J kezdeti érték problémához egyértelműen létezik olyan y: I ∗ → R
maximális megoldása az
y ′ = f (x, y)
differenciálegyenletnek, mely teljesı́ti a kezdeti feltételt: y(x0 ) = y0 .

A legegyszerűbb differenciálegyenlet

y ′ = f (x)

alakú. Ekkor tulajdonképp olyan y(x) függvényt keresünk, amelynek deriváltja


f (x). Nyilvánvalóan y f -nek primitı́v függvénye, másszóval határozatlan integrálja,
a megoldás ezért Z
y(x) = f (x) dx + C

tehát az egyenletnek végtelen sok megoldása van.


Ha kezdeti érték probléma is adott, azaz azt kı́vánjuk, hogy y(x0 ) = y0 is
teljesüljön, akkor az egyetlen megoldás:
Z x
y(x) = y0 + f (t) dt
x0

Ezt a megoldást úgy is megkaphatjuk, hogy a C-t választjuk meg alkalmasan.

12.2 Szétválasztható differenciálegyenletek


Egy differenciálegyenletet szétválasztható (változójú) differenciálegyenletnek ne-
vezünk, ha
y ′ = g(x)h(y)
alakra hozható. (Szokták szeparábilisnek is mondani.) Az ilyen differenciálegyen-
let megoldásait a következők alapján határozhatjuk meg. Rendezzük baloldalra
az y-t tartalmazó kifejezéseket, jobboldalra az x-et tartalmazókat.
1
y ′ (x) = g(x)
h(y(x))
100 12. DIFFERENCIÁLEGYENLETEK

Mindkét oldal határozatlan integrálját képezve:


1
Z Z
y ′ (x) dx = g(x) dx + C
h(y(x))

A helyettesı́téses integrálás szabálya alapján a baloldalt átalakı́thatjuk:


1
Z Z
dy(y(x)) = g(x) dx + C
h(y)

Ebből az egyenletből — jó esetben — a keresett y(x) függvény kifejezhető.

Példa. Tegyük fel, hogy a népesség növekedésének üteme egy szigeten arányos
a népesség aktuális létszámával, s továbbá a sziget maximális befogadóképességét
jelentő A értéktől való eltéréssel:

y ′ = ay(A − y)

A differenciálegyenletben most a és A adott értékek, s az egyenlet szétválasztható


változójú:
1
y′ = a
y(A − y)
A fenti érvelés alapján:
1
Z Z
dy = a dx
y(A − y)
Kiszámı́tva az itt szereplő integrálokat, a következőhöz jutunk:
1 y
ln = ax + C
A A−y

Ebből kifejezhetjük az y függvény:


A
y=
1 + e−A(C+ax
E függvény görbéjét, amely a fentiek alapján a korlátos növekedési folyama-
tokra jellemző, logisztikus görbének nevezik.

12.3 Lineáris differenciálegyenlet


Elsőrendű lineáris differenciálegyenletnek nevezzük az

y ′ + p(x)y = q(x)

alakú egyenleteket. Az egyenletet homogén, ha q(x) = 0 minden x-re. Általában


inhomogénnak mondjuk.
12.3. LINEÁRIS DIFFERENCIÁLEGYENLET 101

Megjegyzés. Könnyen belátható, hogy egy homogén lineáris differenciál-


egyenlet megoldásai alteret alkotnak a differenciálható függvények terében, azaz
bármely két megoldás összege is megoldás. Az is látható hogy ez az altér
1 dimenziós. Másrészt, ha egy inhomogén differenciálegyenlethez tekintjük a
jobboldal lenullázásával keletkező homogén egyenletet, akkor megoldásaik halmaza
között ugyanaz a kapcsolat áll fenn, mint a lineáris egyeneletrendszerek esetében:
az inhomogén két megoldásának különbsége megoldása lesz az homogénnak, s az
inhomogén egy megoldásának és a homogén egy tetszőleges megoldásának összege
az inhomogén egy megoldását adja. Ez azt jelenti, hogy elegendő megkeresnünk a
homogén összes (általános) megoldását, továbbá az inhomogénnek egy konkrét
(partikuláris) megoldását, ezekből előállı́tható az inhomogén összes (általános)
megoldása.
A) A homogén lineáris differenciálegyenlet mindig szétválasztható változójú:

y ′ = −p(x)y

Ezért
1
Z Z
dy = − p(x) dx
y
azaz Z
ln |y| = − p(x) dx + ln |C|

s ı́gy a homogén egyenlet általános megoldása:


R
y(x) = Ce− p(x) dx

B) Az inhomogén egyenletet az ún. állandók variálásának módszerével


oldhatjuk meg. Egy partikuláris megoldást keresünk
R
y(x) = C(x)e− p(x) dx

alakban. Behelyettesı́tve az inhomogén egyenletbe C(x)-re egyszerű diffe-


renciálegyenletet kapunk: R
C ′ (x) = q(x)e p(x) dx
ahonnan C(x) határozatlan integrálással adódik. Így összességében az inhomogén
egyenlet általános megoldását az
R
Z R

y(x) = e− p(x) dx q(x)e p(x) dx dx + C

alakban kapjuk.
Példa. Oldjuk meg az
xy ′ − y = x3 + 1
lineáris differenciálegyenletet!
102 12. DIFFERENCIÁLEGYENLETEK

1.lépésben az xy ′ − y = 0 homogén egyenletet oldjuk meg:

y′ 1
= , tehát y = Cx
y x

2. lépésben az inhomogén egy megoldását C(x)x alakban keressük:

x2 C ′ + xC − Cx = x3 + 1

azaz
1 x2 1
C′ = x + , tehát C(x) = −
x2 2 x
Így az egyenletünk általános megoldása:

x3
y(x) = − 1 + Cx.
2
13. Vektorterek

Több esetben találkozhattunk olyan struktúrával, ahol az összeadás és a (valós)


számmal való szorzás értelmezett, pl. a szabadvektorok esetében, vagy a
függvények körében, vagy a mátrixok esetében. Ezek közös vizsgálatát teszi
lehetővé a vektortér fogalma.
Definı́ció. Egy V 6= ∅ halmazt valós vektortérnek nevezünk, ha V -ben
értelmezett az összeadás művelete, melyre teljesülnek az alábbi tulajdonságok

∀ a, b ∈ V : a + b = b + a

∀ a, b, c ∈ V : (a + b) + c = a + (b + c)
∃ 0∈V : a + 0 = a
∀ a ∈ V ∃(−a) ∈ V : a + (−a) = 0
továbbá minden λ ∈ R valós szám esetén értelmezett az ún. λ-val való szorzás,
mely a ∈ V -hez λ a-t rendeli, s e hozzárendelés teljesı́ti az alábbi tulajdonságokat:

∀ λ, µ ∈ R, a ∈ V : (λ + µ)a = λa + µa

∀ λ ∈ R, a, b ∈ V : λ(a + b) = λa + λb
∀ λ, µ ∈ R, a ∈ V : (λ · µ)a = λ(µa)
1·a= a
Megjegyzés.

1. Komplex vektortér ugyanı́gy értelmezhető, ha a fenti definı́cióban a valós


szám fogalmát a komplex szám fogalmára cseréljük.

2. A továbbiakban azt a valós vagy komplex számtestet, mely elemeivel


szorozhatunk a vektortérben, skalártestként emlı́tjük; e szorzást skalárral
való szorzásnak szokás nevezni. Számos vizsgálatban lényegtelen, hogy a
skalártest a valós vagy a komplex számtest, de némely vizsgálatban fontos
lesz. Ilyenkor felhı́vjuk majd a figyelmet az eltérésre.

103
104 13. VEKTORTEREK

3. Két valós V1 és V2 vektorteret izomorfnak mondunk, ha van közöttük olyan


f : V1 → V2 bijekció, amely művelettartó, azaz
f (a + b) = f (a) + f (b) és f (λa) = λf (a) teljesül minden a, b ∈ V1 és
λ ∈ R esetén. Ilyenkor a két vektortér műveleteik szempontjából azonosnak
tekinthető.

Példák. 1) Legyen n ∈ N egy rögzı́tett természetes szám. Rn jelöli a valós


(rendezett) szám-n-esek halmazát (R n-szeres Descartes szorzata önmagával). Rn -
ben az összeadást, s a λ skalárral való szorzást komponensenként értelmezzük:

(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )

λ(x1 , . . . , xn ) := (λx1 , . . . , λxn )


Könnyű ellenőrizni, hogy az ı́gy értelmezett összeadás és skalárral való szorzás
valóban teljesı́ti a vektorterektől elvárt tulajdonságokat, ami azt jelenti, hogy Rn
valós vektortér a most értelmezett műveletekkel.
Ez a példa azért különösen fontos, mert mint később látni fogjuk, minden n
dimenziós valós vektortér izomorf Rn -nel.
Megjegyzendő, hogy a C komplex számtestből kiindulva ugyanı́gy értelmezhető
C n komplex szám-n-esek komplex vektortere.
2) Tekintsük a (középiskolában megismert) sı́k vagy tér vektorait. (Szokás
szabadvektoroknak nevezni őket, megkülönböztetendő a vektorfogalom általá-
nosabb fogalmától.) Itt két vektor összege összefűzési eljárással vagy a para-
lelogramma átlójával értelmezhető, a λ skalárral való szorzás pedig λ arányú
középpontos hasonlósággal.
a+b (a1 + b1 , a2 + b2 )

(b1 , b2 )
b

a (a1 , a2 )

3) Tekintsünk most egy tetszőleges nemüres X halmazt, s az összes X-en


értelmezett valós függvényt:
V = {f : X → R}
E függvénytérben az összeadás és a λ-val való szorzás szokásosan értelmezett:

(f + g)(x) = f (x) + g(x) (x ∈ X)

(λ f )(x) = λ f (x) (x ∈ X)
13.1. LINEÁRIS FÜGGŐSÉG 105

Nyilvánvalóan teljesülnek a vektortér-tulajdonságok, tehát a V függvénytér valós


vektortér. Ha komplex értékű f : X → C függvényeket tekintünk, ily módon
komplex vektortérhez jutunk. Speciális eseteket kapunk, ha X-et konkrétan
megválasztjuk. Pl. X = N esetén adódik, hogy a valós számsorozatok is valós
vektorteret alkotnak.
4) Legyen n ∈ N rögzı́tett, s tekintsük a legfeljebb n-edfokú polinomok
Pn halmazát. Az összeadás és skalárral való szorzás úgy értelmezett, mint a
függvények körében szokásos. Láthatjuk azonban, hogy egy p(x) = an xn + . . . +
a1 x + a0 és egy q(x) = bn xn + . . . + b1 x + b0 polinom összege együtthatókként
képződik:
(p + q)(x) = (an + bn )xn + . . . + (a1 + b1 )x + (a0 + b0 )
Ebből könnyen adódik, hogy Pn és Rn+1 izomorf vektorterek, mivel a
p(x) = an xn + . . . + a1 x + a0 ∈ Pn 7→ (an , . . . , a1 , a0 ) ∈ Rn+1
leképezés bijekció és művelettartó (izomorfizmus).

13.1 Lineáris függőség


Tekintsük az a1 , a2 , . . . , ak ∈ V vektorrendszert. Ha b = α1 a1 + . . . + αk ak , akkor
azt mondjuk, hogy b lineáris kombinációja az a1 , a2 , . . . , ak vektoroknak. Ilyenkor
azt is mondjuk, hogy b lineárisan van kifejezve a vektorrendszerrel.
Két kérdésre keressük a választ:
1) ha b előállı́tható az a1 , a2 , . . . , ak vektorrendszerrel, milyen esetben egyértelmű
ez az előállı́tás,
2) vajon minden b ∈ V vektor előállı́tható-e a megadott a1 , a2 , . . . , ak
vektorrendszerből.
Egy a1 , a2 , . . . , ak legalább 2 tagú vektorrendszert lineárisan függőnek mon-
dunk, ha valamely vektora lineáris kombinációja a vektorrendszer többi vek-
torának. 1 elemű a ’vektorrendszert’ linárisan függőnek akkor mondunk, ha a = 0.
Egy a1 , a2 , . . . , ak vektorrendszer lineárisan független, ha nem lineárisan függő.
Ez azt jelenti legalább 2 tagú vektorrendszer esetében, hogy közülük egyik sem
fejezhető ki a többi lineáris kombinációjaként.
Megjegyzés.
1. A lineárisan független vektorrendszereket jellemzi azon tulajdonságuk, hogy
vektoraiból a zérusvektor csak triviálisan állı́tható elő, azaz
α1 a1 + . . . + αk ak = 0 csak úgy lehetséges, ha α1 = 0, . . . , αk = 0. Ugyanis,
α1
ha másféleképp is lehetséges, pl. αk 6= 0, akkor ak = (− )a1 + . . . +
αk
αk−1
(− )ak−1 , azaz ak lineárisan kifejezhető a1 , a2 , . . . , ak−1 -el.
αk
2. A lineárisan függő vektorrendszereket az jellemzi, hogy tagjaiból a zérusvektor
nemcsak triviálisan (csupa 0 együtthatókkal) állı́tható elő. Valóban, ha
ak = α1 a1 + . . . + αk−1 ak−1 , akkor 0 = α1 a1 + . . . + αk−1 ak−1 + (−1)ak .
106 13. VEKTORTEREK

3. Ha egy vektorrendszer nem tartalmazza a zérusvektort, akkor pontosan


akkor lineárisan függő, ha valamely vektora előáll az előtte állók lineáris
kombinációjaként. Ugyanis van olyan tag a vektorrendszerben, melyre
a1 , . . . , aj lineárisan függő, de a1 , . . . , aj−1 még nem, hiszen a1 6= 0 egyedül
nem lineárisan függő. Ilyenkor aj lineárisan kifejezhető a1 , . . . , aj−1 -el.

Állı́tás. Egy a1 , . . . , ak vektorrendszer pontosan akkor lineárisan függtelen, ha a


V vektortér tetszőlges b ∈ V vektora legfeljebb egyféleképpen fejezhető ki lineárisan
az a1 , . . . , ak vektorrendszer tagjaival.
Bizonyı́tás. Ha b = α1 a1 + . . . + αk ak = α′1 a1 + . . . + α′k ak teljesül, akkor

(α1 − α′1 )a1 + . . . + (αk − α′k )ak = 0.

Ezért a1 , . . . , ak lineáris függetlenségéből (α1 − α′1 ) = 0, . . . , (αk − α′k ) = 0, s


ı́gy α1 = α′1 , . . . , αk = α′k következik, tehát a két előállı́tás azonos. Fordı́tva,
a zérusvektorra alkalmazva a feltételt, adódik a1 , . . . , ak lineáris függetlensége.
Q. E. D.

13.2 Bázis és dimenzió


Egy a1 , . . . , ak vektorrendszert generátorrendszernek nevezünk, ha a vektortér
bármely b vektora előállı́tható lineáris kombinációval az a1 , . . . , ak vektorokból,
azaz ∃α1 , . . . , αk ∈ R skalárok, hogy b = α1 a1 + . . . + αk ak . Ha egy V vektortérnek
van véges tagszámú generátorrendszere, akkor V -t végesen generáltnak, vagy véges
dimenziósnak mondjuk.
a1 , . . . , ak vektorrendszer bázis, ha lineárisan független és generátorrendszer.
Ilyenkor bármely b ∈ V egyértelműen fejezhető ki lineárisan az a1 , . . . , ak bázis
tagjaival:
∀ b ∈ V ∃! β1 , . . . , βk ∈ R : b = β1 a1 + . . . + βk ak
Az itt fellépő β1 , . . . , βk skalárokat a b vektornak az a1 , . . . , ak bázisra vonatkozó
koordinátáinak nevezzük.
Most megmutatjuk, hogy egy végesen generált vektortérben a bázisok tagszáma
egyenlő.
Állı́tás. Ha a1 , . . . , ak bázis és b1 , . . . , bl is bázis V -ben, akkor k = l.
Bizonyı́tás. Az a1 , . . . , ak bázisból hagyjuk el az első vektort. a2 , . . . , ak
nem bázis, mert a1 nem fejezhető ki vele. a2 , . . . , ak , b1 , . . . , bl lineárisan függő
generátorrendszer, mert generátorrendszer bővı́tése. Sorban haladva, egyesével
hagyjuk el azokat a bi vektorokat, amelyek a előtte állóknak lineáris kombinációja.
A megmaradó vektorrendszer generátorrendszer és lineárisan független, tehát
bázis. Néhány, legalább 1 bi vektor megmaradt a vektorrendszerben, mert
a2 , . . . , ak önmagában nem bázis. A következő lépésben a2 -t hagyjuk el, s
egészı́tjük ki az összes b1 , . . . , bl vektorokkal, majd elhagyjuk a felesleges bi -ket,
mint előbb. Újra bázishoz jutunk. Folytatva a3 -al, stb. végül ak -t is elhagyva,
13.3. ALTÉR ÉS RANG 107

olyan bázishoz jutunk k lépésben, mely bizonyos bi vektorokból áll. Minden


lépésben legalább egy bi vektor bekerült a bázisba, de ugyanaz nem szerepelhet
kétszer, ezért k ≤ l. Felcserélve a két eredeti bázis szerepét l ≤ k adódik, tehát
k = l. Q. E. D.
Definı́ció. Végesen generált vektortér bázisainak közös tagszámát a vektortér
dimenziójának nevezzük.
Példa. 1) Tekintsük Rn -ben az e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . ,
en = (0, . . . , 0, 1), vektorokat. Könnyen láhatjuk, hogy e1 , e2 , . . . , en bázis Rn -
ben; neve természetes vagy kanonikus bázis. e1 , e2 , . . . , en lineárisan független,
mert ha α1 e1 + . . . + αn en = (0, 0, . . . , 0), akkor (α1 , . . . , αn ) = (0, 0, . . . , 0),
azaz α1 = 0, . . . , αn = 0. Generátorrendszer, hiszen ha x = (x1 , . . . , xn ) ∈ Rn
tetszőleges vektor, akkor nyilván x = x1 e1 + . . . + xn en . Ez azt is jelenti,
hogy Rn -ben egy vektornak a természetes bázisra vonatkozó koordinátái éppen
a komponensei.
2) A tér szabadvektorai vektorterének bázisát kaphatjuk úgy, hogy ha
tekintünk négy nem komplanáris (nem egysı́kú) O, A1 , A2 , A3 pontot. Ekkor az
⇀ ⇀ ⇀
OA1 , OA2 , OA3 szabadvektorok bázist adnak.
Megjegyzés. Legyen a1 , . . . , an egy rögzı́tett bázisa a n dimenziós V valós
vektortérnek. Jelölje κ: V → Rn az e bázishoz tartozó koordinátaleképezést:
κ(b) = (β1 , . . . , βn ), ha b = β1 a1 + . . . + βn an . A κ koordinátaleképezés bijektı́v,
hiszen a koordináták egyértelműen meghatározzák a vektort, s minden szám-n-es
valamely vektornak koordináta n-ese. κ művelettartó is, hiszen

κ(b + c) = (β1 + γ1 , . . . , βn + γn ) =

= (β1 , . . . , βn ) + (γ1 , . . . , γn ) = κ(b) + κ(c)

κ(λb) = (λβ1 , . . . , λβn ) = λ(β1 , . . . , βn ) = λκ(b)


Ez azt jelenti, hogy V izomorf Rn -el. Ebből az is adódik, hogy bármely két azonos
dimenziójú valós vektortér izomorf egymással.

13.3 Altér és rang


A V vektortér egy nemüres L részhalmazát altérnek mondjuk, ha a lineáris
kombináció képzés nem ”vezet ki” L-ből, azaz bármely a, b ∈ L és α, β ∈ R
esetén αa + βb ∈ L. Ilyenkor az L altér is vektortér, hiszen egyrészt a műveleti
tulajdonságok öröklődnek L-re,másrészt a zérusvektor 0 · a = 0 miatt van benne
L-ben, a (−a) inverz pedig −a = (−1)a miatt.
Minden vektortérben van két triviális altér, egyik a csak a zérusvektort
tartalmazó L0 = {0} zérusaltér, másik L = V . Nem triviális példa: 1) A tér
szabadvektorai vektorterében egy adott sı́kkal párhuzamos szabadvektorok alteret
alkotnak. 2) R2 -ben pl. L = {(x, 0) | x ∈ R} altér. 3) P4 -ben pl. L = P2 altér.
108 13. VEKTORTEREK

Definı́ció. Egy adott a1 , . . . , ak vektorrendszer által generált altérnek mondjuk


az a1 , . . . , ak vektorrendszer tagjaiból képezhető összes lineáris kombinációk
halmazát:
L(a1 , . . . , ak ) = {α1 a1 + . . . + αk ak | α1 , . . . , αk ∈ R}

Ez nyilvánvalóan altér, sőt a legszűkebb olyan altér, mely tartalmazza az összes


a1 , . . . , ak vektort. A legszűkebb kifejezés azt jelenti, hogy a generált L(a1 , . . . , ak )
altér benne van minden olyan altérben, mely tartalmazza az összes a1 , . . . , ak
vektort.
Láthatjuk, hogy a1 , . . . , ak generátorrendszer az L(a1 , . . . , ak ) altérben, de nem
mindig bázis, csak ha lineárisan független.
Definı́ció. Az L(a1 , . . . , ak ) generált altér dimenzióját az a1 , . . . , ak vektorrend-
szer rangjának nevezzük. Jele: rg(a1 , . . . , ak ).
Általában rg(a1 , . . . , ak ) ≤ k, egyenlőség pontosan akkor teljesül, ha a1 , . . . , ak
lineárisan független. Ha a1 , . . . , ak lineárisan függő, sorban elhagyhatjuk belőle
az olyan vektorokat, melyek lineárisan kifejezhetők a megmaradókkal. Így végül
olyan részrendszerhez jutunk, mely lineárisan független és generátorrendszer, tehát
bázis L(a1 , . . . , ak )-ban.
Állı́tás. Az a1 , . . . , ak vektorrendszer rangja megegyezik maximális lineárisan
független részrendszerének tagszámával.
Bizonyı́tás. Ha pl. a1 , . . . , ar maximális lineárisan független részrendszere az
a1 , . . . , ak vektorrendszernek, akkor bázis L(a1 , . . . , ak )-ban. Ugyanis, bármely
aj , j ≥ r + 1 esetén a1 , . . . , ar , aj lineárisan függő, s ı́gy aj = α1 a1 + . . . +
αr ar . Mivel bármely b ∈ L(a1 , . . . , ak ) kifejezhető lineárisan a1 , . . . , ak -val, ezért
a1 , . . . , ar -rel is. Tehát rg(a1 , . . . , ak ) = r. Q. E. D.
Állı́tás. Egy a1 , . . . , ak vektorrendszer rangja nem változik, ha
— megváltoztatjuk a vektorok sorrendjét,
— valamely tagját λ 6= 0 skalárral szorozzuk,
— valamely vektorához egy másik vektorát hozzáadjuk.
Bizonyı́tás. Többet látunk be: a generált altér sem változik. A harmadik
esetben pl. L(a1 + a2 , a2 , . . . , ak ) = L(a1 , a2 , . . . , ak ), mert a1 + a2 , a2 , . . . , ak ∈
L(a1 , a2 , . . . , ak ) miatt a generált altér fogalmának minimum tulajdonsága szerint
L(a1 + a2 , a2 , . . . , ak ) ⊂ L(a1 , a2 , . . . , ak ), s hasonlóan
a1 = (a1 + a2 ) − a2 , a2 , . . . , ak ∈ L(a1 + a2 , a2 , . . . , ak ) miatt,
L(a1 + a2 , a2 , . . . , ak ) ⊂ L(a1 , a2 , . . . , ak ). Q. E. D.
Ez utóbbi állı́tás — mely leı́rja a rangmegtartó átalakı́tásokat — hatékonyan
alkalmazható konkrét vektorterekben adott vektorrendszerek rangjának meghatá-
rozására.
14. Determinánsok

A determináns fogalma olyan algebrai segédeszköz, amellyel jól jellemezhető a


mátrixok invertálhatósága, a mátrix rangja. Segı́tségével lineáris egyenletrendsz-
erek megoldhatósága dönthető el, sőt konkrét kiszámı́tási módszereket is szolgáltat
az előbbi kérdésekre, bár ez nem mindig hatékony.
Jelöléseket vezetünk be: tekintsünk egy A ∈ Mn n-edrendű kvadratikus
mátrixot:  
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A= . ..
 
 ..

. 
an1 an2 . . . ann
oszlopvektorait jelölje a1 , a2 , . . . , an :
     
a11 a12 a1n
 a21   a22   a2n 
a1 =  .  , a2 =  .  , . . . an =  ..
     
 ..   ..

  . 
an1 an2 ann

Ezek a vektorok most a skalár-n-esek Rn vektorterében lévő vektorok. Ilyenkor


azt is ı́rjuk, hogy A = (a1 , a2 , . . . , an ).
Definı́ció. Determinánsfüggvénynek nevezzük azt a det : Mn → R leképezést,
amely teljesı́ti a következő tulajdonságokat:

• oszlopvektoraiban additı́v:

det (a1 + a′1 , a2 , . . . , an ) = det (a1 , a2 , . . . , an ) + det (a′1 , a2 , . . . , an )

• skalárszorzó kiemelhető:

det (λa1 , a2 , . . . , an ) = λdet (a1 , a2 , . . . , an )

• bármely két oszlop felcserélésekor előjelet vált:

det (a1 , . . . , aj , . . . , ai , . . . , an ) = −det (a1 , . . . , ai , . . . , aj . . . , an )

109
110 14. DETERMINÁNSOK

• az egységmátrix determinánsa 1:

det E = det (e1 , e2 , . . . , en ) = 1

Megjegyzés.

1. Az A mátrix determinánsára a det A jelölést alkalmazzuk, a szokásosabb,


hagyományos jelölés: |A|.

2. Az első tulajdonságot additivitási tulajdonságnak, a másodikat homogenitási


tulajdonságnak (a skalár kiemelhető), a harmadikat alternáló vagy antiszim-
metria tulajdonságnak szokták nevezni.

3. Az additivitási és a homogenitási tulajdonság nemcsak az első oszlopvektorra


igaz, hanem mindegyikre, hiszen az alternáló tulajdonság alapján az első
oszlopra vonatkozó összefüggések átvihetők bármelyikre.

4. A determináns fogalma bizonyos értelemben általánosı́tása a terület, illetve


térfogat fogalmának. Ugyanis, a sı́kban két vektor, a és b — közös
pontból indı́tott reprezentánsaikkal — egy paralelogrammát határoz meg.
Ennek t(a, b) területét pozı́tı́vnak tekintve, ha a paralelogramma pozı́tı́v
körüljárású, mı́g negatı́vnak, ha negatı́v körüljárású, könnyen látható, hogy
teljesı́ti a a determináns definı́ciójában megkı́vánt első 3 tulajdonságot. A
negyedik pedig azt fejezi ki, hogy az egységnégyzet területe 1. Hasonlóan
megfigyelhetjük, hogy a tér 3 szabadvektorából reprezentánsaikkal képezhető
paralelepipedon térfogata is ezen tulajdonságokkal rendelkezik. E térfogat
pontosan akkor nulla, ha a három vektor lineárisan függő.

A 4 kiinduló tulajdonságból vezetjük le a determinánsok további tulaj-


donságait, illetve konkrét kiszámı́tási lehetőségeit. Ha az egyik oszlopvektor a
zérusvektor, akkor a determináns értéke 0, hiszen

det (0, a2 , . . . , an ) = det (0 · 0, a2 , . . . , an ) = 0 · det (0, a2 , . . . , an ) = 0

Ha két oszlop egyenlő, akkor a determináns értéke 0, hiszen az alternáló


tulajdonságot kihasználva:

det (a1 , . . . , a, . . . , a, . . . , an ) = −det (a1 , . . . , a, . . . , a . . . , an ),

s ez csak úgy lehet, ha det (a1 , . . . , an ) = 0.


Most olyan képletet vezetünk le, amely a determinánsnak a mátrix elemeivel
történő kiszámı́tására ad lehetőséget. A mátrix oszlopvektorait a természetes bázis
tagjaival ı́gy fejezhetjük ki:
n
X
aj = aij ei j = 1, 2, . . . , n
i=1
111

Helyettesı́tsük ezt be a mátrix determinánsába, az egyes oszlopvektoroknál


különböző indexet használva, a determináns első két tulajdonsága alapján:
n
X n
X
det (a1 , . . . , an ) = det ( ai1 1 ei1 , . . . , ain n ein ) =
i1 =1 in =1

n
X
= ai1 1 . . . ain n det (ei1 , . . . , ein )
i1 ,...,in =1

Az utóbbi det (ei1 , . . . , ein ) determináns értéke nulla, ha két azonos oszlopa
van, azaz csak akkor különbözik nullától, ha i1 , i2 , . . . , in permutációja az
1, 2, . . . , n számoknak. Ekkor viszont az oszlopok — melyek most a természe-
tes bázis tagjai — szomszédos oszlopcserékkel átrendezhetők úgy, hogy végül az
egységmátrixot kapjuk. Közben e determináns értéke minden cserénél előjelet vált.
Pontosan annyi csere volt szükséges, amennyi az inverziók száma az i1 , i2 , . . . , in
permutációban. (Két elem inverzióban áll egymással az adott permutációban, ha
a nagyobb elem megelőzi a kisebbet.) Ezért
det (ei1 , . . . , ein ) = (−1)I det (e1 , . . . , en ) = (−1)I

ahol I az i1 , i2 , . . . , in permutációban lévő inverziók számát jelöli. Összeségében a


következő állı́táshoz jutunk.
Állı́tás. Az A mátrix determinánsa a következőképp számı́tható ki:
X
|A| = (−1)I ai1 1 . . . ain n ,
i1 ,...,in

ahol az összegzés kiterjed az 1, 2 . . . , n számok összes permutációjára, tehát ez az


összeg n! tagú.

Megjegyzés.
1. Hagyományosan ez a képlet jelenti a determináns definı́cióját, s akkor az
általunk adott definı́ció kikötései egyszerű tulajdonságokként adódnak.
2. A származtatott képlet azonban csak korlátozottan hatékony a determináns
értékének kiszámı́tására, mivel nagyobb n esetén általában az összes n!
szorzat megkeresése hosszadalmas. Ha azonban a mátrix speciális alakú,
pl. felső vagy alsó háromszög alakú, akkor e kiszámı́tási képletből azonnal
adódik, hogy egyetlen olyan szorzat van, amely nem biztosan zérus: a
főátlóban álló elemek szorzata:

a11 a12 . . . a1n

0 a22 . . . a2n
.. .. .. = a11 a22 . . . ann

. . .

0 0 . . . ann
112 14. DETERMINÁNSOK

3. A determináns fenti kiszámı́tási módjából következik, hogy a transzponált


mátrix determinánsa ugyanannyi, mint az eredetié:

det AT = det A más jelöléssel: |AT | = |A|

(A transzponált mátrix az a mátrix, mely a sorok és oszlopok felcserélésével


képződik, másszóval a főátlóra való tükrözéssel.) Ugyanis, A és AT deter-
minánsának képzésében résztvevő szorzatok ugyanazok, hiszen egy szorzatba
minden sorból és minden oszlopból egyetlen elem kerül. Másrészt e szorza-
tok előjelei is azonosak a két determináns képzésében, hiszen ugyanazon
elemek az egyikben oszlopindex szerint, mı́g a másikban sorindex szerint
növekedőleg vannak elrendezve. A sorindexek megfelelő permutációja, illetve
az oszlopindexek megfelelő permutációja viszont egymás inverz permutációi,
ezért bennük az inverziók száma egyenlő.
Ezen megjegyzésünk szerint minden olyan, a mátrixok determinánsáról szóló
állı́tás, amely az oszlopokra vonatkozott, igaz sorokra is, és fordı́tva.
A determinánsok gyakorlati kiszámı́tása szempontjából jelentős a következő
állı́tás.
Állı́tás. Ha egy mátrix egy oszlopát (vagy sorát) úgy változtatjuk meg, hogy
hozzádjuk másik oszlopának (vagy sorának) skalárszorosát, akkor az új mátrix
determinánsa megegyezik az eredetiével.
Bizonyı́tás. Ha pl. az elsőhöz adjuk a második oszlopvektort, akkor:

det (a1 + a2 , a2 , . . . , an ) = det (a1 , a2 , . . . , an ) + det (a2 , a2 , . . . , an )

A második összeadandó nulla, hiszen két oszlopa azonos. Q. E. D.


Most következő állı́tásunk azt jelenti, hogy a determináns eltűnése (nulla volta)
csak attól függ, hogy az oszlopvektorok lineárisan függők, vagy függetlenek.
Állı́tás. Egy A mátrix determinánsa pontosan akkor nulla, ha az oszlopvektorai
lineárisan függők.
Bizonyı́tás. Ha az oszlopvektorok lineárisan függők, pl. az első lineárisan
kifejezhető a többivel: a1 = λ2 a2 + . . . + λn an , akkor

det (a1 , a2 , . . . , an ) = det (λ2 a2 + . . . + λn an , a2 , . . . , an ) =

= λ2 det (a2 , a2 , . . . , an ) + . . . + λn det (an , a2 , . . . , an )


Az utóbbi determinánsok mindegyikében két oszlop azonos, ezért a determinánsok
nullák.
Amennyiben az oszlopvektorok lineárisan függetlenek, akkor bázist alkotnak
Rn -ben, ezért a természetes bázis tagjai is előállı́thatók velük:
n
X
ej = βij ai j = 1, 2, . . . , n
i=1
113

Ugyanazon érveléssel, mint a determináns hagyományos képletének levezetésénél


alkalmaztunk, azt kapjuk, hogy
 
X
1 = det (e1 , . . . , en ) =  (−1)I βi1 1 . . . βin n  det (a1 , . . . , an )
i1 ,...,in

Emiatt det A = det (a1 , . . . , an ) nem lehet nulla. Q. E. D.


Állı́tás. Szorzástétel:

det (A · B) = det A · det B más jelöléssel: |A · B| = |A| · |B|

Bizonyı́tás. Legyen C = A · B, és jelölje c1 , . . . , cn a C mátrix oszlopvektorait.


Ekkor
n
X
cj = bij ai j = 1, 2, . . . , n
i=1

teljesül. Ezért az iménti eljárással újra azt kapjuk, hogy


X
det C = det (c1 , . . . , cn ) = ( (−1)I bi1 1 . . . bin n )det (a1 , . . . , an ) =
i1 ,...,in

= det B · det A
Q. E. D.
Az eddigiekből következik, hogy
Állı́tás. Egy kvadratikus mátrix pontosan akkor invertálható, ha determinánsa
nem nulla.
Bizonyı́tás. Ha invertálható, akkor van olyan B, hogy A · B = E, ezért a
szorzástétel alapján

1 = det E = det (A · B) = det A · det B

tehát det A nem lehet nulla.


Fordı́tva, ha det A nem nulla, akkor az oszlopvektorai lineárisan függetlenek,
tehát bázist alkotnak, belőlük a természetes bázis vektorai előállı́thatók:
n
X
ej = βij ai j = 1, 2, . . . , n
i=1

Láthatjuk, hogy az itt fellépő βij együtthatókból képzett B mátrixszal A · B = E


teljesül, tehát B lesz A-nak inverze. Q. E. D.
114 14. DETERMINÁNSOK

14.1 Kifejtési tétel


Tekintsük az n-edrendű A kvadratikus mátrixot, s töröljük belőle a kiválasztott
i-dik sort és j-dik oszlopot. A visszamaradó (n− 1)-edrendű mátrix determinánsát
az A mátrix (i, j)-dik aldeterminánsának mondjuk, jele: Dij . Az (i, j)-dik
algebrai aldeterminánsnak nevezzük az (−1)i+j Dij értéket, jele: Aij . Ezen
aldeterminánsok segı́tségével is kiszámı́tható A determinánsának értéke:
Állı́tás. Oszlop szerinti kifejtés: Legyen j egy rögzı́tett oszlopindex. Ekkor
n
X
|A| = a1j A1j + . . . + anj Anj = aij Aij
i=1

Sor szerinti kifejtés: Legyen i egy rögzı́tett sorindex. Ekkor


n
X
|A| = ai1 Ai1 + . . . + ain Ain = aij Aij
j=1

Bizonyı́tás. Bontsuk fel az j-dik oszlopot a természetes bázisban:

aj = a1j e1 + . . . + anj en .

Ekkor
|A| = det (a1 , . . . , an ) = det (a1 , . . . , a1j e1 + . . . + anj en , . . . , an ) =

a11 ... 0 ... a1n




a11 ... 1 ... a1n ..

.. ..



a21 ... 0 ... a2n

. . .

= a1j . .. .. + . . . + aij ai1 ... 1 ... ain + ...

.. . . . .. ..

..

an1 ... 0 ... ann . .

a
n1 ... 0 ... ann

a11 ... 0 ... a1n
.. .. ..


. . . + anj
. . .

an−1,1
... 0 ... an−1,n

an1 ... 1 ... ann

E szétbontás egy tetszőleges tagja átalakı́tható (n−i)+(n−j) cserével a következő


alakra, miközben minden alkalommal előjelet vált:

a11 . . . a1n 0
.. ..

aij (−1)2n−(i+j) . . = aij Aij

an1 . . . ann 0

ai1 . . . ain 1

Q. E. D.
14.2. RANGSZÁMTÉTEL 115

Megjegyzés.

1. A kifejtési tétel alkalmazása akkor célszerű, ha egy sorban vagy oszlopban


relatı́ve sok nulla elem van. Ekkor esetleg kevés aldetermináns kiszámı́tása
már az egész detemináns meghatározásához vezet.

2. Ha egy kiválasztott sor (vagy oszlop) elemeit egy másik kiválasztott sor (vagy
oszlop) megfelelő elemeihez tartozó algebrai aldeterminánsokkal szorozzuk, s
e szorzatok összegét képezzük, 0-át kapunk: (Ferde kifejtési tétel) Ha j 6= k
n
X
0 = a1j A1k + . . . + anj Ank = aij Aik
i=1

Ha i 6= k
n
X
0 = ai1 Ak1 + . . . + ain Akn = aij Akj
j=1

Az első igazolásához fejtsük a det (a1 , . . . , aj , . . . , aj , . . . , an ) = 0 deter-


minánst a k-dik oszlopa szerint!

3. Az algebrai aldeterminánsok segı́tségével kifejezhetjük az inverz mátrix


elemeit:
Aji
A−1 = (bij ); bij =
|A|
Ugyanis, az ı́gy megadott mátrixszal kiszámı́tva a A · A−1 szorzatmátrix
(i, j)-dik elemét:
n n
X 1 X
aik bkj = aik Ajk = δij
|A|
k=1 k=1

ahol δij az egységmátrix elemeit jelöli.

14.2 Rangszámtétel
Legyen most A egy k × n-es mátrix. A mátrix rangján oszlopvektorainak a rangját
értjük. Mindjárt látni fogjuk, hogy ez megegyezik a sorvektorainak rangjával.
Tetszőleges A ∈ Mk×n mátrix l-edrendű aldeterminánsát úgy értelmezzük,
hogy kiválasztunk l darab sort és l darab oszlopot, s ezek metszetében szereplő
elemek alkotta l-edrendű determinánst
  képezzük. Ilyen l-edrendű aldeterminánsa
a mátrixnak sok van, pontosan kl nl darab. Most bebizonyı́tjuk, hogy tetszőleges
mátrix rangja meghatározható ezen aldeterminánsokkal, nevezetesen:
Állı́tás. Az A mátrix rangja megegyezik maximális rendű nullától különböző
aldeterminánsának rendjével.
Bizonyı́tás. Tekintsünk egy maximális rendű nullától különböző aldeter-
minánst, s az egyszerűbb ı́rásmód kedvéért tegyük fel, hogy ez a bal felső sarokban
116 14. DETERMINÁNSOK

van, jelölje D, rendje legyen r. Megmutatjuk, hogy ekkor a mátrix rangja r, azaz
speciálisan az a1 , a2 , . . . , ar oszlopvektorok lineárisan függetlenek, de bármelyik
oszlopvektort hozzájuk véve, lineárisan függő vektorrendszert kapunk.
Lineáris függetlenségük abból következik, hogy ha az a1 , . . . , ar oszlopvektorok
lineárisan függők volnának, akkor a csak az első r sorban lévő részoszlopok –
melyek az aldetermináns oszlopai – is függők volnának, s ı́gy a kiválasztott D
aldetermináns nulla volna, ami lehetetlen.
Vegyük hozzá az a1 , a2 , . . . , ar oszlopvektorokhoz az aj oszlopvektort (j > r).
Megmutatjuk, hogy aj lineárisan kifejezhető az előbbiekkel. Tetszőleges i-dik sort
még kiválasztva (i > r), az 1, 2, . . . , r, i sorokkal és 1, 2, . . . , r, j oszlopokkal képzett
aldetermináns nulla, ezért kifejtve az utolsó sora szerint:

0 = ai1 bi1 + . . . + air bir + aij D

Ezen összefüggés akkor is teljesül, ha i = 1, 2, . . . , r – a ferde kifejtési tétel miatt.


Másrészt, a bi1 , . . . , bir algebrai aldeterminánsok nem függnek i-től. Ezért
1
aij = − (ai1 b1 + . . . + air br )
D
teljesül minden i = 1, 2, . . . , n esetén, azaz az oszlopvektorokra:
1
aj = − (a1 b1 + . . . + ar br )
D
Q. E. D.
Megjegyzés.
1. A rangszámtétel alapján látható, hogy tetszőleges mátrix sorvektorainak
rangja oszlopvektorainak rangjával egyenlő, hiszen a determinánsok értéke
transzponáláskor nem változik.
2. A rangszámtételből az is adódik, hogy ha egy kvadratikus mátrix deter-
minánsa nulla, akkor oszlopvektorai lineárisan függők. Ugyanis, ha |A| = 0,
akkor A rangja kisebb, mint n, tehát oszlopvektorainak rangja a vektorok
tagszámánál kisebb, ezért lineárisan független nem lehet.
15. Lineáris
egyenletrendszerek

Az egyenletrendszerek egyik legegyszerűbb formája az, amikor az ismeretleneknek


csak lineáris kifejezései szerepelnek az egyenletekben. Egyszerűségük ellenére
alkalmazásuk széleskörű, éppen jó kezelhetőségük miatt.
Lineáris egyenletrendszernek nevezzük az

a11 x1 + a12 x2 + ... +a1n xn = b1


a21 x1 + a22 x2 + ... +a2n xn = b2
.. ..
. .
ak1 x1 + ak2 x2 + . . . +akn xn = bk

n ismeretlenes, k egyenletből álló egyenletrendszert, ahol


a11 , a12 , . . . , a1n , . . . , ak1 , . . . , akn , b1 , . . . , bk adott valós számok. x1 , . . . , xn jelö-
li az ismeretleneket, az aij számokat a lineáris egyenletrendszer együtthatóinak
mondjuk, mı́g a b1 , b2 , . . . , bk számokat a konstansoknak.
Amennyiben b1 = 0, . . . , bk = 0, az egyenletrendszert homogénnak nevezzük,
általában inhomogénnak. A c1 , c2 , . . . , cn valós számok egy megoldását adják
az adott lineáris egyenletrendszerünknek, ha az ismeretlenek helyére helyettesı́t-
ve a c1 , c2 , . . . , cn számokat, igaz egyenlőségeket kapunk, másszóval c1 , c2 , . . . , cn
kielégı́ti az összes megadott k darab egyenletet.
Megjegyzés.
1. Az ismeretlenek együtthatói és a konstansok nemcsak a valós számtestből
vehetők, hanem lehetnek más számtest, pl. a komplex számtest elemei. Ekkor
természetesen a megoldásokat is ugyanazon számtestben keressük.
2. Egyenletek, egyenletrendszerek esetében két alapvető kérdés van:
1) Van-e az egyenletrendszernek egyáltalán megoldása, s ha van, a megoldás
egyértelmű-e?
2) Hogyan határozhatjuk meg a megoldást, vagy megoldásokat.
A két kérdésre adható válasz nem mindig kapcsolódik szorosan össze.
Elméleti megfontolásokban általában az első kérdés a fontosabb, mı́g
gyakorlati alkalmazások szempontjából a második.

117
118 15. LINEÁRIS EGYENLETRENDSZEREK

Ha a lineáris egyenletrendszernek létezik megoldása, akkor megoldhatónak


mondjuk. Ellenkező esetben, ellentmondásosnak nevezzük. Ha pontosan egy
megoldás létezik, akkor az egyenletrendszert határozottnak nevezzük. Ha több
megoldás van, akkor határozatlannak mondjuk. Lineáris egyenletrendszer esetében
belátható, hogy ilyenkor végtelen sok megoldás van.
Két lineáris egyenletrendszert ekvivalensnek mondunk, ha megoldásaik hal-
maza azonos. Megvizsgáljuk most, hogy az egyenletrendszer mely átalakı́tásai
vezetnek ekvivalens egyenletrendszerekhez. Előszöris, ha csak az egyik, pl. az
első egyenletet változtatjuk úgy, hogy megszorozzuk valamely nullától különböző
számmal, akkor az eredetivel ekvivalens egyenletrendszerhez jutunk. Ugyanis ha
egy c1 , c2 , . . . , cn szám n-es megoldja az eredeti egyenletrendszert, akkor az újat
is, hiszen az első egyenlet esetében
λa11 c1 + λa12 c2 + . . . + λa1n cn = λ(a11 c1 + a12 c2 + . . . + a1n cn ) = λb1
mı́g a többi egyenlet ugyanaz, mint az eredetiben. Fordı́tva ugyanı́gy indokol-
1
hatunk, hiszen a régi első egyenlet az újból szorzással adódik. Másodjára,
λ
ekvivalens egyenletrendszerhez jutunk akkor is, ha valamely, pl. első egyenletet
úgy változtatjuk meg, hogy hozzáadjuk valamelyik másik, pl. második egyenletet.
Ugyanis ha c1 , c2 , . . . , cn megoldja az eredeti egyenletrendszert, akkor az új elsőt
is:
(a11 + a21 )c1 + (a12 + a22 )c2 + . . . + (a1n + a2n )cn =
= (a11 c1 + a12 c2 + . . . + a1n cn ) + (a21 c1 + a22 c2 + . . . + a2n cn ) = b1 + b2
s a többit is, hiszen azok ugyanazok, mint az eredetiben. Fordı́tva, ha c1 , c2 , . . . , cn
megoldja az új egyenletrendszert, akkor a régi első egyenlete az újból úgy kapható
meg, hogy az elsőből levonjuk a másodikat, ezért:
a11 c1 + a12 c2 + . . . + a1n cn =
= ((a11 +a21 )c1 +(a12 +a22 )c2 +. . .+(a1n +a2n )cn )−(a21 c1 +a22 c2 +. . .+a2n cn ) =
= (b1 + b2 ) − b2 = b1 ,
tehát c1 , c2 , . . . , cn megoldja a régi egyenletrendszer első egyenletét, s a többit,
hiszen azok változatlanok.
Megjegyezzük még, hogy nyilvánvalóan nem változik meg az egyenletrendszer
megoldásainak halmaza, ha megváltoztatjuk az egyenletek sorrendjét. Sőt az
össszeadás kommutatı́v volta miatt akkor sem, ha az egyenletben szereplő tagok
sorrendjét (az ismeretlenek sorrendjét) megváltozatjuk.

15.1 Gauss elimináció

Most bemutatunk egy módszert, mely alkalmas egy tetszőleges lineáris egyenle-
trendszer megoldásainak előállı́tására, illetve annak eldöntésére is, hogy az egyen-
letrendszer határozott, határozatlan vagy ellentmondásos. Ez a módszer a Gauss
15.1. GAUSS ELIMINÁCIÓ 119

elimináció, részletesebben az ismeretlenek szukcesszı́v kiküszöbölésének módszere.


A Gauss elimináció során az egyenletrendszert ekvivalens átalakı́tásokkal olyan
alakra hozzuk, hogy onnan a megoldhatóság, és a megoldások könnyen le-
olvashatók legyenek. Ez az alak az ún. trapéz alak vagy speciális esetben
háromszögalak. Egy lineáris egyenletrendszert trapéz alakúnak mondunk, ha
van olyan 1 ≤ r ≤ k, hogy a11 6= 0, a22 6= 0, . . . , arr 6= 0, aij = 0, ha
i = 1, 2, . . . , r, j < i és aij = 0, ha i > r, j = 1, . . . , n. Speciálisan, az
r = n esetben háromszögalakúnak nevezzük az egyenletrendszert. Könnyen meg-
mutatható, hogy bármely lineáris egyenletrendszer véges sok lépésben ekvivalens
átalakı́tásokkal trapéz alakra hozható. A Gauss elimináció fő lépése a következő:
amennyiben a11 6= 0, a második, harmadik, stb., k-adik egyenletből az x1 is-
meretlen eltüntethető, másszóval kiküszöbölhető azáltal, hogy az első egyenlet
ai1
(− )-szeresét adjuk az i-dik egyenlethez (i = 2, 3, . . . , k). Ha a11 = 0, akkor
a11
az első egyenletben nem nulla együtthatóval szereplő ismeretlent kell előrehozni
első ismeretlennek, s ekkor végrehajtani az ismeretlen kiküszöbölését. A második
lépésben a második ismeretlent küszöböljük ki a második egyenlet utáni egyen-
letekből, stb. és ı́gy tovább mindaddig, amı́g van mit kiküszöbölni. Ily módon
trapéz alakhoz jutottunk.
A trapéz alakról felismerhető, hogy van-e megoldása az egyenletrendszernek.
Pontosan akkor megoldható, ha trapéz alakjában az r + 1-dik egyenlettől kezdve
a jobboldali konstansok mind 0-ák. A megoldható esetben az egyenletrendszer
pontosan akkor lesz határozott, ha r = n, azaz háromszögalakra jutottunk.
Ugyanis ekkor az utolsó, n-dik egyenletből adódik xn egyetlen lehetséges értéke,
ezt behelyettesı́tve az előzőbe xn−1 , majd ezt is az előzőbe helyettesı́tve az
újabb ismeretlen értéke, stb. s végül az első egyenetből x1 . Ha viszont r < n,
akkor az egyenletrendszer határozatlan, hiszen az xr+1 , xr+2 , . . . , xn ún. szabad
ismeretleneknek tetszőleges értéket adva az egyenletrendszer határozottá válik,
azaz az előbbiekben alkalmazott visszahelyettesı́téses módszerrel egy (partikuláris)
megoldást kapunk. A szabad ismeretlenek viszont sokféleképp megválaszthatók,
teljesen tetszőlegesen, ezért végtelen sok megoldása van az egyenletrendszernek.
Ilyenkor szokás a megoldásokat a szabad ismeretlenek függvényében felı́rni.
Megjegyzés.
1. Homogén lineáris egyenletrendszer mindig megoldható, hiszen x1 = 0, x2 =
0, . . . , xn = 0 triviálisan megoldást ad. Ezért a megoldhatóság kérdése nem
érdekes, hanem az, hogy e triviálistól különböző megoldás van-e. A Gauss
elimináció módszere szerint ez akkor következik be, ha r < n. Speciálisan
láthatjuk, hogy ha az egyenletek száma kevesebb, mint az ismeretlenek száma
(k < n), akkor a homogén lineáris egyenletrendszernek mindig van triviálistól
különböző megoldása is.
2. Tudjuk, hogy a sı́kon Descartes féle koordinátarendszert tekintve az egye-
nesek Ax + By = C lineáris egyenletekkel adhatók meg. Ezért egy
kétismeretlenes két egyenletből álló lineáris egyenletrendszer megoldhatósága
azzal ekvivalens, hogy a megfelelő egyeneseknek van-e közös pontjuk. Ha
120 15. LINEÁRIS EGYENLETRENDSZEREK

egy közös pontjuk van, metszők, akkor határozott az egyenletrendszer,


ha azonos a két egyenes, akkor határozatlan az egyenletrendszer, s ha
párhuzamosak, akkor az egyenletrendszer ellentmondásos. A 3 ismeretlenes
lineáris egyenletek térbeli sı́kok egyenletei. Ezért a 3 ismeretlenes egyenle-
trendszer megoldása úgy is fölfogható, mint sı́kok metszéspontjának (vagy
metszéspontjainak) meghatározása.

15.2 Mátrixszámı́tás
Ha adott k · n darab valós szám, s ezeket k sorban, s n oszlopban helyezzük el,
akkor k×n tı́pusú mátrixról beszélünk. Jelölése:
 
a11 a12 ... a1n
 a21 a22 ... a2n 
A= .. ..
 

 . . 
ak1 ak2 . . . akn

Itt aij az A mátrix i-dik sorának j-dik elemét jelöli. Gyakran mondjuk, hogy
aij az A mátrix (i, j)-dik eleme. Elméleti megfontolásokban gyakran a tömörı́tett
A = (aij ) jelölést alkalmazzuk. Az összes k × n tı́pusú mátrixok halmazát Mk×n
jelöli. Ha egy mátrixban a sorok és oszlopok száma megegyezik: k = n, akkor
n-edrendű kvadratikus (négyzetes) mátrixról beszélünk. Ezek halmazát adott
n esetén Mn jelöli. Azt a speciális mátrixot, melynek minden eleme nulla,
nullmátrixnak mondjuk, s általában O-val jelöljük. n-edrendű egységmátrixon azt
az n-edrendű kvadratikus mátrixot értjük, melynek főátlójában (diagonálisában)
mindenütt 1 áll, másutt pedig 0: Jele:
 
1 0 ... 0
 0 1 ... 0 
E= .. ..
 

 . . 
0 0 ... 1

Megjegyzés.

1. Nemcsak valós számokból készı́thetünk mátrixokat, hanem tulajdonképpen


bármely halmaz elemeiből, de ha majd műveleteket akarunk értelmezni,
szükséges, hogy a mátrix elemei olyan halmazból valók legyenek, amelyben
az illető művelet értelmezett. Pl. ha komplex számokból készı́tünk mátrixot,
akkor komplex elemű mátrixról beszélünk.

2. Lehet egy mátrixnak csupán egyetlen sora, vagy csak egy oszlopa, ilyenkor
sormátrixról, illetve oszlopmátrixról beszélünk.
15.2. MÁTRIXSZÁMÍTÁS 121

15.21. Mátrixműveletek
Két mátrix összeadása csak akkor lehetséges, ha azonos tı́pusúak. Az A = (aij ) és
B = (bij ) k×n tı́pusú mátrixok összege az a k×n tı́pusú mátrix, melynek (i, j)-dik
eleme A (i, j)-dik elemének és B (i, j)-dik elemének összege:
 
a11 + b11 a12 + b12 . . . a1n + b1n
 a21 + b21 a22 + b22 . . . a2n + b2n 
A+B = .. ..
 

 . . 
ak1 + bk1 ak2 + bk2 . . . akn + bkn

Az összeadás nyilvánvalóan rendelkezik a következő tulajdonságokkal:

(A + B) + C = A + (B + C)

A+B =B+A
A+O = O+A= A
A + (−A) = O
ahol −A azt a mátrixot jelöli, mely A-ból úgy keletkezik, hogy minden elemét
−1-el szorozzuk.
Legyen λ tetszőleges valós szám. λA azt a mátrixot jelöli, mely A-
ból úgy keletkezik, hogy A minden elemét megszorozzuk λ-val. Ezt a fajta
szorzást skalárral való szorzásnak mondjuk. Nyilvánvalóan teljesülnek a következő
tulajdonságok:
(λµ)A = λ(µA)
(λ + µ)A = λA + µA
λ(A + B) = λA + λB
Két mátrix szorzata csak akkor értelmezett, ha az elsőnek annyi oszlopa van,
mint ahány sora a másodiknak. Az A ∈ Mk×n és a B ∈ Mn×l mátrixok szorzata
az a C ∈ Mk×l mátrix, mely (i, j)-dik eleme:
n
X
cij = ai1 b1j + ai2 b2j + . . . + ain bnj = ais bsj
s=1

A mátrixszorzás tulajdonságai:

A(BC) = (AB)C

(A + B)C = AC + BC
A(B + C) = AB + AC
AE = A
Fontos fölfigyelnünk arra, hogy a mátrix szorzás nem kommutatı́v: általában
AB 6= BA.
122 15. LINEÁRIS EGYENLETRENDSZEREK

A mátrixszorzás apró alkalmazásaként arra mutatunk rá, hogy egy lineáris


egyenletrendszer mátrixegyenletként is értelmezhető: Ha A jelöli a lineáris
egyenletrendszer együtthatóiból képzett k × n-es mátrixot, X az ismeretleneket
tartalmazó n × 1-es oszlopmátrixot, s B a konstansokat tartalmazó k × 1 osz-
lopmátrixot, akkor az egyenletrendszer az

AX = B

mátrixegyenletté tömörı́thető.
Egy A kvadratikus mátrixot invertálhatónak mondunk, ha létezik hozzá olyan
B mátrix, hogy AB = BA = E. Ezt a B mátrixot A inverzmátrixának nevezzük,
s a jele A−1 .
Meg lehet mutatni, hogy ha A invertálható, akkor csak egyetlen
 inverze
 van.
0 0
Viszont nem minden kvadratikus mátrix invertálható, pl. a mátrix
1 1
sem. Később fogunk majd mondani feltételeket arra, hogy egy mátrix mikor
invertálható.
Az n-edrendű invertálható mátrixok halmaza a szorzás műveletére nézve zárt,
azaz két invertálható mátrix szorzata is invertálható, és

(AB)−1 = B −1 A−1

Ugyanis, (AB)(B −1 A−1 ) = A(BB −1 )A−1 = (AE)A−1 = AA−1 = E.


Az inverz mátrix meghatározása a következő megfigyelésen alapszik: Az in-
verzmátrix első oszlopában szereplő számok megkeresése egy olyan lineáris egyen-
letrendszer megoldását jelenti, mely együtthatómátrixa A, a jobboldali konstan-
sok oszlopa pedig az E egységmátrix első oszlopa. Az inverz mátrix második,
stb. j-dik oszlopának megkeresése azon lineáris egyenletrendszer megoldását je-
lenti, mely együttható mátrixa A, a jobboldali konstansok oszlopa E második,
stb. j-dik oszlopa. Tehát n darab lineáris egyenletrendszert kell megoldanunk, de
ezek baloldala mind ugyanaz. Mivel a Gauss elimináció lépéseit csupán a baloldali
együtthatómátrix irányı́tja, ezeket az egyenletrendszerek egyidejűleg is megold-
hatjuk. Ezt a módszert szimultán Gauss eliminációnak nevezzük.

15.3 Lineáris egyenletrendszerek megoldhatósága


Kiindulva az általános k egyenletű n ismeretlent tartalmazó

a11 x1 + a12 x2 + ... +a1n xn = b1


a21 x1 + a22 x2 + ... +a2n xn = b2
.. ..
. .
ak1 x1 + ak2 x2 + . . . +akn xn = bk

egyenletrendszerből, előállı́tjuk az egyenletrendszert ún. vektori alakban:

a1 x1 + . . . + an xn = b
15.3. LINEÁRIS EGYENLETRENDSZEREK MEGOLDHATÓSÁGA 123

ahol az ismeretlenek előtt szereplő a1 , a2 , . . . , an ∈ Rk vektorok, illetve b ∈ Rk a


következőképp definiált:
     
a11 a12 a1n
 a21   a22   a2n 
a1 =  .  , a2 =  .  , . . . an =  .  .
     
 ..   ..   .. 
an1 an2 ann
A vektori alak megoldhatóságának kérdése nyilvánvalóan egyenértékű az eredeti
egyenletrendszer megoldhatóságával. Ilyen formában világos, hogy pontosan
akkor oldható meg az egyenletrendszer adott a1 , a2 , . . . , an , b ∈ Rk esetén, ha
b ∈ L(a1 , . . . , an ). Ezt fejezi ki a ranggal megfogalmazva a Kronecker-Capelli
tétel.
Állı́tás. Egy lineáris egyenletrendszer pontosan akkor megoldható, ha
rg(a1 , . . . , an ) = rg(a1 , . . . , an , b).
Bizonyı́tás. Ha az egyenletrendszer megoldható, akkor b ∈ L(a1 , . . . , an ),
ezért L(a1 , . . . , an ) = L(a1 , . . . , an , b), s ı́gy rg(a1 , . . . , an ) = dimL(a1 , . . . , an ) =
dimL(a1 , . . . , an , b) = rg(a1 , . . . , an , b).
Általában L(a1 , . . . , an ) ⊂ L(a1 , . . . , an , b). Ezért, ha a rangok egyenlősége
teljesül, akkor L(a1 , . . . , an ) = L(a1 , . . . , an , b), amiből b ∈ L(a1 , . . . , an )
következik. Tehát vannak olyan α1 , . . . , αn skalárok, hogy a1 α1 + . . . + an αn = b,
vagyis az egyenletrendszer megoldható. Q. E. D.
Megjegyzés.
1. Az egyenletrendszer AX = B mátrixalakját tekintve a tétel feltétele
(rangkritérium) ı́gy fogalmazható át: Az AX = B lineáris egyenletrendszer
pontosan akkor megoldható, ha rgA = rg(A|B), ahol a jobboldali k × (n+ 1)-
es mátrix az egyenletrendszer ún.kibővı́tett mátrixa.
2. Amennyiben a1 , . . . , an generátorrendszere Rk -nak, akkor nyilván min-
den b ∈ Rk esetén megoldható az egyenletrendszer, hiszen ilyenkor
L(a1 , . . . , an ) = Rk .
3. Ha a1 , . . . , an lineárisan független, akkor legfeljebb egy megoldás van,
akármilyen is b. Ilyen esetben tehát az egyenletrendszer nem lehet
határozatlan.
4. Ha az a1 , a2 , . . . , an vektorrendszer bázis Rk -ban (ez csak akkor lehetséges,
ha k = n), akkor az egyenletrendszer határozott, függetlenül b-től. Ugyanis
ilyenkor minden b előállı́tható a megadott a1 , . . . , an vektorokkal, de csak
egyféleképpen.
5. Ha k < n, azaz kevesebb egyenlet van, mint ismeretlen, akkor az
egyenletrendszer nem lehet határozott, hiszen az a1 , . . . , an vektorrendszer
ilyenkor mindenképpen lineárisan függő, ezért ha valamiképp előállı́tható
velük a b vektor, akkor másféleképpen is.
124 15. LINEÁRIS EGYENLETRENDSZEREK

15.4 A lineáris egyenletrendszer megoldáshalmaza


A homogén lineáris egyenletrendszer mindig megoldható, ugyanis x1 = 0, . . . , xn =
0 megoldása. Az a kérdés, hogy ettől a triviálistől különböző megoldás milyen
esetben létezik. Az egyenletrendszer vektori alakja alapján könnyen adódik, hogy
pontosan akkor, ha az a1 , . . . , an vektorrendszer lineárisan függő. Ezt a ranggal
átfogalmazva kapjuk, hogy
Állı́tás. Az a1 x1 +. . .+an xn = 0 homogén lineáris egyenletrendszernek pontosan
akkor létezik triviálistól különböző megoldása, ha rg(a1 , . . . , an ) < n.

Állı́tás. Egy adott homogén lineáris egyenletrendszer megoldásai alteret


alkotnak Rn -ben, melynek dimenziója n − rg(a1 , . . . , an ).
Az állı́tás azt jelenti, hogy elegendő ismerni kellő számú lineárisan független
megoldást, ezekből lineáris kombinációképzéssel tetszőleges megoldás előállı́tható.
A bizonyı́tásnak csak a vázlatát adjuk meg.
Bizonyı́tás. Ha (α1 , . . . , αn ) és (β1 , . . . , βn ) is megoldása az egyenletrend-
szernek, akkor
a1 (α1 + β1 ) + . . . + an (αn + βn ) = (a1 α1 + . . . + an αn ) + (a1 β1 + . . . + an βn ) = 0
miatt (α1 + β1 , . . . , αn + βn ) is megoldás. Hasonlóan látható, hogy a megoldások
halmaza a skalárral való szorzásra nézve is zárt.
A megoldásaltér dimenziójáról szóló összefüggést úgy láthatjuk be, hogy
megkonstruálunk egy bázist, mely a kı́vánt tagszámú. Tekintsük az a1 , . . . , an
vektorrendszer egy maximálisan lineárisan független részrendszérét. Tegyük fel,
hogy ez a1 , . . . , ar . Mivel bármely j = r + 1, . . . , n esetén a1 , . . . , ar , aj lineárisan
függő, aj = α1 a1 + . . . + αr ar . Ez azt jelenti, hogy
uj = (−α1 , . . . , −αr , 0, . . . , 1, . . . , 0) megoldást ad (1 a j-dik helyen áll).
Ezekről a megoldásokról lehet belátni, hogy bázisát alkotják a megoldásaltérnek.
Ugyanis, azonnal látható, hogy lineárisan függetlenek, hiszen mátrixba ı́rva őket,
tartalmazzák az n − r-edrendű egységmátrixot. Másrészt tetszőleges megoldás
előállı́tható ezekből a megadott megoldásokból, nevezetesen egy c = (γ1 , . . . , γn )
megoldás ı́gy állı́tható elő:
c = γr+1 ur+1 + . . . + γn un
Q. E. D.
n
Megjegyzés. Bebizonyı́tható az is, hogy R -ben tetszőlegesen adott altérhez
lehet találni olyan homogén lineáris egyenletrendszert, melynek a megoldáshalma-
za a megadott altér. Természetesen az alterek és a homogén egyenletrendszerek
közti kapcsolat mégsem kölcsönösen egyértelmű, hiszen ekvivalens egyenletrend-
szerekhez azonos megoldásaltér tartozik.
Az inhomogén lineáris egyenletrendszerek vizsgálatához először is minden in-
homogén egyenletrendszerhez hozzárendeljük azt a homogén lineáris egyenletrend-
szert, mely úgy keletkezik az eredetiből, hogy a jobboldali konstansokat nullákkal
helyettesı́tjük. Ennek neve redukált homogén egyenletrendszer.
15.4. A LINEÁRIS EGYENLETRENDSZER MEGOLDÁSHALMAZA 125

Megfigyelhetjük, hogy az eredeti inhomogén egyenletrendszer és a redukált


egyenletrendszere megoldásai között egyszerű kapcsolat áll fenn: Az inhomogén két
megoldásvektorának különbsége megoldása lesz a redukált egyenletrendszernek,
másrészt az inhomogén és a homogén egy-egy megoldásvektorának összege újra az
inhomogén egy megoldását adja. Ezek alapján igaz a következő állı́tás:
Állı́tás. Egy inhomogén lineáris egyenletrendszer megoldáshalmaza a redukált
homogén egyenletrendszere megoldásalterének eltoltja: c + L, ahol c ∈ Rn az
inhomogén egyenletrendszer egy tetszőleges, rögzı́tett (partikuláris) megoldása, L
jelöli a redukált egyenletrendszer megoldásalterét.
Utoljára azokról az egyenletrenszerekről mondunk állı́tásokat, melyek ugyan-
annyi egyenletet tartalmaznak, mint ismeretlent: k = n.
Állı́tás. Egy homogén n ismeretlenes n egyenletből álló lineáris egyenletrendsz-
ernek pontosan akkor van triviálistől különböző megoldása, ha együtthatómátri-
xának determinánsa nulla : |A| = 0.
Az állı́tás abból következik, hogy a1 , . . . , an pontosan akkor lineárisan függő,
ha det (a1 , . . . , an ) = 0.
Állı́tás. Cramer szabály:
Egy n ismeretlenes n egyenletet tartalmazó lineáris egyenletrendszer pontosan
akkor határozott, ha együtthatómátrixának determinánsa nem nulla. Ilyenkor
az egyetlen megoldó szám-n-est a következőképpen kaphatjuk:
di
xi = ,
|A|

ahol di azon mátrix determinánsát jelöli, melyet az együtthatómátrixból úgy


kapunk, hogy az i-dik oszlopot a konstansok oszlopára cseréljük.
Bizonyı́tás. Ha az egyenletrendszer határozott, akkor az a1 , . . . , an vektorok
lineárisan függetlenek, ezért A determinánsa nem nulla.
Fordı́tva, |A| = 6 0 miatt az A mátrix invertálható, ezért az egyenletrendszer
mátrixalakját használva, balról A−1 -el szorozva az egyetlen megoldás X = A−1 B
alakban adódik. Ebből, az inverzmátrix előállı́tási módját kihasználva, majd a
kifejtési tételt, kapjuk, hogy
n n
X Aji 1 X di
xi = bj = Aji bj =
j=1
|A| |A| j=1 |A|

Q. E. D.
126 15. LINEÁRIS EGYENLETRENDSZEREK
16. Euklideszi terek

16.1 A belső szorzat

Ha a valós vektortér eddigi műveletein túl értelmezve van egy ún. belső szorzat,
— amely bármely két vektorhoz egy valós számot rendel, — akkor euklideszi vek-
tortérről beszélünk. Előbb a skalár-n-esek Rn vektorterében értelmezzük a stan-
dard belső szorzatot, megvizsgáljuk tulajdonságait, melyek alapján értelmezhető
ezen euklideszi térben a vektorok normája (hossza), és szöge, illetve merőlegessége
(idegen szóval ortogonalitása). Ezt követően láthatjuk majd, hogy e fogalmak,
melyek a
szabadvektorok terében geometriai értelemben használatosak, az általános euk-
lideszi vektorterekben is értelmezhetők, és analóg tulajdonságokkal rendelkeznek.
Végül a merőleges vetı́tés egy alkalmazását mutatjuk be.
Definı́ció. A valós szám-n-esek körében az x = (x1 , . . . , xn ) és y = (y1 , . . . , yn )
vektorok (standard) belső szorzatán az
(x, y) = x1 y1 + . . . + xn yn
valós számot értjük. Az x = (x1 , . . . , xn ) vektor normájának nevezzük az
p q
||x|| = (x, x) = x21 + . . . + x2n
számot.
A belső szorzatot szokták nevezni skaláris szorzatnak is, a normát pedig a
vektor hosszának.
A belső szorzat nyilvánvalóan teljesı́ti a következő tulajdonságokat:
1. a belső szorzat szimmetrikus:
(x, y) = (y, x) (16.1)

2. mindkét változójában additiv, azaz a műveletek elvégzése és a belső


szorzatképzés sorrendje felcserélhető:
(x + y, z) = (x, z) + (y, z) (16.2)

127
128 16. EUKLIDESZI TEREK

3. a skalár kiemelhető:
(λx, y) = λ(x, y) (16.3)

4. bármely x vektor önmagával képzett belső szorzata pozitı́v, ha x 6= 0.

(x, x) > 0 ∀ x 6= 0 (16.4)

Az utolsó tulajdonság teszi lehetővé a vektor normájának értelmezését.


Állı́tás. Schwarz egyenlőtlenség. Bármely x, y ∈ Rn esetén

|(x, y)| ≤ ||x|| · ||y||

Egyenlőség pontosan akkor teljesül, ha x és y lineárisan függő.


Bizonyı́tás. Az utolsó tulajdonság miatt bármely λ ∈ R esetén

(x + λy, x + λy) ≥ 0

azaz
(x, x) + 2λ(x, y) + λ2 (y, y) ≥ 0
Tehát e λ-ban másodfokú polinom diszkriminánsa D ≤ 0 :

4(x, y)2 − 4(x, x)(y, y) ≤ 0.

ami ekvivalens a bizonyı́tandóval. Ha a Schwarz egyenlőtlenségben az egyenlőség


áll, akkor a diszkrimináns nulla, tehát van gyöke a polinomnak, azaz van olyan λ,
hogy x + λy = 0. Q. E. D.
Állı́tás. Minkowski egyenlőtlenség. Bármely x, y vektor esetén

||x + y|| ≤ ||x|| + ||y||

Egyenlőség pontosan akkor teljesül, ha az egyik vektor a másik nemnegatı́v


számszorosa.
Bizonyı́tás. A norma definı́cióját és a Schwarz egyenlőtlenséget alkalmazzuk:

||x + y||2 = (x + y, x + y) = (x, x) + 2(x, y) + (y, y) ≤ ||x||2 + 2||x|| · ||y|| + ||y||2

Q. E. D.
Megjegyzés.

1. Az utóbbi egyenlőtlenség azt fejezi ki, hogy a normának ugyanolyan


tulajdonsága van, mint az abszolútérték fogalmának a valós számok és a
komplex számok esetében.
16.1. A BELSŐ SZORZAT 129

2. Ezt az állı́tást szokták háromszögegyenlőtlenségként is emlı́teni. Az el-


nevezést az sugallja, hogy ha bevezetjük a vektorok távolságának fogalmát:

d(x, y) = ||x − y||

akkor az egyenlőtlenség ı́gy is kifejezhető:

d(x, z) ≤ d(x, y) + d(y, z)

3. A Schwarz egyenlőtlenség segı́tségével értelmezhetjük a vektorok szögét: A


nullvektortól különböző x, y vektorok szöge az az α szám, melyre

(x, y)
cos α =
||x|| · ||y||

Megjegyzés. A középiskolában megismert szabadvektorok skaláris szorzata


ugyanazon tulajdonságokkal rendelkezik, mint az Rn -ben most bevezetett belső
szorzat. A szabadvektorok körében két vektor skaláris szorzata:

(x, y) = |x| · |y| cos α

ahol |x| a vektor hosszát, α pedig x és y szögét jelöli. A fent jelzett 4 karakterizáló
tulajdonság közűl az additivitás a merőleges vetı́tés tulajdonságaiból adódik,
ugyanis, ha y egységvektor (|y| = 1), akkor (x, y) nem más, mint az x vektor
y irányra eső merőleges vetületének a hossza, előjelesen számı́tva, azaz pozı́tı́v, ha
a merőleges vetület y-nal azonos irányú, illetve ellenkező esetben negatı́v. A többi
tulajdonság nyilvánvalóan teljesül.
Szem előtt tartva Rn fent bevezetett belső szorzatának és a szabadvektorok
skaláris szorzatának tulajdonságait, ezek közös általánosı́tásaként vezetjük be az
euklideszi tér fogalmát:
Definı́ció. Egy E valós vektorteret euklideszi vektortérnek nevezünk, ha
értelmezve van benne a vektorok belső szorzata, amely bármely két vektorhoz
úgy rendel valós számot, hogy teljesüljön az (1)–(4) tulajdonság.
Így speciális euklideszi teret jelent Rn a fent definiált belső szorzattal, illetve
a szabadvektorok tere a skaláris szorzattal. Egy adott vektortéren sokféleképpen
megadható belső szorzat, ezek közül egy kiválasztása jelenti az euklideszi struktúra
megadását. A legfeljebb n-edfokú polinomok vektorterében (vagy a folytonos
függvények vektorterében) a belső szorzat szokásos definı́ciója integrállal történik:
Z 1
(p, q) = p(t)q(t)dt
−1

Megfigyelhettük, hogy az eddigi levezetésekben csakis a belső szorzat 4 definiáló


tulajdonságát használtuk. Tehát az állı́tások bármely euklideszi vektortérben
130 16. EUKLIDESZI TEREK

érvényesek. A polinomok most emlı́tett euklideszi vektorterében pl. a Schwarz


egyenlőtlenség azt jelenti, hogy
Z 1 Z 1 Z 1
| p(t)q(t)dt|2 ≤ p2 (t)dt · q 2 (t)dt
−1 −1 −1

Megjegyzés. Komplex vektortéren is bevezethetünk belső szorzatot, azonban


célszerű módosı́tani a megkı́vánt tulajdonságokat úgy, hogy értelmezhető legyen
a vektorok normája: Komplex vektortéren belső szorzatnak nevezünk egy olyan
megfeleltetést, amely a vektortér bármely két vektorához úgy rendel egy komplex
számot, hogy teljesüljenek a következők:

(y, x) = (x, y)

(x + y, z) = (x, z) + (y, z)
(λx, y) = λ(x, y)
(x, x) ≥ 0 ∀ x 6= 0
Az első tulajdonságban a komplex számok konjugálása szerepel, s ennek fontos
következményei vannak: a második változó esetén a skalár kiemelésekor konjugálás
is történik: (x, λy) = λ(x, y). Másrészt, ebből adódik az is, hogy (x, x) mindig
valós szám, ui. (x, x) = (x, x). A komplex szám-n-esek C n vektorterében a
standard belső szorzat:
(x, y) = x1 y1 + . . . + xn yn
Ezáltal
||x||2 = (x, x) = |x1 |2 + . . . + |xn |2
illetve a Schwarz egyenlőtlenség alakja:

(x1 y1 + . . . + xn yn )2 ≤ (|x1 |2 + . . . + |xn |2 ) · (|y1 |2 + . . . + |yn |2 )

16.2 Ortogonalitás
Definı́ció. Az euklideszi vektortér két x és y vektorát ortogonálisnak mondjuk,
ha (x, y) = 0. Jele: x ⊥ y. Az x ∈ E vektor egységvektor, ha ||x|| = 1.
Egy vektorrendszer ortogonális, ha páronként ortogonális vektorokból áll. Egy
e1 , e2 , . . . , ek vektorrendszer ortonormált, ha ortogonális és egységvektorokból áll.

Ha x és y ortogonális, akkor ||x + y||2 = ||x||2 + ||y||2 . (A Pitagorasz tétel


általánosı́tása) Ugyanis

||x + y||2 = (x + y, x + y) = (x, x) + 2(x, y) + (y, y) = ||x||2 + ||y||2


16.2. ORTOGONALITÁS 131

Az ortonormáltságot kifejezhetjük a következő formulával:

(ei , ej ) = δij

Az ortogonalitás fogalma a merőlegesség általánosı́tása; a szabadvektorok skalá-


ris szorzata esetén ugyanazt jelenti. Ez a fogalom fontos szemléleti módot ad az
általános euklideszi vektorterek vizsgálatában.
Láthatjuk, hogy egy nullvektort nem tartalmazó ortogonális vektorrendszer
mindig lineárisan független. Ugyanis, ha α1 e1 + . . . + αk ek = 0, akkor

0 = (0, ei ) = (α1 e1 + . . . + αk ek , ei ) =

= α1 (e1 , ei ) + . . . + αk (ek , ei ) = αi (ei , ei )


s ı́gy (ei , ei ) 6= 0 miatt αi = 0 adódik minden i = 1, 2, . . . , k-ra. Ebből
adódik, hogy a bázisok között is várhatóan van ortogonális, sőt ortonormált
vektorrendszer. Ortonormált bázisok alkalmazása azért hasznos, mert ilyenkor a
koordinátákkal ugyanúgy lehet számolni, mint Rn -ben. Speciálisan, a koordináta
kiszámolható a belső szorzat segı́tségével. Ha e1 , . . . , en ortonormált bázis E-ben
és x = x1 e1 + . . . + xn en , akkor xi = (x, ei ) minden i = 1, . . . , n-re. Ugyanis

(x, ei ) = (x1 e1 + . . . + xn en , ei ) = x1 (e1 , ei ) + . . . + xn (en , ei ) = xi (ei , ei ) = xi

Továbbá, ha x = x1 e1 + . . . + xn en és y = y1 e1 + . . . + yn en , akkor

(x, y) = (x, y1 e1 + . . . + yn en ) = y1 (x, e1 ) + . . . + yn (x, en ) = x1 y1 + . . . + xn yn

illetve
||x||2 = x21 + . . . + x2n
A szám-n-esek Rn euklideszi vektorterében a természetes bázis nyilvánva-
lóan ortonormált bázist ad meg. A szabadvektorok körében pedig pl. egy
kocka egy csúcsából induló élvektorai határoznak meg ortonormált bázist. Most
megmutatjuk, hogy minden véges dimenziós euklideszi vektortérben van ortonor-
mált bázis.
Állı́tás. Gram–Schmidt ortogonalizálási eljárás
Bármely b1 , b2 , . . . , bn ∈ E bázishoz konstruálható olyan e1 , e2 , . . . , en ortonormált
bázis, melyre L(e1 , . . . , ek ) = L(b1 , . . . , bk ) teljesül minden k = 1, 2, . . . , n-re.
Bizonyı́tás. A konstrukció lényege: legyen e1 = ||bb11 || . Ha e1 , . . . , ek már
ismert, akkor ek+1 -hez a következőképp jutunk. Előbb legyen e′k+1 = bk+1 −
e′
(bk+1 , e1 )e1 − . . . − (bk+1 , ek )ek , majd ek+1 = ||ek+1 . Könnyen ellenőrizhető, hogy
k+1 ||

ı́gy ortonormált vektorrendszerhez, s az utolsó lépésben bázishoz jutunk. Q. E. D.


Definı́ció. Az E euklideszi vektortér egy L alterének ortogonális komplementerén
azon vektorok összességét értjük, melyek ortogonálisak L minden vektorára.
Jelben:
L⊥ = {x ∈ E| | x ⊥ y ∀y ∈ L}
132 16. EUKLIDESZI TEREK

(Magyarul nevezhetnénk merőlegesen kiegészı́tő altérnek is.) Könnyen látható,


hogy L⊥ is altér, ui. ha x1 , x2 ∈ L⊥ , akkor λ1 x1 + λ2 x2 ∈ L⊥ is teljesül, hiszen
(λ1 x1 + λ2 x2 , y) = λ1 (x1 , y) + λ2 (x2 , y) = 0.
Adott L altér esetén tetszőleges x ∈ E vektorhoz egyértelműen található olyan
x′ ∈ L és x′′ ∈ L⊥ , hogy x = x′ + x′′ .
L⊥
x
x′′ .

x′
L

Ugyanis, ha e1 , . . . , ek , ek+1 , . . . , en olyan ortonormált bázis E-ben, hogy


e1 , . . . , ek L-nek bázisa, akkor
x′ = (x, e1 )e1 + . . . + (x, ek )ek ∈ L
x′′ = (x, ek+1 )ek+1 + . . . + (x, en )en ∈ L⊥ .
Ilyen esetben x′ -t az x vektor L altérre eső merőleges vetületének mondjuk. A
merőleges vetület meghatározása bonyolultabb nem ortonormált bázis ismerete
esetén. Tegyük fel, hogy L = L(b1 , b2 , . . . , bk ), s x′ -t x′ = β1 b1 + . . . + βk bk
alakban keressük. Ekkor x − x′ ∈ L⊥ , ezért (bi , x − x′ ) = 0-nak kell teljesülni
minden i = 1, . . . , k esetén. Részletesebben
β1 (b1 , b1 ) + . . . βk (b1 , bk ) = (b1 , x)
..
.
β1 (bk , b1 ) + . . . βk (bk , bk ) = (bk , x)
Ezen inhomogén lineáris egyenletrendszer megoldása útján kapjuk meg a
β1 , . . . , βk együtthatókat, s velük az x′ merőleges vetületvektort.
Az x vektornak az L altértől mért távolságán a
d(x, L) = ||x − x′ ||
értéket értjük. Ez a távolságfogalom is rendelkezik a minimumtulajdonsággal, azaz
d(x, L) = min{||x − l|| | l ∈ L}
ugyanis
||x − l||2 = ||(x − x′ ) + (x′ − l)||2 = ||x − x′ ||2 + ||x′ − l||2 ≥ ||x − x′ ||2
16.3. LEGKISEBB NÉGYZETEK MÓDSZERE 133

16.3 Legkisebb négyzetek módszere


Tegyük fel, hogy a koordinátarendszerben adott (x1 , y1 , ), . . . , (xn , yn ) pont. Azt
keressük, hogy mely y = ax + b egyenes közelı́ti meg ”legjobban” a megadott
pontokat, másszóval mely lineáris függvénykapcsolat közelı́ti meg leginkább a
megadott értékpárokat. A közelı́tés jósága többféleképpen értelmezhető. Egyik
lehetőség az, hogy az
Xn
(yi − (axi + b))2
i=1
eltérésnégyzetösszeget (hibanégyzetösszeget) kı́vánjuk minimalizálni. A lineáris
algebra eszközeivel a következőképpen oldhatjuk meg a problémát: Tekintsük az
x = (x1 , . . . , xn ) ∈ Rn , y = (y1 , . . . , yn ) ∈ Rn és 1 = (1, 1, . . . , 1) ∈ Rn vektorokat,
s az L(x, 1) alteret. Az y vektornak ezen altér egy αx+β1 vektorától való távolsága:
n
X
||y − (αx + β1)|| = [ (yi − (αxi + β))2 ]1/2
i=1

Tudjuk az előzőekből, hogy ez pontosan akkor minimális, ha αx + β1 éppen y-


nak az L(x, 1) altérre eső merőleges vetülete. Az ott ismertetett módszerrel tehát
kiszámı́thatjuk a minimalizáló a, b értékeket. A megoldandó egyenletrendszer
a(x, x) + b(x, 1) = (x, y)
a(1, x) + b(1, 1) = (1, y)
Ebből a megoldás:
(x, y)(1, 1) − (1, y)(x, 1)
a=
(x, x)(1, 1) − (1, x)2
(x, x)(1, y) − (1, x)(x, y)
b=
(x, x)(1, 1) − (1, x)2
(Később a differenciálszámı́tás eszközeit is igénybe vevő módszert is tárgya-
lunk.)
Többváltozós lineáris függvénykapcsolat esetére is alkalmazhatjuk a legkisebb
négyzetek módszerét. Ha több, mondjuk k darab x(1) , . . . , x(k) független változó
menynyiség n féle beállı́tása esetén adottak az egyetlen y függő változó (mért)
értékei, s lineáris k-változós y = a1 x(1) +. . .+ak x(k) +b alakú függvénykapcsolatot
feltételezünk, akkor keressük azon a1 , . . . , ak , b paramétereket, amelyre az
n
(1) (k)
X
(yi − (a1 xi + . . . + ak xi + b))2
i=1

eltérésnégyzetösszeg minimális. Mint az előbb képezzük az Rn -beli x(1) =


(1) (1) (k) (k)
(x1 , . . . , xn ), . . . , x(k) = (x1 , . . . , xn ), 1 = (1, 1, . . . , 1) és y = (y1 , . . . , yn )
vektorokat. A feladat ekvivalens az
||y − (α1 x(1) + . . . + αk x(k) + β1)||
134 16. EUKLIDESZI TEREK

minimalizálásával, melyet — mint már tudjuk, — y-nak az L(x(1) , . . . , x(k) , 1)


altérre eső merőleges vetülete old meg.
17. Lineáris
transzformációk

17.1 Lineáris leképezés, defektus és rang


Vektorterek közötti olyan leképezéseket, amelyek az összeadással és a skalárral
való szorzással ’felcserélhetők’, lineárisnak mondunk. Ezek vizsgálatában fontos,
hogy mely vektorok képződnek a nullvektorba, illetve mely vektorok alkotják
a képteret. Láthatjuk majd, hogy véges dimenziós vektorterek esetén a
lineáris leképezések, illetve transzformációk mátrixszorzással megvalósı́thatók. A
lineáris transzformációk szerkezetének leı́rásában olyan vektorok keresése hasznos,
amelyeket a transzformáció csak megnyújt, de a vektor iránya nem változik meg.
Ha ilyen, ún. sajátvektorokból álló bázis is található a transzformációhoz, akkor
annak hatása egyszerűen leı́rható.
Definı́ció. Legyen V1 és V2 két valós ( vagy mindkettő komplex) vektortér. A
ϕ: V1 → V2 leképezést lineárisnak mondjuk, ha
ϕ(a + b) = ϕ(a) + ϕ(b)
ϕ(λa) = λϕ(a)
teljesül minden a, b ∈ V1 és λ ∈ R (illetve λ ∈ C) esetén. Amennyiben
ϕ bijektı́v is, akkor izomorfizmusról van szó. Ha V1 = V2 , akkor lineáris
transzformációról beszélünk. Ha egy lineáris transzformáció bijektı́v, akkor
regulárisnak (invertálhatónak) nevezzük.
Példák.
1. A közismert geometriai transzformációk majd’ mindegyike lineáris transz-
formációt indukál a szabadvektorok vektorterében. Ilyenek pl. a tér
szabadvektorai esetében a sı́kra történő merőleges vetı́tés, vagy a tengely
körüli forgatás, sı́kbeli vektorok esetén pl. adott pont körüli forgatás, vagy
tengelyes tükrözés.
2. Triviális lineáris transzformációt jelent az identikus transzformáció, mely
minden vektorhoz önmagát rendeli:
id(x) = x

135
136 17. LINEÁRIS TRANSZFORMÁCIÓK

továbbá a zérustranszformáció, amely minden vektorhoz a nullvektort


rendeli:
O(x) = 0

3. Ha az n-dimenziós V vektortéren rögzı́tünk egy bázist, koordinátaleképezés-


nek mondtuk azt a
κ: V → Rn
leképezést, mely minden vektorhoz e rögzı́tett bázisra vonatkozó ko-
ordinátáiból álló szám-n-est rendeli. A koordinátaleképezés nemcsak, hogy
lineáris, hanem bijektı́v is, tehát izomorfizmus.

4. Tekintsük a legfeljebb n-edfokú polinomok Pn vektorterét, és az D: Pn → Pn


transzformációt, mely egy p polinomhoz a p′ deriváltfüggvényt rendeli. A
deriválás tulajdonságai alapján világos, hogy D valóban lineáris transz-
formáció.

Definı́ció. A ϕ: V1 → V2 lineáris leképezés (vagy transzformáció) nullterének


nevezzük azon V1 -beli vektorok összességét, melyeket ϕ a nullvektorba képez:

Ker ϕ = { a ∈ V1 | ϕ(a) = 0 }

A nulltér dimenzióját ϕ defektusának (vagy nullitásának) nevezzük. Jele: def ϕ.


A ϕ(V1 ) képtér dimenzióját ϕ rangjának nevezzük, jele: rg ϕ.

Megjegyzés.

1. Látható, hogy a nulltér valóban altér V1 -ben, és ϕ(V1 ) altér V2 -ben, ezért
beszélhetünk a dimenzióikról. Pl. ha a, b ∈ Ker ϕ, akkor

ϕ(a + b) = ϕ(a) + ϕ(b) = 0 + 0 = 0

miatt a + b ∈ Ker ϕ is teljesül.

2. A fent emlı́tett példák esetében könnyen meghatározhatjuk a nullteret, a


defektust, illetve a rangot. Pl. a sı́kra történő merőleges vetı́tésnél a nulltér
a sı́kra merőleges vektorokból áll, tehát a defektus 1, a képtér pedig a sı́kkal
párhuzamos vektorokból, tehát a rang 2. A differenciálási transzformációnál
a nulltér a konstans polinomokból áll, a defektus 1, a képtér viszont a
legfeljebb (n − 1)-edfokú polinomok vektortere, tehát a rang most n − 1.

3. Egy lineáris leképezés pontosan akkor injektı́v, ha defektusa nulla, azaz a


nulltér csak a nullvektort tartalmazza. Ugyanis ϕ(0) = 0 mindig teljesül,
ezért, ha ϕ injektı́v, akkor ϕ(a) = 0 csak úgy lehet, ha a = 0. Fordı́tva, ha
ϕ(a) = ϕ(b) akkor a linearitási tulajdonság miatt
ϕ(a − b) = 0 s ı́gy a − b = 0, tehát a = b.
17.2. LINEÁRIS TRANSZFORMÁCIÓ MÁTRIXA 137

Az előbbi példákban láthattuk, hogy a defektus és a rang összege V1 dimenzióját


adja. Ez általában is igaz.
Állı́tás. Ha ϕ: V1 → V2 lineáris leképezés, és V1 véges dimenziós, akkor

dim V1 = def ϕ + rg ϕ

Bizonyı́tás. Legyen a1 , . . . , ak bázisa ϕ nullterének (def ϕ = k). Egészı́tsük ki


ezt V1 bázisává az ak+1 , . . . , an vektorokkal. Megmutatjuk, hogy ϕ(ak+1 ), . . . , ϕ(an )
bázisa ϕ(V1 )-nek. Az nyilvánvaló, hogy
ϕ(V1 ) = L(ϕ(a1 ), . . . , ϕ(an )), s ϕ(a1 ) = 0, . . . , ϕ(ak ) = 0 miatt
ϕ(V1 ) = L(ϕ(ak+1 ), . . . , ϕ(an )). Másrészt ϕ(ak+1 ), . . . , ϕ(an ) lineárisan független,
hiszen ha
αk+1 ϕ(ak+1 ) + . . . + αn ϕ(an ) = 0
akkor
ϕ(αk+1 ak+1 + . . . + αn an ) = 0
s ı́gy
αk+1 ak+1 + . . . + αn an ∈ Ker ϕ
azaz
αk+1 ak+1 + . . . + αn an = α1 a1 + . . . + αk ak
Viszont a1 , . . . , an lineáris függetlensége miatt ez csak úgy lehetséges, ha αi =
0 ∀ i = 1, . . . , n. Ezért ϕ(ak+1 ), . . . , ϕ(an ) bázisa ϕ(V1 )-nek, tehát rg ϕ = n − k =
dim V1 − def ϕ. Q. E. D.

17.2 Lineáris transzformáció mátrixa

Definı́ció. A ϕ: V → V lineáris transzformáció b1 , . . . , bn bázisra vonatkozó


mátrixán azt az n-edrendű kvadratikus Mϕ mátrixot értjük, melynek j-dik
oszlopában a ϕ(bj ) képvektornak a b1 , . . . , bn bázisra vonatkozó koordinátái állnak.

 
x1
A transzformáció mátrixának jelentése a következő: ha az X =  ... 
 

xn
oszlopmátrixba ı́rjuk a tetszőleges
  x ∈ V 1 vektor b 1 , . . . , b n bázisra vonatkozó
y1
koordinátáit, illetve Y =  ...  oszlopmátrixba a ϕ(x) képvektor koordinátáit,
 

yn
akkor
Y = Mϕ · X
138 17. LINEÁRIS TRANSZFORMÁCIÓK

azaz bázis rögzı́tése útján a koordináták alkotta oszlopvektorok vektorterében a


transzformáció hatása mátrixszorzással valósul meg. Ugyanis Mϕ = (αij ) jelöléssel
X X X X X XX
yi bi = ϕ(x) = ϕ( xj bj ) = xj ϕ(bj ) = xj ( αij bi ) = ( αij xj )bi .
i j j j i i j

Emiatt azt is mondjuk, hogy az Mϕ mátrix reprezentálja a ϕ transzformációt (a


rögzı́tett bázisban).
Ha ϕ: Rn → Rn tı́pusú lineáris transzformáció és a természetes bázist rögzı́tjük,
akkor ϕ mátrixának oszlopaiban egyszerűen a természetes bázisban szereplő
vektorok képvektorai állnak. Ilyenkor, Rn elemeit oszlopvektorként kezelve, ϕ
ténylegesen azonos a mátrixával való szorzással:
   
x1 x1
ϕ  ...  = Mϕ  ... 
   

xn xn
A mátrixreprezentáció a következő — egyszerűen igazolható — tulajdonságokkal
rendelkezik:
Állı́tás. Ha ϕ és ψ két lineáris transzformáció, akkor

Mϕ+ψ = Mϕ + Mψ

Mϕ◦ψ = Mϕ · Mψ
ahol ϕ + ψ és ϕ ◦ ψ jelentése

(ϕ + ψ)(x) = ϕ(x) + ψ(x) ∀ x ∈ V

(ϕ ◦ ψ)(x) = ϕ(ψ(x)) ∀ x ∈ V
Továbbá
ϕ reguláris ⇐⇒ Mϕ invertálható mátrix.

Ha megváltoztatjuk a kiinduláskor rögzı́tett bázist, akkor megváltozik a lineáris


transzformáció mátrixa is. Az eredeti és az új bázisra vonatkozó mátrixok közöttti
kapcsolatot fejezi ki a most következő állı́tás:
Állı́tás. Ha a1 , . . . , an és b1 , . . . , bn két bázis V -ben, s ϕ: V → V egy lineáris
transzformáció,melynek az adott bázisokra vonatkozó mátrixai MϕA és MϕB akkor

MϕB = S −1 MϕA S

ahol az S mátrix a bázisok közötti átmenetet leı́ró azon mátrix, melynek j-dik
oszlopában bj -bek az a1 , . . . , an bázisra vonatkozó koordinátái állnak.
Bizonyı́tás. Legyen MϕA = (αij ), MϕB = (βij ), S = (sij ). Ekkor
X X X XX
ϕ(bj ) = βkj bk = βkj ( sik ai ) = ( sik βkj )ai
k k i i k
17.3. SAJÁTÉRTÉK-PROBLÉMA 139

másrészt
X X X X XX
ϕ(bj ) = ϕ( skj ak ) = skj ϕ(ak ) = skj ( αik ai ) = ( αik skj )ai
k k k i i k

Így bármely i, j = 1, 2, . . . , n esetén k sik βkj = k αik skj , azaz SMϕB = MϕA S.
P P
S invertálhatóságát felhasználva — melyet most nem igazolunk — kapjuk a
bizonyı́tandót. Q. E. D.
Megjegyzés.

1. Két n-edrendű kvadratikus A és B mátrixot hasonlónak szoktak nevezni, ha


van olyan S invertálható mátrix, hogy B = S −1 AS. Ezzel a fogalommal
állı́tásunk úgy is kifejezhető, hogy egy lineáris transzformáció két bázisra
vonatkozó mátrixai hasonlók.

2. Bizonyos értelemben ez utóbbi kijelentés megfordı́tható, de nem bizonyı́tjuk:


Ha A és B hasonlók, akkor van olyan lineáris transzformáció, melynek
bizonyos bázisokra vonatkozó mátrixai éppen A és B.

17.3 Sajátérték-probléma

Definı́ció. A ϕ: V → V lineáris transzformáció sajátvektorának nevezzük azt


az a 6= 0 vektort, melyre ϕ(a) = λa. Az itt fellépő λ-át a transzformáció
sajátértékének mondjuk.
Világos, hogy ha a sajátvektor, akkor αa is az, mégpedig ugyanazzal a λ-val:

ϕ(αa) = αϕ(a) = α(λa) = λ(αa).

Egy adott λ-hoz tartozó sajátvektorok, kiegészı́tve a nullvektorral, alteret


alkotnak, melyet a λ-hoz tartozó sajátaltérnek nevezünk. A

ϕ(a) = λa ⇐⇒ (ϕ − λid)(a) = 0

átalakı́tás alapján láthatjuk, hogy a λ-hoz tartozó sajátaltér éppen a


Ker (ϕ − λid) nulltér.
Példa. A sı́kban a tengelyes tükrözésnek pl. két sajátértéke van: 1 és −1.
Az 1-hez tartozó sajátvektorok a tengellyel párhuzamos vektorok, mı́g a (−1)-hez
tartozók a tengelyre merőlegesek. Nincs viszont egyetlen egy sajátértéke sem pl. a
pont körüli forgatásnak, ha a forgatás szöge nem 180◦ vagy annak többszöröse.
Az optimális az volna — de általában ez egyáltalán nincs ı́gy — ha
a transzformációhoz lehetne találni sajátvektoraiból álló bázist. (Az ilyen
transzformációkat egyszerűnek vagy diagonalizálhatónak nevezzük.) Ugyanis,
sajátvektorokból álló bázisra vonatkozó mátrix diagonális (a főátlón kı́vül
mindenütt nulla áll), és a főátlóban éppen a sajátértékek állnak, s erre a bázisra
140 17. LINEÁRIS TRANSZFORMÁCIÓK

vonatkozó koordinátákkal reprezentálva, a vektorokat a transzformáció hatása


nagyon egyszerű:
ϕ
(x1 , . . . , xn ) 7→ (λ1 x1 , . . . , λn xn )
Rögzı́tsük most V egy tetszőleges b1 , . . . , bn bázisát, és tekintsük ϕ-nek erre
a bázisra vonatkozó mátrixát, jelölje A, továbbá az a vektor koordinátáit
tartalmazza az X oszlopvektor. Az identikus transzformáció mátrixa E. Az
(ϕ − λid)(a) = 0 összefüggés ekkor a mátrixokkal ı́gy ı́rható le:
(A − λE)X = O.
A keresendő a sajátvektor x1 , . . . , xn koordinátáira nézve ez egy homogén lineáris
egyenletrendszer, melynek — mint tudjuk — pontosan akkor van triviálistól
különböző megoldása, ha az együttható mátrixának determinánsa nulla:
det (A − λE) = 0.
Ez azt jelenti, hogy λ pontosan akkor sajátértéke ϕ-nek, ha teljesül a fenti
ún. karakterisztikus egyenlet. A baloldalán szereplő n-edfokú polinomot ϕ
karakterisztikus polinomjának nevezzük. Ennek alapján fogalmazhatunk ı́gy is:
Állı́tás. A ϕ: V → V lineáris transzformációnak λ pontosan akkor sajátérté-
ke, ha gyöke ϕ karakterisztikus polinomjának, azaz megoldása a karakterisztikus
egyenletnek.

Megjegyzés.
1. ϕ karakterisztikus polinomja nem függ attól, hogy mely bázist rögzı́tettük
kiindulásul. Ui. különböző bázisra vonatkozó mátrixai hasonlók: B =
S −1 AS, s ı́gy
det (B − λE) = det (S −1 AS − λE) = det (S −1 (A − λE)S) =
1
det S −1 det (A − λE)det S = det (A − λE)det S = det (A − λE).
det S
2. Szokás beszélni egy A mátrix karakterisztikus polinomjáról, illetve saját-
értékeiről, ami nem zavaró, hiszen az A mátrixszal való szorzás lineáris
transzformációt jelent Rn -ben.
3. A sajátérték mindig annak a számtestnek eleme, mely felett a V vektortér
értelmezett. Ezért valós vektortér esetén a karakterisztikus polinomnak csak
a valós gyökei lesznek sajátértékek.
4. Komplex vektortér esetén mindig van sajátértéke bármely lineáris transz-
formációnak, hiszen a karakterisztikus polinomnak mindig van gyöke a komp-
lex számok körében.
5. Mivel egy polinomnak legfeljebb annyi gyöke van, mint amennyi a fokszáma,
n-dimenziós téren értelmezett lineáris transzformációnak legfeljebb n db
különböző sajátértéke van.
17.3. SAJÁTÉRTÉK-PROBLÉMA 141

A sajátértékek és a sajátvektorok megkeresése a fentiek alapján a következőkép-


pen történhet: Tekintjük a transzformáció valamely bázisra vonatkozó mátrixát, s
kiszámı́tjuk vele a transzformáció karakterisztikus polinomját, majd megkeressük
ennek gyökeit, ezek lesznek a transzformáció sajátértékei. Az egyes sajátértékekhez
tartozó sajátvektorokat (sajátalteret) pedig az

(A − λE)X = O.

homogén lineáris egyenletrendszer megoldása útján kapjuk.


142 17. LINEÁRIS TRANSZFORMÁCIÓK
18. Az euklideszi terek
transzformációi

Ebben a fejezetben definiáljuk a szimmetrikus és ortogonális mátrixokat, illetve


ezek segı́tségével az euklideszi terek szimmetrikus és ortogonális transzformációit.
Az első transzformációosztály szerepe a kvadratikus formák vizsgálatában fontos,
a második pedig az euklideszi struktúrával kompatibilis: belső szorzat és nor-
matartó. Megmutatjuk, hogy a szimmetrikus transzformációk mindig egyszerűek
(diagonalizálhatók), sőt ortonormált, sajátvektoraiból álló bázis is található. Az
ortogonális transzformációk struktúrája nem ilyen egyszerű, de tulajdonképpen az
elemi geometriai transzformációkból bármely ortogonális transzformáció előállı́tható.

18.1 Szimmetrikus és ortogonális mátrixok


Definı́ció. Egy n-edrendű kvadratikus A mátrix szimmetrikus, ha AT = A,
illetve ortogonális, ha AT = A−1 , ahol AT az A mátrix transzponáltját jelenti
(azaz, AT (i, j)-dik eleme azonos A (j, i)-dik elemével).

Megjegyzés.

1. Egy mátrix ortogonalitása úgy is kifejezhető, hogy AT ·A = E. Ha A1 , . . . , An


jelöli az A mátrix oszlopvektorait, akkor a mátrixszorzás fogalmát figyelembe
véve AT · A elemei valójában az (Ai , Aj ) belső szorzatokat jelentik, vagyis
ortogonális mátrix esetén az oszlopvektorok ortonormált vektorrendszert
alkotnak Rn -ben.
(Ai , Aj ) = δij
Ez a tulajdonság nyilván elegendő is a mátrix ortogonalitásához.

2. Két példa ortogonális mátrixra:


   
cos α − sin α 1 0
sin α cos α 0 −1

Az első a forgatás mátrixa, a második a tükrözésé.

143
144 18. AZ EUKLIDESZI TEREK TRANSZFORMÁCIÓI

3. Ortogonális mátrix determinánsa 1 vagy −1. Ugyanis, a determinánsok


szorzástétele kihasználásával kapjuk, hogy

1 = det E = det (AT A) = det AT · det A = (det A)2

amiből kijelentésünk következik. Könnyű példát mutatni viszont arra, hogy


a megfordı́tás nem igaz: ha egy mátrix determinánsa ±1, akkor nem biztos,
hogy ortogonális.
4. Az ortogonális mátrixok egyik fontos szerepe abban mutatkozik meg, hogy
ha egy ortonormált bázisról térünk át egy másik ortonormált bázisra, akkor
a bázistranszformáció mátrixa ortogonális. Legyen ugyanis S = (sij ) az
a1 , . . . , an → b1 , . . . , bn ortonormált bázisok transzformációját leı́ró mátrix:
n
X
bj = sij ai
i=1

Ekkor
Xn n
X
δij = (bi , bj ) = ( ski ak , slj al ) =
k=1 l=1
n
X n
X n
X
= ski slj (ak , al ) = ski slj δkl = ski skj = (S T S)ij
k,l=1 k,l=1 k=1

tehát S T S = E.
Belátható az is hasonlóan, hogy ha egy ortonormált bázist ortogonális
mátrixszal transzformálunk, akkor a kapott új bázis is ortonormált.

18.2 Szimmetrikus és ortogonális transzformációk


Definı́ció. Az E euklideszi vektortér egy ϕ: E → E lineáris transzformációját
szimmetrikusnak, illetve ortogonálisnak mondunk, ha valamely ortonormált
bázisra vonatkozó mátrixa szimmetrikus, illetve ortogonális.

Megjegyzés.
1. Ha egy lineáris transzformáció valamely ortonormált bázisra vonatkozó
mátrixa szimmetrikus (ortogonális), akkor bármely más ortonormált bázisban
is az. Ugyanis, ortonormált bázisok cseréje esetén a bázistranszformációt
leı́ró S mátrix ortogonális. Így ha A szimmetrikus, akkor B = S −1 AS =
S T AS is szimmetrikus, hiszen

B T = (S T AS)T = S T AT S = S T AS = B.

Hasonlóan, ha A ortogonális, akkor B = S T AS is az, hiszen

B T B = (S T AS)T (S T AS) = S T AT SS T AS = S T AT AS = E
18.2. SZIMMETRIKUS ÉS ORTOGONÁLIS TRANSZFORMÁCIÓK 145

Ez azt jelenti, hogy a lineáris transzformációk szimmetrikusságát és


ortogonalitását kijelölő feltétel korrekt: független az ortonormált bázis
megválasztásától.
2. Nem ortonormált bázisra vonatkozóan a szimmetrikus (ortogonális) transz-
formáció mátrixa általában nem szimmetrikus (ortogonális).

Állı́tás. Szimmetrikus transzformáció esetén

(ϕ(x), y) = (x, ϕ(y))

teljesül minden x, y ∈ E-re.


Bizonyı́tás. Legyen e1 , . . . , en egy ortonormált bázisa E-nek, s
x = x1 e1 + . . . + xn en , illetve y = y1 e1 + . . . + yn en . Ekkor
X X X X
(ϕ(x), y) = (ϕ( xi ei ), yj ej ) = ( xi ϕ(ei ), yj ej ) =
i j i j

X X X
= xi yj (ϕ(ei ), ej ) = xi yj ( αki ek , ej ) =
ij ij k
X X X
= αki xi yj (ek , ej ) = αki xi yj δkj = αji xi yj
ijk ijk ij

Másrészt hasonlóan kapjuk, hogy


X
(x, ϕ(y)) = αij xi yj
ij

ahol A = (αij ) jelöli ϕ mátrixát. A szimmetriája alapján következik állı́tásunk.


Q. E. D.
Most megmutatjuk, hogy a szimmetrikus transzformáció egyszerűek, másszóval
diagonalizálhatók.
Állı́tás. A véges dimenziós E euklideszi vektortér bármely szimmetrikus
transzformációjához van sajátvektoraiból álló ortonormált bázis.
Bizonyı́tás. Először azt mutatjuk meg, hogy a szimmetrikus transzformációnak
van sajátértéke, mely természetesen valós szám. Tekintsük ϕ-nek valamely
ortonormált bázisra vonatkozó A mátrixát. Ekkor az A mátrix nemcsak Rn -en
ad meg egy transzformációt, hanem a komplex szám-n-esek C n vektorterén is.
Ennek az A: C n → C n transzformációnak — mint minden komplex vektortéren
értelmezett lineáris transzformációnak — van komplex λ = α + iβ sajátértéke, s
hozzátartozó z ∈ C n sajátvektora. Természetesen z ∈ C n is fölbontható valós és
képzetes részére: z = u + iv, ahol u, v ∈ Rn . Mivel z 6= 0 sajátvektor: Az = λz,
ezért

Au + iAv = A(u + iv) = (α + iβ)(u + iv) = (αu − βv) + i(αv + βu)


146 18. AZ EUKLIDESZI TEREK TRANSZFORMÁCIÓI

Ebből kapjuk, hogy


Au = αu − βv
Av = αv + βu
A szimmetrikus, tehát (Au, v) = (u, Av). Behelyettesı́tve

(Au, v) = (αu − βv, v) = α(u, v) − β(v, v)

(u, Av) = (u, αv + βu) = α(u, v) + β(u, u)


Ezért β((u, u) + (v, v)) = 0, s ebből β = 0 adódik, hiszen z 6= 0. Tehát λ valós
szám, s mint ϕ karakterisztikus polinomjának gyöke, ϕ-nek sajátértéke.
Másodjára megmutatjuk, hogy van sajátvektorokból álló ortonormált bázis. A
bizonyı́tás a tér dimenziója szerinti teljes indukcióval történik. n = dim E =
1 esetén az állı́tás nyilvánvalóan teljesül. Ha n > 1, akkor legyen e1 az
előbb igazoltan létező λ sajátértékhez tartozó egységnyi normájú sajátvektor.
Tegyük fel, hogy n-nél kisebb dimenziójú euklideszi téren értelmezett szimmetrikus
transzformációhoz van ortonormált sajátvektoraiból álló bázis. Tekintsük most
L(e1 ) ortogonális komplementerét: L = L(e1 )⊥ . Az L-ből választott vektorok
képei is L-ben vannak, hiszen ha l ∈ L, akkor

(ϕ(l), e1 ) = (l, ϕ(e1 )) = (l, λe1 ) = λ(l, e1 ) = 0.

Ezért ha ϕ-t csak L-en tekintjük, akkor egy n − 1 dimenziós euklideszi


tér szimmetrikus transzformációját kapjuk, melyhez feltevésünk szerint van ϕ
sajátvektoraiból álló e2 , . . . , en bázis. Ezt e1 -gyel kiegészı́tve kapjuk E ortonormált
bázisát, mely ϕ sajátvektoraiból áll. Q. E. D.
Következmény. A szimmetrikus mátrixok diagonalizálhatók, sőt ortogonális
mátrixszal, azaz bármely szimmetrikus A mátrixhoz van olyan S ortogonális
mátrix, hogy S T AS diagonális.
Ugyanis, az A mátrix egy szimmetrikus transzformációt jelent Rn -en, melyhez
a tétel szerint van e′1 , . . . , e′n sajátvektorokból álló ortonormált bázis. E bázisban a
transzformáció B mátrixa diagonális. A természetes bázisról az e′1 , . . . , e′n bázisra
való áttérés mátrixát S-sel jelölve (ahol S ortogonális) B = S T AS.
Az ortogonális transzformációk megtartják a vektorok belső szorzatát és
normáját.
Állı́tás. Ha ϕ ortogonális transzformáció a véges dimenziós euklideszi
vektortéren, akkor bármely ortonormált bázis képe is ortonormált bázis. Továbbá

(ϕ(x), ϕ(y)) = (x, y)

s következésképpen
kϕ(x)k = kxk
18.3. KVADRATIKUS FORMÁK 147

Bizonyı́tás. Legyen e1 , . . . , en egy ortonormált bázis.


X X X
(ϕ(ei ), ϕ(ej )) = ( αki ek , αlj el ) = αki αlj (ek , el ) =
k l k,l

X X
= αki αlj δkl = αki αkj = δij
k,l k

Ha x = x1 e1 + . . . + xn en és y = y1 e1 + . . . + yn en , akkor
X X
(ϕ(x), ϕ(y)) = ( xi ϕ(ei ), yj ϕ(ej )) =
i j

X X X X X
= xi yj (ϕ(ei ), ϕ(ej )) = xi yj δij = xi yi = (x, y)
i j i j i

Q. E. D.
Megjegyzés.

1. Ortogonális transzformációnak — ha van sajátértéke, — akkor az csak 1


vagy −1 lehet. Ugyanis ha ϕ(x) = λ(x), akkor

kxk = kϕ(x)k = kλxk = |λ|kxk

2. Az állı́tásban mondott feltételek mindegyike nemcsak szükséges, hanem


elegendő is ahhoz, hogy egy lineáris transzformáció ortogonális legyen.

3. A fentiekből is adódik, hogy a geometriai transzformációk közül minda-


zok ortogonális transzformációt jelentenek, amelyek a vektorok hosszát nem
változtatják meg: a forgatás, a tengelyes tükrözés, az identikus transz-
formáció. Igazolható az is, hogy ha az euklideszi vektortér dimenziója 2,
akkor más ortogonális transzformáció nincs is.

4. n > 2 esetén természetesen az ortogonális transzformációk struktúrája


összetettebb. Ekkor az igazolható, hogy az ortogonális transzformáció-
hoz olyan e1 , . . . , en ortogonális bázis található, melyre vonatkozóan a
transzformáció mátrixa ún. kvázi-diagonális, azaz olyan, hogy az átlón 1−
és 2-odrendű tömbök helyezkednek el, másutt csupa nulla, s az elsőrendű
tömbökben +1 vagy −1 áll, a másodrendű tömbök pedig pont körüli
forgatások mátrixai.

18.3 Kvadratikus formák

Definı́ció. Legyen A szimmetrikus n-edrendű mátrix. A Q(x) = (Ax, x)


leképezést Rn -en értelmezett kvadratikus formának nevezzük.
148 18. AZ EUKLIDESZI TEREK TRANSZFORMÁCIÓI

A kvadratikus formákat gyakran kvadratikus alakoknak is mondják. A


definı́ciót ı́rhatjuk Q(x) = xT Ax formában is, ha x-et oszlopvektorként kezeljük.
Ha az e1 , . . . , en természetes bázis helyett más e′1 , . . . , e′n ortonormált bázist
tekintünk, akkor az x vektornak az új bázisra vonatkozó x′ koordinátáira x′ = S T x,
azaz x = Sx′ . Így

Q(x) = (Sx′ )T ASx′ = (x′ )T S T ASx′ .

Ez azt jelenti, hogy a Q kvadratikus forma e′1 , . . . , en ′ bázisra vonatkozó előállı́tása


az S T AS mátrixszal történik. Az új bázisra való áttérés azért válhat szükségessé,
hogy a kvadratikus forma következő tulajdonságait felismerhessük:
Definı́ció. A Q kvadratikus forma pozitı́v definit, ha Q(x) > 0 minden x 6= 0-
ra, illetve pozı́tı́v szemidefinit, ha Q(x) ≥ 0 minden x ∈ Rn -re. Q negatı́v
(szemi)definit, ha −Q pozitı́v (szemi)definit.
A definitség eldöntését megkönnyı́ti, ha a kvadratikus formához olyan bázis
ismert, melyre vonatkozóan a mátrixa diagonális. Ekkor ugyanis

Q(x) = λ1 x′1 2 + . . . + λn x′n 2

azaz Q(x) előállı́tásában csak négyzetek szerepelnek. Az ilyen alakot kanonikus


alaknak mondjuk, a hozzátartozó bázist pedig a kvadratikus forma kanonikus
bázisának. A kanonikus alak alapján már látható, hogy Q pontosan akkor pozitı́v
definit, ha λi > 0 minden i = 1, . . . , n esetén.
Többféle módszer ismeretes kanonikus bázis megkeresésére, ezek közül most
csak egyet ismertetünk. Azonban belátható, hogy a kapott kanonikus alakban
szereplő pozitı́v és negatı́v együtthatójú tagok száma nem függ a kanonikus alakra
hozás módszerétől. (Ezt nevezik tehetetlenségi törvénynek.)
Állı́tás. Bármely Rn -en értelmezett kvadratikus formához van ortonormált
kanonikus bázis, s az ehhez tartozó kanonikus alakban szereplő együtthatók a
kvadratikus forma A mátrixának sajátértékei.
Bizonyı́tás. Mivel Q mátrixa szimmetrikus, egy szimmetrikus transzformációt
határoz meg Rn -en, melyről tudjuk, hogy létezik hozzá sajátvektorokból álló
ortonormált bázis. Ez az e′1 , . . . , e′n bázis kanonikus bázisa Q-nak, hiszen Q-nak
és a transzformációnak erre vonatkozó mátrixa ugyanaz az S T AS mátrix, mely
diagonális. Q. E. D.
A bizonyı́tásból látható, hogy Q kanonikus bázisa az A által indukált
transzformáció sajátvektoraiból álló ortonormált bázissal egyezik meg.
19. Lineáris programozás

A lineáris programozás alapfeladata — és variánsai — az optimumkeresés számos


esetében föllép a gazdasági alkalmazások területén. Nézzünk erre egy egyszerű
példát!
Tegyük fel, hogy egy vállalat n féle terméket gyárt, s ehhez k féle különféle
forrást (nyersanyagokat, energiát, munkaerőt,stb.) használ fel. aij jelölje az i-dik
forrásból egy darab j-dik termék előállı́tásához szükséges forrás mennyiségét, bi
jelentse az i-dik forrásból rendelkezésre álló összes mennyiséget, és cj pedig a j-
dik termék egységárát. Jelölje xj a j-dik termékből gyártott mennyiséget (ez az
ismeretlen).
A feladat az, hogy megkeressük azokat az x1 , x2 , . . . , xn értékeket, amelyeknél
a vállalat árbevétele maximális. Az árbevétel a
n
X
cj xj
j=1

képlettel adódik, ezt célfüggvénynek nevezzük. Mivel a j-dik termékből xj meny-


nyiséget gyártunk, ahhoz az i-dik forrásból összesen
n
X
aij xj
j=1

szükséges, s ez nem lehet több, mint a rendelkezésre álló bi forrásmennyiség.


Ez azt jelenti, hogy a célfüggvényt a
n
X
aij xj ≤ bi i = 1, 2, . . . , k
j=1

xj ≥ 0 j = 1, 2, . . . , n

korlátozó feltételek mellett kell maximalizálnunk.


A példánkban leı́rt gyakorlati problémát könnyen átalakı́thatjuk néhány
segédváltozó, ún. hiányváltozók bevezetésével a következő standard problémára:
Legyen A = (aij ) egy k × n-es mátrix, c egy n komponensű oszlopvektor, b egy k

149
150 19. LINEÁRIS PROGRAMOZÁS

komponensű oszlopvektor és az x oszlopvektor tartalmazza az ismeretlen x1 , . . . , xn


változókat! Határozzuk meg az
Xn
cj xj
j=1

célfüggvény maximumát a
Ax = b, x≥0
feltételek mellett. Bevezetjük még a következő jelöléseket. Az A mátrix osz-
lopvektorait a1 , a2 , . . . , an jelöli, és feltesszük, hogy az A mátrix rangja r. Az
Ax = b lineáris egyenletrendszer azon megoldásait, amelyek a teljesı́tik a x ≥ 0
feltételt, megengedhető vagy lehetséges megoldásnak nevezzük. Ezek halmaza

M = {x ∈ Rn | Ax = b, x ≥ 0 }.

Az oszlopvektorok által generált altér egy bázisát, azaz A oszlopainak egy r tagú
lineárisan független ai1 , . . . , air részrendszerét megengedett bázisnak nevezzük, ha
van hozzá olyan megengedhető x = (x1 , . . . , xn ) megoldás, hogy xj = 0 minden
j 6= is , s = 1, 2, . . . , r esetén. Az ilyen x megoldást az adott megengedett
bázishoz tartozó bázismegoldásnak nevezzük. A megengedett bázis degenerált,
ha a hozzátartozó bázismegoldásban legalább egy xis elem nulla. A megengedett
bázist és a hozzátartozó bázismegoldást optimálisnak mondjuk, ha a célfüggvény
ennél a bázismegoldásnál maximális értékű, tehát az optimális megoldást v-vel
jelölve
cT v = max cT x.
x∈M

Könnyen látható, hogy egy megengedett bázis egyértelműem meghatározza


a megfelelő bázismegoldást, másszóval csak egy bázismegoldás tartozik egy
megengedett bázishoz.
A) A továbbiakban feltesszük, hogy van megengedhető megoldás. Először is
belátjuk, hogy ilyenkor mindig van bázismegoldás is. Ugyanis, ha y = (y1 , . . . , yn )
egy megengedhető megoldás, akkor tegyük fel az egszerűbb ı́rásmód kedvéért, hogy
ennek első l eleme pozitı́v, a többi nulla:

y1 a1 + . . . + yl al = b. (19.1)

Ha a1 , . . . , al lineárisan független, akkor bázismegoldásról van szó. Ha viszont


lineárisan függők, akkor vannak olyan nem csupa nulla λ1 , . . . , λl együtthatók,
hogy
λ1 a1 + . . . + λl al = 0.
Ezen együtthatók közül némelyek pozitı́vak. (Ha nem ez nem teljesülne, akkor
(−1)-gyel beszorozzuk az összefüggést.) A pozitı́v λi -k esetén képezzük a λyii
hányadosokat és tekintsük ezek közül a legkisebbet:
yj yi
= min ,
λj λi >0 λi
151

és fejezzük az aj vektort az utóbbi összefüggésből:


l
X λi
aj = − ai . (19.2)
λj
i=1,i6=j

Ezt behelyettesı́tve az (19.1) egyenletünkbe, azt kapjuk, hogy


l
X λi
(yi − yj )ai = b.
λj
i=1,i6=j

A minimális hányados kiválasztása miatt itt mindegyik együttható nemnegatı́v, s


ezért azok szintén megengedhető megoldást adnak, de ennek a megoldásnak már
legfeljebb csak l − 1 nullától különböző eleme van. Ha az
a1 , . . . , aj−1 , aj+1 , . . . , al vektorok lineárisan függetlenek, akkor bázismegoldás-
hoz jutottunk. Ha nem, akkor eljárásunk újbóli alkalmazásával elhagyhatunk
egy újabb olyan vektor, amely függőséget okoz, s ezt szükség esetén többször
alkalmazva végül lineárisan független vektorrendszerhez jutunk, amelyhez már
bázismegoldás tartozik.
B) Mostantól csak a bázismegoldásokkal foglalkozunk, s megmutatjuk, hogyan
kaphatunk egy megengedett bázisból egy másikat egyetlen vektornak a kicserélé-
sével.
Állı́tás. Legyen a1 , . . . , ar egy megengedett bázisa a lineáris programozási
standard feladatnak, s tegyük fel, hogy a hozzátartozó bázismegoldás
x = (x1 , . . . , xr , 0, . . . , 0) alakú:

x1 a1 + . . . + xr ar = b, x ≥ 0. (19.3)

Fejezzük A összes többi oszlopát a megengedett bázissal:


r
X
ah = λih ai , h = r + 1, . . . , n. (19.4)
i=1

Tegyük fel, hogy valamely rögzı́tett h-ra λ1h , . . . , λrh között vannak pozitı́v
számok, s legyen
xj xi
= min .
λjh λih >0 λih

Ekkor
a1 , . . . , aj−1 , ah , aj+1 , . . . , ar (19.5)
is megengedett bázis.
Bizonyı́tás. Először is belátjuk, hogy az új vektorrendszer lineárisan független.
Tegyük fel az ellenkezőjét, azaz hogy velük a nullavektort egy nemtriviális lineáris
kombinációval előállı́thatjuk. E lineáris kombinációban aj együtthatója nem lehet
nulla, mert akkor a többi vektor lineárisan függő vektorrendszer lenne. Ezért
152 19. LINEÁRIS PROGRAMOZÁS

ah kifejezhető az a1 , . . . , aj−1 , aj+1 , . . . , ar vektorokkal, de lineáris függetlenségük


miatt csak egyféleképpen. Ez viszont λjh = 0-t jelentené, ami lehetetlen ah
kiválasztási szabálya miatt.
Megmutatjuk, hogy az új vektorrendszer valóban megengedett bázis, azaz a
hozzátartozó megoldás megengedhető. Fejezzük ki aj -t a (19.4) összefüggésből:
r
1 X λih
aj = ah − ai .
λjh λjh
i=1,i6=j

Helyettesı́tsük be ezt a (19.3) egyenletbe:


r  
X λih xj
xi − xj ai + ah = b.
λjh λjh
i=1,i6=j

Innen kiolvashatjuk az új megoldást.


λih
x′i = xi − xj , i =, 1 . . . , r, i 6= j
λjh
xj
x′h =
λjh
x′i = 0 egyébként.

Ennek minden komponense nemnegatı́v: ha λih > 0, akkor a j index kiválasz-


tása miatt, ha pedig nempozitı́v, akkor az új komponens xi -nél is nagyobb, ezért
nemnegatı́v. Q. E. D.
A bizonyı́tásban láthattuk, hogy a b vektor koordinátái (a megoldás) hogyan
adódik az új megengedett bázisban. Figyeljük meg most, hogyan változnak A
oszlopvektorainak koordinátái. Helyettesı́tsük be a (19.4) összefüggésekbe aj
(19.2) kifejezését, ezt kapjuk:
r  
X λik λjh
ah = λih − λjh ai + ak .
λjk λjk
i=1,i6=j

Most egy olyan feltételt fogalmazunk meg, mely teljesülése esetén a célfüggvény
növekszik.
Állı́tás. Az előző állı́tás feltételeit és jelöléseit magtartva, az a1 , . . . , ar megen-
gedett bázisról térjünk át a (19.5) új megengedett bázisra, az utóbbihoz tartozó
bázismegoldást jelölje x′1 , . . . , x′n . Ha
r
X
dh = λih ci − ch < 0,
i=1

akkor
cT x′ ≥ cT x,
153

azaz a célfüggvény nem csökken.


Bizonyı́tás.
r  
X λih xj
cT x′ = xi xi − xj + ch
i=1
λjh λ jh
" r #
xj X
= cT x − λih ci − ch ≥ cT x
λjh i=1

hiszen dh < 0, xj ≥ 0 és λjh ≥ 0. Q. E. D.


Ez a tétel lehetővé tette, hogy egy megengedett bázisról másik olyan megen-
gedett bázisra térjünk át, ahol a célfüggvény értéke nagyobb (nem kisebb). A
következő állı́tás feltétele arra ad útmutatást, hogy mikor álljunk meg.
Állı́tás. Legyen a1 , . . . , ar egy megengedett bázis és
r
X
ah = λih ai , h = r + 1, . . . , n.
i=1

Ha minden h = r + 1, . . . , n esetén
r
X
dh = λih ci − ch ≥ 0,
i=1

akkor a megengedett bázis optimális.


Bizonyı́tás. Megmutatjuk, hogy a célfüggvény értéke minden megengedhető
megoldás esetén kisebb vagy egyenlő, mint az a1 , . . . , ar megengedett bázishoz
tartozó x1 , . . . , xn bázismegoldás esetén.
Legyen y1 , . . . , yn egy tetszőleges megengedhető megoldás. Helyettesı́tsük be
A oszlopvektorainak a megengedett bázis vektoraival való előállı́tását:
n r n r
!
X X X X
b = y h ah = y h ah + yh λih ai
h=1 h=1 h=r+1 i=1
r n
!
X X
= yi + yh λih ai .
i=1 h=r+1
Pr
Másrészt b = i=1 xi ai . Mivel b az adott megengedett bázisban csak egy
fölbontással rendelkezhet:
n
X
xi = yi + yh λih , i = 1, 2, . . . , r.
h=r+1

Így a célfüggvényre
r r n
!
X X X
T
c x = ci xi = ci yi + yh λih
i=1 i=1 h=r+1
154 19. LINEÁRIS PROGRAMOZÁS
n n n r
!
X X X X
= ci y i − ci y i + yh λih ci
i=1 h=r+1 h=r+1 i=1
n
X
= cT y + yh dk ≥ cT y,
h=r+1

hiszen yk ≥ 0, dk ≥ 0. Q. E. D.
Végül feltételt adunk arra, hogy a maximumfeladatnak mikor nincs megoldása.
Ez akkor következik be, - feltéve, hogy megengedhető megoldások vannak, – ha a
célfüggvény felülről nem korlátos a megengedhető megoldások halmazán.
Állı́tás. Legyen a1 , . . . , ar egy megengedett bázis és tegyük fel, hogy valamely
rögzı́tett h esetén (h > r)
r
X r
X
ah = λih ai , dh = λih ci − ch ,
i=1 i=1

dh negatı́v és minden i = 1, . . . , r esetén λih ≤ 0. Ekkor a célfüggvény felülről nem


korlátos a megengedhető megoldások halmazán.
Bizonyı́tás. Legyen p egy tetszőleges pozitı́v szám. Belátjuk, hogy a
célfüggvény p-nél nagyobb értékeket is felvesz. Jelöljön q egy tetszőleges pozitı́v
számot, és x1 , . . . , xn legyen az adott megengedett bázishoz tartozó bázismegoldás.
ah előállı́tását q-val beszorozva, újabb megengedhető megoldást kaphatunk:
n
X n
X r
X
b = xi ai = xi ai + qah − qλih ai
i=1 i=1 i=1
Xr
= (xi − qλih )ai + qah
i=1

λih ≤ 0 és q > 0 miatt az itt fellépő együtthatók valóban megengedhető x′


megoldást adnak. Ekkor
" r #
X
T ′ T
c x =c x−q λih ci − ch ≥ cT x = cT x − qdh .
i=1

Amennyiben q-t alkalmasan választjuk; úgy, hogy cT x − qdh > p teljesedjék, akkor
valóban cT x′ > p. Q. E. D.
A bizonyı́tott állı́tások alapján a standard lineáris programozási feladat meg-
oldására a következő szimplex módszer adódik.
1) Először is a lineáris egyenletrendszernek keresünk egy olyan megoldását,
amelynek minden komponense nemnegatı́v, azaz megengedhető a megoldás.
2) A megengedhető megoldás segı́tségével elő tudunk állı́tani egy megengedett
bázist és az ahhoz tartozó bázismegoldást.
155

3) Ezt követően a megengedett bázisban szereplő vektorokat A olyan alkalmas


oszlopvektoraival cseréljük ki, hogy a célfüggvény értéke nőjön (legalábbis nem
csökkenjen).
4) Minden lépésnél ellenőrizzük, hogy optimális megengedett bázishoz jutot-
tunk-e.
Megjegyezzük, hogy ı́ly módon minden esetben az eljárás véges sok lépésben
véget ér. Megmutatható ugyanis, hogy elkerülhető a megengedett bázisok
ciklikus visszatérése. Belátható az is, hogy ha van optimális megoldás, akkor
az bázismegoldásnál lép fel.
Példa. Határozzuk meg az cT x = x2 + x4 célfüggvény maximumát az
3x1 + x2 + 7x3 + 2x4 = 16

2x1 + x2 + 5x3 + x4 = 11
xi ≥ 0, i = 1, 2, 3, 4
feltételek mellett. Most tehát cT = (0, 1, 0, 1) , x egy számnégyes oszlopvektor, az
A mátrix és b a következő:
   
3 1 7 2 16
A= , b= .
2 1 5 1 11

Könnyen megadhatjuk az egyenletrendszer egy megengedhető megoldását, például


y = (2, 1, 1, 1). A megengedhető megoldásból előállı́thatunk egy bázismegoldást:
Tekintsük az egyenletrendszerünk redukált homogén alakját:

3x1 + x2 + 7x3 + 2x4 = 0

2x1 + x2 + 5x3 + x4 = 0,
s annak egy megoldását, pl.

(λ1 , λ2 , λ3 , λ4 ) = (2, 1, −1, 0).

Most
yi y1 y2
min = = = 1.
λi >0 λi λ1 λ2
Válasszuk mondjuk j = 2-t. Az új megengedhető megoldás x = (0, 0, 2, 1). Mivel
a3 , , a4 lineárisan függetlenek, x bázismegoldás.
Készı́tsük el az ún. szimplex táblát !

0 1 0 1
b a1 a2 a3 a4
0 a3 2 1/3 1/3 1 0
1 a4 1 1/3 −2/3 0 1
1 1/3 −5/3 0 0
156 19. LINEÁRIS PROGRAMOZÁS

A legfelső sorban c komponesei szerepelnek, baloldali oszlopban pedig c-nek a


bázismegoldáshoz kapcsolódó komponensei.
Pr A legalsó sorban b alatt a célfüggvény
értéke, a többi helyen pedig a dh = i=1 λih ci − ch értékek.
Most
x3 xi
= min .
λ32 λi2 >0 λi2

Tételeink szerint az a3 vektort kicserélhetjük az a2 -vel, s akkor a célfüggvény értéke


nő (nem csökken). Alkalmazva a megfelelő formulákat, a következő
szimplex táblához jutunk:

0 1 0 1
b a1 a2 a3 a4
0 a2 6 1 1 3 0
1 a4 5 1 0 2 1
11 2 0 5 0

Mostmár dh ≥ 0 minden h-ra, ezért optimális megengedett bázishoz jutotttunk.


A megfelelő bázismegoldás (0, 6, 0, 5), s a célfüggvény maximális értéke 11.

You might also like