You are on page 1of 180

`

Curs dAlgebra
Lineal

Rafel Amer Ramon


Francesc Carreras Escobar
Departament de Matem`
atica Aplicada II
Escola T`
ecnica Superior dEnginyeries
Industrial i Aeron`
autica de Terrassa

2009 Rafel Amer i Francesc Carreras


Aquesta obra es distribueix sota la llic`encia creative-commons amb les condicions
Reconeixement-No comercial-Compartir de la versi
o 2.5 daquesta llic`encia. Resumint:
Sou lliure de:
copiar, distribuir i comunicar p
ublicament lobra,
fer-ne obres derivades,
amb les condicions seg
uents:

Reconeixement. Heu de recon`eixer els cr`edits de lobra de la manera especificada


per lautor o el llicenciador (per`
o no duna manera que suggereixi que us donen suport
o rebeu suport per l
us que feu lobra).
No comercial. No podeu utilitzar aquesta obra per a finalitats comercials.
Compartir amb la mateixa llic`
encia. Si altereu o transformeu aquesta obra, o
en genereu obres derivades, nomes podeu distribuir lobra generada amb una llic`encia
id`entica a aquesta.
 Quan reutilitzeu o distribuu lobra, heu de deixar ben clar els termes de la llic`encia de
lobra.
 Alguna daquestes condicions pot no aplicar-se si obteniu el perms del titular dels
drets dautor.
 No hi ha res en aquesta llic`encia que menyscabi o restringeixi els drets morals de
lautor.
Podeu trobar el text complet de la llic`encia a ladreca
http://creativecommons.org/licenses/by-nc-sa/2.5/es/legalcode.ca
Escola T`ecnica Superior dEnginyeries Industrial i Aeron`
autica de Terrassa
Colom 11
08222 Terrassa
rafel.amer@upc.edu

Introduccio

Aquest llibre recull lexperi`encia docent dels autors durant els darrers anys com a professors d`algebra
lineal a lEscola T`ecnica Superior dEnginyeries Industrial i Aeron`autica de Terrassa.
El nou pla destudis daquest centre, implantat a partir del curs 9394, ha redut considerablement
el nombre dhores de classe destinades a aquesta assignatura. Aix`o ha exigit, mes que retallar el
programa, exposarlo duna forma diferent que pot provocar distorsions en ladquisicio dh`abits
cientfics indispensables per a un t`ecnic.
Aix doncs, hem cregut convenient proporcionar a lalumne un text ajustat al programa oficial.
Pensem que lajudar`a a assimilar els conceptes i resultats i ens permetr`a dedicar les classes mes a
la discussio didees que no pas a la pura transcripcio dapunts.
Hem volgut posar de manifest els aspectes formatius de l`algebra lineal i la utilitat de les seves
aplicacions pr`actiques. El temari inclou, duna banda, els fonaments: sistemes dequacions lineals,
c`alcul matricial, determinants, espais vectorials i transformacions lineals. De laltra, aplicacions
de caire geom`etric: producte escalar i nocions derivades, teoria de la diagonalitzacio, tensors i
lestudi analtic de les figures de primer i segon grau en el pla i a lespai tridimensional.
Fem constar que no hem incl`os exercicis. Les refer`encies [1] i [2] contenen colleccions de problemes, resolts i proposats respectivament, ajustades al nostre temari. En canvi, ens ha semblat
oportu afegir, al final, un diccionari amb tots els termes definits en el llibre per facilitarne la
localitzacio.
Assumim la responsabilitat exclusiva dels errors que, malgrat les revisions successives, romanen

encara en el text. Dit aix`o, agram els comentaris constructius de diversos companys de la Seccio
de Terrassa del Departament de Matem`atica Aplicada II.
Esperem que aquesta obra sigui u til als estudiants. Que els estalvi el temps i lesforc necessaris
per cercar cada tema en una bibliografia heterog`enia quant a nomenclatura, notacio, contingut i
punts de vista. I que, despres daquesta primera funcio, es converteixi en un llibre de prestatge,
es a dir, sempre a m`a, per trobar amb facilitat aquella idea o aquell procediment que, ai las!, tan
sovint sescapen de la mem`oria.

Setembre de 1997

Rafel Amer i Francesc Carreras

Index

Introduccio

Index

1 Sistemes dequacions i matrius

1.1 Sistemes dequacions lineals . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2 C`alcul matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13


2

Determinants

19

2.1 Definicio i propietats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19


2.2 C`alcul de determinants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Matrius regulars i sistemes dequacions . . . . . . . . . . . . . . . . . . . . . . 26
3

Espais vectorials
3.1 Lespai vectorial num`eric R

33
n

. . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Depend`encia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35


3.3 Dimensio i rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4 Subespais vectorials de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5 Canvis de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

R. Amer i F. Carreras

Lestructura euclidiana de Rn

Index

51

4.1 El producte escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51


4.2 Norma, angle i projeccio ortogonal . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 El m`etode dels mnims quadrats . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4 Orientacio i producte vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5

Transformacions lineals

67

5.1 Definicions i exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


5.2 Canvis de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.3 Nucli, imatge i rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.4 Operacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.5 Endomorfismes i producte escalar . . . . . . . . . . . . . . . . . . . . . . . . . 75
6

Diagonalitzacio de matrius

81

6.1 Endomorfismes diagonalitzables . . . . . . . . . . . . . . . . . . . . . . . . . . 81


6.2 Condicions de diagonalitzacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.3 Diagonalitzacio de matrius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.4 Classificacio de les isometries . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.5 Sistemes dequacions diferencials lineals . . . . . . . . . . . . . . . . . . . . . 98
7

Tensors i formes quadr`atiques

105

7.1 Introduccio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105


7.2 Diagonalitzacio de tensors i formes . . . . . . . . . . . . . . . . . . . . . . . . 109
7.3 Indexs din`ercia i classificacio de formes . . . . . . . . . . . . . . . . . . . . . 111
7.4 Extrems locals de les funcions de diverses variables . . . . . . . . . . . . . . . 115
8

Geometria lineal

121

8.1 Lespai euclidi`a puntual tridimensional . . . . . . . . . . . . . . . . . . . . . . 121


8.2 Varietats lineals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.3 Posicions relatives de les varietats lineals . . . . . . . . . . . . . . . . . . . . . 127
8.4 Angles, dist`ancies, a` rees i volums . . . . . . . . . . . . . . . . . . . . . . . . . 132
9

Corbes i superfcies de segon grau

139

9.1 Ellipse, hip`erbola i par`abola . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

R. Amer i F. Carreras

9.2 Classificacio de les c`oniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142


9.3 Llocs geom`etrics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
9.4 Qu`adriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A Permutacions

163

B Polinomis

167

Bibliografia

173

Index
alfab`etic

175

R. Amer i F. Carreras

Bibliografia

R. Amer i F. Carreras

1
Sistemes dequacions i matrius

Les questions plantejades per l`algebra lineal i les seves aplicacions es formulen sovint en llenguatge matricial; sovint, tambe, condueixen a lestudi de sistemes dequacions lineals. La primera seccio daquest captol recull les definicions b`asiques sobre sistemes i una de les t`ecniques
principals per resoldrels: el m`etode de Gauss, automatitzat per la regla del pivot, amb la variant
anomenada m`etode de Gauss-Jordan (laltre procediment habitual, basat en el c`alcul de determinants, sexposa en el captol 2). La segona seccio es dedica a les nocions fonamentals sobre
matrius i c`alcul matricial.

1.1 Sistemes dequacions lineals


Un sistema dequacions lineals e s una colleccio dequacions de la forma

a11 x1 + a12 x2 + + a1n xn = b1

a x + a x + + a x
= b
21 1

22 2

2n n

..................................

am1 x1 + am2 x2 + + amn xn = bm


on els coeficients ai j , els termes independents b1 , b2 , . . . , bm i els valors que han de prendre les
inc`ognites x1 , x2 , . . . , xn son nombres reals (o, mes en general, complexos). El primer subndex

10

R. Amer i F. Carreras

Sistemes dequacions i matrius

de cada coeficient indica lequacio on apareix, i el segon la inc`ognita a la que multiplica, mentre
que el subndex de cada terme independent es refereix a lequacio. El sistema anterior e s un
sistema amb m equacions i n inc`ognites o, simplement, un sistema m n.
Un sistema e s compatible si admet alguna solucio (una o mes), i e s incompatible si no nadmet
cap. Un sistema compatible e s determinat si nomes admet una solucio, i e s indeterminat si en te
mes duna (aix`o voldr`a dir que en te infinites). Resoldre un sistema compatible significa, en el
cas determinat, donar el valor u nic de cada inc`ognita; en el cas indeterminat, donar una expressio
explcita de les inc`ognites en funcio de certs par`ametres lliures (que habitualment coincideixen
amb algunes de les mateixes inc`ognites), de manera que assignant valors arbitraris a aquests
par`ametres es trobin totes les solucions.
Dos sistemes amb les mateixes inc`ognites (per`o potser amb diferent nombre dequacions) son
equivalents si admeten les mateixes solucions (que poden ser cap, una o mes duna).

Proposicio 1.1 (Operacions elementals.) Les operacions seguents transformen un sistema en un


altre sistema equivalent:
(a) Sumar o restar una equacio a una altra.
(b) Multiplicar o dividir una equacio per un nombre diferent de zero.
(c) Intercanviar dues equacions.
(d) Canviar lordre de les inc`ognites en el sistema.

D EMOSTRACI O . Tot e s de comprovacio immediata.

M`etode de Gauss. Tot sistema dequacions lineals es pot transformar, mitjancant operacions
elementals, en un sistema equivalent de forma triangular, e s a dir, tal que el primer coeficient no
nul de cada equacio correspongui a una inc`ognita posterior a la del primer coeficient no nul de
lequacio anterior. El m`etode de Gauss saplica a cegues, sense saber de quin tipus e s el sistema
abans de comencar els c`alculs. En el captol 3, el teorema de Rouche-Frobenius establir`a els
criteris per classificar a priori un sistema. Daltra banda, el nombre dinc`ognites que queden
lliures en resoldre un sistema indeterminat no dep`en de la manera daplicar el m`etode de Gauss
(o un altre procediment): aix`o quedar`a demostrat tambe en el captol 3 i permetr`a anomenar-lo
el nombre de graus de llibertat del sistema. Una sistematitzacio dels c`alculs que comporta el
m`etode de Gauss, forca u til a la pr`actica, sexposa tot seguit.
Proposicio 1.2 (Regla del pivot.) Si ai j 6= 0 e s un coeficient tal que ai h = 0 per a tot h < j, i es

R. Amer i F. Carreras

11

canvien els coeficients i el terme independent duna altra equacio, la k-`essima, prenent
0
ak`
= ai j ak` ak j ai`

per a

` = 1, 2, . . . , n,

bk0 = ai j bk ak j bi ,
resulta un sistema equivalent a loriginal (es diu que ai j ha estat el pivot daquesta transformacio).
Aplicant reiteradament aquesta idea sarriba a un sistema de forma triangular.

D EMOSTRACI O . Nomes cal observar que els canvis proposats equivalen a multiplicar lequacio k-`essima per ai j i restar-li lequacio i-`essima multiplicada per ak j , que els zeros obtinguts
pr`eviament en columnes h < j es conserven i que, ara, el coeficient de la inc`ognita x j a lequacio
k-`essima ja e s tambe zero.

M`etode de Gauss-Jordan. Transformant amb la regla del pivot no nomes les equacions posteriors sino tambe les precedents, tot sistema dequacions lineals es converteix en un sistema equivalent de forma diagonal, e s a dir, on tots els coeficients de les columnes dels pivots (excepte
ells mateixos) siguin zero. Aix`o ens estalvia la progressiva substitucio de les inc`ognites ja determinades en les equacions precedents del sistema triangular.
Exemples 1.3 (a) Considerem el sistema

x + 4y + 3z = 1

2x + 5y + 4z = 4 .

x 2y 2z = 3
Escrivint nomes, com e s habitual, els coeficients i els termes independents en la disposicio files
columnes que mes endavant denominarem matriu, i aplicant repetidament operacions elementals
seguint el m`etode de Gauss, tenim la successio de sistemes equivalents seguent:

1
4
3
2
5
4
1 2 2


1
1
4
3

4 ' 0 3 2

3
0 6 5

1
1 4 3 1

2 ' 0 3 2 2 .


2
0 0 3 6

En el darrer sistema resulta, de la tercera equacio, z = 2; substituint a lequacio anterior, 3y+4 =


2, e s a dir, y = 2; i substituint, finalment, a la primera, x 8 + 6 = 1, don x = 3. Per tant,
x = 3,
e s la solucio (unica) del sistema original.

y = 2 ,

z=2

12

R. Amer i F. Carreras

Sistemes dequacions i matrius

Si volem aplicar el m`etode de Gauss-Jordan (fent tambe u s de la regla del pivot), la successio de
sistemes, on marquem els pivots que fem servir, e s ara la seguent:

1
4
3 1
1
4
3 1
2
5
4 4 ' 0 3 2 2 '
1 2 2 3
0 6 5 2

3
0 1 11
9
0 0 27
0 3 2
2 ' 0 9 0 18 .


6
0
0 3
6
0
0 3
Aix obtenim 9x = 27, 9y = 18, 3z = 6, don x = 3, y = 2 i z = 2.
(b) Resoldrem ara el sistema

x + y + z = 0

2x + 3y 2z = 0 .

x + 2y 3z = 0
Aplicant novament el m`etode de Gauss tenim


1 1
1 0
1 1
1 0
1 1
1 0
2 3 2 0 ' 0 1 4 0 ' 0 1 4 0 .



0 0
0 0
0 1 4 0
1 2 3 0
De la segona equacio del sistema final surt y = 4z, i substituint a la primera queda x +4z+z = 0,
don x = 5z. Les expressions
x = 5z ,

y = 4z ,

z=z

donen la solucio general del sistema original, en la que la inc`ognita z fa el paper simultani de
par`ametre lliure: donant valors a z obtenim les infinites solucions del sistema.
Fent servir el m`etode de Gauss-Jordan i la regla del pivot com a lexemple anterior, tenim


1 1
1 0
1 0
5 0
1 1
1 0
2 3 2 0 ' 0 1 4 0 ' 0 1 4 0 .



0 0
0 0
1 2 3 0
0 1 4 0
De les equacions x + 5z = 0 i y 4z = 0 resulta novament x = 5z i y = 4z (z = z, par`ametre
lliure).
(c) Estudiem finalment el sistema

x + y + z = 1

x + 2y + z = 3 .

2x + 3y + 2z = 3

R. Amer i F. Carreras

13

Aplicant el m`etode de Gauss obtenim




1 1 1 1
1 1 1 1
1 1 1 1
1 2 1 3 '0 1 0 2 '0 1 0 2 .



2 3 2 3
0 1 0 1
0 0 0 1
La darrera equacio del sistema final e s 0 = 1, per tant aquest sistema e s incompatible i loriginal tambe.

Es diu que un sistema e s homogeni si


b1 = b2 = = bm = 0 .
Tot sistema homogeni e s compatible, ja que admet la solucio (anomenada solucio trivial)
x1 = x2 = = xn = 0 .
Els sistemes homogenis seran els que haurem de resoldre amb mes freque` ncia, i els mes interessants son evidentment els indeterminats: lultim resultat daquesta seccio estableix una propietat
b`asica dels sistemes homogenis.
Teorema 1.4 Tot sistema homogeni amb mes inc`ognites que equacions e s indeterminat.
D EMOSTRACI O . Si n > m, el nombre de pivots necessaris per a triangular el sistema ser`a
r m < n, per tant, al menys una inc`ognita passar`a a ser par`ametre lliure.

1.2 C`alcul matricial


Una matriu de m files i n columnes amb coeficients reals e s una funcio
A : {1, 2, . . . , m} {1, 2, . . . , n} R,
que assigna a cada parell (i, j) un nombre real ai j (la definicio per a matrius amb coeficients
habitual representar una matriu A com
complexos e s an`aloga). Es

a11 a12 a1n


a21 a22 a2n

A=
...................
am1 am2 amn
posant el coeficient ai j a la fila i i la columna j. Es diu que A e s una matriu del tipus m n.

14

R. Amer i F. Carreras

Sistemes dequacions i matrius

Atenent a la definicio, cal observar que una matriu A del tipus m n i una matriu B del tipus
p q son iguals (escriurem A = B) si, i nomes si, m = p, n = q i ai j = bi j per a tot i i
tot j. El conjunt de totes les matrius del tipus m n amb coeficients reals es representa per
Mmn (R) (i per Mmn (C) el de les de coeficients complexos). Son especialment frequents les
matrius columna (tipus m 1), les matrius fila (tipus 1 n) i les matrius quadrades (tipus n n
o dordre n).
En cada un dels conjunts Mmn (R) es defineixen dues operacions internes: la suma, on S =
A + B e s la matriu donada per si j = ai j + bi j , i el producte per un nombre real, on P = t A e s la
matriu donada per pi j = tai j , amb t R. Les propietats essencials daquestes operacions, totes
f`acils de comprovar, son les seguents:
(a) Associativa de la suma: A + (B + C) = (A + B) + C.
(b) Commutativa de la suma: A + B = B + A.
(c) Neutre de la suma: existeix una matriu 0 tal que A + 0 = A per a tota A.
(d) Oposats per a la suma: per a cada matriu A, existeix una matriu A tal que A +(A) = 0.
(e) Distributiva del producte per a la suma de matrius: t (A + B) = t A + t B.
(f) Distributiva del producte per a la suma de nombres: (t + s)A = t A + s A.
(g) Associativitat dels productes: (ts)A = t (s A).
Es defineix la difer`encia de dues matrius A i B com A B = A+(B). Les propietats daquesta
operacio son les derivades de (a)(g).
La tercera operacio fonamental del c`alcul matricial e s la multiplicacio: si A Mmn (R) i
B Mn p (R), el seu producte e s la matriu P = AB Mm p (R) definida per les formules
pi j =

n
X

aik bk j .

k=1

Fem notar que el nombre de columnes de A ha de coincidir amb el de files de B, que la matriu
resultant AB te tantes files com A i tantes columnes com B i, finalment, que loperacio consisteix
en multiplicar escalarment les files de A per les columnes de B.
Exemples 1.5 (a) Tot sistema dequacions lineals es pot representar matricialment en la forma

1
a11 a12 a1n
b1
x2
a21 a22 a2n
b2

,
=

. . . . . . . . . . . . . . . . . . . ...

am1 am2 amn


bm
xn
e s a dir, com AX = B.

15

R. Amer i F. Carreras

(b) Si es defineix per a cada cada n la matriu unitat In com la matriu quadrada nn de coeficients
(
1 si i = j
i j =
0 si i 6= j
e s immediat comprovar que Im A = A = AIn per a tota A Mmn (R): es diu que les matrius
unitat son semineutres laterals per al producte.
(c) Considerem les matrius


1 2
A=
,
2 4


B=

1
1
1 1


i

C=

2 4
1
2

Amb elles podem illustrar dos defectes de la multiplicacio de matrius que cal afegir al fet que
no sempre e s possible multiplicar (de vegades es pot calcular AB per`o no B A). En primer lloc,
AB 6= B A, i aix`o ens diu que no es compleix, en general, la propietat commutativa. Daltra
banda, AC = 0, tot i que A 6= 0 i C 6= 0; per tant, duna relacio del tipus AX = AY no es pot
deduir que X = Y , encara que sigui A 6= 0 i A(X Y ) = 0.
Proposicio 1.6 Quan son factibles els productes que hi intervenen, es compleixen les propietats
seguents:
(a) Associativa: A(BC) = (AB)C.
(b) Distributives: A(B + C) = AB + AC,

(B + C)A = B A + C A.

(c) Compatibilitat: (t A)B = t (AB) = A(t B).


D EMOSTRACI O . Ens limitarem a justificar la part (a) com a illustracio. Observem que si A e s
del tipus m n, B ha de ser del tipus n p i C ha de ser p q. Si posem P = BC, Q = A P,
R = AB i S = RC, caldr`a provar que Q = S. En primer lloc, tant Q com S son matrius del
mateix tipus, m q. A mes, els coeficients corresponents coincideixen:
!
p
p
n
n
n X
X
X
X
X
qi j =
ai` p`j =
ai`
b`k ck j =
ai` b`k ck j
`=1

p X
n
X
k=1 `=1

`=1

ai` b`k ck j =

`=1 k=1

k=1
p
n
X
X
k=1

`=1

!
ai` b`k ck j =

p
X

rik ck j = si j .

k=1

La transposada duna matriu A Mmn (R) e s la matriu At Mnm (R) de coeficients ait j = a ji .
obvi que (At )t = A, i el lector pot demostrar, aplicant la t`ecnica de la proposicio anterior, les
Es
relacions
(A + B)t = At + B t ,
(A)t = At i (AB)t = B t At .

16

R. Amer i F. Carreras

Sistemes dequacions i matrius

Matrius quadrades
Ens concentrarem ara en el conjunt de les matrius quadrades Mnn (R). En primer lloc, aqu
sempre e s possible fer el producte AB, i el resultat e s intern. La matriu unitat In (que denotarem
per I quan no hi hagi confusio sobre n) e s lelement neutre bilateral del producte: AI =
A = I A per a tota A.
Una matriu quadrada A e s sim`etrica si At = A, i ortogonal si At A = I . Les matrius sim`etriques
i les ortogonals son les mes interessants en les aplicacions, i seran estudiades amb detall mes
endavant.
Una matriu quadrada A e s regular (o invertible) si existeix B tal que AB = I = B A. De fet, si
AB = I = C A tenim que
B = I B = C AB = C I = C ,
per tant, si A e s regular existeix una u nica matriu, escrita A1 i denominada inversa de A, tal
que A A1 = I = A1 A. A partir daix`o e s obvi que A1 e s regular i que (A1 )1 = A. Tambe
e s immediat provar que si A i B son regulars tambe ho e s AB, i (AB)1 = B 1 A1 . A mes,
tota matriu regular A e s simplificable, en el sentit que de la relacio AB = AC (i an`alogament de
B A = C A) es dedueix que B = C, ja que
A1 (AB) = A1 (AC) ,

(A1 A)B = (A1 A)C ,

I B = IC

i per tant B = C.
Exemple 1.7 Una matriu del tipus 2 2

A=

a c
b d

e s regular si, i nomes si, ad bc 6= 0. En aquest cas, la seva inversa e s




1
d c
1
.
A =
a
ad bc b
En efecte: si busquem una matriu B tal que AB = I plantejarem


 

a c
x z
1 0
=
,
b d
y t
0 1
que condueix a dos sistemes 2 2 amb els mateixos coeficients (els de la matriu A), lun per a
x, y i laltre per a z, t:
)
)
ax + cy = 1
az + ct = 0
.
bx + dy = 0
bz + dt = 1

17

R. Amer i F. Carreras

Resolent-los per reduccio arribem a les relacions


(ad bc)x = d ,

(ad bc)y = b ,

(ad bc)z = c

(ad bc)t = a ,

don es dedueix que si ad bc 6= 0 existeix una u nica matriu B que compleix AB = I , i e s




1
d c
B=
.
a
ad bc b
A mes, es pot comprovar f`acilment que B A = I , e s a dir, B e s la inversa de A.
En canvi, si ad bc = 0, la matriu

B=

d c
b
a

compleix AB = 0, i aix`o e s suficient per veure que A no te inversa.


El fet que certes matrius no nulles no tinguin inversa (matrius singulars) e s el darrer defecte
que cal fer notar abans de comentar que, en general, el c`alcul matricial presenta moltes analogies
amb el c`alcul ordinari amb nombres reals (i complexos) que el lector ja deu haver notat.
C`alcul de la inversa per GaussJordan. Generalitzant lexemple anterior, considerem el problema de trobar (si existeix) la inversa duna matriu quadrada A Mnn (R). Busquem una
matriu B tal que AB = I ; aquesta igualtat condueix a n sistemes n n, tots ells amb els
mateixos coeficients (els de la matriu A) per`o afectant cada sistema nomes als elements duna
columna de B com a incognites i als de la corresponent columna de la matriu I com a termes independents. Es pot fer un estudi simultani dels n sistemes: nomes cal aplicar el m`etode
de Gauss-Jordan, operant amb la regla del pivot sobre les files de la matriu A | I obtinguda per
juxtaposicio.
Si hem trobat n pivots, haurem obtingut una matriu I | B i tindrem que AB = I : en el captol
seguent veurem que aquesta relacio implica que A e s regular i B e s la inversa de A. En canvi, si
han aparegut menys de n pivots, algun dels sistemes e s incompatible i la matriu A no te inversa.
Exemples 1.8 (a) Busquem la inversa de la matriu

1 2 4
A =2 1 4 .
1 1 3
Aplicant el m`etode de Gauss-Jordan a la matriu A | I


1
1 2 4 1 0 0
2 1 4 0 1 0 '0

1 1 3 0 0 1
0

tenim
2
3
1

4
4
1

1 0 0

2 1 0

1 0 1

18

Sistemes dequacions i matrius

R. Amer i F. Carreras

3
0

0
3
'
0
0

4
4
1


1

2

1

' 0
0


2
0
3 0
0

1
0
0
' 0 3
1 3
0 0 1

0 0 1
2 4
1 0 2
1 4 .

0 1 1 1
3

3 6 12

6 3 12

1 1 3

Per tant A e s regular i

A1

1
2 4
1 4 .
= 2
1 1
3

(b) Estudiem ara la matriu

1 2 3
A =1 1 2 .
2 3 5
Aplicant el m`etode de Gauss-Jordan a la matriu A | I


1
1 2 3 1 0 0
1 1 2 0 1 0 '0

2 3 5 0 0 1
0

tenim
2
1
1

3
1
1

1 0 0

1 1 0

2 0 1

1
0 1 1 2
0
1
0 ,
' 0 1 1 1

0
0
0
1
1 1

i la manca dun tercer pivot (aparicio duna fila de zeros) ens diu que A no e s regular.

R. Amer i F. Carreras

19

2
Determinants

El concepte de determinant e s un instrument de gran inter`es te`oric i pr`actic per a l`algebra lineal.
Tot i la seva aparent complexitat formal, representa una alternativa als procediments de c`alcul
basats en el m`etode de Gauss, als quals supera sovint en eleg`ancia i profunditat.
Farem servir en aquest captol algunes nocions i resultats sobre permutacions, que hem preferit
recollir en un altre lloc (ap`endix A). Per fer ben ntida la notacio, ser`a convenient escriure com
j
ai el coeficient situat a la fila i i la columna j duna matriu gen`erica A Mnn (R), i posar, quan
sigui necessari especificar les files de A,
A = (A1

A2 An ) .

2.1 Definicio i propietats


Donada una matriu quadrada A Mnn (R),

a11 a12 a1n


a1 a2 an
2
2
2
A=
................ ,
an1 an2 ann

20

Determinants

R. Amer i F. Carreras

es defineix el seu determinant com el nombre real


1

a1 a12 a1n
1

a a2 an X
2
2
2

=
det(A) =
( )a11 a22 ann ,

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.


a 1 a 2 a n Pn
n
n
n
de manera que det(A) e s la suma de n! termes, cada un dels quals e s el producte de n coeficients
de la matriu (un de cada fila i, al mateix temps, un de cada columna) amb un signe + o . En
els casos n = 2 i n = 3 fem servir aquesta definicio directament; a partir de n = 4 cal recorrer a
procediments indirectes que deduirem de les propietats del determinant.
Exemples 2.1 (a) Quan n = 2 nomes hi ha dues permutacions, la identitat i la transposicio
= (1, 2). Per tant, el determinant duna matriu 2 2 e s
1

a a2
1 = a1a2 a2a1 .
1
1 2
1 2
a1 a2
2
2
(b) (Regla de Sarrus.) Per a n = 3 hi ha sis permutacions, tres amb signe positiu,
id = (1, 2, 3) ,

(2, 3, 1) ,

(3, 1, 2),

i tres amb signe negatiu,


(3, 2, 1) ,

(2, 1, 3) ,

(1, 3, 2).

Per tant, el determinant duna matriu 3 3 e s



1
a1 a12 a13
1

a a2 a3 = a1a2a3 + a2a3a1 + a3a1a2 a3a2a1 a2a1a3 a1a3a2 .
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
2
2
2
a1 a2 a3
3
3
3
Una manera de recordar aquests termes e s lesquema seguent:

Signe +

Signe

21

R. Amer i F. Carreras

(c) Si una matriu A te una fila de zeros, det(A) = 0. En efecte: si la fila i e s tota nulla, el terme
corresponent a cada Pn conte el factor aii = 0, per tant tots els termes son nuls.
j

(d) Si A e s una matriu triangular inferior, e s a dir, si ai = 0 quan i < j, el seu determinant e s
el producte dels elements de la diagonal principal:
det(A) = a11 a22 ann .
En efecte: per tal que el terme corresponent a una Pn no contingui cap dels zeros situats
sobre la diagonal principal, ha de ser 1 = 1, 2 = 2, i aix successivament fins a n = n; en
definitiva, nomes pot ser el terme de = id, i daqu el valor de det(A). En particular, aix`o
j
tambe e s v`alid si A e s una matriu diagonal, e s a dir, si ai = 0 quan i 6= j. Per exemple,
det(In ) = 1 per a tot n.
Teorema 2.2 (a) El determinant e s una funcio multilineal de les files, e s a dir:
(1) Si una fila es descompon en una suma, Ai = Bi + Ci , aleshores
det(A1 Ai An ) = det(A1 Bi An ) + det(A1 Ci An ) .
(2) Si en una fila es treu un factor comu, Ai = t Bi , aleshores
det(A1 Ai An ) = t det(A1 Bi An ) .
(b) El determinant e s una funcio alternada de les files, e s a dir, si dues files son iguals, Ai = A j ,
el determinant e s zero:
det(A1 Ai A j An ) = 0 .
j

D EMOSTRACI O . (a) Com que Ai = Bi + Ci , tenim que ai = bi + ci per a qualsevol j =


1, 2 . . . , n; per tant, aii = bii + cii per a tota permutacio . Aplicant aix`o a cada terme arribem
immediatament a obtenir la propietat (1). El raonament per a la (2) e s an`aleg.
(b) Si = (i, j) sabem que 7 transforma biunvocament el conjunt Pn+ de totes les
permutacions de signe positiu en el conjunt Pn de totes les permutacions de signe negatiu.
Tenint, a mes, en compte que aik = a jk per a tot k, resulta:
det(A1 Ai A j An ) =
i
X h

( )
=
( )a11 aii a j j ann + ( )a1( )1 ai( )i a j j an( )n
Pn+

i
X h

( )a11 aii a j j ann ( )a11 ai j a ji ann


Pn+

X
Pn+

i
h

( ) a11 aii a j j ann a11 ai j a ji ann = 0 .

22

Determinants

R. Amer i F. Carreras

Corol.lari 2.3 (a) Si permutem dues files duna matriu A, el determinant canvia de signe:
det(A1 Ai A j An ) = det(A1 A j Ai An ) .
(b) Mes en general, per a qualsevol permutacio ,
det(A1

A2 An ) = ( ) det(A1

A2 An ) .

(c) Si a una fila li sumem o restem un multiple duna altra fila, el determinant no varia:
det(A1 Ai + t A j A j An ) = det(A1 Ai A j An ) .
D EMOSTRACI O . (a) Partint de la relacio
det(A1 Ai + A j Ai + A j An ) = 0
i aplicant la multilinealitat, tenim que
det(A1 Ai Ai An ) + det(A1 Ai A j An )+
+ det(A1 A j Ai An ) + det(A1 A j A j An ) = 0 ,
e s a dir,
det(A1 Ai A j An ) = det(A1 A j Ai An ) ,
ja que els altres dos determinants son nuls.
(b) Com que tota permutacio e s producte de transposicions, = 1 2 p , i ( ) = (1) p ,
posant A = (A1 A2 An ) podem escriure
det(A ) = det(A1 2 p ) = (1) det(A2 p ) = = (1) p det(A) = ( ) det(A) .
(c) Aplicant novament el teorema anterior,
det(A1 Ai + t A j A j An ) =
= det(A1 Ai A j An ) + det(A1 t A j A j An )
= det(A1 Ai A j An ) + t det(A1 A j A j An )
= det(A1 Ai A j An ) .
Teorema 2.4 det(At ) = det(A). En conseque` ncia, totes les propietats del determinant enunciades per files son v`alides tambe per a columnes.

23

R. Amer i F. Carreras

D EMOSTRACI O . Si ai e s el coeficient gen`eric de A i bi el de At , sabem que bi = a ji . Aleshores


X

det(At ) =

( )b11 b22 bnn .

Pn

Reordenant els factors de cada un dels termes segons el superndex tenim que
X
det(At ) =
( )b1 1 1 b2 1 2 bn 1 n
Pn

( 1 )a1

a2

an

Pn

ja que ( ) = ( 1 ). Posem = 1 . Com que el sumatori anterior consta dels n! termes


corresponents a totes les possibles permutacions, podem escriure
X
det(At ) =
( )a11 a22 ann = det(A) .
Pn

Teorema 2.5 (Formula del producte.) det(AB) = det(A) det(B).


D EMOSTRACI O . Si C = AB = (C1
com

C2 Cn ), cada una daquestes files es pot escriure


Ci =

n
X

aik Bk ,

k=1

e s a dir, les files de AB son el que sanomena combinacions lineals de les files de B. Representem per Rn el conjunt de totes les permutacions amb repeticio de 1, 2, . . . , n. Aleshores
det(AB) = det(C1
= det

n
X

C2 Cn )
a1k Bk

k=1

Aplicant la multilinealitat del determinant queda


X
det(AB) =
det(a1r1 Br1

n
X

a2k Bk

k=1

n
X

!
ank Bk

k=1

a2r2 Br2 anrn Brn )

r Rn

a1r1 a2r2 anrn det(Br1

Br2 Brn ) .

r Rn

Dels determinants que intervenen en aquest sumatori, podem eliminar tots els que tenen alguna
fila repetida, i deixar nomes aquells per als quals r e s una permutacio sense repeticions, e s a dir,

24

Determinants

R. Amer i F. Carreras

r Pn . Per tant,
det(AB) =

a1r1 a2r2 anrn det(Br1

Br2 Brn )

r Rn

(r )a1r1 a2r2 anrn det(B1

B2 Bn ) = det(A) det(B) .

r Pn

2.2 C`alcul de determinants


Quan n 4, el nombre de termes del sumatori que defineix el determinant e s mes gran o
igual que 24 i creix molt r`apidament, fent impracticable la formula original. Estudiarem ara dos
procediments de c`alcul alternatius.
M`etode de Gauss. Operant per files es pot arribar sempre a una matriu triangular, el determinant
de la qual e s, segons hem vist, el producte dels coeficients de la diagonal principal. Nomes cal
tenir en compte tres punts:
(a) Intercanviar dues files canvia el signe del determinant.
(b) Cada vegada que fem servir la regla del pivot per transformar una fila, cal dividir el determinant resultant pel pivot utilitzat.
(c) Si apareix una fila de zeros no cal seguir, perqu`e el determinant val zero.
Exemple 2.6 C`alcul del determinant


2
1 3
2

3 2
1
4

.
2 3
1 2

2 1
0
1
Marcant els pivots tenim

2
1 3
2

3 2
1
4

2 3
1 2

2 1
0
1




2


1 0
=
2 0



0

1
7
4
2


2
1 3
2

1 1 1 0 7 11
2
=

2
0 16 36
2 7 16 0
0
0
0 140



2
3
2
1



11
2 1 1 0 7
=
0
4 4 2 72 0


0
0
3 1

3
11
16
1




2 (7) 16 140
=
= 20 .

2 72 16

2
2
36
11

25

R. Amer i F. Carreras

Donada una matriu A Mnn (R) i fixat un coeficient ai , denotarem per Ai la submatriu
dordre n 1 que sobte eliminant la fila i i la columna j de la matriu A. Anomenarem adjunt
j
de ai al determinant daquesta submatriu multiplicat per (1)i+ j :
j

Ai = (1)i+ j det(Ai ) .
f`acil recordar el signe corresponent a cada coeficient amb lajut de lesquema seguent:
Es

+ +
+ +

+ + .

.. .. .. .. . .
.
. . . .
j

Lema 2.7 Si tots els coeficients de la fila i diferents de ai son zero, aleshores
j

det(A) = ai Ai .
D EMOSTRACI O . Fent i 1 canvis de fila i j 1 canvis de columna podem situar el coeficient
j
ai a la posicio (1, 1), conservant la fila i, que passa a ser la primera, i la columna j, que tambe
passa a ser-ho. En aquest proces, la fila i i la columna j shauran desordenat:

j
ai
0
...
0
...
0
a11 a12 . . . a1 . . . a1n
j1
a1 a2 . . . a j . . . an
aj
a11 . . . a1
. . . a1n
2
1

2
2
2

........................
...............................
A=
B= j
,
.
j1
n
1
0 0 . . . aij . . . 0
ai1 ai1

. . . ai1 . . . ai1

........................
...............................
j
j
j1
an1 an2 . . . an . . . ann
an
an1 . . . an
. . . ann
j

Si representem per bi els coeficients de la matriu B, podem escriure


X
det(A) = (1)i+ j det(B) = (1)i+ j
( )b11 b22 bnn .
Pn

El primer coeficient de cada terme e s zero, excepte si 1 = 1. Per tant,


X
X
( )b22 bnn ,
det(B) =
( )b11 b22 bnn = b11
Pn
1 =1

Pn1

ja que les permutacions Pn tals que 1 = 1 son les permutacions dels elements 2, 3, . . . , n.
j
1
Daltra banda, B1
= Ai , per tant,
j

det(A) = (1)i+ j det(B) = (1)i+ j b11 B11 = ai Ai .

26

R. Amer i F. Carreras

Determinants

Teorema 2.8 (Regla de Laplace.) Fixada una fila i qualsevol duna matriu A, es compleix que
det(A) = ai1 Ai1 + ai2 Ai2 + + ain Ain .
D EMOSTRACI O . Expressem la fila i com a suma de n files:
Ai = (ai1 0 0) + (0 ai2 . . . 0) + + (0 0 ain ) = Ai1 + Ai2 + + Ain .
Aplicant ara la multilinealitat del determinant i el lema anterior resulta que
det(A) = det(A1 A2 Ai An )
= det(A1 Ai1 An ) + det(A1 Ai2 An )+
+ + det(A1 Ain An )
= ai1 Ai1 + ai2 Ai2 + + ain Ain .
Observacions 2.9 (a) La regla de Laplace e s laltre procediment habitual per a calcular determinants. Tenint en compte que hi ha una regla de Laplace an`aloga per columnes, es parla en
general de desenvolupament dun determinant pels coeficients duna lnia.
(b) Si es multipliquen els coeficients duna fila (o columna) pels adjunts duna altra el resultat e s
zero, ja que correspon al c`alcul dun determinant amb dues files (o columnes) iguals: si i 6= k,
ai1 A1k + ai2 A2k + + ain Ank = 0,
i aix`o ser`a dutilitat mes endavant per justificar la formula del c`alcul de la inversa.
Exemple 2.10 En el determinant que hem calculat abans pel m`etode de Gauss, una vegada
obtinguts els zeros de la primera columna podem aplicar la regla de Laplace, que redueix el
c`alcul a aplicar la regla de Sarrus:




2



2

1
3
2
1
3
2




7 11
2
3 2




1
4 1 0 7 11
2 1


= 2 2 4 4 4 = 20 .
2 3
= 2 0 4
4
4
1
2




2 3 1
2 1
0 2
0
1
3 1

2.3 Matrius regulars i sistemes dequacions


Dedicarem la primera part daquesta seccio a caracteritzar les matrius regulars i a donar un procediment per al c`alcul de la inversa que e s una alternativa al m`etode de Gauss-Jordan. A continuacio, aplicarem els determinants i les matrius regulars a la resolucio dels sistemes dequacions
lineals.

R. Amer i F. Carreras

27

Si A Mnn (R), Aad representar`a la matriu adjunta de A, que resulta de substituir cada coefij
j
cient ai de A pel seu adjunt Ai .
Teorema 2.11 Una matriu A e s regular si, i nomes si, det(A) 6= 0. En aquest cas
A1 =

1
(Aad )t .
det(A)

D EMOSTRACI O . (H) Si A e s regular, aplicant la formula del producte a la relacio A A1 = I ,


resulta que det(A) det(A1 ) = 1. Per tant, det(A) 6= 0 i, a mes,
det(A1 ) =

1
.
det(A)

(H) Aplicant la regla de Laplace i la segona de les observacions que la segueixen, tenim
A(Aad )t = det(A) I = (Aad )t A ;
per tant, si det(A) 6= 0 podem dividir per det(A) i apareix, efectivament, la inversa de A que
proposa lenunciat.

Exemples 2.12 Considerem les dues matrius que hem estudiat al final del captol anterior.
(a) La matriu

1 2 4
A =2 1 4
1 1 3
e s regular perqu`e det(A) = 1. Aplicant la formula de la inversa, tenim que
A1

1 2
4
1
2 4
1
2 1
4 = 2
1 4 .
=
1
1
1 3
1 1
3

(b) La matriu

1 2 3
B =1 1 2
2 3 5
no e s regular perqu`e det(B) = 0, e s a dir, B no te inversa.

28

Determinants

R. Amer i F. Carreras

Un sistema dequacions lineals e s un sistema de Cramer si te tantes equacions com inc`ognites


i la matriu dels coeficients e s regular. Tenint en compte que un sistema dequacions lineals pot
expressar-se matricialment per AX = B, on X e s la matriu columna de les inc`ognites i B la
dels termes independents, es dedueix que tot sistema de Cramer e s compatible determinat, ja que
lunica solucio e s
X = A1 B .
Una forma alternativa dobtenir aquesta solucio e s la seguent.
Teorema 2.13 (Regla de Cramer.) Si AX = B e s un sistema de Cramer i A1 , A2 , . . . , An son
les columnes de la matriu A Mnn (R), la solucio del sistema ve donada per les formules
xi =

A2 B An )
A 2 Ai A n )

det(A1
det(A1

per a i = 1, 2, . . . , n.

D EMOSTRACI O . La solucio u nica del sistema est`a formada pels coeficients de la relacio
B = x 1 A1 + x 2 A2 + + x n An .
Aleshores, per a cada i = 1, 2, . . . , n tenim que

det(A

i
^

A B A ) =
2

n
X

det(A

i
^

A x k Ak An )
2

k=1

= xi det(A1

A 2 Ai A n ) ,

don es dedueix que


xi =

det(A1
det(A1

A2 B An )
.
A 2 Ai A n )

Exemples 2.14 (a) Estudiem novament un sistema que en el captol anterior havem resolt pel
m`etode de Gauss:

x + 4y + 3z = 1

2x + 5y + 4z = 4 .

x 2y 2z = 3
Lescriurem matricialment posant


1
4
3
x
1
2
5
4 y = 4 .
1 2 2
z
3

29

R. Amer i F. Carreras

El determinant de la matriu dels coeficients e s det(A) = 3, per tant es tracta dun


Cramer. La seva solucio e s





1
1 1
1
4
3
3
4 1



4




5
4
4
5 4

2 4
2
3 2 2
1 3 2
1 2 3
x=
= 3,
y=
= 2 ,
z=
3
3
3

sistema de





= 2.

(b) (Interpolacio polin`omica.) Aquest e s un problema amb cert inter`es pr`actic: donats n punts
del pla dabcisses diferents
(a1 , b1 ), (a2 , b2 ), . . . , (an , bn ) ,
es planteja el problema de determinar un polinomi de grau menor o igual que n 1 i, per tant,
amb n coeficients indeterminats,
f (x) = A0 + A1 x + A2 x 2 + + An1 x n1 ,
la gr`afica del qual passi pels n punts donats. Imposant les condicions obtenim un sistema de n
equacions amb n inc`ognites

A0 + a1 A1 + a12 A2 + + a1n1 An1 = b1

n1
2
A0 + a2 A1 + a2 A2 + + a2 An1 = b2
.
..........................................

A0 + an A1 + a 2 A2 + + a n1 An1 = bn
n

El determinant de la matriu dels coeficients daquest sistema e s conegut com a determinant de


Vandermonde, i e s funcio de a1 , a2 , . . . , an :


1 a1 a1 2 . . . a1 n1


1 a2 a2 2 . . . a2 n1

.
V (a1 , a2 , . . . , an ) =

......................
1 an an 2 . . . an n1
Demostrem per induccio que aquest determinant e s el producte de les difer`encies entre els ai , e s
a dir,
Y
V (a1 , a2 , . . . , an ) =
(a j ai ) .
i< j

El cas n = 2 e s trivial. Considerem el polinomi


g(x) = V (a1 , a2 , . . . , an1 , x)

30

Determinants

R. Amer i F. Carreras

que, o` bviament, sanulla per a x = a1 , x = a2 , . . . , x = an1 i e s de grau n 1, i per tant e s


de la forma
g(x) = (x a1 )(x a2 ) (x an1 ) .
Com que e s el coeficient de x n1 , coincideix amb V (a1 , a2 , . . . , an1 ), que per hip`otesi dinduccio e s
Y
(a j ai ) .
i< j<n

Per tant
V (a1 , a2 , . . . , an ) = g(an ) = (an a1 )(an a2 ) (an an1 )

Y
i< j<n

(a j ai ) =

(a j ai ) .

i< j

Lexpressio obtinguda per al determinant de Vandermonde ens diu que V (a1 , a2 , . . . , an ) 6= 0,


de manera que el sistema dequacions e s de Cramer i el problema de la interpolacio polin`omica
admet sempre una u nica solucio.

Pretenem ara generalitzar la filosofia de la regla de Cramer i resoldre sistemes dequacions lineals
arbitraris. Nomes necessitem introduir les nocions de menor duna matriu i inclusio de menors.
Un menor dordre r duna matriu A Mmn (R) e s el determinant duna submatriu formada per
la interseccio de r files i r columnes de A escollides arbitr`ariament. (Per abus de llenguatge,
sanomena tambe menor a la pr`opia submatriu.) Direm que un menor M 0 conte a un menor M si
les files i columnes que determinen M formen part, respectivament, de les files i columnes que
determinen M 0 .
Si AX = B e s un sistema dequacions lineals m n representat matricialment, direm que la
matriu Aa = A | B, obtinguda per juxtaposicio de la columna dels termes independents, e s la
matriu ampliada del sistema.
Suposem que M e s un menor regular m`axim de A, e s a dir, que no el conte cap altre menor regular
de A. En el captol 3, veurem que si M tambe e s un menor regular m`axim de Aa aleshores el
sistema e s compatible. Suposemho aix i posem que M sigui dordre r . Veurem tambe que, si
r < m, totes les equacions que no intervenen a M son redundants i poden, per tant, suprimir
se, de manera que podem suposar r = m. Ara, si r = n el sistema e s de Cramer i sabem com
resoldrel. Si r < n, primer passarem a formar part dels termes independents de les equacions els
termes de les inc`ognites que no intervenen a M, les quals faran de par`ametres lliures. Resolent
el sistema de Cramer resultant obtindrem les r inc`ognites principals en funcio de les n r que
hem deixat com a par`ametres.

31

R. Amer i F. Carreras

Exemple 2.15 Considerem el sistema

2x + y z + t = 1

x + y z + 2t = 3
.
3x + 2y z + 3t = 6

6x + 4y 3z + 6t = 10
Preparem simult`aniament la matriu dels coeficients i la matriu ampliada:

2 1 1 1 1
1 1 1 2 3

3 2 1 3 6 .

6 4 3 6 10
Com que el menor


2 1 1


M = 1 1 1
3 2 1
e s diferent de zero i els cinc menors 44 de la matriu Aa son nuls, M e s un menor regular m`axim
de A i de Aa , i per tant el sistema e s compatible indeterminat. Suprimint la darrera equacio i
passant a la dreta els termes de linc`ognita t, queda el sistema de Cramer (respecte x, y, z)

2 1 1
x
1t
1 1 1 y = 3 2t ,
3 2 1
z
6 3t
que, resolt per la regla de Cramer o be invertint la matriu M, ens dona com a solucio general del
sistema original, en funcio de la inc`ognita t com a par`ametre lliure,
x = 2 + t ,

y = 7 3t ,

z = 2,

t =t.

32

R. Amer i F. Carreras

Determinants

R. Amer i F. Carreras

33

3
Espais vectorials

Aquest captol i el seguent i, de fet, tots els altres tracten essencialment dels espais num`erics
Rn , prototipus dels espais vectorials de dimensio finita, i dels seus subespais. El punt central e s
el concepte de dimensio, del qual deriva la nocio de rang que apareix constantment a la pr`actica.

3.1 Lespai vectorial num`eric Rn


Recordem que les propietats dordenacio total i completitud del conjunt R dels nombres reals
permeten representar-los biunvocament com a punts duna recta una vegada escollits en ella
lorigen i la unitat de longitud, rao per la qual aquests nombres sanomenen sovint escalars.
n
^

El smbol Rn representar`a el producte cartesi`a RR R. Un element gen`eric daquest conjunt, des dara un vector de Rn , e s de la forma u = (x1 , x2 , . . . , xn ). Els nombres x1 , x2 , . . . , xn
son les components del vector u, i recordem que, si v = (y1 , y2 , . . . , yn ), es compleix que u = v
si, i nomes si, xi = yi per a i = 1, 2, . . . , n.
Es defineixen dues operacions b`asiques. La suma de dos vectors u, v Rn e s el vector u + v =
(x1 + y1 , x2 + y2 , . . . , xn + yn ). El producte dun vector u Rn per un escalar t R e s el
vector tu = (t x1 , t x2 , . . . , t xn ). Les propietats fonamentals daquestes operacions totes de
f`acil comprovacio son les seguents:

34

R. Amer i F. Carreras

Espais vectorials

(a) Associativa de la suma: (u + v) + w = u + (v + w).


(b) Commutativa de la suma: u + v = v + u.
(c) Neutre de la suma: existeix un vector 0 tal que 0 + u = u per a tot u Rn .
(d) Oposats per la suma: per a cada vector u existeix un vector u tal que u + (u) = 0.
(e) Distributiva del producte per a la suma de vectors: t (u + v) = tu + tv.
(f) Distributiva del producte per a la suma descalars: (t + s)u = tu + su.
(g) Associativitat dels productes: t (su) = (ts)u.
(h) Unitat: 1u = u.
Es diu que Rn , dotat amb les dues operacions descrites que compleixen aquestes propietats, e s
un espai vectorial, lespai vectorial num`eric de dimensio n. En general:
Definicio 3.1 Tot conjunt provist duna suma interna i un producte per escalars que compleixen
les propietats (a)(h) e s un espai vectorial real.
Els conjunts de matrius dun mateix tipus, els Mmn (R), tambe son espais vectorials reals. De
fet, podem identificar Rn amb M1n (R) o Mn1 (R), segons escrivim els vectors en fila o en
columna.
Si el producte est`a definit per a tot t C (conjunt dels nombres complexos), es parla despai
vectorial complex: aquest seria, per exemple, el cas de Cn o Mmn (C).
Observacions 3.2 (a) Tornant a Rn , la difer`encia de dos vectors u i v es defineix com u v =
u + (v), i el quocient dun vector u per un escalar t 6= 0 com
u
1
= u.
t
t
Les propietats daquestes dues operacions secund`aries son les derivades de (a)(h).
(b) R2 ser`a anomenat simplement el pla, i R3 lespai. Aquests dos espais vectorials admeten
la representacio gr`afica habitual, una vegada escollits lorigen, la unitat de longitud i uns eixos
perpendiculars entre si. Daquesta manera, lespai, per exemple, coincideix amb lespai dels
vectors lliures usual en la Fsica: hom pot identificar els vectors (1, 0, 0), (0, 1, 0) i (0, 0, 1) de
R3 amb E , E i kE respectivament, i escriure
u = (x1 , x2 , x3 ) = x1E + x2 E + x3 kE .
La suma correspon, geom`etricament, a la regla del parallelogram, i el producte per escalars a la
prolongacio proporcional dels vectors en un sentit o laltre segons el signe del factor escalar.

R. Amer i F. Carreras

35

Un subconjunt S Rn e s un subespai vectorial de Rn si compleix les condicions seguents:


(1) 0 S.
(2) u, v S H u + v S.
(3) u S H tu S per a tot t R.
La condicio (1) expressa que S 6= . Les altres dues garanteixen que la suma i la multiplicacio
per escalars restringides a S son operacions internes de S. Com que les propietats (a)(h) romanen v`alides dins de S, aquest conjunt e s, per ell mateix, un espai vectorial real. Per tant, les
definicions i els resultats que dara endavant sestableixen per a espais vectorials son aplicables
no nomes a Rn sino tambe als seus subespais.
Exemples 3.3 (a) {0} i Rn son els anomenats subespais trivials de Rn .
(b) Cada vector e 6= 0 de Rn defineix el subespai h e i = {te ; t R }, anomenat recta engendrada per e. En el cas del pla R2 , aquest e s lunic tipus possible de subespai no trivial.
(c) Tota equacio lineal homog`enia a1 x1 + a2 x2 + + an xn = 0 defineix un subespai de Rn ,
format pels vectors u = (x1 , x2 , . . . , xn ) que la satisfan. Mes en general, e s igualment f`acil
veure que el conjunt de les solucions de qualsevol sistema dequacions lineals homog`enies amb
n inc`ognites e s un subespai de Rn . Aquesta e s una de les dues maneres habituals de descriure un
subespai: donantne les equacions implcites.

3.2 Depend`encia lineal


Sigui E un espai vectorial real (per fixar idees, el lector pot suposar que E e s Rn , o qualsevol
dels seus subespais).
Un vector v e s combinacio lineal dels vectors u 1 , u 2 , . . . , u m si existeixen escalars t1 , t2 , . . . , tm
tals que
t1 u 1 + t2 u 2 + + tm u m = v .
El vector 0, per exemple, e s combinacio lineal de qualsevol conjunt de vectors.
Els vectors u 1 , u 2 , . . . , u m son linealment dependents si existeix alguna combinacio lineal no
trivial (es a dir, amb algun coeficient no nul) daquests vectors que dona 0. Per tant, direm que
u 1 , u 2 , . . . , u m son linealment independents si
t1 u 1 + t2 u 2 + + tm u m = 0

t1 = t2 = = tm = 0 .

36

R. Amer i F. Carreras

Espais vectorials

Observacions 3.4 (a) Estudiar si un vector v Rn e s combinacio lineal de u 1 , u 2 , . . . , u m


condueix a discutir un sistema de n equacions lineals: les inc`ognites son t1 , t2 , . . . , tm , els seus
coeficients son les components dels vectors u 1 , u 2 , . . . , u m escrites en columna i els termes independents son les components de v. La resposta e s afirmativa si, i nomes si, el sistema e s
compatible.
(b) An`alogament, per saber si u 1 , u 2 , . . . , u m son linealment independents es planteja un sistema
que coincideix amb lanterior excepte en els termes independents, que aqu son tots nuls. Ara, els
vectors son linealment independents si, i nomes si, el sistema (homogeni i, per tant, compatible)
e s determinat.
Proposicio 3.5 Els vectors u 1 , u 2 , . . . , u m son linealment dependents si, i nomes si, algun dells
e s combinacio lineal dels restants.
D EMOSTRACI O . (H) Si son linealment dependents, existir`a una relacio de depend`encia
t1 u 1 + t2 u 2 + + tm u m = 0
amb algun coeficient no nul. Sense perdre generalitat podem suposar que t1 6= 0; aleshores tenim
que
tm
t2
u1 = u2 um ,
t1
t1
i aix`o demostra que u 1 e s combinacio lineal dels restants.
(H) Si, per exemple, u 1 = s2 u 2 + + sm u m , apareix la relacio
u 1 s2 u 2 sm u m = 0 ,
on almenys el coeficient de u 1 no e s nul. Per tant, u 1 , u 2 , . . . , u m son linealment dependents.
De manera equivalent, es pot enunciar: els vectors u 1 , u 2 , . . . , u m son linealment independents
si, i nomes si, cap dells e s combinacio lineal dels altres.
Proposicio 3.6 Si el vector v e s combinacio lineal dels vectors u 1 , u 2 , . . . , u m , ho e s de forma
u nica si, i nomes si, u 1 , u 2 , . . . , u m son linealment independents.
D EMOSTRACI O . (H) Suposem que v sexpressa de manera u nica com a combinacio lineal
dels vectors u 1 , u 2 , . . . , u m :
v = s1 u 1 + s2 u 2 + + sm u m .

R. Amer i F. Carreras

37

Aleshores, si
t1 u 1 + t2 u 2 + + tm u m = 0 ,
sumant les dues igualtats tindrem que
v = (t1 + s1 )u 1 + (t2 + s2 )u 2 + + (tm + sm )u m ,
i de la unicitat de lexpressio de v es dedueix que ti + si = si per a tot i = 1, 2, . . . , m. Per tant,
t1 = t2 = = tm = 0 i els vectors u 1 , u 2 , . . . , u m son linealment independents.
(H) Si

v = t1 u 1 + t2 u 2 + + tm u m
v = s1 u 1 + s2 u 2 + + sm u m

son dues expressions de v com a combinacio lineal de u 1 , u 2 , . . . , u m , en restar-les obtenim


(t1 s1 )u 1 + (t2 s2 )u 2 + + (tm sm )u m = 0 .
La independ`encia lineal daquests vectors implica que ti si = 0 per a i = 1, 2, . . . , m, e s a dir,
v sexpressa de manera u nica com a combinacio lineal de u 1 , u 2 , . . . , u m .
Proposicio 3.7 Si u m e s combinacio lineal de u 1 , u 2 , . . . , u m1 , aleshores tot vector que sigui
combinacio lineal de u 1 , u 2 , . . . , u m tambe ho e s de u 1 , u 2 , . . . , u m1 .
D EMOSTRACI O . Suposem que u m = s1 u 1 + s2 u 2 + + sm1 u m1 . Si
v = t1 u 1 + t2 u 2 + + tm u m ,
nomes cal substituir en aquesta relacio lexpressio anterior de u m per obtenir
v = (t1 + s1 tm )u 1 + (t2 + s2 tm )u 2 + + (tm1 + sm1 tm )u m1 .
Un conjunt {u 1 , u 2 , . . . , u m } de vectors de E e s un sistema de generadors de E si tots els vectors
daquest espai son combinacio lineal de u 1 , u 2 , . . . , u m .
Una base de E e s un sistema de generadors linealment independents de E. Si hem escollit una
base B = {e1 , e2 , . . . , en } de E, cada vector u E sescriu de forma u nica com
u = x1 e1 + x2 e2 + + xn en .
Els coeficients x1 , x2 , . . . , xn daquesta combinacio lineal son les components de u en la base
B. Habitualment, les bases i per tant les llistes de components dels vectors es consideren
ordenades.

38

R. Amer i F. Carreras

Espais vectorials

Exemples 3.8 (a) La base can`onica de Rn e s la formada pels vectors


e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1),
i es representa per Bc . Les components dun vector u = (x1 , x2 , . . . , xn ) en aquesta base son,
precisament, x1 , x2 , . . . , xn .
(b) Generalitzant la idea de recta engendrada per un vector, obtindrem la segona manera habitual
de descriure un subespai. Donats u 1 , u 2 , . . . , u m Rn , es defineix el subespai engendrat per
aquests vectors com el conjunt de totes les seves combinacions lineals, e s a dir,
hu 1 , u 2 , . . . , u m i = {t1 u 1 + t2 u 2 + + tm u m ; t1 , t2 , . . . , tm R}
clar que {u 1 , u 2 , . . . , u m } e s
(el lector comprovar`a que aix`o e s, efectivament, un subespai). Es
un sistema de generadors daquest subespai. Si els vectors son linealment independents, formen
una base del subespai; si no ho son, la proposicio anterior ens dona un procediment recursiu
per eliminar vectors daquest sistema fins a obtenir-ne un subconjunt de generadors linealment
independents que, aleshores, ser`a una base del subespai: nomes cal suprimir els vectors que
siguin combinacio lineal dels anteriors.
Teorema 3.9 Suposem que u 1 , u 2 , . . . , u k son vectors linealment independents de E, i que
e1 , e2 , . . . , em formen un sistema de generadors del mateix espai. Aleshores, k m.
D EMOSTRACI O . Com que e1 , e2 , . . . , em generen lespai E, els vectors u 1 , u 2 , . . . , u k son combinacio lineal dells:
u 1 = a11 e1 + a21 e2 + + am1 em ,
u 2 = a12 e1 + a22 e2 + + am2 em ,
..
.
u k = a1k e1 + a2k e2 + + amk em .
En substituir aquestes expressions a la combinacio lineal
t1 u 1 + t2 u 2 + + tk u k
i agrupar els coeficients de e1 , e2 , . . . , em obtenim
(a11 t1 + a12 t2 + + a1k tk )e1 +
+(a21 t1 + a22 t2 + + a2k tk )e2 +
+ + (am1 t1 + am2 t2 + + amk tk )em .

R. Amer i F. Carreras

39

Aleshores, si k > m el sistema dequacions

= 0

a21 t1 + a22 t2 + + a2k tk = 0


,
...............................

am1 t1 + am2 t2 + + amk tk = 0


a11 t1 + a12 t2 + + a1k tk

que te m equacions i k inc`ognites, e s indeterminat, e s a dir, te solucions diferents de la trivial, les


quals compleixen que
t1 u 1 + t2 u 2 + + tk u k = 0 .
Aix`o e s una contradiccio, ja que els vectors u 1 , u 2 , . . . , u k son linealment independents. Per tant,
ha de ser k m.
En particular, si B = {e1 , e2 , . . . , en } e s una base de E, k vectors de E amb k > n no poden ser
linealment independents, i k vectors de E amb k < n no poden formar sistema de generadors de
E. Una consequ`encia fonamental e s el resultat seguent.
Teorema 3.10 (Teorema de les bases.) Totes les bases dun espai vectorial E tenen el mateix
nombre de vectors.
D EMOSTRACI O . Siguin B = {e1 , e2 , . . . , en } i B 0 = {e10 , e20 , . . . , em0 } dues bases de E. Si m < n,
B 0 no e s un sistema de generadors, i si m > n, els vectors de B 0 no son linealment independents.
Per tant, m = n.
Observacions 3.11 Suposem que B = {e1 , e2 , . . . , en } e s una base de E.
(a) (Teorema de Steinitz.) Si u 1 , u 2 , . . . , u k son vectors linealment independents de E, es poden
escollir n k vectors de la base B que juntament amb u 1 , u 2 , . . . , u k formin una base de E.
El raonament e s recurrent, comencant pel fet que algun vector de la base B no e s combinacio
lineal de u 1 , u 2 , . . . , u k i, per tant, es pot afegir a ells sense perdres la independ`encia lineal.
(b) Si {u 1 , u 2 , . . . , u n } son vectors linealment independents de E, aquests vectors formen base
de E.
Observem que si no fossin generadors de E existiria algun vector u n+1 de E que no seria combinacio lineal dells, e s a dir, tindrem n + 1 vectors u 1 , u 2 , . . . , u n , u n+1 linealment independents,
en contradiccio amb lexist`encia del sistema de generadors B.

40

R. Amer i F. Carreras

Espais vectorials

(c) Si {u 1 , u 2 , . . . , u n } e s un sistema de generadors de E, aleshores aquests vectors tambe formen


base de E.
En efecte: si els vectors u 1 , u 2 , . . . , u n no fossin linealment independents, algun dells seria
combinacio lineal dels altres, i eliminant-lo obtindrem un sistema de generadors de E amb
n 1 vectors. Una altra contradiccio amb lexist`encia de B.

3.3 Dimensio i rang


En aquesta seccio retrobarem idees que estaven latents en els dos primers captols i que ara
podem establir amb rigor.
Definicio 3.12 La dimensio dun espai vectorial e s el nombre de vectors de qualsevol de les
seves bases. Evidentment, aquesta definicio queda justificada pel teorema de les bases.
El rang dun conjunt de vectors e s la dimensio del subespai que generen: simb`olicament
rang {u 1 , u 2 , . . . , u m } = dim hu 1 , u 2 , . . . , u m i .
`
Exemples 3.13 (a) Obviament,
dim(Rn ) = n. I, per conveni, es pren dim{0} = 0.
(b) Si e 6= 0, dimhei = 1. Si S e s el subespai de R3 definit per lequacio 3x 2y z = 0, tenim
que dim(S) = 2, perqu`e els vectors de S es poden escriure en la forma
(x, y, z) = (x, y, 3x 2y) = x(1, 0, 3) + y(0, 1, 2).
En general, una recta e s un subespai de dimensio 1, un pla e s un subespai de dimensio 2, i un
hiperpla de Rn e s un subespai de dimensio n 1.
(c) Algunes vegades cal fer servir que si S e s un subespai de E, i dim(S) = dim(E), aleshores
S = E.
(d) I sempre e s bo tenir present que la dimensio e s el nombre de par`ametres lliures que cal donar
per determinar un vector de lespai considerat (nombre de graus de llibertat). Aix veiem, per
exemple, sense necessitat dexplicitar una base, que
dim Mmn (R) = mn.
El rang duna matriu A Mmn (R) e s el rang del conjunt de les seves columnes, e s a dir, la
dimensio del subespai generat per les n columnes de A interpretades com a vectors de Rm .

R. Amer i F. Carreras

41

De vegades es distingeix entre el rang que acabem de definir, que sanomena rang per columnes de A, escrit rangC (A), i el concepte an`aleg de rang per files de A, escrit rang F (A), e s a
dir, la dimensio del subespai generat per les m files de A interpretades com a vectors de Rn .
Demostrarem en aquesta mateixa seccio que rangC (A) = rang F (A) per a tota matriu A.
Sigui A una matriu quadrada n n, i u 1 , u 2 , . . . , u n Rn els vectors que, escrits en la base
can`onica, formen les columnes de A. Recollim en el resultat seguent les diverses caracteritzacions de les matrius regulars.
Teorema 3.14 Son equivalents:
(a) A e s regular.
(b) det(A) 6= 0.
(c) La triangulacio de A dona lloc a n pivots.
(d) u 1 , u 2 , . . . , u n son linealment independents (es a dir, formen base de Rn ).
(e) rang(A) = n.

D EMOSTRACI O . (a) i (b) son equivalents segons hem vist en el captol anterior, i (d) i (e) ho son
per la definicio de rang duna matriu. La demostracio quedar`a completa veient que
(b) H (d) H (c) H (b) .
(b) H (d) Si considerem el sistema homogeni que permet estudiar la independ`encia lineal de
u 1 , u 2 , . . . , u n , la condicio det(A) 6= 0 ens diu que es tracta dun sistema de Cramer i, per tant,
compatible determinat: aix`o significa que u 1 , u 2 , . . . , u n son linealment independents.
(d) H (c) Si els vectors son linealment independents, la triangulacio del sistema anterior ha de
donar lloc a n pivots, per tal que sigui determinat.
(c) H (b) La triangulacio de la matriu A nomes modifica det(A) segons un factor de proporcionalitat no nul; si han aparegut n pivots, el determinant ser`a diferent de zero.

A continuacio, estudiarem dos procediments per calcular el rang duna matriu arbitr`aria A
Mmn (R), lun pel m`etode de Gauss i laltre per determinants.
Proposicio 3.15 El nombre de pivots que apareixen en triangular una matriu A coincideix amb
el seu rang i, per tant, e s independent del cam seguit per triangular-la.

42

R. Amer i F. Carreras

Espais vectorials

D EMOSTRACI O . Considerem el sistema homogeni que permet estudiar la depend`encia lineal


entre les columnes u 1 , u 2 , . . . , u n de la matriu A. Una vegada triangulat, hauran aparegut, diguem, r pivots. Aix`o significa que les r columnes on figuren aquests pivots son linealment
independents, perqu`e el sistema homogeni corresponent e s compatible determinat. I que cada
una de les restants e s combinacio lineal delles, perqu`e el sistema que tradueix aquesta questio
e s compatible. En definitiva, r = rang(A).
Lema 3.16 El rang duna matriu A e s r si, i nomes si, existeix un menor regular m`axim dordre
r.

D EMOSTRACI O . Posem r 0 = rang(A). En primer lloc r r 0 , perqu`e si hi ha un menor regular dordre r les seves subcolumnes, i per tant les columnes senceres que hi intervenen, son
linealment independents.
Daltra banda, r 0 r , perqu`e si hi ha r 0 columnes linealment independents en podem extreure,
aplicant la proposicio anterior, un menor regular dordre r 0 .

Corol.lari 3.17 Per a qualsevol matriu A es compleix que rang(A) = rang(At ), e s a dir, rangC (A) =
rang F (A).

immediata a partir de la caracteritzacio del rang donada pel lema anterior i


D EMOSTRACI O . Es
del fet que el determinant de tota matriu coincideix amb el de la seva transposada.

Proposicio 3.18 El rang duna matriu A e s r si, i nomes si, existeix algun menor regular dordre
r i tots els menors dordre r + 1 que el contenen son nuls.

D EMOSTRACI O . (H) Nomes cal aplicar el lema anterior.


(H) Suposem que u 1 , u 2 , . . . , u r son les columnes que defineixen el menor regular. Nomes
cal veure que qualsevol altra columna u j e s combinacio lineal daquestes. Segons una de les
propietats caracterstiques de les matrius regulars, el rang per files de la matriu definida per
u 1 , u 2 , . . . , u r , u j e s r . Pel corol.lari anterior, el rang (per columnes) daquesta matriu tambe e s
r , i aix`o vol dir que u j e s combinacio lineal de u 1 , u 2 , . . . , u r .

R. Amer i F. Carreras

43

Teorema 3.19 (Teorema de Rouche-Frobenius.) (a) El sistema dequacions lineals AX = B e s


compatible si, i nomes si, rang(A) = rang(Aa ).
(b) Si e s compatible, el sistema e s determinat si, i nomes si, rang(A) = n, on n e s el nombre
dinc`ognites del sistema.

D EMOSTRACI O . (a) Si A1 , A2 , . . . , An son les columnes de A, la condicio de compatibilitat e s


equivalent a que
B hA1 , A2 , . . . , An i ,
e s a dir,
hA1 , A2 , . . . , An i = hA1 , A2 , . . . , An , Bi ,
i aix`o e s equivalent a que rang(A) = rang(Aa ).
(b) Suposant satisfeta la condicio anterior, el fet que el sistema sigui determinat equival a que B
sigui combinacio lineal u nica de A1 , A2 , . . . , An , i aix`o passa si, i nomes si, aquests vectors son
linealment independents, e s a dir, si, i nomes si, rang(A) = n.
Observacions 3.20 (a) Cal destacar que lestudi del rang duna matriu A ens permet escollir un
conjunt m`axim de columnes (o files) linealment independents.
(1) Si apliquem el m`etode de Gauss, seran aquelles on hagin aparegut els pivots.
(2) Si fem servir determinants, seran aquelles que intervenen en el menor regular m`axim. Aix`o
justifica el procediment de resolucio de sistemes que hem exposat al final del captol 2.
(b) Quan es tracta de discutir el tipus dun sistema dequacions lineals amb coeficients que depenen dun o mes par`ametres, es convenient fer u s del teorema de RoucheFrobenius i seguir la
regla pr`actica seguent: igualar a 0 un menor dordre m`axim de la matriu ampliada Aa .

3.4 Subespais vectorials de Rn


Hi ha dues formes b`asiques de descriure un subespai S de Rn : donant un sistema de generadors
o be donant un sistema dequacions lineals homog`enies que caracteritzen els vectors de S, les
anomenades equacions implcites del subespai. En primer lloc ens ocuparem de veure com es
passa duna forma a laltra i com es troba una base i la dimensio del subespai.
(a) Donat S = hu 1 , u 2 , . . . , u m i, el c`alcul duna base de S e s equivalent al c`alcul del rang de
la matriu A formada per les components daquests vectors escrites en columna, el qual ser`a la
dimensio del subespai.

44

Espais vectorials

R. Amer i F. Carreras

Si apliquem el m`etode de Gauss triangulant la matriu A, la dimensio de S e s el nombre de pivots


que en resulten, i els vectors corresponents a les columnes on apareixen aquests pivots formen
una base de S.
Si operem amb determinants, la dimensio de S e s el tamany del menor regular m`axim de A, i els
vectors corresponents a les columnes involucrades en aquest menor formen una base de S.
(b) Per obtenir les equacions implcites dun subespai S a partir duna base {u 1 , u 2 , . . . , u r } de
S, hem dimposar a un vector gen`eric v = (x1 , x2 , . . . , xn ) que sigui combinacio lineal dels
anteriors. A la pr`actica, preparem la matriu ampliada Aa que resulta dafegir a A la columna de
les components de v i imposem la condicio rang(Aa ) = r .
Si apliquem el m`etode de Gauss, despres de triangular A anul.larem els coeficients de la columna
nova que donarien un pivot addicional; si fem servir determinants, una vegada localitzat el menor
que indica el rang de A anul.larem els menors dordre r + 1 que el contenen i es formen afegint
part de la columna nova.
(c) Finalment, donades les equacions implcites dun subespai S, cal resoldre el sistema (pel
m`etode de Gauss, per determinants o per qualsevol altre procediment) per obtenir una base del
subespai. Notem que, en aquest cas, si el rang de la matriu del sistema e s r , la dimensio del
subespai S e s n r , e s a dir, el nombre de graus de llibertat del sistema.

Exemples 3.21 (a) C`alcul de la dimensio, una base i les equacions implcites del subespai de
R4 , S = h(1, 2, 1, 0), (1, 3, 2, 1), (1, 4, 5, 2), (1, 2, 0, 4)i.
Triangulem la matriu ampliada

1
2

1
0

1
3
2
1

1
4
5
2

1
2
0
4

x
y
.
z
t

Aix`o ens permetr`a seleccionar una base dentre els generadors de S, con`eixer la dimensio del
subespai i, finalment, obtenirne les equacions implcites.

1
2

1
0

1
3
2
1

1
4
5
2

1
2
0
4


x
1

y 0
'
z 0
t
0

1
1
3
1

1
2
6
2

1
0
1
4



x

2x + y

x+z


t

45

R. Amer i F. Carreras

'

1
0
0
0

1
1
0
0

1
2
0
0

1
0
1
4



x


2x + y

7x 3y + z

2x y + t


'

1
0
0
0

1
1
0
0

1
2
0
0

1
0
1
0



x


2x + y


7x 3y + z


26x + 11y 4z + t

Daqu resulta que dim(S) = 3, que els vectors (1, 2, 1, 0), (1, 3, 2, 1) i (1, 2, 0, 4) formen una
base de S i que lequacio implcita daquest subespai e s
26x + 11y 4z + t = 0 .
(b) C`alcul duna base del subespai S de R4 definit per les equacions

x + y + z t = 0

x + 2y z + t = 0 .

3x + 5y z + t = 0
Operarem amb determinants. La matriu del sistema e s

1 1
1 1 0
1 2 1
1 0 .
3 5 1
1 0
Un menor regular m`axim e s


1 1


1 2 ,
i aix`o ens diu que el rang del sistema e s 2 i, per tant, dim(S) = 4 2 = 2. A mes, podem
suprimir la tercera equacio i guardar x i y com a inc`ognites principals. Queda, doncs, un sistema
de Cramer respecte daquestes dues inc`ognites,
)
x + y = z + t
,
x + 2y = z t
la solucio general del qual e s
x = 3z + 3t,

y = 2z 2t,

z = z,

t = t.

El vector
u = (3z + 3t, 2z 2t, z, t) = z(3, 2, 1, 0) + t (3, 2, 0, 1) ,
on z i t son els par`ametres lliures, e s lelement gen`eric del subespai S. Els vectors (3, 2, 1, 0)
i (3, 2, 0, 1) formen una base de S.
Recomanem al lector que torni a resoldre aquests dos exemples, operant en el primer cas per
determinants i en el segon pel m`etode de Gauss.

46

R. Amer i F. Carreras

Espais vectorials

La resta daquesta seccio es dedica a lestudi de les operacions habituals amb subespais de Rn .
La interseccio de dos subespais S i T e s tambe un subespai, que es representa per S T . Naturalment, la manera mes directa de descriurel e s reunir en un sol sistema les equacions implcites
de S i les de T .
La suma de dos subespais e s el subespai representat per S + T i format per totes les sumes de la
forma u + v, on u S i v T . La manera mes directa de descriurel e s reunir en un sol conjunt
un sistema de generadors de S i un de T , la qual cosa ens dona un sistema de generadors de
S + T . En general, tot i prenent bases de cadascun dels subespais, es pot perdre la independ`encia
lineal quan les ajuntem. Aix`o motiva la definicio seguent.
Es diu que la suma de dos subespais S i T e s directa, i sescriu S T , si cada vector de la suma
sescriu de manera u nica com a suma dun vector de S i un vector de T . Es f`acil veure que aix`o
equival a que
u + v = 0, u S, v T H u = v = 0 .
Donades dues bases B de S i B 0 de T , S + T e s directa si, i nomes si, B B 0 e s un conjunt
linealment independent, i aquesta e s, potser, la caracteritzacio mes u til a la pr`actica. Finalment,
la condicio de suma directa tambe e s equivalent a que S T = {0}.
Totes les definicions i resultats anteriors (amb lunica excepcio del criteri de la interseccio que
acabem dexposar per a la suma directa) es generalitzen immediatament al cas de mes de dos
subespais.
Es diu que dos subespais S i T son suplementaris si S T = Rn . Els subespais {0} i Rn son
suplementaris. Per a qualsevol altre subespai S e s f`acil trobar un suplementari: ampliant una
base {u 1 , u 2 , . . . , u r } de S fins a obtenir una base {u 1 , u 2 , . . . , u r , u r +1 , . . . , u n } de Rn , e s f`acil
veure que el subespai T = hu r +1 , . . . , u n i e s un suplementari de S.
Teorema 3.22 (Formula de Grassmann.) Siguin S i T subespais de Rn .
(a) Quan S T = {0}, dim(S T ) = dim(S) + dim(T ).
(b) En general, dim(S + T ) = dim(S) + dim(T ) dim(S T ).
D EMOSTRACI O . (a) Es dedueix immediatament de la caracteritzacio de suma directa per reunio
de bases.
(b) Escollim un suplementari S1 de S T respecte a S, de manera que S = S1 (S T ).
An`alogament, escollim T1 tal que T = T1 (S T ). Ara no e s difcil comprovar que S1 , S T

47

R. Amer i F. Carreras

i T1 formen suma directa i que


S1 (S T ) T1 = S + T.
Aplicant la formula de lapartat (a) resulta que
dim(S + T ) = dim(S1 ) + dim(S T ) + dim(T1 )
= dim(S) + dim(T ) dim(S T ) .

3.5 Canvis de base


Dedicarem aquesta darrera seccio a plantejar i resoldre el problema del canvi de base, i ser`a
suficient illustrarlo a Rn . Considerem dues bases,
B = {e1 , e2 , . . . , en }

B 0 = {e10 , e20 , . . . , en0 } .

Per fixar idees, direm que B e s la base vella i B 0 e s la base nova. Cada vector u Rn queda
determinat tant per les seves components (x1 , x2 , . . . , xn ) en la base B, que son els coeficients
de la combinacio lineal
u = x1 e1 + x2 e2 + + xn en ,
com per les seves components (x10 , x20 , . . . , xn0 ) en la base B 0 , que son els coeficients de
u = x10 e10 + x20 e20 + + xn0 en0 .
Es tracta de trobar la relacio entre unes components i les altres. Per a aix`o, necessitem con`eixer
com sexpressen els vectors nous en funcio dels vells, e s a dir, les relacions
e0j

n
X

ai j ei

j = 1, 2, . . . , n .

per a

i=1

Substituint aquestes relacions i calculant, obtenim


n
X

xi ei = u =

i=1

n
X

x j0 e0j =

j=1

n
n X
X

n
X

x j0

j=1

ai j x j0 ei =

j=1 i=1

n
X
i=1

n
n
X
X
i=1


ai j ei =

ai j x j0

j=1

i, comparant els extrems daquestes igualtats,


xi =

n
X
j=1

ai j x j0

per a i = 1, 2, . . . , n .

ei ,

48

Espais vectorials

R. Amer i F. Carreras

Aquestes relacions resolen la questio, per`o e s convenient expressarles en forma matricial.


Denotarem el canvi de base que estem considerant per
C

(Rn , B 0 ) (Rn , B) ,
i anomenarem matriu del canvi de base de B 0 a B a la matriu

a11 a12 . . . a1 j . . .
a21 a22 . . . a2 j . . .

... ... ... ... ...


C =
ai1 ai2 . . . ai j . . .

... ... ... ... ...


an1 an2 . . . an j . . .

a1n
a2n
...
ain
...
ann

que ens dona, per columnes, les components de cadascun dels vectors nous en la base dels vectors
vells.
Si X i X 0 representen, respectivament, les matrius columna formades amb les components de u
en les bases B i B 0 , tenim, com a expressio matricial de les relacions entre components que hem
deduit anteriorment,
X = C X0 ,
que e s la formula matricial del canvi de base i expressa les components velles dun vector
arbitrari en funcio de les noves.
Pel teorema de caracteritzacio de les matrius regulars vist a la seccio 3 daquest captol, sabem que la matriu C e s regular. Per tant, si volem calcular les components noves dun vector
coneixent les velles, farem servir la relacio inversa,
X 0 = C 1 X ,
observant que C 1 e s precisament la matriu del canvi de base de B a B 0 . Resumim tota la
informacio obtinguda en el resultat seguent.
Teorema 3.23 (a) Si C e s la matriu del canvi de base de B 0 a B, que descriu per columnes els
vectors de la base B 0 en funcio de la base B, la relacio
X = C X0
expressa les components dun vector en la base B en funcio de les seves components en la base
B0 .
(b) C 1 e s la matriu del canvi de base invers:
C 1

(Rn , B) (Rn , B 0 ) ,

X 0 = C 1 X .

49

R. Amer i F. Carreras

Exemples 3.24 (a) Els vectors e10 = (1, 1, 1), e20 = (1, 1, 2) i e30 = (0, 1, 1) formen una base B 0
de R3 . Si Bc denota la base can`onica, el canvi de base natural i la seva matriu son

1 1 0
C
(R3 , B 0 ) (R3 , B c ) ,
C =1 1 1 .
1 2 1
La relacio entre les components can`oniques (x, y, z) dun vector arbitrari u de R3 i les components (x 0 , y 0 , z 0 ) del mateix vector u en la base B 0 son


0
0
0

x
1 1 0
x
x = x + y
y = 1 1 1 y 0 , e s a dir,
y = x 0 + y0 + z0

z
1 2 1
z
z = x 0 + 2y 0 + z 0 .
La matriu inversa de C e s

C 1

1
1 1
1 ,
= 0 1
1
1
0

expressa els vectors e1 , e2 , e3 de la base can`onica en funcio dels de B 0 ,


e1 = e10 e30 ,

e2 = e10 e20 + e30 ,

e3 = e10 + e20 ,

i permet invertir la relacio entre les components dels vectors:




x0
1
1 1
x
y 0 = 0 1
1 y ,
z0
1
1
0
z

e s a dir,

x = x + y z
y 0 = y + z

0
z = x + y .

En el cas que es vulgui transformar lequacio dun subespai, i con`eixer, per exemple, lequacio
que tindria en la base nova el pla que en la base can`onica es descriu per 2x y +z = 0, nomes cal
substituir a lequacio donada les expressions de x, y i z que ens dona el canvi de base original.
Aix doncs,
2(x 0 + y 0 ) (x 0 + y 0 + z 0 ) + (x 0 + 2y 0 + z 0 ) = 0 ,
e s a dir, 2x 0 + 3y 0 = 0, e s lequacio del pla en la base B 0 .
(b) En algunes situacions no es coneix dentrada la relacio entre les dues bases, per`o disposem
de la seva relacio amb la base can`onica. Suposem que B 0 i B 00 son les bases, i que sabem les
matrius de canvi a la base can`onica per a cada una:
P

(Rn , B 0 ) (Rn , B c )

Si volem determinar la matriu del canvi denotat per


C

(Rn , B 00 ) (Rn , B c ) .

(Rn , B 00 ) (Rn , B 0 ) ,

50

Espais vectorials

R. Amer i F. Carreras

nomes cal observar que de les relacions P X 0 = X = Q X 00 es dedueix que


X 0 = P 1 Q X 00 ,
per tant la matriu buscada e s
C = P 1 Q .
Per exemple, si tenim la base B 0 de lexemple anterior, i la base B 00 formada pels vectors
e100 = (1, 1, 2),

e200 = (0, 0, 1) i

e300 = (1, 1, 2) ,

resulta

1 1 0
P =1 1 1 ,
1 2 1

1 0 1
1 ,
Q =1 0
2 1
2

0 1 2
1
1 .
C = P 1 Q = 1
0
0
2

R. Amer i F. Carreras

51

4
Lestructura euclidiana de Rn

El producte escalar e s la tercera operacio b`asica amb vectors de Rn . Dell deriven conceptes
m`etrics com lortogonalitat, la norma i langle, que obren el cam a multiples aplicacions geom`etriques i fsiques de l`algebra lineal. Aix, el m`etode dels mnims quadrats que presentem
a la tercera seccio no e s mes que laplicacio de la idea de projeccio ortogonal a lestudi dels
sistemes sobredeterminats.

4.1 El producte escalar


El producte escalar de dos vectors u, v Rn e s el nombre real
u v = x1 y1 + x2 y2 + + xn yn ,
suposant que u = (x1 , x2 , . . . , xn ) i v = (y1 , y2 , . . . , yn ).
immediat comprovar que aquesta operacio e s
Es
(a) definida positiva: u u > 0 per a tot u 6= 0 ;
(b) sim`etrica (commutativa): u v = v u ;
(c) compatible amb el producte per escalars: (tu) v = t (u v) = u (tv) ;

52

R. Amer i F. Carreras

Lestructura euclidiana de Rn

(d) distributiva respecte de la suma: u (v + w) = u v + u w .


Sempre que, a mes de les operacions lineals, es considera el producte escalar, e s habitual denominar a Rn lespai euclidi`a de dimensio n.
Es diu que dos vectors u, v son ortogonals (o perpendiculars), i sescriu u v, si u v = 0. De
manera similar, es diu que dos subespais S i T son ortogonals si u v = 0 per a tot u S i tot
v T.
Proposicio 4.1 (a) Vectors no nuls ortogonals dos a dos son linealment independents.
(b) Subespais ortogonals dos a dos formen suma directa.

D EMOSTRACI O . La idea e s b`asicament la mateixa, per tant provarem nomes lapartat (a). Si
tenim una relacio
t1 u 1 + t2 u 2 + + tk u k = 0
entre vectors no nuls ortogonals dos a dos, fent el producte escalar per qualsevol u i resulta que
ti (u i u i ) = 0
i per tant ti = 0, i aix`o ens diu que u 1 , u 2 . . . , u k son linealment independents.

Teorema 4.2 (M`etode dortogonalitzacio de Gram-Schmidt.) Si u 1 , u 2 , . . . , u m son vectors


linealment independents, existeixen vectors v1 , v2 , . . . , vm ortogonals dos a dos tals que
hu 1 , u 2 , . . . , u j i = hv1 , v2 , . . . , v j i

per a

j = 1, 2, . . . , m .

D EMOSTRACI O . Prenem v1 = u 1 . El segon vector ser`a de la forma v2 = u 2 t1 v1 , i aix`o


assegura que h u 1 , u 2 i = h v1 , v2 i; cal, per`o, imposar que v2 v1 , i aquesta condicio determina
t1 :
v1 u 2
v1 v2 = 0 ,
v1 u 2 t1 v1 v1 = 0 ,
t1 =
.
v1 v1
Suposem obtinguts v1 , v2 ,. . . , vk que satisfan les condicions; prenem ara
vk+1 = u k+1 (t1 v1 + t2 v2 + + tk vk ) ,
expressio que garanteix la segona de les igualtats seguents:
h u 1 , . . . , u k , u k+1 i = h v1 , . . . , vk , u k+1 i = h v1 , . . . , vk , vk+1 i .

53

R. Amer i F. Carreras

Lortogonalitat de vk+1 amb vi per a i = 1, 2, . . . , k dona


vi vk+1 = 0 ,

vi u k+1 ti vi vi = 0 ,

ti =

vi u k+1
,
vi vi

i aquests coeficients t1 , t2 , . . . , tk determinen vk+1 .


Corol.lari 4.3 (a) Tot subespai S 6= {0} de Rn admet bases ortogonals.
(b) Els vectors ortogonals a (tots els vectors de) S formen un subespai S , anomenat suplementari ortogonal de S perqu`e compleix que
S S = Rn

(S ) = S .

D EMOSTRACI O . Ampliem una base qualsevol { u 1 , u 2 , . . . , u r } de S fins a obtenir una base


{ u 1 , u 2 , . . . , u r , u r +1 , . . . , u n } de Rn . Aplicant el m`etode de Gram-Schmidt a aquest conjunt
resulta una base ortogonal de Rn : { v1 , v2 , . . . , vr , vr +1 , . . . , vn }. Com que, segons el teorema,
hu 1 , u 2 , . . . , u r i = hv1 , v2 , . . . , vr i ,
els vectors v1 , v2 , . . . , vr formen una base ortogonal de S, i aix`o demostra lapartat (a).
Daltra banda, e s f`acil veure que hvr +1 , . . . , vn i = S , de manera que S S = Rn . Finalment,
S (S ) , per`o per dimensions veiem que aquesta inclusio e s una igualtat, i aix queda provat
lapartat (b).
Exemples 4.4 (a) C`alcul duna base ortogonal del subespai S = hu 1 , u 2 , u 3 i de R4 , on
u 1 = (1, 1, 0, 1),

u 2 = (0, 0, 1, 1) i

u 3 = (2, 0, 1, 0) .

Aplicant el m`etode Gram-Schmidt a u 1 , u 2 , u 3 tenim:


v1 = u 1 = (1, 1, 0, 1) ;
v1 u 2
1
= ,
v1 v1
3

1
i per tant podem prendre v2 = u 2 /3 v1 = (1, 1, 3, 2), ja que els factors lineals no afecten
la independ`encia lineal ni lortogonalitat; finalment,
v1 u 3
2
v2 u 3
1
v3 = u 3 (tv1 + sv2 ) ,
on
t=
= ,
s=
= ,
v1 v1
3
v2 v2
3

i queda v3 = u 3 2/3 v1 1/3 v2 = (1, 1, 0, 0). En definitiva, els vectors (1, 1, 0, 1),
(1, 1, 3, 2) i (1, 1, 0, 0) formen una base ortogonal de S.
v2 = u 2 tv1 ,

on

t=

(b) Si S e s un pla de R3 dequacio Ax + By + C z = 0, posem w = (A, B, C) i u = (x, y, z).


Lequacio del pla diu, simplement, que w u = 0, per tant u S si, i nomes si, u w, i resulta,
doncs, que S = hwi.

54

Lestructura euclidiana de Rn

R. Amer i F. Carreras

4.2 Norma, angle i projeccio ortogonal


La norma (m`odul o longitud) dun vector u Rn es defineix com
q

k u k = u u = x12 + x22 + + xn2 ,


on u = (x1 , x2 , . . . , xn ).
Proposicio 4.5 La norma compleix les propietats seguents:
(a) k u k > 0 si u 6= 0.
(b) k tu k = | t |k u k per a tot t R.
(c) k u + v k2 = k u k2 + k v k2 si, i nomes si, u v (teorema de Pit`agores).
(d) | u v | k u kk v k (desigualtat de Schwarz).
(e) k u + v k k u k + k v k (desigualtat triangular).
D EMOSTRACI O . (a) Per definicio.
(b) k tu k =

(tu) (tu) = t 2 u u = | t | u u = | t |k u k.

(c) En general es compleix que


k u + v k2 = (u + v) (u + v) = k u k2 + k v k2 + 2u v ,
per tant el teorema de Pit`agores resulta evident.
(d) Si v = 0 es produeix la igualtat; suposem que v 6= 0 i considerem els vectors
u 0 = tv

u 00 = u u 0 ,

on

t=

uv
.
vv

Evidentment u = u 0 + u 00 i, a mes, u 0 u 00 , ja que


u 0 u 00 = (tv) (u tv) =

uv
(u v)2
(u v)
(v v) = 0 ;
vv
(v v)2

aleshores, aplicant el teorema de Pit`agores tindrem que k u k k u 0 k, e s a dir,


ku k

|u v|
|u v|
kvk =
vv
kvk

o be

|u v| k u kk v k .

R. Amer i F. Carreras

55

(e) Aplicant la igualtat que hem fet servir a (c) i la desigualtat de Schwarz tenim que
k u + v k2 = k u k2 + 2u v + k v k2
k u k2 + 2k u kk v k + k v k2 = (k u k + k v k)2 ,
per tant k u + v k k u k + k v k.
Es diu que un vector u e s unitari si k u k = 1. Normalitzar un vector u 6= 0 e s substituir-lo per
u0 =

u
,
ku k

vector que o` bviament e s unitari i conserva les relacions dindepend`encia i ortogonalitat de u


amb altres vectors. Una base formada per vectors unitaris i ortogonals dos a dos es diu que e s
una base ortonormal. La base can`onica de Rn nes lexemple mes senzill. De fet, qualsevol
subespai de Rn admet bases ortonormals: nomes cal fer unitaris els vectors duna base ortogonal
del subespai.
Proposicio 4.6 Si B = {u 1 , u 2 , . . . , u n } e s una base de Rn , i C e s la matriu de canvi de base de
B a la base can`onica,
B e s base ortonormal

C e s ortogonal .

D EMOSTRACI O . Nomes cal observar que els coeficients pi j de la matriu C t C son els productes
escalars dels vectors de B entre ells,
pi j = u i u j ,
i recordar les nocions de vector unitari i vectors ortogonals.
Observacio 4.7 La comprovacio de que una matriu C e s ortogonal equival, segons aquest resultat, a veure que
n
X
i=1
n
X

ci j 2 = 1

ci j cik = 0

per a tot
quan

j 6= k

(columnes unit`aries)
(columnes ortogonals dos a dos) .

i=1

El lector pot comprovar daquesta manera que les matrius seguents son ortogonals:



1 0
0
1
2
2
1 3
1
4
0 0 1 ,
2
1 2 .
,
5 4 3
3
0 1
0
2 2
1

56

Lestructura euclidiana de Rn

R. Amer i F. Carreras

Langle (no orientat) entre dos vectors no nuls u i v de Rn es defineix com


(u, v) = arccos

uv
.
k u kk v k

Per justificar aquesta definicio, observem que, segons la desigualtat de Schwarz,


1

uv
1,
k u kk v k

i, com que la funcio cos : [0, ] [1, 1] e s bijectiva per ser decreixent, existeix un u nic
angle [0, ] tal que
uv
.
cos =
k u kk v k
Aquest angle e s el que hem pres com a (u, v). De la definicio resulta, doncs, que (u, v) =
(v, u). A mes, e s immediat comprovar les propietats seguents:
(a) 0 (u, v) .
(b) u i v son linealment dependents si, i nomes si, (u, v) = 0 o .
(c) u v si, i nomes si, (u, v) = /2 .
(d) Si t, s R,

(
(u, v)
si ts > 0
(tu, sv) =
(u, v) si ts < 0 .

Tambe recuperem, daquesta manera, la formula cl`assica del producte escalar, generalitzada ara
a Rn :
u v = k u kk v k cos (u, v)
(si u = 0 o v = 0, cos (u, v) no est`a definit, per`o es pren u v = 0).
Exemples 4.8 (a) Si B = { e1 , e2 , . . . , en } e s una base ortonormal de Rn i
u = x1 e1 + x2 e2 + + xn en ,
es compleix que xi = u ei = k u k cos i , on i = (u, ei ) per a i = 1, 2, . . . , n; els coeficients
cos i son els cosinus directors de u en la base B, i es pot escriure
u = ku k

n
X
i=1

(cos i )ei ,

amb

n
X

cos2 i = 1 .

i=1

(b) No sempre e s el millor cam fer servir una base ortonormal com a refer`encia. Suposem
que volem determinar les longituds de les diagonals dun parallelogram, del qual coneixem les
longituds dels costats, 2 i 8, i langle agut que formen, 60 . Prenem com a base del pla dos

57

R. Amer i F. Carreras

vectors u i v que representen els costats no parallels. Aleshores les diagonals corresponen als
vectors u + v i u v, i tenint en compte que
u u = k u k2 = 4 ,

v v = k v k2 = 64 ,

u v = k u kk v k cos (u, v) = 2 8 cos 60 = 8 ,


resulta

k u + v k2 = (u + v) (u + v) = k u k2 + 2u v + k v k2 = 84

k u v k = (u v) (u v) = k u k 2u v + k v k = 52 ,

per tant les longituds de les diagonals son 84 i 52.


2

Teorema 4.9 (Teorema de la projeccio ortogonal.) Donat un subespai H de Rn , per a cada


vector u Rn existeix un u nic vector u 0 H tal que u u 0 H . La norma k u u 0 k e s la
mnima dist`ancia entre u i els vectors de H . Es diu que u 0 e s la projeccio ortogonal de u sobre
H.
D EMOSTRACI O . Escollida una base ortogonal B = { e1 , e2 , . . . , er } de H , i donat el vector
u Rn , es tracta de determinar un vector u 0 = t1 e1 + t2 e2 + + tr er . La condicio u u 0 H
es tradueix en que (u u 0 ) ei = 0 per a i = 1, 2, . . . , r , i daqu obtenim que
u ei
ti =
per a i = 1, 2, . . . , r .
ei ei
Aix`o demostra lexist`encia i unicitat del vector u 0 . Ara, si v 0 H , i v 0 6= u 0 , tenim que
u v 0 = (u u 0 ) + (u 0 v 0 ) ;
aplicant el teorema de Pit`agores,
k u v 0 k2 = k u u 0 k2 + k u 0 v 0 k2 > k u u 0 k2 ,
i per tant k u v 0 k > k u u 0 k.
Observacions 4.10 (a) El fet que k u u 0 k sigui mnima sexpressa dient que u 0 e s la millor
aproximacio a u dins de H , i aquesta e s la propietat mes u til de la projeccio ortogonal.
(b) El vector u 00 = u u 0 e s la projeccio ortogonal de u sobre el subespai H . En algun cas
e s mes f`acil calcular primer u 00 i obtenir despres u 0 = u u 00 . La relacio u = u 0 + u 00 e s la
descomposicio u nica de u segons la suma directa H H = Rn .
(c) El sim`etric de u respecte a H e s el vector
u = u 0 u 00 = u 2u 00 = 2u 0 u .
immediat comprovar que k u k = k u k, i que u + u = 2u 0 H .
Es

58

R. Amer i F. Carreras

Lestructura euclidiana de Rn

Exemples 4.11 (a) La projeccio ortogonal dun vector u Rn sobre una recta H = hwi e s,
segons el teorema,
uw
u0 =
w.
ww
(b) Si H e s un pla de R3 , definit per una equacio Ax + By + C z = 0 en la base can`onica o en
qualsevol base ortonormal, sabem que H = hw i, on w = (A, B, C); per tant, donat u R3
tenim
uw
uw
u 00 =
w,
u 0 = u u 00 = u
w.
ww
ww
(c) El sim`etric dun vector u Rn respecte al subespai {0} e s u = u. El sim`etric de u respecte
a una recta H = hwi e s
uw
u = 2
w u.
ww
Finalment, el sim`etric dun vector u R3 respecte a un pla H = hwi e s
u = u 2

uw
w.
ww

4.3 El m`etode dels mnims quadrats


El criteri dels mnims quadrats e s un dels mes habituals a nivell cientfic i t`ecnic. Com a exemple
elemental daplicacio daquest principi, revisarem en primer lloc la nocio de mitjana aritm`etica.
Considerem una s`erie de dades x1 , x2 , . . . , xn i interpretemles com els resultats de n mesuraments duna magnitud X . Qualsevol quantitat x pot ser un valor de centralitzacio de la s`erie
de dades, sempre que satisfaci alguna condicio de proximitat a totes elles com a conjunt. Si
prenem com a mesura de desviacio lexpressio
(x) = (x x1 )2 + (x x2 )2 + + (x xn )2 ,
obtindrem el valor x que minimitza aquesta funcio derivant i igualant a zero:
0 (x) = 2(x x1 ) + 2(x x2 ) + + 2(x xn ) = 0 .
La solucio u nica daquesta equacio e s
x=x=

x1 + x2 + + xn
,
n

expressio que coneixem com a mitjana aritm`etica de les dades x1 , x2 , . . . , xn . La funcio presenta efectivament un mnim absolut en aquest punt, perqu`e la seva gr`afica e s una par`abola i el
coeficient principal e s positiu.

59

R. Amer i F. Carreras

Per tant, la mitjana aritm`etica e s el valor de centralitzacio que minimitza la suma dels quadrats
de les desviacions de les dades. Es pot arribar al mateix resultat aplicant la teoria de la projeccio
ortogonal i projectant el vector x = (x1 , x2 , . . . , xn ) sobre la recta engendrada pel vector w =
(1, 1, . . . , 1): el resultat e s el vector xw, on x e s la mitjana aritm`etica.
Generalitzant aquesta idea, considerem ara un sistema de m equacions lineals amb n inc`ognites

c11 x1 + c12 x2 + + c1n xn = d1

c21 x1 + c22 x2 + + c2n xn = d2


, o matricialment C x = d .
..

cm1 x1 + cm2 x2 + + cmn xn = dm


El sistema e s compatible si, i nomes si, existeix algun vector x Rn tal que k C x d k = 0.
Si e s incompatible (de vegades e s diu que e s un sistema sobredeterminat), el criteri dels mnims
quadrats indica que cal considerar com a solucio aproximada qualsevol vector x que faci mnim
lerror quadr`atic, e s a dir, = k C x d k.
Si c1 , c2 , . . . , cn son les columnes de la matriu C, el sistema e s equivalent a la relacio
x1 c1 + x2 c2 + + xn cn = d .
La incompatibilitat equival a dir que d
/ H = hc1 , c2 , . . . , cn i, i per tant cal trobar la projeccio
0
ortogonal d de d sobre H i despres resoldre
x1 c1 + x2 c2 + + xn cn = d 0
(aquest enfocament inclou, i per tant generalitza, el cas de compatibilitat, en el qual d 0 = d).
Aix`o resol conceptualment el problema, per`o e s u til i senzill sistematitzar els c`alculs necessaris.
Teorema 4.12 En les condicions anteriors:
(a) C x = d 0 si, i nomes si, Ax = b, on A = C t C i b = C t d.
(b) x e s u nic si, i nomes si, rang(C) = n; en aquest cas, A e s regular.
D EMOSTRACI O . (a) C x = d 0 significa que C x d H . Per tant, el producte escalar de
cada generador de H (columna ci de la matriu C) per C x d ha de ser zero. Matricialment,
lanullacio daquests productes escalars sexpressa per
C t (C x d) = 0 ,

CtC x = Ctd ,

Ax = b .

(b) Segons el teorema de Rouche-Frobenius, rang(C) = n e s equivalent a que el sistema C x =


d 0 , que sabem que e s compatible, sigui determinat. I aix`o e s equivalent a dir que la matriu
quadrada A sigui regular.

60

Lestructura euclidiana de Rn

R. Amer i F. Carreras

Exemples 4.13 (a) (Regressio lineal.) El problema pr`actic potser mes frequent e s el de trobar
lequacio de la recta que sajusta millor a una distribucio de punts del pla (recta de regressio).
Sense obtenir formules sistem`atiques (tasca mes pr`opia dun curs destadstica), resoldrem un
exemple concret aplicant el teorema anterior.
Suposem que es tracta dajustar una recta als punts de coordenades (0, 0), (2, 1) i (4, 1). La recta
ser`a y = ax + b, i les condicions


b = 0
 
0 1
0

a
2a + b = 1 , o be C x = d , on C = 2 1 , x =
i d =1 .
b

4 1
1
4a + b = 1
El sistema e s o` bviament incompatible, el rang e s 2 i, multiplicant per la matriu C t , obtenim

  


   
 
1/4
1
3 6
6
20 6
a
6
a
= 1
.
=
,
=
2
/6
6 3
b
2
b
24 6 20
La recta buscada e s

x
1
+ ,
4 6
que no passa per cap dels tres punts per`o minimitza lerror quadr`atic : concretament, x =
(a, b) = ( 1/4, 1/6), C x = ( 1/6, 2/3, 7/6) i d = (0, 1, 1), per tant

6
.
= k Cx d k =
6
y=

(Si el lector ha dibuixat els tres punts i cau en la temptacio de creure mes adequadala recta
horitzontal y = 1, observar`a que lerror quadr`atic corresponent a aquesta recta e s 1 > 6/6.)
(b) (Regressio quadr`atica.) Un problema an`aleg a lanterior e s el de trobar lequacio de la
par`abola que sajusta millor a una distribucio de punts del pla (leleccio del tipus de funcio en un
problema de regressio dep`en de diversos factors, un dels quals pot ser la disposicio geom`etrica
del punts). Com a illustracio, determinarem el polinomi de regressio quadr`atica dels punts
(1, 2), (0, 1), (1, 1) i (2, 0). Lequacio ser`a y = ax 2 + bx + c, i les condicions

a+bc =2

c=1
,
o be C x = d ,

a + b + c = 1

4a + 2b + c = 0
on

1 1 1
0
0 1
,
C =
1
1 1
4
2 1

x= b
c

2
1

d=
1 .
0

R. Amer i F. Carreras

61

El sistema e s incompatible, el rang de C e s 3 i, aplicant novament el procediment indicat en el


teorema anterior, obtenim el sistema

18 8 6
a
1
8 6 2 b = 3 ,
6 2 4
c
2
la solucio del qual e s a = 1/2, b = -13/10 i c = 2/5. Per tant, el polinomi de regressio quadr`atica
dels quatre punts donats e s
1
y = (5x 2 13x + 4) ,
10

2 5
.
i lerror quadr`atic com`es =
5
(c) Considerem finalment el sistema seguent, en el qual rang(C) = 2 i n = 3:


x + 2y + z = 3
1 2 1
3

x
1 1 4
2
x + y + 4z = 2

= .
,
2 3 5 y
5
2x + 3y + 5z = 5

4 6 10
0
4x + 6y + 10z = 0
Multiplicant per la transposada resulta el sistema

22 33 55
x
15
33 50 81 y = 23 ,
55 81 142
z
36
que e s compatible indeterminat i te per solucio general

9
x = 7z
11 .

y = 3z + 1
Val la pena observar que en el cas dun sistema indeterminat, com ho e s aquest, totes les solucions
donen el mateix error quadr`atic, ja que aquest error e s = k d 0 d k i aquesta expressio no dep`en
de quin vector x ens dona C x = d 0 . Aqu, fent, per exemple, z = 0, surt d 0 = 1/11(13, 2, 15, 30)
i un error quadr`atic

10 33
0
= kd d k =
.
11

4.4 Orientacio i producte vectorial


Es defineix una relacio dequival`encia entre les bases ordenades de Rn dient que
B ' B0

si, i nomes si,

det(C) > 0 ,

62

R. Amer i F. Carreras

Lestructura euclidiana de Rn

on C e s la matriu del canvi de base de B 0 a B. Aquesta relacio e s dequival`encia i classifica les


bases de Rn en dos tipus. Orientar Rn e s escollir un dels dos tipus: es diu que les seves bases
son positives, i que les bases de laltre tipus son negatives. En algunes questions (angle orientat,
producte vectorial, girs, rotacions) e s indispensable haver fixat una orientacio, i el criteri habitual
e s prendre com a positives la base can`onica de Rn i les del seu tipus.
La interpretacio fsica de la relacio dequival`encia e s la seguent. En el pla: si anem del primer
vector de la base al segon pel cam mes curt, o seguim el sentit horari o lantihorari, i aquesta
e s la classificacio. Es habitual prendre com a positives les bases de sentit antihorari. A lespai:
girant un tornavs segons el cam mes curt del primer vector al segon, lestri es mour`a en el sentit
habitual prendre com a positives les bases ortogonals
del tercer vector o en sentit contrari. Es
en les quals el tornavs segueix el sentit del tercer vector (regla del tornavs) i les equivalents a
elles.
Exemples 4.14 (a) Si B i B 0 son bases ortonormals de Rn i C la matriu (ortogonal) de canvi de
base, B i B 0 son del mateix tipus si, i nomes si, det(C) = 1.
(b) Si B = {e1 , e2 } e s una base positiva de R2 , {e2 , e1 } e s negativa. A R3 , lefecte de permutar
els vectors duna base dep`en del signe de la permutacio. Aix, si B = {e1 , e2 , e3 } e s positiva,
{e3 , e1 , e2 } tambe ho e s, per`o {e1 , e3 , e2 } e s negativa.
(c) (Angle orientat en el pla.) Recordem que, donats dos vectors no nuls u, v R2 , (u, v)
[0, ] representa langle no orientat entre u i v. Suposem ara orientat R2 . Donats dos vectors
linealment independents u i v, definim langle orientat de u a v com
(
(u, v)
si {u, v} e s base positiva
+
(u, v) =
(u, v) 2 (u, v) si {u, v} e s base negativa .
Si u i v son diferents de zero per`o linealment dependents, les dues opcions ens donen + (u, v) =
(u, v), ja que (u, v) e s 0 o . Notem que linterval de variacio de + (u, v) e s damplitud
2 . Es immediat comprovar que + (v, u) = + (u, v), i que, si {e1 , e2 } e s la base can`onica,
+ (e1 , e2 ) = /2.
(d) (Coordenades polars.) Sigui u = (x, y) 6= 0 un vector arbitrari del pla orientat. Com ja
hem vist, si posem = (u, e1 ), = (u, e2 ), i r = k u k, tenim x = r cos , y = r cos ,
amb cos2 + cos2 = 1 i, per tant, cos = sin . Definim largument del vector u com
= + (e1 , u). Com que el determinant de la matriu del canvi de {e1 , u} a {e1 , e2 } val y, i
sin 0 perqu`e [0, ], tenim: en els quadrants primer i segon, on y 0, = i cos =
sin = sin ; en els quadrants tercer i quart, on y 0, = i cos = sin = sin . Per
tant,
x = r cos ,
y = r sin
u = (x, y) 6= 0 de R2 .

63

R. Amer i F. Carreras

El m`odul r i largument son les coordenades polars del vector u.


(e) (Orientacio de plans a lespai.) La nocio dorientacio per a subespais de Rn e s an`aloga a
la que hem descrit per a Rn . Limitantnos ara a R3 , cal observar que lorientacio de lespai no
determina una orientacio en els seus plans, i aix`o reflecteix el fet que un observador pot situar
se a qualsevol dels dos costats dun pla. El procediment per orientar un pla H de lespai e s
el seguent: escollim un dels dos sentits possibles dels vectors ortogonals al pla (recordem que
dim H = 1), seleccionant un vector concret w H ; llavors orientem el pla H prenent com a
positives les bases {u, v} de H tals que {u, v, w} e s positiva a R3 .
Considerem, com a illustracio, el pla dequacio x 2y + z = 0. Lorientem escollint el vector
ortogonal w = (1, 2, 1). Donada una base del pla, per exemple {(2, 1, 0), (0, 1, 2)}, podem
classificarla com a positiva perqu`e ho e s a R3 la base {(2, 1, 0), (0, 1, 2), (1, 2, 1)}, ja que la
matriu del canvi a la base can`onica i el seu determinant son

2 0
1
C = 1 1 2 i det(C) = 10 > 0 .
0 2
1

Considerem lespai R3 orientat de la forma habitual. Introduirem el producte vectorial duna


manera constructiva que posar`a de manifest les seves propietats caracterstiques.
Teorema 4.15 Donats dos vectors linealment independents u, v R3 , existeix un u nic vector
w R3 tal que:
(a) w u i w v.
(b) k w k = k u kk v k sin , on = (u, v).
(c) {u, v, w} e s una base positiva de R3 .
D EMOSTRACI O . Escrivim u = (x1 , x2 , x3 ), v = (y1 , y2 , y3 ) i w = (z 1 , z 2 , z 3 ). La condicio (a)
dona lloc al sistema seguent:

x1 z 1 + x2 z 2 + x3 z 3 = 0
y1 z 1 + y2 z 2 + y3 z 3 = 0
La solucio general daquest sistema e s

z 1 = A1 t

x2 x3

,
z 2 = A2 t , on A1 =
y2 y3

z 3 = A3 t

)
.



x3 x1


A2 =
y3 y1



x1 x2

.
A3 =
y1 y2

64

R. Amer i F. Carreras

Lestructura euclidiana de Rn

De la condicio (b) obtenim


k w k2 = k u k2 k v k2 sin2 = k u k2 k v k2 (1 cos2 ) = k u k2 k v k2 (u v)2 .
Substituint les components de u, v i w resulta
t 2 (A21 + A22 + A23 ) = (x12 + x22 + x32 )(y12 + y22 + y32 ) (x1 y1 + x2 y2 + x3 y3 )2
= (x1 y2 x2 y1 )2 + (x2 y3 x3 y2 )2 + (x3 y1 x1 y3 )2
= A21 + A22 + A23 ,
i daqu t = 1. Aplicant, finalment, la condicio (c), tenim que


x1
x2
x3

y2
y3 = t (A21 + A22 + A23 ) ,
0 < y1
t A1 t A2 t A3
i es dedueix que t = 1. Per tant, queda determinat un u nic vector w = (A1 , A2 , A3 ) que compleix
les tres condicions de lenunciat.
El vector w determinat pel teorema anterior e s el producte vectorial de u i v, escrit des dara
u v. Una regla mnemot`ecnica per recordar la seva expressio explcita e s la seguent:


e1 e2 e3


u v = x1 x2 x3
y1 y2 y3
on {e1 , e2 , e3 } e s la base can`onica de R3 . Aix`o permet estendre la definicio al cas en que u i v
son linealment dependents, posant u v = 0 en concord`ancia amb el determinant formal.
immediat comprovar que el producte vectorial e s una operacio distributiva respecte a la suma,
Es
compatible amb el producte per escalars i anticommutativa: v u = u v. A mes, si {u, v} e s
un conjunt ortonormal, {u, v, u v} e s una base ortonormal positiva de R3 . La propietat seguent,
u til en alguns contextos, e s mes complexa.
Proposicio 4.16 (Doble producte vectorial.) Si u, v, w R3 ,
u (v w) = (u w)v (u v)w .
D EMOSTRACI O . Per tal de simplificar al m`axim els c`alculs, escollim (sempre e s possible) una
base ortonormal positiva {e1 , e2 , e3 } tal que
u = ae1 ,

v = be1 + ce2

w = pe1 + qe2 + r e3 .

R. Amer i F. Carreras

65

Aleshores tenim, fent les operacions,


u (v w) = a(bq cp)e2 abr e3
(u w)v (u v)w = ap(be1 + ce2 ) ab( pe1 + qe2 + r e3 ) ,
i e s evident que els dos resultats coincideixen.
Una primera aplicacio del producte vectorial e s la seguent. Donada una base {u, v} dun pla,
u v e s un generador de la recta ortogonal al pla. Dit duna altra manera igualment u til: si una
recta est`a definida com a interseccio de dos plans, el producte vectorial dels vectors formats amb
els coeficients de les equacions dels plans e s un generador de la recta.
Finalment, el producte mixt de tres vectors u, v, w R3 es defineix com u (v w), i per tant
coincideix amb el determinant de la matriu de les components dels tres vectors:


x1 x2 x3


u (v w) = y1 y2 y3 .
z1 z2 z3
En particular, u (v w) = 0 si, i nomes si, u, v, w son linealment dependents, i u (v w) =
(u v) w.

66

R. Amer i F. Carreras

Lestructura euclidiana de Rn

R. Amer i F. Carreras

67

5
Transformacions lineals

Molts processos matem`atics, geom`etrics, fsics, qumics i econ`omics son representables, si mes
no en primera aproximacio, per relacions lineals entre les variables que hi intervenen. Aquesta
evid`encia, juntament amb lntima connexio entre les transformacions lineals i el c`alcul matricial,
concedeix un paper molt especial a aquest captol i el seguent.

5.1 Definicions i exemples


Observem en primer lloc que, de la mateixa manera que e s habitual descriure una funcio f :
R R per una formula com f (x) = x 2 + 3x, o per lequacio equivalent y = x 2 + 3x, una
transformacio entre dos espais euclidians, per exemple T : R3 R2 , es pot definir per una
formula com
T (x, y, z) = (x y 2, x + y + 3z 2 ) ,
o per les equacions corresponents
(

x0 = xy 2
y 0 = x + y + 3z 2 .

Recordem tambe la nomenclatura relativa a les aplicacions en general. Sigui T : A B


una aplicacio entre dos conjunts arbitraris. Si T (a) = b, direm que b e s la imatge de a per la

68

R. Amer i F. Carreras

Transformacions lineals

transformacio T i que a e s una antiimatge de b. Daltra banda, es diu que T e s injectiva si a 6= a 0


implica T (a) 6= T (a 0 ). Es diu que T e s exhaustiva si per a qualsevol b B existeix algun a A
tal que T (a) = b. Es diu que T e s bijectiva si e s injectiva i exhaustiva. Si T e s bijectiva, cada
element b B te una sola antiimatge a A, i escrivint T 1 (b) = a definim una nova aplicacio
T 1 : B A, anomenada inversa de T . Mes en general, el smbol T 1 (b) denota el conjunt
de totes les antiimatges de lelement b B, encara que T no sigui bijectiva. Finalment, donades
dues aplicacions T : A B i S : B C, podem formar la composicio de S i T , que e s
laplicacio S T : A C definida per (S T )(a) = S(T (a)).
Definicio 5.1 Una transformacio T : Rn Rm e s lineal si compleix les condicions
(a) T (u + u 0 ) = T (u) + T (u 0 )
(b) T (tu) = t T (u)
per a qualssevol t R, u, u 0 Rn . De les propietats (a) i (b) es dedueix immediatament que
T (0) = 0, que T (u u 0 ) = T (u) T (u 0 ) i que, en general,
T (t1 u 1 + t2 u 2 + + tk u k ) = t1 T (u 1 ) + t2 T (u 2 ) + + tk T (u k ) .
Una transformacio lineal T : Rn Rn sanomena un endomorfisme de Rn , i aquest e s el cas
que tractarem amb mes freque` ncia.

Teorema 5.2 (Caracteritzacio matricial.) Una transformacio T : Rn Rm e s lineal si, i


nomes si, es pot representar matricialment per
Y = AX .
D EMOSTRACI O . () Donades les bases B = {u 1 , u 2 , . . . , u n } de Rn i B 0 = {v1 , v2 , . . . , vm } de
Rm , siguin

x1
y1
a11 a12 a1n
x2
y2
a21 a22 a2n

X = . ,
Y =
i
A
=

...................
..
ym
am1 am2 amn
xn
les columnes de components dun vector arbitrari u Rn i un vector arbitrari v Rm en les
bases respectives i la matriu obtinguda de les relacions
T (u j ) =

m
X
i=1

ai j vi

per a

j = 1, 2, . . . , n ,

69

R. Amer i F. Carreras

que expressen les imatges dels vectors de la primera base com a combinacions lineals dels vectors
de la segona. Aplicant la linealitat de T al c`alcul de la imatge del vector
u=

n
X

xj u j

j=1

obtenim que
T (u) = T

n
X

n
n
X
 X
xj u j =
x j T (u j ) =
xj

j=1

n X
m
X

j=1

ai j x j vi =

j=1 i=1

i, comparant amb v =

m
X

j=1

m
n
X
X
i=1

ai j x j

m
X

ai j vi

i=1

vi

j=1

yi vi , resulta que la relacio intrnseca

i=1

v = T (u)
es tradueix en components per
yi =

n
X

ai j x j

per a i = 1, 2, . . . , m ,

j=1

o, matricialment,
Y = AX .
() Si T est`a definida respecte a dues bases per Y = AX , on A e s una matriu arbitr`aria m n,
e s evident que, si Y1 = AX 1 , Y2 = AX 2 i t R, aleshores
A(X 1 + X 2 ) = AX 1 + AX 2 = Y1 + Y2

A(t X 1 ) = t AX 1 = tY1 ,

i per tant T e s lineal.


Observacions 5.3 Podem extreure mes informacio daquest teorema.
(a) Les components de les imatges T (u 1 ), T (u 2 ), . . . , T (u n ) en la base {v1 , v2 , . . . , vm } formen
les columnes de la matriu A, que rep el nom de matriu de T relativa a les dues bases:

a11 a12 a1n


a21 a22 a2n

A=
................... .
am1 am2 amn
Simbolitzarem aquesta relacio escrivint A = M(T, B, B 0 ).

70

R. Amer i F. Carreras

Transformacions lineals

a dir, una
(b) Aquestes imatges determinen T i, a mes, poden ser escollides arbitr`ariament. Es
vegada fixades bases dels dos espais, tota matriu A del tipus m n descriu una transformacio
lineal T .
(c) A efectes pr`actics, conve notar que e s caracterstic duna transformacio lineal el fet que les
seves equacions vinguin donades per relacions lineals homog`enies entre els dos conjunts de
variables. Amb aquest criteri, el lector pot observar que lexemple de transformacio proposat a
linici daquest captol no e s, en absolut, lineal.
(d) En el cas dun endomorfisme, emprarem nomes una base de refer`encia. La matriu ser`a quadrada, i escriurem simplement A = M(T, B). Les columnes de A ens donaran les components
de les imatges T (u 1 ), T (u 2 ), . . . , T (u n ) en funcio dels vectors u 1 , u 2 , . . . , u n .
f`acil comprovar que les funcions lineals f : R R son les de la forma
Exemples 5.4 (a) Es
y = f (x) = ax (notem lanalogia formal amb el cas general, on tenim la relacio matricial
Y = T (X ) = AX ). Com e s ben sabut, amb funcions lineals descrivim, entre molts altres
processos, costos, interessos, descomptes, rec`arrecs...
(b) (Equacions dun gir en el pla orientat.) Un gir dangle [0, 2 ) al voltant de lorigen del pla orientat R2 e s la transformacio G : R2 R2 que conserva el m`odul dels vectors i incrementa els arguments en un angle . Per tant, G(0, 0) = (0, 0) i, si u = (x, y) =
(r cos , r sin ), i v = G(u) = (x 0 , y 0 ), tenim les relacions
x 0 = r cos( + ) ,

y 0 = r sin( + ) ,

que, introduint les variables x, y, ens condueixen a unes equacions tpicament lineals segons el
teorema de caracteritzacio:
)
 0  
 
x 0 = x cos y sin
x
cos sin
x
o be
=
.
0
0
y
sin

cos

y
y = x sin + y cos
Aix doncs, tot gir G del pla orientat e s un endomorfisme, i la seva matriu en la base can`onica e s


cos sin
A = M(G, Bc ) =
.
sin
cos
(c) (Equacions duna simetria axial en el pla.) Considerem la simetria S : R2 R2 respecte a
la recta x = 3y (eix de simetria). Suposant ara comprovades per exemple geom`etricament
les condicions de linealitat, nomes caldr`a trobar les imatges dels dos vectors de la base can`onica
per determinar la matriu. Aplicant la formula del captol anterior,
S(u) = 2

uw
w u,
ww

R. Amer i F. Carreras

71

i tenint en compte que un vector director de leix de simetria e s, per exemple, w = (3, 1),
obtenim S(1, 0) = ( 4/5, 3/5) i S(0, 1) = ( 3/5, 4/5). Per tant, lequacio matricial daquesta
simetria axial en la base can`onica e s
 0 

 
1 4
3
x
x
=
.
0
y
y
5 3 4
En aquest exemple hem fet servir el teorema de caracteritzacio en el sentit recproc del de lexemple anterior: suposant justificada a priori la linealitat, laprofitem per trobar amb el mnim
esforc les equacions generals de la transformacio.

5.2 Canvis de base


Tot i que e s habitual i sovint convenient treballar amb la matriu duna transformacio lineal
relativa a les bases can`oniques, e s important con`eixer els efectes dels canvis de base. Per fixar
idees, considerarem amb detall nomes el cas dels endomorfismes.
Teorema 5.5 (Formula del canvi de base.) Considerem un endomorfisme T : Rn Rn i dues
bases, B i B 0 . Si A = M(T, B), A0 = M(T, B 0 ), i C e s la matriu del canvi de base de B 0 a B,
aleshores
A0 = C 1 AC .
D EMOSTRACI O . La relacio u = T (v) es tradueix per Y = AX en la base B, i per Y 0 = A0 X 0 en
la base B 0 . El pas de X 0 a Y 0 es pot obtenir tambe en tres fases: (a) passem el vector u de B 0 a B;
(b) transformem el vector u en v = T (u); (c) passem el vector v de B a B 0 . Matricialment,
(a) X 0 7 X = C X 0
(b) X 7 Y = AX = AC X 0
(c) Y 7 Y 0 = C 1 Y = C 1 AC X 0 .
Com que aquesta era la transformacio que duia a terme la matriu A0 , deduim que
A0 = C 1 AC .
Observacio 5.6 El lector no hauria de tenir dificultat en generalitzar el resultat anterior per a
una transformacio lineal qualsevol T : Rn Rm aplicant un canvi de base a cada espai: Si B1
i B10 son bases de Rn , i B2 i B20 son bases de Rm , la relacio entre les matrius
A = M(T, B1 , B2 )

A0 = M(T, B10 , B20 )

72

Transformacions lineals

R. Amer i F. Carreras

e s
A0 = D 1 AC ,
on C e s la matriu del canvi de base en el primer espai, de B10 a B1 , i D e s la matriu del canvi de
base en el segon, de B20 a B2 .
Exemples 5.7 (a) Si B 0 e s una base ortogonal positiva del pla orientat, formada per dos vectors
de la mateixa longitud, e10 = (a, b) i e20 = (b, a), la matriu del gir dangle en la base B 0
coincideix amb la matriu del gir en la base can`onica, ja que tenim




a b
cos sin
C=
, A=
b
a
sin
cos
i
0

A =C

1
AC = 2
a + b2

a b
b a



cos sin
sin
cos



a b
b
a


=

cos sin
sin
cos

(b) Considerem la simetria axial estudiada a la seccio anterior. Amb el vector director de leix
e10 = (3, 1) i el vector ortogonal e20 = (1, 3) podem formar una base adaptada a la simetria,
B 0 = {e10 , e20 }. Es evident que S(e10 ) = e10 , S(e20 ) = e20 i, per tant, la matriu de la simetria axial
en aquesta base e s ben simple:


1
0
0
A =
.
0 1
Si ara volem calcular la matriu de S en la base can`onica, nomes cal desfer el canvi A0 = C 1 AC,
obtenint
A = C A0 C 1 .
Aplicant aquesta nova relacio resulta




3 1
1
0
0
C=
,
A =
1
3
0 1

1
A=
5

4
3
3 4

(c) El determinant de la matriu dun endomorfisme no varia en fer un canvi de base. En efecte:
aplicant determinants a la formula del canvi resulta
det(A0 ) = det(C 1 AC) = det(C 1 ) det(A) det(C) =

1
det(A) det(C) = det(A) .
det(C)

(d) Suposem que un endomorfisme T : R2 R2 queda definit de la manera seguent:


T (1, 2) = (5, 1),

T (2, 1) = (4, 3) .

R. Amer i F. Carreras

73

Per trobar A = M(T, Bc ) nomes cal observar que tenim una nova base B 0 , formada pels vectors
e10 = (1, 2) i e20 = (2, 1), i considerar les matrius seguents:




1 2
5 4
0
0
C=
(canvi de B a Bc )
i
B = M(T, B , Bc ) =
.
2
1
1 3
Aplicant un raonament similar al del teorema del canvi de base resulta


1 3 14
1
.
A = BC =
5 5 5

5.3 Nucli, imatge i rang


Considerem una transformacio lineal arbitr`aria T : Rn Rm . Es defineix el nucli de T com
el subespai format per les antiimatges del vector 0: simb`olicament
Nuc(T ) = T 1 (0) = {u Rn : T (u) = 0} .
Es defineix la imatge de T com el subespai format per totes les imatges dels vectors de Rn :
Im(T ) = {v Rm : v = T (u), u Rn } .
(El lector hauria de comprovar que, efectivament, Nuc(T ) i Im(T ) son subespais.) Finalment, el
rang de T es defineix per
rang(T ) = dim Im(T ) .
Teorema 5.8 (a) Si B = {u 1 , u 2 , . . . , u n } e s una base de Rn , {T (u 1 ), T (u 2 ), . . . , T (u n )} e s un
sistema de generadors del subespai Im(T ). Per tant, rang(T ) e s el rang de qualsevol matriu A
que representi a T .
(b) dim Nuc(T ) + dim Im(T ) = n.
D EMOSTRACI O . (a) Si v Im(T ), sabem que v = T (u) per a algun u Rn . Com que
u = t1 u 1 + t2 u 2 + + tn u n , resulta
v = T (u) = T (t1 u 1 + t2 u 2 + + tn u n ) = t1 T (u 1 ) + t2 T (u 2 ) + + tn T (u n ) .
Com que les columnes de la matriu A representen, doncs, un sistema de generadors de Im(T ),
queda establerta tambe la identitat entre els rangs.
(b) El sistema dequacions descrit matricialment per AX = 0 defineix el nucli. Per tant,
dim Nuc(T ) = n rang(A) = n dim Im(T ) .

74

Transformacions lineals

R. Amer i F. Carreras

Corol.lari 5.9 (a) T e s una transformacio exhaustiva si, i nomes si, rang(T ) = m.
(b) T e s injectiva si, i nomes si, Nuc(T ) = {0}, e s a dir, si, i nomes si, rang(T ) = n.
(c) Un endomorfisme T de Rn e s bijectiu si, i nomes si, rang(T ) = n, e s a dir, det(A) 6= 0, on A
e s qualsevol matriu que representi a T .

D EMOSTRACI O . (a) T e s exhaustiva si, i nomes si, Im(T ) = Rm , i aix`o e s equivalent a que
rang(T ) = m.
(b) Si T e s injectiva, o` bviament ha de ser Nuc(T ) = {0}. Recprocament, si Nuc(T ) = {0}, de
la igualtat T (u) = T (u 0 ) resulta T (u u 0 ) = 0, e s a dir, u u 0 Nuc(T ) i, per tant, u = u 0 :
aix`o significa que T e s injectiva. La segona equival`encia e s una conseque` ncia immediata de la
formula de les dimensions del teorema anterior.
(c) Es despr`en dels dos apartats anteriors.

Exemples 5.10 (a) Considerem la projeccio ortogonal de Rn sobre un subespai H , e s a dir, la


transformacio P : Rn Rn tal que P(u) = u 0 , projeccio ortogonal de u sobre H . Es f`acil
veure que P e s lineal, i per tant un endomorfisme de Rn , i tambe que
Nuc(P) = H ,

Im(P) = H

rang(P) = dim(H ) .

(b) Aquest exemple tambe permet illustrar una formula general per al c`alcul dantiimatges que
e s u til en alguns contextos i el lector pot justificar com a exercici: si v = T (u), aleshores
T 1 (v) = u + Nuc(T ) ,
e s a dir, coneguda una antiimatge concreta u de v, totes les antiimatges daquest vector sobtenen
sumant a u un vector arbitrari del nucli de la transformacio.
(c) Considerem ara, tambe a Rn , la simetria respecte a un subespai H , e s a dir, la transformacio
S : Rn Rn tal que S(u) = u , sim`etric de u respecte a H . Si H = {0} e s diu que S e s la
simetria central, si H e s una recta S e s una simetria axial, i si H e s un pla S e s una simetria
plana. Tambe e s f`acil veure que S e s lineal, i per tant un endomorfisme de Rn , per`o en aquest
cas resulta
Nuc(S) = {0},
Im(S) = Rn
i
rang(S) = n ,
de manera que S e s una transformacio bijectiva.

75

R. Amer i F. Carreras

5.4 Operacions
Com en el cas dels canvis de base, en aquesta seccio ens limitarem a considerar operacions amb
endomorfismes, deixant al lector la senzilla tasca de generalitzar la major part de les idees i els
resultats a transformacions lineals entre espais diferents.
Si t R, i T i S son endomorfismes de Rn , e s immediat comprovar que les transformacions de
Rn en si mateix definides per
(T + S)(u) = T (u) + S(u)

(t T )(u) = t T (u)

u Rn

son lineals. I establir les corresponents relacions matricials:


M(T + S, B) = M(T, B) + M(S, B)

M(t T, B) = t M(T, B) .

An`alogament, e s f`acil veure que la transformacio composta ST e s lineal, i correspon al producte


de matrius:
M(S T, B) = M(S, B)M(T, B) .
Finalment, recordem que, si A = M(T, B), T e s bijectiu si, i nomes si, A e s regular. Seguint
la mateixa t`ecnica que en els casos anteriors, es pot provar que, en aquest sup`osit, T 1 tambe e s
lineal i
M(T 1 , B) = M(T, B)1 .
Es important esmentar lexist`encia, per a cada n, de lendomorfisme anomenat identitat, denotat
per I : Rn Rn i definit per I (u) = u per a tot u Rn . La matriu daquest endomorfisme en
qualsevol base e s la matriu unitat I , i daqu labus de notacio que fem. Les relacions de I amb
les dues darreres operacions son les seguents:
T I =T = I T
i, si T e s bijectiu,
T T 1 = I = T 1 T .

5.5 Endomorfismes i producte escalar


Estudiarem ara diversos tipus dendomorfismes de lespai Rn que son interessants per la seva
connexio amb lestructura euclidiana, fent especial insist`encia en els casos del pla i de lespai.
Aquests tipus de transformacions son les projeccions ortogonals i les denominades isometries
(transformacions rgides), entre les quals cal destacar les simetries i, sobre tot, els girs del pla i
les rotacions de lespai.

76

Transformacions lineals

R. Amer i F. Carreras

Recordem que, donat un subespai H de Rn , denotem per P i S, respectivament, la projeccio


ortogonal sobre H i la simetria respecte a H . Les relacions seguents son clares:
P 2 = P,

S2 = I

S = 2P I .

Les matrius de P i S relatives a una base B 0 adaptada a la suma directa H H son, respectivament,

0
A =

..

.
1
0

..

0
B =

..

1
1

..

.
1

Aquestes matrius A0 i B 0 son sim`etriques, per`o tambe ho son les matrius respectives A i B en la
base can`onica Bc . En efecte, suposant ortonormal la base B 0 , la matriu C del canvi de base de B 0
a Bc e s ortogonal, per tant C 1 = C t , A = C A0 C t i
At = (C A0 C t )t = C A0 C t = A ,
i un argument an`aleg serveix per a la matriu B. A mes, la matriu B e s ortogonal, perqu`e B t = B
i B 2 = I , de manera que B t B = I .
Abans de discutir la nocio general disometria, passem als girs del pla i les rotacions de lespai.
La descripcio dels girs en el pla orientat sha dut a terme amb tota generalitat en la primera seccio
daquest captol, i ser`a u til per a lestudi de les rotacions.
Donats un angle [0, 2 ) i un vector unitari w de lespai R3 orientat, considerarem el pla H =
hwi orientat per w, i definirem la rotacio dangle al voltant del vector w com lendomorfisme
R : R3 R3 descrit de la forma seguent en termes de la suma directa R3 = hwi H :

R(u) =

si u hwi

G(u) si u H
on G e s el gir dangle en el pla H orientat per w. Com que qualsevol vector u R3 sescriu
de forma u nica com u = u 0 + u 00 , amb u 0 H i u 00 hwi, tenim, per linealitat,
R(u) = R(u 0 ) + R(u 00 ) = G(u 0 ) + u 00 .

77

R. Amer i F. Carreras

Evidentment, si {u, v} e s una base ortonormal positiva de H , la matriu de R en la base ortonormal


positiva {w, u, v} de R3 e s

1
0
0
0 cos sin .
0 sin cos
El resultat seguent dona una formula de c`alcul directe dimatges per a les rotacions.
Proposicio 5.11 Si R e s la rotacio dangle al voltant del vector unitari w R3 ,
R(u) = u cos + (1 cos )(u w)w + (w u) sin

u R3 .

D EMOSTRACI O . Escrivim u = u 0 + u 00 . Si u 0 = 0 aleshores u = u 00 , i la formula dona,


efectivament, R(u) = R(u 00 ) = u 00 . Si u 0 6= 0, {u 0 , w u 0 } e s una base ortogonal positiva de H ,
amb ku 0 k = kw u 0 k. Per tant,
R(u 0 ) = u 0 cos + (w u 0 ) sin .
A mes, R(u 00 ) = u 00 = (u w)w, ja que kwk = 1. Finalment, w u 0 = w u. Aix doncs,
R(u) = R(u 0 ) + R(u 00 ) = u 0 cos + (w u) sin + (u w)w =
= u cos + (1 cos )(u w)w + (w u) sin .
Exemple 5.12 Calculem la imatge del vector u = (1, 0, 1) segons la rotacio de 90 al voltant
del vector w = (1, 1, 1). La rotacio est`a ben definida perqu`e el vector w precisa el sentit de leix

de rotacio, per`o a la formula caldr`a fer servir el vector normalitzat, e s a dir, w = 1/ 3(1, 1, 1).
Els c`alculs parcials principals i el resultat son:
2

uw = ,
3

w u = (1, 0, 1)
3

1
3

R(u) = (2 +

3, 2, 2 3) .

Les isometries formen una classe important dendomorfismes de lespai euclidi`a. Son les transformacions rgides, e s a dir, aquelles que no deformen les figures de lespai. Intuitivament, la
rigidesa equival a la conservacio de les longituds dels vectors i dels angles entre ells; com que
aquests dos conceptes estan estretament lligats al producte escalar, e s natural donar la definicio
seguent.
Un endomorfisme T : Rn Rn e s una isometria de Rn si conserva el producte escalar dels
vectors, e s a dir, si
T (u) T (v) = u v
u, v Rn .

78

R. Amer i F. Carreras

Transformacions lineals

(Aquesta condicio e s tan forta que es pot demostrar que tota transformacio T : Rn Rn que
conserva el producte escalar ha de ser lineal.) A partir de la definicio, e s immediat comprovar
que tota isometria T
(a) conserva lortogonalitat: si u v, T (u) T (v) ;
(b) conserva la norma: kT (u)k = kuk u Rn ;
(c) conserva els angles no orientats: si u, v 6= 0, (T (u), T (v)) = (u, v) ;
(d) e s bijectiva .

Proposicio 5.13 Si A e s la matriu dun endomorfisme T : Rn Rn relativa a una base


ortonormal (per exemple, la base can`onica),
T e s isometria

A e s ortogonal .

D EMOSTRACI O . () Si T e s una isometria ha de conservar els productes escalars entre els


vectors de la base ortonormal de refer`encia, condicio que es tradueix en la relacio At A = I .
() Recprocament, la condicio At A = I expressa que es conserven els productes escalars
entre els vectors de la base i, per tant, tambe es conserva el producte escalar de qualsevol parell
de vectors.

Exemples 5.14 (a) Aplicant aquesta caracteritzacio matricial de les isometries e s f`acil comprovar, a partir de les matrius corresponents, que totes les simetries, els girs del pla i les rotacions
de lespai son isometries, mentre que les projeccions ortogonals no ho son.
(b) De la mateixa manera, o directament per la definicio, es demostra que la identitat I , la inversa
de qualsevol isometria i la composicio disometries tambe son isometries.
(c) Tenint en compte que el determinant de la matriu dun endomorfisme no dep`en de la base a la
qual est`a referida, les isometries es poden classificar en dos tipus. Les isometries directes son les
que compleixen que det(A) = 1, i evidentment conserven lorientacio de lespai vectorial i, per
tant, son realitzables fsicament: els girs del pla i les rotacions de lespai, aix com la identitat
(gir o rotacio de 0 ), la simetria central del pla (gir de 180 ) i les simetries axials de lespai
(rotacions de 180 ) son isometries directes. Les isometries inverses son les que compleixen
que det(A) = 1 i, per tant, inverteixen lorientacio de lespai vectorial i no son realitzables
fsicament: les simetries axials del pla i la simetria central i les simetries planes de lespai son
isometries inverses.

R. Amer i F. Carreras

79

Una questio o` bvia en aquest punt e s la seguent: hem esgotat, amb els exemples precedents, el
cat`aleg disometries? La resposta es donar`a en el pr`oxim captol, aplicant parcialment la teoria
de la diagonalitzacio de matrius, i prover`a un criteri per classificar una isometria a partir de la
seva matriu en una base ortonormal (la base can`onica, per fixar idees). Limitarem lestudi als
casos del pla i lespai, els mes interessants des del punt de vista fsic.

80

R. Amer i F. Carreras

Transformacions lineals

R. Amer i F. Carreras

81

6
Diagonalitzacio de matrius

Dentre els procediments de reduccio de matrius a formes senzilles, la diagonalitzacio e s un


dels mes u tils de cara a les aplicacions pr`actiques del c`alcul matricial. A difer`encia daltres
situacions, en aquesta questio sobtenen millors resultats en el cas complex que en el cas real, ja
que un punt crucial e s la descomposicio del polinomi caracterstic i aix`o fa intervenir el teorema
fonamental de l`algebra (vegeu lap`endix B). Exposarem la teoria en el cas real, tot remarcant
els punts on lus dels nombres complexos suposa variacions. I encara que el marc natural de
la diagonalitzacio e s el dels endomorfismes, ser`a convenient traduir les nocions i els resultats al
llenguatge de les matrius quadrades, que e s lhabitual de la t`ecnica.

6.1 Endomorfismes diagonalitzables


Hem vist en el captol anterior que les matrius de la simetria axial S : R2 R2 respecte a la
recta x = 3y, en la base can`onica i en la base adaptada B 0 = {(3, 1), (1, 3)}, son respectivament




1 4
3
1
0
i
.
0 1
5 3 4
Observem que la segona matriu permet fer una concisa descripcio de lactuacio de S: (a) deixa
invariants els vectors u de leix de simetria; (b) canvia de signe els vectors v perpendiculars a
leix; (c) converteix qualsevol altre vector del pla, que ser`a de la forma u + v, en u v.

82

Diagonalitzacio de matrius

R. Amer i F. Carreras

Mes en general, tambe hem comprovat la simplicitat de les matrius de les simetries i les projeccions ortogonals a Rn quan sabem escollir una base adequada.
Recordem que una matriu quadrada A = (ai j ) e s diagonal si ai j = 0 quan i 6= j.
Un endomorfisme T : Rn Rn e s diagonalitzable si la seva matriu en alguna base B 0 e s
diagonal:

A0 =
.
..

.
n
Per diagonalitzar un endomorfisme cal, doncs, trobar n vectors e10 , e20 , . . . , en0 linealment independents tals que T (ei0 ) = i ei0 per a i = 1, 2, . . . , n. Aix`o suggereix les definicions seguents.
Un vector e Rn e s un vector propi dun endomorfisme T si
T (e) = e
per a algun R. En particular, el vector 0 e s un vector propi amb qualsevol R. Per tant,
nomes direm que un nombre R e s un valor propi de T si existeix algun vector e 6= 0 tal que
T (e) = e. Cada vector propi e 6= 0 est`a associat a un u nic valor propi, perqu`e
e = T (e) = e

( )e = 0

=.

La condicio de vector propi es pot escriure en la forma (T I )(e) = 0, i aix`o e s equivalent a


dir que
e Nuc(T I ) .
Ara podem tornar a la definicio inicial, i dir que T e s diagonalitzable si, i nomes si, existeix una
base de Rn formada per vectors propis de T . I com que la condicio e Nuc(T I ) dona una
descripcio operativa dels vectors propis de valor propi , ens ocuparem en primer lloc de veure
com podem obtenir tots els valors propis de T .
Proposicio 6.1 e s un valor propi de T si, i nomes si, det( I T ) = 0.
D EMOSTRACI O . Recordem que un endomorfisme te nucli no nul si, i nomes si, el seu determinant e s zero; per tant, existeixen vectors e 6= 0 dins de Nuc(T I ) si, i nomes si,
det(T I ) = 0, i aix`o e s equivalent a dir que det( I T ) = 0.

R. Amer i F. Carreras

83

Introduirem, doncs, una variable x i calcularem det(x I T ), e s a dir, det(x I A), on A e s


qualsevol matriu que representi a T (vegeu la primera de les observacions seguents). El resultat
e s un polinomi de la forma
det(x I T ) = x n A1 x n1 + A2 x n2 + (1)n An ,
que sanomena polinomi caracterstic de T . Les seves arrels, cada una amb la multiplicitat
corresponent, son els valors propis de T . Per a cada arrel , el subespai Nuc(T I ) est`a
format per tots els vectors propis de T amb valor propi .
Observacions 6.2 (a) El polinomi caracterstic no dep`en, com a determinant dun endomorfisme,
de la matriu a partir de la qual es calcula. En efecte: si A i A0 son dues matrius de T , i C e s la
matriu de canvi de base que ens dona A0 = C 1 AC, tenim
det(x I A0 ) = det(C 1 x I C C 1 AC) = det(C 1 {x I A}C)
= det(C 1 ) det(x I A) det(C) = det(x I A) .
(b) A mes del c`alcul directe del polinomi caracterstic, e s interessant con`eixer un m`etode alternatiu. Cada coeficient Ai de la formula de det(x I T ) e s la suma dels menors diagonals dordre
i de la matriu A, e s a dir, menors dordre i que
 tenen la seva diagonal principal situada en la
diagonal principal de A. Per a cada i hi ha ni menors diagonals dordre i. En particular, A1
sanomena la traca de A (suma dels coeficients de la diagonal principal), mentre que An e s el determinant de A. Tot i que una demostracio general daquesta formula e s complicada de notacio,
comprovarla per a n = 2 i n = 3 e s un bon exercici daplicacio del c`alcul de determinants.

6.2 Condicions de diagonalitzacio


Sigui T un endomorfisme de Rn .
Lema 6.3 Si 1 , 2 , . . . , k son valors propis diferents de T , la suma dels subespais de vectors
propis corresponents e s directa.
D EMOSTRACI O . Aplicarem induccio sobre el nombre de valors propis, k.
Si k=1, no hi ha res a demostrar.
Suposem que k 2 i que lenunciat e s cert per a k 1, e s a dir, que la suma dels k 1 primers
subespais de vectors propis e s directa:
Nuc(T 1 I ) Nuc(T 2 I ) Nuc(T k1 I ) .

84

R. Amer i F. Carreras

Diagonalitzacio de matrius

Per demostrar que la suma dels k subespais e s directa, hem de veure que si ei Nuc(T i I )
per a i = 1, 2, . . . , k, nomes e s possible la igualtat
e1 + e2 + + ek = 0
quan cada ei = 0 (que e s una de les condicions de suma directa).
Aplicant T a aquesta igualtat tenim que
1 e1 + 2 e2 + + k ek = 0 ,
mentre que multiplicant-la per k obtenim
k e1 + k e2 + + k ek = 0 .
Restant aquestes dues igualtats resulta que
(k 1 )e1 + (k 2 )e2 + + (k k1 )ek1 = 0 .
Com que els coeficients daquesta suma son diferents de zero, i la suma dels k 1 primers
subespais e s directa, podem assegurar que e1 = e2 = = ek1 = 0 i, en conseque` ncia,
ek = 0.
De vegades, lenunciat daquest lema sexpressa sense massa precisio dient que vectors
propis de valors propis diferents son linealment independents.
Lema 6.4 Si e s un valor propi de T de multiplicitat m, i d = dim Nuc(T I ), aleshores
1 d m.
evident que d 1, ja que la definicio de valor propi garanteix lexist`encia
D EMOSTRACI O . Es
dalgun e 6= 0 dins de Nuc(T I ).
Prenem ara una base {e1 , e2 , . . . , ed } de Nuc(T I ) i lampliem fins a obtenir una base
{e1 , e2 , . . . , ed , ed+1 , . . . , en } de Rn . Laspecte de la matriu de T en aquesta base e s

. .d
C

R. Amer i F. Carreras

85

de manera que desenvolupant det(x I T ) per les primeres d columnes queda


det(x I T ) = (x )d det(x I B) .
Aix`o assegura que la multiplicitat de larrel e s m d.
Teorema 6.5 (Condicio necess`aria i suficient de diagonalitzacio.) Un endomorfisme T de Rn
e s diagonalitzable si, i nomes si, compleix les dues condicions seguents:
(a) El polinomi caracterstic es descompon totalment en factors de primer grau:
det(x I T ) = (x 1 )m 1 (x 2 )m 2 (x k )m k .
(b) La dimensio de cada nucli coincideix amb la multiplicitat del valor propi corresponent:
di = m i

i = 1, . . . , k .

per a

D EMOSTRACI O . (H) Si T e s diagonalitzable, la suma directa dels nuclis coincideix amb tot
lespai Rn , perqu`e els vectors propis que formen la base en la que la matriu de T e s diagonal
surten necess`ariament daquests nuclis. Aix doncs, la matriu diagonal de T

. .m 1

.
.m. 2

. .m k

.
k
dona directament det(x I T ) = (x 1 )m 1 (x 2 )m 2 (x k )m k . Daltra banda, tenim que
di m i per a tot i segons el lema precedent; a mes,
d1 + d2 + + dk = n
perqu`e la suma directa dels nuclis e s Rn ; finalment,
m1 + m2 + + mk = n
segons resulta de calcular el grau del polinomi caracterstic. De tot aix`o es dedueix que
di = m i

per a

i = 1, . . . , k .

86

Diagonalitzacio de matrius

R. Amer i F. Carreras

(H) Si T compleix les condicions (a) i (b), la suma directa dels nuclis e s Rn , ja que
dim [Nuc(T 1 I ) Nuc(T k I )] =
=

k
X

dim Nuc(T i I ) =

i=1

k
X
i=1

di =

k
X

mi = n .

i=1

Per tant, prenent una base adaptada a la suma directa tindrem una base de Rn formada per vectors
propis de T , el qual ser`a en conseque` ncia un endomorfisme diagonalitzable.
Corol.lari 6.6 (Una condicio suficient.) Si un endomorfisme T de Rn te n valors propis diferents,
T e s diagonalitzable.

D EMOSTRACI O . En aquest cas, det(x I T ) es descompon totalment en producte de n factors


de primer grau:
det(x I T ) = (x 1 )(x 2 ) (x n ) .
Com que cada m i e s igual a 1, el segon dels lemes previs assegura que di = 1 = m i per a cada
i = 1, . . . , n, per tant T e s diagonalitzable.
Observacions 6.7 (a) Si considerem endomorfismes T : Cn Cn (espai vectorial num`eric
complex de dimensio n), la condicio necess`aria i suficient de diagonalitzacio es redueix a lapartat (b) del teorema, ja que, segons el teorema fonamental de l`algebra, la condicio (a) sempre es
complir`a.
(b) Tant el teorema com el corollari permeten determinar si un endomorfisme e s diagonalitzable
sense trobar els vectors propis, ja que, una vegada descompost el polinomi caracterstic, o be te
n arrels diferents, o be nomes cal calcular els rangs de T i I i comprovar si es compleix la
igualtat
m i = n rang(T i I ) per a i = 1, . . . , k .
(De fet, nomes cal comprovar-la quan m i > 1.)

Exemples 6.8 (a) Ni els girs en el pla ni les rotacions a lespai admeten vectors propis si langle
e s 6= 0, ; per tant no son endomorfismes diagonalitzables.
(b) Si la matriu dun endomorfisme T de R2 en la base can`onica e s sim`etrica, T e s diagonalitzable. El lector pot comprovar directament aquesta propietat, que e s un cas particular del teorema
espectral que demostrarem a continuacio.

87

R. Amer i F. Carreras

Un endomorfisme T de Rn e s sim`etric si compleix que


T (u) v = u T (v)

per a qualssevol

u, v Rn .

Si A e s la matriu de T en la base can`onica (o en qualsevol base ortonormal), T e s sim`etric si, i


nomes si, A e s sim`etrica. En efecte: si X i Y son les columnes de les components de u i v en
aquesta base, la condicio de simetria e s equivalent a que
(AX )t Y = X t AY ,

e s a dir,

X t At Y = X t AY ,

i aix`o e s cert per a qualssevol X i Y si, i nomes si, At = A.


Lema 6.9 Vectors propis dun endomorfisme sim`etric corresponents a valors propis diferents
son ortogonals.
D EMOSTRACI O . Si T (e) = e i T (e0 ) = e0 , amb 6= , aplicant la condicio de simetria
tenim que
(e e0 ) = T (e) e0 = e T (e0 ) = (e e0 ) ,
i daqu es dedueix que ( )(e e0 ) = 0, i per tant e e0 = 0 ja que 6= 0.

Teorema 6.10 (Teorema espectral.) Tot endomorfisme sim`etric de Rn e s diagonalitzable, i admet


una base ortonormal de vectors propis.
D EMOSTRACI O . Sigui T lendomorfisme i A la seva matriu (sim`etrica) en la base can`onica.
En primer lloc veurem que det(x I T ) es descompon totalment sobre R. Considerem lendomorfisme T : Cn Cn definit per la matriu A en la base can`onica de Cn . Es obvi que
det(x I T ) = det(x I T ), i sabem que si C e s una arrel amb multiplicitat m daquest
polinomi amb coeficients reals tambe ho e s el seu conjugat .
Per veure que ha de tenir la part imagin`aria nulla, escollim un vector propi u Cn de lendomorfisme T amb valor propi . Com que A te tots els coeficients reals, u tambe e s un vector
propi de T amb valor propi . Aleshores, si U e s la matriu columna de les components de u,
t
t
t
tenim que U U e s un nombre real i positiu, per tant U U = (U U )t = U t U . Pel mateix motiu,
t
t
U AU = (U AU )t = U t AU i, en conseque` ncia,
t

U U = U U = U AU = U t AU = U t U = U t U = U U ,
don es despr`en que = i per tant R.

88

Diagonalitzacio de matrius

R. Amer i F. Carreras

Finalment, comprovarem per induccio sobre n que existeix una base ortonormal de vectors propis
de T . Si n = 1, no hi ha res a dir. Si lenunciat e s cert per al cas n 1, seleccionem un vector
propi unitari en de T amb valor propi i escrivim
Rn = H hen i ,
on H = hen i . Si u H es compleix que T (u) H , perqu`e
T (u) en = u T (en ) = u en = 0 .
Per tant, T es restringeix a un endomorfisme, encara sim`etric, de H . Com que H e s un espai
vectorial de dimensio n 1, per hip`otesi dinduccio existeix una base ortonormal de H , diguem
{e1 , e2 , . . . , en1 }, formada per vectors propis de T .
Ara e s evident que {e1 , e2 , . . . , en1 , en } e s una base ortonormal de Rn formada per vectors propis
de T , que per tant e s diagonalitzable.
Exemple 6.11 Estudiem lendomorfisme T de R3 definit en la base can`onica per la matriu

2 1 1
A =1 2 1 .
1 1 2
Pel teorema espectral, T e s diagonalitzable. El polinomi caracterstic e s
det(x I A) = x 3 6x 2 + 9x 4 = (x 1)2 (x 4) ,
i els valors propis son 1 (doble) i 4 (simple). Els subespais de vectors propis son
Nuc(T I ) = h (1, 0, 1), (0, 1, 1) i

Nuc(T 4I ) = h (1, 1, 1) i .

El vector u 3 = (1, 1, 1) e s ortogonal als vectors u 1 = (1, 0, 1) i u 2 = (0, 1, 1), com assegura
el lema previ al teorema espectral, per`o aquests dos u ltims no ho son entre ells i cal aplicar el
m`etode de Gram-Schmidt, prenent v1 = u 1 i
v2 = u 2 tv1 ,

amb t =

u1 u2
1
= ,
u1 u1
2

e s a dir, v2 = 2u 2 u 1 = (1, 2 1) per evitar fraccions. Afegint v3 = u 3 , els vectors


v1 = (1, 0, 1) ,

v2 = (1, 2, 1) i v3 = (1, 1, 1)

formen una base ortogonal de vectors propis de T . Normalitzant-los obtenim els vectors
1
w1 = (1, 0, 1) ,
2

1
w2 = (1, 2, 1) i
6

1
w3 = (1, 1, 1) ,
3

R. Amer i F. Carreras

89

que formen una base ortonormal B 0 de vectors propis de T . La matriu del canvi e s


3 1 2
1
C= 0
2 2

6
3 1
2
(ortogonal: C 1 = C t ), i la matriu de lendomorfisme T en la base B 0 e s

1
.
1
A0 = C 1 AC = C t AC =
4

6.3 Diagonalitzacio de matrius


Traduirem ara la teoria de diagonalitzacio al llenguatge matricial. Es diu que una matriu quadrada A e s diagonalitzable si existeix una matriu regular C tal que A0 = C 1 AC sigui diagonal.
De cara a la pr`actica, cal notar que les columnes de C seran els vectors propis de lendomorfisme
representat per A, i la diagonal de A0 estar`a ocupada pels valors propis disposats en el mateix
ordre que shagi assignat als vectors propis.
Si la matriu A e s de coeficients reals, ser`a convenient distingir dos casos. (1) Direm que A e s
diagonalitzable sobre els nombres reals si podem escollir com a matriu de canvi C una matriu de
coeficients reals (i per tant A0 tambe ho ser`a). (2) Direm, en canvi, que A e s diagonalitzable sobre
els nombres complexos si hem de prendre C (i per tant A0 ) amb coeficients en general complexos.
En les aplicacions, aquesta segona opcio potser nomes ser`a admissible en determinats contextos.
Finalment, observem que si B e s una matriu conjugada de A, e s a dir, si B = D 1 AD amb D
regular, i A e s diagonalitzable, aleshores B tambe ho ser`a, ja que A i B representen un mateix
endomorfisme en bases diferents.
Exemples 6.12 (a) El polinomi caracterstic de la matriu

1 0 0
A =1 1 0
0 0 2
e s det(x I A) = (x 1)2 (x 2). Tot i que aquest polinomi es descompon totalment, la matriu
no e s diagonalitzable, perqu`e

0 0 0
A I = 1 0 0 , rang(A I ) = 2
0 0 1

90

R. Amer i F. Carreras

Diagonalitzacio de matrius

i, per tant, m 1 = 2 per`o d1 = 3 rang(A I ) = 1.


(b) El polinomi caracterstic de la matriu

1
1
B=
1
0

0
1
0
0

0
1
2
0

0
2

0
2

e s det(x I B) = (x 1)(x + 1)(x 2)2 . Per saber si la matriu e s diagonalitzable, nomes cal
trobar rang(B 2I ): com que

3
0 0 0
1 1 1 2
,
B 2I =
1
0 0 0
0
0 0 0
tenim que rang(B 2I ) = 2 i d2 = 4 2 = 2 = m 2 . Per tant, B e s diagonalitzable.
(c) En el cas de la matriu

3 0 0
C =0 0 0
1 1 1

apliquem el corollari perqu`e


det(x I C) = x(x 1)(x 3) ,
i per tant hi ha tres valors propis diferents, condicio suficient per afirmar que C e s diagonalitzable.
(d) El polinomi caracterstic de la matriu

0 0
0
D = 0 0 1
0 1
0
e s det(x I D) = x 3 + x = x(x i)(x + i). Aquesta matriu no e s diagonalitzable sobre R,
perqu`e el polinomi caracterstic no es descompon totalment en factors de primer grau, mentre
que e s diagonalitzable sobre C perqu`e presenta tres valors propis diferents.
(e) (Teorema espectral generalitzat.) Tota matriu sim`etrica e s diagonalitzable amb un canvi
ortogonal.

R. Amer i F. Carreras

91

En efecte: podem suposar que la matriu representa un endomorfisme de Rn en la base can`onica,


i aplicar el teorema espectral original. Com que la base de vectors propis es pot escollir ortonormal, la matriu C del canvi de base ser`a ortogonal, e s a dir, complir`a que C t C = I (fins i tot
podem fer que det(C) = 1 si volem que el canvi conservi lorientacio). Per tant tenim
A0 = C 1 AC = C t AC .
Aquest resultat e s fonamental per a lestudi de tensors, formes quadr`atiques, c`oniques i qu`adriques.
Exemple 6.13 (C`alcul de les pot`encies duna matriu diagonalitzable.) Si A e s una matriu quadrada, les seves pot`encies naturals Am seguiran una llei de recurr`encia que, en general, e s molt
difcil de trobar directament. En el cas que A sigui diagonalitzable, disposem dun m`etode alternatiu passant per la matriu diagonal conjugada A0 = C 1 AC. En efecte: si

A0 =

..

.
n

(amb 1 , 2 , . . . , n no necess`ariament diferents), e s immediat comprovar que

m
1

2 m

per a tot m N.
(A0 )m =

..

.
n m

Daltra banda, de la relacio A0 = C 1 AC obtenim


A = C A0 C 1 ,
A2 = C A0 C 1 C A0 C 1 = C(A0 )2 C 1
i en general, per induccio,
Am = C(A0 )m C 1 ,
formula que resoldr`a la questio. Com a illustracio, considerem la matriu


2 2
A=
.
1 3
El polinomi caracterstic e s det(x I A) = (x 1)(x 4), i per tant A e s diagonalitzable.
Calculant una base de vectors propis, obtenim




2 1
1 0
0
,
A =
i
C=
1 1
0 4

92

Diagonalitzacio de matrius

R. Amer i F. Carreras

i aplicant la formula de retorn tenim que




 

2 1
1
0 1 1 1
m
A =
1 1
0 4m 3 1
2






1
1
4m 1 2
2 + 4m 2 + 2 4m
2 2
=
=
+
1
3 1 + 4m 1 + 2 4m
3 1
3 1 2

m N.

6.4 Classificacio de les isometries


Al final del captol anterior hem deixat pendent lestudi general de les isometries, que ara podem
dur a terme aplicant, en part, la teoria de la diagonalitzacio. A la primera part de la seccio
classificarem les isometries del pla, i a la segona les de lespai.

Isometries del pla


En el pla, les u niques isometries possibles son els girs i les simetries axials (la identitat i la
simetria central son, de fet, girs dangles respectius 0 i ). A mes, el determinant les classifica:
una isometria T e s un gir si det(T ) = 1, i e s una simetria axial si det(T ) = 1. Suposarem el
pla orientat per tal de descriure els girs unvocament.
Sigui T una isometria del pla orientat R2 definida en la base can`onica per la matriu


a c
A=
.
b d
Aquesta matriu compleix que At = A1 , on




1
d c
a b
1
t
,
A =
A =
c d
a
det(A) b
i det(A) = 1. Estudiem aquests dos casos per separat.
Cas 1. Si det(A) = 1, lanterior igualtat e s


a b
c d


=

d c
b
a

Aleshores la matriu e s de la forma




a b
A=
b
a

(
,

don

d=a
c = b .

amb a 2 + b2 = 1

93

R. Amer i F. Carreras

i, en conseque` ncia, existeix un u nic [0, 2 ) tal que a = cos i b = sin . En definitiva, la
matriu de T en la base can`onica e s


cos sin
sin
cos
i T e s un gir dangle .
Com a casos particulars tenim la identitat T = I quan = 0 i la simetria central T = I quan
= .
Cas 2. Si det(A) = 1, tenim que


a b
c d


=

Aleshores


A=

d
c
b a

a
b
b a

(
,

don

d = a
c = b.

amb a 2 + b2 = 1 .

Aquesta matriu e s sim`etrica i, per tant, diagonalitzable en una base ortonormal B 0 = {e10 , e20 }. El
seu polinomi caracterstic e s det(x I A) = x 2 1 = (x 1)(x + 1), de manera que la matriu
de T en la base B 0 e s


1
0
0
A =
.
0 1
T e s, doncs, la simetria axial deix
h e10 i = Nuc(T I ) .
Observacions 6.14 (a) Tambe podem distingir els girs de les simetries a partir del seguent fet:
si la matriu A e s sim`etrica, T e s la identitat, una simetria axial o la simetria central; si A no e s
sim`etrica, T e s un gir.
(b) Els girs tals que 6= 0, son les u niques isometries del pla que no tenen vectors propis.

Isometries de lespai
Estudiem ara les isometries de lespai orientat R3 . A difer`encia de les isometries del pla, les de
lespai sempre tenen vectors propis, ja que el seu polinomi caracterstic, en ser de grau 3, te com
a mnim una arrel real. El resultat seguent ens dona mes informacio.
Lema 6.15 Sigui T e s una isometria de R3 .

94

R. Amer i F. Carreras

Diagonalitzacio de matrius

(a) Si det(T ) = 1, T admet el valor propi 1.


(b) Si det(T ) = 1, T admet el valor propi 1.
D EMOSTRACI O . Sigui A la matriu de T en la base can`onica.
(a) La matriu A I compleix que
A I = A At A = (I At )A ,
i per tant
det(A I ) = det(I At ) det(A) = det(I A) = det(A I ) ,
ja que aquests determinants son dordre 3. Aix doncs, det(A I ) = 0 i T admet el valor propi
1.
(b) La matriu A + I compleix que
A + I = A + At A = (I + At )A ,
de forma que
det(A + I ) = det(I + At ) det(A) = det(I + A) .
Per tant, det(A + I ) = 0 i T admet el valor propi 1.
Tal com hem fet en el pla, distingirem dos casos segons el determinant de la isometria.
Cas 1. Si T e s una isometria de R3 amb determinant 1, sigui w un vector no nul amb valor propi
1, i considerem la descomposicio de lespai
R3 = h w i H ,

on

H = h w i .

Si u H , tenim que T (u) w = T (u) T (w) = u w = 0, e s a dir, T (u) H , i la restriccio de


T a H e s una isometria plana. Daltra banda, el vector w determina una orientacio sobre el pla
H i, com que aquesta restriccio no pot ser una simetria perqu`e el determinant de T e s 1, ha de
ser un gir dangle . Aleshores, si {u, v} e s una base ortonormal positiva de H , la matriu de T
en la base B = {w, u, v} de R3 e s

1
0
0
0 cos sin ,
0 sin cos
i T e s una rotacio dangle al voltant del vector w.

R. Amer i F. Carreras

95

Observacions 6.16 (a) Langle dep`en de T , de lorientacio de lespai i del sentit del vector
propi w escollit. En particular, la rotacio dangle al voltant de w coincideix amb la rotacio
dangle al voltant de w.
(b) Com a casos particulars tenim la identitat T = I quan = 0 i la simetria axial respecte a la
recta hwi = Nuc(T I ) quan = .
Cas 2. Si T e s una isometria de R3 amb determinant 1, sigui w un vector no nul amb valor
propi 1, i considerem la descomposicio de lespai
R3 = h w i H ,

on

H = h w i .

El mateix raonament dabans ens permet assegurar que la restriccio de T a H tambe e s un gir
dangle . Aleshores, si {u, v} e s una base ortonormal positiva de H , la matriu de T en la base
B = {w, u, v} e s

1
0
0
0 cos sin ,
0 sin cos
i T e s la composicio de la rotacio dangle al voltant del vector w amb la simetria plana
respecte a H . A mes, aquesta composicio e s commutativa, i cal notar que leix de rotacio i el pla
de simetria son ortogonals.
Observacio 6.17 Com a casos particulars tenim la simetria central T = I quan = i la
simetria plana respecte al subespai H = Nuc(T I ) quan = 0.

Podem resumir els resultats obtinguts en aquest apartat amb lesquema de classificacio seguent.
Si la matriu A representa la isometria T en la base can`onica o en qualsevol base ortonormal
positiva de R3 , aleshores:
Exemples 6.18 (a) Considerem la isometria T
matriu

0
A =1
0

de R3 que en la base can`onica ve definida per la

0 1
0 0 .
1 0

immediat comprovar que aquesta matriu e s ortogonal, no sim`etrica, que det(A) = 1 i que
Es
Nuc(T I ) = h (1, 1, 1) i. Per tant, es tracta duna rotacio al voltant del vector (1, 1, 1).
Per obtenir langle de rotacio hem de calcular sin i cos . Apliquem la formula
T (u) = u cos + (1 cos )(u w)w + (w u) sin

96

Diagonalitzacio de matrius

R. Amer i F. Carreras

det(A)

A
sim`etrica

Si

Identitat
Simetria axial respecte al subespai Nuc(T I )

No

Rotacio al voltant del vector w Nuc(T I )

Si

Identitat o simetria central


Simetria plana respecte al subespai Nuc(T I )

No

Composicio duna rotacio al voltant de w Nuc(T + I )


i una simetria plana respecte al subespai h w i

Taula 6.1: Classificacio de les isometries a lespai


amb w =

1 (1, 1, 1)
3

i u = (1, 0, 0):
1

(0, 1, 0) = (1, 0, 0) cos + (1 cos ) (1, 1, 1) + (0, 1, 1) sin .


3

Igualant les components tenim les relacions

1 cos

= 0

1 cos sin
+ =1 ,
3

1 cos sin

= 0
3
3

cos +

amb les quals determinem les raons trigonom`etriques de langle buscat:

3
1
cos =
i
sin =
.
2
2
Per tant, T e s la rotacio de 120 al voltant del vector (1, 1, 1): aquests son els dos elements
geom`etrics de la isometria.
Hi ha un m`etode alternatiu per determinar langle duna rotacio. Es basa en el fet que la traca
de la matriu dun endomorfisme e s invariant pels canvis de base, perqu`e e s un coeficient del

R. Amer i F. Carreras

97

polinomi caracterstic. Comparant la matriu A que tenim amb la matriu de la rotacio en una base
adaptada a leix resulta la relacio
1 + 2 cos = tr(A) .
Quan cos 6= 1, aquesta equacio admet dues solucions 1 , 2 [0, 2), tals que
0 < 1 <

< 2 < 2 .

Si w e s el vector que defineix el sentit de leix de rotacio, escollim un vector no nul u w,


calculem la seva imatge v = T (u) i considerem la base {w, u, v}: si e s positiva, = 1 ; si e s
negativa, = 2 . (Si cos = 1, = 0 o sense ambiguitat.)
A lexemple que acabem destudiar tenim
1 + 2 cos = 0 ,
cos = 1/2 i, per tant, 1 = 120 i 2 = 240 . Prenent w = (1, 1, 1) i u = (1, 1, 0) resulta
v = T (u) = (0, 1, 1). Com que

1
1
0

1 1
1

1
0 1




=3>0

deduim que = 1 = 120 .


(b) Considerem ara lendomorfisme S de R3 definit per

0 1 0
B = M(S, Bc ) = 1 0 0 .
0 0 1
B e s ortogonal i sim`etrica per`o det(B) = 1, per tant S e s una simetria plana. El pla de simetria
e s el subespai Nuc(S I ), definit pel sistema dequacions


1
1 0
x
0
1 1 0 y = 0 ,
0
0 0
z
0
que es redueix a lequacio x y = 0. Aquest e s el pla de simetria, i lunic element geom`etric
que cal determinar en aquest cas.

98

R. Amer i F. Carreras

Diagonalitzacio de matrius

6.5 Sistemes dequacions diferencials lineals


Una aplicacio interessant de la diagonalitzacio de matrius e s la resolucio de sistemes dequacions
diferencials lineals de primer ordre amb coeficients constants.
Una equacio diferencial de primer ordre en forma normal e s una relacio
y 0 = f (x, y)
entre una variable independent x, una variable y que e s funcio de x i la derivada corresponent
dy
.
dx

y0 =

El problema consisteix a trobar les solucions, e s a dir, les funcions y = y(x) que satisfan la
relacio anterior per a tot x dun cert interval.
Exigint condicions a la funcio f apareixen diversos tipus dequacions diferencials. Si es demana
que f sigui lineal en y, ens trobem amb lequacio diferencial lineal
y 0 = P(x)y + Q(x) .
Si P(x) = e s una constant tenim lequacio diferencial lineal de primer ordre amb coeficient
constant
y 0 = y + Q(x) ,
on suposarem que Q e s una funcio almenys contnua en un interval I R. Si, a mes, Q(x) = 0,
resulta lanomenada equacio homog`enia
y 0 = y ,
la mes senzilla de totes per`o tambe la mes frequent en les primeres aplicacions pr`actiques.
Teorema 6.19 (a) Les solucions de lequacio homog`enia de primer ordre
y 0 = y
son totes les funcions de la forma
y(x) = Cex

amb C R .

(b) Una solucio particular de lequacio completa


y 0 = y + Q(x)

99

R. Amer i F. Carreras

e s la funcio
y p (x) = ex

Q(x)ex d x .

(c) La solucio general de lequacio completa e s


y = y p (x) + Cex

amb C R .

D EMOSTRACI O . (a) Representem per D laccio de derivar. La condicio D(y) = y implica


que
D(yex ) = D(y)ex yex = 0 ,
de manera que la funcio yex e s constant sobre R i resulta
yex = C ,

o be

y(x) = Cex

amb C R .

Recprocament, tota funcio daquesta forma e s solucio de lequacio homog`enia.


(b) Provem una funcio de la forma
y p (x) = C(x)ex
com a solucio de lequacio completa, suposant C(x) derivable (m`etode de variacio de les constants). Derivant,
y p0 (x) = C 0 (x)ex + C(x)ex ,
i substituint a lequacio completa i simplificant resulta
C 0 (x)ex = Q(x) ,

Z
e s a dir, C(x) =

Q(x)ex d x ,

expressio que ens dona la solucio particular y p (x) indicada a lenunciat.


(c) Si y = y(x) e s una solucio de lequacio completa, y y p ho e s de lhomog`enia, per tant
y y p = Cex

y(x) = y p (x) + Cex

amb C R .

Recprocament, tota funcio daquesta forma e s solucio de lequacio completa.


Exemple 6.20 (Condicions inicials.) La constant arbitr`aria C que apareix en la solucio general
duna equacio de primer ordre es determina imposant a la funcio solucio una condicio addicional,
que acostuma a ser del tipus
y = y0

quan

x = x0 ,

on x0 i y0 son dades (es frequent prendre x0 = 0, i daqu ve el nom de condicions inicials).

100

Diagonalitzacio de matrius

R. Amer i F. Carreras

Com a illustracio, resoldrem lequacio diferencial


y 0 = 2y + x
amb les condicions inicials y = 1/2 quan x = 0.
(a) Lequacio homog`enia associada e s y 0 = 2y, i la seva solucio general y = Ce2x , amb C R.
(b) Una solucio particular de lequacio completa ser`a de la forma y p = C(x)e2x , on


Z
x
1 2x
2x
+
e
C(x) = xe
dx =
2 4
i per tant
yp =

x
1
.
2 4

(c) La solucio general de lequacio proposada e s la famlia


y = Ce2x

1
x

2 4

amb C R .

(d) Imposant les condicions inicials exigides,


1
1
=C ,
2
4

C=

3
4

i queda com a solucio u nica del problema la funcio


y=

3e2x 2x 1
.
4

Un sistema dequacions diferencials de primer ordre per a dues variables x, y que depenen duna
variable independent t e s un parell dequacions de la forma

dx
= F(x, y, t)
x =

dt
.
dy

y =
= G(x, y, t)
dt
Les solucions seran parelles de funcions x = x(t), y = y(t) que amb les seves derivades
satisfacin les dues equacions per a tot t dun cert interval.
Es pot donar a la variable t el significat de temps, i entendre x i y com les coordenades dun punt
m`obil del pla: en aquesta interpretacio cinem`atica del sistema, el vector velocitat v = (x,
y ) est`a
relacionat amb la posicio (x, y) i el temps t.

101

R. Amer i F. Carreras

El sistema e s lineal si les funcions F i G ho son respecte x i y conjuntament, i amb coeficients


constants si ho son els daquestes variables, quedant de la forma
)
x = ax + cy + f (t)
,
y = bx + dy + g(t)
on suposem que f i g son almenys contnues en un interval I R. Si les funcions f i g son
nulles, el sistema e s homogeni.
Matricialment, un sistema dequacions diferencials lineals amb coeficients constants es pot representar per
X = AX + H (t) ,
on

X=

x
y

X =

x
y

A=

a c
b d


i

H (t) =

f (t)
g(t)

Teorema 6.21 Si la matriu A e s diagonalitzable (sobre R o sobre C), el sistema dequacions


diferencials
X = AX + H (t)
es pot resoldre fent el canvi de variables X = CU que diagonalitza A, ja que condueix a un
sistema format per dues equacions lineals de primer ordre resolubles separadament.
D EMOSTRACI O . Com que A e s diagonalitzable (sobre C si e s necessari), existir`a una matriu
C tal que D = C 1 AC ser`a diagonal. Introduint el vector de noves variables U definit per
X = CU , tenim que
U = C 1 X ,

U = C 1 X

C 1 A = DC 1 .

Aleshores
U = C 1 X = C 1 [AX + H (t)] = DC 1 X + C 1 H (t) = DU + C 1 H (t) .
Si posem

U=

u
v


D=

H (t) =

(t)
(t)

aquest sistema sescriu


u = u + (t)
v = v + (t)

)
.

Una vegada resoltes separadament aquestes dues equacions i obtingudes les solucions u = u(t)
i v = v(t), desfent el canvi per X = CU tindrem la solucio general del sistema original, donada
per x = x(t) i y = y(t).

102

Diagonalitzacio de matrius

R. Amer i F. Carreras

Exemples 6.22 (a) Considerem el sistema seguent i la matriu que el defineix:


)


x = x + 2y 4t 3
1 2
i A=
.
2 1
y = 2x + y 2t 1
El polinomi caracterstic e s det(x I A) = x 2 2x 3, i els valors propis 3 i 1. Calculant els
vectors propis obtenim la matriu del canvi que diagonalitza A i el sistema en les noves variables:
)


u = 3u 3t 2
1
1
C=
i
.
1 1
v = v t 1
Resolent per separat les equacions del nou sistema i desfent el canvi trobem la solucio general
del sistema original:
)
  
  3t

u = Ae3t + t + 1
x
1
1
Ae + t + 1
,
=
y
1 1
Bet t
v = Bet t
i, finalment,
x(t) = Ae3t + Bet + 1
y(t) = Ae3t Bet + 2t + 1

)
.

(b) (Condicions inicials.) Les condicions inicials habituals per a un sistema dequacions diferencials de primer ordre son de la forma
x = x0

y = y0

quan

t = t0 ,

on x0 , y0 i t0 (sovint e s t0 = 0) son dades. Aix`o permet determinar les constants que apareixen
en la solucio general i escollir la solucio adequada.
Com a illustracio, considerem un m`obil del pla que a linstant t = 0 es troba en el punt (2, 0) i
en tot moment es regeix per les equacions diferencials de lexemple (a).
Imposant les condicions inicials, tenim que A = 0 i B = 1, constants que defineixen la solucio
u nica o traject`oria del mobil
x = et + 1 ,

y = et + 2t + 1 .

(c) Un fluid que es mou en pla sanomena estacionari quan la velocitat de cada partcula no
dep`en mes que de la posicio (i no del temps): altrament dit, si en passar per cada punt totes
les partcules porten la mateixa velocitat, donada pel camp vectorial que assigna a cada punt un
vector. Les solucions dun tal sistema
)
x = F(x, y)
y = G(x, y)

R. Amer i F. Carreras

103

son traject`ories x = x(t), y = y(t) que en cada punt tenen un vector tangent prefixat.
Considerem per exemple el sistema
)

x = y
y = x

A cada punt, el camp vectorial e s ortogonal al vector de posicio i de la mateixa longitud: la


descripcio gr`afica suggereix que les partcules del fluid seguiran o rbites tancades al voltant de
lorigen en sentit negatiu (el de les agulles del rellotge). La resolucio del sistema ho confirmar`a.
La matriu que defineix el sistema i el seu polinomi caracterstic son


0 1
A=
i
det(x I A) = x 2 + 1 = (x i)(x + i) ,
1 0
per tant e s necessari diagonalitzar sobre C: la matriu del canvi i el nou sistema son
)


u = iu
1
1
C=
i
.
i i
v = iv
Resolent aquest nou sistema i desfent el canvi surt la solucio general complexa del sistema original:
)
)
u = Aeit
x = Aeit + Beit
i
amb A , B C .
v = Beit
y = i Aeit i Beit
Imposant que x i y tinguin valors reals per a tot t surt B = A, i escrivint A = C + Di queda,
incloent els signes en les constants,
)
x = C cos t + D sin t
amb C , D R .
y = D cos t C sin t
Afegint ara com a condicions inicials x = r i y = 0 quan t = 0, resulta que C = r i D = 0.
Aleshores, les equacions de la traject`oria del fluid, que confirmen la prediccio feta al principi a
partir del camp vectorial, son
x = r cos t ,

y = r sin t ,

i representen circumfer`encies de centre lorigen i radi r recorregudes en el sentit de les agulles


del rellotge.
Molt probablement, el lector ja haur`a notat que el concepte de sistema lineal de primer ordre
amb coeficients constants i el teorema de resolucio son o` bviament generalitzables a mes de dues
variables dependents de t.

104

R. Amer i F. Carreras

Diagonalitzacio de matrius

R. Amer i F. Carreras

105

7
Tensors i formes quadr`atiques

Pensant en les aplicacions a la fsica i al c`alcul infinitesimal, dediquem aquest captol a lexemple
mes interessant de l`algebra tensorial: els tensors covariants sim`etrics de segon ordre que aqu
anomenarem simplement tensors i les formes quadr`atiques associades.

7.1 Introduccio
Abans de donar la definicio formal de les dues nocions b`asiques que volem considerar, proposarem per a cada una delles una situacio on es presenta de manera natural.
Exemple 7.1 (La forma hessiana duna funcio.) Considerem una funcio real de dues variables
z = f (x, y) i un punt p = (x0 , y0 ) del seu domini. Denotem les derivades parcials segones de
f en el punt p per
 2 
 2 
 2 
 2 
f
f
f
f
a=
,
b=
=
i
c=
.
2
x p
y x p
x y p
y2 p
Laplicacio q : R2 R que a cada vector u = (x, y) interpretat com un increment a partir
del punt p li assigna
q(u) = q(x, y) = ax 2 + 2bx y + cy 2

106

Tensors i formes quadr`atiques

R. Amer i F. Carreras

e s lhessiana de la funcio f en el punt p. El seu estudi condueix a un criteri per seleccionar els
extrems locals de la funcio f dentre els seus punts estacionaris (vegeu la darrera seccio daquest
captol).
En general, una forma quadr`atica e s una aplicacio q : Rn R definida per una expressio
polin`omica homog`enia de segon grau en les variables x1 , x2 , . . . , xn :
q(u) = q(x1 , x2 , . . . , xn ) =

n
X

ai j xi x j

i, j=1

(on sempre es pot suposar, i aix ho farem, que ai j = a ji ). Observem que si A = (ai j ) i
X = (x1 x2 xn )t tenim que
q(u) = q(x1 , x2 , . . . , xn ) = X t AX .
immediat de comprovar que q(tu) = t 2 q(u).
Es
Exemple 7.2 (El tensor din`ercia.) Suposem que una partcula de massa m es mou a lespai fent
una rotacio al voltant de leix hwi amb velocitat angular k w k. Si r e s el vector de posicio de la
partcula, sabem que la seva velocitat e s v = w r .
Es defineix el moment cin`etic de la partcula a cada posicio r per
M(w) = mr v = mr (w r ) .
La transformacio M e s un endomorfisme sim`etric de R3 . Definim el tensor din`ercia de la
partcula a la posicio r per
T (u, v) = u M(v) .
T dona la mateixa informacio que M, per`o e s mes u til en determinades questions. Per exemple,
lenergia cin`etica de la partcula es pot escriure com
1
1
E = mk v k2 = T (w, w) .
2
2
(En el cas dun s`olid rgid compost per un continu de partcules, cal introduir a tot arreu el smbol
dintegracio.)

En general, un tensor (un tensor covariant sim`etric de segon ordre, per ser precisos) e s una
aplicacio bilineal sim`etrica T : Rn Rn R. Bilineal vol dir lineal respecte a cada una de
les dues variables vectorials, i aix`o significa que tenim
T (u + u 0 , v) = T (u, v) + T (u 0 , v)

T (tu, v) = t T (u, v)

i dues relacions an`alogues quan fixem u en comptes de v. Sim`etrica vol dir que T (u, v) =
T (v, u).

R. Amer i F. Carreras

107

Teorema 7.3 (Caracteritzacio dels tensors.) Una aplicacio T : Rn Rn R e s un tensor si,


i nomes si, es pot representar matricialment per
T (u, v) = X t AY ,
on A e s una matriu sim`etrica.
D EMOSTRACI O . El raonament e s molt semblant al del teorema de caracteritzacio de les transformacions lineals del captol 5, aix que el deixarem com a exercici per al lector interessat.
Observacions 7.4 (a) A la demostracio anterior es comprova que, si B = {e1 , e2 , . . . , en } e s una
base de Rn , els escalars
ai j = T (ei , e j )
determinen totalment T , poden ser escollits arbitr`ariament sempre que ai j = a ji (simetria) i son
els coeficients de la matriu A, que e s la matriu de T en la base B. Simbolitzarem aquesta u ltima
relacio per A = M(T, B). Aix doncs, si X i Y son les columnes respectives de components de
u i v en la base B, tenim que
T (u, v) = X t AY =

n
X

ai j xi yj .

i, j=1

En general, els coeficients diagonals aii sanomenen components principals del tensor, i els
coeficients no diagonals ai j components secund`aries. En el cas del tensor delasticitat (origen
del mot tensor) es parla, respectivament, de tensions normals i tensions tangencials.
(b) (Forma quadr`atica associada.) Donat el tensor T , definim la forma quadr`atica associada a
T com laplicacio q : Rn R donada per
q(u) = T (u, u) .
Amb les notacions de lobservacio anterior tenim que
q(u) = X t AX ,
i e s immediat comprovar la propietat seguent, dita igualtat de polaritzacio, que permet afirmar
que tota forma quadr`atica q est`a associada a un u nic tensor T :
q(u + v) = q(u) + q(v) + 2T (u, v) .
(c) (Formula del canvi de base.) Si B 0 e s una altra base de Rn , A0 = M(T, B 0 ) i C e s la matriu
del canvi de base de B 0 a B, aleshores es compleix la relacio
A0 = C t AC .

108

Tensors i formes quadr`atiques

R. Amer i F. Carreras

(Novament, deixem la comprovacio a les mans del lector, que pot inspirarse en el cas dels
endomorfismes tractat en el captol 5.) Des del punt de vista fsic, e s habitual pensar en un tensor
com un ens descrit a cada base per una matriu sim`etrica A que, en fer un canvi de base, varia
seguint la formula anterior. Escrita en components, la formula sexpressa per
n
X
ai0 j =
c`i a`k ck j per a i, j = 1, 2, . . . , n .
k,`=1

(d) (Restriccio dun tensor a un subespai.) Suposem que T e s un tensor definit sobre Rn , B e s
una base de Rn i A = M(T, B). Suposem tambe que H e s un subespai del qual hem escollit
una base B 0 = {u 1 , u 2 , . . . , u k }, i que D e s la matriu (de tamany n k) que relaciona B 0 amb B.
Aleshores, la restriccio de T al subespai H , que es defineix de manera o` bvia, queda descrita en
la base B 0 per la matriu
A0 = D t AD ,
perqu`e aquest producte matricial calcula els coeficients ai0 j = T (u i , u j ) de la matriu A0 . Com a
illustracio, restringirem el tensor T de R3 definit per

6
2
4
A = M(T, Bc ) = 2 2 2
4 2
0
al pla dequacio 2x + 3y z = 0. Una base daquest pla e s B 0
de la restriccio de T en aquesta base e s


 6
1
2
4
1 0 2
2 2 2 0
A0 = D t AD =
0 1 3
2
4 2
0

= {(1, 0, 2), (0, 1, 3)}, i la matriu



0
22
10

1
=
.
10 14
3

La t`ecnica de restriccio e s u til per a lestudi dels extrems condicionats de les funcions de diverses
variables.
Exemples 7.5 (a) Si la posicio duna partcula de massa m referida a una base ortonormal positiva de lespai e s r = (x, y, z), la matriu del tensor din`ercia de la partcula en aquesta posicio
e s
2

y + z2
x y
x z
x 2 + z2
yz .
A = m x y
2
x z
yz
x + y2
En el cas dun sistema format per un nombre finit de partcules de masses m k
tives rk = (xk , yk , z k ), la matriu e s
X
X
X
m k (yk2 + z k2 )
m k xk yk

m k xk z k
k X
k
k
X
X

m k xk yk
m k (xk2 + z k2 )

m k yk z k
A=

k
k
k
X
X
Xm x z

m y z
m (x 2 + y 2 )
k k k

k k k

i posicions respec

R. Amer i F. Carreras

109

Els coeficients de la diagonal principal son els moments din`ercia, i els restants sanomenen
productes din`ercia.
(b) La presentacio geom`etrica de la teoria de la relativitat restringida fa servir un espai vectorial
real, lespaitemps E 4 = V3 T1 , on V3 e s lespai ordinari (de les posicions) i T1 e s leix
temporal. La formulacio de la teoria es fonamenta en el tensor de Minkowski, que en una base
{i, j, k, h} adaptada a la suma directa queda definit per la matriu

1
,
A=

1
2
c
on c e s la velocitat de la llum. Lequacio de la forma quadr`atica associada al tensor de Minkowski
en la mateixa base e s
q(u) = q(x, y, z, t) = x 2 + y 2 + z 2 c2 t 2 ,
i la cinem`atica de la relativitat restringida equival essencialment a lestudi de les isometriesde
E 4 , endomorfismes que deixen invariant el tensor de Minkowski i reben el nom de transformacions de Lorentz.
La mec`anica relativista dels medis continus demostra que el tensor de lenergia mec`anica dun
fluid perfecte e s un multiple escalar del tensor de Minkowski.

7.2 Diagonalitzacio de tensors i formes


Exposarem ara un dels processos de diagonalitzacio de tensors i formes quadr`atiques.
Teorema 7.6 Si T e s un tensor arbitrari sobre Rn , existeixen bases B 0 de Rn on la matriu de T
e s diagonal i, per tant, la forma quadr`atica associada q sexpressa com a combinacio lineal de
quadrats:

0
0
0
0 2
0 2
0 2
..
A0 = M(T, B 0 ) =
i q(x1 , x2 , . . . , xn ) = 1 (x1 ) +2 (x2 ) + +n (xn ) .
.
n
D EMOSTRACI O . La matriu A de T en una base B de Rn e s sim`etrica. Aplicant el teorema
espectral generalitzat, existeix una matriu ortogonal de canvi de base C tal que
A0 = C 1 AC = C t AC
e s diagonal.

110

Tensors i formes quadr`atiques

R. Amer i F. Carreras

Observacions 7.7 (a) Si nomes considerem bases ortonormals (es a dir, fem canvis ortogonals),
el resultat final del proces la matriu A0 e s u nic llevat de lordre en qu`e disposem els valors
propis. Lequacio corresponent per a la forma quadr`atica associada,
q(x10 , x20 , . . . , xn0 ) = 1 (x10 )2 + 2 (x20 )2 + + n (xn0 )2 ,
sanomena lexpressio euclidiana can`onica de q.
(b) A efectes pr`actics, recordem que els coeficients de la diagonal de A0 son els valors propis de
la matriu A, i que les columnes de la matriu de canvi C son els vectors propis ortonormals de A
escrits en el mateix ordre que els valors propis.
Exemple 7.8 Considerem un cub rgid i homogeni, de costat 1 i densitat 12, que gira al voltant
dun eix que passa per un dels seus v`ertexs, i suposem que els vectors de la base ortonormal
positiva de refer`encia B segueixen les direccions de les arestes del cub. Aleshores, la matriu del
tensor din`ercia del s`olid en la base B e s

8 3 3
8 3 .
A = 3
3 3
8
El polinomi caracterstic e s det(t I A) = t 3 24t 2 + 165t 242, i els valors propis son 2
(simple) i 11 (doble). Escollim com a vectors propis respectius
1
u 1 = (1, 1, 1),
3

1
u 2 = (1, 1, 0) i
2

1
u 3 = (1, 1, 2) .
6

En la base ortonormal positiva B 0 = {u 1 , u 2 , u 3 }, la matriu del tensor din`ercia del cub e s

2
.
11
A0 =
11
Els valors propis son els moments principals din`ercia del cub, i les direccions definides pels
vectors u 1 , u 2 , u 3 son els eixos principals din`ercia. Si leix de rotacio e s un daquests eixos
aleshores no hi ha productes din`ercia, i aix`o significa que la figura es troba en equilibri din`amic.
Lexpressio euclidiana can`onica de la forma quadr`atica associada e s
2

q(x 0 , y 0 , z 0 ) = 2x 0 + 11y 0 + 11z 0 .


Si la figura gira, per exemple, al voltant del vector w = u 1 + 2u 2 + 2u 3 , amb velocitat angular
3, la seva energia cin`etica en qualsevol moment e s
1
E = q(1, 2, 2) = 45 .
2

111

R. Amer i F. Carreras

Aplicant factors correctors adequats als vectors de la base on un tensor T diagonalitza, sempre
podem fer que els coeficients de la matriu diagonal de T siguin exclusivament 1, 1 o 0. A
lexemple anterior, si prenem com a base
1
v1 = (1, 1, 1),
6

1
v2 = (1, 1, 0) i
22

1
v3 = (1, 1, 2)
66

queda com a matriu del tensor

A0 =

1
1

i com a expressio de la forma quadr`atica associada


2

q(x 0 , y 0 , z 0 ) = x 0 + y 0 + z 0 .
Observem que hem sacrificat la normalitzacio dels vectors.

7.3 Indexs din`ercia i classificacio de formes


Hem vist que, donat un tensor T sobre Rn , existeixen bases on la matriu de T e s diagonal,
i apareixen r coeficients positius, s coeficients negatius i t = n r s zeros a la diagonal
principal. De fet, hi ha altres procediments de diagonalitzacio, i no condueixen a un mateix
resultat.
Exemple 7.9 Considerem la forma quadr`atica definida per
q(x, y, z) = 6x 2 + 4x y 2y 2 + 2x z + 2yz .
En la base formada pels vectors
1
u 1 = (1, 0, 0),
6
la matriu del tensor associat e s

1
u 2 = (1, 3, 0)
24

u 3 = (1, 1, 4)

1
0

mentre que els valors propis son 2 + 22, 2 22 i 0. No importa la manera com hem obtingut
els vectors u 1 , u 2 , u 3 : la questio e s que existeixen diferents matrius diagonals dun mateix tensor.
Aleshores, el resultat seguent esdeve essencial.

112

Tensors i formes quadr`atiques

R. Amer i F. Carreras

Teorema 7.10 (Llei din`ercia de Sylvester.) Els nombres r i s no depenen de la base escollida
per diagonalitzar el tensor T .
D EMOSTRACI O . Sigui B = {u 1 , . . . , u r , v1 , . . . , vs , w1 , . . . , wt } una base on la matriu de T
e s diagonal, i suposem que, a la diagonal, els primers r coeficients son positius, els s seguents
negatius i els t finals zeros. Aix`o ens dona una descomposicio de lespai en suma directa:
Rn = Pr Ns Rt ,
on T (u, v) = 0 si u i v pertanyen a subespais diferents i, a mes,
q(u) > 0 u Pr ,

q(v) < 0

v Ns

q(w) = 0

w Rt .

Sigui B 0 una altra base on la matriu de T e s diagonal, ordenada de forma an`aloga. Dentrada,
Rt = {u Rn : T (u, v) = 0 v Rn } = Rt00 ,
per tant, t = t 0 i r + r 0 = s + s 0 .
Comprovem ara que la projeccio de Rn sobre Pr parallelament a Ns Rt e s injectiva quan es
restringeix a Pr00 . En efecte: si 0 6= x Pr00 , tenim x = u + v + w amb u Pr , v Ns i w Rt ;
si fos u = 0, resultaria que
0 < q(x) = q(v + w) = q(v) + q(w) + 2T (v, w) = q(v) < 0 ,
absurd. Aix doncs, r 0 r . Per la simetria del raonament, r = r 0 , i per tant tambe s = s 0 .
Els nombres r i s son els ndexs din`ercia de T (i de q). La llei din`ercia ens diu que lexpressio
duna forma quadr`atica en qualsevol base on la matriu sigui diagonal amb coeficients 1, 1 i 0
e s u nica, i queda justificat denominarla lexpressio can`onica af de la forma. Una manera de
calcular els ndexs din`ercia, i descriure per tant lexpressio can`onica af de la forma, e s comptar
els signes dels valors propis. El teorema de Descartes (vegeu lap`endix B) sembla fet a mida per
a aquesta finalitat, ja que per ser sim`etrica la matriu A que representa a T sabem a priori que el
seu polinomi caracterstic te totes les arrels reals, i podem determinar f`acilment r i s.
Exemple 7.11 Considerem la forma quadr`atica de lexemple anterior:
q(x, y, z) = 6x 2 + 4x y 2y 2 + 2x z + 2yz .
El polinomi caracterstic e s det(t I A) = t 3 4t 2 18t = 0. Aqu hi ha una variacio de signe,
i per tant un u nic valor propi positiu; com que 0 e s un valor propi simple, hi ha un tercer valor
propi negatiu. Lexpressio can`onica af de q e s
2

q(x 0 , y 0 , z 0 ) = x 0 y 0 .

113

R. Amer i F. Carreras

Es diu que una forma quadr`atica q e s definida positiva (respectivament, definida negativa) si
q(u) > 0 (resp., q(u) < 0) per a tot u 6= 0. Es diu que q e s semidefinida positiva si q(u) 0
per a tot u Rn (amb algun u tal que q(u) > 0) per`o existeix algun v 6= 0 tal que q(v) = 0 el
lector prover`a la definicio de semidefinida negativa. Finalment, q e s no definida si existeixen
u, v Rn tals que q(u) > 0 i q(v) < 0. Lunica forma quadr`atica que escapa, doncs, a aquesta
classificacio e s la forma nulla. A continuacio donem diversos criteris per classificar una forma
quadr`atica arbitr`aria.
Teorema 7.12 Els ndexs din`ercia r i s duna forma quadr`atica q definida sobre Rn , calculables a partir dels valors propis 1 , 2 , . . . , n , permeten classificarla segons lesquema de la
taula 7.1.

Tot i > 0

r =n

s=0

definida positiva

Tot i < 0

r =0

s=n

definida negativa

Tot i 0, algun k > 0


i algun j = 0

0<r <n

s=0

semidefinida positiva

Tot i 0, algun k < 0


i algun j = 0

r =0

0<s<n

semidefinida negativa

Algun i > 0
i algun j < 0

r >0

s>0

no definida

Tot i = 0

r =0

s=0

forma nulla

Taula 7.1: Classificacio de formes quadr`atiques

D EMOSTRACI O . Nomes cal pensar en lexpressio can`onica af de q, amb la qual es fan paleses
les sis possibilitats, i en la relacio entre els ndexs din`ercia i els signes dels valors propis.

Exemples 7.13 (a) El tensor din`ercia duna partcula dona sempre una forma quadr`atica semide-

114

R. Amer i F. Carreras

Tensors i formes quadr`atiques

finida positiva, perqu`e el polinomi caracterstic e s


t 3 2mr 2 t 2 + m 2r 4 t = 0 ,
on r 2 = x 2 + y 2 + z 2 , i els valors propis son mr 2 (doble) i 0 (simple).
(b) En canvi, si tenim tres partcules de masses respectives 2, 1 i 1, situades a les posicions
(1,1,0), (1,0,1) i (0,1,1), la matriu del tensor din`ercia del sistema e s

5 2 1
5 1 .
A = 2
1 1
6
El polinomi caracterstic e s det(t I A) = t 3 16t 2 + 79t 112, de manera que la forma
quadr`atica associada e s definitiva positiva perqu`e r = 3 i s = 0.
Teorema 7.14 (Criteri de Sylvester.) Si A e s la matriu del tensor T en alguna base, i els nombres
D1 , D2 , . . . , Dn son els menors diagonals creixents de la matriu A = (ai j ), e s a dir,
Dk = det(Ak ) ,

on

Ak = (ai j ) per a

1 i, j k ,

aleshores:
(a) q e s definida positiva si, i nomes si, D1 , D2 , . . . , Dn > 0.
(b) q e s definida negativa si, i nomes si, Dk > 0 quan k e s parell i Dk < 0 quan k e s senar.
D EMOSTRACI O . (a) Denotem per B = {e1 , e2 , . . . , en } la base on la matriu de T e s A.
(H) Per a cada k = 1, 2, . . . , n, la restriccio de q al subespai h e1 , e2 , . . . , ek i e s definida
positiva i la matriu e s Ak ; en alguna base daquest subespai la matriu ser`a diagonal,

t1

..
A0k =
amb
t1 , . . . , tk > 0 ,

.
tk
de manera que det(A0k ) > 0 i, per la formula del canvi de base, Dk = det(Ak ) > 0.
(H) Suposem que q no e s definida positiva i considerem el mes petit dels subespais Hk =
h e1 , e2 , . . . , ek i on la restriccio de q no e s definida positiva. Aquesta restriccio diagonalitza en
una base h e10 , e20 , . . . , ek0 i de Hk amb matriu A0k , i no tots els t1 , . . . , tk poden ser positius. Ara
be, si existissin ti , t j 0, la restriccio de q al pla h ei0 , e0j i seria definida (o semidefinida) negativa
o nulla, en contradiccio amb el fet que h ei0 , e0j i Hk1 6= {0}. Per tant, existeix un u nic ti 0,
i Dk = det(Ak ) 0 en contradiccio amb les hip`otesis.

R. Amer i F. Carreras

115

(b) El raonament e s molt semblant en els dos casos.


(H) La diagonal de A0k constar`a de t1 , . . . , tk < 0, de manera que Dk = det(Ak ) > 0 si k e s
parell i Dk = det(Ak ) < 0 si k e s senar.
(H) Aqu q no seria definida negativa en algun Hk i, an`alogament al cas (a), resultaria que
Dk 0 si k e s parell o Dk 0 si k e s senar, en contradiccio amb les hip`otesis.
Corol.lari 7.15 Si n = 2, considerem la matriu del tensor associat T , aix com el determinant i
la traca daquesta matriu:


a b
A=
,
D = det(A) = ac b2
i
T = tr (A) = a + c .
b c
Aleshores tenim el criteri de classificacio seguent:
D>0

a>0

definida positiva

D>0

a<0

definida negativa

D=0

T >0

semidefinida positiva

D=0

T <0

semidefinida negativa

D<0
D=0

no definida
T =0

forma nulla

Taula 7.2: Classificacio de formes quadr`atiques (n = 2)

D EMOSTRACI O . Si D > 0, ha de ser a 6= 0, i podem aplicar el criteri de Sylvester. Si D = 0,


un valor propi e s 0 i laltre T , i apliquem el criteri dels valors propis. Finalment, si D < 0 els
valors propis son de signe diferent i fem servir el mateix criteri.

7.4 Extrems locals de les funcions de diverses variables


Aquesta seccio es dedica a una aplicacio interessant de la classificacio de formes. Suposem
que el lector ha seguit o est`a seguint un curs de c`alcul infinitesimal que proporciona els

116

R. Amer i F. Carreras

Tensors i formes quadr`atiques

coneixements sobre diferenciabilitat dels que farem u s.


Sigui f : D R una funcio real de diverses variables definida en un domini D Rn i de
classe C 2 en algun entorn U dun punt p D, entorn que podem suposar una bola oberta de
centre p.
Es diu que f te un m`axim (respectivament, mnim) local en el punt p si f ( p) f (x) (resp.,
f ( p) f (x)) per a tot x dun cert entorn de p. En tots dos casos direm que f te un extrem local
a p.
Si f te un extrem local a p, e s condicio necess`aria que sanulli la diferencial en aquell punt,
(d f ) p = 0 ,
o, equivalentment, que totes les derivades parcials de f en el punt p siguin nulles:


f
= 0 per a i = 1, 2, . . . , n
xi p
(es diu que p e s un punt estacionari de f ).
Daltra banda, la formula de Taylor aplicada a f en el punt p, amb terme complementari de
segon grau, e s

f ( p + t) = f ( p) + (d f ) p (t) + 21 d 2 f q (t, t)
per a t Rn suficientment petit en norma per tal que p + t U , i essent q un punt del segment
que uneix p amb p + t. Aix com d f e s un camp que en cada punt, diguem p, dona una forma
lineal (d f ) p es a dir, una transformacio lineal de Rn a R, d 2 f e s un camp tensorial de segon
ordre, que en cada punt p dona un tensor (d 2 f ) p (sim`etric pel teorema de Schwartz), ja que els
coeficients de la matriu daquest tensor en la base can`onica son les derivades parcials segones de
f en el punt:
 2 
f
ai j =
.
xi x j p
Escrivint la formula de Taylor en termes de les derivades parcials tenim


n 
n 
X
1 X
2 f
f
f ( p + t) = f ( p) +
ti +
ti t j ,
xi p
2 i, j=1 xi x j q
i=1
on t = (t1 , . . . , tn ).
Si suposem que f satisf`a la condicio necess`aria dextrem local en el punt p, la formula es redueix
a

n 
2 f
1 X
2
1
f ( p + t) f ( p) = 2 (d f )q (t, t) =
ti t j .
2 i, j=1 xi x j q

R. Amer i F. Carreras

117

Per a obtenir condicions suficients dextrem local e s necessari estudiar el signe daquest increment prop del punt p. El resultat seguent dona un criteri forca u til, i per justificar-lo nomes
necessitem observar que la condicio C 2 exigida a f assegura que les derivades parcials segones
son contnues.
Teorema 7.16 (Condicions suficients dextrem local.) Sigui f : D R una funcio definida
en un domini D Rn i de classe C 2 en un entorn U dun punt p D. Suposem que (d f ) p = 0.
Aleshores:
(a) Si (d 2 f ) p e s definida positiva, f te un mnim local en el punt p.
(b) Si (d 2 f ) p e s definida negativa, f te un m`axim local en el punt p.
(c) Si (d 2 f ) p e s no definida, f no te extrem local en el punt p.
D EMOSTRACI O . (a) Si (d 2 f ) p e s definida positiva, per les condicions que reflecteixen aquest
fet desigualtats, basicament i la continutat de les derivades parcials segones de f , (d 2 f )q
seguir`a essent definida positiva en tot un entorn de p, i retornant a la formula de lincrement
escrita abans daquest teorema arribem a la conclusio que f ( p + t) f ( p) 0 per a tot punt
p + t de lentorn; per tant, f presenta un mnim local en el punt p.
(b) Largument e s, mutatis mutandis, id`entic.
(c) Si (d 2 f ) p e s no definida, existeixen vectors u, v Rn tals que
(d 2 f ) p (u, u) > 0

(d 2 f ) p (v, v) < 0 .

Considerant la funcio g() = f ( p + u) resulta que


g 0 (0) = (d f ) p (u) = 0

g 00 (0) = (d 2 f ) p (u, u) > 0

i, per tant, f te, segons la direccio de u, un mnim local en el punt p; per`o un raonament an`aleg
per a la funcio h() = f ( p +v) ens diu que f te un m`axim local en el punt p segons la direccio
de v. En definitiva, f no te extrem local en el punt p.
Observem que si (d 2 f ) p e s semidefinida o nulla, el teorema anterior no e s aplicable, i cal fer
un estudi basat en altres m`etodes. I tambe que per classificar (d 2 f ) p podem fer u s, segons
convingui, de qualsevol dels criteris establerts a la seccio anterior.
Exemples 7.17 (a) Considerem f (x, y) = x 2 y 2 . Busquem els punts que satisfan la condicio
necess`aria d f = 0, e s a dir,
f
= 2x = 0
x

f
= 2y = 0 ,
y

118

Tensors i formes quadr`atiques

R. Amer i F. Carreras

i trobem p = (0, 0). La matriu hessiana matriu de les derivades parcials segones en aquest
punt e s


2
0
H (0, 0) =
.
0 2
evident, doncs, que (d 2 f ) p e s no definida i, per tant, f no te extrem local en el punt (0, 0): es
Es
diu que hi ha un punt de sella (m`axim en una direccio, quan x = 0, i mnim en una altra, quan
y = 0).
(b) Considerem ara la funcio z = f (x, y) = (x 2 + y 2 2x)(x 2 + y 2 6x). Seguint el mateix
procediment, tenim com a condiciones necess`aries

f
2
2
2

= (4x 8)(x + y ) 16x + 24x = 0

x
.
f

= 4y(x 2 + y 2 4x) = 0

y
De la segona equacio resulta que y = 0 o be x 2 + y 2 4x = 0. (1) Si y = 0, la primera equacio
es converteix en 4x(x 2 6x + 6) = 0, don

x = 0,
x =3+ 3
o
x = 3 3.
(2) Si x 2 + y 2 4x = 0, tenim que x 2 + y 2 = 4x i la primera equacio es transforma en 8x = 0,
per tant x = 0 i y = 0.
Resumint, caldr`a estudiar la matriu hessiana en els punts

a = (0, 0) ,
b = (3 + 3, 0)
i

c = (3

3, 0) .

Les derivades parcials segones de f son


2 f
= 12(x 2 4x + 2) + 4y 2 ,
x2
2 f
= 4(3y 2 + x 2 4x) .
y2

2 f
2 f
=
= 8y(x 2)
x y
y x

En el punt b, la matriu hessiana e s


H (b) =


24( 3 + 1)
0
,
0
8 3

i per tant f presenta un mnim local, daltura 36 24 3.

119

R. Amer i F. Carreras

En el punt c, la matriu hessiana e s


H (c) =

24(1
0

3)

0
8 3

i per tant f presenta un m`axim local, daltura 36 + 24 3.


Hem deixat el punt a per al final, ja que
H (a) =

24 0
0 0

i el teorema no decideix perqu`e H (a) e s semidefinida positiva. Cal dur a terme un estudi particular, que en aquest cas queda resolt de la forma seguent. El primer factor sanulla sobre la
circumfer`encia x 2 + y 2 2x = 0, de centre (1, 0) i radi 1, mentre que el segon ho fa sobre la
circumfer`encia x 2 + y 2 6x = 0, de centre (3, 0) i radi 3. A qualsevol entorn del punt (0, 0) hi ha
punts dels interiors de les dues circumfer`encies, en els quals f prendr`a valors positius, i tambe
punts interiors a una per`o exteriors a laltra, on f prendr`a valors negatius. Tenint en compte que
f (0, 0) = 0, sarriba a la conclusio que f no presenta extrem local en el punt (0, 0).

120

R. Amer i F. Carreras

Tensors i formes quadr`atiques

R. Amer i F. Carreras

121

8
Geometria lineal

La percepcio prim`aria del mon real es fonamenta en els punts i les figures que amb ells es formen, i no pas en els vectors. Per`o lus de coordenades per determinar la posicio dels punts, i
per tant dequacions per descriure les figures elementals, converteix la geometria analtica en un
camp de fecunda aplicacio de l`algebra lineal. En aquest captol estudiarem les figures lineals,
e s a dir, les definides per equacions de primer grau. Com que el lector ja coneix segurament
alguns dels conceptes i t`ecniques que apareixen, aprofitarem la seva intuicio i la seva experi`encia
pr`evia per estalviar-li un exces de formalisme analtic. Presentarem la teoria nomes per a lespai
tridimensional; les refer`encies al pla es reduiran a aquells aspectes en els quals lanalogia requereix algun comentari. (Daltra banda, no sembla oportu en aquest context fer distincions entre
geometria estrictament af i geometria m`etrica.)

8.1 Lespai euclidi`a puntual tridimensional


La primera definicio estableix les relacions b`asiques entre punts i vectors que cal prendre com a
punt de partida.
Definicio 8.1 Lespai euclidi`a puntual tridimensional e s una terna E 3 = (P3 , V3 , +), on P3 e s
un conjunt delements anomenats punts, V3 e s lespai vectorial euclidi`a tridimensional que

122

R. Amer i F. Carreras

Geometria lineal

suposarem orientat sempre que convingui i hi ha definida una operacio de la forma


+
P3 V3 P3
( p, vE) 7 p + vE
que assigna un punt p + vE a cada parell format per un punt p i un vector vE (en aquest captol i el
seguent els vectors duran fletxa). Es demana que es compleixin els axiomes seguents:
(a) Associativitat: ( p + vE) + w
E = p + (E
v + w).
E
(b) Determinacio: donats p, q P3 existeix un u nic vE V3 tal que p + vE = q.
i direm que q e s lextrem de vE quan
Dara endavant representarem aquest vector per vE =
pq,
lorigen e s p; amb aquesta nova notacio,
=q.
p+
pq
El lector probablement enten i aix`o e s positiu que aquesta definicio representa en certa
manera la construccio recproca del proces de formacio dels vectors lliures que ha vist en els
seus estudis anteriors.

Un exemple sense connotacions gr`afiques si no es vol e s el seguent: P3 e s el conjunt R3 , V3


e s lespai vectorial euclidi`a R3 i loperacio + e s la suma ordin`aria component a component: e s
immediat comprovar que es compleixen els axiomes.
Proposicio 8.2 Per a qualssevol p, q, r P3 es compleix que:

(a)
pp = 0E .

.
(b) q
p =
pq
+

(c)
pq
qr =
pr .
D EMOSTRACI O . (a) Existeix un u nic vector vE tal que p + vE = p; per tant
p + (E
v + vE) = ( p + vE) + vE = p + vE ,
E
i daqu resulta que vE + vE = vE, e s a dir, vE = 0.
(b) Aplicant lassociativitat, tenim que
+ q

+ q

= p,
p + (
pq
p) = ( p +
pq)
p = q + qp
+ q

i aixo implica que


pq
p = 0E i, per tant, q
p =
pq.

123

R. Amer i F. Carreras

(c) Novament per lassociativitat,


+

p + (
pq
qr ) = ( p +
pq)
qr = q +
qr = r ,
+

e s a dir,
pq
qr =
pr .
Una refer`encia cartesiana de E 3 e s una quaterna R = {o ; eE1 , eE2 , eE3 }, on o P3 e s un punt
escollit arbitr`ariament, anomenat origen de la refer`encia, i B = {Ee1 , eE2 , eE3 } e s una base de V3 .
Es diu que la refer`encia e s rectangular si B e s una base ortonormal, que suposarem sempre
positiva. Farem servir sempre refer`encies rectangulars, tot i que molts resultats els que no
depenen del producte escalar ni de conceptes derivats dell son extrapolables a refer`encies de
qualsevol mena.
Donada una refer`encia R, cada punt p de P3 es pot descriure pel seu vector de posicio respecte
a lorigen de coordenades:

op = p1 eE1 + p2 eE2 + p3 eE3 .


Els coeficients ( p1 , p2 , p3 ) son les coordenades del punt p en la refer`encia R, i el determinen
unvocament i sense restriccions: qualsevol terna ( p1 , p2 , p3 ) defineix un punt, concretament
p = o + p1 eE1 + p2 eE2 + p3 eE3 .

Es important traduir a coordenades dels punts i components dels vectors les dues operacions
b`asiques definides entre ells: donats
p = ( p1 , p2 , p3 ) ,

q = (q1 , q2 , q3 ) i

vE = v1 eE1 + v2 eE2 + v3 eE3 = (v1 , v2 , v3 ) ,

tenim les relacions


p + vE = q p + v = q
vE =
pq
i
i
i

per a i = 1, 2, 3 .

Exemples 8.3 (a) Considerant les relacions entre coordenades i components, e s immediat comprovar la propietat del parallelogram:

pq
rs

si, i nomes si,

(b) El punt mitj`a de p i q es defineix com


1
m = p+
pq .
2

pr =
qs .

124

Geometria lineal

R. Amer i F. Carreras

Laparent asimetria de la definicio desapareix en observar que les coordenades de m son les
semisumes de les corresponents coordenades de p i q, don resulta que
1
.
m = q + qp
2

(c) An`alogament, el baricentre de tres punts p, q i r es defineix com


2
g = r + r
m,
3

on m e s el punt mitj`a de p i q; aqu trobem que les coordenades de g son les mitjanes aritm`etiques
de les coordenades corresponents de p, q i r , i per tant els papers de p, q i r en aquesta construccio son permutables.

Formula del canvi de refer`encia. Sigui R0 = {o1 ; uE1 , uE2 , uE3 } una altra refer`encia, i suposem
conegudes tant la posicio del nou origen com la depend`encia de la nova base:

= b eE + b eE + b eE
oo
1
1 1
2 2
3 3

uE j = c1 j eE1 + c2 j eE2 + c3 j eE3

per a

j = 1, 2, 3 .

La relacio entre les coordenades velles (x, y, z) i les noves (x 0 , y 0 , z 0 ) dun punt gen`eric p P3
resulta simplement de la igualtat

+
op =
oo
o
p
1

i e s

x = b1 + c11 x 0 + c12 y 0 + c13 z 0

y = b2 + c21 x 0 + c22 y 0 + c23 z 0


z = b3 + c31 x 0 + c32 y 0 + c33 z

X = B + C X0 ,

o be

on

x
X =y ,
z

x0
X 0 = y0 ,
z0

b1
B = b2
b3

c11 c12 c13


C = c21 c22 c23 .
c31 c32 c33

La matriu C e s regular (det C 6= 0) perqu`e descriu un canvi de base, ortogonal (C 1 = C t ) si


les dues refer`encies son rectangulars i amb det(C) = 1 si les bases de les refer`encies tenen la
mateixa orientacio. Dins daquest model general, son frequents dues situacions mes simples: (a)
si C = I , la formula queda X = B + X 0 i es diu que hem fet una transllacio deixos; (b) si
B = 0, la formula e s X = C X 0 i parlem de rotacio deixos.

R. Amer i F. Carreras

125

8.2 Varietats lineals


En la resta del captol suposarem donada una refer`encia rectangular R = {o; eE1 , eE2 , eE3 }. Cada
punt quedar`a identificat per les seves coordenades i cada vector per les seves components:
p = (x, y, z) ,

uE = (a, b, c) .

Una varietat lineal de lespai E 3 e s un conjunt de punts de la forma L = p + D, on p P3


i D V3 e s un subespai vectorial, anomenat direccio de L. Segons sigui dim(D) = 1 o
dim(D) = 2, es diu que L e s una recta o un pla, mentre que els punts son les varietats de
dimensio 0.
Equacions duna recta. Donada una recta
R :

p0 + D1 = p0 + h uE i

es diu que uE e s un vector director de R. Qualsevol punt de R e s de la forma


pt = p0 + t uE

amb t R ,

i aix`o e s lequacio param`etrica vectorial de la recta R. Si referim a R el punt gen`eric pt =


(x, y, z) i tambe p0 = (x0 , y0 , z 0 ) i uE = (a, b, c), lequacio origina les equacions param`etriques
(escalars)

x = x0 + at
y = y0 + bt

z = z 0 + ct

de les quals, eliminant el par`ametre t, passem a


x x0
y y0
z z0
=
=
,
a
b
c
que e s lequacio contnua de la recta R.
Equacions dun pla. Donat un pla
P :

p0 + D2 = p0 + h uE, vE i

qualsevol dels seus punts e s de la forma


p = p0 + t uE + s vE

amb t, s R ,

i aix`o e s lequacio param`etrica vectorial del pla. Els par`ametres seliminen escrivint la relacio
equivalent o equacio implcita
det(
p
E, vE) = 0 .
0 p, u

126

Geometria lineal

R. Amer i F. Carreras

Referint a R el punt gen`eric p = (x, y, z)


(v1 , v2 , v3 ) resulta

x x0

y y0

z z0

i tambe p0 = (x0 , y0 , z 0 ), uE = (u 1 , u 2 , u 3 ) i vE =

u 1 v1
u 2 v2 = 0 ,
u 3 v3

que una vegada desenvolupada adopta la forma


A(x x0 ) + B(y y0 ) + C(z z 0 ) = 0 ,

Ax + By + C z + D = 0 .

o be

Observacions 8.4 (a) Notem que lequacio contnua duna recta condueix a un sistema de dues
equacions lineals de rang 2 (equacions implcites de la recta) i que, recprocament, un tal sistema defineix una recta, ja que la seva solucio general ens dona les equacions param`etriques.
Geom`etricament, donar el sistema significa expressar la recta com a interseccio de dos plans.
Tambe es posa de manifest que els plans i les rectes son precisament les figures definides per
equacions lineals, les mes senzilles, doncs, segons el criteri del grau per`o tambe les mes usuals
a la pr`actica.
Aix, donada la recta definida per
3x + y + 2z 6 = 0
x +y+z4=0

)
,

resolem aquest sistema i obtenim, prenent x = t com a variable lliure,


x =t,

y =2+t,

z = 2 2t ,

que son les equacions param`etriques; lequacio contnua ser`a


x 0
y2
z2
=
=
.
1
1
2
convenient recordar que els coeficients A, B i C de lequacio dun pla satisfan la propor(b) Es
cionalitat derivada del seu origen,
A
B

=
u 2 v2
u 3 v3



u 3 v3
u 1 v1

C
=
,

u 1 v1




u 2 v2

de manera que la direccio del pla e s D2 = hwi


E , on w
E = uE vE = (A, B, C), i la seva equacio
implcita en la base B = {Ee1 , eE2 , eE3 } de V3 sobte senzillament suprimint el terme independent
de lequacio de P:
Ax + By + C z = 0 .

127

R. Amer i F. Carreras

(c) En el pla euclidi`a puntual E 2 = (P2 , V2 , +) les u niques varietats lineals no trivials son les
rectes, que comparteixen caracterstiques de les rectes de lespai (direccio de dimensio 1) i dels
plans (direccio de dimensio n 1), i per tant admeten tres tipus dequacions:
(1) param`etrica:

pt = p0 + t uE,

(2) contnua:

x x0
y y0
=
,
a
b

(3) implcita:

Ax + By + C = 0,

a mes daltres tambe usuals que suposem conegudes pel lector, com lexplcita y = mx + n o
lequacio punt-pendent y y0 = m(x x0 ).

8.3 Posicions relatives de les varietats lineals


Estudiarem en aquest apartat el parallelisme, la interseccio i la perpendicularitat de varietats,
donant condicions operatives. Inclourem tambe lequacio del feix de plans que passen per una
recta.
Dues varietats lineals L i L 0 , de direccions respectives D i D 0 , son paralleles, i sescriu L k L 0 ,
si D D 0 o D 0 D.
En particular, dos plans (o dues rectes) son parallels si, i nomes si, tenen la mateixa direccio
per dimensions, mentre que una recta i un pla son parallels si la direccio de la recta est`a
continguda en la del pla. Esquem`aticament tenim:

R0

a
b
c
= 0 = 0
0
a
b
c

Aa + Bb + Cc = 0

P0

A
B
C
= 0 = 0
0
A
B
C

Taula 8.1: Parallelisme de varietats lineals

on uE = (a, b, c) e s un vector director de R, vE = (a 0 , b0 , c0 ) ho e s de R 0 , Ax + By + C z + D = 0


e s lequacio implcita de P i A0 x + B 0 y + C 0 z + D 0 = 0 e s la de P 0 .

128

Geometria lineal

R. Amer i F. Carreras

Analitzem ara les possibles situacions dincid`encia (interseccio) entre varietats.


(A) Donades dues rectes
R :

p0 + t uE

R0 :

q0 + s vE ,

la primera possibilitat e s que siguin paralleles, quan uE i vE son proporcionals; en particular, seran
coincidents si q0 R.
En cas contrari, els vectors uE i vE son linealment independents, de manera que si existeix un punt
comu p R R 0 e s u nic (rectes secants): vegem que aix`o e s equivalent a que
E, vE) = 0 .
det(
p
0 q0 , u


En efecte: si p R R 0 tindrem que
p
E s vE per a certs t, s
0 q0 = p0 p + pq0 = t u
E i vE son linealment
R, depend`encia lineal que anulla el determinant; recprocament, si
p
0 q0 , u
dependents, existir`a una relacio de la forma

p
E s vE ,
0 q0 = t u
i prenent p = p0 + t uE resulta que

p = p0 + t uE = p0 +
p
E = q0 + s vE R 0 ,
0 q0 + s v
i per tant p R R 0 .
Finalment, quan

E, vE) 6= 0 ,
det(
p
0 q0 , u

les rectes no son paralleles ni secants, i es diu que sencreuen (possibilitat que no existeix entre
rectes del pla).
(B) Donats una recta i un pla,
R :

p0 + t uE

P :

Ax + By + C z + D = 0 ,

els possibles punts de R P sobtindran en substituir les equacions param`etriques de la recta


x = x0 + at ,

y = y0 + bt ,

z = z 0 + ct

a lequacio del pla: aix`o dona


(Aa + Bb + Cc)t + (Ax0 + By0 + C z 0 + D) = 0 .
Si Aa + Bb + Cc = 0, el vector director de la recta, uE, pertany a la direccio del pla, D2 , i les
varietats son paralleles; si, a mes, Ax0 + By0 + C z 0 + D = 0, el punt p0 i tota la recta R es
troben dins el pla, i es diu que P passa per R o que R est`a inclosa en el pla.

129

R. Amer i F. Carreras

Lalternativa e s que sigui Aa + Bb + Cc 6= 0: aleshores hi ha un u nic punt comu p R P, i


es diu que les varietats son secants.
Si la recta ve donada per les seves equacions implcites, formem amb elles i lequacio del pla un
sistema 3 3:

A1 x + B1 y + C1 z + D1 = 0

A2 x + B2 y + C2 z + D2 = 0 .

Ax + By + C z + D = 0
Si els rangs de la matriu dels coeficients i la matriu ampliada son r i r 0 , tenim tres possibilitats:
(a) si r = r 0 = 3, la recta i el pla son secants (solucio u nica); (b) si r = 2, per`o r 0 = 3, son
parallels sense inclusio (incompatibilitat); (c) si r = r 0 = 2, el pla passa per la recta (infinites
solucions amb un grau de llibertat).
(C) Donats dos plans
P1 :

A1 x + B1 y + C1 z + D1 = 0

P2 :

A2 x + B2 y + C2 z + D2 = 0 ,

considerem els rangs r i r 0 del sistema que formen. Hi ha tambe tres casos: si r = 1, els plans
son parallels, coincidents si r 0 = 1 i diferents si r 0 = 2; si r = r 0 = 2, son secants, i els punts
comuns formen una recta com ja hem dit en una observacio de la seccio anterior. Com que la
refer`encia e s rectangular, el vector director de la recta comuna e s w
E1 w
E 2 , on w
E 1 = (A1 , B1 , C1 )
iw
E 2 = (A2 , B2 , C2 ).
Feix de plans. Aquesta e s la denominacio del conjunt de plans que passen per una recta determinada R. Suposem que R est`a definida com a interseccio de dos plans
P1 :

A1 x + B1 y + C1 z + D1 = 0

P2 :

A2 x + B2 y + C2 z + D2 = 0 .

Com hem vist a lapartat (B) dincid`encia, la condicio necess`aria i suficient per tal que un pla
arbitrari P passi per R e s que afegint la seva equacio Ax + By + C z + D = 0 al sistema format
per les altres dues no canvi el conjunt de solucions (els punts de R): aix`o significa que lequacio
de P ser`a combinacio lineal de les altres dues, i per tant
(A1 x + B1 y + C1 z + D1 ) + (A2 x + B2 y + C2 z + D2 ) = 0 ,
variant , R, e s lequacio (de tots els plans) del feix que passa per R. Una expressio
equivalent, en la que nomes perdem P2 , resulta de dividir per 6= 0 i prendre = /:
(A1 x + B1 y + C1 z + D1 ) + (A2 x + B2 y + C2 z + D2 ) = 0 .
Exemple 8.5 Busquem lequacio del pla que passa pel punt p = (1, 1, 3) i per la recta
)
2x + y + z = 0
.
x + y 3z = 1

130

Geometria lineal

R. Amer i F. Carreras

Preparem lequacio del feix que passa per aquesta recta:


(2x + y + z) + (x + y 3z 1) = 0 .
Imposant que un pla daquesta forma passi per p, determinem
6 + (8) = 0 ,

3
4

i, per tant, el pla ser`a (2x + y + z) + 3/4(x + y 3z 1) = 0 o, equivalentment,


4(2x + y + z) + 3(x + y 3z 1) = 0 ,

e s a dir,

11x + 7y 5z 3 = 0 .

Dues varietats lineals L i L 0 , de direccions respectives D i D 0 , son perpendiculars, i sescriu


L L 0 , si D D 0 o D 0 D .
Esquem`aticament tenim:

R0

aa 0 + bb0 + cc0 = 0

a
b
c
=
=
A
B
C

P0

A A0 + B B 0 + CC 0 = 0

Taula 8.2: Perpendicularitat de varietats lineals

on uE = (a, b, c) e s un vector director de R, vE = (a 0 , b0 , c0 ) ho e s de R 0 , Ax + By + C z + D = 0


e s lequacio implcita de P i A0 x + B 0 y + C 0 z + D 0 = 0 e s la de P 0 .
Teorema 8.6 Considerem un punt p i una varietat lineal L = p0 + D. Aleshores:
D.
(a) Existeix un u nic punt q L tal
pq
(b) Existeix un u nic punt s tal que q e s el punt mitj`a de p i s.
D EMOSTRACI O . (a) El punt q ha de ser de la forma p0 + vE, amb vE D. La condicio de
perpendicularitat e s

p
E D,
0p v

131

R. Amer i F. Carreras

e s a dir, vE ha de ser la projeccio ortogonal del vector


p
0 p sobre el subespai D. El teorema de
la projeccio ortogonal assegura lexist`encia i unicitat daquest vector, per tant el punt q queda
unvocament determinat.
e s el punt que compleix la condicio de lenunciat.
f`acil veure que s = p + 2
(b) Es
pq

Es diu que q e s la projeccio ortogonal de p sobre la varietat L i s el sim`etric de p respecte a L.


Exemples 8.7 (a) Si R e s la recta p0 + h uE i, la projeccio ortogonal de
p
Ei
0 p sobre el subespai h u
es

p
E
0p u
vE =
uE ,
2
k uE k
per tant la projeccio de p sobre R e s el punt

p
E
0p u
q = p0 +
uE .
2
k uE k
Aquest punt tambe es pot obtenir fent la interseccio de la recta R i el pla perpendicular que passa
per p.
(b) Si P e s el pla p0 + h w
E i , la projeccio ortogonal de
p
E i e s
0 p sobre el subespai h w

p
E
0p w
vE =
p
p

w
E,
0
2
kw
Ek
per tant la projeccio de p sobre P e s el punt

p
E
p
E
0p w
0p w

q = p0 + p0 p
w
E = p
w
E.
2
2
kw
Ek
kw
Ek
An`alogament al cas anterior, podem obtenir aquest punt com a interseccio del pla P i la recta
perpendicular que passa per p. Com a illustracio, donats el punt p = (5, 3, 2) i el pla P
dequacio 2x + y z + 3 = 0 busquem q i s.
La recta que passa per p amb vector director w
E = (2, 1, 1), ortogonal a P, e s
x = 5 + 2t ,

y =3+t,

z = 2 t ,

i fent la interseccio amb el pla resulta


2(5 + 2t) + (3 + t) (2 t) + 3 = 0 ,

6t + 18 = 0 ,

t = 3 ,

de manera que obtenim la projeccio ortogonal de p sobre P, que e s q = (1, 0, 1). Finalment,
= (6, 3, 3) i fent
considerant
pq
= (5, 3, 2) + 2(6, 3, 3) = (7, 3, 4) ,
s = p + 2
pq
trobem el sim`etric de p respecte a P.

132

R. Amer i F. Carreras

Geometria lineal

8.4 Angles, dist`ancies, a` rees i volums


Tots els angles (no orientats) entre varietats es redueixen a angles entre vectors. En efecte:
(a) langle entre dues rectes e s el que formen els respectius vectors directors, i aix`o inclou la
possibilitat dobtenirne un o el seu suplementari; (b) langle entre una recta i un pla e s el que
forma la recta amb la seva projeccio ortogonal sobre el pla (o 90 si son perpendiculars), per`o
aquest angle coincideix amb el complementari de langle entre la recta i les perpendiculars al pla;
(c) langle entre dos plans e s el que formen sengles perpendiculars tracades dins de cada un a la
recta interseccio (o 0 si son plans parallels), per`o coincideix amb el que forma qualsevol parell
de rectes perpendiculars respectivament a cada pla. Com es pot observar, langle e s invariant per
parallelisme.
Exemple 8.8 Per calcular langle entre el pla 3x 4y + 12z 1 = 0 i la recta
x 1
y+2
z3
=
=
,
20
21
0
considerem el vector perpendicular al pla i el vector director de la recta:
w
E = (3, 4, 12)

uE = (20, 21, 0) .

Langle entre aquests vectors e s


= arccos

144
w
E uE
= arccos
= 67 320 ,
kw
E kk uE k
13 29

i langle entre la recta i el pla e s


= 90 67 320 = 22 280 .

La dist`ancia entre dos punts p i q de P3 e s la norma del vector que defineixen:


k.
d( p, q) = k
pq

Les propietats de la dist`ancia resulten de traduir les de la norma (captol 4), i per tant son de
comprovacio immediata:
(a) d( p, p) = 0; d( p, q) > 0 si p 6= q.
(b) d( p, q) = d(q, p).
(c) Desigualtat triangular: d( p, r ) d( p, q) + d(q, r ).

133

R. Amer i F. Carreras

(d) Teorema de Pit`agores: si p, q, r son els v`ertexs dun triangle rectangle a q, e s a dir,

q
p
qr , aleshores
d( p, r )2 = d( p, q)2 + d(q, r )2 .
La dist`ancia entre dues varietats lineals L i L 0 e s el mnim de les dist`ancies entre punts de luna
i de laltra:
d(L , L 0 ) = min{ d( p, q) : p L , q L 0 } .
Aquesta definicio de dist`ancia exigeix que comprovem en cada cas lexist`encia del mnim. Analitzarem seguidament tots els casos possibles.
Teorema 8.9 La dist`ancia dun punt p a una varietat lineal L e s la del punt a la seva projeccio
ortogonal sobre L.
D EMOSTRACI O . Si q e s la projeccio ortogonal de p sobre L i p0 6= q e s un punt qualsevol de
L, aplicant el teorema de Pit`agores al triangle de v`ertexs p0 , q i p, rectangle a q, tenim
d( p0 , p)2 = d( p0 , q)2 + d(q, p)2 ,
de manera que d( p0 , p) > d(q, p) i per tant d( p, L) = d( p, q).

Exemple 8.10 Si p = (x0 , y0 , z 0 ) i P e s el pla dequacio Ax + By + C z + D = 0,


d( p, P) =

| Ax0 + By0 + C z 0 + D |
.

A2 + B 2 + C 2

En efecte: si w
E = (A, B, C), la projeccio ortogonal q del punt p sobre P e s la interseccio de la
recta p + h w
E i, dequacions
x = x0 + At ,

y = y0 + Bt ,

z = z 0 + Ct ,

amb el pla: substituint trobem


A(x0 + At) + B(y0 + Bt) + C(z 0 + Ct) + D = 0 ,

t =

Ax0 + By0 + C z 0 + D
.
A2 + B 2 + C 2

Finalment, recordant que k w k2 = A2 + B 2 + C 2 ,


d( p, P) = d( p, q) = k t w
Ek=

| Ax0 + By0 + C z 0 + D |
.

A2 + B 2 + C 2

Aquesta formula e s aprofitable per al pla: la dist`ancia del punt p = (x0 , y0 ) a la recta R dequacio
Ax + By + C = 0 e s
| Ax0 + By0 + C |
.
d( p, R) =

A2 + B 2

134

Geometria lineal

R. Amer i F. Carreras

La definicio de dist`ancia implica que la dist`ancia entre varietats secants e s nulla. Queden,
doncs, quatre casos possibles. En els tres referits a varietats paralleles L i L 0 (dues rectes, dos
plans o recta i pla), amb direccions respectives D D 0 , la dist`ancia e s la de qualsevol punt
p L a L 0 . En efecte: si q e s la projeccio ortogonal de p sobre L 0 i p1 L i q1 L 0 son punts
arbitraris,


p
1 q1 = p1 p + pq + qq1 = pq + ( p1 p + qq1 ) ,
i, pel teorema de Pit`agores,
d( p1 , q1 ) d( p, q) ,
e s a dir, d(L , L 0 ) = d( p, L 0 ) per a qualsevol p L.
La darrera situacio requereix un estudi particular.
Proposicio 8.11 Donades dues rectes que sencreuen
R :

pt = p0 + t uE ,

R0 :

qs = q0 + s vE ,

existeix un u nic parell de punts pt R i qs R 0 tals que la recta que els uneix e s perpendicular
a R i a R 0 . A mes,
d(R, R 0 ) = d( pt , qs ) .
D EMOSTRACI O . Escrivim

p
E+
p
E
t qs = pt p0 + p0 q0 + q0 qs = t u
0 q0 + s v
i imposem les condicions de perpendicular comuna,

uE
p
t qs = 0 ,

vE
p
t qs = 0 ,

que condueixen a un sistema lineal 2 2 per a t i s:

t (E
u uE) + s(E
u vE) + uE
p
0 q0 = 0
t (E
v uE) + s(E
v vE) + vE
p
q =0

)
.

0 0

El determinant del sistema e s


E
u uE uE vE
E
v uE vE vE



< 0,

per la desigualtat de Schwarz. El sistema te, per tant, solucio u nica, i els punts pt i qs defineixen
la perpendicular comuna. Per veure que d( pt , qs ) e s la mnima dist`ancia possible entre les dues
rectes, considerem altres punts p0 R i q0 R 0 : aplicant el teorema de Pit`agores a la relacio



p
0 q 0 = p0 pt + pt q s + q s q 0 = pt q s + ( p0 pt + q s q 0 )
obtenim que
d( p0 , q0 ) > d( pt , qs ) .

135

R. Amer i F. Carreras

El lector pot comprovar que, fent passar un pla P per R 0 que sigui parallel a R, es compleix
que d(R, R 0 ) = d(R, P), que e s un dels casos previs. Mes endavant veurem tambe una formula
per calcular la dist`ancia entre rectes que sencreuen, basada en el producte vectorial. De tota
manera, inclourem ara una aplicacio del teorema anterior.
Exemple 8.12 Calculem la dist`ancia entre les rectes donades per les equacion contnues
R :

z+2
x 3
=y=
,
0
1

R0 :

x
z5
= y+1=
.
4
3

Amb les expressions param`etriques preparem


p
t qs :
pt = (3, 0, 2) + t (0, 1, 1) ,
qs = (0, 1, 5) + s(4, 1, 3) ,

p
q = (3, 1, 7) + s(4, 1, 3) t (0, 1, 1) .
t s

Imposant la perpendicularitat amb uE = (0, 1, 1) i vE = (4, 1, 3) tenim


)
8 + 4s 2t = 0
,
34 + 26s 4t = 0

don resulten t = 2, s = 1,
p
2 q1 = (1, 2, 2) i, finalment,
d(R, R 0 ) = k
p
q k = 3.
2 1

El producte vectorial resulta u til per a obtenir certes formules sobre dist`ancies, a` rees i volums.
Recordem que, orientant V3 duna de les dues maneres possibles, queda definit unvocament el
producte vectorial uE vE de qualsevol parell de vectors uE, vE V3 (de fet, canviar lorientacio no
influeix en cap de les formules).
Proposicio 8.13 (a) La dist`ancia dun punt p a una recta R : p0 + h uE i e s
k
p
Ek
0p u
d( p, R) =
.
k uE k
(b) La dist`ancia dun punt p a un pla P : p0 + h uE , vE i e s, posant w
E = uE vE,

| p0 p w
E|
| p0 p (E
u vE) |
| det(
p
E , vE) |
0p,u
d( p, P) =
=
=
.
kw
Ek
k uE vE k
k uE vE k
(c) La dist`ancia entre dues rectes que sencreuen, R : p0 + h uE i i R 0 : q0 + h vE i, e s
u vE) |
E , vE) |
|
p
| det(
p
0 q0 (E
0 q0 , u
d(R, R 0 ) =
=
.
k uE vE k
k uE vE k

136

R. Amer i F. Carreras

Geometria lineal

D EMOSTRACI O . (a) Sigui q la projeccio ortogonal de p sobre R: el triangle de v`ertexs p0 , q i


p e s rectangle a q, per tant, si e s langle entre
p
E, tenim
0p i u
k
p
Ek
0p u
d( p, R) = d( p, q) = k
p
.
0 p k sin =
k uE k

(b) Sigui q la projeccio ortogonal de p sobre P: q


p e s la projeccio ortogonal de
p
0 p sobre el
subespai h w
E i, de manera que

p
E
0p w

q
p=
w,
2
kw
Ek

E |

k = | p0 p w
don d( p, P) = k qp
.
kw
Ek

s la projeccio ortogonal de

(c)
p
p
E vE i; aix doncs,
t qs e
0 q0 sobre el subespai h u
u vE) |
|
p
0 q0 (E

.
d(R, R 0 ) = k
p
t qs k =
k uE vE k
Acabem aquest breu formulari del producte vectorial amb aplicacions al c`alcul de casos elementals per`o frequents d`arees i volums, estalviant al lector disquisicions te`oriques sobre aquests dos
conceptes, que li son prou familiars.
Proposicio 8.14 (a) L`area del triangle de v`ertexs p, q, r P3 e s
1
2

A = k
pq
pr k .
(b) L`area dun parallelogram, on p e s un v`ertex i q i r son els v`ertexs adjacents a p, e s

A = k
pq
pr k .

D EMOSTRACI O . (a) Prenent com a base del triangle el costat pq, laltura corresponent e s h =
d(r, pq) i, aplicant la formula de la dist`ancia dun punt a una recta,
1
2

1
2

kh = k
k
A = k
pq
pq

k
pq
pr k
1
= k
pq
pr k .

2
k pq k

k h.
(b) El raonament e s an`aleg, per`o aqu A = k
pq

137

R. Amer i F. Carreras

Proposicio 8.15 (a) El volum dun tetr`aedre de v`ertexs p, q, r , s P3 e s


1

V = |
ps ( pq
pr ) | .
6

(b) El volum dun paralleleppede, on p e s un v`ertex i q, r i s son els v`ertexs adjacents a p, e s

V = |
ps (
pq
pr ) | .
D EMOSTRACI O . (a) Prenem com a base el triangle de v`ertexs p, q, r . Laltura corresponent
ser`a h = d(s, pqr ) i, aplicant formules anteriors,

|
ps (
pq
pr ) |
1
11
1

V = A( pqr ) h =
k pq pr k
= |
ps ( pq
pr ) | .

3
32
6
k pq pr k
(b) El raonament e s an`aleg, per`o aqu el volum e s simplement l`area de la base per laltura.
Observacions 8.16 (a) Cal fer notar que, en les quatre formules precedents, el v`ertex destacat p
pot ser qualsevol de la figura mentre es respecti ladjac`encia en les formules, i tambe que podem
calcular el producte mixt fent servir determinants:

ps (
pq
pr ) = det(
pq,
pq,
ps) .
(b) Les formules de les a` rees tambe son aplicables a figures de pla P2 , si el considerem submergit
dins de P3 afegint simplement una tercera coordenada nulla a cada punt.
Per exemple, per calcular l`area del triangle de v`ertexs p = ( p1 , p2 ), q = (q1 , q2 ) i r = (r1 , r2 ),
submergint P2 dins de P3 escrivim

= (q p , q p , 0) ,
pq
1
1
2
2

pr = (r1 p1 , r2 p2 , 0) .

L`area del triangle pqr e s


1

k pq
pr k .
2

Daltra banda,


q p1 q 2 p2

pq pr = 0, 0, 1
r 1 p1 r 2 p2

i, tenint en compte que



q 1 p1 q 2 p2

r 1 p1 r 2 p2


p1

= q1

r1


p2 1
q2 1 ,
r2 1

138

R. Amer i F. Carreras

resulta que l`area del triangle pqr e s el valor absolut de




p1 p2 1


1
.
q
q
1
1
2

2
r1 r2 1

Geometria lineal

R. Amer i F. Carreras

139

9
Corbes i superfcies de segon grau

En el captol anterior hem estudiat a fons les rectes i els plans, e s a dir, les figures geom`etriques
definides per equacions de primer grau. Aquest captol tracta de les c`oniques i les qu`adriques,
que son, respectivament, les corbes del pla i les superfcies de lespai definides per equacions de
segon grau.
Discutirem amb detall les c`oniques, i mes breument les qu`adriques per raons de concisio: el
lector trobar`a analogies formals suficients per justificar aquesta difer`encia de tractament.
Continuarem denotant per E 2 = (P2 , V2 , +) el pla euclidi`a puntual i per E 3 = (P3 , V3 , +)
lespai, i fent u s, nomes, de refer`encies rectangulars positives.

9.1 Ellipse, hip`erbola i par`abola


Donats dos punts F i F 0 del pla P2 , anomenarem ellipse el conjunt de punts p P2 tals que
d( p, F) + d( p, F 0 ) = 2a ,
on 2a > d(F, F 0 ). F i F 0 son els focus de lellipse i a el semieix major.

140

R. Amer i F. Carreras

Corbes i superfcies de segon grau

El punt mitj`a del segment F F 0 e s el centre de lellipse, i la constant 2c = d(F, F 0 ) e s la


dist`ancia focal. La recta que uneix els focus e s leix principal i la recta que passa pel centre i e s
perpendicular a leix principal sanomena eix secundari.
Quan F = F 0 , lellipse es redueix a una circumfer`encia, i en aquest cas es poden prendre com
a eixos dues rectes perpendiculars qualssevol que passin pel centre.
Escollint una refer`encia R = { o ; uE, vE }, on o e s el centre de lellipse, uE un vector unitari sobre
leix principal i vE un vector unitari sobre leix secundari, els focus son F = (c, 0) i F 0 = (c, 0),
i els punts de lellipse son els que compleixen lequacio
p
p
(x c)2 + y 2 + (x + c)2 + y 2 = 2a .
Aquesta equacio e s equivalent a
(a 2 c2 )x 2 + a 2 y 2 = a 2 (a 2 c2 ) ,
i si posem b2 = a 2 c2 i dividim tota lequacio per a 2 b2 es converteix en
x2
y2
+
= 1,
a2
b2
que e s lequacio can`onica de lellipse. En el cas duna circumfer`encia sescriu x 2 + y 2 = r 2 ,
on r = a = b e s el radi.
De la mateixa manera, anomenarem hip`erbola el conjunt de punts p P2 tals que
| d( p, F) d( p, F 0 ) | = 2a ,
on ara 0 < 2a < d(F, F 0 ). F i F 0 son els focus de la hip`erbola, i a el semieix real. El centre,
la dist`ancia focal i els eixos principal i secundari duna hip`erbola es defineixen igual que per a
lellipse.
Escollint una refer`encia com en el cas anterior, lequacio de la hip`erbola e s
p
p
| (x c)2 + y 2 (x + c)2 + y 2 | = 2a ,
que e s equivalent a
(c2 a 2 )x 2 a 2 y 2 = a 2 (c2 a 2 ) .
Prenent b2 = c2 a 2 i dividint per a 2 b2 obtenim
x2
y2

= 1,
a2
b2
que e s lequacio can`onica de la hip`erbola.

141

R. Amer i F. Carreras

Observacions 9.1 (a) De les equacions can`oniques de lellipse i la hip`erbola es dedueix que
els eixos principal i secundari son eixos de simetria, ja que si (x, y) compleix lequacio els seus
sim`etrics respecte als eixos, (x, y) i (x, y), tambe la compleixen.
(b) Les interseccions daquestes c`oniques amb els eixos sanomenen v`ertexs. Lellipse te quatre
v`ertexs: dos sobre leix principal, els punts de coordenades (a, 0) i (a, 0), i dos sobre leix
secundari, (0, b) i (0, b). La hip`erbola nomes en te dos sobre leix principal, els punts de
coordenades (a, 0) i (a, 0).
(c) Allant la y de les equacions can`oniques de lellipse i la hip`erbola obtenim
y=

bp 2
a x2
a

y=

bp 2
x a2
a

respectivament. Aix`o ens diu que lellipse e s una figura fitada i la hip`erbola no. A mes, les
rectes dequacions
b
y= x
a
son asmptotes de la hip`erbola. Si les dues asmptotes son perpendiculars, e s a dir, si a = b,
direm que la hip`erbola e s equil`atera.

Donats un punt F i una recta R que no el conte, anomenarem par`abola el conjunt de punts p del
pla que compleixen la condicio
d( p, F) = d( p, R) .
F e s el focus de la par`abola, R e s la directriu, i el punt mitj`a de la perpendicular de F a R e s el
v`ertex. La dist`ancia m = d(F, R) e s el par`ametre de la par`abola.
Escollim una refer`encia R = { o ; uE, vE }, on o e s el v`ertex de la par`abola, uE un vector unitari amb
la direccio de R i vE un vector unitari i perpendicular a uE en el sentit de R a F. Lequacio de R e s
m
m
y = , el focus e s F = (0, ) i els punts de la par`abola son els que compleixen lequacio
2





m 2
m

x2 + y
= y+ ,
2

equivalent a
x 2 2my = 0

o be

y=

x2
,
2m

que e s lequacio can`onica de la par`abola.


Observacions 9.2 (a) Aquesta equacio ens diu que la par`abola te un u nic eix de simetria, leix
oy, i un u nic v`ertex, que coincideix amb lorigen de coordenades de R.

142

Corbes i superfcies de segon grau

R. Amer i F. Carreras

(b) A difer`encia de lellipse i la hip`erbola, en les que el sentit dels vectors uE i vE (i, per tant, el
sentit positiu dels eixos de coordenades) no influeix en lequacio can`onica, si en leleccio de la
refer`encia R per a la par`abola invertim el sentit del vector vE (i, per tant, el sentit de leix oy), la
m
m
recta R tindr`a per equacio y = , el focus ser`a F = (0, ) i lequacio de la par`abola ser`a
2

x 2 + 2my = 0.

9.2 Classificacio de les c`oniques


Una c`onica del pla e s el conjunt de punts que en una refer`encia R satisfan una equacio de segon
grau
F(x, y) = ax 2 + 2bx y + cy 2 + 2d x + 2ey + f = 0 .
El nostre objectiu e s trobar una altra refer`encia on lequacio de la c`onica adopti la forma mes
senzilla possible. Aquesta ser`a lequacio reduda de la c`onica, que en el cas duna ellipse, una
hip`erbola o una par`abola haur`a de coincidir, essencialment, amb la seva equacio can`onica.
Aquest proces de reduccio ens permetr`a donar una classificacio de les c`oniques i introduir el
concepte dinvariant duna c`onica per canvis de coordenades.
Si posem

A=

a b
b c


X=

x
y

L = (d

e) ,

lequacio ax 2 + 2bx y + cy 2 + 2d x + 2ey + f = 0 es pot escriure


X t AX + 2L X + f = 0 ,
que e s lequacio matricial de la c`onica; si posem

a b d
A3 = b c e i
d e f

x
X3 = y ,
1

la mateixa equacio te la forma


X 3t A3 X 3 = 0 ,
equacio matricial compacta de la c`onica. Lequival`encia de les tres formes es comprova directament efectuant els productes de les matrius que intervenen a les equacions.
Donada una nova refer`encia R0 = { o ; uE, vE }, on o = (x0 , y0 ), uE = (c11 , c21 ) i vE = (c12 , c22 ),
les equacions del canvi de coordenades son
X = B + C X0 ,

143

R. Amer i F. Carreras

on

B=

x0
y0


C=

c11 c12
c21 c22


i

X =

La forma matricial compacta daquest canvi de coordenades e s

c11 c12 x0
X 3 = C3 X 30 , on C3 = c21 c22 y0 i
0
0 1

x0
y0

x0
X 30 = y 0 .
1

Com que les dues refer`encies son rectangulars, C e s una matriu ortogonal, e s a dir, C t C = I
i per tant C t = C 1 . A mes, det(C) = 1, ja que tambe suposem sempre que les refer`encies
utilitzades son positives.
Proposicio 9.3 Aplicant a lequacio X t AX + 2L X + f = 0 el canvi de coordenades X =
B + C X 0 obtenim
(X 0 )t A0 X 0 + 2L 0 X 0 + f 0 = 0 ,
on

0
t

A = C AC
L 0 = (B t A + L)C

0
f = B t AB + 2L B + f = F(x0 , y0 ) .

Lequacio matricial compacta de la c`onica en les noves coordenades e s


(X 30 )t A03 X 30 = 0 ,

on

A03 = C3t A3 C3 .

D EMOSTRACI O . En substituir X = B + C X 0 a lequacio matricial de la c`onica sobte


(B + C X 0 )t A(B + C X 0 ) + 2L(B + C X 0 ) + f = 0
i, en efectuar els productes daquestes matrius,
B t AB + B t AC X 0 + (X 0 )t C t AB + (X 0 )t C t AC X 0 + 2L B + 2LC X 0 + f = 0 .
Daltra banda, (X 0 )t C t AB = B t AC X 0 , ja que aquests productes donen escalars; per tant, agrupant els termes obtenim
(X 0 )t C t AC X 0 + 2(B t A + L)C X + B t AB + 2L B + f = 0 ,
e s a dir,
(X 0 )t A0 X 0 + 2L 0 X 0 + f 0 = 0 .

144

R. Amer i F. Carreras

Corbes i superfcies de segon grau

De la mateixa manera, la substitucio de X 3 = C3 X 30 a lequacio matricial compacta de la c`onica


dona
(X 30 )t C3t A3 C3 X 30 = 0 ,
e s a dir,
(X 30 )t A03 X 30 = 0 .
La nocio de c`onica no dep`en del sistema de refer`encia escollit ja que, segons la proposicio
anterior, el fet de quedar definida per una equacio de segon grau no varia en fer un canvi de
coordenades.
Les matrius A i A3 duna banda, i les matrius A0 i A03 de laltra, corresponen a les formes
matricial i matricial compacta de la mateixa c`onica en dos sistemes de refer`encia diferents. Estan
relacionades per les igualtats
A0 = C t AC

A03 = C3t A3 C3 ,

la qual cosa ens permetr`a introduir el concepte dinvariant a partir del resultat seguent.
Proposicio 9.4 En tot canvi de coordenades es compleix:
(a) A i A0 tenen els mateixos valors propis.
(b) det(A) = det(A0 ), tr(A) = tr(A0 ).
(c) det(A3 ) = det(A03 ), rang(A3 ) = rang(A03 ).
D EMOSTRACI O . (a) Com que C e s una matriu ortogonal, A0 = C t AC = C 1 AC; per tant, A i
A0 tenen el mateix polinomi caracterstic i, en conseque` ncia, els mateixos valors propis.
(b) Nomes cal observar que el determinant i la traca son els coeficients del polinomi caracterstic
duna matriu dordre 2.
evident que det(C3 ) = det(C) = 1, per tant det(A3 ) = det(A0 ). Finalment, rang(A3 ) =
(c) Es
3
rang(A03 ) perqu`e la matriu C3 e s regular.
Definim ara com invariants de la c`onica:
(a) i : valors propis de A.
(b) D2 = det(A) i T = tr(A).
(c) D3 = det(A3 ) i r3 = rang(A3 ).

145

R. Amer i F. Carreras

Observacio 9.5 T , D2 i D3 son invariants de la funcio F(x, y) per canvis de coordenades, per`o
no podem dir que siguin invariants de la c`onica descrita per lequacio F(x, y) = 0. Nomes
cal observar que la multiplicacio daquesta equacio per un escalar t 6= 0 no modifica la c`onica,
mentre que les quantitats anteriors es transformen en t T , t 2 D2 i t 3 D3 respectivament. En canvi,
el signe de D2 , lanullacio de D3 , el rang r3 i el signe de D3 T son invariants estrictes de la
c`onica, ja que son independents del sistema de refer`encia i dels factors t 6= 0, i son els que farem
servir per donar un criteri pr`actic de classificacio de les c`oniques en aquesta mateixa seccio.

La classificacio de les c`oniques es basa en fer leleccio del canvi de coordenades X = B + C X 0


de manera que lequacio inicial de la c`onica es transformi en la mes senzilla possible. La matriu
C ens dona les direccions dels nous eixos de coordenades, que han de coincidir amb els de la
c`onica, mentre que lobjectiu de la translacio B e s que el nou origen de coordenades coincideixi
amb el centre o el v`ertex de la c`onica.
Per tal que lequacio resultant sigui la mes senzilla possible, la matriu A0 ha de ser diagonal i, si
e s possible, hem de fer que L 0 = 0 o f 0 = 0. Si det(A) 6= 0, el sistema dequacions AX + L t = 0
e s compatible determinat i, per tant, si B nes la solucio tindrem que L 0 = 0. El lema seguent
descriu els casos en que D2 = det(A) = 0.
Lema 9.6 (a) Si D2 = D3 = 0, el sistema AX + L t = 0 e s compatible indeterminat.
(b) Si D2 = 0 i D3 6= 0, el sistema AX + L t = 0 e s incompatible.

D EMOSTRACI O . Suposant que D2 = 0, e s suficient demostrar que el sistema e s compatible


indeterminat si, i nomes si, D3 = 0. Com que D2 = 0, la matriu A ha de ser de la forma

A=

a ta
ta t 2 a


o

amb a 6= 0

En el primer cas tindrem que



a ta

D3 = ta t 2 a
d
e

d
e
f

A=

0 0
0 c












= d ta d e a d = a(dt e)2 ;
2

t a e
ta e

aleshores, si D3 = 0 ha de ser e = td, i el sistema AX + L t = 0 queda




amb c 6= 0 .

a ta
ta t 2 a



x
y

que, evidentment, e s compatible indeterminat.


+

d
dt


=

0
0

146

R. Amer i F. Carreras

Corbes i superfcies de segon grau

Recprocament, si el sistema e s compatible indeterminat sha de complir que




a d


don
D3 = 0 .
ta e = 0 ,
La demostracio en el segon cas e s an`aloga i mes senzilla.
Teorema 9.7 Donada una c`onica F(x, y) = 0, existeix una refer`encia rectangular positiva R0 =
{ o ; uE, vE } on la seva equacio e s dun dels tres tipus seguents:
(a) x 0 2 + y 0 2 + f 0 = 0,
(b) x 0 2 + f 0 = 0,
(c) x 0 2 + 2e0 y 0 = 0,
amb , i e0 no nuls.
D EMOSTRACI O . Hem de trobar un canvi de coordenades rectangular X = B + C X 0 tal que
lequacio de la c`onica en les noves coordenades sigui dun dels tres tipus de lenunciat.
Sigui C una matriu ortogonal amb det(C) = 1 tal que A0 = C t AC sigui diagonal:



0
A =

amb 6= 0.
Per escollir la translacio B distingirem tres casos:
(a) Si D2 6= 0, sigui B = (x0 , y0 )t lunica solucio del sistema AX + L t = 0. Aleshores, lequacio
de la c`onica en les noves coordenades e s x 0 2 + y 0 2 + f 0 = 0, on f 0 = F(x0 , y0 ).
(b) Si D2 = D3 = 0, sigui B = (x0 , y0 )t una solucio qualsevol del sistema AX + L t = 0.
Aleshores, lequacio de la c`onica en les noves coordenades e s x 0 2 + f 0 = 0, on f 0 = F(x0 , y0 ),
ja que un dels valors propis de A ha de ser nul.
(c) Si D2 = 0 i D3 6= 0, sigui B = (x0 , y0 )t lunica solucio del sistema dequacions
)
F(x, y) = 0
,
L 01 = 0
on L 01 e s el primer coeficient de L 0 (vegeu el lema seguent). Aleshores, lequacio de la c`onica en
les noves coordenades e s x 0 2 + 2e0 y 0 = 0, on
e0 = (d, e) vE

147

R. Amer i F. Carreras

i vE e s el vector propi unitari de A de valor propi 0 que ocupa la segona columna de la matriu de
canvi C.
Lema 9.8 Si D2 = 0 i D3 6= 0, el sistema
F(x, y) = 0

L 01 = 0
te una u nica solucio.
D EMOSTRACI O . Farem la demostracio nomes en el cas on


a ta
A=
amb
a 6= 0 ,
ta t 2 a
deixant la de laltre cas per al lector. Els valors propis de A son = a(1 + t 2 ) i = 0, i la
matriu de canvi e s


1
1 t
C=
.
1
1 + t2 t
Aleshores e s immediat comprovar que F(x, y) = a(x + t y)2 + 2d x + 2ey + f , i que lequacio
L 01 = 0 es pot escriure a(1 + t 2 )(x + t y) + d + et = 0; per tant, el sistema
)
F(x, y) = 0
L 01 = 0
es transforma en un sistema lineal de dues inc`ognites i determinant


1 t


d e = e dt 6= 0 ,
ja que D3 = a(e dt)2 6= 0. En conseque` ncia, el sistema e s compatible determinat.
Les matrius de la c`onica en les noves coordenades son





0
0
A =
o A =

0
i

A03 =

,
f0

A03 =

f0

A03 =

0 e0
e0 0

A mes, els invariants de la c`onica es poden calcular a partir de les matrius en les coordenades
originals i a partir daquestes matrius. A continuacio analitzem els diferents tipus de figura que
corresponen a les equacions del teorema anterior, fent una primera distincio segons D3 6= 0 o
D3 = 0.

148

R. Amer i F. Carreras

Corbes i superfcies de segon grau

C`oniques no degenerades (D3 6= 0)


Nomes ho poden ser les del tipus (a) amb f 0 6= 0 i les del tipus (c). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 + f 0 = 0, i distingim tres possibilitats:
1. Valors propis del mateix signe (D2 = > 0) i terme independent amb signe contrari
(

D3
f 0
=
< 0). Lequacio es transforma en
T
+

x 02
y02
+
=1
p2
q2
i la c`onica e s una ellipse real. Si els valors propis coincideixen, e s una circumfer`encia, ja
que queda p = q (radi de la circumfer`encia).
2. Valors propis i terme independent del mateix signe (D2 = > 0 i
Lequacio es transforma en

f 0
D3
=
> 0).
T
+

y02
x 02
+
= 1
p2
q2
i la c`onica e s una ellipse imagin`aria.
3. Valors propis amb signe diferent (D2 = < 0). Permutant els eixos si e s necessari,
lequacio es transforma en
x 02
y02
2 =1
p2
q
i la c`onica e s una hip`erbola. Si T = 0, els valors propis compleixen = i la hip`erbola
e s equil`atera.
Les c`oniques del segon tipus tenen equacio reduda x 0 2 + 2e0 y 0 = 0 (D2 = 0), que en aillar la
y 0 es transforma en
x 02
y0 =
.
2m
Per tant, es tracta duna par`abola.

C`oniques degenerades (D3 = 0)


Ho son les c`oniques del tipus (a) amb f 0 = 0 i les del tipus (b). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 = 0, i distingim dos casos:
1. Valors propis amb signe diferent (D2 = < 0). Lequacio es pot escriure
(
px 0 + qy 0 = 0
2
2
2 0
2 0
p x q y = 0 o be
px 0 qy 0 = 0
i la c`onica e s un parell de rectes reals secants. Si T = 0, els valors propis compleixen
= i les dues rectes son perpendiculars.

R. Amer i F. Carreras

149

2. Valors propis del mateix signe (D2 = > 0). Lequacio es pot escriure
(
px 0 + iqy 0 = 0
2
2
p 2 x 0 + q 2 y 0 = 0 o be
px 0 iqy 0 = 0
i la c`onica e s un parell de rectes imagin`aries secants amb v`ertex real (el punt x 0 = y 0 = 0).
Les c`oniques del segon tipus tenen equacio reduda x 00 2 + f 0 = 0 (D2 = 0), i ara distingim tres
casos:
1. f 0 = 0 (r3 = 1). Lequacio reduda e s x 0 2 = 0 i la c`onica e s una recta doble.
2. i f 0 tenen signe diferent (r3 = 2). Lequacio reduda es transforma en
(
x0 = p
2
x 0 = p 2 o be
x0 = p
i la c`onica e s un parell de rectes reals paralleles .
3. i f 0 tenen el mateix signe (r3 = 2). Lequacio reduda es transforma en
(
x 0 = pi
2
x 0 = p 2 o be
x 0 = pi
i la c`onica e s un parell de rectes imagin`aries paralleles.
Les observacions que hem fet sobre els invariants en aquesta classificacio de les c`oniques a partir
de lequacio reduda ens permeten establir el criteri de classificacio de la taula 9.1.

D3 T > 0 ellipse imagin`aria

D2 > 0
D3 T < 0 ellipse real
D3 6= 0
D2 < 0 hip`erbola

D = 0 par`abola
2

D2 > 0 parell de rectes imagin`aries secants amb v`ertex real

D < 0 parell de rectes reals secants


2
(
D3 = 0

r3 = 2 parell de rectes paralleles (reals o imagin`aries)

D2 = 0
r3 = 1 recta doble

Taula 9.1: Classificacio de c`oniques

150

R. Amer i F. Carreras

Corbes i superfcies de segon grau

Observacions 9.9 (a) El cas = = 0 fa que lequacio es redueixi a una de primer grau
(A0 = A = 0) i, com que es tracta duna recta, no lhem incl`os a lestudi de les c`oniques, on hem
suposat sempre 6= 0.
(b) La refer`encia R0 = { 0 ; uE, vE } on la c`onica adopta lequacio reduda compleix les propietats
seguents: (1) uE e s un vector propi unitari de valor propi i determina la direccio positiva de leix
ox 0 ; (2) vE e s un vector propi unitari de valor propi , determina la direccio positiva de leix oy 0
i el podem escollir de manera que det(C) = 1 per tal que la refer`encia R0 sigui positiva; (3) el
nou origen de coordenades e s el punt x 0 = y 0 = 0, per tant a partir daqu podem trobar les seves
coordenades en la refer`encia original i coincideix amb el centre de lellipse o el de la hip`erbola
o amb el v`ertex de la par`abola.
(c) Si permutem lordre en que escollim els valors propis i vectors propis corresponents, el sistema de refer`encia i lequacio reduda tambe varien, intercanviant-se els papers de les coordenades
x 0 i y0.
Exemples 9.10 (a) La c`onica dequacio
10x 2 12x y 6y 2 12x 12y 129 = 0
te matrius

A=

10 6
6 6


i

10 6
6
6
A3 = 6 6
6 6 129

i invariants D2 = 96 i D3 = 11808, per tant e s una hip`erbola.


El polinomi caracterstic de la matriu A e s det(x I A) = x 2 4x 96 i els valors propis 12
i 8. Com a vectors propis escollim (3, 1) de valor propi 12 i (1, 3) de valor propi 8. El
centre de la hip`erbola e s la solucio del sistema dequacions AX + L t = 0, e s a dir,
)
10x 6y 6 = 0
,
6x 6y 6 = 0
e s a dir, el punt (0, 1), i els eixos son les rectes que passen pel centre i tenen direccions (3, 1)
i (1, 3) respectivament. Lequacio reduda i el canvi de coordenades corresponent son

  

 0 
1
0
x
3 1
x
02
02
+
.
12x 8y 123 = 0 i
=
1
y
y0
10 1 3
Finalment, les asmptotes de la hip`erbola son les rectes que passen pel centre i tenen pendent
m = lim

y
.
x

151

R. Amer i F. Carreras

Dividint lequacio de la hip`erbola entre x 2 i prenent el lmit obtenim que 10 12m 6m 2 = 0,


e s a dir, els pendents de les asmptotes son

3 + 2 6
3 2 6
i
.
3
3
(b) Les matrius de la c`onica dequacio
x 2 4x y + 4y 2 2x y = 0
son

A=

1 2
2
4


i

1
A3 = 2
1

2
4
-1/2

1
-1/2
0

i els seus invariants D2 = 0 i D3 = -25/4, per tant la c`onica e s una par`abola.


Els valors propis de la matriu A son 5 i 0, i els vectors propis corresponents (1, 2) i (2, 1). Per
calcular el v`ertex de la par`abola hem de resoldre el sistema dequacions
)
x 2 4x y + 4y 2 2x y = 0
,
x 2y = 0
que te per solucio (0, 0). Daltra banda, tenim que

5
1
e = (1, -1/2) (2, 1) =
2
5
0

i lequacio reduda de la par`abola e s

2
5x 0 5 y 0 = 0 ,

y0 =

o be

02
5x .

El canvi de coordenades que transforma lequacio inicial en lequacio reduda e s


 

 0 
1
x
1 2
x
.
=
y
2
1
y0
5
(c) La c`onica dequacio
2x 2 2x y 4y 2 2x + 10y 4 = 0
te matrius

A=

2 1
1 4


i

2 1 1
5
A3 = 1 4
1
5 4

152

R. Amer i F. Carreras

Corbes i superfcies de segon grau

i invariants D2 = 9 i D3 = 0, per tant e s un parell de rectes reals secants. Per calcular les
seves equacions, tractem lequacio de la c`onica com una equacio de segon grau per a y,
4y 2 + (10 2x)y + (2x 2 2x 4) = 0 ,
que te per solucio
p
(10 2x)2 + 16(2x 2 2x 4)
y=
8

2x 10 36x 2 72x + 36
=
8
2x 10

2x 10 (6x 6)
.
8

Aleshores, la c`onica est`a formada per les rectes


y = x + 2

y=

x +1
,
2

e s a dir, x + y 2 = 0 i x 2y + 1 = 0.

9.3 Llocs geom`etrics


Un lloc geom`etric en el pla e s un conjunt de punts que satisfan una propietat determinada, expressada habitualment en termes geom`etrics (dist`ancies entre punts, dist`ancies entre punts i rectes,
interseccio de rectes, etc.). El problema de determinar un lloc geom`etric consisteix a trobar
lequacio daquest conjunt de punts en una refer`encia donada o en una adaptada al problema.
Les definicions dellipse, hip`erbola i par`abola de la primera seccio daquest captol i el c`alcul de
les seves equacions can`oniques en unes refer`encies adequades son exemples de llocs geom`etrics
on la propietat que els determina ve donada per dist`ancies. En ocasions semblants, laplicacio
directa de la condicio que han de complir els punts del lloc geom`etric dona la seva equacio.
Exemple 9.11 A partir duna recta R i un punt F exterior a ella, calculem lequacio del lloc
geom`etric dels punts p que satisfan, per a un t 0 fix,
d( p, F) = td( p, R) .
Escollim una refer`encia de manera que la recta R tingui equacio y = 0 i el punt F coordenades
(0, 1). Aleshores lequacio e s
p
x 2 + (y 1)2 = t| y | .

153

R. Amer i F. Carreras

Elevant al quadrat els dos termes obtenim


x 2 + (y 1)2 = t 2 y 2 ,
i, agrupant els termes,
x 2 + (1 t 2 )y 2 2y + 1 = 0 ,
que e s una c`onica per a qualsevol valor de t. Tenint en compte que D3 = t 2 i D2 = 1 t 2 ,
resulta: si t = 0, la c`onica e s un parell de rectes imagin`aries secants amb v`ertex real (el punt F);
si 0 < t < 1, e s una ellipse; si t = 1, e s una par`abola; i si t > 1, e s una hip`erbola.

En altres ocasions, les propietats que defineixen els punts dun lloc geom`etric depenen delements variables que es poden expressar en termes dun o mes par`ametres. Aleshores, les equacions que descriuen aquests punts tambe depenen dels par`ametres, i lequacio del lloc geom`etric
sobte en eliminar-los daquest sistema. (Observem que per poder eliminarlos el sistema ha de
tenir una equacio mes que par`ametres.)
Exemple 9.12 Donats el punt F = (0, 1) i la par`abola x 2 4y = 0, calculem lequacio del lloc
geom`etric dels punts mitjans dels segments que uneixen dos punts de la par`abola i passen per F.
Aquests segments sobtenen en fer passar una recta variable pel punt F i calcular la seva interseccio amb la par`abola. Una recta que passa pel punt F te equacio
y 1 = mx

o be

y = mx + 1

(les rectes variables depenen del par`ametre m). La interseccio daquesta recta i la par`abola ve
donada per lequacio
x 2 4(mx + 1) = 0 ,
i les seves solucions son
x=

4m

p
16m 2 + 16
4m 4 m 2 + 1
=
= 2m 2 1 + m 2 .
2
2

Per tant, les interseccions de la recta i la par`abola son els punts


p
p
P = (2m + 2 1 + m 2 , 1 + 2m 2 + 2m 1 + m 2 )
p
p
Q = (2m 2 1 + m 2 , 1 + 2m 2 2m 1 + m 2 ) ,
i el punt mitj`a del segment P Q te per coordenades
x = 2m
y = 1 + 2m 2

)
.

154

Corbes i superfcies de segon grau

R. Amer i F. Carreras

Aquest e s el sistema que descriu els punts del lloc geom`etric en funcio del par`ametre m. Per
eliminar-lo, allem m de la primera equacio,
m=

x
,
2

i substituim a la segona: resulta


y =1+2

 x 2
2

2y = 2 + x 2
x 2 2y + 2 = 0 ,
que e s lequacio duna par`abola.

9.4 Qu`adriques
Una qu`adrica e s una figura C de lespai que en algun sistema de coordenades queda definida per
una equacio de la forma
F(x, y, z) = a11 x 2 + a22 y 2 + a33 z 2 + 2a12 x y + 2a13 x z + 2a23 yz + 2b1 x + 2b2 y + 2b3 z + c = 0 .

Introduint les notacions



x

X= y ,
z

a11 a12 a13


A = a12 a22 a23
a13 a23 a33

L = (b1

b2

b3 ) ,

lequacio F(x, y, z) = 0 e s equivalent a lequacio matricial de C,


X t AX + 2L X + c = 0 ,
i escrivint

x
y

X4 =
z
1


i

A4 =

A Lt
L c

obtenim lequacio matricial compacta


X 4t A4 X 4 = 0 .

a11 a12 a13 b1


a12 a22 a23 b2

=
a13 a23 a33 b3
b1 b2 b3 c

R. Amer i F. Carreras

155

Daltra banda, un canvi de refer`encia de les coordenades (x, y, z) a les coordenades (x 0 , y 0 , z 0 )


es descriu per X = B + C X 0 , on B e s una transllacio de lorigen al punt (x0 , y0 , z 0 ) i C una
rotacio dels eixos. En forma compacta resulta


C B
0
X 4 = C4 X 4 , on C4 =
.
0 1

La demostracio dels dos resultats seguents e s la mateixa que en el cas de les c`oniques.
Proposicio 9.13 Aplicant a la qu`adrica C el canvi de refer`encia X = B + C X 0 , lequacio de la
figura en la nova refer`encia e s (X 0 )t A0 X 0 + 2L 0 X 0 + c0 = 0, on
0
t

A = C AC
L 0 = (B t A + L)C

0
c = B t AB + 2L B + c = F(x0 , y0 , z 0 )
En forma compacta, lexpressio passa a ser (X 40 )t A04 X 40 = 0, on A04 = C4t A4 C4 .
Corol.lari 9.14 Son invariants de la qu`adrica C per canvis de coordenades:
(a) Els valors propis , i de la matriu A.
(b) El polinomi caracterstic de la matriu A, det(I A) = 3 t1 2 + t2 t3 , on t1 = tr(A),
t2 e s la suma dels tres menors diagonals dordre 2 i t3 = det(A) = D3 .
(c) El determinant D4 = det(A4 ).
(d) El rang r4 = rang(A4 ).

Recordem que, com en el cas de les c`oniques, per parlar dinvariants estrictes cal tenir present
lefecte de multiplicar per t 6= 0 lequacio de la qu`adrica. Els valors propis passen a ser t, t i
t , els coeficients del polinomi caracterstic de A queden multiplicats respectivament per t, t 2 i
t 3 i el determinant total es converteix en t 4 D4 , mentre que el rang de A4 no varia.
El proces de reduccio de lequacio duna qu`adrica e s semblant al de les c`oniques. Com que la matriu A e s sim`etrica, existeix una matriu ortogonal C amb det(C) = 1 i tal que C t AC = C 1 AC
e s diagonal; en llenguatge geom`etric, una rotacio deixos elimina els termes no rectangulars, e s
a dir, fa que
0
0
0
a12
= a13
= a23
= 0,
0
0
0
mentre que a11
= , a22
= i a33
= , valors propis de A. Daltra banda, escollint la translacio
B de manera adequada (o aplicant una segona rotacio deixos en un dels casos) podem anullar

156

R. Amer i F. Carreras

Corbes i superfcies de segon grau

els termes de la part lineal quan el sistema AX + L t = 0 e s compatible, o be dos coeficients de la


part lineal i el terme independent quan aquest sistema e s incompatible. Arribem aix al resultat
seguent.
Teorema 9.15 Amb un canvi de coordenades adequat, lequacio de qualsevol qu`adrica pot
reduir-se a un dels cinc tipus seguents:
(a) x 0 2 + y 0 2 + z 0 2 + c0 = 0.
(b) x 0 2 + y 0 2 + c0 = 0.
(c) x 0 2 + c0 = 0.
(d) x 0 2 + y 0 2 + 2b30 z 0 = 0.
(e) x 0 2 + 2b30 y 0 = 0.
Els coeficients , , i b30 son no nuls.
A continuacio analitzem els diversos tipus de superfcies que representen aquestes equacions, i
el criteri b`asic per distingirles e s el signe dels coeficients. Pr`eviament, per`o, seguim el criteri
del rang per a una primera classificacio.

Qu`adriques no degenerades (r4 = 4, e s a dir, D4 6= 0)


Ho son les qu`adriques del tipus (a) amb c0 6= 0 i les del tipus (d). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 + z 0 2 + c0 = 0, i hem de distingir quatre possibilitats:
1. Els tres valors propis tenen el mateix signe i el terme independent signe contrari (D4 =
c0 < 0). Amb petites modificacions aritm`etiques, lequacio adopta la forma
x 02
y02
z02
+
+
=1
p2
q2
r2
i la qu`adrica e s un ellipsoide real (de revolucio si coincideixen dos dels valors propis i
una esfera si coincideixen tots tres).
2. Valors propis i terme independent del mateix signe (D4 > 0). Lequacio es podr`a escriure
x 02
y02
z02
+ 2 + 2 = 1
p2
q
r
i la qu`adrica e s un ellipsoide imaginari (sense punts reals).
3. Valors propis de signe diferent i terme independent del mateix signe que el valor propi
allat (D4 > 0). Lequacio es pot escriure
x 02
y02
z02
+

= 1,
p2
q2
r2

R. Amer i F. Carreras

157

i la qu`adrica e s un hiperboloide duna fulla.


4. Valors propis de signe diferent i terme independent amb el mateix signe que dos dells
(D4 < 0). Lequacio quedar`a de la forma
x 02
y02
z02

= 1,
p2
q2
r2
que e s lhiperboloide de dues fulles.
Les qu`adriques del tipus (d) tenen equacio reduda x 0 2 + y 0 2 + 2b30 z 0 = 0, i distingim dues
possibilitats:
1. Els valors propis no nuls son del mateix signe (t2 = > 0 i D4 = b30 2 < 0). Resulta
x 02
y02
+
= z0 ,
p2
q2
anomenada paraboloide ellptic (de revolucio o circular si p = q).
2. Els valors propis no nuls tenen signe diferent (t2 < 0 i D4 > 0). Prenent el primer positiu,
el segon negatiu i el coeficient b30 negatiu, apareix
x 02
y02
2 = z0 ,
p2
q
que e s el paraboloide hiperb`olic.

Qu`adriques poc degenerades (r4 = 3 i, en particular, D4 = 0)


Ho son les qu`adriques del tipus (a) amb c0 = 0, les del tipus (b) amb c0 6= 0 i les del tipus (e).
Les del tipus (a) tenen equacio reduda x 0 2 + y 0 2 + z 0 2 = 0 (D3 6= 0), i distingim dues
possibilitats:
1. Valors propis de signe diferent. Lequacio sescriu
y02
x 02
2
+
= z0
2
2
p
q
i la qu`adrica e s un con real (circular o de revolucio si p = q).
2. Valors propis del mateix signe. Aix`o dona
y02
x 02
2
+
= z 0 ,
2
2
p
q
que e s un con imaginari (amb v`ertex real x 0 = y 0 = z 0 = 0).

158

R. Amer i F. Carreras

Corbes i superfcies de segon grau

Les del tipus (b) tenen equacio reduda x 0 2 + y 0 2 + c0 = 0 (D3 = 0), i hem de distingir tres
possibilitats:
1. Valors propis no nuls del mateix signe (t2 > 0) i terme independent de signe contrari
(

c0
< 0). Lequacio reduda es transforma en
+

x 02
y02
+
=1
p2
q2
i la qu`adrica e s un cilindre ellptic real (circular si p = q).
2. Valors propis no nuls i terme independent del mateix signe (t2 > 0 i
queda

c0
> 0). Lequacio
+

x 02
y02
+
= 1
p2
q2
i aix`o e s un cilindre ellptic imaginari (sense punts reals).
3. Valors propis no nuls de signe diferent (t2 < 0). Permutant, si e s necessari, les coordenades
x 0 i y 0 tenim que
y02
x 02

= 1,
p2
q2
anomenat cilindre hiperb`olic.
Les qu`adriques del tipus (e) tenen equacio reduda x 0 2 + 2b30 y 0 = 0 (D3 = t2 = 0), i lequacio
es pot escriure com
2
x 0 = 2 py 0 ,
que correspon a un cilindre parab`olic.

Qu`adriques molt degenerades (r4 2 i, en particular, D4 = R4 = D3 = 0)


Ho son les qu`adriques del tipus (b) amb c0 = 0 i les del tipus (c). Les del tipus (b) tenen equacio
reduda x 0 2 + y 0 2 = 0, i hem de distingir dues possibilitats:
1. Valors propis de signe diferent (t2 < 0). Podem escriure
(
px 0 + qy 0 = 0
2 02
2 02
p x q y = 0 , o be
px 0 qy 0 = 0
que defineix un parell de plans reals secants (perpendiculars si p = q).
2. Valors propis del mateix signe (t2 > 0). Tindrem
(
2 02

2 02

p x + q y = 0,

o be

px 0 + iqy 0 = 0
px 0 iqy 0 = 0

159

R. Amer i F. Carreras

que e s un parell de plans imaginaris secants (amb interseccio real: la recta dequacions
x 0 = y 0 = 0).
Finalment, les qu`adriques del tipus (c) tenen equacio reduda x 0 2 + c0 = 0 (t2 = 0), i distingim
tres possibilitats:
1. Si i c0 tenen signe diferent, tenim
(
02

x =p ,
2

o be

x0 = p
x0 = p

que e s un parell de plans reals parallels (diferents).


2. Si i c0 tenen el mateix signe,
(
02

x = p ,
2

o be

x0 = i p
x 0 = i p

i aix`o e s un parell de plans imaginaris parallels (sense punts reals).


3. Si c0 = 0 (r4 = 1), dividint lequacio per obtenim
2

x0 = 0
que e s un pla doble.
Aquesta classificacio de les qu`adriques es pot expressar en termes dels invariants dacord amb
lesquema de la taula 9.2.

Observacions 9.16 (a) Per classificar una qu`adrica no e s indispensable calcular efectivament els
valors propis de la matriu A: nomes cal tenir en compte els signes, i per a aix`o e s forca u til el
teorema de Descartes (vegeu lap`endix B).
(b) Recomanem al lector que estudi les seccions de les qu`adriques per plans perpendiculars
als eixos: e s un exercici instructiu per familiaritzarse amb els noms de les figures i per notar
determinades caracterstiques: la connexio dellipsoides, paraboloides i hiperboloides duna
fulla, lafitament de lellipsoide, el paper del v`ertex del con i del paraboloide o els eixos dels
cilindres.
(c) En comparacio amb les c`oniques, aqu tambe trobem el cas no degenerat (ellipsoides, hiperboloides i paraboloides) i un cas degenerat (parell de plans) an`aleg al dels parells de rectes
del pla; hi ha, per`o, un grup intermig, format pels cons i els cilindres, que e s una mena dhbrid
sense correspond`encia en el cas de les c`oniques.

160

R. Amer i F. Carreras

D4 > 0

D4 < 0

D3 6= 0

D3 = 0

D3 6= 0

Corbes i superfcies de segon grau

(
Valors propis amb el mateix signe
Valors propis amb signe diferent
paraboloide hiperb`olic

ellipsoide imaginari
hiperboloide duna fulla

(
Valors propis amb el mateix signe
Valors propis amb signe diferent

ellipsoide real
hiperboloide de dues fulles

D3 = 0 paraboloide ellptic
(

Valors propis amb el mateix signe con imaginari

D3 6= 0

Valors propis amb signe diferent


con real

t2 > 0 cilindre ellptic (real o imaginari)

t2 < 0 cilindre hiperb`olic

r4 = 3

t = 0 cilindre parab`olic

D4 = 0

t2 > 0 parell de plans imaginaris secants

D3 = 0

r
=
2
t2 < 0 parell de plans reals secants

t2 = 0 parell de plans parallels (reals o imaginaris)

r4 = 1 pla doble

Taula 9.2: Classificacio de qu`adriques


Exemples 9.17 (a) Considerem la qu`adrica dequacio
2x 2 + 2x y 2x z 2yz + 6x + 10y + 4z 20 = 0 .
Calculant els invariants a partir de la matriu

2
1 1
3
1
0 1
5

A4 =
1 1
0
2
3
5
2 20
resulta D4 = 0, r4 = 2 i t2 = 3, per tant la qu`adrica e s un parell de plans reals secants.

R. Amer i F. Carreras

161

(b) Estudiem ara la qu`adrica


x 2 + y 2 2z 2 + 2x y + 4x z + 2z 4 = 0 .
La matriu e s

1
1
A4 =
2
0

1
2
0
1
0
0
.
0 2
1
0
1 4

Com que D4 = 16, e s una qu`adrica no degenerada. El polinomi caracterstic de la matriu A,


det(I A) = 3 8 + 4 ,
ens indica que hi ha dos valors propis positius i un de negatiu, per tant aquesta qu`adrica e s un
hiperboloide duna fulla.
(c) Finalment, considerem la qu`adrica
x 2 + y 2 z 2 + 4x 4z = 0 .
Novament, partim de la matriu

1
0
A4 =
0
2

0
0
2
1
0
0

0 1 2
0 2
0

i obtenim D4 = 0 i D3 = 1. Els valors propis de A son 1 (doble) i 1, per tant es tracta dun
con real circular.

162

R. Amer i F. Carreras

Corbes i superfcies de segon grau

R. Amer i F. Carreras

163

A
Permutacions

Una permutacio del conjunt N = {1, 2, . . . , n} e s una aplicacio bijectiva : N N , que


escriurem amb la imatge de cada element a sota dell:




1 2 ... n
1 2 3 4 5 6
=
;
per exemple,
=
.
1 2 . . . n
4 5 1 6 3 2
Representarem per Pn el conjunt de les n! permutacions possibles de N , que son simplement
reordenacions dels n elements. La identitat, definida per


1 2 ... n
id =
,
1 2 ... n
e s lunica permutacio que conserva lordre natural. Donada una permutacio , es diu que un
parell i < j e s una inversio de si i > j . El signe de e s ( ) = (1)inv( ) , on inv( ) e s
el nombre dinversions de . Per exemple, (id) = 1, i si e s lexemple concret del principi
aleshores ( ) = 1, ja que presenta 9 inversions.
Una transposicio e s una permutacio que deixa fixos tots els elements de N excepte dos, i direm
que e s b`asica si aquests dos elements son consecutius; per exemple, si




1 2 3 4 5 6
1 2 3 4 5 6
=
i
=
,
1 5 3 4 2 6
1 2 4 3 5 6

164

Permutacions

R. Amer i F. Carreras

e s una transposicio i e s una transposicio b`asica. En qualsevol cas, escriurem simplement


transposicions com aquestes en la forma = (2, 5) i = (3, 4). El signe de tota transposicio e s
1.
El producte de dues permutacions i e s laplicacio composta, escrita (recordem que primer
opera i despres ). El producte e s una operacio associativa, i la identitat nes lelement neutre.
La inversa duna permutacio e s laplicacio inversa, escrita 1 , i e s lunica permutacio tal que
1 = id = 1 . Amb els exemples anteriors,



 

1 2 3 4 5 6
4 5 1 6 3 2
1 2 3 4 5 6
1
=
i =
=
.
4 5 6 1 3 2
1 2 3 4 5 6
3 6 5 1 2 4
Proposicio A.1 ( 1 ) = ( ) per a qualsevol Pn .
D EMOSTRACI O . Cada inversio de equival a una inversio de 1 , ja que
i< j

amb k = i > ` = j

`<k

amb

j = 1 ` > i = 1 k .

Proposicio A.2 Sigui una transposicio. Aleshores:


(a) ( ) = ( )

Pn .

(b) Laplicacio Pn Pn definida per 7 transforma les permutacions de signe positiu


en permutacions de signe negatiu i viceversa; per tant, hi ha la meitat de permutacions de
cada signe.
D EMOSTRACI O . (a) Si e s b`asica, presenta una inversio menys o una inversio mes que
, de manera que ( ) = ( ). Si no e s b`asica, e s el producte dun nombre senar de
transposicions b`asiques, ja que per a qualsevol parell i < j de N podem escriure
(i, j) = (i, i + 1)(i + 1, i + 2) ( j 2, j 1)( j 1, j)( j 2, j 1) (i + 1, i + 2)(i, i + 1) .
Aplicant reiteradament la propietat establerta abans en el cas de les transposicions b`asiques,
arribem tambe aqu a la relacio ( ) = ( ).
(b) Segons lapartat anterior, el signe de e s el contrari del de ; com que laplicacio donada
per 7 e s injectiva, hi ha tantes permutacions de signe positiu com de signe negatiu.
Proposicio A.3 Tota permutacio e s producte de transposicions. Si = 1 2 p e s una descomposicio daquest tipus,
( ) = (1) p .

R. Amer i F. Carreras

165

D EMOSTRACI O . Aplicarem recurr`encia sobre el nombre delements que no queden fixos. Si


mou nomes i i j, aleshores = (i, j). Suposem ara que mou k > 2 elements de N , i escollim
i tal que i = j 6= i. La permutacio (i, j) deixa invariants els mateixos elements que i, a
mes, lelement i: per recurr`encia, sabem que (i, j) = 2 p (producte de transposicions),
per tant = 1 2 p amb 1 = (i, j). Lafirmacio final sobre el signe de la permutacio e s una
conseque` ncia immediata de lapartat (a) de la proposicio precedent.

166

R. Amer i F. Carreras

Permutacions

R. Amer i F. Carreras

167

B
Polinomis

Un monomi e s una expressio de la forma ax m , on el coeficient a e s un nombre real o complex,


x e s una indeterminada i m e s un nombre natural o zero. Un polinomi e s una suma finita de
monomis, que escrivim com
p(x) = a0 + a1 x + a2 x 2 + + an x n ,
amb an 6= 0 si n > 0. Es diu que n e s el grau de p(x). Els polinomis de grau 0, tambe
anomenats constants, sidentifiquen amb els nombres. Els polinomis es poden sumar, restar i
multiplicar seguint les lleis ordin`aries de l`algebra, i nomes tenen invers els polinomis constants
no nuls.
Divisio entera. Donats dos polinomis p(x) i d(x) 6= 0, existeixen dos u nics polinomis q(x)
(quocient) i r (x) (residu) tals que:
(1) p(x) = d(x)q(x) + r (x).
(2) r (x) e s 0 o de grau mes petit que el grau de d(x).
La demostracio e s senzilla, per induccio sobre el grau de p(x). Sens dubte, el lector tambe
coneix la regla de Ruffini, que esquematitza la divisio dun polinomi p(x) per x .
Quan r (x) = 0 la divisio e s exacta, i es diu que d(x) e s un divisor de p(x) o be que p(x) e s un
multiple de d(x).

168

Polinomis

R. Amer i F. Carreras

Si e s un nombre real o complex, el valor num`eric dun polinomi p(x) quan x = e s


p() = a0 + a1 + a2 2 + + an n ,
i e s una arrel de p(x) si p() = 0.
Proposicio B.1 (a) (Teorema del residu.) El residu de la divisio dun polinomi p(x) per x
e s el valor num`eric p().
(b) (Teorema del factor.) Un nombre e s arrel dun polinomi p(x) si, i nomes si, x e s un
divisor de p(x).
D EMOSTRACI O . (a) La divisio de p(x) per x dona p(x) = (x )q(x) + r, i substituint
arreu x = queda p() = r .
(b) Es una conseque` ncia immediata de (a).
Exemples B.2 (a) Els valors num`
es poden calcular amb la regla de Ruffini.
erics dun polinomi
3
Per exemple, si volem trobar p( 2) quan p(x) = x + 2x 2 3x + 1, fem

2
1

2
2+

2+2 2

1 + 2 2

4 2
5

i tenim que p( 2) = 5 2.
(b) Segons el teorema del factor, si e s una arrel de p(x) tenim
p(x) = (x )q(x) .
Si e s una arrel de q(x) resulta q(x) = (x )r (x), i per tant
p(x) = (x )(x )r (x) .
Si continuem aquest proces de descomposicio, i tenim en compte el comportament del grau
davant de la multiplicacio de polinomis, observem que el darrer quocient ser`a de grau zero, i per
tant un polinomi de grau n > 0 pot tenir, com a m`axim, n arrels diferents.

R. Amer i F. Carreras

169

Daltra banda, una arrel pot apar`eixer mes duna vegada durant aquesta descomposicio dun
polinomi p(x) com a producte de factors de primer grau, per tant e s convenient introduir la
nocio seguent: es diu que e s una arrel de p(x) amb multiplicitat m si
p(x) = (x )m q(x)

amb q() 6= 0 .

Aix, direm que e s simple si m = 1, i multiple (doble, triple, ...) si m > 1.

Per completar lestudi de les arrels i la descomposicio dels polinomis en factors, ser`a u til distingir entre els polinomis de coeficients reals, el conjunt dels quals representarem per R[x], i
els polinomis de coeficients complexos, que formaran el conjunt denotat per C[x]. Com que es
pot considerar R C, tambe tenim que R[x] C[x]. El motiu de la distincio e s el seguent:
mentre que molts polinomis de coeficients reals no tenen arrels reals (x 2 + 1 nes lexemple mes
senzill), o no tantes com indica el seu grau encara que comptem les multiplicitats, la situacio e s
totalment diferent en el cas de coeficients complexos. El resultat seguent permet afirmar que els
complexos representen la culminacio de les ampliacions de la idea de nombre.
Teorema B.3 (Teorema fonamental de l`algebra.) Tot polinomi no constant de coeficients complexos te alguna arrel complexa.

D EMOSTRACI O . Gauss va donar cinc demostracions diferents daquesta propietat. Lamentablement, cap delles e s prou elemental per inclourela aqu.
Corol.lari B.4 Tot polinomi no constant p(x) de coeficients complexos es descompon totalment
dins de C[x] en producte de factors de primer grau:
p(x) = an (x 1 )(x 2 ) (x n )
o, agrupant les arrels segons les seves multiplicitats,
p(x) = an (x 1 )m 1 (x 2 )m 2 (x r )mr .
En particular, tot polinomi no constant te, comptant les multiplicitats, tantes arrels com indica el
seu grau:
m 1 + m 2 + + mr = n .

D EMOSTRACI O . Nomes cal aplicar reiteradament el teorema fonamental de l`algebra i el teorema del factor.

170

Polinomis

R. Amer i F. Carreras

El teorema de Gauss tambe dona informacio sobre els polinomis de coeficients reals, i ens ocuparem immediatament daquesta questio.
Lema B.5 Si tenim un polinomi no constant p(x) R[x], i C e s una arrel de p(x) amb
multiplicitat m, el complex conjugat tambe e s una arrel de p(x), i amb la mateixa multiplicitat
m.
D EMOSTRACI O . La conjugacio, e s a dir, laplicacio
= u + iv

= u iv ,

conserva les quatre operacions aritm`etiques. Denotarem per q(x) el polinomi que resulta de
conjugar els coeficientes de q(x). Conjugant les relacions
p(x) = (x )m q(x)

q() 6= 0

q() 6= 0 ,

obtenim les corresponents a ,


p(x) = (x )m q(x)
i per tant e s una arrel de p(x) amb multiplicitat m.
Corol.lari B.6 Tot polinomi no constant p(x) de coeficients reals es descompon totalment dins
de R[x] en producte de factors de primer grau o de segon grau amb discriminant negatiu:
p(x) = an (x 1 )m 1 (x r )mr (x 2 + b1 x + c1 )n 1 (x 2 + bs x + cs )n s ,
amb 1 , . . . , r , b1 , c1 , . . . , bs , cs R i b j 2 4c j < 0 per a j = 1, . . . , s.
D EMOSTRACI O . Si = u + iv i = u iv son arrels complexes conjugades de p(x), podem
agrupar els factors corresponents aix:
(x )(x ) = (x u iv)(x u + iv) = (x u)2 + v 2
= x 2 2ux + (u 2 + v 2 ) = x 2 + bx + c ,
on b = 2u, c = u 2 + v 2 i b2 4c < 0. Partim ara de la descomposicio de p(x) a C[x], que
segons el lema anterior ser`a de la forma
p(x) = an (x 1 )m 1 (x r )mr (x 1 )n 1 (x 1 )n 1 (x s )n s (x s )n s ,
amb 1 , . . . , r R i 1 , . . . , s
/ R. Agrupant de la manera indicada abans cada arrel complexa amb la seva conjugada resulta la descomposicio de p(x) dins de R[x].

171

R. Amer i F. Carreras

Un aspecte b`asic dels polinomis e s la seva interpretacio com a funcions. Cada polinomi p(x)
defineix una funcio, denotada per p, que assigna a cada el valor num`eric p(). El domini de
la funcio p pot ser R o C segons convingui; el recorregut, sempre dins de C, es trobar`a dins de
R o no depenent del domini escollit i del tipus de coeficients del polinomi (tots reals o algun
complex). Es important notar que si p e s la funcio nulla aleshores p(x) e s el polinomi 0; per
tant, polinomis diferents defineixen funcions diferents. Els polinomis de grau 0 sanomenen
constants perqu`e ho son les funcions associades.
Si p(x) R[x], habitualment es considera p : R R. Aquesta funcio polin`omica e s contnua
i, de fet, infinitament derivable.
Exemples B.7 (a) Tot polinomi p(x) R[x] de grau senar te alguna arrel real. Aix`o e s conseque` ncia de laparellament darrels conjugades, per`o tambe es pot demostrar considerant la
funcio polin`omica p. Suposant an > 0 observem que
lim p(t) =

lim p(t) = + ,

t+

perqu`e el grau de p(x) e s senar. Per tant, existeixen nombres t0 i t1 tals que p(t0 ) < 0 i p(t1 ) > 0.
Aplicant el teorema de Bolzano, es dedueix que p() = 0 per a algun (t0 , t1 ).
(b) e s una arrel del polinomi p(x) amb multiplicitat m si, i nomes si,
p() = Dp() = D 2 p() = = D m1 p() = 0

per`o

D m p() 6= 0 ,

on D i p() representa la i`essima derivada de la funcio p en el punt . La demostracio daquesta


propietat e s senzilla, observant que si e s una arrel de p(x) amb multiplicitat m aleshores tambe
ho e s de Dp(x) amb multiplicitat m 1.

C`alcul elemental darrels. Recordarem alguns criteris senzills per a lobtencio darrels de polinomis. En primer lloc, si p(x) e s un polinomi de coeficients enters, les arrels enteres de p(x)
son divisors del terme independent a0 . Aix`o suposa un nombre finit de proves amb la regla de
Ruffini. Les arrels racionals de p(x) son tals que, escrites en forma irreductible r/s, el numerador r ha de ser un divisor del terme independent a0 i el denominador s ha de serho del coeficient
principal an ; per tant, tambe en aquest cas el nombre de proves e s finit.
Si p(x) e s un polinomi de coeficients racionals, e s f`acil trobar un polinomi de coeficients enters amb les mateixes arrels que p(x), al qual podrem aplicar les idees anteriors: nomes cal
multiplicar p(x) pel denominador comu de tots els seus coeficients.
Per al c`alcul darrels irracionals, esmentem nomes el m`etode de les aproximacions successives
basat en el teorema de Bolzano (si e s possible, conve fer primer un esboc de la gr`afica de p).

172

R. Amer i F. Carreras

Polinomis

Finalment, recordem algunes idees elementals que sovint son u tils per a la descomposicio dun
polinomi en factors: les anomenades igualtats notables, la resolucio dequacions de segon grau
(aplicable tambe a les equacions biquadrades) i treure factor comu la m`axima pot`encia possible
de x quan el terme independent e s zero.
(Per desgr`acia, cap de les demostracions del teorema fonamental de l`algebra e s constructiva, en
el sentit de permetre la localitzacio efectiva de larrel de la qual sen garanteix lexist`encia.)
Lultima propietat que indicarem e s un resultat interessant, sobre tot per a lestudi de les formes
quadr`atiques i les qu`adriques, ja que en aquests dos casos treballem amb el polinomi caracterstic
duna matriu sim`etrica que, segons el teorema espectral, sabem que te totes les arrels reals.
Teorema B.8 (Teorema de Descartes.) Si p(x) e s un polinomi de coeficients reals i totes les
arrels de p(x) son reals, el nombre de variacions de signe entre coeficients consecutius (no
nuls, l`ogicament) de p(x) coincideix amb el nombre darrels positives de p(x) comptant les
multiplicitats.
D EMOSTRACI O . La justificacio no e s difcil, i es pot trobar a qualsevol tractat d`algebra que
inclogui un estudi detallat dels polinomis.
Exemples B.9 (a) El polinomi p(x) = x 3 16x 2 9x + 28 e s el polinomi caracterstic duna
matriu sim`etrica, i per tant te tres arrels reals. Com que no te larrel 0 i presenta dues variacions
de signe, sabem que tindr`a dues arrels positives i una arrel negativa (el lector pot confirmar que
les arrels de p(x) son, aproximadament, 10 54, 10 10 i 160 44).
(b) Per la mateixa rao, sabem que el polinomi q(x) = x 5 8x 3 + 4x 2 te cinc arrels reals. Hi ha
dues variacions de signe, per tant te dues arrels positives, larrel 0 doble i una arrel negativa.
(c) En canvi, el polinomi r (x) = 2x 3 6x + 5 te una sola arrel real i dues complexes conjugades.
Laplicacio (incorrecta) del teorema de Descartes diria que te dues arrels positives i una negativa.

Bibliografia

[1] Amer, R. i Domnguez, J. M.

`
Algebra
Lineal. Problemes resolts.
Ed. UPC. Barcelona. 1992.
[2] Amer, R. Carreras, F. i Tudur, J.

`
Algebra
Lineal. Problemes, exercicis i questions.
Ed. Cardellach C`opies. Terrassa. 1998.
[3] Anton, H.

Introduccion al a lgebra lineal.


Ed. Limusa. Mexico. 1989.
[4] Burgos, J. de

Algebra Lineal.
Ed. McGraw Hill. Madrid. 1993.
[5] Castellet, M. i Llerena, I.

`
Algebra
lineal i geometria.
Publicacions de la Universitat Aut`onoma de Barcelona. 1988.
[6] Granero, F.

Algebra y geometra analtica.


Ed. McGraw. Madrid. 1985.
[7] Lang, S.

Algebra lineal.
Ed. AddisonWesley. Mexico. 1986.

174

R. Amer i F. Carreras

[8] Moreno, J. M.

Una introduccion al a lgebra lineal elemental.


Dep. de Matematicas. U.A.B. Bellaterra. 1988.
[9] Xambo, S.

Algebra lineal y geometrias lineales (Tomos I y II).


Ed. Eunibar. Barcelona.

Bibliografia

Index alfab`etic

adjunt dun coeficient, 25


angle
de dos vectors, 56
entre varietats lineals, 132
orientat en el pla, 62
antiimatge, 68
a` rea
dun parallelogram, 136
dun triangle, 136
arrel
multiplicitat duna, 169
simple, 169
baricentre, 124
base, 37
can`onica de Rn , 38
negativa, 62
ortogonal, 53
ortonormal, 55
positiva, 62
c`alcul
darrels de polinomis, 171
c`alcul de determinants
m`etode de Gauss, 24
regla de Laplace, 26
regla de Sarrus, 20

c`alcul de la inversa
m`etode de GaussJordan, 17
per determinants, 27
canvi de base
en tensors, 107
en un espai vectorial, 47, 48
formula matricial, 48
matriu del, 48
per a endomorfismes, 71
per a transformacions lineals, 71
canvi de refer`encia, 124
cilindre
ellptic imaginari, 158
ellptic real, 158
hiperb`olic, 158
parab`olic, 158
circumfer`encia, 140, 148
classificacio
de c`oniques, 142, 145, 149
de qu`adriques, 159
components dun vector en una base, 37
con
imaginari, 157
real, 157
c`onica, 142
canvi de coordenades, 143
degenerada, 148

176

equacio matricial, 142


equacio matricial compacta, 142
equacio reduda, 142
invariants, 142, 144
invariants estrictes, 145
no degenerada, 148
coordenades, 123
coordenades polars, 62
cosinus directors, 56
desigualtat
de Schwarz, 54
triangular, 54, 132
determinants
definicio, 19
de Vandermonde, 29
formula del producte, 23
propietats, 2123
diagonalitzacio
condicions, 8386
de matrius, 89
dendomorfismes, 81
de tensors i formes, 109
dimensio dun espai vectorial, 40
dist`ancia
dun punt a una recta, 135
dun punt a un pla, 133
entre dos punts, 132
entre dues varietats lineals, 133
entre rectes que sencreuen, 134
entre varietats paralleles, 134
entre varietats secants, 134
diviso entera de polinomis, 167
doble producte vectorial, 64
eixos
principals din`ercia, 110
ellipse, 139
centre, 140
dist`ancia focal, 140
eix principal, 140
eix secundari, 140

R. Amer i F. Carreras

Index
alfab`etic

equacio can`onica, 140


focus, 139
imagin`aria, 148
real, 148
semieix major, 139
ellipsoide
imaginari, 156
real, 156
endomorfisme, 68
diagonalitzable, 81, 82
identitat, 75
isometria, 77
sim`etric, 87
equacio
duna recta, 125
dun pla, 125
reduda duna c`onica, 142
equacio diferencial, 98
homog`enia, 98
lineal, 98
lineal amb coeficients constants, 98
equival`encia de sistemes dequacions, 10
error quadr`atic, 59
esfera, 156
espai
euclidi`a puntual, 121
vectorial euclidi`a, 122
espai vectorial, 34
complex, 34
euclidi`a, 52
num`eric, 34
orientacio dun, 61
expressio
euclidiana af, 112
euclidiana can`onica, 110
extrems locals
m`axim, 116
mnim, 116
feix de plans, 129
forma
hessiana, 105

R. Amer i F. Carreras

lineal, 116
quadr`atica, 106
forma quadr`atica
associada a un tensor, 107
definida negativa, 113, 114
definida positiva, 113, 114
no definida, 113
semidefinida negativa, 113
semidefinida positiva, 113
formula
de Grassmann, 46
de Taylor, 116
formula del canvi de base
en transformacions lineals, 71
funcio polin`omica, 171
gir en el pla orientat, 70, 93
hip`erbola, 140, 148
asmptotes, 141
equacio can`onica, 140
equil`atera, 141, 148
focus, 140
semieix real, 140
hiperboloide
de dues fulles, 157
duna fulla, 157
imatge, 67
duna transformacio lineal, 73
ndexs din`ercia, 111, 112
interpolacio polin`omica, 29
inversa
duna matriu, 16
duna transformacio, 68
isometria vectorial, 77
directa, 78
inversa, 78
isometries
classificacio, 92
de lespai, 93

177

del pla, 92
llei din`ercia de Sylvester, 111
llocs geom`etrics, 152
matriu
adjunta, 27
ampliada, 30
columna, 14
conjugada, 89
definicio, 13
diagonal, 21
diagonalitzable, 89
diagonalitzable sobre els complexos, 89
diagonalitzable sobre els reals, 89
dordre n, 14
duna transformacio lineal, 69
dun endomorfisme, 70
dun tensor, 107
fila, 14
invertible, 16
m n, 13
ortogonal, 16
quadrada, 14
regular, 16, 27
sim`etrica, 16
simplificable, 16
singular, 17
transposada, 15
triangular inferior, 21
unitat, 15
matrius quadrades, 16
menors diagonals, 83
menors duna matriu, 30
m`etode de Gram-Schmidt, 52
m`etode dels mnims quadrats, 58
mitjana aritm`etica, 58
moment cin`etic, 106
moments din`ercia, 109
norma dun vector, 54
nucli duna transformacio lineal, 73

178

operacions amb endomorfismes, 75


composicio, 75
producte per escalars, 75
suma, 75
operacions amb matrius
difer`encia, 14
pot`encies, 91
producte, 14
producte per escalars, 14
propietats, 1415
suma, 14
operacions amb vectors
difer`encia, 34
producte escalar, 51
producte per un escalar, 33
producte vectorial, 63
suma, 33
orientacio
de plans a lespai, 63
despais vectorials, 61
par`abola, 141, 148
equacio can`onica, 141
focus, 141
par`ametre, 141
recta directriu, 141
v`ertex, 141
paraboloide
ellptic, 157
hiperb`olic, 157
parell de plans
imaginaris parallels, 159
imaginaris secants, 159
reals parallels, 159
reals secants, 158
parell de rectes
imagin`aries paralleles, 149
imagin`aries secants, 149
reals paralleles, 149
reals secants, 148
permutacio, 163
identitat, 163

R. Amer i F. Carreras

Index
alfab`etic

inversa, 164
inversio, 163
signe duna, 163
pivot, 11
pla doble, 159
polinomi, 167
arrels, 168
constant, 167
ndex dun, 167
valor num`eric dun, 168
polinomi caracterstic, 83
producte de permutacions, 164
producte escalar, 51
formula cl`assica, 56
producte mixt, 65
productes din`ercia, 109
producte vectorial, 63
projeccio ortogonal
com a endomorfisme, 74, 75
dun punt sobre una varietat lineal, 131
dun vector sobre un subespai, 57
propietat del parallelogram, 123
punt de sella, 118
punt mitj`a, 130
qu`adrica, 154
equacio matricial, 154
equacio matricial compacta, 154
equacio reduda, 156
invariants, 155
invariants estrictes, 155
molt degenerada, 158
no generada, 156
poc degenerada, 157
rang
duna matriu, 40, 42
duna transformacio lineal, 73
dun conjunt de vectors, 40
per columnes, 41
per files, 41
recta

R. Amer i F. Carreras

de regressio, 60
recta doble, 149
refer`encia cartesiana, 123
rectangular, 123
regla
de Ruffini, 167
regressio
lineal, 60
quadr`atica, 60
resolucio de sistemes, 10
m`etode de Gauss, 10
m`etode de Gauss-Jordan, 11
regla de Cramer, 28
regla del pivot, 10
solucio general, 12
solucio trivial, 13
restriccio dun tensor a un subespai, 108
rotacio al voltant dun vector, 76, 94
simetria
axial a lespai, 95
axial en el pla, 70, 93
com a endomorfisme, 74, 75
plana, 95
sim`etric
dun punt respecte a una varietat lineal,
131
dun vector respecte a un subespai, 57
sistema dequacions diferencials, 100
sistema dequacions lineals, 9
coeficients, 9
compatible, 10
determinat, 10
indeterminat, 10
de Cramer, 28
expressio matricial, 14
forma diagonal, 11
forma triangular, 10
graus de llibertat, 10
homogeni, 13
inc`ognites, 9
incompatible, 10

179

m n, 10
sobredeterminat, 59
termes independents, 9
subespais vectorials
interseccio, 46
ortogonals, 52
suma, 46
suma directa, 46
suplementaris, 46
subespai vectorial, 35
engendrat per un conjunt de vectors, 38
equacions implcites, 35, 43
sistema de generadors, 37
suplementari dun, 46
suplementari ortogonal dun, 53
tensor, 106
components principals, 107
components secund`aries, 107
de Minkowski, 109
din`ercia, 106
teorema
caracteritzacio de les transformacions lineals, 68
caracteritzacio dels tensors, 107
criteri de Sylvester, 114
de Descartes, 172
de la projeccio ortogonal, 57
de les bases, 39
del factor, 168
del residu, 168
dels sistemes homogenis, 13
de Pit`agores, 54, 132
de Rouche-Frobenius, 42, 59
de Steinitz, 39
espectral, 87
espectral generalitzat, 90
fonamental de l`algebra, 169
traca duna matriu quadrada, 83
transformacio, 67
bijectiva, 68
exhaustiva, 68

180

injectiva, 68
inversa, 68
lineal, 68
transposicio, 163
b`asica, 163
valor propi, 82
varietats lineals, 125
paralleles, 127
perpendiculars, 130
posicions relatives, 127130
vector
de posicio, 123
lliure, 34
origen i extrem dun, 122
propi, 82
unitari, 55
vectors
combinacio lineal, 35
linealment dependents, 35
linealment independents, 35
ortogonals, 52
relacio de depend`encia, 36
v`ertexs duna c`onica, 141
volum
dun paralleleppede, 137
dun tetr`aedre, 136

R. Amer i F. Carreras

Index
alfab`etic

You might also like