Curs Algebra Lineal PDF

`
Curs dAlgebra
Lineal
Rafel Amer Ramon

Francesc Carreras Escobar
Departament de Matem`
atica Aplicada II
Escola T`
ecnica Superior dEnginyeries
Industrial i Aeron`
autica de Terrassa
2009 Rafel Amer i Francesc Carreras

Aquesta obra es distribueix sota la llicència creative-commons amb les condicions
Reconeixement-No comercial-Compartir de la versi
o 2.5 daquesta llicència. Resumint:
Sou lliure de:
copiar, distribuir i comunicar p
ublicament lobra,
fer-ne obres derivades,
amb les condicions seg
uents:
Reconeixement. Heu de reconèixer els crèdits de lobra de la manera especificada

per lautor o el llicenciador (per`
o no duna manera que suggereixi que us donen suport
o rebeu suport per l
us que feu lobra).
No comercial. No podeu utilitzar aquesta obra per a finalitats comercials.
Compartir amb la mateixa llic`
encia. Si altereu o transformeu aquesta obra, o
en genereu obres derivades, nomes podeu distribuir lobra generada amb una llicència
idèntica a aquesta.
Quan reutilitzeu o distribuu lobra, heu de deixar ben clar els termes de la llicència de
lobra.
Alguna daquestes condicions pot no aplicar-se si obteniu el perms del titular dels
drets dautor.
No hi ha res en aquesta llicència que menyscabi o restringeixi els drets morals de
lautor.
Podeu trobar el text complet de la llicència a ladreca
http://creativecommons.org/licenses/by-nc-sa/2.5/es/legalcode.ca
Escola Tècnica Superior dEnginyeries Industrial i Aeron`
autica de Terrassa
Colom 11
08222 Terrassa
rafel.amer@upc.edu
Introduccio
Aquest llibre recull lexperiència docent dels autors durant els darrers anys com a professors dàlgebra
lineal a lEscola Tècnica Superior dEnginyeries Industrial i Aeronàutica de Terrassa.
El nou pla destudis daquest centre, implantat a partir del curs 9394, ha redut considerablement
el nombre dhores de classe destinades a aquesta assignatura. Això ha exigit, mes que retallar el
programa, exposarlo duna forma diferent que pot provocar distorsions en ladquisicio dhàbits
cientfics indispensables per a un tècnic.
Aix doncs, hem cregut convenient proporcionar a lalumne un text ajustat al programa oficial.
Pensem que lajudarà a assimilar els conceptes i resultats i ens permetrà dedicar les classes mes a
la discussio didees que no pas a la pura transcripcio dapunts.
Hem volgut posar de manifest els aspectes formatius de làlgebra lineal i la utilitat de les seves
aplicacions pràctiques. El temari inclou, duna banda, els fonaments: sistemes dequacions lineals,
càlcul matricial, determinants, espais vectorials i transformacions lineals. De laltra, aplicacions
de caire geomètric: producte escalar i nocions derivades, teoria de la diagonalitzacio, tensors i
lestudi analtic de les figures de primer i segon grau en el pla i a lespai tridimensional.
Fem constar que no hem inclòs exercicis. Les referències [1] i [2] contenen colleccions de problemes, resolts i proposats respectivament, ajustades al nostre temari. En canvi, ens ha semblat
oportu afegir, al final, un diccionari amb tots els termes definits en el llibre per facilitarne la
localitzacio.
Assumim la responsabilitat exclusiva dels errors que, malgrat les revisions successives, romanen
encara en el text. Dit això, agram els comentaris constructius de diversos companys de la Seccio
de Terrassa del Departament de Matemàtica Aplicada II.
Esperem que aquesta obra sigui u til als estudiants. Que els estalvi el temps i lesforc necessaris
per cercar cada tema en una bibliografia heterogènia quant a nomenclatura, notacio, contingut i
punts de vista. I que, despres daquesta primera funcio, es converteixi en un llibre de prestatge,
es a dir, sempre a mà, per trobar amb facilitat aquella idea o aquell procediment que, ai las!, tan
sovint sescapen de la memòria.
Setembre de 1997
Rafel Amer i Francesc Carreras
Index
Introduccio
Index
1 Sistemes dequacions i matrius
1.1 Sistemes dequacions lineals . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Càlcul matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2
Determinants
19
2.1 Definicio i propietats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2 Càlcul de determinants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Matrius regulars i sistemes dequacions . . . . . . . . . . . . . . . . . . . . . . 26
3
Espais vectorials
3.1 Lespai vectorial numèric R
33
n
. . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2 Dependència lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3 Dimensio i rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4 Subespais vectorials de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.5 Canvis de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
R. Amer i F. Carreras
Lestructura euclidiana de Rn
Index
51
4.1 El producte escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.2 Norma, angle i projeccio ortogonal . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 El mètode dels mnims quadrats . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4 Orientacio i producte vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5
Transformacions lineals
67
5.1 Definicions i exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2 Canvis de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.3 Nucli, imatge i rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.4 Operacions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.5 Endomorfismes i producte escalar . . . . . . . . . . . . . . . . . . . . . . . . . 75
6
Diagonalitzacio de matrius
81
6.1 Endomorfismes diagonalitzables . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.2 Condicions de diagonalitzacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.3 Diagonalitzacio de matrius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.4 Classificacio de les isometries . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.5 Sistemes dequacions diferencials lineals . . . . . . . . . . . . . . . . . . . . . 98
7
Tensors i formes quadràtiques
105
7.1 Introduccio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

7.2 Diagonalitzacio de tensors i formes . . . . . . . . . . . . . . . . . . . . . . . . 109
7.3 Indexs dinèrcia i classificacio de formes . . . . . . . . . . . . . . . . . . . . . 111
7.4 Extrems locals de les funcions de diverses variables . . . . . . . . . . . . . . . 115
8
Geometria lineal
121
8.1 Lespai euclidià puntual tridimensional . . . . . . . . . . . . . . . . . . . . . . 121

8.2 Varietats lineals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.3 Posicions relatives de les varietats lineals . . . . . . . . . . . . . . . . . . . . . 127
8.4 Angles, distàncies, a` rees i volums . . . . . . . . . . . . . . . . . . . . . . . . . 132
9
Corbes i superfcies de segon grau
139
9.1 Ellipse, hipèrbola i paràbola . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
9.2 Classificacio de les còniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

9.3 Llocs geomètrics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
9.4 Quàdriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A Permutacions
163
B Polinomis
167
Bibliografia
173
Index
alfabètic
175
Bibliografia
1
Sistemes dequacions i matrius
Les questions plantejades per làlgebra lineal i les seves aplicacions es formulen sovint en llenguatge matricial; sovint, tambe, condueixen a lestudi de sistemes dequacions lineals. La primera seccio daquest captol recull les definicions bàsiques sobre sistemes i una de les tècniques
principals per resoldrels: el mètode de Gauss, automatitzat per la regla del pivot, amb la variant
anomenada mètode de Gauss-Jordan (laltre procediment habitual, basat en el càlcul de determinants, sexposa en el captol 2). La segona seccio es dedica a les nocions fonamentals sobre
matrius i càlcul matricial.
1.1 Sistemes dequacions lineals

Un sistema dequacions lineals e s una colleccio dequacions de la forma
a11 x1 + a12 x2 + + a1n xn = b1
a x + a x + + a x
= b
21 1
22 2
2n n
..................................
am1 x1 + am2 x2 + + amn xn = bm

on els coeficients ai j , els termes independents b1 , b2 , . . . , bm i els valors que han de prendre les
incògnites x1 , x2 , . . . , xn son nombres reals (o, mes en general, complexos). El primer subndex
10
de cada coeficient indica lequacio on apareix, i el segon la incògnita a la que multiplica, mentre
que el subndex de cada terme independent es refereix a lequacio. El sistema anterior e s un
sistema amb m equacions i n incògnites o, simplement, un sistema m n.
Un sistema e s compatible si admet alguna solucio (una o mes), i e s incompatible si no nadmet
cap. Un sistema compatible e s determinat si nomes admet una solucio, i e s indeterminat si en te
mes duna (això voldrà dir que en te infinites). Resoldre un sistema compatible significa, en el
cas determinat, donar el valor u nic de cada incògnita; en el cas indeterminat, donar una expressio
explcita de les incògnites en funcio de certs paràmetres lliures (que habitualment coincideixen
amb algunes de les mateixes incògnites), de manera que assignant valors arbitraris a aquests
paràmetres es trobin totes les solucions.
Dos sistemes amb les mateixes incògnites (però potser amb diferent nombre dequacions) son
equivalents si admeten les mateixes solucions (que poden ser cap, una o mes duna).
Proposicio 1.1 (Operacions elementals.) Les operacions seguents transformen un sistema en un

altre sistema equivalent:
(a) Sumar o restar una equacio a una altra.
(b) Multiplicar o dividir una equacio per un nombre diferent de zero.
(c) Intercanviar dues equacions.
(d) Canviar lordre de les incògnites en el sistema.
D EMOSTRACI O . Tot e s de comprovacio immediata.
Mètode de Gauss. Tot sistema dequacions lineals es pot transformar, mitjancant operacions
elementals, en un sistema equivalent de forma triangular, e s a dir, tal que el primer coeficient no
nul de cada equacio correspongui a una incògnita posterior a la del primer coeficient no nul de
lequacio anterior. El mètode de Gauss saplica a cegues, sense saber de quin tipus e s el sistema
abans de comencar els càlculs. En el captol 3, el teorema de Rouche-Frobenius establirà els
criteris per classificar a priori un sistema. Daltra banda, el nombre dincògnites que queden
lliures en resoldre un sistema indeterminat no depèn de la manera daplicar el mètode de Gauss
(o un altre procediment): això quedarà demostrat tambe en el captol 3 i permetrà anomenar-lo
el nombre de graus de llibertat del sistema. Una sistematitzacio dels càlculs que comporta el
mètode de Gauss, forca u til a la pràctica, sexposa tot seguit.
Proposicio 1.2 (Regla del pivot.) Si ai j 6= 0 e s un coeficient tal que ai h = 0 per a tot h < j, i es
11
canvien els coeficients i el terme independent duna altra equacio, la k-èssima, prenent
0
ak`
= ai j ak` ak j ai`
per a
` = 1, 2, . . . , n,
bk0 = ai j bk ak j bi ,
resulta un sistema equivalent a loriginal (es diu que ai j ha estat el pivot daquesta transformacio).
Aplicant reiteradament aquesta idea sarriba a un sistema de forma triangular.
D EMOSTRACI O . Nomes cal observar que els canvis proposats equivalen a multiplicar lequacio k-èssima per ai j i restar-li lequacio i-èssima multiplicada per ak j , que els zeros obtinguts
prèviament en columnes h < j es conserven i que, ara, el coeficient de la incògnita x j a lequacio
k-èssima ja e s tambe zero.
Mètode de Gauss-Jordan. Transformant amb la regla del pivot no nomes les equacions posteriors sino tambe les precedents, tot sistema dequacions lineals es converteix en un sistema equivalent de forma diagonal, e s a dir, on tots els coeficients de les columnes dels pivots (excepte
ells mateixos) siguin zero. Això ens estalvia la progressiva substitucio de les incògnites ja determinades en les equacions precedents del sistema triangular.
Exemples 1.3 (a) Considerem el sistema
x + 4y + 3z = 1
2x + 5y + 4z = 4 .
x 2y 2z = 3
Escrivint nomes, com e s habitual, els coeficients i els termes independents en la disposicio files
columnes que mes endavant denominarem matriu, i aplicant repetidament operacions elementals
seguint el mètode de Gauss, tenim la successio de sistemes equivalents seguent:
1
4
3
2
5
4
1 2 2

1
1
4
3

4 ' 0 3 2

3
0 6 5
1
1 4 3 1

2 ' 0 3 2 2 .

2
0 0 3 6
En el darrer sistema resulta, de la tercera equacio, z = 2; substituint a lequacio anterior, 3y+4 =

2, e s a dir, y = 2; i substituint, finalment, a la primera, x 8 + 6 = 1, don x = 3. Per tant,
x = 3,
e s la solucio (unica) del sistema original.
y = 2 ,
z=2
12
Si volem aplicar el mètode de Gauss-Jordan (fent tambe u s de la regla del pivot), la successio de
sistemes, on marquem els pivots que fem servir, e s ara la seguent:

1
4
3 1
1
4
3 1
2
5
4 4 ' 0 3 2 2 '
1 2 2 3
0 6 5 2

3
0 1 11
9
0 0 27
0 3 2
2 ' 0 9 0 18 .

6
0
0 3
6
0
0 3
Aix obtenim 9x = 27, 9y = 18, 3z = 6, don x = 3, y = 2 i z = 2.
(b) Resoldrem ara el sistema
x + y + z = 0
2x + 3y 2z = 0 .
x + 2y 3z = 0
Aplicant novament el mètode de Gauss tenim

1 1
1 0
1 1
1 0
1 1
1 0
2 3 2 0 ' 0 1 4 0 ' 0 1 4 0 .

0 0
0 0
0 1 4 0
1 2 3 0
De la segona equacio del sistema final surt y = 4z, i substituint a la primera queda x +4z+z = 0,
don x = 5z. Les expressions
x = 5z ,
y = 4z ,
z=z
donen la solucio general del sistema original, en la que la incògnita z fa el paper simultani de
paràmetre lliure: donant valors a z obtenim les infinites solucions del sistema.
Fent servir el mètode de Gauss-Jordan i la regla del pivot com a lexemple anterior, tenim

1 1
1 0
1 0
5 0
1 1
1 0
2 3 2 0 ' 0 1 4 0 ' 0 1 4 0 .

0 0
0 0
1 2 3 0
0 1 4 0
De les equacions x + 5z = 0 i y 4z = 0 resulta novament x = 5z i y = 4z (z = z, paràmetre
lliure).
(c) Estudiem finalment el sistema
x + y + z = 1
x + 2y + z = 3 .
2x + 3y + 2z = 3
13
Aplicant el mètode de Gauss obtenim

1 1 1 1
1 1 1 1
1 1 1 1
1 2 1 3 '0 1 0 2 '0 1 0 2 .

2 3 2 3
0 1 0 1
0 0 0 1
La darrera equacio del sistema final e s 0 = 1, per tant aquest sistema e s incompatible i loriginal tambe.
Es diu que un sistema e s homogeni si

b1 = b2 = = bm = 0 .
Tot sistema homogeni e s compatible, ja que admet la solucio (anomenada solucio trivial)
x1 = x2 = = xn = 0 .
Els sistemes homogenis seran els que haurem de resoldre amb mes freque` ncia, i els mes interessants son evidentment els indeterminats: lultim resultat daquesta seccio estableix una propietat
bàsica dels sistemes homogenis.
Teorema 1.4 Tot sistema homogeni amb mes incògnites que equacions e s indeterminat.
D EMOSTRACI O . Si n > m, el nombre de pivots necessaris per a triangular el sistema serà
r m < n, per tant, al menys una incògnita passarà a ser paràmetre lliure.
1.2 Càlcul matricial

Una matriu de m files i n columnes amb coeficients reals e s una funcio
A : {1, 2, . . . , m} {1, 2, . . . , n} R,
que assigna a cada parell (i, j) un nombre real ai j (la definicio per a matrius amb coeficients
habitual representar una matriu A com
complexos e s anàloga). Es
a11 a12 a1n

a21 a22 a2n
A=
...................
am1 am2 amn
posant el coeficient ai j a la fila i i la columna j. Es diu que A e s una matriu del tipus m n.
14
Atenent a la definicio, cal observar que una matriu A del tipus m n i una matriu B del tipus
p q son iguals (escriurem A = B) si, i nomes si, m = p, n = q i ai j = bi j per a tot i i
tot j. El conjunt de totes les matrius del tipus m n amb coeficients reals es representa per
Mmn (R) (i per Mmn (C) el de les de coeficients complexos). Son especialment frequents les
matrius columna (tipus m 1), les matrius fila (tipus 1 n) i les matrius quadrades (tipus n n
o dordre n).
En cada un dels conjunts Mmn (R) es defineixen dues operacions internes: la suma, on S =
A + B e s la matriu donada per si j = ai j + bi j , i el producte per un nombre real, on P = t A e s la
matriu donada per pi j = tai j , amb t R. Les propietats essencials daquestes operacions, totes
fàcils de comprovar, son les seguents:
(a) Associativa de la suma: A + (B + C) = (A + B) + C.
(b) Commutativa de la suma: A + B = B + A.
(c) Neutre de la suma: existeix una matriu 0 tal que A + 0 = A per a tota A.
(d) Oposats per a la suma: per a cada matriu A, existeix una matriu A tal que A +(A) = 0.
(e) Distributiva del producte per a la suma de matrius: t (A + B) = t A + t B.
(f) Distributiva del producte per a la suma de nombres: (t + s)A = t A + s A.
(g) Associativitat dels productes: (ts)A = t (s A).
Es defineix la diferència de dues matrius A i B com A B = A+(B). Les propietats daquesta
operacio son les derivades de (a)(g).
La tercera operacio fonamental del càlcul matricial e s la multiplicacio: si A Mmn (R) i
B Mn p (R), el seu producte e s la matriu P = AB Mm p (R) definida per les formules
pi j =
n
X
aik bk j .
k=1
Fem notar que el nombre de columnes de A ha de coincidir amb el de files de B, que la matriu
resultant AB te tantes files com A i tantes columnes com B i, finalment, que loperacio consisteix
en multiplicar escalarment les files de A per les columnes de B.
Exemples 1.5 (a) Tot sistema dequacions lineals es pot representar matricialment en la forma
1
a11 a12 a1n
b1
x2
a21 a22 a2n
b2

,
=
. . . . . . . . . . . . . . . . . . . ...
am1 am2 amn

bm
xn
e s a dir, com AX = B.
15
(b) Si es defineix per a cada cada n la matriu unitat In com la matriu quadrada nn de coeficients
(
1 si i = j
i j =
0 si i 6= j
e s immediat comprovar que Im A = A = AIn per a tota A Mmn (R): es diu que les matrius
unitat son semineutres laterals per al producte.
(c) Considerem les matrius

1 2
A=
,
2 4

B=
1
1
1 1

i
C=
2 4
1
2
Amb elles podem illustrar dos defectes de la multiplicacio de matrius que cal afegir al fet que
no sempre e s possible multiplicar (de vegades es pot calcular AB però no B A). En primer lloc,
AB 6= B A, i això ens diu que no es compleix, en general, la propietat commutativa. Daltra
banda, AC = 0, tot i que A 6= 0 i C 6= 0; per tant, duna relacio del tipus AX = AY no es pot
deduir que X = Y , encara que sigui A 6= 0 i A(X Y ) = 0.
Proposicio 1.6 Quan son factibles els productes que hi intervenen, es compleixen les propietats
seguents:
(a) Associativa: A(BC) = (AB)C.
(b) Distributives: A(B + C) = AB + AC,
(B + C)A = B A + C A.
(c) Compatibilitat: (t A)B = t (AB) = A(t B).

D EMOSTRACI O . Ens limitarem a justificar la part (a) com a illustracio. Observem que si A e s
del tipus m n, B ha de ser del tipus n p i C ha de ser p q. Si posem P = BC, Q = A P,
R = AB i S = RC, caldrà provar que Q = S. En primer lloc, tant Q com S son matrius del
mateix tipus, m q. A mes, els coeficients corresponents coincideixen:
!
p
p
n
n
n X
X
X
X
X
qi j =
ai` p`j =
ai`
b`k ck j =
ai` b`k ck j
`=1
p X
n
X
k=1 `=1
`=1
ai` b`k ck j =
`=1 k=1
k=1
p
n
X
X
k=1
`=1
!
ai` b`k ck j =
p
X
rik ck j = si j .
k=1
La transposada duna matriu A Mmn (R) e s la matriu At Mnm (R) de coeficients ait j = a ji .
obvi que (At )t = A, i el lector pot demostrar, aplicant la tècnica de la proposicio anterior, les
Es
relacions
(A + B)t = At + B t ,
(A)t = At i (AB)t = B t At .
16
Matrius quadrades
Ens concentrarem ara en el conjunt de les matrius quadrades Mnn (R). En primer lloc, aqu
sempre e s possible fer el producte AB, i el resultat e s intern. La matriu unitat In (que denotarem
per I quan no hi hagi confusio sobre n) e s lelement neutre bilateral del producte: AI =
A = I A per a tota A.
Una matriu quadrada A e s simètrica si At = A, i ortogonal si At A = I . Les matrius simètriques
i les ortogonals son les mes interessants en les aplicacions, i seran estudiades amb detall mes
endavant.
Una matriu quadrada A e s regular (o invertible) si existeix B tal que AB = I = B A. De fet, si
AB = I = C A tenim que
B = I B = C AB = C I = C ,
per tant, si A e s regular existeix una u nica matriu, escrita A1 i denominada inversa de A, tal
que A A1 = I = A1 A. A partir daixò e s obvi que A1 e s regular i que (A1 )1 = A. Tambe
e s immediat provar que si A i B son regulars tambe ho e s AB, i (AB)1 = B 1 A1 . A mes,
tota matriu regular A e s simplificable, en el sentit que de la relacio AB = AC (i anàlogament de
B A = C A) es dedueix que B = C, ja que
A1 (AB) = A1 (AC) ,
(A1 A)B = (A1 A)C ,
I B = IC
i per tant B = C.
Exemple 1.7 Una matriu del tipus 2 2

A=
a c
b d
e s regular si, i nomes si, ad bc 6= 0. En aquest cas, la seva inversa e s

1
d c
1
.
A =
a
ad bc b
En efecte: si busquem una matriu B tal que AB = I plantejarem

a c
x z
1 0
=
,
b d
y t
0 1
que condueix a dos sistemes 2 2 amb els mateixos coeficients (els de la matriu A), lun per a
x, y i laltre per a z, t:
)
)
ax + cy = 1
az + ct = 0
.
bx + dy = 0
bz + dt = 1
17
Resolent-los per reduccio arribem a les relacions

(ad bc)x = d ,
(ad bc)y = b ,
(ad bc)z = c
(ad bc)t = a ,
don es dedueix que si ad bc 6= 0 existeix una u nica matriu B que compleix AB = I , i e s

1
d c
B=
.
a
ad bc b
A mes, es pot comprovar fàcilment que B A = I , e s a dir, B e s la inversa de A.
En canvi, si ad bc = 0, la matriu

B=
d c
b
a
compleix AB = 0, i això e s suficient per veure que A no te inversa.

El fet que certes matrius no nulles no tinguin inversa (matrius singulars) e s el darrer defecte
que cal fer notar abans de comentar que, en general, el càlcul matricial presenta moltes analogies
amb el càlcul ordinari amb nombres reals (i complexos) que el lector ja deu haver notat.
Càlcul de la inversa per GaussJordan. Generalitzant lexemple anterior, considerem el problema de trobar (si existeix) la inversa duna matriu quadrada A Mnn (R). Busquem una
matriu B tal que AB = I ; aquesta igualtat condueix a n sistemes n n, tots ells amb els
mateixos coeficients (els de la matriu A) però afectant cada sistema nomes als elements duna
columna de B com a incognites i als de la corresponent columna de la matriu I com a termes independents. Es pot fer un estudi simultani dels n sistemes: nomes cal aplicar el mètode
de Gauss-Jordan, operant amb la regla del pivot sobre les files de la matriu A | I obtinguda per
juxtaposicio.
Si hem trobat n pivots, haurem obtingut una matriu I | B i tindrem que AB = I : en el captol
seguent veurem que aquesta relacio implica que A e s regular i B e s la inversa de A. En canvi, si
han aparegut menys de n pivots, algun dels sistemes e s incompatible i la matriu A no te inversa.
Exemples 1.8 (a) Busquem la inversa de la matriu
1 2 4
A =2 1 4 .
1 1 3
Aplicant el mètode de Gauss-Jordan a la matriu A | I

1
1 2 4 1 0 0
2 1 4 0 1 0 '0

1 1 3 0 0 1
0
tenim
2
3
1
4
4
1
1 0 0

2 1 0

1 0 1
18
3
0
0
3
'
0
0
4
4
1

1

2

1
' 0
0

2
0
3 0
0
1
0
0
' 0 3
1 3
0 0 1

0 0 1
2 4
1 0 2
1 4 .

0 1 1 1
3
3 6 12

6 3 12

1 1 3
Per tant A e s regular i
A1
1
2 4
1 4 .
= 2
1 1
3
(b) Estudiem ara la matriu
1 2 3
A =1 1 2 .
2 3 5
Aplicant el mètode de Gauss-Jordan a la matriu A | I

1
1 2 3 1 0 0
1 1 2 0 1 0 '0

2 3 5 0 0 1
0
tenim
2
1
1
3
1
1
1 0 0

1 1 0

2 0 1
1
0 1 1 2
0
1
0 ,
' 0 1 1 1

0
0
0
1
1 1
i la manca dun tercer pivot (aparicio duna fila de zeros) ens diu que A no e s regular.
19
2
Determinants
El concepte de determinant e s un instrument de gran interès teòric i pràctic per a làlgebra lineal.
Tot i la seva aparent complexitat formal, representa una alternativa als procediments de càlcul
basats en el mètode de Gauss, als quals supera sovint en elegància i profunditat.
Farem servir en aquest captol algunes nocions i resultats sobre permutacions, que hem preferit
recollir en un altre lloc (apèndix A). Per fer ben ntida la notacio, serà convenient escriure com
j
ai el coeficient situat a la fila i i la columna j duna matriu genèrica A Mnn (R), i posar, quan
sigui necessari especificar les files de A,
A = (A1
A2 An ) .
2.1 Definicio i propietats

Donada una matriu quadrada A Mnn (R),
a11 a12 a1n

a1 a2 an
2
2
2
A=
................ ,
an1 an2 ann
20
Determinants
es defineix el seu determinant com el nombre real

1

a1 a12 a1n
1

a a2 an X
2
2
2

=
det(A) =
( )a11 a22 ann ,

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

a 1 a 2 a n Pn
n
n
n
de manera que det(A) e s la suma de n! termes, cada un dels quals e s el producte de n coeficients
de la matriu (un de cada fila i, al mateix temps, un de cada columna) amb un signe + o . En
els casos n = 2 i n = 3 fem servir aquesta definicio directament; a partir de n = 4 cal recorrer a
procediments indirectes que deduirem de les propietats del determinant.
Exemples 2.1 (a) Quan n = 2 nomes hi ha dues permutacions, la identitat i la transposicio
= (1, 2). Per tant, el determinant duna matriu 2 2 e s
1

a a2
1 = a1a2 a2a1 .
1
1 2
1 2
a1 a2
2
2
(b) (Regla de Sarrus.) Per a n = 3 hi ha sis permutacions, tres amb signe positiu,
id = (1, 2, 3) ,
(2, 3, 1) ,
(3, 1, 2),
i tres amb signe negatiu,

(3, 2, 1) ,
(2, 1, 3) ,
(1, 3, 2).
Per tant, el determinant duna matriu 3 3 e s

1
a1 a12 a13
1

a a2 a3 = a1a2a3 + a2a3a1 + a3a1a2 a3a2a1 a2a1a3 a1a3a2 .
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
2
2
2
a1 a2 a3
3
3
3
Una manera de recordar aquests termes e s lesquema seguent:
Signe +
Signe
21
(c) Si una matriu A te una fila de zeros, det(A) = 0. En efecte: si la fila i e s tota nulla, el terme
corresponent a cada Pn conte el factor aii = 0, per tant tots els termes son nuls.
j
(d) Si A e s una matriu triangular inferior, e s a dir, si ai = 0 quan i < j, el seu determinant e s
el producte dels elements de la diagonal principal:
det(A) = a11 a22 ann .
En efecte: per tal que el terme corresponent a una Pn no contingui cap dels zeros situats
sobre la diagonal principal, ha de ser 1 = 1, 2 = 2, i aix successivament fins a n = n; en
definitiva, nomes pot ser el terme de = id, i daqu el valor de det(A). En particular, això
j
tambe e s vàlid si A e s una matriu diagonal, e s a dir, si ai = 0 quan i 6= j. Per exemple,
det(In ) = 1 per a tot n.
Teorema 2.2 (a) El determinant e s una funcio multilineal de les files, e s a dir:
(1) Si una fila es descompon en una suma, Ai = Bi + Ci , aleshores
det(A1 Ai An ) = det(A1 Bi An ) + det(A1 Ci An ) .
(2) Si en una fila es treu un factor comu, Ai = t Bi , aleshores
det(A1 Ai An ) = t det(A1 Bi An ) .
(b) El determinant e s una funcio alternada de les files, e s a dir, si dues files son iguals, Ai = A j ,
el determinant e s zero:
det(A1 Ai A j An ) = 0 .
j
D EMOSTRACI O . (a) Com que Ai = Bi + Ci , tenim que ai = bi + ci per a qualsevol j =

1, 2 . . . , n; per tant, aii = bii + cii per a tota permutacio . Aplicant això a cada terme arribem
immediatament a obtenir la propietat (1). El raonament per a la (2) e s anàleg.
(b) Si = (i, j) sabem que 7 transforma biunvocament el conjunt Pn+ de totes les
permutacions de signe positiu en el conjunt Pn de totes les permutacions de signe negatiu.
Tenint, a mes, en compte que aik = a jk per a tot k, resulta:
det(A1 Ai A j An ) =
i
X h
( )
=
( )a11 aii a j j ann + ( )a1( )1 ai( )i a j j an( )n
Pn+
i
X h
( )a11 aii a j j ann ( )a11 ai j a ji ann

Pn+
X
Pn+
i
h
( ) a11 aii a j j ann a11 ai j a ji ann = 0 .
22
Determinants
Corol.lari 2.3 (a) Si permutem dues files duna matriu A, el determinant canvia de signe:
det(A1 Ai A j An ) = det(A1 A j Ai An ) .
(b) Mes en general, per a qualsevol permutacio ,
det(A1
A2 An ) = ( ) det(A1
A2 An ) .
(c) Si a una fila li sumem o restem un multiple duna altra fila, el determinant no varia:
det(A1 Ai + t A j A j An ) = det(A1 Ai A j An ) .
D EMOSTRACI O . (a) Partint de la relacio
det(A1 Ai + A j Ai + A j An ) = 0
i aplicant la multilinealitat, tenim que
det(A1 Ai Ai An ) + det(A1 Ai A j An )+
+ det(A1 A j Ai An ) + det(A1 A j A j An ) = 0 ,
e s a dir,
det(A1 Ai A j An ) = det(A1 A j Ai An ) ,
ja que els altres dos determinants son nuls.
(b) Com que tota permutacio e s producte de transposicions, = 1 2 p , i ( ) = (1) p ,
posant A = (A1 A2 An ) podem escriure
det(A ) = det(A1 2 p ) = (1) det(A2 p ) = = (1) p det(A) = ( ) det(A) .
(c) Aplicant novament el teorema anterior,
det(A1 Ai + t A j A j An ) =
= det(A1 Ai A j An ) + det(A1 t A j A j An )
= det(A1 Ai A j An ) + t det(A1 A j A j An )
= det(A1 Ai A j An ) .
Teorema 2.4 det(At ) = det(A). En conseque` ncia, totes les propietats del determinant enunciades per files son vàlides tambe per a columnes.
23
D EMOSTRACI O . Si ai e s el coeficient genèric de A i bi el de At , sabem que bi = a ji . Aleshores

X
det(At ) =
( )b11 b22 bnn .
Pn
Reordenant els factors de cada un dels termes segons el superndex tenim que
X
det(At ) =
( )b1 1 1 b2 1 2 bn 1 n
Pn
( 1 )a1
a2
an
Pn
ja que ( ) = ( 1 ). Posem = 1 . Com que el sumatori anterior consta dels n! termes

corresponents a totes les possibles permutacions, podem escriure
X
det(At ) =
( )a11 a22 ann = det(A) .
Pn
Teorema 2.5 (Formula del producte.) det(AB) = det(A) det(B).

D EMOSTRACI O . Si C = AB = (C1
com
C2 Cn ), cada una daquestes files es pot escriure

Ci =
n
X
aik Bk ,
k=1
e s a dir, les files de AB son el que sanomena combinacions lineals de les files de B. Representem per Rn el conjunt de totes les permutacions amb repeticio de 1, 2, . . . , n. Aleshores
det(AB) = det(C1
= det
n
X
C2 Cn )
a1k Bk
k=1
Aplicant la multilinealitat del determinant queda

X
det(AB) =
det(a1r1 Br1
n
X
a2k Bk
k=1
n
X
!
ank Bk
k=1
a2r2 Br2 anrn Brn )
r Rn
a1r1 a2r2 anrn det(Br1
Br2 Brn ) .
r Rn
Dels determinants que intervenen en aquest sumatori, podem eliminar tots els que tenen alguna
fila repetida, i deixar nomes aquells per als quals r e s una permutacio sense repeticions, e s a dir,
24
Determinants
r Pn . Per tant,
det(AB) =
a1r1 a2r2 anrn det(Br1
Br2 Brn )
r Rn
(r )a1r1 a2r2 anrn det(B1
B2 Bn ) = det(A) det(B) .
r Pn
2.2 Càlcul de determinants

Quan n 4, el nombre de termes del sumatori que defineix el determinant e s mes gran o
igual que 24 i creix molt ràpidament, fent impracticable la formula original. Estudiarem ara dos
procediments de càlcul alternatius.
Mètode de Gauss. Operant per files es pot arribar sempre a una matriu triangular, el determinant
de la qual e s, segons hem vist, el producte dels coeficients de la diagonal principal. Nomes cal
tenir en compte tres punts:
(a) Intercanviar dues files canvia el signe del determinant.
(b) Cada vegada que fem servir la regla del pivot per transformar una fila, cal dividir el determinant resultant pel pivot utilitzat.
(c) Si apareix una fila de zeros no cal seguir, perquè el determinant val zero.
Exemple 2.6 Càlcul del determinant

2
1 3
2

3 2
1
4

.
2 3
1 2

2 1
0
1
Marcant els pivots tenim

2
1 3
2

3 2
1
4

2 3
1 2

2 1
0
1

2

10
=
20

0
1
7
4
2

2
1 3
2

1 1 1 0 7 11
2
=

2
0 16 36
2 7 16 0
0
0
0 140

2
3
2
1

11
2 1 1 0 7
=
0
4 4 2 72 0

0
0
3 1
3
11
16
1

2 (7) 16 140
=
= 20 .

2 72 16

2
2
36
11
25
Donada una matriu A Mnn (R) i fixat un coeficient ai , denotarem per Ai la submatriu
dordre n 1 que sobte eliminant la fila i i la columna j de la matriu A. Anomenarem adjunt
j
de ai al determinant daquesta submatriu multiplicat per (1)i+ j :
j
Ai = (1)i+ j det(Ai ) .
fàcil recordar el signe corresponent a cada coeficient amb lajut de lesquema seguent:
Es
+ +
+ +
+ + .
.. .. .. .. . .
.
. . . .
j
Lema 2.7 Si tots els coeficients de la fila i diferents de ai son zero, aleshores
j
det(A) = ai Ai .
D EMOSTRACI O . Fent i 1 canvis de fila i j 1 canvis de columna podem situar el coeficient
j
ai a la posicio (1, 1), conservant la fila i, que passa a ser la primera, i la columna j, que tambe
passa a ser-ho. En aquest proces, la fila i i la columna j shauran desordenat:
j
ai
0
...
0
...
0
a11 a12 . . . a1 . . . a1n
j1
a1 a2 . . . a j . . . an
aj
a11 . . . a1
. . . a1n
2
1
2
2
2
........................
...............................
A=
B= j
,
.
j1
n
1
0 0 . . . aij . . . 0
ai1 ai1
. . . ai1 . . . ai1
........................
...............................
j
j
j1
an1 an2 . . . an . . . ann
an
an1 . . . an
. . . ann
j
Si representem per bi els coeficients de la matriu B, podem escriure

X
det(A) = (1)i+ j det(B) = (1)i+ j
( )b11 b22 bnn .
Pn
El primer coeficient de cada terme e s zero, excepte si 1 = 1. Per tant,

X
X
( )b22 bnn ,
det(B) =
( )b11 b22 bnn = b11
Pn
1 =1
Pn1
ja que les permutacions Pn tals que 1 = 1 son les permutacions dels elements 2, 3, . . . , n.
j
1
Daltra banda, B1
= Ai , per tant,
j
det(A) = (1)i+ j det(B) = (1)i+ j b11 B11 = ai Ai .
26
Determinants
Teorema 2.8 (Regla de Laplace.) Fixada una fila i qualsevol duna matriu A, es compleix que
det(A) = ai1 Ai1 + ai2 Ai2 + + ain Ain .
D EMOSTRACI O . Expressem la fila i com a suma de n files:
Ai = (ai1 0 0) + (0 ai2 . . . 0) + + (0 0 ain ) = Ai1 + Ai2 + + Ain .
Aplicant ara la multilinealitat del determinant i el lema anterior resulta que
det(A) = det(A1 A2 Ai An )
= det(A1 Ai1 An ) + det(A1 Ai2 An )+
+ + det(A1 Ain An )
= ai1 Ai1 + ai2 Ai2 + + ain Ain .
Observacions 2.9 (a) La regla de Laplace e s laltre procediment habitual per a calcular determinants. Tenint en compte que hi ha una regla de Laplace anàloga per columnes, es parla en
general de desenvolupament dun determinant pels coeficients duna lnia.
(b) Si es multipliquen els coeficients duna fila (o columna) pels adjunts duna altra el resultat e s
zero, ja que correspon al càlcul dun determinant amb dues files (o columnes) iguals: si i 6= k,
ai1 A1k + ai2 A2k + + ain Ank = 0,
i això serà dutilitat mes endavant per justificar la formula del càlcul de la inversa.
Exemple 2.10 En el determinant que hem calculat abans pel mètode de Gauss, una vegada
obtinguts els zeros de la primera columna podem aplicar la regla de Laplace, que redueix el
càlcul a aplicar la regla de Sarrus:

2

2

1
3
2
1
3
2

7 11
2
3 2

1
4 1 0 7 11
2 1

= 2 2 4 4 4 = 20 .
2 3
= 2 0 4
4
4
1
2

2 3 1
2 1
0 2
0
1
3 1
2.3 Matrius regulars i sistemes dequacions

Dedicarem la primera part daquesta seccio a caracteritzar les matrius regulars i a donar un procediment per al càlcul de la inversa que e s una alternativa al mètode de Gauss-Jordan. A continuacio, aplicarem els determinants i les matrius regulars a la resolucio dels sistemes dequacions
lineals.
27
Si A Mnn (R), Aad representarà la matriu adjunta de A, que resulta de substituir cada coefij
j
cient ai de A pel seu adjunt Ai .
Teorema 2.11 Una matriu A e s regular si, i nomes si, det(A) 6= 0. En aquest cas
A1 =
1
(Aad )t .
det(A)
D EMOSTRACI O . (H) Si A e s regular, aplicant la formula del producte a la relacio A A1 = I ,

resulta que det(A) det(A1 ) = 1. Per tant, det(A) 6= 0 i, a mes,
det(A1 ) =
1
.
det(A)
(H) Aplicant la regla de Laplace i la segona de les observacions que la segueixen, tenim
A(Aad )t = det(A) I = (Aad )t A ;
per tant, si det(A) 6= 0 podem dividir per det(A) i apareix, efectivament, la inversa de A que
proposa lenunciat.
Exemples 2.12 Considerem les dues matrius que hem estudiat al final del captol anterior.
(a) La matriu
1 2 4
A =2 1 4
1 1 3
e s regular perquè det(A) = 1. Aplicant la formula de la inversa, tenim que
A1
1 2
4
1
2 4
1
2 1
4 = 2
1 4 .
=
1
1
1 3
1 1
3
(b) La matriu
1 2 3
B =1 1 2
2 3 5
no e s regular perquè det(B) = 0, e s a dir, B no te inversa.
28
Determinants
Un sistema dequacions lineals e s un sistema de Cramer si te tantes equacions com incògnites

i la matriu dels coeficients e s regular. Tenint en compte que un sistema dequacions lineals pot
expressar-se matricialment per AX = B, on X e s la matriu columna de les incògnites i B la
dels termes independents, es dedueix que tot sistema de Cramer e s compatible determinat, ja que
lunica solucio e s
X = A1 B .
Una forma alternativa dobtenir aquesta solucio e s la seguent.
Teorema 2.13 (Regla de Cramer.) Si AX = B e s un sistema de Cramer i A1 , A2 , . . . , An son
les columnes de la matriu A Mnn (R), la solucio del sistema ve donada per les formules
xi =
A2 B An )
A 2 Ai A n )
det(A1
det(A1
per a i = 1, 2, . . . , n.
D EMOSTRACI O . La solucio u nica del sistema està formada pels coeficients de la relacio
B = x 1 A1 + x 2 A2 + + x n An .
Aleshores, per a cada i = 1, 2, . . . , n tenim que
det(A
i
^
A B A ) =
2
n
X
det(A
i
^
A x k Ak An )
2
k=1
= xi det(A1
A 2 Ai A n ) ,
don es dedueix que

xi =
det(A1
det(A1
A2 B An )
.
A 2 Ai A n )
Exemples 2.14 (a) Estudiem novament un sistema que en el captol anterior havem resolt pel
mètode de Gauss:
x + 4y + 3z = 1
2x + 5y + 4z = 4 .
x 2y 2z = 3
Lescriurem matricialment posant

1
4
3
x
1
2
5
4 y = 4 .
1 2 2
z
3
29
El determinant de la matriu dels coeficients e s det(A) = 3, per tant es tracta dun

Cramer. La seva solucio e s

1
1 1
1
4
3
3
4 1

4

5
4
4
5 4

2 4
2
3 2 2
1 3 2
1 2 3
x=
= 3,
y=
= 2 ,
z=
3
3
3
sistema de

= 2.
(b) (Interpolacio polinòmica.) Aquest e s un problema amb cert interès pràctic: donats n punts
del pla dabcisses diferents
(a1 , b1 ), (a2 , b2 ), . . . , (an , bn ) ,
es planteja el problema de determinar un polinomi de grau menor o igual que n 1 i, per tant,
amb n coeficients indeterminats,
f (x) = A0 + A1 x + A2 x 2 + + An1 x n1 ,
la gràfica del qual passi pels n punts donats. Imposant les condicions obtenim un sistema de n
equacions amb n incògnites
A0 + a1 A1 + a12 A2 + + a1n1 An1 = b1
n1
2
A0 + a2 A1 + a2 A2 + + a2 An1 = b2
.
..........................................
A0 + an A1 + a 2 A2 + + a n1 An1 = bn
n
El determinant de la matriu dels coeficients daquest sistema e s conegut com a determinant de

Vandermonde, i e s funcio de a1 , a2 , . . . , an :

1 a1 a1 2 . . . a1 n1

1 a2 a2 2 . . . a2 n1

.
V (a1 , a2 , . . . , an ) =

......................
1 an an 2 . . . an n1
Demostrem per induccio que aquest determinant e s el producte de les diferències entre els ai , e s
a dir,
Y
V (a1 , a2 , . . . , an ) =
(a j ai ) .
i< j
El cas n = 2 e s trivial. Considerem el polinomi

g(x) = V (a1 , a2 , . . . , an1 , x)
30
Determinants
que, o` bviament, sanulla per a x = a1 , x = a2 , . . . , x = an1 i e s de grau n 1, i per tant e s

de la forma
g(x) = (x a1 )(x a2 ) (x an1 ) .
Com que e s el coeficient de x n1 , coincideix amb V (a1 , a2 , . . . , an1 ), que per hipòtesi dinduccio e s
Y
(a j ai ) .
i< j<n
Per tant
V (a1 , a2 , . . . , an ) = g(an ) = (an a1 )(an a2 ) (an an1 )
Y
i< j<n
(a j ai ) =
(a j ai ) .
i< j
Lexpressio obtinguda per al determinant de Vandermonde ens diu que V (a1 , a2 , . . . , an ) 6= 0,

de manera que el sistema dequacions e s de Cramer i el problema de la interpolacio polinòmica
admet sempre una u nica solucio.
Pretenem ara generalitzar la filosofia de la regla de Cramer i resoldre sistemes dequacions lineals
arbitraris. Nomes necessitem introduir les nocions de menor duna matriu i inclusio de menors.
Un menor dordre r duna matriu A Mmn (R) e s el determinant duna submatriu formada per
la interseccio de r files i r columnes de A escollides arbitràriament. (Per abus de llenguatge,
sanomena tambe menor a la pròpia submatriu.) Direm que un menor M 0 conte a un menor M si
les files i columnes que determinen M formen part, respectivament, de les files i columnes que
determinen M 0 .
Si AX = B e s un sistema dequacions lineals m n representat matricialment, direm que la
matriu Aa = A | B, obtinguda per juxtaposicio de la columna dels termes independents, e s la
matriu ampliada del sistema.
Suposem que M e s un menor regular màxim de A, e s a dir, que no el conte cap altre menor regular
de A. En el captol 3, veurem que si M tambe e s un menor regular màxim de Aa aleshores el
sistema e s compatible. Suposemho aix i posem que M sigui dordre r . Veurem tambe que, si
r < m, totes les equacions que no intervenen a M son redundants i poden, per tant, suprimir
se, de manera que podem suposar r = m. Ara, si r = n el sistema e s de Cramer i sabem com
resoldrel. Si r < n, primer passarem a formar part dels termes independents de les equacions els
termes de les incògnites que no intervenen a M, les quals faran de paràmetres lliures. Resolent
el sistema de Cramer resultant obtindrem les r incògnites principals en funcio de les n r que
hem deixat com a paràmetres.
31
Exemple 2.15 Considerem el sistema
2x + y z + t = 1
x + y z + 2t = 3
.
3x + 2y z + 3t = 6
6x + 4y 3z + 6t = 10
Preparem simultàniament la matriu dels coeficients i la matriu ampliada:

2 1 1 1 1
1 1 1 2 3
3 2 1 3 6 .

6 4 3 6 10
Com que el menor

2 1 1

M = 1 1 1
3 2 1
e s diferent de zero i els cinc menors 44 de la matriu Aa son nuls, M e s un menor regular màxim
de A i de Aa , i per tant el sistema e s compatible indeterminat. Suprimint la darrera equacio i
passant a la dreta els termes de lincògnita t, queda el sistema de Cramer (respecte x, y, z)
2 1 1
x
1t
1 1 1 y = 3 2t ,
3 2 1
z
6 3t
que, resolt per la regla de Cramer o be invertint la matriu M, ens dona com a solucio general del
sistema original, en funcio de la incògnita t com a paràmetre lliure,
x = 2 + t ,
y = 7 3t ,
z = 2,
t =t.
32
Determinants
33
3
Espais vectorials
Aquest captol i el seguent i, de fet, tots els altres tracten essencialment dels espais numèrics
Rn , prototipus dels espais vectorials de dimensio finita, i dels seus subespais. El punt central e s
el concepte de dimensio, del qual deriva la nocio de rang que apareix constantment a la pràctica.
3.1 Lespai vectorial numèric Rn

Recordem que les propietats dordenacio total i completitud del conjunt R dels nombres reals
permeten representar-los biunvocament com a punts duna recta una vegada escollits en ella
lorigen i la unitat de longitud, rao per la qual aquests nombres sanomenen sovint escalars.
n
^
El smbol Rn representarà el producte cartesià RR R. Un element genèric daquest conjunt, des dara un vector de Rn , e s de la forma u = (x1 , x2 , . . . , xn ). Els nombres x1 , x2 , . . . , xn
son les components del vector u, i recordem que, si v = (y1 , y2 , . . . , yn ), es compleix que u = v
si, i nomes si, xi = yi per a i = 1, 2, . . . , n.
Es defineixen dues operacions bàsiques. La suma de dos vectors u, v Rn e s el vector u + v =
(x1 + y1 , x2 + y2 , . . . , xn + yn ). El producte dun vector u Rn per un escalar t R e s el
vector tu = (t x1 , t x2 , . . . , t xn ). Les propietats fonamentals daquestes operacions totes de
fàcil comprovacio son les seguents:
34
Espais vectorials
(a) Associativa de la suma: (u + v) + w = u + (v + w).

(b) Commutativa de la suma: u + v = v + u.
(c) Neutre de la suma: existeix un vector 0 tal que 0 + u = u per a tot u Rn .
(d) Oposats per la suma: per a cada vector u existeix un vector u tal que u + (u) = 0.
(e) Distributiva del producte per a la suma de vectors: t (u + v) = tu + tv.
(f) Distributiva del producte per a la suma descalars: (t + s)u = tu + su.
(g) Associativitat dels productes: t (su) = (ts)u.
(h) Unitat: 1u = u.
Es diu que Rn , dotat amb les dues operacions descrites que compleixen aquestes propietats, e s
un espai vectorial, lespai vectorial numèric de dimensio n. En general:
Definicio 3.1 Tot conjunt provist duna suma interna i un producte per escalars que compleixen
les propietats (a)(h) e s un espai vectorial real.
Els conjunts de matrius dun mateix tipus, els Mmn (R), tambe son espais vectorials reals. De
fet, podem identificar Rn amb M1n (R) o Mn1 (R), segons escrivim els vectors en fila o en
columna.
Si el producte està definit per a tot t C (conjunt dels nombres complexos), es parla despai
vectorial complex: aquest seria, per exemple, el cas de Cn o Mmn (C).
Observacions 3.2 (a) Tornant a Rn , la diferència de dos vectors u i v es defineix com u v =
u + (v), i el quocient dun vector u per un escalar t 6= 0 com
u
1
= u.
t
t
Les propietats daquestes dues operacions secundàries son les derivades de (a)(h).
(b) R2 serà anomenat simplement el pla, i R3 lespai. Aquests dos espais vectorials admeten
la representacio gràfica habitual, una vegada escollits lorigen, la unitat de longitud i uns eixos
perpendiculars entre si. Daquesta manera, lespai, per exemple, coincideix amb lespai dels
vectors lliures usual en la Fsica: hom pot identificar els vectors (1, 0, 0), (0, 1, 0) i (0, 0, 1) de
R3 amb E , E i kE respectivament, i escriure
u = (x1 , x2 , x3 ) = x1E + x2 E + x3 kE .
La suma correspon, geomètricament, a la regla del parallelogram, i el producte per escalars a la
prolongacio proporcional dels vectors en un sentit o laltre segons el signe del factor escalar.
35
Un subconjunt S Rn e s un subespai vectorial de Rn si compleix les condicions seguents:

(1) 0 S.
(2) u, v S H u + v S.
(3) u S H tu S per a tot t R.
La condicio (1) expressa que S 6= . Les altres dues garanteixen que la suma i la multiplicacio
per escalars restringides a S son operacions internes de S. Com que les propietats (a)(h) romanen vàlides dins de S, aquest conjunt e s, per ell mateix, un espai vectorial real. Per tant, les
definicions i els resultats que dara endavant sestableixen per a espais vectorials son aplicables
no nomes a Rn sino tambe als seus subespais.
Exemples 3.3 (a) {0} i Rn son els anomenats subespais trivials de Rn .
(b) Cada vector e 6= 0 de Rn defineix el subespai h e i = {te ; t R }, anomenat recta engendrada per e. En el cas del pla R2 , aquest e s lunic tipus possible de subespai no trivial.
(c) Tota equacio lineal homogènia a1 x1 + a2 x2 + + an xn = 0 defineix un subespai de Rn ,
format pels vectors u = (x1 , x2 , . . . , xn ) que la satisfan. Mes en general, e s igualment fàcil
veure que el conjunt de les solucions de qualsevol sistema dequacions lineals homogènies amb
n incògnites e s un subespai de Rn . Aquesta e s una de les dues maneres habituals de descriure un
subespai: donantne les equacions implcites.
3.2 Dependència lineal

Sigui E un espai vectorial real (per fixar idees, el lector pot suposar que E e s Rn , o qualsevol
dels seus subespais).
Un vector v e s combinacio lineal dels vectors u 1 , u 2 , . . . , u m si existeixen escalars t1 , t2 , . . . , tm
tals que
t1 u 1 + t2 u 2 + + tm u m = v .
El vector 0, per exemple, e s combinacio lineal de qualsevol conjunt de vectors.
Els vectors u 1 , u 2 , . . . , u m son linealment dependents si existeix alguna combinacio lineal no
trivial (es a dir, amb algun coeficient no nul) daquests vectors que dona 0. Per tant, direm que
u 1 , u 2 , . . . , u m son linealment independents si
t1 u 1 + t2 u 2 + + tm u m = 0
t1 = t2 = = tm = 0 .
36
Espais vectorials
Observacions 3.4 (a) Estudiar si un vector v Rn e s combinacio lineal de u 1 , u 2 , . . . , u m

condueix a discutir un sistema de n equacions lineals: les incògnites son t1 , t2 , . . . , tm , els seus
coeficients son les components dels vectors u 1 , u 2 , . . . , u m escrites en columna i els termes independents son les components de v. La resposta e s afirmativa si, i nomes si, el sistema e s
compatible.
(b) Anàlogament, per saber si u 1 , u 2 , . . . , u m son linealment independents es planteja un sistema
que coincideix amb lanterior excepte en els termes independents, que aqu son tots nuls. Ara, els
vectors son linealment independents si, i nomes si, el sistema (homogeni i, per tant, compatible)
e s determinat.
Proposicio 3.5 Els vectors u 1 , u 2 , . . . , u m son linealment dependents si, i nomes si, algun dells
e s combinacio lineal dels restants.
D EMOSTRACI O . (H) Si son linealment dependents, existirà una relacio de dependència
t1 u 1 + t2 u 2 + + tm u m = 0
amb algun coeficient no nul. Sense perdre generalitat podem suposar que t1 6= 0; aleshores tenim
que
tm
t2
u1 = u2 um ,
t1
t1
i això demostra que u 1 e s combinacio lineal dels restants.
(H) Si, per exemple, u 1 = s2 u 2 + + sm u m , apareix la relacio
u 1 s2 u 2 sm u m = 0 ,
on almenys el coeficient de u 1 no e s nul. Per tant, u 1 , u 2 , . . . , u m son linealment dependents.
De manera equivalent, es pot enunciar: els vectors u 1 , u 2 , . . . , u m son linealment independents
si, i nomes si, cap dells e s combinacio lineal dels altres.
Proposicio 3.6 Si el vector v e s combinacio lineal dels vectors u 1 , u 2 , . . . , u m , ho e s de forma
u nica si, i nomes si, u 1 , u 2 , . . . , u m son linealment independents.
D EMOSTRACI O . (H) Suposem que v sexpressa de manera u nica com a combinacio lineal
dels vectors u 1 , u 2 , . . . , u m :
v = s1 u 1 + s2 u 2 + + sm u m .
37
Aleshores, si
t1 u 1 + t2 u 2 + + tm u m = 0 ,
sumant les dues igualtats tindrem que
v = (t1 + s1 )u 1 + (t2 + s2 )u 2 + + (tm + sm )u m ,
i de la unicitat de lexpressio de v es dedueix que ti + si = si per a tot i = 1, 2, . . . , m. Per tant,
t1 = t2 = = tm = 0 i els vectors u 1 , u 2 , . . . , u m son linealment independents.
(H) Si
v = t1 u 1 + t2 u 2 + + tm u m
v = s1 u 1 + s2 u 2 + + sm u m
son dues expressions de v com a combinacio lineal de u 1 , u 2 , . . . , u m , en restar-les obtenim

(t1 s1 )u 1 + (t2 s2 )u 2 + + (tm sm )u m = 0 .
La independència lineal daquests vectors implica que ti si = 0 per a i = 1, 2, . . . , m, e s a dir,
v sexpressa de manera u nica com a combinacio lineal de u 1 , u 2 , . . . , u m .
Proposicio 3.7 Si u m e s combinacio lineal de u 1 , u 2 , . . . , u m1 , aleshores tot vector que sigui
combinacio lineal de u 1 , u 2 , . . . , u m tambe ho e s de u 1 , u 2 , . . . , u m1 .
D EMOSTRACI O . Suposem que u m = s1 u 1 + s2 u 2 + + sm1 u m1 . Si
v = t1 u 1 + t2 u 2 + + tm u m ,
nomes cal substituir en aquesta relacio lexpressio anterior de u m per obtenir
v = (t1 + s1 tm )u 1 + (t2 + s2 tm )u 2 + + (tm1 + sm1 tm )u m1 .
Un conjunt {u 1 , u 2 , . . . , u m } de vectors de E e s un sistema de generadors de E si tots els vectors
daquest espai son combinacio lineal de u 1 , u 2 , . . . , u m .
Una base de E e s un sistema de generadors linealment independents de E. Si hem escollit una
base B = {e1 , e2 , . . . , en } de E, cada vector u E sescriu de forma u nica com
u = x1 e1 + x2 e2 + + xn en .
Els coeficients x1 , x2 , . . . , xn daquesta combinacio lineal son les components de u en la base
B. Habitualment, les bases i per tant les llistes de components dels vectors es consideren
ordenades.
38
Espais vectorials
Exemples 3.8 (a) La base canònica de Rn e s la formada pels vectors

e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1),
i es representa per Bc . Les components dun vector u = (x1 , x2 , . . . , xn ) en aquesta base son,
precisament, x1 , x2 , . . . , xn .
(b) Generalitzant la idea de recta engendrada per un vector, obtindrem la segona manera habitual
de descriure un subespai. Donats u 1 , u 2 , . . . , u m Rn , es defineix el subespai engendrat per
aquests vectors com el conjunt de totes les seves combinacions lineals, e s a dir,
hu 1 , u 2 , . . . , u m i = {t1 u 1 + t2 u 2 + + tm u m ; t1 , t2 , . . . , tm R}
clar que {u 1 , u 2 , . . . , u m } e s
(el lector comprovarà que això e s, efectivament, un subespai). Es
un sistema de generadors daquest subespai. Si els vectors son linealment independents, formen
una base del subespai; si no ho son, la proposicio anterior ens dona un procediment recursiu
per eliminar vectors daquest sistema fins a obtenir-ne un subconjunt de generadors linealment
independents que, aleshores, serà una base del subespai: nomes cal suprimir els vectors que
siguin combinacio lineal dels anteriors.
Teorema 3.9 Suposem que u 1 , u 2 , . . . , u k son vectors linealment independents de E, i que
e1 , e2 , . . . , em formen un sistema de generadors del mateix espai. Aleshores, k m.
D EMOSTRACI O . Com que e1 , e2 , . . . , em generen lespai E, els vectors u 1 , u 2 , . . . , u k son combinacio lineal dells:
u 1 = a11 e1 + a21 e2 + + am1 em ,
u 2 = a12 e1 + a22 e2 + + am2 em ,
..
.
u k = a1k e1 + a2k e2 + + amk em .
En substituir aquestes expressions a la combinacio lineal
t1 u 1 + t2 u 2 + + tk u k
i agrupar els coeficients de e1 , e2 , . . . , em obtenim
(a11 t1 + a12 t2 + + a1k tk )e1 +
+(a21 t1 + a22 t2 + + a2k tk )e2 +
+ + (am1 t1 + am2 t2 + + amk tk )em .
39
Aleshores, si k > m el sistema dequacions
= 0
a21 t1 + a22 t2 + + a2k tk = 0

,
...............................
am1 t1 + am2 t2 + + amk tk = 0

a11 t1 + a12 t2 + + a1k tk
que te m equacions i k incògnites, e s indeterminat, e s a dir, te solucions diferents de la trivial, les

quals compleixen que
t1 u 1 + t2 u 2 + + tk u k = 0 .
Això e s una contradiccio, ja que els vectors u 1 , u 2 , . . . , u k son linealment independents. Per tant,
ha de ser k m.
En particular, si B = {e1 , e2 , . . . , en } e s una base de E, k vectors de E amb k > n no poden ser
linealment independents, i k vectors de E amb k < n no poden formar sistema de generadors de
E. Una consequència fonamental e s el resultat seguent.
Teorema 3.10 (Teorema de les bases.) Totes les bases dun espai vectorial E tenen el mateix
nombre de vectors.
D EMOSTRACI O . Siguin B = {e1 , e2 , . . . , en } i B 0 = {e10 , e20 , . . . , em0 } dues bases de E. Si m < n,
B 0 no e s un sistema de generadors, i si m > n, els vectors de B 0 no son linealment independents.
Per tant, m = n.
Observacions 3.11 Suposem que B = {e1 , e2 , . . . , en } e s una base de E.
(a) (Teorema de Steinitz.) Si u 1 , u 2 , . . . , u k son vectors linealment independents de E, es poden
escollir n k vectors de la base B que juntament amb u 1 , u 2 , . . . , u k formin una base de E.
El raonament e s recurrent, comencant pel fet que algun vector de la base B no e s combinacio
lineal de u 1 , u 2 , . . . , u k i, per tant, es pot afegir a ells sense perdres la independència lineal.
(b) Si {u 1 , u 2 , . . . , u n } son vectors linealment independents de E, aquests vectors formen base
de E.
Observem que si no fossin generadors de E existiria algun vector u n+1 de E que no seria combinacio lineal dells, e s a dir, tindrem n + 1 vectors u 1 , u 2 , . . . , u n , u n+1 linealment independents,
en contradiccio amb lexistència del sistema de generadors B.
40
Espais vectorials
(c) Si {u 1 , u 2 , . . . , u n } e s un sistema de generadors de E, aleshores aquests vectors tambe formen

base de E.
En efecte: si els vectors u 1 , u 2 , . . . , u n no fossin linealment independents, algun dells seria
combinacio lineal dels altres, i eliminant-lo obtindrem un sistema de generadors de E amb
n 1 vectors. Una altra contradiccio amb lexistència de B.
3.3 Dimensio i rang

En aquesta seccio retrobarem idees que estaven latents en els dos primers captols i que ara
podem establir amb rigor.
Definicio 3.12 La dimensio dun espai vectorial e s el nombre de vectors de qualsevol de les
seves bases. Evidentment, aquesta definicio queda justificada pel teorema de les bases.
El rang dun conjunt de vectors e s la dimensio del subespai que generen: simbòlicament
rang {u 1 , u 2 , . . . , u m } = dim hu 1 , u 2 , . . . , u m i .
`
Exemples 3.13 (a) Obviament,
dim(Rn ) = n. I, per conveni, es pren dim{0} = 0.
(b) Si e 6= 0, dimhei = 1. Si S e s el subespai de R3 definit per lequacio 3x 2y z = 0, tenim
que dim(S) = 2, perquè els vectors de S es poden escriure en la forma
(x, y, z) = (x, y, 3x 2y) = x(1, 0, 3) + y(0, 1, 2).
En general, una recta e s un subespai de dimensio 1, un pla e s un subespai de dimensio 2, i un
hiperpla de Rn e s un subespai de dimensio n 1.
(c) Algunes vegades cal fer servir que si S e s un subespai de E, i dim(S) = dim(E), aleshores
S = E.
(d) I sempre e s bo tenir present que la dimensio e s el nombre de paràmetres lliures que cal donar
per determinar un vector de lespai considerat (nombre de graus de llibertat). Aix veiem, per
exemple, sense necessitat dexplicitar una base, que
dim Mmn (R) = mn.
El rang duna matriu A Mmn (R) e s el rang del conjunt de les seves columnes, e s a dir, la
dimensio del subespai generat per les n columnes de A interpretades com a vectors de Rm .
41
De vegades es distingeix entre el rang que acabem de definir, que sanomena rang per columnes de A, escrit rangC (A), i el concepte anàleg de rang per files de A, escrit rang F (A), e s a
dir, la dimensio del subespai generat per les m files de A interpretades com a vectors de Rn .
Demostrarem en aquesta mateixa seccio que rangC (A) = rang F (A) per a tota matriu A.
Sigui A una matriu quadrada n n, i u 1 , u 2 , . . . , u n Rn els vectors que, escrits en la base
canònica, formen les columnes de A. Recollim en el resultat seguent les diverses caracteritzacions de les matrius regulars.
Teorema 3.14 Son equivalents:
(a) A e s regular.
(b) det(A) 6= 0.
(c) La triangulacio de A dona lloc a n pivots.
(d) u 1 , u 2 , . . . , u n son linealment independents (es a dir, formen base de Rn ).
(e) rang(A) = n.
D EMOSTRACI O . (a) i (b) son equivalents segons hem vist en el captol anterior, i (d) i (e) ho son
per la definicio de rang duna matriu. La demostracio quedarà completa veient que
(b) H (d) H (c) H (b) .
(b) H (d) Si considerem el sistema homogeni que permet estudiar la independència lineal de
u 1 , u 2 , . . . , u n , la condicio det(A) 6= 0 ens diu que es tracta dun sistema de Cramer i, per tant,
compatible determinat: això significa que u 1 , u 2 , . . . , u n son linealment independents.
(d) H (c) Si els vectors son linealment independents, la triangulacio del sistema anterior ha de
donar lloc a n pivots, per tal que sigui determinat.
(c) H (b) La triangulacio de la matriu A nomes modifica det(A) segons un factor de proporcionalitat no nul; si han aparegut n pivots, el determinant serà diferent de zero.
A continuacio, estudiarem dos procediments per calcular el rang duna matriu arbitrària A
Mmn (R), lun pel mètode de Gauss i laltre per determinants.
Proposicio 3.15 El nombre de pivots que apareixen en triangular una matriu A coincideix amb
el seu rang i, per tant, e s independent del cam seguit per triangular-la.
42
Espais vectorials
D EMOSTRACI O . Considerem el sistema homogeni que permet estudiar la dependència lineal

entre les columnes u 1 , u 2 , . . . , u n de la matriu A. Una vegada triangulat, hauran aparegut, diguem, r pivots. Això significa que les r columnes on figuren aquests pivots son linealment
independents, perquè el sistema homogeni corresponent e s compatible determinat. I que cada
una de les restants e s combinacio lineal delles, perquè el sistema que tradueix aquesta questio
e s compatible. En definitiva, r = rang(A).
Lema 3.16 El rang duna matriu A e s r si, i nomes si, existeix un menor regular màxim dordre
r.
D EMOSTRACI O . Posem r 0 = rang(A). En primer lloc r r 0 , perquè si hi ha un menor regular dordre r les seves subcolumnes, i per tant les columnes senceres que hi intervenen, son
linealment independents.
Daltra banda, r 0 r , perquè si hi ha r 0 columnes linealment independents en podem extreure,
aplicant la proposicio anterior, un menor regular dordre r 0 .
Corol.lari 3.17 Per a qualsevol matriu A es compleix que rang(A) = rang(At ), e s a dir, rangC (A) =
rang F (A).
immediata a partir de la caracteritzacio del rang donada pel lema anterior i

D EMOSTRACI O . Es
del fet que el determinant de tota matriu coincideix amb el de la seva transposada.
Proposicio 3.18 El rang duna matriu A e s r si, i nomes si, existeix algun menor regular dordre
r i tots els menors dordre r + 1 que el contenen son nuls.
D EMOSTRACI O . (H) Nomes cal aplicar el lema anterior.

(H) Suposem que u 1 , u 2 , . . . , u r son les columnes que defineixen el menor regular. Nomes
cal veure que qualsevol altra columna u j e s combinacio lineal daquestes. Segons una de les
propietats caracterstiques de les matrius regulars, el rang per files de la matriu definida per
u 1 , u 2 , . . . , u r , u j e s r . Pel corol.lari anterior, el rang (per columnes) daquesta matriu tambe e s
r , i això vol dir que u j e s combinacio lineal de u 1 , u 2 , . . . , u r .
43
Teorema 3.19 (Teorema de Rouche-Frobenius.) (a) El sistema dequacions lineals AX = B e s

compatible si, i nomes si, rang(A) = rang(Aa ).
(b) Si e s compatible, el sistema e s determinat si, i nomes si, rang(A) = n, on n e s el nombre
dincògnites del sistema.
D EMOSTRACI O . (a) Si A1 , A2 , . . . , An son les columnes de A, la condicio de compatibilitat e s

equivalent a que
B hA1 , A2 , . . . , An i ,
e s a dir,
hA1 , A2 , . . . , An i = hA1 , A2 , . . . , An , Bi ,
i això e s equivalent a que rang(A) = rang(Aa ).
(b) Suposant satisfeta la condicio anterior, el fet que el sistema sigui determinat equival a que B
sigui combinacio lineal u nica de A1 , A2 , . . . , An , i això passa si, i nomes si, aquests vectors son
linealment independents, e s a dir, si, i nomes si, rang(A) = n.
Observacions 3.20 (a) Cal destacar que lestudi del rang duna matriu A ens permet escollir un
conjunt màxim de columnes (o files) linealment independents.
(1) Si apliquem el mètode de Gauss, seran aquelles on hagin aparegut els pivots.
(2) Si fem servir determinants, seran aquelles que intervenen en el menor regular màxim. Això
justifica el procediment de resolucio de sistemes que hem exposat al final del captol 2.
(b) Quan es tracta de discutir el tipus dun sistema dequacions lineals amb coeficients que depenen dun o mes paràmetres, es convenient fer u s del teorema de RoucheFrobenius i seguir la
regla pràctica seguent: igualar a 0 un menor dordre màxim de la matriu ampliada Aa .
3.4 Subespais vectorials de Rn

Hi ha dues formes bàsiques de descriure un subespai S de Rn : donant un sistema de generadors
o be donant un sistema dequacions lineals homogènies que caracteritzen els vectors de S, les
anomenades equacions implcites del subespai. En primer lloc ens ocuparem de veure com es
passa duna forma a laltra i com es troba una base i la dimensio del subespai.
(a) Donat S = hu 1 , u 2 , . . . , u m i, el càlcul duna base de S e s equivalent al càlcul del rang de
la matriu A formada per les components daquests vectors escrites en columna, el qual serà la
dimensio del subespai.
44
Espais vectorials
Si apliquem el mètode de Gauss triangulant la matriu A, la dimensio de S e s el nombre de pivots

que en resulten, i els vectors corresponents a les columnes on apareixen aquests pivots formen
una base de S.
Si operem amb determinants, la dimensio de S e s el tamany del menor regular màxim de A, i els
vectors corresponents a les columnes involucrades en aquest menor formen una base de S.
(b) Per obtenir les equacions implcites dun subespai S a partir duna base {u 1 , u 2 , . . . , u r } de
S, hem dimposar a un vector genèric v = (x1 , x2 , . . . , xn ) que sigui combinacio lineal dels
anteriors. A la pràctica, preparem la matriu ampliada Aa que resulta dafegir a A la columna de
les components de v i imposem la condicio rang(Aa ) = r .
Si apliquem el mètode de Gauss, despres de triangular A anul.larem els coeficients de la columna
nova que donarien un pivot addicional; si fem servir determinants, una vegada localitzat el menor
que indica el rang de A anul.larem els menors dordre r + 1 que el contenen i es formen afegint
part de la columna nova.
(c) Finalment, donades les equacions implcites dun subespai S, cal resoldre el sistema (pel
mètode de Gauss, per determinants o per qualsevol altre procediment) per obtenir una base del
subespai. Notem que, en aquest cas, si el rang de la matriu del sistema e s r , la dimensio del
subespai S e s n r , e s a dir, el nombre de graus de llibertat del sistema.
Exemples 3.21 (a) Càlcul de la dimensio, una base i les equacions implcites del subespai de
R4 , S = h(1, 2, 1, 0), (1, 3, 2, 1), (1, 4, 5, 2), (1, 2, 0, 4)i.
Triangulem la matriu ampliada
1
2
1
0
1
3
2
1
1
4
5
2
1
2
0
4
x
y
.
z
t
Això ens permetrà seleccionar una base dentre els generadors de S, conèixer la dimensio del
subespai i, finalment, obtenirne les equacions implcites.
1
2
1
0
1
3
2
1
1
4
5
2
1
2
0
4

x
1
y 0
'
z 0
t
0
1
1
3
1
1
2
6
2
1
0
1
4

x

2x + y

x+z

t
45
'
1
0
0
0
1
1
0
0
1
2
0
0
1
0
1
4

x

2x + y

7x 3y + z

2x y + t

'

1
0
0
0
1
1
0
0
1
2
0
0
1
0
1
0

x

2x + y

7x 3y + z

26x + 11y 4z + t
Daqu resulta que dim(S) = 3, que els vectors (1, 2, 1, 0), (1, 3, 2, 1) i (1, 2, 0, 4) formen una
base de S i que lequacio implcita daquest subespai e s
26x + 11y 4z + t = 0 .
(b) Càlcul duna base del subespai S de R4 definit per les equacions
x + y + z t = 0
x + 2y z + t = 0 .
3x + 5y z + t = 0
Operarem amb determinants. La matriu del sistema e s

1 1
1 1 0
1 2 1
1 0 .
3 5 1
1 0
Un menor regular màxim e s

1 1

1 2 ,
i això ens diu que el rang del sistema e s 2 i, per tant, dim(S) = 4 2 = 2. A mes, podem
suprimir la tercera equacio i guardar x i y com a incògnites principals. Queda, doncs, un sistema
de Cramer respecte daquestes dues incògnites,
)
x + y = z + t
,
x + 2y = z t
la solucio general del qual e s
x = 3z + 3t,
y = 2z 2t,
z = z,
t = t.
El vector
u = (3z + 3t, 2z 2t, z, t) = z(3, 2, 1, 0) + t (3, 2, 0, 1) ,
on z i t son els paràmetres lliures, e s lelement genèric del subespai S. Els vectors (3, 2, 1, 0)
i (3, 2, 0, 1) formen una base de S.
Recomanem al lector que torni a resoldre aquests dos exemples, operant en el primer cas per
determinants i en el segon pel mètode de Gauss.
46
Espais vectorials
La resta daquesta seccio es dedica a lestudi de les operacions habituals amb subespais de Rn .
La interseccio de dos subespais S i T e s tambe un subespai, que es representa per S T . Naturalment, la manera mes directa de descriurel e s reunir en un sol sistema les equacions implcites
de S i les de T .
La suma de dos subespais e s el subespai representat per S + T i format per totes les sumes de la
forma u + v, on u S i v T . La manera mes directa de descriurel e s reunir en un sol conjunt
un sistema de generadors de S i un de T , la qual cosa ens dona un sistema de generadors de
S + T . En general, tot i prenent bases de cadascun dels subespais, es pot perdre la independència
lineal quan les ajuntem. Això motiva la definicio seguent.
Es diu que la suma de dos subespais S i T e s directa, i sescriu S T , si cada vector de la suma
sescriu de manera u nica com a suma dun vector de S i un vector de T . Es fàcil veure que això
equival a que
u + v = 0, u S, v T H u = v = 0 .
Donades dues bases B de S i B 0 de T , S + T e s directa si, i nomes si, B B 0 e s un conjunt
linealment independent, i aquesta e s, potser, la caracteritzacio mes u til a la pràctica. Finalment,
la condicio de suma directa tambe e s equivalent a que S T = {0}.
Totes les definicions i resultats anteriors (amb lunica excepcio del criteri de la interseccio que
acabem dexposar per a la suma directa) es generalitzen immediatament al cas de mes de dos
subespais.
Es diu que dos subespais S i T son suplementaris si S T = Rn . Els subespais {0} i Rn son
suplementaris. Per a qualsevol altre subespai S e s fàcil trobar un suplementari: ampliant una
base {u 1 , u 2 , . . . , u r } de S fins a obtenir una base {u 1 , u 2 , . . . , u r , u r +1 , . . . , u n } de Rn , e s fàcil
veure que el subespai T = hu r +1 , . . . , u n i e s un suplementari de S.
Teorema 3.22 (Formula de Grassmann.) Siguin S i T subespais de Rn .
(a) Quan S T = {0}, dim(S T ) = dim(S) + dim(T ).
(b) En general, dim(S + T ) = dim(S) + dim(T ) dim(S T ).
D EMOSTRACI O . (a) Es dedueix immediatament de la caracteritzacio de suma directa per reunio
de bases.
(b) Escollim un suplementari S1 de S T respecte a S, de manera que S = S1 (S T ).
Anàlogament, escollim T1 tal que T = T1 (S T ). Ara no e s difcil comprovar que S1 , S T
47
i T1 formen suma directa i que

S1 (S T ) T1 = S + T.
Aplicant la formula de lapartat (a) resulta que
dim(S + T ) = dim(S1 ) + dim(S T ) + dim(T1 )
= dim(S) + dim(T ) dim(S T ) .
3.5 Canvis de base

Dedicarem aquesta darrera seccio a plantejar i resoldre el problema del canvi de base, i serà
suficient illustrarlo a Rn . Considerem dues bases,
B = {e1 , e2 , . . . , en }
B 0 = {e10 , e20 , . . . , en0 } .
Per fixar idees, direm que B e s la base vella i B 0 e s la base nova. Cada vector u Rn queda
determinat tant per les seves components (x1 , x2 , . . . , xn ) en la base B, que son els coeficients
de la combinacio lineal
u = x1 e1 + x2 e2 + + xn en ,
com per les seves components (x10 , x20 , . . . , xn0 ) en la base B 0 , que son els coeficients de
u = x10 e10 + x20 e20 + + xn0 en0 .
Es tracta de trobar la relacio entre unes components i les altres. Per a això, necessitem conèixer
com sexpressen els vectors nous en funcio dels vells, e s a dir, les relacions
e0j
n
X
ai j ei
j = 1, 2, . . . , n .
per a
i=1
Substituint aquestes relacions i calculant, obtenim

n
X
xi ei = u =
i=1
n
X
x j0 e0j =
j=1
n
n X
X
n
X
x j0
j=1
ai j x j0 ei =
j=1 i=1
n
X
i=1
n
n
X
X
i=1

ai j ei =
ai j x j0
j=1
i, comparant els extrems daquestes igualtats,

xi =
n
X
j=1
ai j x j0
per a i = 1, 2, . . . , n .
ei ,
48
Espais vectorials
Aquestes relacions resolen la questio, però e s convenient expressarles en forma matricial.

Denotarem el canvi de base que estem considerant per
C
(Rn , B 0 ) (Rn , B) ,
i anomenarem matriu del canvi de base de B 0 a B a la matriu
a11 a12 . . . a1 j . . .
a21 a22 . . . a2 j . . .
... ... ... ... ...

C =
ai1 ai2 . . . ai j . . .
... ... ... ... ...

an1 an2 . . . an j . . .
a1n
a2n
...
ain
...
ann
que ens dona, per columnes, les components de cadascun dels vectors nous en la base dels vectors
vells.
Si X i X 0 representen, respectivament, les matrius columna formades amb les components de u
en les bases B i B 0 , tenim, com a expressio matricial de les relacions entre components que hem
deduit anteriorment,
X = C X0 ,
que e s la formula matricial del canvi de base i expressa les components velles dun vector
arbitrari en funcio de les noves.
Pel teorema de caracteritzacio de les matrius regulars vist a la seccio 3 daquest captol, sabem que la matriu C e s regular. Per tant, si volem calcular les components noves dun vector
coneixent les velles, farem servir la relacio inversa,
X 0 = C 1 X ,
observant que C 1 e s precisament la matriu del canvi de base de B a B 0 . Resumim tota la
informacio obtinguda en el resultat seguent.
Teorema 3.23 (a) Si C e s la matriu del canvi de base de B 0 a B, que descriu per columnes els
vectors de la base B 0 en funcio de la base B, la relacio
X = C X0
expressa les components dun vector en la base B en funcio de les seves components en la base
B0 .
(b) C 1 e s la matriu del canvi de base invers:
C 1
(Rn , B) (Rn , B 0 ) ,
X 0 = C 1 X .
49
Exemples 3.24 (a) Els vectors e10 = (1, 1, 1), e20 = (1, 1, 2) i e30 = (0, 1, 1) formen una base B 0
de R3 . Si Bc denota la base canònica, el canvi de base natural i la seva matriu son
1 1 0
C
(R3 , B 0 ) (R3 , B c ) ,
C =1 1 1 .
1 2 1
La relacio entre les components canòniques (x, y, z) dun vector arbitrari u de R3 i les components (x 0 , y 0 , z 0 ) del mateix vector u en la base B 0 son

0
0
0
x
1 1 0
x
x = x + y
y = 1 1 1 y 0 , e s a dir,
y = x 0 + y0 + z0
z
1 2 1
z
z = x 0 + 2y 0 + z 0 .
La matriu inversa de C e s
C 1
1
1 1
1 ,
= 0 1
1
1
0
expressa els vectors e1 , e2 , e3 de la base canònica en funcio dels de B 0 ,

e1 = e10 e30 ,
e2 = e10 e20 + e30 ,
e3 = e10 + e20 ,
i permet invertir la relacio entre les components dels vectors:

x0
1
1 1
x
y 0 = 0 1
1 y ,
z0
1
1
0
z
e s a dir,
x = x + y z
y 0 = y + z
0
z = x + y .
En el cas que es vulgui transformar lequacio dun subespai, i conèixer, per exemple, lequacio
que tindria en la base nova el pla que en la base canònica es descriu per 2x y +z = 0, nomes cal
substituir a lequacio donada les expressions de x, y i z que ens dona el canvi de base original.
Aix doncs,
2(x 0 + y 0 ) (x 0 + y 0 + z 0 ) + (x 0 + 2y 0 + z 0 ) = 0 ,
e s a dir, 2x 0 + 3y 0 = 0, e s lequacio del pla en la base B 0 .
(b) En algunes situacions no es coneix dentrada la relacio entre les dues bases, però disposem
de la seva relacio amb la base canònica. Suposem que B 0 i B 00 son les bases, i que sabem les
matrius de canvi a la base canònica per a cada una:
P
(Rn , B 0 ) (Rn , B c )
Si volem determinar la matriu del canvi denotat per

C
(Rn , B 00 ) (Rn , B c ) .
(Rn , B 00 ) (Rn , B 0 ) ,
50
Espais vectorials
nomes cal observar que de les relacions P X 0 = X = Q X 00 es dedueix que

X 0 = P 1 Q X 00 ,
per tant la matriu buscada e s
C = P 1 Q .
Per exemple, si tenim la base B 0 de lexemple anterior, i la base B 00 formada pels vectors
e100 = (1, 1, 2),
e200 = (0, 0, 1) i
e300 = (1, 1, 2) ,
resulta
1 1 0
P =1 1 1 ,
1 2 1
1 0 1
1 ,
Q =1 0
2 1
2
0 1 2
1
1 .
C = P 1 Q = 1
0
0
2
51
4
El producte escalar e s la tercera operacio bàsica amb vectors de Rn . Dell deriven conceptes
mètrics com lortogonalitat, la norma i langle, que obren el cam a multiples aplicacions geomètriques i fsiques de làlgebra lineal. Aix, el mètode dels mnims quadrats que presentem
a la tercera seccio no e s mes que laplicacio de la idea de projeccio ortogonal a lestudi dels
sistemes sobredeterminats.
4.1 El producte escalar

El producte escalar de dos vectors u, v Rn e s el nombre real
u v = x1 y1 + x2 y2 + + xn yn ,
suposant que u = (x1 , x2 , . . . , xn ) i v = (y1 , y2 , . . . , yn ).
immediat comprovar que aquesta operacio e s
Es
(a) definida positiva: u u > 0 per a tot u 6= 0 ;
(b) simètrica (commutativa): u v = v u ;
(c) compatible amb el producte per escalars: (tu) v = t (u v) = u (tv) ;
52
(d) distributiva respecte de la suma: u (v + w) = u v + u w .

Sempre que, a mes de les operacions lineals, es considera el producte escalar, e s habitual denominar a Rn lespai euclidià de dimensio n.
Es diu que dos vectors u, v son ortogonals (o perpendiculars), i sescriu u v, si u v = 0. De
manera similar, es diu que dos subespais S i T son ortogonals si u v = 0 per a tot u S i tot
v T.
Proposicio 4.1 (a) Vectors no nuls ortogonals dos a dos son linealment independents.
(b) Subespais ortogonals dos a dos formen suma directa.
D EMOSTRACI O . La idea e s bàsicament la mateixa, per tant provarem nomes lapartat (a). Si
tenim una relacio
t1 u 1 + t2 u 2 + + tk u k = 0
entre vectors no nuls ortogonals dos a dos, fent el producte escalar per qualsevol u i resulta que
ti (u i u i ) = 0
i per tant ti = 0, i això ens diu que u 1 , u 2 . . . , u k son linealment independents.
Teorema 4.2 (Mètode dortogonalitzacio de Gram-Schmidt.) Si u 1 , u 2 , . . . , u m son vectors

linealment independents, existeixen vectors v1 , v2 , . . . , vm ortogonals dos a dos tals que
hu 1 , u 2 , . . . , u j i = hv1 , v2 , . . . , v j i
per a
j = 1, 2, . . . , m .
D EMOSTRACI O . Prenem v1 = u 1 . El segon vector serà de la forma v2 = u 2 t1 v1 , i això

assegura que h u 1 , u 2 i = h v1 , v2 i; cal, però, imposar que v2 v1 , i aquesta condicio determina
t1 :
v1 u 2
v1 v2 = 0 ,
v1 u 2 t1 v1 v1 = 0 ,
t1 =
.
v1 v1
Suposem obtinguts v1 , v2 ,. . . , vk que satisfan les condicions; prenem ara
vk+1 = u k+1 (t1 v1 + t2 v2 + + tk vk ) ,
expressio que garanteix la segona de les igualtats seguents:
h u 1 , . . . , u k , u k+1 i = h v1 , . . . , vk , u k+1 i = h v1 , . . . , vk , vk+1 i .
53
Lortogonalitat de vk+1 amb vi per a i = 1, 2, . . . , k dona

vi vk+1 = 0 ,
vi u k+1 ti vi vi = 0 ,
ti =
vi u k+1
,
vi vi
i aquests coeficients t1 , t2 , . . . , tk determinen vk+1 .

Corol.lari 4.3 (a) Tot subespai S 6= {0} de Rn admet bases ortogonals.
(b) Els vectors ortogonals a (tots els vectors de) S formen un subespai S , anomenat suplementari ortogonal de S perquè compleix que
S S = Rn
(S ) = S .
D EMOSTRACI O . Ampliem una base qualsevol { u 1 , u 2 , . . . , u r } de S fins a obtenir una base

{ u 1 , u 2 , . . . , u r , u r +1 , . . . , u n } de Rn . Aplicant el mètode de Gram-Schmidt a aquest conjunt
resulta una base ortogonal de Rn : { v1 , v2 , . . . , vr , vr +1 , . . . , vn }. Com que, segons el teorema,
hu 1 , u 2 , . . . , u r i = hv1 , v2 , . . . , vr i ,
els vectors v1 , v2 , . . . , vr formen una base ortogonal de S, i això demostra lapartat (a).
Daltra banda, e s fàcil veure que hvr +1 , . . . , vn i = S , de manera que S S = Rn . Finalment,
S (S ) , però per dimensions veiem que aquesta inclusio e s una igualtat, i aix queda provat
lapartat (b).
Exemples 4.4 (a) Càlcul duna base ortogonal del subespai S = hu 1 , u 2 , u 3 i de R4 , on
u 1 = (1, 1, 0, 1),
u 2 = (0, 0, 1, 1) i
u 3 = (2, 0, 1, 0) .
Aplicant el mètode Gram-Schmidt a u 1 , u 2 , u 3 tenim:

v1 = u 1 = (1, 1, 0, 1) ;
v1 u 2
1
= ,
v1 v1
3
1
i per tant podem prendre v2 = u 2 /3 v1 = (1, 1, 3, 2), ja que els factors lineals no afecten
la independència lineal ni lortogonalitat; finalment,
v1 u 3
2
v2 u 3
1
v3 = u 3 (tv1 + sv2 ) ,
on
t=
= ,
s=
= ,
v1 v1
3
v2 v2
3
i queda v3 = u 3 2/3 v1 1/3 v2 = (1, 1, 0, 0). En definitiva, els vectors (1, 1, 0, 1),
(1, 1, 3, 2) i (1, 1, 0, 0) formen una base ortogonal de S.
v2 = u 2 tv1 ,
on
t=
(b) Si S e s un pla de R3 dequacio Ax + By + C z = 0, posem w = (A, B, C) i u = (x, y, z).

Lequacio del pla diu, simplement, que w u = 0, per tant u S si, i nomes si, u w, i resulta,
doncs, que S = hwi.
54
4.2 Norma, angle i projeccio ortogonal

La norma (mòdul o longitud) dun vector u Rn es defineix com
q
k u k = u u = x12 + x22 + + xn2 ,

on u = (x1 , x2 , . . . , xn ).
Proposicio 4.5 La norma compleix les propietats seguents:
(a) k u k > 0 si u 6= 0.
(b) k tu k = | t |k u k per a tot t R.
(c) k u + v k2 = k u k2 + k v k2 si, i nomes si, u v (teorema de Pitàgores).
(d) | u v | k u kk v k (desigualtat de Schwarz).
(e) k u + v k k u k + k v k (desigualtat triangular).
D EMOSTRACI O . (a) Per definicio.
(b) k tu k =
(tu) (tu) = t 2 u u = | t | u u = | t |k u k.
(c) En general es compleix que

k u + v k2 = (u + v) (u + v) = k u k2 + k v k2 + 2u v ,
per tant el teorema de Pitàgores resulta evident.
(d) Si v = 0 es produeix la igualtat; suposem que v 6= 0 i considerem els vectors
u 0 = tv
u 00 = u u 0 ,
on
t=
uv
.
vv
Evidentment u = u 0 + u 00 i, a mes, u 0 u 00 , ja que

u 0 u 00 = (tv) (u tv) =
uv
(u v)2
(u v)
(v v) = 0 ;
vv
(v v)2
aleshores, aplicant el teorema de Pitàgores tindrem que k u k k u 0 k, e s a dir,

ku k
|u v|
|u v|
kvk =
vv
kvk
o be
|u v| k u kk v k .
55
(e) Aplicant la igualtat que hem fet servir a (c) i la desigualtat de Schwarz tenim que
k u + v k2 = k u k2 + 2u v + k v k2
k u k2 + 2k u kk v k + k v k2 = (k u k + k v k)2 ,
per tant k u + v k k u k + k v k.
Es diu que un vector u e s unitari si k u k = 1. Normalitzar un vector u 6= 0 e s substituir-lo per
u0 =
u
,
ku k
vector que o` bviament e s unitari i conserva les relacions dindependència i ortogonalitat de u

amb altres vectors. Una base formada per vectors unitaris i ortogonals dos a dos es diu que e s
una base ortonormal. La base canònica de Rn nes lexemple mes senzill. De fet, qualsevol
subespai de Rn admet bases ortonormals: nomes cal fer unitaris els vectors duna base ortogonal
del subespai.
Proposicio 4.6 Si B = {u 1 , u 2 , . . . , u n } e s una base de Rn , i C e s la matriu de canvi de base de
B a la base canònica,
B e s base ortonormal
C e s ortogonal .
D EMOSTRACI O . Nomes cal observar que els coeficients pi j de la matriu C t C son els productes
escalars dels vectors de B entre ells,
pi j = u i u j ,
i recordar les nocions de vector unitari i vectors ortogonals.
Observacio 4.7 La comprovacio de que una matriu C e s ortogonal equival, segons aquest resultat, a veure que
n
X
i=1
n
X
ci j 2 = 1
ci j cik = 0
per a tot
quan
j 6= k
(columnes unitàries)
(columnes ortogonals dos a dos) .
i=1
El lector pot comprovar daquesta manera que les matrius seguents son ortogonals:

1 0
0
1
2
2
1 3
1
4
0 0 1 ,
2
1 2 .
,
5 4 3
3
0 1
0
2 2
1
56
Langle (no orientat) entre dos vectors no nuls u i v de Rn es defineix com

(u, v) = arccos
uv
.
k u kk v k
Per justificar aquesta definicio, observem que, segons la desigualtat de Schwarz,

1
uv
1,
k u kk v k
i, com que la funcio cos : [0, ] [1, 1] e s bijectiva per ser decreixent, existeix un u nic
angle [0, ] tal que
uv
.
cos =
k u kk v k
Aquest angle e s el que hem pres com a (u, v). De la definicio resulta, doncs, que (u, v) =
(v, u). A mes, e s immediat comprovar les propietats seguents:
(a) 0 (u, v) .
(b) u i v son linealment dependents si, i nomes si, (u, v) = 0 o .
(c) u v si, i nomes si, (u, v) = /2 .
(d) Si t, s R,
(
(u, v)
si ts > 0
(tu, sv) =
(u, v) si ts < 0 .
Tambe recuperem, daquesta manera, la formula clàssica del producte escalar, generalitzada ara
a Rn :
u v = k u kk v k cos (u, v)
(si u = 0 o v = 0, cos (u, v) no està definit, però es pren u v = 0).
Exemples 4.8 (a) Si B = { e1 , e2 , . . . , en } e s una base ortonormal de Rn i
u = x1 e1 + x2 e2 + + xn en ,
es compleix que xi = u ei = k u k cos i , on i = (u, ei ) per a i = 1, 2, . . . , n; els coeficients
cos i son els cosinus directors de u en la base B, i es pot escriure
u = ku k
n
X
i=1
(cos i )ei ,
amb
n
X
cos2 i = 1 .
i=1
(b) No sempre e s el millor cam fer servir una base ortonormal com a referència. Suposem
que volem determinar les longituds de les diagonals dun parallelogram, del qual coneixem les
longituds dels costats, 2 i 8, i langle agut que formen, 60 . Prenem com a base del pla dos
57
vectors u i v que representen els costats no parallels. Aleshores les diagonals corresponen als
vectors u + v i u v, i tenint en compte que
u u = k u k2 = 4 ,
v v = k v k2 = 64 ,
u v = k u kk v k cos (u, v) = 2 8 cos 60 = 8 ,

resulta
k u + v k2 = (u + v) (u + v) = k u k2 + 2u v + k v k2 = 84
k u v k = (u v) (u v) = k u k 2u v + k v k = 52 ,
per tant les longituds de les diagonals son 84 i 52.

2
Teorema 4.9 (Teorema de la projeccio ortogonal.) Donat un subespai H de Rn , per a cada

vector u Rn existeix un u nic vector u 0 H tal que u u 0 H . La norma k u u 0 k e s la
mnima distància entre u i els vectors de H . Es diu que u 0 e s la projeccio ortogonal de u sobre
H.
D EMOSTRACI O . Escollida una base ortogonal B = { e1 , e2 , . . . , er } de H , i donat el vector
u Rn , es tracta de determinar un vector u 0 = t1 e1 + t2 e2 + + tr er . La condicio u u 0 H
es tradueix en que (u u 0 ) ei = 0 per a i = 1, 2, . . . , r , i daqu obtenim que
u ei
ti =
per a i = 1, 2, . . . , r .
ei ei
Això demostra lexistència i unicitat del vector u 0 . Ara, si v 0 H , i v 0 6= u 0 , tenim que
u v 0 = (u u 0 ) + (u 0 v 0 ) ;
aplicant el teorema de Pitàgores,
k u v 0 k2 = k u u 0 k2 + k u 0 v 0 k2 > k u u 0 k2 ,
i per tant k u v 0 k > k u u 0 k.
Observacions 4.10 (a) El fet que k u u 0 k sigui mnima sexpressa dient que u 0 e s la millor
aproximacio a u dins de H , i aquesta e s la propietat mes u til de la projeccio ortogonal.
(b) El vector u 00 = u u 0 e s la projeccio ortogonal de u sobre el subespai H . En algun cas
e s mes fàcil calcular primer u 00 i obtenir despres u 0 = u u 00 . La relacio u = u 0 + u 00 e s la
descomposicio u nica de u segons la suma directa H H = Rn .
(c) El simètric de u respecte a H e s el vector
u = u 0 u 00 = u 2u 00 = 2u 0 u .
immediat comprovar que k u k = k u k, i que u + u = 2u 0 H .
Es
58
Exemples 4.11 (a) La projeccio ortogonal dun vector u Rn sobre una recta H = hwi e s,
segons el teorema,
uw
u0 =
w.
ww
(b) Si H e s un pla de R3 , definit per una equacio Ax + By + C z = 0 en la base canònica o en
qualsevol base ortonormal, sabem que H = hw i, on w = (A, B, C); per tant, donat u R3
tenim
uw
uw
u 00 =
w,
u 0 = u u 00 = u
w.
ww
ww
(c) El simètric dun vector u Rn respecte al subespai {0} e s u = u. El simètric de u respecte
a una recta H = hwi e s
uw
u = 2
w u.
ww
Finalment, el simètric dun vector u R3 respecte a un pla H = hwi e s
u = u 2
uw
w.
ww
4.3 El mètode dels mnims quadrats

El criteri dels mnims quadrats e s un dels mes habituals a nivell cientfic i tècnic. Com a exemple
elemental daplicacio daquest principi, revisarem en primer lloc la nocio de mitjana aritmètica.
Considerem una sèrie de dades x1 , x2 , . . . , xn i interpretemles com els resultats de n mesuraments duna magnitud X . Qualsevol quantitat x pot ser un valor de centralitzacio de la sèrie
de dades, sempre que satisfaci alguna condicio de proximitat a totes elles com a conjunt. Si
prenem com a mesura de desviacio lexpressio
(x) = (x x1 )2 + (x x2 )2 + + (x xn )2 ,
obtindrem el valor x que minimitza aquesta funcio derivant i igualant a zero:
0 (x) = 2(x x1 ) + 2(x x2 ) + + 2(x xn ) = 0 .
La solucio u nica daquesta equacio e s
x=x=
x1 + x2 + + xn
,
n
expressio que coneixem com a mitjana aritmètica de les dades x1 , x2 , . . . , xn . La funcio presenta efectivament un mnim absolut en aquest punt, perquè la seva gràfica e s una paràbola i el
coeficient principal e s positiu.
59
Per tant, la mitjana aritmètica e s el valor de centralitzacio que minimitza la suma dels quadrats
de les desviacions de les dades. Es pot arribar al mateix resultat aplicant la teoria de la projeccio
ortogonal i projectant el vector x = (x1 , x2 , . . . , xn ) sobre la recta engendrada pel vector w =
(1, 1, . . . , 1): el resultat e s el vector xw, on x e s la mitjana aritmètica.
Generalitzant aquesta idea, considerem ara un sistema de m equacions lineals amb n incògnites
c11 x1 + c12 x2 + + c1n xn = d1
c21 x1 + c22 x2 + + c2n xn = d2

, o matricialment C x = d .
..
cm1 x1 + cm2 x2 + + cmn xn = dm

El sistema e s compatible si, i nomes si, existeix algun vector x Rn tal que k C x d k = 0.
Si e s incompatible (de vegades e s diu que e s un sistema sobredeterminat), el criteri dels mnims
quadrats indica que cal considerar com a solucio aproximada qualsevol vector x que faci mnim
lerror quadràtic, e s a dir, = k C x d k.
Si c1 , c2 , . . . , cn son les columnes de la matriu C, el sistema e s equivalent a la relacio
x1 c1 + x2 c2 + + xn cn = d .
La incompatibilitat equival a dir que d
/ H = hc1 , c2 , . . . , cn i, i per tant cal trobar la projeccio
0
ortogonal d de d sobre H i despres resoldre
x1 c1 + x2 c2 + + xn cn = d 0
(aquest enfocament inclou, i per tant generalitza, el cas de compatibilitat, en el qual d 0 = d).
Això resol conceptualment el problema, però e s u til i senzill sistematitzar els càlculs necessaris.
Teorema 4.12 En les condicions anteriors:
(a) C x = d 0 si, i nomes si, Ax = b, on A = C t C i b = C t d.
(b) x e s u nic si, i nomes si, rang(C) = n; en aquest cas, A e s regular.
D EMOSTRACI O . (a) C x = d 0 significa que C x d H . Per tant, el producte escalar de
cada generador de H (columna ci de la matriu C) per C x d ha de ser zero. Matricialment,
lanullacio daquests productes escalars sexpressa per
C t (C x d) = 0 ,
CtC x = Ctd ,
Ax = b .
(b) Segons el teorema de Rouche-Frobenius, rang(C) = n e s equivalent a que el sistema C x =

d 0 , que sabem que e s compatible, sigui determinat. I això e s equivalent a dir que la matriu
quadrada A sigui regular.
60
Exemples 4.13 (a) (Regressio lineal.) El problema pràctic potser mes frequent e s el de trobar
lequacio de la recta que sajusta millor a una distribucio de punts del pla (recta de regressio).
Sense obtenir formules sistemàtiques (tasca mes pròpia dun curs destadstica), resoldrem un
exemple concret aplicant el teorema anterior.
Suposem que es tracta dajustar una recta als punts de coordenades (0, 0), (2, 1) i (4, 1). La recta
serà y = ax + b, i les condicions

b = 0

0 1
0
a
2a + b = 1 , o be C x = d , on C = 2 1 , x =
i d =1 .
b
4 1
1
4a + b = 1
El sistema e s o` bviament incompatible, el rang e s 2 i, multiplicant per la matriu C t , obtenim

1/4
1
3 6
6
20 6
a
6
a
= 1
.
=
,
=
2
/6
6 3
b
2
b
24 6 20
La recta buscada e s
x
1
+ ,
4 6
que no passa per cap dels tres punts però minimitza lerror quadràtic : concretament, x =
(a, b) = ( 1/4, 1/6), C x = ( 1/6, 2/3, 7/6) i d = (0, 1, 1), per tant
6
.
= k Cx d k =
6
y=
(Si el lector ha dibuixat els tres punts i cau en la temptacio de creure mes adequadala recta
horitzontal y = 1, observarà que lerror quadràtic corresponent a aquesta recta e s 1 > 6/6.)
(b) (Regressio quadràtica.) Un problema anàleg a lanterior e s el de trobar lequacio de la
paràbola que sajusta millor a una distribucio de punts del pla (leleccio del tipus de funcio en un
problema de regressio depèn de diversos factors, un dels quals pot ser la disposicio geomètrica
del punts). Com a illustracio, determinarem el polinomi de regressio quadràtica dels punts
(1, 2), (0, 1), (1, 1) i (2, 0). Lequacio serà y = ax 2 + bx + c, i les condicions
a+bc =2
c=1
,
o be C x = d ,
a + b + c = 1
4a + 2b + c = 0
on
1 1 1
0
0 1
,
C =
1
1 1
4
2 1
x= b
c
2
1
d=
1 .
0
61
El sistema e s incompatible, el rang de C e s 3 i, aplicant novament el procediment indicat en el

teorema anterior, obtenim el sistema
18 8 6
a
1
8 6 2 b = 3 ,
6 2 4
c
2
la solucio del qual e s a = 1/2, b = -13/10 i c = 2/5. Per tant, el polinomi de regressio quadràtica
dels quatre punts donats e s
1
y = (5x 2 13x + 4) ,
10
2 5
.
i lerror quadràtic comès =
5
(c) Considerem finalment el sistema seguent, en el qual rang(C) = 2 i n = 3:

x + 2y + z = 3
1 2 1
3
x
1 1 4
2
x + y + 4z = 2
= .
,
2 3 5 y
5
2x + 3y + 5z = 5
4 6 10
0
4x + 6y + 10z = 0
Multiplicant per la transposada resulta el sistema
22 33 55
x
15
33 50 81 y = 23 ,
55 81 142
z
36
que e s compatible indeterminat i te per solucio general
9
x = 7z
11 .
y = 3z + 1
Val la pena observar que en el cas dun sistema indeterminat, com ho e s aquest, totes les solucions
donen el mateix error quadràtic, ja que aquest error e s = k d 0 d k i aquesta expressio no depèn
de quin vector x ens dona C x = d 0 . Aqu, fent, per exemple, z = 0, surt d 0 = 1/11(13, 2, 15, 30)
i un error quadràtic
10 33
0
= kd d k =
.
11
4.4 Orientacio i producte vectorial

Es defineix una relacio dequivalència entre les bases ordenades de Rn dient que
B ' B0
si, i nomes si,
det(C) > 0 ,
62
on C e s la matriu del canvi de base de B 0 a B. Aquesta relacio e s dequivalència i classifica les

bases de Rn en dos tipus. Orientar Rn e s escollir un dels dos tipus: es diu que les seves bases
son positives, i que les bases de laltre tipus son negatives. En algunes questions (angle orientat,
producte vectorial, girs, rotacions) e s indispensable haver fixat una orientacio, i el criteri habitual
e s prendre com a positives la base canònica de Rn i les del seu tipus.
La interpretacio fsica de la relacio dequivalència e s la seguent. En el pla: si anem del primer
vector de la base al segon pel cam mes curt, o seguim el sentit horari o lantihorari, i aquesta
e s la classificacio. Es habitual prendre com a positives les bases de sentit antihorari. A lespai:
girant un tornavs segons el cam mes curt del primer vector al segon, lestri es mourà en el sentit
habitual prendre com a positives les bases ortogonals
del tercer vector o en sentit contrari. Es
en les quals el tornavs segueix el sentit del tercer vector (regla del tornavs) i les equivalents a
elles.
Exemples 4.14 (a) Si B i B 0 son bases ortonormals de Rn i C la matriu (ortogonal) de canvi de
base, B i B 0 son del mateix tipus si, i nomes si, det(C) = 1.
(b) Si B = {e1 , e2 } e s una base positiva de R2 , {e2 , e1 } e s negativa. A R3 , lefecte de permutar
els vectors duna base depèn del signe de la permutacio. Aix, si B = {e1 , e2 , e3 } e s positiva,
{e3 , e1 , e2 } tambe ho e s, però {e1 , e3 , e2 } e s negativa.
(c) (Angle orientat en el pla.) Recordem que, donats dos vectors no nuls u, v R2 , (u, v)
[0, ] representa langle no orientat entre u i v. Suposem ara orientat R2 . Donats dos vectors
linealment independents u i v, definim langle orientat de u a v com
(
(u, v)
si {u, v} e s base positiva
+
(u, v) =
(u, v) 2 (u, v) si {u, v} e s base negativa .
Si u i v son diferents de zero però linealment dependents, les dues opcions ens donen + (u, v) =
(u, v), ja que (u, v) e s 0 o . Notem que linterval de variacio de + (u, v) e s damplitud
2 . Es immediat comprovar que + (v, u) = + (u, v), i que, si {e1 , e2 } e s la base canònica,
+ (e1 , e2 ) = /2.
(d) (Coordenades polars.) Sigui u = (x, y) 6= 0 un vector arbitrari del pla orientat. Com ja
hem vist, si posem = (u, e1 ), = (u, e2 ), i r = k u k, tenim x = r cos , y = r cos ,
amb cos2 + cos2 = 1 i, per tant, cos = sin . Definim largument del vector u com
= + (e1 , u). Com que el determinant de la matriu del canvi de {e1 , u} a {e1 , e2 } val y, i
sin 0 perquè [0, ], tenim: en els quadrants primer i segon, on y 0, = i cos =
sin = sin ; en els quadrants tercer i quart, on y 0, = i cos = sin = sin . Per
tant,
x = r cos ,
y = r sin
u = (x, y) 6= 0 de R2 .
63
El mòdul r i largument son les coordenades polars del vector u.

(e) (Orientacio de plans a lespai.) La nocio dorientacio per a subespais de Rn e s anàloga a
la que hem descrit per a Rn . Limitantnos ara a R3 , cal observar que lorientacio de lespai no
determina una orientacio en els seus plans, i això reflecteix el fet que un observador pot situar
se a qualsevol dels dos costats dun pla. El procediment per orientar un pla H de lespai e s
el seguent: escollim un dels dos sentits possibles dels vectors ortogonals al pla (recordem que
dim H = 1), seleccionant un vector concret w H ; llavors orientem el pla H prenent com a
positives les bases {u, v} de H tals que {u, v, w} e s positiva a R3 .
Considerem, com a illustracio, el pla dequacio x 2y + z = 0. Lorientem escollint el vector
ortogonal w = (1, 2, 1). Donada una base del pla, per exemple {(2, 1, 0), (0, 1, 2)}, podem
classificarla com a positiva perquè ho e s a R3 la base {(2, 1, 0), (0, 1, 2), (1, 2, 1)}, ja que la
matriu del canvi a la base canònica i el seu determinant son
2 0
1
C = 1 1 2 i det(C) = 10 > 0 .
0 2
1
Considerem lespai R3 orientat de la forma habitual. Introduirem el producte vectorial duna

manera constructiva que posarà de manifest les seves propietats caracterstiques.
Teorema 4.15 Donats dos vectors linealment independents u, v R3 , existeix un u nic vector
w R3 tal que:
(a) w u i w v.
(b) k w k = k u kk v k sin , on = (u, v).
(c) {u, v, w} e s una base positiva de R3 .
D EMOSTRACI O . Escrivim u = (x1 , x2 , x3 ), v = (y1 , y2 , y3 ) i w = (z 1 , z 2 , z 3 ). La condicio (a)
dona lloc al sistema seguent:
x1 z 1 + x2 z 2 + x3 z 3 = 0
y1 z 1 + y2 z 2 + y3 z 3 = 0
La solucio general daquest sistema e s
z 1 = A1 t

x2 x3

,
z 2 = A2 t , on A1 =
y2 y3
z 3 = A3 t
)
.

x3 x1

A2 =
y3 y1

x1 x2

.
A3 =
y1 y2
64
De la condicio (b) obtenim

k w k2 = k u k2 k v k2 sin2 = k u k2 k v k2 (1 cos2 ) = k u k2 k v k2 (u v)2 .
Substituint les components de u, v i w resulta
t 2 (A21 + A22 + A23 ) = (x12 + x22 + x32 )(y12 + y22 + y32 ) (x1 y1 + x2 y2 + x3 y3 )2
= (x1 y2 x2 y1 )2 + (x2 y3 x3 y2 )2 + (x3 y1 x1 y3 )2
= A21 + A22 + A23 ,
i daqu t = 1. Aplicant, finalment, la condicio (c), tenim que

x1
x2
x3

y2
y3 = t (A21 + A22 + A23 ) ,
0 < y1
t A1 t A2 t A3
i es dedueix que t = 1. Per tant, queda determinat un u nic vector w = (A1 , A2 , A3 ) que compleix
les tres condicions de lenunciat.
El vector w determinat pel teorema anterior e s el producte vectorial de u i v, escrit des dara
u v. Una regla mnemotècnica per recordar la seva expressio explcita e s la seguent:

e1 e2 e3

u v = x1 x2 x3
y1 y2 y3
on {e1 , e2 , e3 } e s la base canònica de R3 . Això permet estendre la definicio al cas en que u i v
son linealment dependents, posant u v = 0 en concordància amb el determinant formal.
immediat comprovar que el producte vectorial e s una operacio distributiva respecte a la suma,
Es
compatible amb el producte per escalars i anticommutativa: v u = u v. A mes, si {u, v} e s
un conjunt ortonormal, {u, v, u v} e s una base ortonormal positiva de R3 . La propietat seguent,
u til en alguns contextos, e s mes complexa.
Proposicio 4.16 (Doble producte vectorial.) Si u, v, w R3 ,
u (v w) = (u w)v (u v)w .
D EMOSTRACI O . Per tal de simplificar al màxim els càlculs, escollim (sempre e s possible) una
base ortonormal positiva {e1 , e2 , e3 } tal que
u = ae1 ,
v = be1 + ce2
w = pe1 + qe2 + r e3 .
65
Aleshores tenim, fent les operacions,

u (v w) = a(bq cp)e2 abr e3
(u w)v (u v)w = ap(be1 + ce2 ) ab( pe1 + qe2 + r e3 ) ,
i e s evident que els dos resultats coincideixen.
Una primera aplicacio del producte vectorial e s la seguent. Donada una base {u, v} dun pla,
u v e s un generador de la recta ortogonal al pla. Dit duna altra manera igualment u til: si una
recta està definida com a interseccio de dos plans, el producte vectorial dels vectors formats amb
els coeficients de les equacions dels plans e s un generador de la recta.
Finalment, el producte mixt de tres vectors u, v, w R3 es defineix com u (v w), i per tant
coincideix amb el determinant de la matriu de les components dels tres vectors:

x1 x2 x3

u (v w) = y1 y2 y3 .
z1 z2 z3
En particular, u (v w) = 0 si, i nomes si, u, v, w son linealment dependents, i u (v w) =
(u v) w.
66
67
5
Molts processos matemàtics, geomètrics, fsics, qumics i econòmics son representables, si mes
no en primera aproximacio, per relacions lineals entre les variables que hi intervenen. Aquesta
evidència, juntament amb lntima connexio entre les transformacions lineals i el càlcul matricial,
concedeix un paper molt especial a aquest captol i el seguent.
5.1 Definicions i exemples

Observem en primer lloc que, de la mateixa manera que e s habitual descriure una funcio f :
R R per una formula com f (x) = x 2 + 3x, o per lequacio equivalent y = x 2 + 3x, una
transformacio entre dos espais euclidians, per exemple T : R3 R2 , es pot definir per una
formula com
T (x, y, z) = (x y 2, x + y + 3z 2 ) ,
o per les equacions corresponents
(
x0 = xy 2
y 0 = x + y + 3z 2 .
Recordem tambe la nomenclatura relativa a les aplicacions en general. Sigui T : A B

una aplicacio entre dos conjunts arbitraris. Si T (a) = b, direm que b e s la imatge de a per la
68
transformacio T i que a e s una antiimatge de b. Daltra banda, es diu que T e s injectiva si a 6= a 0

implica T (a) 6= T (a 0 ). Es diu que T e s exhaustiva si per a qualsevol b B existeix algun a A
tal que T (a) = b. Es diu que T e s bijectiva si e s injectiva i exhaustiva. Si T e s bijectiva, cada
element b B te una sola antiimatge a A, i escrivint T 1 (b) = a definim una nova aplicacio
T 1 : B A, anomenada inversa de T . Mes en general, el smbol T 1 (b) denota el conjunt
de totes les antiimatges de lelement b B, encara que T no sigui bijectiva. Finalment, donades
dues aplicacions T : A B i S : B C, podem formar la composicio de S i T , que e s
laplicacio S T : A C definida per (S T )(a) = S(T (a)).
Definicio 5.1 Una transformacio T : Rn Rm e s lineal si compleix les condicions
(a) T (u + u 0 ) = T (u) + T (u 0 )
(b) T (tu) = t T (u)
per a qualssevol t R, u, u 0 Rn . De les propietats (a) i (b) es dedueix immediatament que
T (0) = 0, que T (u u 0 ) = T (u) T (u 0 ) i que, en general,
T (t1 u 1 + t2 u 2 + + tk u k ) = t1 T (u 1 ) + t2 T (u 2 ) + + tk T (u k ) .
Una transformacio lineal T : Rn Rn sanomena un endomorfisme de Rn , i aquest e s el cas
que tractarem amb mes freque` ncia.
Teorema 5.2 (Caracteritzacio matricial.) Una transformacio T : Rn Rm e s lineal si, i

nomes si, es pot representar matricialment per
Y = AX .
D EMOSTRACI O . () Donades les bases B = {u 1 , u 2 , . . . , u n } de Rn i B 0 = {v1 , v2 , . . . , vm } de
Rm , siguin
x1
y1
a11 a12 a1n
x2
y2
a21 a22 a2n
X = . ,
Y =
i
A
=

...................
..
ym
am1 am2 amn
xn
les columnes de components dun vector arbitrari u Rn i un vector arbitrari v Rm en les
bases respectives i la matriu obtinguda de les relacions
T (u j ) =
m
X
i=1
ai j vi
per a
j = 1, 2, . . . , n ,
69
que expressen les imatges dels vectors de la primera base com a combinacions lineals dels vectors
de la segona. Aplicant la linealitat de T al càlcul de la imatge del vector
u=
n
X
xj u j
j=1
obtenim que
T (u) = T
n
X
n
n
X
X
xj u j =
x j T (u j ) =
xj
j=1
n X
m
X
j=1
ai j x j vi =
j=1 i=1
i, comparant amb v =
m
X
j=1
m
n
X
X
i=1
ai j x j
m
X
ai j vi
i=1
vi
j=1
yi vi , resulta que la relacio intrnseca
i=1
v = T (u)
es tradueix en components per
yi =
n
X
ai j x j
per a i = 1, 2, . . . , m ,
j=1
o, matricialment,
Y = AX .
() Si T està definida respecte a dues bases per Y = AX , on A e s una matriu arbitrària m n,
e s evident que, si Y1 = AX 1 , Y2 = AX 2 i t R, aleshores
A(X 1 + X 2 ) = AX 1 + AX 2 = Y1 + Y2
A(t X 1 ) = t AX 1 = tY1 ,
i per tant T e s lineal.

Observacions 5.3 Podem extreure mes informacio daquest teorema.
(a) Les components de les imatges T (u 1 ), T (u 2 ), . . . , T (u n ) en la base {v1 , v2 , . . . , vm } formen
les columnes de la matriu A, que rep el nom de matriu de T relativa a les dues bases:
a11 a12 a1n

a21 a22 a2n
A=
................... .
am1 am2 amn
Simbolitzarem aquesta relacio escrivint A = M(T, B, B 0 ).
70
a dir, una
(b) Aquestes imatges determinen T i, a mes, poden ser escollides arbitràriament. Es
vegada fixades bases dels dos espais, tota matriu A del tipus m n descriu una transformacio
lineal T .
(c) A efectes pràctics, conve notar que e s caracterstic duna transformacio lineal el fet que les
seves equacions vinguin donades per relacions lineals homogènies entre els dos conjunts de
variables. Amb aquest criteri, el lector pot observar que lexemple de transformacio proposat a
linici daquest captol no e s, en absolut, lineal.
(d) En el cas dun endomorfisme, emprarem nomes una base de referència. La matriu serà quadrada, i escriurem simplement A = M(T, B). Les columnes de A ens donaran les components
de les imatges T (u 1 ), T (u 2 ), . . . , T (u n ) en funcio dels vectors u 1 , u 2 , . . . , u n .
fàcil comprovar que les funcions lineals f : R R son les de la forma
Exemples 5.4 (a) Es
y = f (x) = ax (notem lanalogia formal amb el cas general, on tenim la relacio matricial
Y = T (X ) = AX ). Com e s ben sabut, amb funcions lineals descrivim, entre molts altres
processos, costos, interessos, descomptes, recàrrecs...
(b) (Equacions dun gir en el pla orientat.) Un gir dangle [0, 2 ) al voltant de lorigen del pla orientat R2 e s la transformacio G : R2 R2 que conserva el mòdul dels vectors i incrementa els arguments en un angle . Per tant, G(0, 0) = (0, 0) i, si u = (x, y) =
(r cos , r sin ), i v = G(u) = (x 0 , y 0 ), tenim les relacions
x 0 = r cos( + ) ,
y 0 = r sin( + ) ,
que, introduint les variables x, y, ens condueixen a unes equacions tpicament lineals segons el
teorema de caracteritzacio:
)
0

x 0 = x cos y sin
x
cos sin
x
o be
=
.
0
0
y
sin
cos
y
y = x sin + y cos
Aix doncs, tot gir G del pla orientat e s un endomorfisme, i la seva matriu en la base canònica e s

cos sin
A = M(G, Bc ) =
.
sin
cos
(c) (Equacions duna simetria axial en el pla.) Considerem la simetria S : R2 R2 respecte a
la recta x = 3y (eix de simetria). Suposant ara comprovades per exemple geomètricament
les condicions de linealitat, nomes caldrà trobar les imatges dels dos vectors de la base canònica
per determinar la matriu. Aplicant la formula del captol anterior,
S(u) = 2
uw
w u,
ww
71
i tenint en compte que un vector director de leix de simetria e s, per exemple, w = (3, 1),
obtenim S(1, 0) = ( 4/5, 3/5) i S(0, 1) = ( 3/5, 4/5). Per tant, lequacio matricial daquesta
simetria axial en la base canònica e s
0

1 4
3
x
x
=
.
0
y
y
5 3 4
En aquest exemple hem fet servir el teorema de caracteritzacio en el sentit recproc del de lexemple anterior: suposant justificada a priori la linealitat, laprofitem per trobar amb el mnim
esforc les equacions generals de la transformacio.
5.2 Canvis de base

Tot i que e s habitual i sovint convenient treballar amb la matriu duna transformacio lineal
relativa a les bases canòniques, e s important conèixer els efectes dels canvis de base. Per fixar
idees, considerarem amb detall nomes el cas dels endomorfismes.
Teorema 5.5 (Formula del canvi de base.) Considerem un endomorfisme T : Rn Rn i dues
bases, B i B 0 . Si A = M(T, B), A0 = M(T, B 0 ), i C e s la matriu del canvi de base de B 0 a B,
aleshores
A0 = C 1 AC .
D EMOSTRACI O . La relacio u = T (v) es tradueix per Y = AX en la base B, i per Y 0 = A0 X 0 en
la base B 0 . El pas de X 0 a Y 0 es pot obtenir tambe en tres fases: (a) passem el vector u de B 0 a B;
(b) transformem el vector u en v = T (u); (c) passem el vector v de B a B 0 . Matricialment,
(a) X 0 7 X = C X 0
(b) X 7 Y = AX = AC X 0
(c) Y 7 Y 0 = C 1 Y = C 1 AC X 0 .
Com que aquesta era la transformacio que duia a terme la matriu A0 , deduim que
A0 = C 1 AC .
Observacio 5.6 El lector no hauria de tenir dificultat en generalitzar el resultat anterior per a
una transformacio lineal qualsevol T : Rn Rm aplicant un canvi de base a cada espai: Si B1
i B10 son bases de Rn , i B2 i B20 son bases de Rm , la relacio entre les matrius
A = M(T, B1 , B2 )
A0 = M(T, B10 , B20 )
72
e s
A0 = D 1 AC ,
on C e s la matriu del canvi de base en el primer espai, de B10 a B1 , i D e s la matriu del canvi de
base en el segon, de B20 a B2 .
Exemples 5.7 (a) Si B 0 e s una base ortogonal positiva del pla orientat, formada per dos vectors
de la mateixa longitud, e10 = (a, b) i e20 = (b, a), la matriu del gir dangle en la base B 0
coincideix amb la matriu del gir en la base canònica, ja que tenim

a b
cos sin
C=
, A=
b
a
sin
cos
i
0
A =C
1
AC = 2
a + b2
a b
b a

cos sin
sin
cos

a b
b
a

=
cos sin
sin
cos
(b) Considerem la simetria axial estudiada a la seccio anterior. Amb el vector director de leix
e10 = (3, 1) i el vector ortogonal e20 = (1, 3) podem formar una base adaptada a la simetria,
B 0 = {e10 , e20 }. Es evident que S(e10 ) = e10 , S(e20 ) = e20 i, per tant, la matriu de la simetria axial
en aquesta base e s ben simple:

1
0
0
A =
.
0 1
Si ara volem calcular la matriu de S en la base canònica, nomes cal desfer el canvi A0 = C 1 AC,
obtenint
A = C A0 C 1 .
Aplicant aquesta nova relacio resulta

3 1
1
0
0
C=
,
A =
1
3
0 1
1
A=
5
4
3
3 4
(c) El determinant de la matriu dun endomorfisme no varia en fer un canvi de base. En efecte:
aplicant determinants a la formula del canvi resulta
det(A0 ) = det(C 1 AC) = det(C 1 ) det(A) det(C) =
1
det(A) det(C) = det(A) .
det(C)
(d) Suposem que un endomorfisme T : R2 R2 queda definit de la manera seguent:

T (1, 2) = (5, 1),
T (2, 1) = (4, 3) .
73
Per trobar A = M(T, Bc ) nomes cal observar que tenim una nova base B 0 , formada pels vectors
e10 = (1, 2) i e20 = (2, 1), i considerar les matrius seguents:

1 2
5 4
0
0
C=
(canvi de B a Bc )
i
B = M(T, B , Bc ) =
.
2
1
1 3
Aplicant un raonament similar al del teorema del canvi de base resulta

1 3 14
1
.
A = BC =
5 5 5
5.3 Nucli, imatge i rang

Considerem una transformacio lineal arbitrària T : Rn Rm . Es defineix el nucli de T com
el subespai format per les antiimatges del vector 0: simbòlicament
Nuc(T ) = T 1 (0) = {u Rn : T (u) = 0} .
Es defineix la imatge de T com el subespai format per totes les imatges dels vectors de Rn :
Im(T ) = {v Rm : v = T (u), u Rn } .
(El lector hauria de comprovar que, efectivament, Nuc(T ) i Im(T ) son subespais.) Finalment, el
rang de T es defineix per
rang(T ) = dim Im(T ) .
Teorema 5.8 (a) Si B = {u 1 , u 2 , . . . , u n } e s una base de Rn , {T (u 1 ), T (u 2 ), . . . , T (u n )} e s un
sistema de generadors del subespai Im(T ). Per tant, rang(T ) e s el rang de qualsevol matriu A
que representi a T .
(b) dim Nuc(T ) + dim Im(T ) = n.
D EMOSTRACI O . (a) Si v Im(T ), sabem que v = T (u) per a algun u Rn . Com que
u = t1 u 1 + t2 u 2 + + tn u n , resulta
v = T (u) = T (t1 u 1 + t2 u 2 + + tn u n ) = t1 T (u 1 ) + t2 T (u 2 ) + + tn T (u n ) .
Com que les columnes de la matriu A representen, doncs, un sistema de generadors de Im(T ),
queda establerta tambe la identitat entre els rangs.
(b) El sistema dequacions descrit matricialment per AX = 0 defineix el nucli. Per tant,
dim Nuc(T ) = n rang(A) = n dim Im(T ) .
74
Corol.lari 5.9 (a) T e s una transformacio exhaustiva si, i nomes si, rang(T ) = m.
(b) T e s injectiva si, i nomes si, Nuc(T ) = {0}, e s a dir, si, i nomes si, rang(T ) = n.
(c) Un endomorfisme T de Rn e s bijectiu si, i nomes si, rang(T ) = n, e s a dir, det(A) 6= 0, on A
e s qualsevol matriu que representi a T .
D EMOSTRACI O . (a) T e s exhaustiva si, i nomes si, Im(T ) = Rm , i això e s equivalent a que
rang(T ) = m.
(b) Si T e s injectiva, o` bviament ha de ser Nuc(T ) = {0}. Recprocament, si Nuc(T ) = {0}, de
la igualtat T (u) = T (u 0 ) resulta T (u u 0 ) = 0, e s a dir, u u 0 Nuc(T ) i, per tant, u = u 0 :
això significa que T e s injectiva. La segona equivalència e s una conseque` ncia immediata de la
formula de les dimensions del teorema anterior.
(c) Es desprèn dels dos apartats anteriors.
Exemples 5.10 (a) Considerem la projeccio ortogonal de Rn sobre un subespai H , e s a dir, la

transformacio P : Rn Rn tal que P(u) = u 0 , projeccio ortogonal de u sobre H . Es fàcil
veure que P e s lineal, i per tant un endomorfisme de Rn , i tambe que
Nuc(P) = H ,
Im(P) = H
rang(P) = dim(H ) .
(b) Aquest exemple tambe permet illustrar una formula general per al càlcul dantiimatges que
e s u til en alguns contextos i el lector pot justificar com a exercici: si v = T (u), aleshores
T 1 (v) = u + Nuc(T ) ,
e s a dir, coneguda una antiimatge concreta u de v, totes les antiimatges daquest vector sobtenen
sumant a u un vector arbitrari del nucli de la transformacio.
(c) Considerem ara, tambe a Rn , la simetria respecte a un subespai H , e s a dir, la transformacio
S : Rn Rn tal que S(u) = u , simètric de u respecte a H . Si H = {0} e s diu que S e s la
simetria central, si H e s una recta S e s una simetria axial, i si H e s un pla S e s una simetria
plana. Tambe e s fàcil veure que S e s lineal, i per tant un endomorfisme de Rn , però en aquest
cas resulta
Nuc(S) = {0},
Im(S) = Rn
i
rang(S) = n ,
de manera que S e s una transformacio bijectiva.
75
5.4 Operacions
Com en el cas dels canvis de base, en aquesta seccio ens limitarem a considerar operacions amb
endomorfismes, deixant al lector la senzilla tasca de generalitzar la major part de les idees i els
resultats a transformacions lineals entre espais diferents.
Si t R, i T i S son endomorfismes de Rn , e s immediat comprovar que les transformacions de
Rn en si mateix definides per
(T + S)(u) = T (u) + S(u)
(t T )(u) = t T (u)
u Rn
son lineals. I establir les corresponents relacions matricials:

M(T + S, B) = M(T, B) + M(S, B)
M(t T, B) = t M(T, B) .
Anàlogament, e s fàcil veure que la transformacio composta ST e s lineal, i correspon al producte

de matrius:
M(S T, B) = M(S, B)M(T, B) .
Finalment, recordem que, si A = M(T, B), T e s bijectiu si, i nomes si, A e s regular. Seguint
la mateixa tècnica que en els casos anteriors, es pot provar que, en aquest supòsit, T 1 tambe e s
lineal i
M(T 1 , B) = M(T, B)1 .
Es important esmentar lexistència, per a cada n, de lendomorfisme anomenat identitat, denotat
per I : Rn Rn i definit per I (u) = u per a tot u Rn . La matriu daquest endomorfisme en
qualsevol base e s la matriu unitat I , i daqu labus de notacio que fem. Les relacions de I amb
les dues darreres operacions son les seguents:
T I =T = I T
i, si T e s bijectiu,
T T 1 = I = T 1 T .
5.5 Endomorfismes i producte escalar

Estudiarem ara diversos tipus dendomorfismes de lespai Rn que son interessants per la seva
connexio amb lestructura euclidiana, fent especial insistència en els casos del pla i de lespai.
Aquests tipus de transformacions son les projeccions ortogonals i les denominades isometries
(transformacions rgides), entre les quals cal destacar les simetries i, sobre tot, els girs del pla i
les rotacions de lespai.
76
Recordem que, donat un subespai H de Rn , denotem per P i S, respectivament, la projeccio

ortogonal sobre H i la simetria respecte a H . Les relacions seguents son clares:
P 2 = P,
S2 = I
S = 2P I .
Les matrius de P i S relatives a una base B 0 adaptada a la suma directa H H son, respectivament,
0
A =
..
.
1
0
..
0
B =
..
1
1
..
.
1
Aquestes matrius A0 i B 0 son simètriques, però tambe ho son les matrius respectives A i B en la
base canònica Bc . En efecte, suposant ortonormal la base B 0 , la matriu C del canvi de base de B 0
a Bc e s ortogonal, per tant C 1 = C t , A = C A0 C t i
At = (C A0 C t )t = C A0 C t = A ,
i un argument anàleg serveix per a la matriu B. A mes, la matriu B e s ortogonal, perquè B t = B
i B 2 = I , de manera que B t B = I .
Abans de discutir la nocio general disometria, passem als girs del pla i les rotacions de lespai.
La descripcio dels girs en el pla orientat sha dut a terme amb tota generalitat en la primera seccio
daquest captol, i serà u til per a lestudi de les rotacions.
Donats un angle [0, 2 ) i un vector unitari w de lespai R3 orientat, considerarem el pla H =
hwi orientat per w, i definirem la rotacio dangle al voltant del vector w com lendomorfisme
R : R3 R3 descrit de la forma seguent en termes de la suma directa R3 = hwi H :
R(u) =
si u hwi
G(u) si u H
on G e s el gir dangle en el pla H orientat per w. Com que qualsevol vector u R3 sescriu
de forma u nica com u = u 0 + u 00 , amb u 0 H i u 00 hwi, tenim, per linealitat,
R(u) = R(u 0 ) + R(u 00 ) = G(u 0 ) + u 00 .
77
Evidentment, si {u, v} e s una base ortonormal positiva de H , la matriu de R en la base ortonormal

positiva {w, u, v} de R3 e s
1
0
0
0 cos sin .
0 sin cos
El resultat seguent dona una formula de càlcul directe dimatges per a les rotacions.
Proposicio 5.11 Si R e s la rotacio dangle al voltant del vector unitari w R3 ,
R(u) = u cos + (1 cos )(u w)w + (w u) sin
u R3 .
D EMOSTRACI O . Escrivim u = u 0 + u 00 . Si u 0 = 0 aleshores u = u 00 , i la formula dona,

efectivament, R(u) = R(u 00 ) = u 00 . Si u 0 6= 0, {u 0 , w u 0 } e s una base ortogonal positiva de H ,
amb ku 0 k = kw u 0 k. Per tant,
R(u 0 ) = u 0 cos + (w u 0 ) sin .
A mes, R(u 00 ) = u 00 = (u w)w, ja que kwk = 1. Finalment, w u 0 = w u. Aix doncs,
R(u) = R(u 0 ) + R(u 00 ) = u 0 cos + (w u) sin + (u w)w =
= u cos + (1 cos )(u w)w + (w u) sin .
Exemple 5.12 Calculem la imatge del vector u = (1, 0, 1) segons la rotacio de 90 al voltant
del vector w = (1, 1, 1). La rotacio està ben definida perquè el vector w precisa el sentit de leix
de rotacio, però a la formula caldrà fer servir el vector normalitzat, e s a dir, w = 1/ 3(1, 1, 1).
Els càlculs parcials principals i el resultat son:
2
uw = ,
3
w u = (1, 0, 1)
3
1
3
R(u) = (2 +
3, 2, 2 3) .
Les isometries formen una classe important dendomorfismes de lespai euclidià. Son les transformacions rgides, e s a dir, aquelles que no deformen les figures de lespai. Intuitivament, la
rigidesa equival a la conservacio de les longituds dels vectors i dels angles entre ells; com que
aquests dos conceptes estan estretament lligats al producte escalar, e s natural donar la definicio
seguent.
Un endomorfisme T : Rn Rn e s una isometria de Rn si conserva el producte escalar dels
vectors, e s a dir, si
T (u) T (v) = u v
u, v Rn .
78
(Aquesta condicio e s tan forta que es pot demostrar que tota transformacio T : Rn Rn que
conserva el producte escalar ha de ser lineal.) A partir de la definicio, e s immediat comprovar
que tota isometria T
(a) conserva lortogonalitat: si u v, T (u) T (v) ;
(b) conserva la norma: kT (u)k = kuk u Rn ;
(c) conserva els angles no orientats: si u, v 6= 0, (T (u), T (v)) = (u, v) ;
(d) e s bijectiva .
Proposicio 5.13 Si A e s la matriu dun endomorfisme T : Rn Rn relativa a una base

ortonormal (per exemple, la base canònica),
T e s isometria
A e s ortogonal .
D EMOSTRACI O . () Si T e s una isometria ha de conservar els productes escalars entre els

vectors de la base ortonormal de referència, condicio que es tradueix en la relacio At A = I .
() Recprocament, la condicio At A = I expressa que es conserven els productes escalars
entre els vectors de la base i, per tant, tambe es conserva el producte escalar de qualsevol parell
de vectors.
Exemples 5.14 (a) Aplicant aquesta caracteritzacio matricial de les isometries e s fàcil comprovar, a partir de les matrius corresponents, que totes les simetries, els girs del pla i les rotacions
de lespai son isometries, mentre que les projeccions ortogonals no ho son.
(b) De la mateixa manera, o directament per la definicio, es demostra que la identitat I , la inversa
de qualsevol isometria i la composicio disometries tambe son isometries.
(c) Tenint en compte que el determinant de la matriu dun endomorfisme no depèn de la base a la
qual està referida, les isometries es poden classificar en dos tipus. Les isometries directes son les
que compleixen que det(A) = 1, i evidentment conserven lorientacio de lespai vectorial i, per
tant, son realitzables fsicament: els girs del pla i les rotacions de lespai, aix com la identitat
(gir o rotacio de 0 ), la simetria central del pla (gir de 180 ) i les simetries axials de lespai
(rotacions de 180 ) son isometries directes. Les isometries inverses son les que compleixen
que det(A) = 1 i, per tant, inverteixen lorientacio de lespai vectorial i no son realitzables
fsicament: les simetries axials del pla i la simetria central i les simetries planes de lespai son
isometries inverses.
79
Una questio o` bvia en aquest punt e s la seguent: hem esgotat, amb els exemples precedents, el
catàleg disometries? La resposta es donarà en el pròxim captol, aplicant parcialment la teoria
de la diagonalitzacio de matrius, i proverà un criteri per classificar una isometria a partir de la
seva matriu en una base ortonormal (la base canònica, per fixar idees). Limitarem lestudi als
casos del pla i lespai, els mes interessants des del punt de vista fsic.
80
81
6
Dentre els procediments de reduccio de matrius a formes senzilles, la diagonalitzacio e s un

dels mes u tils de cara a les aplicacions pràctiques del càlcul matricial. A diferència daltres
situacions, en aquesta questio sobtenen millors resultats en el cas complex que en el cas real, ja
que un punt crucial e s la descomposicio del polinomi caracterstic i això fa intervenir el teorema
fonamental de làlgebra (vegeu lapèndix B). Exposarem la teoria en el cas real, tot remarcant
els punts on lus dels nombres complexos suposa variacions. I encara que el marc natural de
la diagonalitzacio e s el dels endomorfismes, serà convenient traduir les nocions i els resultats al
llenguatge de les matrius quadrades, que e s lhabitual de la tècnica.
6.1 Endomorfismes diagonalitzables

Hem vist en el captol anterior que les matrius de la simetria axial S : R2 R2 respecte a la
recta x = 3y, en la base canònica i en la base adaptada B 0 = {(3, 1), (1, 3)}, son respectivament

1 4
3
1
0
i
.
0 1
5 3 4
Observem que la segona matriu permet fer una concisa descripcio de lactuacio de S: (a) deixa
invariants els vectors u de leix de simetria; (b) canvia de signe els vectors v perpendiculars a
leix; (c) converteix qualsevol altre vector del pla, que serà de la forma u + v, en u v.
82
Mes en general, tambe hem comprovat la simplicitat de les matrius de les simetries i les projeccions ortogonals a Rn quan sabem escollir una base adequada.
Recordem que una matriu quadrada A = (ai j ) e s diagonal si ai j = 0 quan i 6= j.
Un endomorfisme T : Rn Rn e s diagonalitzable si la seva matriu en alguna base B 0 e s
diagonal:
A0 =
.
..
.
n
Per diagonalitzar un endomorfisme cal, doncs, trobar n vectors e10 , e20 , . . . , en0 linealment independents tals que T (ei0 ) = i ei0 per a i = 1, 2, . . . , n. Això suggereix les definicions seguents.
Un vector e Rn e s un vector propi dun endomorfisme T si
T (e) = e
per a algun R. En particular, el vector 0 e s un vector propi amb qualsevol R. Per tant,
nomes direm que un nombre R e s un valor propi de T si existeix algun vector e 6= 0 tal que
T (e) = e. Cada vector propi e 6= 0 està associat a un u nic valor propi, perquè
e = T (e) = e
( )e = 0
=.
La condicio de vector propi es pot escriure en la forma (T I )(e) = 0, i això e s equivalent a

dir que
e Nuc(T I ) .
Ara podem tornar a la definicio inicial, i dir que T e s diagonalitzable si, i nomes si, existeix una
base de Rn formada per vectors propis de T . I com que la condicio e Nuc(T I ) dona una
descripcio operativa dels vectors propis de valor propi , ens ocuparem en primer lloc de veure
com podem obtenir tots els valors propis de T .
Proposicio 6.1 e s un valor propi de T si, i nomes si, det( I T ) = 0.
D EMOSTRACI O . Recordem que un endomorfisme te nucli no nul si, i nomes si, el seu determinant e s zero; per tant, existeixen vectors e 6= 0 dins de Nuc(T I ) si, i nomes si,
det(T I ) = 0, i això e s equivalent a dir que det( I T ) = 0.
83
Introduirem, doncs, una variable x i calcularem det(x I T ), e s a dir, det(x I A), on A e s

qualsevol matriu que representi a T (vegeu la primera de les observacions seguents). El resultat
e s un polinomi de la forma
det(x I T ) = x n A1 x n1 + A2 x n2 + (1)n An ,
que sanomena polinomi caracterstic de T . Les seves arrels, cada una amb la multiplicitat
corresponent, son els valors propis de T . Per a cada arrel , el subespai Nuc(T I ) està
format per tots els vectors propis de T amb valor propi .
Observacions 6.2 (a) El polinomi caracterstic no depèn, com a determinant dun endomorfisme,
de la matriu a partir de la qual es calcula. En efecte: si A i A0 son dues matrius de T , i C e s la
matriu de canvi de base que ens dona A0 = C 1 AC, tenim
det(x I A0 ) = det(C 1 x I C C 1 AC) = det(C 1 {x I A}C)
= det(C 1 ) det(x I A) det(C) = det(x I A) .
(b) A mes del càlcul directe del polinomi caracterstic, e s interessant conèixer un mètode alternatiu. Cada coeficient Ai de la formula de det(x I T ) e s la suma dels menors diagonals dordre
i de la matriu A, e s a dir, menors dordre i que
tenen la seva diagonal principal situada en la
diagonal principal de A. Per a cada i hi ha ni menors diagonals dordre i. En particular, A1
sanomena la traca de A (suma dels coeficients de la diagonal principal), mentre que An e s el determinant de A. Tot i que una demostracio general daquesta formula e s complicada de notacio,
comprovarla per a n = 2 i n = 3 e s un bon exercici daplicacio del càlcul de determinants.
6.2 Condicions de diagonalitzacio

Sigui T un endomorfisme de Rn .
Lema 6.3 Si 1 , 2 , . . . , k son valors propis diferents de T , la suma dels subespais de vectors
propis corresponents e s directa.
D EMOSTRACI O . Aplicarem induccio sobre el nombre de valors propis, k.
Si k=1, no hi ha res a demostrar.
Suposem que k 2 i que lenunciat e s cert per a k 1, e s a dir, que la suma dels k 1 primers
subespais de vectors propis e s directa:
Nuc(T 1 I ) Nuc(T 2 I ) Nuc(T k1 I ) .
84
Per demostrar que la suma dels k subespais e s directa, hem de veure que si ei Nuc(T i I )
per a i = 1, 2, . . . , k, nomes e s possible la igualtat
e1 + e2 + + ek = 0
quan cada ei = 0 (que e s una de les condicions de suma directa).
Aplicant T a aquesta igualtat tenim que
1 e1 + 2 e2 + + k ek = 0 ,
mentre que multiplicant-la per k obtenim
k e1 + k e2 + + k ek = 0 .
Restant aquestes dues igualtats resulta que
(k 1 )e1 + (k 2 )e2 + + (k k1 )ek1 = 0 .
Com que els coeficients daquesta suma son diferents de zero, i la suma dels k 1 primers
subespais e s directa, podem assegurar que e1 = e2 = = ek1 = 0 i, en conseque` ncia,
ek = 0.
De vegades, lenunciat daquest lema sexpressa sense massa precisio dient que vectors
propis de valors propis diferents son linealment independents.
Lema 6.4 Si e s un valor propi de T de multiplicitat m, i d = dim Nuc(T I ), aleshores
1 d m.
evident que d 1, ja que la definicio de valor propi garanteix lexistència
D EMOSTRACI O . Es
dalgun e 6= 0 dins de Nuc(T I ).
Prenem ara una base {e1 , e2 , . . . , ed } de Nuc(T I ) i lampliem fins a obtenir una base
{e1 , e2 , . . . , ed , ed+1 , . . . , en } de Rn . Laspecte de la matriu de T en aquesta base e s

. .d
C
85
de manera que desenvolupant det(x I T ) per les primeres d columnes queda

det(x I T ) = (x )d det(x I B) .
Això assegura que la multiplicitat de larrel e s m d.
Teorema 6.5 (Condicio necessària i suficient de diagonalitzacio.) Un endomorfisme T de Rn
e s diagonalitzable si, i nomes si, compleix les dues condicions seguents:
(a) El polinomi caracterstic es descompon totalment en factors de primer grau:
det(x I T ) = (x 1 )m 1 (x 2 )m 2 (x k )m k .
(b) La dimensio de cada nucli coincideix amb la multiplicitat del valor propi corresponent:
di = m i
i = 1, . . . , k .
per a
D EMOSTRACI O . (H) Si T e s diagonalitzable, la suma directa dels nuclis coincideix amb tot
lespai Rn , perquè els vectors propis que formen la base en la que la matriu de T e s diagonal
surten necessàriament daquests nuclis. Aix doncs, la matriu diagonal de T
. .m 1
.
.m. 2
. .m k
.
k
dona directament det(x I T ) = (x 1 )m 1 (x 2 )m 2 (x k )m k . Daltra banda, tenim que
di m i per a tot i segons el lema precedent; a mes,
d1 + d2 + + dk = n
perquè la suma directa dels nuclis e s Rn ; finalment,
m1 + m2 + + mk = n
segons resulta de calcular el grau del polinomi caracterstic. De tot això es dedueix que
di = m i
per a
i = 1, . . . , k .
86
(H) Si T compleix les condicions (a) i (b), la suma directa dels nuclis e s Rn , ja que
dim [Nuc(T 1 I ) Nuc(T k I )] =
=
k
X
dim Nuc(T i I ) =
i=1
k
X
i=1
di =
k
X
mi = n .
i=1
Per tant, prenent una base adaptada a la suma directa tindrem una base de Rn formada per vectors
propis de T , el qual serà en conseque` ncia un endomorfisme diagonalitzable.
Corol.lari 6.6 (Una condicio suficient.) Si un endomorfisme T de Rn te n valors propis diferents,
T e s diagonalitzable.
D EMOSTRACI O . En aquest cas, det(x I T ) es descompon totalment en producte de n factors

de primer grau:
det(x I T ) = (x 1 )(x 2 ) (x n ) .
Com que cada m i e s igual a 1, el segon dels lemes previs assegura que di = 1 = m i per a cada
i = 1, . . . , n, per tant T e s diagonalitzable.
Observacions 6.7 (a) Si considerem endomorfismes T : Cn Cn (espai vectorial numèric
complex de dimensio n), la condicio necessària i suficient de diagonalitzacio es redueix a lapartat (b) del teorema, ja que, segons el teorema fonamental de làlgebra, la condicio (a) sempre es
complirà.
(b) Tant el teorema com el corollari permeten determinar si un endomorfisme e s diagonalitzable
sense trobar els vectors propis, ja que, una vegada descompost el polinomi caracterstic, o be te
n arrels diferents, o be nomes cal calcular els rangs de T i I i comprovar si es compleix la
igualtat
m i = n rang(T i I ) per a i = 1, . . . , k .
(De fet, nomes cal comprovar-la quan m i > 1.)
Exemples 6.8 (a) Ni els girs en el pla ni les rotacions a lespai admeten vectors propis si langle
e s 6= 0, ; per tant no son endomorfismes diagonalitzables.
(b) Si la matriu dun endomorfisme T de R2 en la base canònica e s simètrica, T e s diagonalitzable. El lector pot comprovar directament aquesta propietat, que e s un cas particular del teorema
espectral que demostrarem a continuacio.
87
Un endomorfisme T de Rn e s simètric si compleix que

T (u) v = u T (v)
per a qualssevol
u, v Rn .
Si A e s la matriu de T en la base canònica (o en qualsevol base ortonormal), T e s simètric si, i

nomes si, A e s simètrica. En efecte: si X i Y son les columnes de les components de u i v en
aquesta base, la condicio de simetria e s equivalent a que
(AX )t Y = X t AY ,
e s a dir,
X t At Y = X t AY ,
i això e s cert per a qualssevol X i Y si, i nomes si, At = A.

Lema 6.9 Vectors propis dun endomorfisme simètric corresponents a valors propis diferents
son ortogonals.
D EMOSTRACI O . Si T (e) = e i T (e0 ) = e0 , amb 6= , aplicant la condicio de simetria
tenim que
(e e0 ) = T (e) e0 = e T (e0 ) = (e e0 ) ,
i daqu es dedueix que ( )(e e0 ) = 0, i per tant e e0 = 0 ja que 6= 0.
Teorema 6.10 (Teorema espectral.) Tot endomorfisme simètric de Rn e s diagonalitzable, i admet

una base ortonormal de vectors propis.
D EMOSTRACI O . Sigui T lendomorfisme i A la seva matriu (simètrica) en la base canònica.
En primer lloc veurem que det(x I T ) es descompon totalment sobre R. Considerem lendomorfisme T : Cn Cn definit per la matriu A en la base canònica de Cn . Es obvi que
det(x I T ) = det(x I T ), i sabem que si C e s una arrel amb multiplicitat m daquest
polinomi amb coeficients reals tambe ho e s el seu conjugat .
Per veure que ha de tenir la part imaginària nulla, escollim un vector propi u Cn de lendomorfisme T amb valor propi . Com que A te tots els coeficients reals, u tambe e s un vector
propi de T amb valor propi . Aleshores, si U e s la matriu columna de les components de u,
t
t
t
tenim que U U e s un nombre real i positiu, per tant U U = (U U )t = U t U . Pel mateix motiu,
t
t
U AU = (U AU )t = U t AU i, en conseque` ncia,
t
U U = U U = U AU = U t AU = U t U = U t U = U U ,
don es desprèn que = i per tant R.
88
Finalment, comprovarem per induccio sobre n que existeix una base ortonormal de vectors propis
de T . Si n = 1, no hi ha res a dir. Si lenunciat e s cert per al cas n 1, seleccionem un vector
propi unitari en de T amb valor propi i escrivim
Rn = H hen i ,
on H = hen i . Si u H es compleix que T (u) H , perquè
T (u) en = u T (en ) = u en = 0 .
Per tant, T es restringeix a un endomorfisme, encara simètric, de H . Com que H e s un espai
vectorial de dimensio n 1, per hipòtesi dinduccio existeix una base ortonormal de H , diguem
{e1 , e2 , . . . , en1 }, formada per vectors propis de T .
Ara e s evident que {e1 , e2 , . . . , en1 , en } e s una base ortonormal de Rn formada per vectors propis
de T , que per tant e s diagonalitzable.
Exemple 6.11 Estudiem lendomorfisme T de R3 definit en la base canònica per la matriu
2 1 1
A =1 2 1 .
1 1 2
Pel teorema espectral, T e s diagonalitzable. El polinomi caracterstic e s
det(x I A) = x 3 6x 2 + 9x 4 = (x 1)2 (x 4) ,
i els valors propis son 1 (doble) i 4 (simple). Els subespais de vectors propis son
Nuc(T I ) = h (1, 0, 1), (0, 1, 1) i
Nuc(T 4I ) = h (1, 1, 1) i .
El vector u 3 = (1, 1, 1) e s ortogonal als vectors u 1 = (1, 0, 1) i u 2 = (0, 1, 1), com assegura
el lema previ al teorema espectral, però aquests dos u ltims no ho son entre ells i cal aplicar el
mètode de Gram-Schmidt, prenent v1 = u 1 i
v2 = u 2 tv1 ,
amb t =
u1 u2
1
= ,
u1 u1
2
e s a dir, v2 = 2u 2 u 1 = (1, 2 1) per evitar fraccions. Afegint v3 = u 3 , els vectors

v1 = (1, 0, 1) ,
v2 = (1, 2, 1) i v3 = (1, 1, 1)
formen una base ortogonal de vectors propis de T . Normalitzant-los obtenim els vectors
1
w1 = (1, 0, 1) ,
2
1
w2 = (1, 2, 1) i
6
1
w3 = (1, 1, 1) ,
3
89
que formen una base ortonormal B 0 de vectors propis de T . La matriu del canvi e s

3 1 2
1
C= 0
2 2
6
3 1
2
(ortogonal: C 1 = C t ), i la matriu de lendomorfisme T en la base B 0 e s
1
.
1
A0 = C 1 AC = C t AC =
4
6.3 Diagonalitzacio de matrius

Traduirem ara la teoria de diagonalitzacio al llenguatge matricial. Es diu que una matriu quadrada A e s diagonalitzable si existeix una matriu regular C tal que A0 = C 1 AC sigui diagonal.
De cara a la pràctica, cal notar que les columnes de C seran els vectors propis de lendomorfisme
representat per A, i la diagonal de A0 estarà ocupada pels valors propis disposats en el mateix
ordre que shagi assignat als vectors propis.
Si la matriu A e s de coeficients reals, serà convenient distingir dos casos. (1) Direm que A e s
diagonalitzable sobre els nombres reals si podem escollir com a matriu de canvi C una matriu de
coeficients reals (i per tant A0 tambe ho serà). (2) Direm, en canvi, que A e s diagonalitzable sobre
els nombres complexos si hem de prendre C (i per tant A0 ) amb coeficients en general complexos.
En les aplicacions, aquesta segona opcio potser nomes serà admissible en determinats contextos.
Finalment, observem que si B e s una matriu conjugada de A, e s a dir, si B = D 1 AD amb D
regular, i A e s diagonalitzable, aleshores B tambe ho serà, ja que A i B representen un mateix
endomorfisme en bases diferents.
Exemples 6.12 (a) El polinomi caracterstic de la matriu
1 0 0
A =1 1 0
0 0 2
e s det(x I A) = (x 1)2 (x 2). Tot i que aquest polinomi es descompon totalment, la matriu
no e s diagonalitzable, perquè
0 0 0
A I = 1 0 0 , rang(A I ) = 2
0 0 1
90
i, per tant, m 1 = 2 però d1 = 3 rang(A I ) = 1.

(b) El polinomi caracterstic de la matriu
1
1
B=
1
0
0
1
0
0
0
1
2
0
0
2
0
2
e s det(x I B) = (x 1)(x + 1)(x 2)2 . Per saber si la matriu e s diagonalitzable, nomes cal
trobar rang(B 2I ): com que
3
0 0 0
1 1 1 2
,
B 2I =
1
0 0 0
0
0 0 0
tenim que rang(B 2I ) = 2 i d2 = 4 2 = 2 = m 2 . Per tant, B e s diagonalitzable.
(c) En el cas de la matriu
3 0 0
C =0 0 0
1 1 1
apliquem el corollari perquè

det(x I C) = x(x 1)(x 3) ,
i per tant hi ha tres valors propis diferents, condicio suficient per afirmar que C e s diagonalitzable.
(d) El polinomi caracterstic de la matriu
0 0
0
D = 0 0 1
0 1
0
e s det(x I D) = x 3 + x = x(x i)(x + i). Aquesta matriu no e s diagonalitzable sobre R,
perquè el polinomi caracterstic no es descompon totalment en factors de primer grau, mentre
que e s diagonalitzable sobre C perquè presenta tres valors propis diferents.
(e) (Teorema espectral generalitzat.) Tota matriu simètrica e s diagonalitzable amb un canvi
ortogonal.
91
En efecte: podem suposar que la matriu representa un endomorfisme de Rn en la base canònica,

i aplicar el teorema espectral original. Com que la base de vectors propis es pot escollir ortonormal, la matriu C del canvi de base serà ortogonal, e s a dir, complirà que C t C = I (fins i tot
podem fer que det(C) = 1 si volem que el canvi conservi lorientacio). Per tant tenim
A0 = C 1 AC = C t AC .
Aquest resultat e s fonamental per a lestudi de tensors, formes quadràtiques, còniques i quàdriques.
Exemple 6.13 (Càlcul de les potències duna matriu diagonalitzable.) Si A e s una matriu quadrada, les seves potències naturals Am seguiran una llei de recurrència que, en general, e s molt
difcil de trobar directament. En el cas que A sigui diagonalitzable, disposem dun mètode alternatiu passant per la matriu diagonal conjugada A0 = C 1 AC. En efecte: si
A0 =
..
.
n
(amb 1 , 2 , . . . , n no necessàriament diferents), e s immediat comprovar que
m
1
2 m
per a tot m N.
(A0 )m =
..
.
n m
Daltra banda, de la relacio A0 = C 1 AC obtenim

A = C A0 C 1 ,
A2 = C A0 C 1 C A0 C 1 = C(A0 )2 C 1
i en general, per induccio,
Am = C(A0 )m C 1 ,
formula que resoldrà la questio. Com a illustracio, considerem la matriu

2 2
A=
.
1 3
El polinomi caracterstic e s det(x I A) = (x 1)(x 4), i per tant A e s diagonalitzable.
Calculant una base de vectors propis, obtenim

2 1
1 0
0
,
A =
i
C=
1 1
0 4
92
i aplicant la formula de retorn tenim que

2 1
1
0 1 1 1
m
A =
1 1
0 4m 3 1
2

1
1
4m 1 2
2 + 4m 2 + 2 4m
2 2
=
=
+
1
3 1 + 4m 1 + 2 4m
3 1
3 1 2
m N.
6.4 Classificacio de les isometries

Al final del captol anterior hem deixat pendent lestudi general de les isometries, que ara podem
dur a terme aplicant, en part, la teoria de la diagonalitzacio. A la primera part de la seccio
classificarem les isometries del pla, i a la segona les de lespai.
Isometries del pla

En el pla, les u niques isometries possibles son els girs i les simetries axials (la identitat i la
simetria central son, de fet, girs dangles respectius 0 i ). A mes, el determinant les classifica:
una isometria T e s un gir si det(T ) = 1, i e s una simetria axial si det(T ) = 1. Suposarem el
pla orientat per tal de descriure els girs unvocament.
Sigui T una isometria del pla orientat R2 definida en la base canònica per la matriu

a c
A=
.
b d
Aquesta matriu compleix que At = A1 , on

1
d c
a b
1
t
,
A =
A =
c d
a
det(A) b
i det(A) = 1. Estudiem aquests dos casos per separat.
Cas 1. Si det(A) = 1, lanterior igualtat e s

a b
c d

=
d c
b
a
Aleshores la matriu e s de la forma

a b
A=
b
a
(
,
don
d=a
c = b .
amb a 2 + b2 = 1
93
i, en conseque` ncia, existeix un u nic [0, 2 ) tal que a = cos i b = sin . En definitiva, la
matriu de T en la base canònica e s

cos sin
sin
cos
i T e s un gir dangle .
Com a casos particulars tenim la identitat T = I quan = 0 i la simetria central T = I quan
= .
Cas 2. Si det(A) = 1, tenim que

a b
c d

=
Aleshores

A=
d
c
b a
a
b
b a
(
,
don
d = a
c = b.
amb a 2 + b2 = 1 .
Aquesta matriu e s simètrica i, per tant, diagonalitzable en una base ortonormal B 0 = {e10 , e20 }. El
seu polinomi caracterstic e s det(x I A) = x 2 1 = (x 1)(x + 1), de manera que la matriu
de T en la base B 0 e s

1
0
0
A =
.
0 1
T e s, doncs, la simetria axial deix
h e10 i = Nuc(T I ) .
Observacions 6.14 (a) Tambe podem distingir els girs de les simetries a partir del seguent fet:
si la matriu A e s simètrica, T e s la identitat, una simetria axial o la simetria central; si A no e s
simètrica, T e s un gir.
(b) Els girs tals que 6= 0, son les u niques isometries del pla que no tenen vectors propis.
Isometries de lespai
Estudiem ara les isometries de lespai orientat R3 . A diferència de les isometries del pla, les de
lespai sempre tenen vectors propis, ja que el seu polinomi caracterstic, en ser de grau 3, te com
a mnim una arrel real. El resultat seguent ens dona mes informacio.
Lema 6.15 Sigui T e s una isometria de R3 .
94
(a) Si det(T ) = 1, T admet el valor propi 1.

(b) Si det(T ) = 1, T admet el valor propi 1.
D EMOSTRACI O . Sigui A la matriu de T en la base canònica.
(a) La matriu A I compleix que
A I = A At A = (I At )A ,
i per tant
det(A I ) = det(I At ) det(A) = det(I A) = det(A I ) ,
ja que aquests determinants son dordre 3. Aix doncs, det(A I ) = 0 i T admet el valor propi
1.
(b) La matriu A + I compleix que
A + I = A + At A = (I + At )A ,
de forma que
det(A + I ) = det(I + At ) det(A) = det(I + A) .
Per tant, det(A + I ) = 0 i T admet el valor propi 1.
Tal com hem fet en el pla, distingirem dos casos segons el determinant de la isometria.
Cas 1. Si T e s una isometria de R3 amb determinant 1, sigui w un vector no nul amb valor propi
1, i considerem la descomposicio de lespai
R3 = h w i H ,
on
H = h w i .
Si u H , tenim que T (u) w = T (u) T (w) = u w = 0, e s a dir, T (u) H , i la restriccio de

T a H e s una isometria plana. Daltra banda, el vector w determina una orientacio sobre el pla
H i, com que aquesta restriccio no pot ser una simetria perquè el determinant de T e s 1, ha de
ser un gir dangle . Aleshores, si {u, v} e s una base ortonormal positiva de H , la matriu de T
en la base B = {w, u, v} de R3 e s
1
0
0
0 cos sin ,
0 sin cos
i T e s una rotacio dangle al voltant del vector w.
95
Observacions 6.16 (a) Langle depèn de T , de lorientacio de lespai i del sentit del vector
propi w escollit. En particular, la rotacio dangle al voltant de w coincideix amb la rotacio
dangle al voltant de w.
(b) Com a casos particulars tenim la identitat T = I quan = 0 i la simetria axial respecte a la
recta hwi = Nuc(T I ) quan = .
Cas 2. Si T e s una isometria de R3 amb determinant 1, sigui w un vector no nul amb valor
propi 1, i considerem la descomposicio de lespai
R3 = h w i H ,
on
H = h w i .
El mateix raonament dabans ens permet assegurar que la restriccio de T a H tambe e s un gir
dangle . Aleshores, si {u, v} e s una base ortonormal positiva de H , la matriu de T en la base
B = {w, u, v} e s
1
0
0
0 cos sin ,
0 sin cos
i T e s la composicio de la rotacio dangle al voltant del vector w amb la simetria plana
respecte a H . A mes, aquesta composicio e s commutativa, i cal notar que leix de rotacio i el pla
de simetria son ortogonals.
Observacio 6.17 Com a casos particulars tenim la simetria central T = I quan = i la
simetria plana respecte al subespai H = Nuc(T I ) quan = 0.
Podem resumir els resultats obtinguts en aquest apartat amb lesquema de classificacio seguent.
Si la matriu A representa la isometria T en la base canònica o en qualsevol base ortonormal
positiva de R3 , aleshores:
Exemples 6.18 (a) Considerem la isometria T
matriu
0
A =1
0
de R3 que en la base canònica ve definida per la
0 1
0 0 .
1 0
immediat comprovar que aquesta matriu e s ortogonal, no simètrica, que det(A) = 1 i que
Es
Nuc(T I ) = h (1, 1, 1) i. Per tant, es tracta duna rotacio al voltant del vector (1, 1, 1).
Per obtenir langle de rotacio hem de calcular sin i cos . Apliquem la formula
T (u) = u cos + (1 cos )(u w)w + (w u) sin
96
det(A)
A
simètrica
Si
Identitat
Simetria axial respecte al subespai Nuc(T I )
No
Rotacio al voltant del vector w Nuc(T I )
Si
Identitat o simetria central

Simetria plana respecte al subespai Nuc(T I )
No
Composicio duna rotacio al voltant de w Nuc(T + I )

i una simetria plana respecte al subespai h w i
Taula 6.1: Classificacio de les isometries a lespai

amb w =
1 (1, 1, 1)
3
i u = (1, 0, 0):
1
(0, 1, 0) = (1, 0, 0) cos + (1 cos ) (1, 1, 1) + (0, 1, 1) sin .

3
Igualant les components tenim les relacions
1 cos
= 0
1 cos sin
+ =1 ,
3
1 cos sin
= 0
3
3
cos +
amb les quals determinem les raons trigonomètriques de langle buscat:
3
1
cos =
i
sin =
.
2
2
Per tant, T e s la rotacio de 120 al voltant del vector (1, 1, 1): aquests son els dos elements
geomètrics de la isometria.
Hi ha un mètode alternatiu per determinar langle duna rotacio. Es basa en el fet que la traca
de la matriu dun endomorfisme e s invariant pels canvis de base, perquè e s un coeficient del
97
polinomi caracterstic. Comparant la matriu A que tenim amb la matriu de la rotacio en una base
adaptada a leix resulta la relacio
1 + 2 cos = tr(A) .
Quan cos 6= 1, aquesta equacio admet dues solucions 1 , 2 [0, 2), tals que
0 < 1 <
< 2 < 2 .
Si w e s el vector que defineix el sentit de leix de rotacio, escollim un vector no nul u w,

calculem la seva imatge v = T (u) i considerem la base {w, u, v}: si e s positiva, = 1 ; si e s
negativa, = 2 . (Si cos = 1, = 0 o sense ambiguitat.)
A lexemple que acabem destudiar tenim
1 + 2 cos = 0 ,
cos = 1/2 i, per tant, 1 = 120 i 2 = 240 . Prenent w = (1, 1, 1) i u = (1, 1, 0) resulta
v = T (u) = (0, 1, 1). Com que

1
1
0

1 1
1

1
0 1

=3>0

deduim que = 1 = 120 .

(b) Considerem ara lendomorfisme S de R3 definit per
0 1 0
B = M(S, Bc ) = 1 0 0 .
0 0 1
B e s ortogonal i simètrica però det(B) = 1, per tant S e s una simetria plana. El pla de simetria
e s el subespai Nuc(S I ), definit pel sistema dequacions

1
1 0
x
0
1 1 0 y = 0 ,
0
0 0
z
0
que es redueix a lequacio x y = 0. Aquest e s el pla de simetria, i lunic element geomètric
que cal determinar en aquest cas.
98
6.5 Sistemes dequacions diferencials lineals

Una aplicacio interessant de la diagonalitzacio de matrius e s la resolucio de sistemes dequacions
diferencials lineals de primer ordre amb coeficients constants.
Una equacio diferencial de primer ordre en forma normal e s una relacio
y 0 = f (x, y)
entre una variable independent x, una variable y que e s funcio de x i la derivada corresponent
dy
.
dx
y0 =
El problema consisteix a trobar les solucions, e s a dir, les funcions y = y(x) que satisfan la
relacio anterior per a tot x dun cert interval.
Exigint condicions a la funcio f apareixen diversos tipus dequacions diferencials. Si es demana
que f sigui lineal en y, ens trobem amb lequacio diferencial lineal
y 0 = P(x)y + Q(x) .
Si P(x) = e s una constant tenim lequacio diferencial lineal de primer ordre amb coeficient
constant
y 0 = y + Q(x) ,
on suposarem que Q e s una funcio almenys contnua en un interval I R. Si, a mes, Q(x) = 0,
resulta lanomenada equacio homogènia
y 0 = y ,
la mes senzilla de totes però tambe la mes frequent en les primeres aplicacions pràctiques.
Teorema 6.19 (a) Les solucions de lequacio homogènia de primer ordre
y 0 = y
son totes les funcions de la forma
y(x) = Cex
amb C R .
(b) Una solucio particular de lequacio completa

y 0 = y + Q(x)
99
e s la funcio
y p (x) = ex
Q(x)ex d x .
(c) La solucio general de lequacio completa e s

y = y p (x) + Cex
amb C R .
D EMOSTRACI O . (a) Representem per D laccio de derivar. La condicio D(y) = y implica

que
D(yex ) = D(y)ex yex = 0 ,
de manera que la funcio yex e s constant sobre R i resulta
yex = C ,
o be
y(x) = Cex
amb C R .
Recprocament, tota funcio daquesta forma e s solucio de lequacio homogènia.

(b) Provem una funcio de la forma
y p (x) = C(x)ex
com a solucio de lequacio completa, suposant C(x) derivable (mètode de variacio de les constants). Derivant,
y p0 (x) = C 0 (x)ex + C(x)ex ,
i substituint a lequacio completa i simplificant resulta
C 0 (x)ex = Q(x) ,
Z
e s a dir, C(x) =
Q(x)ex d x ,
expressio que ens dona la solucio particular y p (x) indicada a lenunciat.

(c) Si y = y(x) e s una solucio de lequacio completa, y y p ho e s de lhomogènia, per tant
y y p = Cex
y(x) = y p (x) + Cex
amb C R .
Recprocament, tota funcio daquesta forma e s solucio de lequacio completa.

Exemple 6.20 (Condicions inicials.) La constant arbitrària C que apareix en la solucio general
duna equacio de primer ordre es determina imposant a la funcio solucio una condicio addicional,
que acostuma a ser del tipus
y = y0
quan
x = x0 ,
on x0 i y0 son dades (es frequent prendre x0 = 0, i daqu ve el nom de condicions inicials).
100
Com a illustracio, resoldrem lequacio diferencial

y 0 = 2y + x
amb les condicions inicials y = 1/2 quan x = 0.
(a) Lequacio homogènia associada e s y 0 = 2y, i la seva solucio general y = Ce2x , amb C R.
(b) Una solucio particular de lequacio completa serà de la forma y p = C(x)e2x , on

Z
x
1 2x
2x
+
e
C(x) = xe
dx =
2 4
i per tant
yp =
x
1
.
2 4
(c) La solucio general de lequacio proposada e s la famlia

y = Ce2x
1
x
2 4
amb C R .
(d) Imposant les condicions inicials exigides,

1
1
=C ,
2
4
C=
3
4
i queda com a solucio u nica del problema la funcio

y=
3e2x 2x 1
.
4
Un sistema dequacions diferencials de primer ordre per a dues variables x, y que depenen duna
variable independent t e s un parell dequacions de la forma
dx
= F(x, y, t)
x =
dt
.
dy
y =
= G(x, y, t)
dt
Les solucions seran parelles de funcions x = x(t), y = y(t) que amb les seves derivades
satisfacin les dues equacions per a tot t dun cert interval.
Es pot donar a la variable t el significat de temps, i entendre x i y com les coordenades dun punt
mòbil del pla: en aquesta interpretacio cinemàtica del sistema, el vector velocitat v = (x,
y ) està
relacionat amb la posicio (x, y) i el temps t.
101
El sistema e s lineal si les funcions F i G ho son respecte x i y conjuntament, i amb coeficients

constants si ho son els daquestes variables, quedant de la forma
)
x = ax + cy + f (t)
,
y = bx + dy + g(t)
on suposem que f i g son almenys contnues en un interval I R. Si les funcions f i g son
nulles, el sistema e s homogeni.
Matricialment, un sistema dequacions diferencials lineals amb coeficients constants es pot representar per
X = AX + H (t) ,
on

X=
x
y
X =
x
y
A=
a c
b d

i
H (t) =
f (t)
g(t)
Teorema 6.21 Si la matriu A e s diagonalitzable (sobre R o sobre C), el sistema dequacions

diferencials
X = AX + H (t)
es pot resoldre fent el canvi de variables X = CU que diagonalitza A, ja que condueix a un
sistema format per dues equacions lineals de primer ordre resolubles separadament.
D EMOSTRACI O . Com que A e s diagonalitzable (sobre C si e s necessari), existirà una matriu
C tal que D = C 1 AC serà diagonal. Introduint el vector de noves variables U definit per
X = CU , tenim que
U = C 1 X ,
U = C 1 X
C 1 A = DC 1 .
Aleshores
U = C 1 X = C 1 [AX + H (t)] = DC 1 X + C 1 H (t) = DU + C 1 H (t) .
Si posem

U=
u
v

D=
H (t) =
(t)
(t)
aquest sistema sescriu

u = u + (t)
v = v + (t)
)
.
Una vegada resoltes separadament aquestes dues equacions i obtingudes les solucions u = u(t)
i v = v(t), desfent el canvi per X = CU tindrem la solucio general del sistema original, donada
per x = x(t) i y = y(t).
102
Exemples 6.22 (a) Considerem el sistema seguent i la matriu que el defineix:

)

x = x + 2y 4t 3
1 2
i A=
.
2 1
y = 2x + y 2t 1
El polinomi caracterstic e s det(x I A) = x 2 2x 3, i els valors propis 3 i 1. Calculant els
vectors propis obtenim la matriu del canvi que diagonalitza A i el sistema en les noves variables:
)

u = 3u 3t 2
1
1
C=
i
.
1 1
v = v t 1
Resolent per separat les equacions del nou sistema i desfent el canvi trobem la solucio general
del sistema original:
)

3t

u = Ae3t + t + 1
x
1
1
Ae + t + 1
,
=
y
1 1
Bet t
v = Bet t
i, finalment,
x(t) = Ae3t + Bet + 1
y(t) = Ae3t Bet + 2t + 1
)
.
(b) (Condicions inicials.) Les condicions inicials habituals per a un sistema dequacions diferencials de primer ordre son de la forma
x = x0
y = y0
quan
t = t0 ,
on x0 , y0 i t0 (sovint e s t0 = 0) son dades. Això permet determinar les constants que apareixen
en la solucio general i escollir la solucio adequada.
Com a illustracio, considerem un mòbil del pla que a linstant t = 0 es troba en el punt (2, 0) i
en tot moment es regeix per les equacions diferencials de lexemple (a).
Imposant les condicions inicials, tenim que A = 0 i B = 1, constants que defineixen la solucio
u nica o trajectòria del mobil
x = et + 1 ,
y = et + 2t + 1 .
(c) Un fluid que es mou en pla sanomena estacionari quan la velocitat de cada partcula no
depèn mes que de la posicio (i no del temps): altrament dit, si en passar per cada punt totes
les partcules porten la mateixa velocitat, donada pel camp vectorial que assigna a cada punt un
vector. Les solucions dun tal sistema
)
x = F(x, y)
y = G(x, y)
103
son trajectòries x = x(t), y = y(t) que en cada punt tenen un vector tangent prefixat.
Considerem per exemple el sistema
)
x = y
y = x
A cada punt, el camp vectorial e s ortogonal al vector de posicio i de la mateixa longitud: la

descripcio gràfica suggereix que les partcules del fluid seguiran o rbites tancades al voltant de
lorigen en sentit negatiu (el de les agulles del rellotge). La resolucio del sistema ho confirmarà.
La matriu que defineix el sistema i el seu polinomi caracterstic son

0 1
A=
i
det(x I A) = x 2 + 1 = (x i)(x + i) ,
1 0
per tant e s necessari diagonalitzar sobre C: la matriu del canvi i el nou sistema son
)

u = iu
1
1
C=
i
.
i i
v = iv
Resolent aquest nou sistema i desfent el canvi surt la solucio general complexa del sistema original:
)
)
u = Aeit
x = Aeit + Beit
i
amb A , B C .
v = Beit
y = i Aeit i Beit
Imposant que x i y tinguin valors reals per a tot t surt B = A, i escrivint A = C + Di queda,
incloent els signes en les constants,
)
x = C cos t + D sin t
amb C , D R .
y = D cos t C sin t
Afegint ara com a condicions inicials x = r i y = 0 quan t = 0, resulta que C = r i D = 0.
Aleshores, les equacions de la trajectòria del fluid, que confirmen la prediccio feta al principi a
partir del camp vectorial, son
x = r cos t ,
y = r sin t ,
i representen circumferències de centre lorigen i radi r recorregudes en el sentit de les agulles

del rellotge.
Molt probablement, el lector ja haurà notat que el concepte de sistema lineal de primer ordre
amb coeficients constants i el teorema de resolucio son o` bviament generalitzables a mes de dues
variables dependents de t.
104
105
7
Pensant en les aplicacions a la fsica i al càlcul infinitesimal, dediquem aquest captol a lexemple
mes interessant de làlgebra tensorial: els tensors covariants simètrics de segon ordre que aqu
anomenarem simplement tensors i les formes quadràtiques associades.
7.1 Introduccio
Abans de donar la definicio formal de les dues nocions bàsiques que volem considerar, proposarem per a cada una delles una situacio on es presenta de manera natural.
Exemple 7.1 (La forma hessiana duna funcio.) Considerem una funcio real de dues variables
z = f (x, y) i un punt p = (x0 , y0 ) del seu domini. Denotem les derivades parcials segones de
f en el punt p per
2
2
2
2
f
f
f
f
a=
,
b=
=
i
c=
.
2
x p
y x p
x y p
y2 p
Laplicacio q : R2 R que a cada vector u = (x, y) interpretat com un increment a partir
del punt p li assigna
q(u) = q(x, y) = ax 2 + 2bx y + cy 2
106
e s lhessiana de la funcio f en el punt p. El seu estudi condueix a un criteri per seleccionar els
extrems locals de la funcio f dentre els seus punts estacionaris (vegeu la darrera seccio daquest
captol).
En general, una forma quadràtica e s una aplicacio q : Rn R definida per una expressio
polinòmica homogènia de segon grau en les variables x1 , x2 , . . . , xn :
q(u) = q(x1 , x2 , . . . , xn ) =
n
X
ai j xi x j
i, j=1
(on sempre es pot suposar, i aix ho farem, que ai j = a ji ). Observem que si A = (ai j ) i
X = (x1 x2 xn )t tenim que
q(u) = q(x1 , x2 , . . . , xn ) = X t AX .
immediat de comprovar que q(tu) = t 2 q(u).
Es
Exemple 7.2 (El tensor dinèrcia.) Suposem que una partcula de massa m es mou a lespai fent
una rotacio al voltant de leix hwi amb velocitat angular k w k. Si r e s el vector de posicio de la
partcula, sabem que la seva velocitat e s v = w r .
Es defineix el moment cinètic de la partcula a cada posicio r per
M(w) = mr v = mr (w r ) .
La transformacio M e s un endomorfisme simètric de R3 . Definim el tensor dinèrcia de la
partcula a la posicio r per
T (u, v) = u M(v) .
T dona la mateixa informacio que M, però e s mes u til en determinades questions. Per exemple,
lenergia cinètica de la partcula es pot escriure com
1
1
E = mk v k2 = T (w, w) .
2
2
(En el cas dun sòlid rgid compost per un continu de partcules, cal introduir a tot arreu el smbol
dintegracio.)
En general, un tensor (un tensor covariant simètric de segon ordre, per ser precisos) e s una
aplicacio bilineal simètrica T : Rn Rn R. Bilineal vol dir lineal respecte a cada una de
les dues variables vectorials, i això significa que tenim
T (u + u 0 , v) = T (u, v) + T (u 0 , v)
T (tu, v) = t T (u, v)
i dues relacions anàlogues quan fixem u en comptes de v. Simètrica vol dir que T (u, v) =
T (v, u).
107
Teorema 7.3 (Caracteritzacio dels tensors.) Una aplicacio T : Rn Rn R e s un tensor si,

i nomes si, es pot representar matricialment per
T (u, v) = X t AY ,
on A e s una matriu simètrica.
D EMOSTRACI O . El raonament e s molt semblant al del teorema de caracteritzacio de les transformacions lineals del captol 5, aix que el deixarem com a exercici per al lector interessat.
Observacions 7.4 (a) A la demostracio anterior es comprova que, si B = {e1 , e2 , . . . , en } e s una
base de Rn , els escalars
ai j = T (ei , e j )
determinen totalment T , poden ser escollits arbitràriament sempre que ai j = a ji (simetria) i son
els coeficients de la matriu A, que e s la matriu de T en la base B. Simbolitzarem aquesta u ltima
relacio per A = M(T, B). Aix doncs, si X i Y son les columnes respectives de components de
u i v en la base B, tenim que
T (u, v) = X t AY =
n
X
ai j xi yj .
i, j=1
En general, els coeficients diagonals aii sanomenen components principals del tensor, i els
coeficients no diagonals ai j components secundàries. En el cas del tensor delasticitat (origen
del mot tensor) es parla, respectivament, de tensions normals i tensions tangencials.
(b) (Forma quadràtica associada.) Donat el tensor T , definim la forma quadràtica associada a
T com laplicacio q : Rn R donada per
q(u) = T (u, u) .
Amb les notacions de lobservacio anterior tenim que
q(u) = X t AX ,
i e s immediat comprovar la propietat seguent, dita igualtat de polaritzacio, que permet afirmar
que tota forma quadràtica q està associada a un u nic tensor T :
q(u + v) = q(u) + q(v) + 2T (u, v) .
(c) (Formula del canvi de base.) Si B 0 e s una altra base de Rn , A0 = M(T, B 0 ) i C e s la matriu
del canvi de base de B 0 a B, aleshores es compleix la relacio
A0 = C t AC .
108
(Novament, deixem la comprovacio a les mans del lector, que pot inspirarse en el cas dels
endomorfismes tractat en el captol 5.) Des del punt de vista fsic, e s habitual pensar en un tensor
com un ens descrit a cada base per una matriu simètrica A que, en fer un canvi de base, varia
seguint la formula anterior. Escrita en components, la formula sexpressa per
n
X
ai0 j =
cì a`k ck j per a i, j = 1, 2, . . . , n .
k,`=1
(d) (Restriccio dun tensor a un subespai.) Suposem que T e s un tensor definit sobre Rn , B e s
una base de Rn i A = M(T, B). Suposem tambe que H e s un subespai del qual hem escollit
una base B 0 = {u 1 , u 2 , . . . , u k }, i que D e s la matriu (de tamany n k) que relaciona B 0 amb B.
Aleshores, la restriccio de T al subespai H , que es defineix de manera o` bvia, queda descrita en
la base B 0 per la matriu
A0 = D t AD ,
perquè aquest producte matricial calcula els coeficients ai0 j = T (u i , u j ) de la matriu A0 . Com a
illustracio, restringirem el tensor T de R3 definit per
6
2
4
A = M(T, Bc ) = 2 2 2
4 2
0
al pla dequacio 2x + 3y z = 0. Una base daquest pla e s B 0
de la restriccio de T en aquesta base e s

6
1
2
4
1 0 2
2 2 2 0
A0 = D t AD =
0 1 3
2
4 2
0
= {(1, 0, 2), (0, 1, 3)}, i la matriu

0
22
10
1
=
.
10 14
3
La tècnica de restriccio e s u til per a lestudi dels extrems condicionats de les funcions de diverses
variables.
Exemples 7.5 (a) Si la posicio duna partcula de massa m referida a una base ortonormal positiva de lespai e s r = (x, y, z), la matriu del tensor dinèrcia de la partcula en aquesta posicio
e s
2
y + z2
x y
x z
x 2 + z2
yz .
A = m x y
2
x z
yz
x + y2
En el cas dun sistema format per un nombre finit de partcules de masses m k
tives rk = (xk , yk , z k ), la matriu e s
X
X
X
m k (yk2 + z k2 )
m k xk yk
m k xk z k
k X
k
k
X
X
m k xk yk
m k (xk2 + z k2 )
m k yk z k
A=
k
k
k
X
X
Xm x z
m y z
m (x 2 + y 2 )
k k k
k k k
i posicions respec
109
Els coeficients de la diagonal principal son els moments dinèrcia, i els restants sanomenen
productes dinèrcia.
(b) La presentacio geomètrica de la teoria de la relativitat restringida fa servir un espai vectorial
real, lespaitemps E 4 = V3 T1 , on V3 e s lespai ordinari (de les posicions) i T1 e s leix
temporal. La formulacio de la teoria es fonamenta en el tensor de Minkowski, que en una base
{i, j, k, h} adaptada a la suma directa queda definit per la matriu
1
,
A=
1
2
c
on c e s la velocitat de la llum. Lequacio de la forma quadràtica associada al tensor de Minkowski
en la mateixa base e s
q(u) = q(x, y, z, t) = x 2 + y 2 + z 2 c2 t 2 ,
i la cinemàtica de la relativitat restringida equival essencialment a lestudi de les isometriesde
E 4 , endomorfismes que deixen invariant el tensor de Minkowski i reben el nom de transformacions de Lorentz.
La mecànica relativista dels medis continus demostra que el tensor de lenergia mecànica dun
fluid perfecte e s un multiple escalar del tensor de Minkowski.
7.2 Diagonalitzacio de tensors i formes

Exposarem ara un dels processos de diagonalitzacio de tensors i formes quadràtiques.
Teorema 7.6 Si T e s un tensor arbitrari sobre Rn , existeixen bases B 0 de Rn on la matriu de T
e s diagonal i, per tant, la forma quadràtica associada q sexpressa com a combinacio lineal de
quadrats:
0
0
0
0 2
0 2
0 2
..
A0 = M(T, B 0 ) =
i q(x1 , x2 , . . . , xn ) = 1 (x1 ) +2 (x2 ) + +n (xn ) .
.
n
D EMOSTRACI O . La matriu A de T en una base B de Rn e s simètrica. Aplicant el teorema
espectral generalitzat, existeix una matriu ortogonal de canvi de base C tal que
A0 = C 1 AC = C t AC
e s diagonal.
110
Observacions 7.7 (a) Si nomes considerem bases ortonormals (es a dir, fem canvis ortogonals),
el resultat final del proces la matriu A0 e s u nic llevat de lordre en què disposem els valors
propis. Lequacio corresponent per a la forma quadràtica associada,
q(x10 , x20 , . . . , xn0 ) = 1 (x10 )2 + 2 (x20 )2 + + n (xn0 )2 ,
sanomena lexpressio euclidiana canònica de q.
(b) A efectes pràctics, recordem que els coeficients de la diagonal de A0 son els valors propis de
la matriu A, i que les columnes de la matriu de canvi C son els vectors propis ortonormals de A
escrits en el mateix ordre que els valors propis.
Exemple 7.8 Considerem un cub rgid i homogeni, de costat 1 i densitat 12, que gira al voltant
dun eix que passa per un dels seus vèrtexs, i suposem que els vectors de la base ortonormal
positiva de referència B segueixen les direccions de les arestes del cub. Aleshores, la matriu del
tensor dinèrcia del sòlid en la base B e s
8 3 3
8 3 .
A = 3
3 3
8
El polinomi caracterstic e s det(t I A) = t 3 24t 2 + 165t 242, i els valors propis son 2
(simple) i 11 (doble). Escollim com a vectors propis respectius
1
u 1 = (1, 1, 1),
3
1
u 2 = (1, 1, 0) i
2
1
u 3 = (1, 1, 2) .
6
En la base ortonormal positiva B 0 = {u 1 , u 2 , u 3 }, la matriu del tensor dinèrcia del cub e s
2
.
11
A0 =
11
Els valors propis son els moments principals dinèrcia del cub, i les direccions definides pels
vectors u 1 , u 2 , u 3 son els eixos principals dinèrcia. Si leix de rotacio e s un daquests eixos
aleshores no hi ha productes dinèrcia, i això significa que la figura es troba en equilibri dinàmic.
Lexpressio euclidiana canònica de la forma quadràtica associada e s
2
q(x 0 , y 0 , z 0 ) = 2x 0 + 11y 0 + 11z 0 .

Si la figura gira, per exemple, al voltant del vector w = u 1 + 2u 2 + 2u 3 , amb velocitat angular
3, la seva energia cinètica en qualsevol moment e s
1
E = q(1, 2, 2) = 45 .
2
111
Aplicant factors correctors adequats als vectors de la base on un tensor T diagonalitza, sempre
podem fer que els coeficients de la matriu diagonal de T siguin exclusivament 1, 1 o 0. A
lexemple anterior, si prenem com a base
1
v1 = (1, 1, 1),
6
1
v2 = (1, 1, 0) i
22
1
v3 = (1, 1, 2)
66
queda com a matriu del tensor
A0 =
1
1
i com a expressio de la forma quadràtica associada

2
q(x 0 , y 0 , z 0 ) = x 0 + y 0 + z 0 .
Observem que hem sacrificat la normalitzacio dels vectors.
7.3 Indexs dinèrcia i classificacio de formes

Hem vist que, donat un tensor T sobre Rn , existeixen bases on la matriu de T e s diagonal,
i apareixen r coeficients positius, s coeficients negatius i t = n r s zeros a la diagonal
principal. De fet, hi ha altres procediments de diagonalitzacio, i no condueixen a un mateix
resultat.
Exemple 7.9 Considerem la forma quadràtica definida per
q(x, y, z) = 6x 2 + 4x y 2y 2 + 2x z + 2yz .
En la base formada pels vectors
1
u 1 = (1, 0, 0),
6
la matriu del tensor associat e s
1
u 2 = (1, 3, 0)
24
u 3 = (1, 1, 4)
1
0
mentre que els valors propis son 2 + 22, 2 22 i 0. No importa la manera com hem obtingut
els vectors u 1 , u 2 , u 3 : la questio e s que existeixen diferents matrius diagonals dun mateix tensor.
Aleshores, el resultat seguent esdeve essencial.
112
Teorema 7.10 (Llei dinèrcia de Sylvester.) Els nombres r i s no depenen de la base escollida
per diagonalitzar el tensor T .
D EMOSTRACI O . Sigui B = {u 1 , . . . , u r , v1 , . . . , vs , w1 , . . . , wt } una base on la matriu de T
e s diagonal, i suposem que, a la diagonal, els primers r coeficients son positius, els s seguents
negatius i els t finals zeros. Això ens dona una descomposicio de lespai en suma directa:
Rn = Pr Ns Rt ,
on T (u, v) = 0 si u i v pertanyen a subespais diferents i, a mes,
q(u) > 0 u Pr ,
q(v) < 0
v Ns
q(w) = 0
w Rt .
Sigui B 0 una altra base on la matriu de T e s diagonal, ordenada de forma anàloga. Dentrada,
Rt = {u Rn : T (u, v) = 0 v Rn } = Rt00 ,
per tant, t = t 0 i r + r 0 = s + s 0 .
Comprovem ara que la projeccio de Rn sobre Pr parallelament a Ns Rt e s injectiva quan es
restringeix a Pr00 . En efecte: si 0 6= x Pr00 , tenim x = u + v + w amb u Pr , v Ns i w Rt ;
si fos u = 0, resultaria que
0 < q(x) = q(v + w) = q(v) + q(w) + 2T (v, w) = q(v) < 0 ,
absurd. Aix doncs, r 0 r . Per la simetria del raonament, r = r 0 , i per tant tambe s = s 0 .
Els nombres r i s son els ndexs dinèrcia de T (i de q). La llei dinèrcia ens diu que lexpressio
duna forma quadràtica en qualsevol base on la matriu sigui diagonal amb coeficients 1, 1 i 0
e s u nica, i queda justificat denominarla lexpressio canònica af de la forma. Una manera de
calcular els ndexs dinèrcia, i descriure per tant lexpressio canònica af de la forma, e s comptar
els signes dels valors propis. El teorema de Descartes (vegeu lapèndix B) sembla fet a mida per
a aquesta finalitat, ja que per ser simètrica la matriu A que representa a T sabem a priori que el
seu polinomi caracterstic te totes les arrels reals, i podem determinar fàcilment r i s.
Exemple 7.11 Considerem la forma quadràtica de lexemple anterior:
q(x, y, z) = 6x 2 + 4x y 2y 2 + 2x z + 2yz .
El polinomi caracterstic e s det(t I A) = t 3 4t 2 18t = 0. Aqu hi ha una variacio de signe,
i per tant un u nic valor propi positiu; com que 0 e s un valor propi simple, hi ha un tercer valor
propi negatiu. Lexpressio canònica af de q e s
2
q(x 0 , y 0 , z 0 ) = x 0 y 0 .
113
Es diu que una forma quadràtica q e s definida positiva (respectivament, definida negativa) si
q(u) > 0 (resp., q(u) < 0) per a tot u 6= 0. Es diu que q e s semidefinida positiva si q(u) 0
per a tot u Rn (amb algun u tal que q(u) > 0) però existeix algun v 6= 0 tal que q(v) = 0 el
lector proverà la definicio de semidefinida negativa. Finalment, q e s no definida si existeixen
u, v Rn tals que q(u) > 0 i q(v) < 0. Lunica forma quadràtica que escapa, doncs, a aquesta
classificacio e s la forma nulla. A continuacio donem diversos criteris per classificar una forma
quadràtica arbitrària.
Teorema 7.12 Els ndexs dinèrcia r i s duna forma quadràtica q definida sobre Rn , calculables a partir dels valors propis 1 , 2 , . . . , n , permeten classificarla segons lesquema de la
taula 7.1.
Tot i > 0
r =n
s=0
definida positiva
Tot i < 0
r =0
s=n
definida negativa
Tot i 0, algun k > 0

i algun j = 0
0<r <n
s=0
semidefinida positiva
Tot i 0, algun k < 0

i algun j = 0
r =0
0<s<n
semidefinida negativa
Algun i > 0
i algun j < 0
r >0
s>0
no definida
Tot i = 0
r =0
s=0
forma nulla
Taula 7.1: Classificacio de formes quadràtiques
D EMOSTRACI O . Nomes cal pensar en lexpressio canònica af de q, amb la qual es fan paleses
les sis possibilitats, i en la relacio entre els ndexs dinèrcia i els signes dels valors propis.
Exemples 7.13 (a) El tensor dinèrcia duna partcula dona sempre una forma quadràtica semide-
114
finida positiva, perquè el polinomi caracterstic e s

t 3 2mr 2 t 2 + m 2r 4 t = 0 ,
on r 2 = x 2 + y 2 + z 2 , i els valors propis son mr 2 (doble) i 0 (simple).
(b) En canvi, si tenim tres partcules de masses respectives 2, 1 i 1, situades a les posicions
(1,1,0), (1,0,1) i (0,1,1), la matriu del tensor dinèrcia del sistema e s
5 2 1
5 1 .
A = 2
1 1
6
El polinomi caracterstic e s det(t I A) = t 3 16t 2 + 79t 112, de manera que la forma
quadràtica associada e s definitiva positiva perquè r = 3 i s = 0.
Teorema 7.14 (Criteri de Sylvester.) Si A e s la matriu del tensor T en alguna base, i els nombres
D1 , D2 , . . . , Dn son els menors diagonals creixents de la matriu A = (ai j ), e s a dir,
Dk = det(Ak ) ,
on
Ak = (ai j ) per a
1 i, j k ,
aleshores:
(a) q e s definida positiva si, i nomes si, D1 , D2 , . . . , Dn > 0.
(b) q e s definida negativa si, i nomes si, Dk > 0 quan k e s parell i Dk < 0 quan k e s senar.
D EMOSTRACI O . (a) Denotem per B = {e1 , e2 , . . . , en } la base on la matriu de T e s A.
(H) Per a cada k = 1, 2, . . . , n, la restriccio de q al subespai h e1 , e2 , . . . , ek i e s definida
positiva i la matriu e s Ak ; en alguna base daquest subespai la matriu serà diagonal,
t1
..
A0k =
amb
t1 , . . . , tk > 0 ,
.
tk
de manera que det(A0k ) > 0 i, per la formula del canvi de base, Dk = det(Ak ) > 0.
(H) Suposem que q no e s definida positiva i considerem el mes petit dels subespais Hk =
h e1 , e2 , . . . , ek i on la restriccio de q no e s definida positiva. Aquesta restriccio diagonalitza en
una base h e10 , e20 , . . . , ek0 i de Hk amb matriu A0k , i no tots els t1 , . . . , tk poden ser positius. Ara
be, si existissin ti , t j 0, la restriccio de q al pla h ei0 , e0j i seria definida (o semidefinida) negativa
o nulla, en contradiccio amb el fet que h ei0 , e0j i Hk1 6= {0}. Per tant, existeix un u nic ti 0,
i Dk = det(Ak ) 0 en contradiccio amb les hipòtesis.
115
(b) El raonament e s molt semblant en els dos casos.

(H) La diagonal de A0k constarà de t1 , . . . , tk < 0, de manera que Dk = det(Ak ) > 0 si k e s
parell i Dk = det(Ak ) < 0 si k e s senar.
(H) Aqu q no seria definida negativa en algun Hk i, anàlogament al cas (a), resultaria que
Dk 0 si k e s parell o Dk 0 si k e s senar, en contradiccio amb les hipòtesis.
Corol.lari 7.15 Si n = 2, considerem la matriu del tensor associat T , aix com el determinant i
la traca daquesta matriu:

a b
A=
,
D = det(A) = ac b2
i
T = tr (A) = a + c .
b c
Aleshores tenim el criteri de classificacio seguent:
D>0
a>0
definida positiva
D>0
a<0
definida negativa
D=0
T >0
semidefinida positiva
D=0
T <0
semidefinida negativa
D<0
D=0
no definida
T =0
forma nulla
Taula 7.2: Classificacio de formes quadràtiques (n = 2)
D EMOSTRACI O . Si D > 0, ha de ser a 6= 0, i podem aplicar el criteri de Sylvester. Si D = 0,

un valor propi e s 0 i laltre T , i apliquem el criteri dels valors propis. Finalment, si D < 0 els
valors propis son de signe diferent i fem servir el mateix criteri.
7.4 Extrems locals de les funcions de diverses variables

Aquesta seccio es dedica a una aplicacio interessant de la classificacio de formes. Suposem
que el lector ha seguit o està seguint un curs de càlcul infinitesimal que proporciona els
116
coneixements sobre diferenciabilitat dels que farem u s.

Sigui f : D R una funcio real de diverses variables definida en un domini D Rn i de
classe C 2 en algun entorn U dun punt p D, entorn que podem suposar una bola oberta de
centre p.
Es diu que f te un màxim (respectivament, mnim) local en el punt p si f ( p) f (x) (resp.,
f ( p) f (x)) per a tot x dun cert entorn de p. En tots dos casos direm que f te un extrem local
a p.
Si f te un extrem local a p, e s condicio necessària que sanulli la diferencial en aquell punt,
(d f ) p = 0 ,
o, equivalentment, que totes les derivades parcials de f en el punt p siguin nulles:

f
= 0 per a i = 1, 2, . . . , n
xi p
(es diu que p e s un punt estacionari de f ).
Daltra banda, la formula de Taylor aplicada a f en el punt p, amb terme complementari de
segon grau, e s

f ( p + t) = f ( p) + (d f ) p (t) + 21 d 2 f q (t, t)
per a t Rn suficientment petit en norma per tal que p + t U , i essent q un punt del segment
que uneix p amb p + t. Aix com d f e s un camp que en cada punt, diguem p, dona una forma
lineal (d f ) p es a dir, una transformacio lineal de Rn a R, d 2 f e s un camp tensorial de segon
ordre, que en cada punt p dona un tensor (d 2 f ) p (simètric pel teorema de Schwartz), ja que els
coeficients de la matriu daquest tensor en la base canònica son les derivades parcials segones de
f en el punt:
2
f
ai j =
.
xi x j p
Escrivint la formula de Taylor en termes de les derivades parcials tenim

n
n
X
1 X
2 f
f
f ( p + t) = f ( p) +
ti +
ti t j ,
xi p
2 i, j=1 xi x j q
i=1
on t = (t1 , . . . , tn ).
Si suposem que f satisfà la condicio necessària dextrem local en el punt p, la formula es redueix
a

n
2 f
1 X
2
1
f ( p + t) f ( p) = 2 (d f )q (t, t) =
ti t j .
2 i, j=1 xi x j q
117
Per a obtenir condicions suficients dextrem local e s necessari estudiar el signe daquest increment prop del punt p. El resultat seguent dona un criteri forca u til, i per justificar-lo nomes
necessitem observar que la condicio C 2 exigida a f assegura que les derivades parcials segones
son contnues.
Teorema 7.16 (Condicions suficients dextrem local.) Sigui f : D R una funcio definida
en un domini D Rn i de classe C 2 en un entorn U dun punt p D. Suposem que (d f ) p = 0.
Aleshores:
(a) Si (d 2 f ) p e s definida positiva, f te un mnim local en el punt p.
(b) Si (d 2 f ) p e s definida negativa, f te un màxim local en el punt p.
(c) Si (d 2 f ) p e s no definida, f no te extrem local en el punt p.
D EMOSTRACI O . (a) Si (d 2 f ) p e s definida positiva, per les condicions que reflecteixen aquest
fet desigualtats, basicament i la continutat de les derivades parcials segones de f , (d 2 f )q
seguirà essent definida positiva en tot un entorn de p, i retornant a la formula de lincrement
escrita abans daquest teorema arribem a la conclusio que f ( p + t) f ( p) 0 per a tot punt
p + t de lentorn; per tant, f presenta un mnim local en el punt p.
(b) Largument e s, mutatis mutandis, idèntic.
(c) Si (d 2 f ) p e s no definida, existeixen vectors u, v Rn tals que
(d 2 f ) p (u, u) > 0
(d 2 f ) p (v, v) < 0 .
Considerant la funcio g() = f ( p + u) resulta que

g 0 (0) = (d f ) p (u) = 0
g 00 (0) = (d 2 f ) p (u, u) > 0
i, per tant, f te, segons la direccio de u, un mnim local en el punt p; però un raonament anàleg
per a la funcio h() = f ( p +v) ens diu que f te un màxim local en el punt p segons la direccio
de v. En definitiva, f no te extrem local en el punt p.
Observem que si (d 2 f ) p e s semidefinida o nulla, el teorema anterior no e s aplicable, i cal fer
un estudi basat en altres mètodes. I tambe que per classificar (d 2 f ) p podem fer u s, segons
convingui, de qualsevol dels criteris establerts a la seccio anterior.
Exemples 7.17 (a) Considerem f (x, y) = x 2 y 2 . Busquem els punts que satisfan la condicio
necessària d f = 0, e s a dir,
f
= 2x = 0
x
f
= 2y = 0 ,
y
118
i trobem p = (0, 0). La matriu hessiana matriu de les derivades parcials segones en aquest
punt e s

2
0
H (0, 0) =
.
0 2
evident, doncs, que (d 2 f ) p e s no definida i, per tant, f no te extrem local en el punt (0, 0): es
Es
diu que hi ha un punt de sella (màxim en una direccio, quan x = 0, i mnim en una altra, quan
y = 0).
(b) Considerem ara la funcio z = f (x, y) = (x 2 + y 2 2x)(x 2 + y 2 6x). Seguint el mateix
procediment, tenim com a condiciones necessàries
f
2
2
2
= (4x 8)(x + y ) 16x + 24x = 0
x
.
f
= 4y(x 2 + y 2 4x) = 0
y
De la segona equacio resulta que y = 0 o be x 2 + y 2 4x = 0. (1) Si y = 0, la primera equacio
es converteix en 4x(x 2 6x + 6) = 0, don
x = 0,
x =3+ 3
o
x = 3 3.
(2) Si x 2 + y 2 4x = 0, tenim que x 2 + y 2 = 4x i la primera equacio es transforma en 8x = 0,
per tant x = 0 i y = 0.
Resumint, caldrà estudiar la matriu hessiana en els punts
a = (0, 0) ,
b = (3 + 3, 0)
i
c = (3
3, 0) .
Les derivades parcials segones de f son

2 f
= 12(x 2 4x + 2) + 4y 2 ,
x2
2 f
= 4(3y 2 + x 2 4x) .
y2
2 f
2 f
=
= 8y(x 2)
x y
y x
En el punt b, la matriu hessiana e s

H (b) =

24( 3 + 1)
0
,
0
8 3
i per tant f presenta un mnim local, daltura 36 24 3.
119
En el punt c, la matriu hessiana e s

H (c) =
24(1
0
3)
0
8 3
i per tant f presenta un màxim local, daltura 36 + 24 3.

Hem deixat el punt a per al final, ja que
H (a) =
24 0
0 0
i el teorema no decideix perquè H (a) e s semidefinida positiva. Cal dur a terme un estudi particular, que en aquest cas queda resolt de la forma seguent. El primer factor sanulla sobre la
circumferència x 2 + y 2 2x = 0, de centre (1, 0) i radi 1, mentre que el segon ho fa sobre la
circumferència x 2 + y 2 6x = 0, de centre (3, 0) i radi 3. A qualsevol entorn del punt (0, 0) hi ha
punts dels interiors de les dues circumferències, en els quals f prendrà valors positius, i tambe
punts interiors a una però exteriors a laltra, on f prendrà valors negatius. Tenint en compte que
f (0, 0) = 0, sarriba a la conclusio que f no presenta extrem local en el punt (0, 0).
120
121
8
Geometria lineal
La percepcio primària del mon real es fonamenta en els punts i les figures que amb ells es formen, i no pas en els vectors. Però lus de coordenades per determinar la posicio dels punts, i
per tant dequacions per descriure les figures elementals, converteix la geometria analtica en un
camp de fecunda aplicacio de làlgebra lineal. En aquest captol estudiarem les figures lineals,
e s a dir, les definides per equacions de primer grau. Com que el lector ja coneix segurament
alguns dels conceptes i tècniques que apareixen, aprofitarem la seva intuicio i la seva experiència
prèvia per estalviar-li un exces de formalisme analtic. Presentarem la teoria nomes per a lespai
tridimensional; les referències al pla es reduiran a aquells aspectes en els quals lanalogia requereix algun comentari. (Daltra banda, no sembla oportu en aquest context fer distincions entre
geometria estrictament af i geometria mètrica.)
8.1 Lespai euclidià puntual tridimensional

La primera definicio estableix les relacions bàsiques entre punts i vectors que cal prendre com a
punt de partida.
Definicio 8.1 Lespai euclidià puntual tridimensional e s una terna E 3 = (P3 , V3 , +), on P3 e s
un conjunt delements anomenats punts, V3 e s lespai vectorial euclidià tridimensional que
122
Geometria lineal
suposarem orientat sempre que convingui i hi ha definida una operacio de la forma

+
P3 V3 P3
( p, vE) 7 p + vE
que assigna un punt p + vE a cada parell format per un punt p i un vector vE (en aquest captol i el
seguent els vectors duran fletxa). Es demana que es compleixin els axiomes seguents:
(a) Associativitat: ( p + vE) + w
E = p + (E
v + w).
E
(b) Determinacio: donats p, q P3 existeix un u nic vE V3 tal que p + vE = q.
i direm que q e s lextrem de vE quan
Dara endavant representarem aquest vector per vE =
pq,
lorigen e s p; amb aquesta nova notacio,
=q.
p+
pq
El lector probablement enten i això e s positiu que aquesta definicio representa en certa
manera la construccio recproca del proces de formacio dels vectors lliures que ha vist en els
seus estudis anteriors.
Un exemple sense connotacions gràfiques si no es vol e s el seguent: P3 e s el conjunt R3 , V3

e s lespai vectorial euclidià R3 i loperacio + e s la suma ordinària component a component: e s
immediat comprovar que es compleixen els axiomes.
Proposicio 8.2 Per a qualssevol p, q, r P3 es compleix que:
(a)
pp = 0E .
.
(b) q
p =
pq
+
(c)
pq
qr =
pr .
D EMOSTRACI O . (a) Existeix un u nic vector vE tal que p + vE = p; per tant
p + (E
v + vE) = ( p + vE) + vE = p + vE ,
E
i daqu resulta que vE + vE = vE, e s a dir, vE = 0.
(b) Aplicant lassociativitat, tenim que
+ q
+ q
= p,
p + (
pq
p) = ( p +
pq)
p = q + qp
+ q
i aixo implica que

pq
p = 0E i, per tant, q
p =
pq.
123
(c) Novament per lassociativitat,

+
p + (
pq
qr ) = ( p +
pq)
qr = q +
qr = r ,
+
e s a dir,
pq
qr =
pr .
Una referència cartesiana de E 3 e s una quaterna R = {o ; eE1 , eE2 , eE3 }, on o P3 e s un punt
escollit arbitràriament, anomenat origen de la referència, i B = {Ee1 , eE2 , eE3 } e s una base de V3 .
Es diu que la referència e s rectangular si B e s una base ortonormal, que suposarem sempre
positiva. Farem servir sempre referències rectangulars, tot i que molts resultats els que no
depenen del producte escalar ni de conceptes derivats dell son extrapolables a referències de
qualsevol mena.
Donada una referència R, cada punt p de P3 es pot descriure pel seu vector de posicio respecte
a lorigen de coordenades:
op = p1 eE1 + p2 eE2 + p3 eE3 .

Els coeficients ( p1 , p2 , p3 ) son les coordenades del punt p en la referència R, i el determinen
unvocament i sense restriccions: qualsevol terna ( p1 , p2 , p3 ) defineix un punt, concretament
p = o + p1 eE1 + p2 eE2 + p3 eE3 .
Es important traduir a coordenades dels punts i components dels vectors les dues operacions
bàsiques definides entre ells: donats
p = ( p1 , p2 , p3 ) ,
q = (q1 , q2 , q3 ) i
vE = v1 eE1 + v2 eE2 + v3 eE3 = (v1 , v2 , v3 ) ,
tenim les relacions

p + vE = q p + v = q
vE =
pq
i
i
i
per a i = 1, 2, 3 .
Exemples 8.3 (a) Considerant les relacions entre coordenades i components, e s immediat comprovar la propietat del parallelogram:
pq
rs
si, i nomes si,
(b) El punt mitjà de p i q es defineix com

1
m = p+
pq .
2
pr =
qs .
124
Geometria lineal
Laparent asimetria de la definicio desapareix en observar que les coordenades de m son les
semisumes de les corresponents coordenades de p i q, don resulta que
1
.
m = q + qp
2
(c) Anàlogament, el baricentre de tres punts p, q i r es defineix com

2
g = r + r
m,
3
on m e s el punt mitjà de p i q; aqu trobem que les coordenades de g son les mitjanes aritmètiques
de les coordenades corresponents de p, q i r , i per tant els papers de p, q i r en aquesta construccio son permutables.
Formula del canvi de referència. Sigui R0 = {o1 ; uE1 , uE2 , uE3 } una altra referència, i suposem
conegudes tant la posicio del nou origen com la dependència de la nova base:
= b eE + b eE + b eE
oo
1
1 1
2 2
3 3
uE j = c1 j eE1 + c2 j eE2 + c3 j eE3
per a
j = 1, 2, 3 .
La relacio entre les coordenades velles (x, y, z) i les noves (x 0 , y 0 , z 0 ) dun punt genèric p P3
resulta simplement de la igualtat
+
op =
oo
o
p
1
i e s
x = b1 + c11 x 0 + c12 y 0 + c13 z 0
y = b2 + c21 x 0 + c22 y 0 + c23 z 0

z = b3 + c31 x 0 + c32 y 0 + c33 z
X = B + C X0 ,
o be
on
x
X =y ,
z
x0
X 0 = y0 ,
z0
b1
B = b2
b3
c11 c12 c13

C = c21 c22 c23 .
c31 c32 c33
La matriu C e s regular (det C 6= 0) perquè descriu un canvi de base, ortogonal (C 1 = C t ) si

les dues referències son rectangulars i amb det(C) = 1 si les bases de les referències tenen la
mateixa orientacio. Dins daquest model general, son frequents dues situacions mes simples: (a)
si C = I , la formula queda X = B + X 0 i es diu que hem fet una transllacio deixos; (b) si
B = 0, la formula e s X = C X 0 i parlem de rotacio deixos.
125
8.2 Varietats lineals

En la resta del captol suposarem donada una referència rectangular R = {o; eE1 , eE2 , eE3 }. Cada
punt quedarà identificat per les seves coordenades i cada vector per les seves components:
p = (x, y, z) ,
uE = (a, b, c) .
Una varietat lineal de lespai E 3 e s un conjunt de punts de la forma L = p + D, on p P3

i D V3 e s un subespai vectorial, anomenat direccio de L. Segons sigui dim(D) = 1 o
dim(D) = 2, es diu que L e s una recta o un pla, mentre que els punts son les varietats de
dimensio 0.
Equacions duna recta. Donada una recta
R :
p0 + D1 = p0 + h uE i
es diu que uE e s un vector director de R. Qualsevol punt de R e s de la forma

pt = p0 + t uE
amb t R ,
i això e s lequacio paramètrica vectorial de la recta R. Si referim a R el punt genèric pt =

(x, y, z) i tambe p0 = (x0 , y0 , z 0 ) i uE = (a, b, c), lequacio origina les equacions paramètriques
(escalars)
x = x0 + at
y = y0 + bt
z = z 0 + ct
de les quals, eliminant el paràmetre t, passem a

x x0
y y0
z z0
=
=
,
a
b
c
que e s lequacio contnua de la recta R.
Equacions dun pla. Donat un pla
P :
p0 + D2 = p0 + h uE, vE i
qualsevol dels seus punts e s de la forma

p = p0 + t uE + s vE
amb t, s R ,
i això e s lequacio paramètrica vectorial del pla. Els paràmetres seliminen escrivint la relacio
equivalent o equacio implcita
det(
p
E, vE) = 0 .
0 p, u
126
Geometria lineal
Referint a R el punt genèric p = (x, y, z)

(v1 , v2 , v3 ) resulta

x x0

y y0

z z0
i tambe p0 = (x0 , y0 , z 0 ), uE = (u 1 , u 2 , u 3 ) i vE =

u 1 v1
u 2 v2 = 0 ,
u 3 v3
que una vegada desenvolupada adopta la forma

A(x x0 ) + B(y y0 ) + C(z z 0 ) = 0 ,
Ax + By + C z + D = 0 .
o be
Observacions 8.4 (a) Notem que lequacio contnua duna recta condueix a un sistema de dues
equacions lineals de rang 2 (equacions implcites de la recta) i que, recprocament, un tal sistema defineix una recta, ja que la seva solucio general ens dona les equacions paramètriques.
Geomètricament, donar el sistema significa expressar la recta com a interseccio de dos plans.
Tambe es posa de manifest que els plans i les rectes son precisament les figures definides per
equacions lineals, les mes senzilles, doncs, segons el criteri del grau però tambe les mes usuals
a la pràctica.
Aix, donada la recta definida per
3x + y + 2z 6 = 0
x +y+z4=0
)
,
resolem aquest sistema i obtenim, prenent x = t com a variable lliure,

x =t,
y =2+t,
z = 2 2t ,
que son les equacions paramètriques; lequacio contnua serà

x 0
y2
z2
=
=
.
1
1
2
convenient recordar que els coeficients A, B i C de lequacio dun pla satisfan la propor(b) Es
cionalitat derivada del seu origen,
A
B

=
u 2 v2
u 3 v3

u 3 v3
u 1 v1
C
=
,

u 1 v1

u 2 v2
de manera que la direccio del pla e s D2 = hwi

E , on w
E = uE vE = (A, B, C), i la seva equacio
implcita en la base B = {Ee1 , eE2 , eE3 } de V3 sobte senzillament suprimint el terme independent
de lequacio de P:
Ax + By + C z = 0 .
127
(c) En el pla euclidià puntual E 2 = (P2 , V2 , +) les u niques varietats lineals no trivials son les
rectes, que comparteixen caracterstiques de les rectes de lespai (direccio de dimensio 1) i dels
plans (direccio de dimensio n 1), i per tant admeten tres tipus dequacions:
(1) paramètrica:
pt = p0 + t uE,
(2) contnua:
x x0
y y0
=
,
a
b
(3) implcita:
Ax + By + C = 0,
a mes daltres tambe usuals que suposem conegudes pel lector, com lexplcita y = mx + n o
lequacio punt-pendent y y0 = m(x x0 ).
8.3 Posicions relatives de les varietats lineals

Estudiarem en aquest apartat el parallelisme, la interseccio i la perpendicularitat de varietats,
donant condicions operatives. Inclourem tambe lequacio del feix de plans que passen per una
recta.
Dues varietats lineals L i L 0 , de direccions respectives D i D 0 , son paralleles, i sescriu L k L 0 ,
si D D 0 o D 0 D.
En particular, dos plans (o dues rectes) son parallels si, i nomes si, tenen la mateixa direccio
per dimensions, mentre que una recta i un pla son parallels si la direccio de la recta està
continguda en la del pla. Esquemàticament tenim:
R0
a
b
c
= 0 = 0
0
a
b
c
Aa + Bb + Cc = 0
P0
A
B
C
= 0 = 0
0
A
B
C
Taula 8.1: Parallelisme de varietats lineals
on uE = (a, b, c) e s un vector director de R, vE = (a 0 , b0 , c0 ) ho e s de R 0 , Ax + By + C z + D = 0

e s lequacio implcita de P i A0 x + B 0 y + C 0 z + D 0 = 0 e s la de P 0 .
128
Geometria lineal
Analitzem ara les possibles situacions dincidència (interseccio) entre varietats.

(A) Donades dues rectes
R :
p0 + t uE
R0 :
q0 + s vE ,
la primera possibilitat e s que siguin paralleles, quan uE i vE son proporcionals; en particular, seran
coincidents si q0 R.
En cas contrari, els vectors uE i vE son linealment independents, de manera que si existeix un punt
comu p R R 0 e s u nic (rectes secants): vegem que això e s equivalent a que
E, vE) = 0 .
det(
p
0 q0 , u

En efecte: si p R R 0 tindrem que
p
E s vE per a certs t, s
0 q0 = p0 p + pq0 = t u
E i vE son linealment
R, dependència lineal que anulla el determinant; recprocament, si
p
0 q0 , u
dependents, existirà una relacio de la forma
p
E s vE ,
0 q0 = t u
i prenent p = p0 + t uE resulta que
p = p0 + t uE = p0 +
p
E = q0 + s vE R 0 ,
0 q0 + s v
i per tant p R R 0 .
Finalment, quan
E, vE) 6= 0 ,
det(
p
0 q0 , u
les rectes no son paralleles ni secants, i es diu que sencreuen (possibilitat que no existeix entre
rectes del pla).
(B) Donats una recta i un pla,
R :
p0 + t uE
P :
Ax + By + C z + D = 0 ,
els possibles punts de R P sobtindran en substituir les equacions paramètriques de la recta

x = x0 + at ,
y = y0 + bt ,
z = z 0 + ct
a lequacio del pla: això dona

(Aa + Bb + Cc)t + (Ax0 + By0 + C z 0 + D) = 0 .
Si Aa + Bb + Cc = 0, el vector director de la recta, uE, pertany a la direccio del pla, D2 , i les
varietats son paralleles; si, a mes, Ax0 + By0 + C z 0 + D = 0, el punt p0 i tota la recta R es
troben dins el pla, i es diu que P passa per R o que R està inclosa en el pla.
129
Lalternativa e s que sigui Aa + Bb + Cc 6= 0: aleshores hi ha un u nic punt comu p R P, i

es diu que les varietats son secants.
Si la recta ve donada per les seves equacions implcites, formem amb elles i lequacio del pla un
sistema 3 3:
A1 x + B1 y + C1 z + D1 = 0
A2 x + B2 y + C2 z + D2 = 0 .
Ax + By + C z + D = 0
Si els rangs de la matriu dels coeficients i la matriu ampliada son r i r 0 , tenim tres possibilitats:
(a) si r = r 0 = 3, la recta i el pla son secants (solucio u nica); (b) si r = 2, però r 0 = 3, son
parallels sense inclusio (incompatibilitat); (c) si r = r 0 = 2, el pla passa per la recta (infinites
solucions amb un grau de llibertat).
(C) Donats dos plans
P1 :
A1 x + B1 y + C1 z + D1 = 0
P2 :
A2 x + B2 y + C2 z + D2 = 0 ,
considerem els rangs r i r 0 del sistema que formen. Hi ha tambe tres casos: si r = 1, els plans
son parallels, coincidents si r 0 = 1 i diferents si r 0 = 2; si r = r 0 = 2, son secants, i els punts
comuns formen una recta com ja hem dit en una observacio de la seccio anterior. Com que la
referència e s rectangular, el vector director de la recta comuna e s w
E1 w
E 2 , on w
E 1 = (A1 , B1 , C1 )
iw
E 2 = (A2 , B2 , C2 ).
Feix de plans. Aquesta e s la denominacio del conjunt de plans que passen per una recta determinada R. Suposem que R està definida com a interseccio de dos plans
P1 :
A1 x + B1 y + C1 z + D1 = 0
P2 :
A2 x + B2 y + C2 z + D2 = 0 .
Com hem vist a lapartat (B) dincidència, la condicio necessària i suficient per tal que un pla
arbitrari P passi per R e s que afegint la seva equacio Ax + By + C z + D = 0 al sistema format
per les altres dues no canvi el conjunt de solucions (els punts de R): això significa que lequacio
de P serà combinacio lineal de les altres dues, i per tant
(A1 x + B1 y + C1 z + D1 ) + (A2 x + B2 y + C2 z + D2 ) = 0 ,
variant , R, e s lequacio (de tots els plans) del feix que passa per R. Una expressio
equivalent, en la que nomes perdem P2 , resulta de dividir per 6= 0 i prendre = /:
(A1 x + B1 y + C1 z + D1 ) + (A2 x + B2 y + C2 z + D2 ) = 0 .
Exemple 8.5 Busquem lequacio del pla que passa pel punt p = (1, 1, 3) i per la recta
)
2x + y + z = 0
.
x + y 3z = 1
130
Geometria lineal
Preparem lequacio del feix que passa per aquesta recta:

(2x + y + z) + (x + y 3z 1) = 0 .
Imposant que un pla daquesta forma passi per p, determinem
6 + (8) = 0 ,
3
4
i, per tant, el pla serà (2x + y + z) + 3/4(x + y 3z 1) = 0 o, equivalentment,

4(2x + y + z) + 3(x + y 3z 1) = 0 ,
e s a dir,
11x + 7y 5z 3 = 0 .
Dues varietats lineals L i L 0 , de direccions respectives D i D 0 , son perpendiculars, i sescriu

L L 0 , si D D 0 o D 0 D .
Esquemàticament tenim:
R0
aa 0 + bb0 + cc0 = 0
a
b
c
=
=
A
B
C
P0
A A0 + B B 0 + CC 0 = 0
Taula 8.2: Perpendicularitat de varietats lineals
on uE = (a, b, c) e s un vector director de R, vE = (a 0 , b0 , c0 ) ho e s de R 0 , Ax + By + C z + D = 0

e s lequacio implcita de P i A0 x + B 0 y + C 0 z + D 0 = 0 e s la de P 0 .
Teorema 8.6 Considerem un punt p i una varietat lineal L = p0 + D. Aleshores:
D.
(a) Existeix un u nic punt q L tal
pq
(b) Existeix un u nic punt s tal que q e s el punt mitjà de p i s.
D EMOSTRACI O . (a) El punt q ha de ser de la forma p0 + vE, amb vE D. La condicio de
perpendicularitat e s
p
E D,
0p v
131
e s a dir, vE ha de ser la projeccio ortogonal del vector

p
0 p sobre el subespai D. El teorema de
la projeccio ortogonal assegura lexistència i unicitat daquest vector, per tant el punt q queda
unvocament determinat.
e s el punt que compleix la condicio de lenunciat.
fàcil veure que s = p + 2
(b) Es
pq
Es diu que q e s la projeccio ortogonal de p sobre la varietat L i s el simètric de p respecte a L.

Exemples 8.7 (a) Si R e s la recta p0 + h uE i, la projeccio ortogonal de
p
Ei
0 p sobre el subespai h u
es
p
E
0p u
vE =
uE ,
2
k uE k
per tant la projeccio de p sobre R e s el punt
p
E
0p u
q = p0 +
uE .
2
k uE k
Aquest punt tambe es pot obtenir fent la interseccio de la recta R i el pla perpendicular que passa
per p.
(b) Si P e s el pla p0 + h w
E i , la projeccio ortogonal de
p
E i e s
0 p sobre el subespai h w
p
E
0p w
vE =
p
p
w
E,
0
2
kw
Ek
per tant la projeccio de p sobre P e s el punt
p
E
p
E
0p w
0p w
q = p0 + p0 p
w
E = p
w
E.
2
2
kw
Ek
kw
Ek
Anàlogament al cas anterior, podem obtenir aquest punt com a interseccio del pla P i la recta
perpendicular que passa per p. Com a illustracio, donats el punt p = (5, 3, 2) i el pla P
dequacio 2x + y z + 3 = 0 busquem q i s.
La recta que passa per p amb vector director w
E = (2, 1, 1), ortogonal a P, e s
x = 5 + 2t ,
y =3+t,
z = 2 t ,
i fent la interseccio amb el pla resulta

2(5 + 2t) + (3 + t) (2 t) + 3 = 0 ,
6t + 18 = 0 ,
t = 3 ,
de manera que obtenim la projeccio ortogonal de p sobre P, que e s q = (1, 0, 1). Finalment,
= (6, 3, 3) i fent
considerant
pq
= (5, 3, 2) + 2(6, 3, 3) = (7, 3, 4) ,
s = p + 2
pq
trobem el simètric de p respecte a P.
132
Geometria lineal
8.4 Angles, distàncies, a` rees i volums

Tots els angles (no orientats) entre varietats es redueixen a angles entre vectors. En efecte:
(a) langle entre dues rectes e s el que formen els respectius vectors directors, i això inclou la
possibilitat dobtenirne un o el seu suplementari; (b) langle entre una recta i un pla e s el que
forma la recta amb la seva projeccio ortogonal sobre el pla (o 90 si son perpendiculars), però
aquest angle coincideix amb el complementari de langle entre la recta i les perpendiculars al pla;
(c) langle entre dos plans e s el que formen sengles perpendiculars tracades dins de cada un a la
recta interseccio (o 0 si son plans parallels), però coincideix amb el que forma qualsevol parell
de rectes perpendiculars respectivament a cada pla. Com es pot observar, langle e s invariant per
parallelisme.
Exemple 8.8 Per calcular langle entre el pla 3x 4y + 12z 1 = 0 i la recta
x 1
y+2
z3
=
=
,
20
21
0
considerem el vector perpendicular al pla i el vector director de la recta:
w
E = (3, 4, 12)
uE = (20, 21, 0) .
Langle entre aquests vectors e s

= arccos
144
w
E uE
= arccos
= 67 320 ,
kw
E kk uE k
13 29
i langle entre la recta i el pla e s

= 90 67 320 = 22 280 .
La distància entre dos punts p i q de P3 e s la norma del vector que defineixen:

k.
d( p, q) = k
pq
Les propietats de la distància resulten de traduir les de la norma (captol 4), i per tant son de
comprovacio immediata:
(a) d( p, p) = 0; d( p, q) > 0 si p 6= q.
(b) d( p, q) = d(q, p).
(c) Desigualtat triangular: d( p, r ) d( p, q) + d(q, r ).
133
(d) Teorema de Pitàgores: si p, q, r son els vèrtexs dun triangle rectangle a q, e s a dir,
q
p
qr , aleshores
d( p, r )2 = d( p, q)2 + d(q, r )2 .
La distància entre dues varietats lineals L i L 0 e s el mnim de les distàncies entre punts de luna
i de laltra:
d(L , L 0 ) = min{ d( p, q) : p L , q L 0 } .
Aquesta definicio de distància exigeix que comprovem en cada cas lexistència del mnim. Analitzarem seguidament tots els casos possibles.
Teorema 8.9 La distància dun punt p a una varietat lineal L e s la del punt a la seva projeccio
ortogonal sobre L.
D EMOSTRACI O . Si q e s la projeccio ortogonal de p sobre L i p0 6= q e s un punt qualsevol de
L, aplicant el teorema de Pitàgores al triangle de vèrtexs p0 , q i p, rectangle a q, tenim
d( p0 , p)2 = d( p0 , q)2 + d(q, p)2 ,
de manera que d( p0 , p) > d(q, p) i per tant d( p, L) = d( p, q).
Exemple 8.10 Si p = (x0 , y0 , z 0 ) i P e s el pla dequacio Ax + By + C z + D = 0,

d( p, P) =
| Ax0 + By0 + C z 0 + D |
.
A2 + B 2 + C 2
En efecte: si w
E = (A, B, C), la projeccio ortogonal q del punt p sobre P e s la interseccio de la
recta p + h w
E i, dequacions
x = x0 + At ,
y = y0 + Bt ,
z = z 0 + Ct ,
amb el pla: substituint trobem

A(x0 + At) + B(y0 + Bt) + C(z 0 + Ct) + D = 0 ,
t =
Ax0 + By0 + C z 0 + D
.
A2 + B 2 + C 2
Finalment, recordant que k w k2 = A2 + B 2 + C 2 ,

d( p, P) = d( p, q) = k t w
Ek=
| Ax0 + By0 + C z 0 + D |
.
A2 + B 2 + C 2
Aquesta formula e s aprofitable per al pla: la distància del punt p = (x0 , y0 ) a la recta R dequacio
Ax + By + C = 0 e s
| Ax0 + By0 + C |
.
d( p, R) =
A2 + B 2
134
Geometria lineal
La definicio de distància implica que la distància entre varietats secants e s nulla. Queden,
doncs, quatre casos possibles. En els tres referits a varietats paralleles L i L 0 (dues rectes, dos
plans o recta i pla), amb direccions respectives D D 0 , la distància e s la de qualsevol punt
p L a L 0 . En efecte: si q e s la projeccio ortogonal de p sobre L 0 i p1 L i q1 L 0 son punts
arbitraris,

p
1 q1 = p1 p + pq + qq1 = pq + ( p1 p + qq1 ) ,
i, pel teorema de Pitàgores,
d( p1 , q1 ) d( p, q) ,
e s a dir, d(L , L 0 ) = d( p, L 0 ) per a qualsevol p L.
La darrera situacio requereix un estudi particular.
Proposicio 8.11 Donades dues rectes que sencreuen
R :
pt = p0 + t uE ,
R0 :
qs = q0 + s vE ,
existeix un u nic parell de punts pt R i qs R 0 tals que la recta que els uneix e s perpendicular
a R i a R 0 . A mes,
d(R, R 0 ) = d( pt , qs ) .
D EMOSTRACI O . Escrivim
p
E+
p
E
t qs = pt p0 + p0 q0 + q0 qs = t u
0 q0 + s v
i imposem les condicions de perpendicular comuna,
uE
p
t qs = 0 ,
vE
p
t qs = 0 ,
que condueixen a un sistema lineal 2 2 per a t i s:
t (E
u uE) + s(E
u vE) + uE
p
0 q0 = 0
t (E
v uE) + s(E
v vE) + vE
p
q =0
)
.
0 0
El determinant del sistema e s

E
u uE uE vE
E
v uE vE vE

< 0,

per la desigualtat de Schwarz. El sistema te, per tant, solucio u nica, i els punts pt i qs defineixen
la perpendicular comuna. Per veure que d( pt , qs ) e s la mnima distància possible entre les dues
rectes, considerem altres punts p0 R i q0 R 0 : aplicant el teorema de Pitàgores a la relacio

p
0 q 0 = p0 pt + pt q s + q s q 0 = pt q s + ( p0 pt + q s q 0 )
obtenim que
d( p0 , q0 ) > d( pt , qs ) .
135
El lector pot comprovar que, fent passar un pla P per R 0 que sigui parallel a R, es compleix
que d(R, R 0 ) = d(R, P), que e s un dels casos previs. Mes endavant veurem tambe una formula
per calcular la distància entre rectes que sencreuen, basada en el producte vectorial. De tota
manera, inclourem ara una aplicacio del teorema anterior.
Exemple 8.12 Calculem la distància entre les rectes donades per les equacion contnues
R :
z+2
x 3
=y=
,
0
1
R0 :
x
z5
= y+1=
.
4
3
Amb les expressions paramètriques preparem

p
t qs :
pt = (3, 0, 2) + t (0, 1, 1) ,
qs = (0, 1, 5) + s(4, 1, 3) ,
p
q = (3, 1, 7) + s(4, 1, 3) t (0, 1, 1) .
t s
Imposant la perpendicularitat amb uE = (0, 1, 1) i vE = (4, 1, 3) tenim

)
8 + 4s 2t = 0
,
34 + 26s 4t = 0
don resulten t = 2, s = 1,
p
2 q1 = (1, 2, 2) i, finalment,
d(R, R 0 ) = k
p
q k = 3.
2 1
El producte vectorial resulta u til per a obtenir certes formules sobre distàncies, a` rees i volums.
Recordem que, orientant V3 duna de les dues maneres possibles, queda definit unvocament el
producte vectorial uE vE de qualsevol parell de vectors uE, vE V3 (de fet, canviar lorientacio no
influeix en cap de les formules).
Proposicio 8.13 (a) La distància dun punt p a una recta R : p0 + h uE i e s
k
p
Ek
0p u
d( p, R) =
.
k uE k
(b) La distància dun punt p a un pla P : p0 + h uE , vE i e s, posant w
E = uE vE,
| p0 p w
E|
| p0 p (E
u vE) |
| det(
p
E , vE) |
0p,u
d( p, P) =
=
=
.
kw
Ek
k uE vE k
k uE vE k
(c) La distància entre dues rectes que sencreuen, R : p0 + h uE i i R 0 : q0 + h vE i, e s
u vE) |
E , vE) |
|
p
| det(
p
0 q0 (E
0 q0 , u
d(R, R 0 ) =
=
.
k uE vE k
k uE vE k
136
Geometria lineal
D EMOSTRACI O . (a) Sigui q la projeccio ortogonal de p sobre R: el triangle de vèrtexs p0 , q i

p e s rectangle a q, per tant, si e s langle entre
p
E, tenim
0p i u
k
p
Ek
0p u
d( p, R) = d( p, q) = k
p
.
0 p k sin =
k uE k
(b) Sigui q la projeccio ortogonal de p sobre P: q

p e s la projeccio ortogonal de
p
0 p sobre el
subespai h w
E i, de manera que
p
E
0p w
q
p=
w,
2
kw
Ek
E |
k = | p0 p w
don d( p, P) = k qp
.
kw
Ek
s la projeccio ortogonal de
(c)
p
p
E vE i; aix doncs,
t qs e
0 q0 sobre el subespai h u
u vE) |
|
p
0 q0 (E
.
d(R, R 0 ) = k
p
t qs k =
k uE vE k
Acabem aquest breu formulari del producte vectorial amb aplicacions al càlcul de casos elementals però frequents dàrees i volums, estalviant al lector disquisicions teòriques sobre aquests dos
conceptes, que li son prou familiars.
Proposicio 8.14 (a) Làrea del triangle de vèrtexs p, q, r P3 e s
1
2
A = k
pq
pr k .
(b) Làrea dun parallelogram, on p e s un vèrtex i q i r son els vèrtexs adjacents a p, e s
A = k
pq
pr k .
D EMOSTRACI O . (a) Prenent com a base del triangle el costat pq, laltura corresponent e s h =
d(r, pq) i, aplicant la formula de la distància dun punt a una recta,
1
2
1
2
kh = k
k
A = k
pq
pq
k
pq
pr k
1
= k
pq
pr k .
2
k pq k
k h.
(b) El raonament e s anàleg, però aqu A = k
pq
137
Proposicio 8.15 (a) El volum dun tetràedre de vèrtexs p, q, r , s P3 e s

1
V = |
ps ( pq
pr ) | .
6
(b) El volum dun paralleleppede, on p e s un vèrtex i q, r i s son els vèrtexs adjacents a p, e s
V = |
ps (
pq
pr ) | .
D EMOSTRACI O . (a) Prenem com a base el triangle de vèrtexs p, q, r . Laltura corresponent
serà h = d(s, pqr ) i, aplicant formules anteriors,
|
ps (
pq
pr ) |
1
11
1
V = A( pqr ) h =
k pq pr k
= |
ps ( pq
pr ) | .
3
32
6
k pq pr k
(b) El raonament e s anàleg, però aqu el volum e s simplement làrea de la base per laltura.
Observacions 8.16 (a) Cal fer notar que, en les quatre formules precedents, el vèrtex destacat p
pot ser qualsevol de la figura mentre es respecti ladjacència en les formules, i tambe que podem
calcular el producte mixt fent servir determinants:
ps (
pq
pr ) = det(
pq,
pq,
ps) .
(b) Les formules de les a` rees tambe son aplicables a figures de pla P2 , si el considerem submergit
dins de P3 afegint simplement una tercera coordenada nulla a cada punt.
Per exemple, per calcular làrea del triangle de vèrtexs p = ( p1 , p2 ), q = (q1 , q2 ) i r = (r1 , r2 ),
submergint P2 dins de P3 escrivim
= (q p , q p , 0) ,
pq
1
1
2
2
pr = (r1 p1 , r2 p2 , 0) .
Làrea del triangle pqr e s

1
k pq
pr k .
2
Daltra banda,

q p1 q 2 p2
pq pr = 0, 0, 1
r 1 p1 r 2 p2
i, tenint en compte que

q 1 p1 q 2 p2

r 1 p1 r 2 p2

p1

= q1

r1

p2 1
q2 1 ,
r2 1
138
resulta que làrea del triangle pqr e s el valor absolut de

p1 p2 1

1
.
q
q
1
1
2

2
r1 r2 1
Geometria lineal
139
9
En el captol anterior hem estudiat a fons les rectes i els plans, e s a dir, les figures geomètriques
definides per equacions de primer grau. Aquest captol tracta de les còniques i les quàdriques,
que son, respectivament, les corbes del pla i les superfcies de lespai definides per equacions de
segon grau.
Discutirem amb detall les còniques, i mes breument les quàdriques per raons de concisio: el
lector trobarà analogies formals suficients per justificar aquesta diferència de tractament.
Continuarem denotant per E 2 = (P2 , V2 , +) el pla euclidià puntual i per E 3 = (P3 , V3 , +)
lespai, i fent u s, nomes, de referències rectangulars positives.
9.1 Ellipse, hipèrbola i paràbola

Donats dos punts F i F 0 del pla P2 , anomenarem ellipse el conjunt de punts p P2 tals que
d( p, F) + d( p, F 0 ) = 2a ,
on 2a > d(F, F 0 ). F i F 0 son els focus de lellipse i a el semieix major.
140
El punt mitjà del segment F F 0 e s el centre de lellipse, i la constant 2c = d(F, F 0 ) e s la

distància focal. La recta que uneix els focus e s leix principal i la recta que passa pel centre i e s
perpendicular a leix principal sanomena eix secundari.
Quan F = F 0 , lellipse es redueix a una circumferència, i en aquest cas es poden prendre com
a eixos dues rectes perpendiculars qualssevol que passin pel centre.
Escollint una referència R = { o ; uE, vE }, on o e s el centre de lellipse, uE un vector unitari sobre
leix principal i vE un vector unitari sobre leix secundari, els focus son F = (c, 0) i F 0 = (c, 0),
i els punts de lellipse son els que compleixen lequacio
p
p
(x c)2 + y 2 + (x + c)2 + y 2 = 2a .
Aquesta equacio e s equivalent a
(a 2 c2 )x 2 + a 2 y 2 = a 2 (a 2 c2 ) ,
i si posem b2 = a 2 c2 i dividim tota lequacio per a 2 b2 es converteix en
x2
y2
+
= 1,
a2
b2
que e s lequacio canònica de lellipse. En el cas duna circumferència sescriu x 2 + y 2 = r 2 ,
on r = a = b e s el radi.
De la mateixa manera, anomenarem hipèrbola el conjunt de punts p P2 tals que
| d( p, F) d( p, F 0 ) | = 2a ,
on ara 0 < 2a < d(F, F 0 ). F i F 0 son els focus de la hipèrbola, i a el semieix real. El centre,
la distància focal i els eixos principal i secundari duna hipèrbola es defineixen igual que per a
lellipse.
Escollint una referència com en el cas anterior, lequacio de la hipèrbola e s
p
p
| (x c)2 + y 2 (x + c)2 + y 2 | = 2a ,
que e s equivalent a
(c2 a 2 )x 2 a 2 y 2 = a 2 (c2 a 2 ) .
Prenent b2 = c2 a 2 i dividint per a 2 b2 obtenim
x2
y2
= 1,
a2
b2
que e s lequacio canònica de la hipèrbola.
141
Observacions 9.1 (a) De les equacions canòniques de lellipse i la hipèrbola es dedueix que
els eixos principal i secundari son eixos de simetria, ja que si (x, y) compleix lequacio els seus
simètrics respecte als eixos, (x, y) i (x, y), tambe la compleixen.
(b) Les interseccions daquestes còniques amb els eixos sanomenen vèrtexs. Lellipse te quatre
vèrtexs: dos sobre leix principal, els punts de coordenades (a, 0) i (a, 0), i dos sobre leix
secundari, (0, b) i (0, b). La hipèrbola nomes en te dos sobre leix principal, els punts de
coordenades (a, 0) i (a, 0).
(c) Allant la y de les equacions canòniques de lellipse i la hipèrbola obtenim
y=
bp 2
a x2
a
y=
bp 2
x a2
a
respectivament. Això ens diu que lellipse e s una figura fitada i la hipèrbola no. A mes, les
rectes dequacions
b
y= x
a
son asmptotes de la hipèrbola. Si les dues asmptotes son perpendiculars, e s a dir, si a = b,
direm que la hipèrbola e s equilàtera.
Donats un punt F i una recta R que no el conte, anomenarem paràbola el conjunt de punts p del
pla que compleixen la condicio
d( p, F) = d( p, R) .
F e s el focus de la paràbola, R e s la directriu, i el punt mitjà de la perpendicular de F a R e s el
vèrtex. La distància m = d(F, R) e s el paràmetre de la paràbola.
Escollim una referència R = { o ; uE, vE }, on o e s el vèrtex de la paràbola, uE un vector unitari amb
la direccio de R i vE un vector unitari i perpendicular a uE en el sentit de R a F. Lequacio de R e s
m
m
y = , el focus e s F = (0, ) i els punts de la paràbola son els que compleixen lequacio
2

m 2
m

x2 + y
=y+ ,
2
equivalent a
x 2 2my = 0
o be
y=
x2
,
2m
que e s lequacio canònica de la paràbola.

Observacions 9.2 (a) Aquesta equacio ens diu que la paràbola te un u nic eix de simetria, leix
oy, i un u nic vèrtex, que coincideix amb lorigen de coordenades de R.
142
(b) A diferència de lellipse i la hipèrbola, en les que el sentit dels vectors uE i vE (i, per tant, el
sentit positiu dels eixos de coordenades) no influeix en lequacio canònica, si en leleccio de la
referència R per a la paràbola invertim el sentit del vector vE (i, per tant, el sentit de leix oy), la
m
m
recta R tindrà per equacio y = , el focus serà F = (0, ) i lequacio de la paràbola serà
2
x 2 + 2my = 0.
9.2 Classificacio de les còniques

Una cònica del pla e s el conjunt de punts que en una referència R satisfan una equacio de segon
grau
F(x, y) = ax 2 + 2bx y + cy 2 + 2d x + 2ey + f = 0 .
El nostre objectiu e s trobar una altra referència on lequacio de la cònica adopti la forma mes
senzilla possible. Aquesta serà lequacio reduda de la cònica, que en el cas duna ellipse, una
hipèrbola o una paràbola haurà de coincidir, essencialment, amb la seva equacio canònica.
Aquest proces de reduccio ens permetrà donar una classificacio de les còniques i introduir el
concepte dinvariant duna cònica per canvis de coordenades.
Si posem

A=
a b
b c

X=
x
y
L = (d
e) ,
lequacio ax 2 + 2bx y + cy 2 + 2d x + 2ey + f = 0 es pot escriure

X t AX + 2L X + f = 0 ,
que e s lequacio matricial de la cònica; si posem
a b d
A3 = b c e i
d e f
x
X3 = y ,
1
la mateixa equacio te la forma

X 3t A3 X 3 = 0 ,
equacio matricial compacta de la cònica. Lequivalència de les tres formes es comprova directament efectuant els productes de les matrius que intervenen a les equacions.
Donada una nova referència R0 = { o ; uE, vE }, on o = (x0 , y0 ), uE = (c11 , c21 ) i vE = (c12 , c22 ),
les equacions del canvi de coordenades son
X = B + C X0 ,
143
on

B=
x0
y0

C=
c11 c12
c21 c22

i
X =
La forma matricial compacta daquest canvi de coordenades e s
c11 c12 x0
X 3 = C3 X 30 , on C3 = c21 c22 y0 i
0
0 1
x0
y0
x0
X 30 = y 0 .
1
Com que les dues referències son rectangulars, C e s una matriu ortogonal, e s a dir, C t C = I
i per tant C t = C 1 . A mes, det(C) = 1, ja que tambe suposem sempre que les referències
utilitzades son positives.
Proposicio 9.3 Aplicant a lequacio X t AX + 2L X + f = 0 el canvi de coordenades X =
B + C X 0 obtenim
(X 0 )t A0 X 0 + 2L 0 X 0 + f 0 = 0 ,
on
0
t
A = C AC
L 0 = (B t A + L)C
0
f = B t AB + 2L B + f = F(x0 , y0 ) .
Lequacio matricial compacta de la cònica en les noves coordenades e s

(X 30 )t A03 X 30 = 0 ,
on
A03 = C3t A3 C3 .
D EMOSTRACI O . En substituir X = B + C X 0 a lequacio matricial de la cònica sobte

(B + C X 0 )t A(B + C X 0 ) + 2L(B + C X 0 ) + f = 0
i, en efectuar els productes daquestes matrius,
B t AB + B t AC X 0 + (X 0 )t C t AB + (X 0 )t C t AC X 0 + 2L B + 2LC X 0 + f = 0 .
Daltra banda, (X 0 )t C t AB = B t AC X 0 , ja que aquests productes donen escalars; per tant, agrupant els termes obtenim
(X 0 )t C t AC X 0 + 2(B t A + L)C X + B t AB + 2L B + f = 0 ,
e s a dir,
(X 0 )t A0 X 0 + 2L 0 X 0 + f 0 = 0 .
144
De la mateixa manera, la substitucio de X 3 = C3 X 30 a lequacio matricial compacta de la cònica

dona
(X 30 )t C3t A3 C3 X 30 = 0 ,
e s a dir,
(X 30 )t A03 X 30 = 0 .
La nocio de cònica no depèn del sistema de referència escollit ja que, segons la proposicio
anterior, el fet de quedar definida per una equacio de segon grau no varia en fer un canvi de
coordenades.
Les matrius A i A3 duna banda, i les matrius A0 i A03 de laltra, corresponen a les formes
matricial i matricial compacta de la mateixa cònica en dos sistemes de referència diferents. Estan
relacionades per les igualtats
A0 = C t AC
A03 = C3t A3 C3 ,
la qual cosa ens permetrà introduir el concepte dinvariant a partir del resultat seguent.
Proposicio 9.4 En tot canvi de coordenades es compleix:
(a) A i A0 tenen els mateixos valors propis.
(b) det(A) = det(A0 ), tr(A) = tr(A0 ).
(c) det(A3 ) = det(A03 ), rang(A3 ) = rang(A03 ).
D EMOSTRACI O . (a) Com que C e s una matriu ortogonal, A0 = C t AC = C 1 AC; per tant, A i
A0 tenen el mateix polinomi caracterstic i, en conseque` ncia, els mateixos valors propis.
(b) Nomes cal observar que el determinant i la traca son els coeficients del polinomi caracterstic
duna matriu dordre 2.
evident que det(C3 ) = det(C) = 1, per tant det(A3 ) = det(A0 ). Finalment, rang(A3 ) =
(c) Es
3
rang(A03 ) perquè la matriu C3 e s regular.
Definim ara com invariants de la cònica:
(a) i : valors propis de A.
(b) D2 = det(A) i T = tr(A).
(c) D3 = det(A3 ) i r3 = rang(A3 ).
145
Observacio 9.5 T , D2 i D3 son invariants de la funcio F(x, y) per canvis de coordenades, però
no podem dir que siguin invariants de la cònica descrita per lequacio F(x, y) = 0. Nomes
cal observar que la multiplicacio daquesta equacio per un escalar t 6= 0 no modifica la cònica,
mentre que les quantitats anteriors es transformen en t T , t 2 D2 i t 3 D3 respectivament. En canvi,
el signe de D2 , lanullacio de D3 , el rang r3 i el signe de D3 T son invariants estrictes de la
cònica, ja que son independents del sistema de referència i dels factors t 6= 0, i son els que farem
servir per donar un criteri pràctic de classificacio de les còniques en aquesta mateixa seccio.
La classificacio de les còniques es basa en fer leleccio del canvi de coordenades X = B + C X 0

de manera que lequacio inicial de la cònica es transformi en la mes senzilla possible. La matriu
C ens dona les direccions dels nous eixos de coordenades, que han de coincidir amb els de la
cònica, mentre que lobjectiu de la translacio B e s que el nou origen de coordenades coincideixi
amb el centre o el vèrtex de la cònica.
Per tal que lequacio resultant sigui la mes senzilla possible, la matriu A0 ha de ser diagonal i, si
e s possible, hem de fer que L 0 = 0 o f 0 = 0. Si det(A) 6= 0, el sistema dequacions AX + L t = 0
e s compatible determinat i, per tant, si B nes la solucio tindrem que L 0 = 0. El lema seguent
descriu els casos en que D2 = det(A) = 0.
Lema 9.6 (a) Si D2 = D3 = 0, el sistema AX + L t = 0 e s compatible indeterminat.
(b) Si D2 = 0 i D3 6= 0, el sistema AX + L t = 0 e s incompatible.
D EMOSTRACI O . Suposant que D2 = 0, e s suficient demostrar que el sistema e s compatible

indeterminat si, i nomes si, D3 = 0. Com que D2 = 0, la matriu A ha de ser de la forma

A=
a ta
ta t 2 a

o
amb a 6= 0
En el primer cas tindrem que

a ta

D3 = ta t 2 a
d
e
d
e
f
A=
0 0
0 c

= d ta d e a d = a(dt e)2 ;
2

t a e
ta e

aleshores, si D3 = 0 ha de ser e = td, i el sistema AX + L t = 0 queda

amb c 6= 0 .
a ta
ta t 2 a

x
y
que, evidentment, e s compatible indeterminat.

+
d
dt

=
0
0
146
Recprocament, si el sistema e s compatible indeterminat sha de complir que

a d

don
D3 = 0 .
ta e = 0 ,
La demostracio en el segon cas e s anàloga i mes senzilla.
Teorema 9.7 Donada una cònica F(x, y) = 0, existeix una referència rectangular positiva R0 =
{ o ; uE, vE } on la seva equacio e s dun dels tres tipus seguents:
(a) x 0 2 + y 0 2 + f 0 = 0,
(b) x 0 2 + f 0 = 0,
(c) x 0 2 + 2e0 y 0 = 0,
amb , i e0 no nuls.
D EMOSTRACI O . Hem de trobar un canvi de coordenades rectangular X = B + C X 0 tal que
lequacio de la cònica en les noves coordenades sigui dun dels tres tipus de lenunciat.
Sigui C una matriu ortogonal amb det(C) = 1 tal que A0 = C t AC sigui diagonal:

0
A =
amb 6= 0.
Per escollir la translacio B distingirem tres casos:
(a) Si D2 6= 0, sigui B = (x0 , y0 )t lunica solucio del sistema AX + L t = 0. Aleshores, lequacio
de la cònica en les noves coordenades e s x 0 2 + y 0 2 + f 0 = 0, on f 0 = F(x0 , y0 ).
(b) Si D2 = D3 = 0, sigui B = (x0 , y0 )t una solucio qualsevol del sistema AX + L t = 0.
Aleshores, lequacio de la cònica en les noves coordenades e s x 0 2 + f 0 = 0, on f 0 = F(x0 , y0 ),
ja que un dels valors propis de A ha de ser nul.
(c) Si D2 = 0 i D3 6= 0, sigui B = (x0 , y0 )t lunica solucio del sistema dequacions
)
F(x, y) = 0
,
L 01 = 0
on L 01 e s el primer coeficient de L 0 (vegeu el lema seguent). Aleshores, lequacio de la cònica en
les noves coordenades e s x 0 2 + 2e0 y 0 = 0, on
e0 = (d, e) vE
147
i vE e s el vector propi unitari de A de valor propi 0 que ocupa la segona columna de la matriu de
canvi C.
Lema 9.8 Si D2 = 0 i D3 6= 0, el sistema
F(x, y) = 0
L 01 = 0
te una u nica solucio.
D EMOSTRACI O . Farem la demostracio nomes en el cas on

a ta
A=
amb
a 6= 0 ,
ta t 2 a
deixant la de laltre cas per al lector. Els valors propis de A son = a(1 + t 2 ) i = 0, i la
matriu de canvi e s

1
1 t
C=
.
1
1 + t2 t
Aleshores e s immediat comprovar que F(x, y) = a(x + t y)2 + 2d x + 2ey + f , i que lequacio
L 01 = 0 es pot escriure a(1 + t 2 )(x + t y) + d + et = 0; per tant, el sistema
)
F(x, y) = 0
L 01 = 0
es transforma en un sistema lineal de dues incògnites i determinant

1 t

d e = e dt 6= 0 ,
ja que D3 = a(e dt)2 6= 0. En conseque` ncia, el sistema e s compatible determinat.
Les matrius de la cònica en les noves coordenades son

0
0
A =
o A =
0
i
A03 =
,
f0
A03 =
f0
A03 =
0 e0
e0 0
A mes, els invariants de la cònica es poden calcular a partir de les matrius en les coordenades
originals i a partir daquestes matrius. A continuacio analitzem els diferents tipus de figura que
corresponen a les equacions del teorema anterior, fent una primera distincio segons D3 6= 0 o
D3 = 0.
148
Còniques no degenerades (D3 6= 0)

Nomes ho poden ser les del tipus (a) amb f 0 6= 0 i les del tipus (c). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 + f 0 = 0, i distingim tres possibilitats:
1. Valors propis del mateix signe (D2 = > 0) i terme independent amb signe contrari
(
D3
f 0
=
< 0). Lequacio es transforma en
T
+
x 02
y02
+
=1
p2
q2
i la cònica e s una ellipse real. Si els valors propis coincideixen, e s una circumferència, ja
que queda p = q (radi de la circumferència).
2. Valors propis i terme independent del mateix signe (D2 = > 0 i
Lequacio es transforma en
f 0
D3
=
> 0).
T
+
y02
x 02
+
= 1
p2
q2
i la cònica e s una ellipse imaginària.
3. Valors propis amb signe diferent (D2 = < 0). Permutant els eixos si e s necessari,
lequacio es transforma en
x 02
y02
2 =1
p2
q
i la cònica e s una hipèrbola. Si T = 0, els valors propis compleixen = i la hipèrbola
e s equilàtera.
Les còniques del segon tipus tenen equacio reduda x 0 2 + 2e0 y 0 = 0 (D2 = 0), que en aillar la
y 0 es transforma en
x 02
y0 =
.
2m
Per tant, es tracta duna paràbola.
Còniques degenerades (D3 = 0)

Ho son les còniques del tipus (a) amb f 0 = 0 i les del tipus (b). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 = 0, i distingim dos casos:
1. Valors propis amb signe diferent (D2 = < 0). Lequacio es pot escriure
(
px 0 + qy 0 = 0
2
2
2 0
2 0
p x q y = 0 o be
px 0 qy 0 = 0
i la cònica e s un parell de rectes reals secants. Si T = 0, els valors propis compleixen
= i les dues rectes son perpendiculars.
149
2. Valors propis del mateix signe (D2 = > 0). Lequacio es pot escriure
(
px 0 + iqy 0 = 0
2
2
p 2 x 0 + q 2 y 0 = 0 o be
px 0 iqy 0 = 0
i la cònica e s un parell de rectes imaginàries secants amb vèrtex real (el punt x 0 = y 0 = 0).
Les còniques del segon tipus tenen equacio reduda x 00 2 + f 0 = 0 (D2 = 0), i ara distingim tres
casos:
1. f 0 = 0 (r3 = 1). Lequacio reduda e s x 0 2 = 0 i la cònica e s una recta doble.
2. i f 0 tenen signe diferent (r3 = 2). Lequacio reduda es transforma en
(
x0 = p
2
x 0 = p 2 o be
x0 = p
i la cònica e s un parell de rectes reals paralleles .
3. i f 0 tenen el mateix signe (r3 = 2). Lequacio reduda es transforma en
(
x 0 = pi
2
x 0 = p 2 o be
x 0 = pi
i la cònica e s un parell de rectes imaginàries paralleles.
Les observacions que hem fet sobre els invariants en aquesta classificacio de les còniques a partir
de lequacio reduda ens permeten establir el criteri de classificacio de la taula 9.1.
D3 T > 0 ellipse imaginària
D2 > 0
D3 T < 0 ellipse real
D3 6= 0
D2 < 0 hipèrbola
D = 0 paràbola
2
D2 > 0 parell de rectes imaginàries secants amb vèrtex real
D < 0 parell de rectes reals secants

2
(
D3 = 0
r3 = 2 parell de rectes paralleles (reals o imaginàries)
D2 = 0
r3 = 1 recta doble
Taula 9.1: Classificacio de còniques
150
Observacions 9.9 (a) El cas = = 0 fa que lequacio es redueixi a una de primer grau
(A0 = A = 0) i, com que es tracta duna recta, no lhem inclòs a lestudi de les còniques, on hem
suposat sempre 6= 0.
(b) La referència R0 = { 0 ; uE, vE } on la cònica adopta lequacio reduda compleix les propietats
seguents: (1) uE e s un vector propi unitari de valor propi i determina la direccio positiva de leix
ox 0 ; (2) vE e s un vector propi unitari de valor propi , determina la direccio positiva de leix oy 0
i el podem escollir de manera que det(C) = 1 per tal que la referència R0 sigui positiva; (3) el
nou origen de coordenades e s el punt x 0 = y 0 = 0, per tant a partir daqu podem trobar les seves
coordenades en la referència original i coincideix amb el centre de lellipse o el de la hipèrbola
o amb el vèrtex de la paràbola.
(c) Si permutem lordre en que escollim els valors propis i vectors propis corresponents, el sistema de referència i lequacio reduda tambe varien, intercanviant-se els papers de les coordenades
x 0 i y0.
Exemples 9.10 (a) La cònica dequacio
10x 2 12x y 6y 2 12x 12y 129 = 0
te matrius

A=
10 6
6 6

i
10 6
6
6
A3 = 6 6
6 6 129
i invariants D2 = 96 i D3 = 11808, per tant e s una hipèrbola.

El polinomi caracterstic de la matriu A e s det(x I A) = x 2 4x 96 i els valors propis 12
i 8. Com a vectors propis escollim (3, 1) de valor propi 12 i (1, 3) de valor propi 8. El
centre de la hipèrbola e s la solucio del sistema dequacions AX + L t = 0, e s a dir,
)
10x 6y 6 = 0
,
6x 6y 6 = 0
e s a dir, el punt (0, 1), i els eixos son les rectes que passen pel centre i tenen direccions (3, 1)
i (1, 3) respectivament. Lequacio reduda i el canvi de coordenades corresponent son

0
1
0
x
3 1
x
02
02
+
.
12x 8y 123 = 0 i
=
1
y
y0
10 1 3
Finalment, les asmptotes de la hipèrbola son les rectes que passen pel centre i tenen pendent
m = lim
y
.
x
151
Dividint lequacio de la hipèrbola entre x 2 i prenent el lmit obtenim que 10 12m 6m 2 = 0,

e s a dir, els pendents de les asmptotes son
3 + 2 6
3 2 6
i
.
3
3
(b) Les matrius de la cònica dequacio
x 2 4x y + 4y 2 2x y = 0
son

A=
1 2
2
4

i
1
A3 = 2
1
2
4
-1/2
1
-1/2
0
i els seus invariants D2 = 0 i D3 = -25/4, per tant la cònica e s una paràbola.

Els valors propis de la matriu A son 5 i 0, i els vectors propis corresponents (1, 2) i (2, 1). Per
calcular el vèrtex de la paràbola hem de resoldre el sistema dequacions
)
x 2 4x y + 4y 2 2x y = 0
,
x 2y = 0
que te per solucio (0, 0). Daltra banda, tenim que
5
1
e = (1, -1/2) (2, 1) =
2
5
0
i lequacio reduda de la paràbola e s
2
5x 0 5 y 0 = 0 ,
y0 =
o be
02
5x .
El canvi de coordenades que transforma lequacio inicial en lequacio reduda e s

0
1
x
1 2
x
.
=
y
2
1
y0
5
(c) La cònica dequacio
2x 2 2x y 4y 2 2x + 10y 4 = 0
te matrius

A=
2 1
1 4

i
2 1 1
5
A3 = 1 4
1
5 4
152
i invariants D2 = 9 i D3 = 0, per tant e s un parell de rectes reals secants. Per calcular les
seves equacions, tractem lequacio de la cònica com una equacio de segon grau per a y,
4y 2 + (10 2x)y + (2x 2 2x 4) = 0 ,
que te per solucio
p
(10 2x)2 + 16(2x 2 2x 4)
y=
8
2x 10 36x 2 72x + 36
=
8
2x 10
2x 10 (6x 6)
.
8
Aleshores, la cònica està formada per les rectes

y = x + 2
y=
x +1
,
2
e s a dir, x + y 2 = 0 i x 2y + 1 = 0.
9.3 Llocs geomètrics

Un lloc geomètric en el pla e s un conjunt de punts que satisfan una propietat determinada, expressada habitualment en termes geomètrics (distàncies entre punts, distàncies entre punts i rectes,
interseccio de rectes, etc.). El problema de determinar un lloc geomètric consisteix a trobar
lequacio daquest conjunt de punts en una referència donada o en una adaptada al problema.
Les definicions dellipse, hipèrbola i paràbola de la primera seccio daquest captol i el càlcul de
les seves equacions canòniques en unes referències adequades son exemples de llocs geomètrics
on la propietat que els determina ve donada per distàncies. En ocasions semblants, laplicacio
directa de la condicio que han de complir els punts del lloc geomètric dona la seva equacio.
Exemple 9.11 A partir duna recta R i un punt F exterior a ella, calculem lequacio del lloc
geomètric dels punts p que satisfan, per a un t 0 fix,
d( p, F) = td( p, R) .
Escollim una referència de manera que la recta R tingui equacio y = 0 i el punt F coordenades
(0, 1). Aleshores lequacio e s
p
x 2 + (y 1)2 = t| y | .
153
Elevant al quadrat els dos termes obtenim

x 2 + (y 1)2 = t 2 y 2 ,
i, agrupant els termes,
x 2 + (1 t 2 )y 2 2y + 1 = 0 ,
que e s una cònica per a qualsevol valor de t. Tenint en compte que D3 = t 2 i D2 = 1 t 2 ,
resulta: si t = 0, la cònica e s un parell de rectes imaginàries secants amb vèrtex real (el punt F);
si 0 < t < 1, e s una ellipse; si t = 1, e s una paràbola; i si t > 1, e s una hipèrbola.
En altres ocasions, les propietats que defineixen els punts dun lloc geomètric depenen delements variables que es poden expressar en termes dun o mes paràmetres. Aleshores, les equacions que descriuen aquests punts tambe depenen dels paràmetres, i lequacio del lloc geomètric
sobte en eliminar-los daquest sistema. (Observem que per poder eliminarlos el sistema ha de
tenir una equacio mes que paràmetres.)
Exemple 9.12 Donats el punt F = (0, 1) i la paràbola x 2 4y = 0, calculem lequacio del lloc
geomètric dels punts mitjans dels segments que uneixen dos punts de la paràbola i passen per F.
Aquests segments sobtenen en fer passar una recta variable pel punt F i calcular la seva interseccio amb la paràbola. Una recta que passa pel punt F te equacio
y 1 = mx
o be
y = mx + 1
(les rectes variables depenen del paràmetre m). La interseccio daquesta recta i la paràbola ve
donada per lequacio
x 2 4(mx + 1) = 0 ,
i les seves solucions son
x=
4m
p
16m 2 + 16
4m 4 m 2 + 1
=
= 2m 2 1 + m 2 .
2
2
Per tant, les interseccions de la recta i la paràbola son els punts

p
p
P = (2m + 2 1 + m 2 , 1 + 2m 2 + 2m 1 + m 2 )
p
p
Q = (2m 2 1 + m 2 , 1 + 2m 2 2m 1 + m 2 ) ,
i el punt mitjà del segment P Q te per coordenades
x = 2m
y = 1 + 2m 2
)
.
154
Aquest e s el sistema que descriu els punts del lloc geomètric en funcio del paràmetre m. Per
eliminar-lo, allem m de la primera equacio,
m=
x
,
2
i substituim a la segona: resulta

y =1+2
x 2
2
2y = 2 + x 2
x 2 2y + 2 = 0 ,
que e s lequacio duna paràbola.
9.4 Quàdriques
Una quàdrica e s una figura C de lespai que en algun sistema de coordenades queda definida per
una equacio de la forma
F(x, y, z) = a11 x 2 + a22 y 2 + a33 z 2 + 2a12 x y + 2a13 x z + 2a23 yz + 2b1 x + 2b2 y + 2b3 z + c = 0 .
Introduint les notacions

x
X= y ,
z
a11 a12 a13

A = a12 a22 a23
a13 a23 a33
L = (b1
b2
b3 ) ,
lequacio F(x, y, z) = 0 e s equivalent a lequacio matricial de C,

X t AX + 2L X + c = 0 ,
i escrivint
x
y
X4 =
z
1

i
A4 =
A Lt
L c
obtenim lequacio matricial compacta

X 4t A4 X 4 = 0 .
a11 a12 a13 b1

a12 a22 a23 b2
=
a13 a23 a33 b3
b1 b2 b3 c
155
Daltra banda, un canvi de referència de les coordenades (x, y, z) a les coordenades (x 0 , y 0 , z 0 )

es descriu per X = B + C X 0 , on B e s una transllacio de lorigen al punt (x0 , y0 , z 0 ) i C una
rotacio dels eixos. En forma compacta resulta

C B
0
X 4 = C4 X 4 , on C4 =
.
0 1
La demostracio dels dos resultats seguents e s la mateixa que en el cas de les còniques.
Proposicio 9.13 Aplicant a la quàdrica C el canvi de referència X = B + C X 0 , lequacio de la
figura en la nova referència e s (X 0 )t A0 X 0 + 2L 0 X 0 + c0 = 0, on
0
t
A = C AC
L 0 = (B t A + L)C
0
c = B t AB + 2L B + c = F(x0 , y0 , z 0 )
En forma compacta, lexpressio passa a ser (X 40 )t A04 X 40 = 0, on A04 = C4t A4 C4 .
Corol.lari 9.14 Son invariants de la quàdrica C per canvis de coordenades:
(a) Els valors propis , i de la matriu A.
(b) El polinomi caracterstic de la matriu A, det(I A) = 3 t1 2 + t2 t3 , on t1 = tr(A),
t2 e s la suma dels tres menors diagonals dordre 2 i t3 = det(A) = D3 .
(c) El determinant D4 = det(A4 ).
(d) El rang r4 = rang(A4 ).
Recordem que, com en el cas de les còniques, per parlar dinvariants estrictes cal tenir present
lefecte de multiplicar per t 6= 0 lequacio de la quàdrica. Els valors propis passen a ser t, t i
t , els coeficients del polinomi caracterstic de A queden multiplicats respectivament per t, t 2 i
t 3 i el determinant total es converteix en t 4 D4 , mentre que el rang de A4 no varia.
El proces de reduccio de lequacio duna quàdrica e s semblant al de les còniques. Com que la matriu A e s simètrica, existeix una matriu ortogonal C amb det(C) = 1 i tal que C t AC = C 1 AC
e s diagonal; en llenguatge geomètric, una rotacio deixos elimina els termes no rectangulars, e s
a dir, fa que
0
0
0
a12
= a13
= a23
= 0,
0
0
0
mentre que a11
= , a22
= i a33
= , valors propis de A. Daltra banda, escollint la translacio
B de manera adequada (o aplicant una segona rotacio deixos en un dels casos) podem anullar
156
els termes de la part lineal quan el sistema AX + L t = 0 e s compatible, o be dos coeficients de la

part lineal i el terme independent quan aquest sistema e s incompatible. Arribem aix al resultat
seguent.
Teorema 9.15 Amb un canvi de coordenades adequat, lequacio de qualsevol quàdrica pot
reduir-se a un dels cinc tipus seguents:
(a) x 0 2 + y 0 2 + z 0 2 + c0 = 0.
(b) x 0 2 + y 0 2 + c0 = 0.
(c) x 0 2 + c0 = 0.
(d) x 0 2 + y 0 2 + 2b30 z 0 = 0.
(e) x 0 2 + 2b30 y 0 = 0.
Els coeficients , , i b30 son no nuls.
A continuacio analitzem els diversos tipus de superfcies que representen aquestes equacions, i
el criteri bàsic per distingirles e s el signe dels coeficients. Prèviament, però, seguim el criteri
del rang per a una primera classificacio.
Quàdriques no degenerades (r4 = 4, e s a dir, D4 6= 0)

Ho son les quàdriques del tipus (a) amb c0 6= 0 i les del tipus (d). Les del primer tipus tenen
equacio reduda x 0 2 + y 0 2 + z 0 2 + c0 = 0, i hem de distingir quatre possibilitats:
1. Els tres valors propis tenen el mateix signe i el terme independent signe contrari (D4 =
c0 < 0). Amb petites modificacions aritmètiques, lequacio adopta la forma
x 02
y02
z02
+
+
=1
p2
q2
r2
i la quàdrica e s un ellipsoide real (de revolucio si coincideixen dos dels valors propis i
una esfera si coincideixen tots tres).
2. Valors propis i terme independent del mateix signe (D4 > 0). Lequacio es podrà escriure
x 02
y02
z02
+ 2 + 2 = 1
p2
q
r
i la quàdrica e s un ellipsoide imaginari (sense punts reals).
3. Valors propis de signe diferent i terme independent del mateix signe que el valor propi
allat (D4 > 0). Lequacio es pot escriure
x 02
y02
z02
+
= 1,
p2
q2
r2
157
i la quàdrica e s un hiperboloide duna fulla.

4. Valors propis de signe diferent i terme independent amb el mateix signe que dos dells
(D4 < 0). Lequacio quedarà de la forma
x 02
y02
z02
= 1,
p2
q2
r2
que e s lhiperboloide de dues fulles.
Les quàdriques del tipus (d) tenen equacio reduda x 0 2 + y 0 2 + 2b30 z 0 = 0, i distingim dues
possibilitats:
1. Els valors propis no nuls son del mateix signe (t2 = > 0 i D4 = b30 2 < 0). Resulta
x 02
y02
+
= z0 ,
p2
q2
anomenada paraboloide ellptic (de revolucio o circular si p = q).
2. Els valors propis no nuls tenen signe diferent (t2 < 0 i D4 > 0). Prenent el primer positiu,
el segon negatiu i el coeficient b30 negatiu, apareix
x 02
y02
2 = z0 ,
p2
q
que e s el paraboloide hiperbòlic.
Quàdriques poc degenerades (r4 = 3 i, en particular, D4 = 0)

Ho son les quàdriques del tipus (a) amb c0 = 0, les del tipus (b) amb c0 6= 0 i les del tipus (e).
Les del tipus (a) tenen equacio reduda x 0 2 + y 0 2 + z 0 2 = 0 (D3 6= 0), i distingim dues
possibilitats:
1. Valors propis de signe diferent. Lequacio sescriu
y02
x 02
2
+
= z0
2
2
p
q
i la quàdrica e s un con real (circular o de revolucio si p = q).
2. Valors propis del mateix signe. Això dona
y02
x 02
2
+
= z 0 ,
2
2
p
q
que e s un con imaginari (amb vèrtex real x 0 = y 0 = z 0 = 0).
158
Les del tipus (b) tenen equacio reduda x 0 2 + y 0 2 + c0 = 0 (D3 = 0), i hem de distingir tres
possibilitats:
1. Valors propis no nuls del mateix signe (t2 > 0) i terme independent de signe contrari
(
c0
< 0). Lequacio reduda es transforma en
+
x 02
y02
+
=1
p2
q2
i la quàdrica e s un cilindre ellptic real (circular si p = q).
2. Valors propis no nuls i terme independent del mateix signe (t2 > 0 i
queda
c0
> 0). Lequacio
+
x 02
y02
+
= 1
p2
q2
i això e s un cilindre ellptic imaginari (sense punts reals).
3. Valors propis no nuls de signe diferent (t2 < 0). Permutant, si e s necessari, les coordenades
x 0 i y 0 tenim que
y02
x 02
= 1,
p2
q2
anomenat cilindre hiperbòlic.
Les quàdriques del tipus (e) tenen equacio reduda x 0 2 + 2b30 y 0 = 0 (D3 = t2 = 0), i lequacio
es pot escriure com
2
x 0 = 2 py 0 ,
que correspon a un cilindre parabòlic.
Quàdriques molt degenerades (r4 2 i, en particular, D4 = R4 = D3 = 0)

Ho son les quàdriques del tipus (b) amb c0 = 0 i les del tipus (c). Les del tipus (b) tenen equacio
reduda x 0 2 + y 0 2 = 0, i hem de distingir dues possibilitats:
1. Valors propis de signe diferent (t2 < 0). Podem escriure
(
px 0 + qy 0 = 0
2 02
2 02
p x q y = 0 , o be
px 0 qy 0 = 0
que defineix un parell de plans reals secants (perpendiculars si p = q).
2. Valors propis del mateix signe (t2 > 0). Tindrem
(
2 02
2 02
p x + q y = 0,
o be
px 0 + iqy 0 = 0
px 0 iqy 0 = 0
159
que e s un parell de plans imaginaris secants (amb interseccio real: la recta dequacions
x 0 = y 0 = 0).
Finalment, les quàdriques del tipus (c) tenen equacio reduda x 0 2 + c0 = 0 (t2 = 0), i distingim
tres possibilitats:
1. Si i c0 tenen signe diferent, tenim
(
02
x =p ,
2
o be
x0 = p
x0 = p
que e s un parell de plans reals parallels (diferents).

2. Si i c0 tenen el mateix signe,
(
02
x = p ,
2
o be
x0 = i p
x 0 = i p
i això e s un parell de plans imaginaris parallels (sense punts reals).

3. Si c0 = 0 (r4 = 1), dividint lequacio per obtenim
2
x0 = 0
que e s un pla doble.
Aquesta classificacio de les quàdriques es pot expressar en termes dels invariants dacord amb
lesquema de la taula 9.2.
Observacions 9.16 (a) Per classificar una quàdrica no e s indispensable calcular efectivament els
valors propis de la matriu A: nomes cal tenir en compte els signes, i per a això e s forca u til el
teorema de Descartes (vegeu lapèndix B).
(b) Recomanem al lector que estudi les seccions de les quàdriques per plans perpendiculars
als eixos: e s un exercici instructiu per familiaritzarse amb els noms de les figures i per notar
determinades caracterstiques: la connexio dellipsoides, paraboloides i hiperboloides duna
fulla, lafitament de lellipsoide, el paper del vèrtex del con i del paraboloide o els eixos dels
cilindres.
(c) En comparacio amb les còniques, aqu tambe trobem el cas no degenerat (ellipsoides, hiperboloides i paraboloides) i un cas degenerat (parell de plans) anàleg al dels parells de rectes
del pla; hi ha, però, un grup intermig, format pels cons i els cilindres, que e s una mena dhbrid
sense correspondència en el cas de les còniques.
160
D4 > 0
D4 < 0
D3 6= 0
D3 = 0
D3 6= 0
(
Valors propis amb el mateix signe
Valors propis amb signe diferent
paraboloide hiperbòlic
ellipsoide imaginari
hiperboloide duna fulla
(
Valors propis amb el mateix signe
ellipsoide real
hiperboloide de dues fulles
D3 = 0 paraboloide ellptic
(
Valors propis amb el mateix signe con imaginari
D3 6= 0

con real
t2 > 0 cilindre ellptic (real o imaginari)
t2 < 0 cilindre hiperbòlic
r4 = 3
t = 0 cilindre parabòlic
D4 = 0
t2 > 0 parell de plans imaginaris secants
D3 = 0
r
=
2
t2 < 0 parell de plans reals secants
t2 = 0 parell de plans parallels (reals o imaginaris)
r4 = 1 pla doble
Taula 9.2: Classificacio de quàdriques

Exemples 9.17 (a) Considerem la quàdrica dequacio
2x 2 + 2x y 2x z 2yz + 6x + 10y + 4z 20 = 0 .
Calculant els invariants a partir de la matriu
2
1 1
3
1
0 1
5
A4 =
1 1
0
2
3
5
2 20
resulta D4 = 0, r4 = 2 i t2 = 3, per tant la quàdrica e s un parell de plans reals secants.
161
(b) Estudiem ara la quàdrica

x 2 + y 2 2z 2 + 2x y + 4x z + 2z 4 = 0 .
La matriu e s
1
1
A4 =
2
0
1
2
0
1
0
0
.
0 2
1
0
1 4
Com que D4 = 16, e s una quàdrica no degenerada. El polinomi caracterstic de la matriu A,

det(I A) = 3 8 + 4 ,
ens indica que hi ha dos valors propis positius i un de negatiu, per tant aquesta quàdrica e s un
hiperboloide duna fulla.
(c) Finalment, considerem la quàdrica
x 2 + y 2 z 2 + 4x 4z = 0 .
Novament, partim de la matriu
1
0
A4 =
0
2
0
0
2
1
0
0
0 1 2
0 2
0
i obtenim D4 = 0 i D3 = 1. Els valors propis de A son 1 (doble) i 1, per tant es tracta dun
con real circular.
162
163
A
Permutacions
Una permutacio del conjunt N = {1, 2, . . . , n} e s una aplicacio bijectiva : N N , que

escriurem amb la imatge de cada element a sota dell:

1 2 ... n
1 2 3 4 5 6
=
;
per exemple,
=
.
1 2 . . . n
4 5 1 6 3 2
Representarem per Pn el conjunt de les n! permutacions possibles de N , que son simplement
reordenacions dels n elements. La identitat, definida per

1 2 ... n
id =
,
1 2 ... n
e s lunica permutacio que conserva lordre natural. Donada una permutacio , es diu que un
parell i < j e s una inversio de si i > j . El signe de e s ( ) = (1)inv( ) , on inv( ) e s
el nombre dinversions de . Per exemple, (id) = 1, i si e s lexemple concret del principi
aleshores ( ) = 1, ja que presenta 9 inversions.
Una transposicio e s una permutacio que deixa fixos tots els elements de N excepte dos, i direm
que e s bàsica si aquests dos elements son consecutius; per exemple, si

1 2 3 4 5 6
1 2 3 4 5 6
=
i
=
,
1 5 3 4 2 6
1 2 4 3 5 6
164
Permutacions
e s una transposicio i e s una transposicio bàsica. En qualsevol cas, escriurem simplement

transposicions com aquestes en la forma = (2, 5) i = (3, 4). El signe de tota transposicio e s
1.
El producte de dues permutacions i e s laplicacio composta, escrita (recordem que primer
opera i despres ). El producte e s una operacio associativa, i la identitat nes lelement neutre.
La inversa duna permutacio e s laplicacio inversa, escrita 1 , i e s lunica permutacio tal que
1 = id = 1 . Amb els exemples anteriors,

1 2 3 4 5 6
4 5 1 6 3 2
1 2 3 4 5 6
1
=
i =
=
.
4 5 6 1 3 2
1 2 3 4 5 6
3 6 5 1 2 4
Proposicio A.1 ( 1 ) = ( ) per a qualsevol Pn .
D EMOSTRACI O . Cada inversio de equival a una inversio de 1 , ja que
i< j
amb k = i > ` = j
`<k
amb
j = 1 ` > i = 1 k .
Proposicio A.2 Sigui una transposicio. Aleshores:

(a) ( ) = ( )
Pn .
(b) Laplicacio Pn Pn definida per 7 transforma les permutacions de signe positiu

en permutacions de signe negatiu i viceversa; per tant, hi ha la meitat de permutacions de
cada signe.
D EMOSTRACI O . (a) Si e s bàsica, presenta una inversio menys o una inversio mes que
, de manera que ( ) = ( ). Si no e s bàsica, e s el producte dun nombre senar de
transposicions bàsiques, ja que per a qualsevol parell i < j de N podem escriure
(i, j) = (i, i + 1)(i + 1, i + 2) ( j 2, j 1)( j 1, j)( j 2, j 1) (i + 1, i + 2)(i, i + 1) .
Aplicant reiteradament la propietat establerta abans en el cas de les transposicions bàsiques,
arribem tambe aqu a la relacio ( ) = ( ).
(b) Segons lapartat anterior, el signe de e s el contrari del de ; com que laplicacio donada
per 7 e s injectiva, hi ha tantes permutacions de signe positiu com de signe negatiu.
Proposicio A.3 Tota permutacio e s producte de transposicions. Si = 1 2 p e s una descomposicio daquest tipus,
( ) = (1) p .
165
D EMOSTRACI O . Aplicarem recurrència sobre el nombre delements que no queden fixos. Si

mou nomes i i j, aleshores = (i, j). Suposem ara que mou k > 2 elements de N , i escollim
i tal que i = j 6= i. La permutacio (i, j) deixa invariants els mateixos elements que i, a
mes, lelement i: per recurrència, sabem que (i, j) = 2 p (producte de transposicions),
per tant = 1 2 p amb 1 = (i, j). Lafirmacio final sobre el signe de la permutacio e s una
conseque` ncia immediata de lapartat (a) de la proposicio precedent.
166
Permutacions
167
B
Polinomis
Un monomi e s una expressio de la forma ax m , on el coeficient a e s un nombre real o complex,

x e s una indeterminada i m e s un nombre natural o zero. Un polinomi e s una suma finita de
monomis, que escrivim com
p(x) = a0 + a1 x + a2 x 2 + + an x n ,
amb an 6= 0 si n > 0. Es diu que n e s el grau de p(x). Els polinomis de grau 0, tambe
anomenats constants, sidentifiquen amb els nombres. Els polinomis es poden sumar, restar i
multiplicar seguint les lleis ordinàries de làlgebra, i nomes tenen invers els polinomis constants
no nuls.
Divisio entera. Donats dos polinomis p(x) i d(x) 6= 0, existeixen dos u nics polinomis q(x)
(quocient) i r (x) (residu) tals que:
(1) p(x) = d(x)q(x) + r (x).
(2) r (x) e s 0 o de grau mes petit que el grau de d(x).
La demostracio e s senzilla, per induccio sobre el grau de p(x). Sens dubte, el lector tambe
coneix la regla de Ruffini, que esquematitza la divisio dun polinomi p(x) per x .
Quan r (x) = 0 la divisio e s exacta, i es diu que d(x) e s un divisor de p(x) o be que p(x) e s un
multiple de d(x).
168
Polinomis
Si e s un nombre real o complex, el valor numèric dun polinomi p(x) quan x = e s

p() = a0 + a1 + a2 2 + + an n ,
i e s una arrel de p(x) si p() = 0.
Proposicio B.1 (a) (Teorema del residu.) El residu de la divisio dun polinomi p(x) per x
e s el valor numèric p().
(b) (Teorema del factor.) Un nombre e s arrel dun polinomi p(x) si, i nomes si, x e s un
divisor de p(x).
D EMOSTRACI O . (a) La divisio de p(x) per x dona p(x) = (x )q(x) + r, i substituint
arreu x = queda p() = r .
(b) Es una conseque` ncia immediata de (a).
Exemples B.2 (a) Els valors num`
es poden calcular amb la regla de Ruffini.
erics dun polinomi
3
Per exemple, si volem trobar p( 2) quan p(x) = x + 2x 2 3x + 1, fem
2
1
2
2+
2+2 2
1 + 2 2
4 2
5
i tenim que p( 2) = 5 2.
(b) Segons el teorema del factor, si e s una arrel de p(x) tenim
p(x) = (x )q(x) .
Si e s una arrel de q(x) resulta q(x) = (x )r (x), i per tant
p(x) = (x )(x )r (x) .
Si continuem aquest proces de descomposicio, i tenim en compte el comportament del grau
davant de la multiplicacio de polinomis, observem que el darrer quocient serà de grau zero, i per
tant un polinomi de grau n > 0 pot tenir, com a màxim, n arrels diferents.
169
Daltra banda, una arrel pot aparèixer mes duna vegada durant aquesta descomposicio dun
polinomi p(x) com a producte de factors de primer grau, per tant e s convenient introduir la
nocio seguent: es diu que e s una arrel de p(x) amb multiplicitat m si
p(x) = (x )m q(x)
amb q() 6= 0 .
Aix, direm que e s simple si m = 1, i multiple (doble, triple, ...) si m > 1.
Per completar lestudi de les arrels i la descomposicio dels polinomis en factors, serà u til distingir entre els polinomis de coeficients reals, el conjunt dels quals representarem per R[x], i
els polinomis de coeficients complexos, que formaran el conjunt denotat per C[x]. Com que es
pot considerar R C, tambe tenim que R[x] C[x]. El motiu de la distincio e s el seguent:
mentre que molts polinomis de coeficients reals no tenen arrels reals (x 2 + 1 nes lexemple mes
senzill), o no tantes com indica el seu grau encara que comptem les multiplicitats, la situacio e s
totalment diferent en el cas de coeficients complexos. El resultat seguent permet afirmar que els
complexos representen la culminacio de les ampliacions de la idea de nombre.
Teorema B.3 (Teorema fonamental de làlgebra.) Tot polinomi no constant de coeficients complexos te alguna arrel complexa.
D EMOSTRACI O . Gauss va donar cinc demostracions diferents daquesta propietat. Lamentablement, cap delles e s prou elemental per inclourela aqu.
Corol.lari B.4 Tot polinomi no constant p(x) de coeficients complexos es descompon totalment
dins de C[x] en producte de factors de primer grau:
p(x) = an (x 1 )(x 2 ) (x n )
o, agrupant les arrels segons les seves multiplicitats,
p(x) = an (x 1 )m 1 (x 2 )m 2 (x r )mr .
En particular, tot polinomi no constant te, comptant les multiplicitats, tantes arrels com indica el
seu grau:
m 1 + m 2 + + mr = n .
D EMOSTRACI O . Nomes cal aplicar reiteradament el teorema fonamental de làlgebra i el teorema del factor.
170
Polinomis
El teorema de Gauss tambe dona informacio sobre els polinomis de coeficients reals, i ens ocuparem immediatament daquesta questio.
Lema B.5 Si tenim un polinomi no constant p(x) R[x], i C e s una arrel de p(x) amb
multiplicitat m, el complex conjugat tambe e s una arrel de p(x), i amb la mateixa multiplicitat
m.
D EMOSTRACI O . La conjugacio, e s a dir, laplicacio
= u + iv
= u iv ,
conserva les quatre operacions aritmètiques. Denotarem per q(x) el polinomi que resulta de
conjugar els coeficientes de q(x). Conjugant les relacions
p(x) = (x )m q(x)
q() 6= 0
q() 6= 0 ,
obtenim les corresponents a ,

p(x) = (x )m q(x)
i per tant e s una arrel de p(x) amb multiplicitat m.
Corol.lari B.6 Tot polinomi no constant p(x) de coeficients reals es descompon totalment dins
de R[x] en producte de factors de primer grau o de segon grau amb discriminant negatiu:
p(x) = an (x 1 )m 1 (x r )mr (x 2 + b1 x + c1 )n 1 (x 2 + bs x + cs )n s ,
amb 1 , . . . , r , b1 , c1 , . . . , bs , cs R i b j 2 4c j < 0 per a j = 1, . . . , s.
D EMOSTRACI O . Si = u + iv i = u iv son arrels complexes conjugades de p(x), podem
agrupar els factors corresponents aix:
(x )(x ) = (x u iv)(x u + iv) = (x u)2 + v 2
= x 2 2ux + (u 2 + v 2 ) = x 2 + bx + c ,
on b = 2u, c = u 2 + v 2 i b2 4c < 0. Partim ara de la descomposicio de p(x) a C[x], que
segons el lema anterior serà de la forma
p(x) = an (x 1 )m 1 (x r )mr (x 1 )n 1 (x 1 )n 1 (x s )n s (x s )n s ,
amb 1 , . . . , r R i 1 , . . . , s
/ R. Agrupant de la manera indicada abans cada arrel complexa amb la seva conjugada resulta la descomposicio de p(x) dins de R[x].
171
Un aspecte bàsic dels polinomis e s la seva interpretacio com a funcions. Cada polinomi p(x)
defineix una funcio, denotada per p, que assigna a cada el valor numèric p(). El domini de
la funcio p pot ser R o C segons convingui; el recorregut, sempre dins de C, es trobarà dins de
R o no depenent del domini escollit i del tipus de coeficients del polinomi (tots reals o algun
complex). Es important notar que si p e s la funcio nulla aleshores p(x) e s el polinomi 0; per
tant, polinomis diferents defineixen funcions diferents. Els polinomis de grau 0 sanomenen
constants perquè ho son les funcions associades.
Si p(x) R[x], habitualment es considera p : R R. Aquesta funcio polinòmica e s contnua
i, de fet, infinitament derivable.
Exemples B.7 (a) Tot polinomi p(x) R[x] de grau senar te alguna arrel real. Això e s conseque` ncia de laparellament darrels conjugades, però tambe es pot demostrar considerant la
funcio polinòmica p. Suposant an > 0 observem que
lim p(t) =
lim p(t) = + ,
t+
perquè el grau de p(x) e s senar. Per tant, existeixen nombres t0 i t1 tals que p(t0 ) < 0 i p(t1 ) > 0.
Aplicant el teorema de Bolzano, es dedueix que p() = 0 per a algun (t0 , t1 ).
(b) e s una arrel del polinomi p(x) amb multiplicitat m si, i nomes si,
p() = Dp() = D 2 p() = = D m1 p() = 0
però
D m p() 6= 0 ,
on D i p() representa la ièssima derivada de la funcio p en el punt . La demostracio daquesta

propietat e s senzilla, observant que si e s una arrel de p(x) amb multiplicitat m aleshores tambe
ho e s de Dp(x) amb multiplicitat m 1.
Càlcul elemental darrels. Recordarem alguns criteris senzills per a lobtencio darrels de polinomis. En primer lloc, si p(x) e s un polinomi de coeficients enters, les arrels enteres de p(x)
son divisors del terme independent a0 . Això suposa un nombre finit de proves amb la regla de
Ruffini. Les arrels racionals de p(x) son tals que, escrites en forma irreductible r/s, el numerador r ha de ser un divisor del terme independent a0 i el denominador s ha de serho del coeficient
principal an ; per tant, tambe en aquest cas el nombre de proves e s finit.
Si p(x) e s un polinomi de coeficients racionals, e s fàcil trobar un polinomi de coeficients enters amb les mateixes arrels que p(x), al qual podrem aplicar les idees anteriors: nomes cal
multiplicar p(x) pel denominador comu de tots els seus coeficients.
Per al càlcul darrels irracionals, esmentem nomes el mètode de les aproximacions successives
basat en el teorema de Bolzano (si e s possible, conve fer primer un esboc de la gràfica de p).
172
Polinomis
Finalment, recordem algunes idees elementals que sovint son u tils per a la descomposicio dun
polinomi en factors: les anomenades igualtats notables, la resolucio dequacions de segon grau
(aplicable tambe a les equacions biquadrades) i treure factor comu la màxima potència possible
de x quan el terme independent e s zero.
(Per desgràcia, cap de les demostracions del teorema fonamental de làlgebra e s constructiva, en
el sentit de permetre la localitzacio efectiva de larrel de la qual sen garanteix lexistència.)
Lultima propietat que indicarem e s un resultat interessant, sobre tot per a lestudi de les formes
quadràtiques i les quàdriques, ja que en aquests dos casos treballem amb el polinomi caracterstic
duna matriu simètrica que, segons el teorema espectral, sabem que te totes les arrels reals.
Teorema B.8 (Teorema de Descartes.) Si p(x) e s un polinomi de coeficients reals i totes les
arrels de p(x) son reals, el nombre de variacions de signe entre coeficients consecutius (no
nuls, lògicament) de p(x) coincideix amb el nombre darrels positives de p(x) comptant les
multiplicitats.
D EMOSTRACI O . La justificacio no e s difcil, i es pot trobar a qualsevol tractat dàlgebra que
inclogui un estudi detallat dels polinomis.
Exemples B.9 (a) El polinomi p(x) = x 3 16x 2 9x + 28 e s el polinomi caracterstic duna
matriu simètrica, i per tant te tres arrels reals. Com que no te larrel 0 i presenta dues variacions
de signe, sabem que tindrà dues arrels positives i una arrel negativa (el lector pot confirmar que
les arrels de p(x) son, aproximadament, 10 54, 10 10 i 160 44).
(b) Per la mateixa rao, sabem que el polinomi q(x) = x 5 8x 3 + 4x 2 te cinc arrels reals. Hi ha
dues variacions de signe, per tant te dues arrels positives, larrel 0 doble i una arrel negativa.
(c) En canvi, el polinomi r (x) = 2x 3 6x + 5 te una sola arrel real i dues complexes conjugades.
Laplicacio (incorrecta) del teorema de Descartes diria que te dues arrels positives i una negativa.
Bibliografia
[1] Amer, R. i Domnguez, J. M.
`
Algebra
Lineal. Problemes resolts.
Ed. UPC. Barcelona. 1992.
[2] Amer, R. Carreras, F. i Tudur, J.
`
Algebra
Lineal. Problemes, exercicis i questions.
Ed. Cardellach Còpies. Terrassa. 1998.
[3] Anton, H.
Introduccion al a lgebra lineal.

Ed. Limusa. Mexico. 1989.
[4] Burgos, J. de
Algebra Lineal.
Ed. McGraw Hill. Madrid. 1993.
[5] Castellet, M. i Llerena, I.
`
Algebra
lineal i geometria.
Publicacions de la Universitat Autònoma de Barcelona. 1988.
[6] Granero, F.
Algebra y geometra analtica.

Ed. McGraw. Madrid. 1985.
[7] Lang, S.
Algebra lineal.
Ed. AddisonWesley. Mexico. 1986.
174
[8] Moreno, J. M.
Una introduccion al a lgebra lineal elemental.

Dep. de Matematicas. U.A.B. Bellaterra. 1988.
[9] Xambo, S.
Algebra lineal y geometrias lineales (Tomos I y II).

Ed. Eunibar. Barcelona.
Bibliografia
Index alfabètic
adjunt dun coeficient, 25

angle
de dos vectors, 56
entre varietats lineals, 132
orientat en el pla, 62
antiimatge, 68
a` rea
dun parallelogram, 136
dun triangle, 136
arrel
multiplicitat duna, 169
simple, 169
baricentre, 124
base, 37
canònica de Rn , 38
negativa, 62
ortogonal, 53
ortonormal, 55
positiva, 62
càlcul
darrels de polinomis, 171
càlcul de determinants
mètode de Gauss, 24
regla de Laplace, 26
regla de Sarrus, 20
càlcul de la inversa
mètode de GaussJordan, 17
per determinants, 27
canvi de base
en tensors, 107
en un espai vectorial, 47, 48
formula matricial, 48
matriu del, 48
per a endomorfismes, 71
per a transformacions lineals, 71
canvi de referència, 124
cilindre
ellptic imaginari, 158
ellptic real, 158
hiperbòlic, 158
parabòlic, 158
circumferència, 140, 148
classificacio
de còniques, 142, 145, 149
de quàdriques, 159
components dun vector en una base, 37
con
imaginari, 157
real, 157
cònica, 142
canvi de coordenades, 143
degenerada, 148
176
equacio matricial, 142

equacio matricial compacta, 142
equacio reduda, 142
invariants, 142, 144
invariants estrictes, 145
no degenerada, 148
coordenades, 123
coordenades polars, 62
cosinus directors, 56
desigualtat
de Schwarz, 54
triangular, 54, 132
determinants
definicio, 19
de Vandermonde, 29
formula del producte, 23
propietats, 2123
diagonalitzacio
condicions, 8386
de matrius, 89
dendomorfismes, 81
de tensors i formes, 109
dimensio dun espai vectorial, 40
distància
dun punt a una recta, 135
dun punt a un pla, 133
entre dos punts, 132
entre dues varietats lineals, 133
entre rectes que sencreuen, 134
entre varietats paralleles, 134
entre varietats secants, 134
diviso entera de polinomis, 167
doble producte vectorial, 64
eixos
principals dinèrcia, 110
ellipse, 139
centre, 140
distància focal, 140
eix principal, 140
eix secundari, 140
Index
alfabètic
equacio canònica, 140

focus, 139
imaginària, 148
real, 148
semieix major, 139
ellipsoide
imaginari, 156
real, 156
endomorfisme, 68
diagonalitzable, 81, 82
identitat, 75
isometria, 77
simètric, 87
equacio
duna recta, 125
dun pla, 125
reduda duna cònica, 142
equacio diferencial, 98
homogènia, 98
lineal, 98
lineal amb coeficients constants, 98
equivalència de sistemes dequacions, 10
error quadràtic, 59
esfera, 156
espai
euclidià puntual, 121
vectorial euclidià, 122
espai vectorial, 34
complex, 34
euclidià, 52
numèric, 34
orientacio dun, 61
expressio
euclidiana af, 112
euclidiana canònica, 110
extrems locals
màxim, 116
mnim, 116
feix de plans, 129
forma
hessiana, 105
lineal, 116
quadràtica, 106
forma quadràtica
associada a un tensor, 107
definida negativa, 113, 114
definida positiva, 113, 114
no definida, 113
semidefinida negativa, 113
semidefinida positiva, 113
formula
de Grassmann, 46
de Taylor, 116
formula del canvi de base
en transformacions lineals, 71
funcio polinòmica, 171
gir en el pla orientat, 70, 93
hipèrbola, 140, 148
asmptotes, 141
equilàtera, 141, 148
focus, 140
semieix real, 140
hiperboloide
de dues fulles, 157
duna fulla, 157
imatge, 67
duna transformacio lineal, 73
ndexs dinèrcia, 111, 112
interpolacio polinòmica, 29
inversa
duna matriu, 16
duna transformacio, 68
isometria vectorial, 77
directa, 78
inversa, 78
isometries
classificacio, 92
de lespai, 93
177
del pla, 92
llei dinèrcia de Sylvester, 111
llocs geomètrics, 152
matriu
adjunta, 27
ampliada, 30
columna, 14
conjugada, 89
definicio, 13
diagonal, 21
diagonalitzable, 89
diagonalitzable sobre els complexos, 89
diagonalitzable sobre els reals, 89
dordre n, 14
dun endomorfisme, 70
dun tensor, 107
fila, 14
invertible, 16
m n, 13
ortogonal, 16
quadrada, 14
regular, 16, 27
simètrica, 16
simplificable, 16
singular, 17
transposada, 15
triangular inferior, 21
unitat, 15
matrius quadrades, 16
menors diagonals, 83
menors duna matriu, 30
mètode de Gram-Schmidt, 52
mètode dels mnims quadrats, 58
mitjana aritmètica, 58
moment cinètic, 106
moments dinèrcia, 109
norma dun vector, 54
nucli duna transformacio lineal, 73
178
operacions amb endomorfismes, 75

composicio, 75
producte per escalars, 75
suma, 75
operacions amb matrius
diferència, 14
potències, 91
producte, 14
producte per escalars, 14
propietats, 1415
suma, 14
operacions amb vectors
diferència, 34
producte escalar, 51
producte per un escalar, 33
producte vectorial, 63
suma, 33
orientacio
de plans a lespai, 63
despais vectorials, 61
paràbola, 141, 148
focus, 141
paràmetre, 141
recta directriu, 141
vèrtex, 141
paraboloide
ellptic, 157
hiperbòlic, 157
parell de plans
imaginaris parallels, 159
imaginaris secants, 159
reals parallels, 159
reals secants, 158
parell de rectes
imaginàries paralleles, 149
imaginàries secants, 149
reals paralleles, 149
reals secants, 148
permutacio, 163
identitat, 163
Index
alfabètic
inversa, 164
inversio, 163
signe duna, 163
pivot, 11
pla doble, 159
polinomi, 167
arrels, 168
constant, 167
ndex dun, 167
valor numèric dun, 168
polinomi caracterstic, 83
producte de permutacions, 164
producte escalar, 51
formula clàssica, 56
producte mixt, 65
productes dinèrcia, 109
producte vectorial, 63
projeccio ortogonal
com a endomorfisme, 74, 75
dun punt sobre una varietat lineal, 131
dun vector sobre un subespai, 57
propietat del parallelogram, 123
punt de sella, 118
punt mitjà, 130
quàdrica, 154
equacio matricial, 154
equacio matricial compacta, 154
equacio reduda, 156
invariants, 155
invariants estrictes, 155
molt degenerada, 158
no generada, 156
poc degenerada, 157
rang
duna matriu, 40, 42
dun conjunt de vectors, 40
per columnes, 41
per files, 41
recta
de regressio, 60
recta doble, 149
referència cartesiana, 123
rectangular, 123
regla
de Ruffini, 167
regressio
lineal, 60
quadràtica, 60
resolucio de sistemes, 10
mètode de Gauss, 10
mètode de Gauss-Jordan, 11
regla de Cramer, 28
regla del pivot, 10
solucio general, 12
solucio trivial, 13
restriccio dun tensor a un subespai, 108
rotacio al voltant dun vector, 76, 94
simetria
axial a lespai, 95
axial en el pla, 70, 93
com a endomorfisme, 74, 75
plana, 95
simètric
dun punt respecte a una varietat lineal,
131
dun vector respecte a un subespai, 57
sistema dequacions diferencials, 100
sistema dequacions lineals, 9
coeficients, 9
compatible, 10
determinat, 10
indeterminat, 10
de Cramer, 28
expressio matricial, 14
forma diagonal, 11
forma triangular, 10
graus de llibertat, 10
homogeni, 13
incògnites, 9
incompatible, 10
179
m n, 10
sobredeterminat, 59
termes independents, 9
subespais vectorials
interseccio, 46
ortogonals, 52
suma, 46
suma directa, 46
suplementaris, 46
subespai vectorial, 35
engendrat per un conjunt de vectors, 38
equacions implcites, 35, 43
sistema de generadors, 37
suplementari dun, 46
suplementari ortogonal dun, 53
tensor, 106
components principals, 107
components secundàries, 107
de Minkowski, 109
dinèrcia, 106
teorema
caracteritzacio de les transformacions lineals, 68
caracteritzacio dels tensors, 107
criteri de Sylvester, 114
de Descartes, 172
de la projeccio ortogonal, 57
de les bases, 39
del factor, 168
del residu, 168
dels sistemes homogenis, 13
de Pitàgores, 54, 132
de Rouche-Frobenius, 42, 59
de Steinitz, 39
espectral, 87
espectral generalitzat, 90
fonamental de làlgebra, 169
traca duna matriu quadrada, 83
transformacio, 67
bijectiva, 68
exhaustiva, 68
180
injectiva, 68
inversa, 68
lineal, 68
transposicio, 163
bàsica, 163
valor propi, 82
varietats lineals, 125
paralleles, 127
perpendiculars, 130
posicions relatives, 127130
vector
de posicio, 123
lliure, 34
origen i extrem dun, 122
propi, 82
unitari, 55
vectors
combinacio lineal, 35
linealment dependents, 35
linealment independents, 35
ortogonals, 52
relacio de dependència, 36
vèrtexs duna cònica, 141
volum
dun paralleleppede, 137
dun tetràedre, 136
Index
alfabètic

Curs Algebra Lineal PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Curs Algebra Lineal PDF

Uploaded by

Copyright:

Available Formats

`

Rafel Amer Ramon

2009 Rafel Amer i Francesc Carreras

Reconeixement. Heu de recon`eixer els cr`edits de lobra de la manera especificada

Rafel Amer i Francesc Carreras

1 Sistemes dequacions i matrius

1.1 Sistemes dequacions lineals . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2 C`alcul matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.1 Definicio i propietats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2 Depend`encia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.1 El producte escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1 Definicions i exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.1 Endomorfismes diagonalitzables . . . . . . . . . . . . . . . . . . . . . . . . . . 81

Tensors i formes quadr`atiques

7.1 Introduccio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

8.1 Lespai euclidi`a puntual tridimensional . . . . . . . . . . . . . . . . . . . . . . 121

Corbes i superfcies de segon grau

9.1 Ellipse, hip`erbola i par`abola . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

9.2 Classificacio de les c`oniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

1.1 Sistemes dequacions lineals

a11 x1 + a12 x2 + + a1n xn = b1

am1 x1 + am2 x2 + + amn xn = bm

Sistemes dequacions i matrius

Proposicio 1.1 (Operacions elementals.) Les operacions seguents transformen un sistema en un

D EMOSTRACI O . Tot e s de comprovacio immediata.

En el darrer sistema resulta, de la tercera equacio, z = 2; substituint a lequacio anterior, 3y+4 =

Sistemes dequacions i matrius

Aplicant el m`etode de Gauss obtenim

Es diu que un sistema e s homogeni si

1.2 C`alcul matricial

a11 a12 a1n

Sistemes dequacions i matrius

am1 am2 amn

(c) Compatibilitat: (t A)B = t (AB) = A(t B).

Sistemes dequacions i matrius

(A1 A)B = (A1 A)C ,

e s regular si, i nomes si, ad bc 6= 0. En aquest cas, la seva inversa e s

Resolent-los per reduccio arribem a les relacions

don es dedueix que si ad bc 6= 0 existeix una u nica matriu B que compleix AB = I , i e s

compleix AB = 0, i aix`o e s suficient per veure que A no te inversa.

Sistemes dequacions i matrius

Per tant A e s regular i

(b) Estudiem ara la matriu

2.1 Definicio i propietats

a11 a12 a1n

es defineix el seu determinant com el nombre real

i tres amb signe negatiu,

Per tant, el determinant duna matriu 3 3 e s

D EMOSTRACI O . (a) Com que Ai = Bi + Ci , tenim que ai = bi + ci per a qualsevol j =

( )a11 aii a j j ann ( )a11 ai j a ji ann

( ) a11 aii a j j ann a11 ai j a ji ann = 0 .

D EMOSTRACI O . Si ai e s el coeficient gen`eric de A i bi el de At , sabem que bi = a ji . Aleshores

( )b11 b22 bnn .

ja que ( ) = ( 1 ). Posem = 1 . Com que el sumatori anterior consta dels n! termes

Teorema 2.5 (Formula del producte.) det(AB) = det(A) det(B).

C2 Cn ), cada una daquestes files es pot escriure

Aplicant la multilinealitat del determinant queda

a2r2 Br2 anrn Brn )

a1r1 a2r2 anrn det(Br1

a1r1 a2r2 anrn det(Br1

(r )a1r1 a2r2 anrn det(B1

2.2 C`alcul de determinants

Si representem per bi els coeficients de la matriu B, podem escriure

( )a11 aii a j j ann ( )a11 ai j a ji ann

( ) a11 aii a j j ann a11 ai j a ji ann = 0 .

( )b11 b22 bnn .

ja que ( ) = ( 1 ). Posem = 1 . Com que el sumatori anterior consta dels n! termes

(r )a1r1 a2r2 anrn det(B1