11.

PruCbcse quc el pentadec4gono rcgular cs constructible.

12. PruCbcsc que cs posiblc trisccar el @lo

de 72".

13. PruCbcrie quc un mdgono regular no es constructible.
*14. PruCbcrie quc el poligono regular dc 17 lados es umstructiblc.

Volvcmos a la cxposici6n general. Sea F u n campo y, como usualmente, F[x]el anillo dc 10s polinomios en x sobrc F.

D~PIHICI~H. = a o P + a l P - l + ... +al?-'+ ... + a m - , x + a . c Si f(x) s un polinomio en q x ] , cntonccs la derivada dc f(x), rcpresentada por f'(x), es el polinomio f'(x) = n a o P - l + ( n - l ) a l P - l + ... +(n-i)a#-I-'+

... + o ; - ,

dc F [ x ] .

Dar e t d&ici6n o probar las propicdades b4sim formales dc la sa derivada en cuanto a polinomios sc refiere, no requicrc el concept0 dc Ilmite. Pcro, como el campo F es arbitrario, podcmos espcrar quc pasen algunas cosas cxtra2las. Por cjemplo, si F a dc caracterletica p 0 la derivada dcl polinomio x' cs pxn-' = 0. As1 pucs, el resultado com6n del d c u l o dc quc un polinomio cuya derivada cs cero dcbc ser una constante, no sigve sicndo vuido. Pcro si la caracterlstica de F c s 0 y sif'(x) = 0 para f ( x ) ~ F [ xcr cicrto que f(x) = a € F ] el problcma 1). Incluso cuando la caractcrlstica dc F cs p # 0 podemos a h describir lor polinomios con derivada a r o ; si f'(x) = 0 entonas f(x) cs un polinomio en xp (vhrie el problcma 2). Probarnor ahora la8 anAlogas dc las rcglas formaks dc difmciaci6n quc tan bien conocemos.

+

case

LEMA 5.5. PWQ ~ l e s q u i e r a f ( x ) , ( x ) € q x ] y ~ l q u i c ~ E F g r

1) Cf(4 +g(x))' = f'(4 + g ' ( x ) ; 2) (af(x))' = aY(x); J) Cf(x)g(x))' f'(x)g(x)+f(x)g'(x).

-

Prueba. Las pruebas dc las partcs (1) y (2) son extraordiumiimcnte feciles y se dqan como cjercicio. Para probar la partc (3) n6tcsc quc, & acuerdo w n la8 part- (1) y (2), cs suficicntc probarla en el caso muy espcial A x ) = X I y g ( x ) = xJ dondc tanto i wmo j son positives. Pcro mtonccs f(x)g(x) = x"', dc dondc Cf(x)g(x))' = ( i + j ) x'+'-'; pcro f'(x)g(x) = i 2 - l x J = ~ . + J - I y f(x)g'(x) = jx'xJ-' = jx'+I-'; dc don&, en consrmcnaa, f '(x)g(x)+f(x)gl(x)= (l+j)x'+'-' = Cf(x)g(x))'.

16.

MAS ACERCA OE RAICES

116

Rccutrdcsc que en el c4lculo elemental sc mucstra la cquivalcncia cntrc la cxistencia dc una raiz multiple dc una funci6n y la anulaci6n simultanca de la funci6n y su derivada en un punto dado. lncluso dcntro dc nucstro actual rnarco, en el quc Fcsun carnpo arbitrario, existc una tal intcrrclaci6n.

LEMA 5.6. El polinomio f{x)eF[x] riene una raiz multiple si y sdlo si f(x) y f'(x) rienen un factor comun no rri13ial (es decir, de grado posiriro).
Prueba. Antes dc probar el lcha, parecc adecuado quc hagamos obxrvar quc si f(x) y g(x) en fix] ticnen un factor cornin no trivial en K[x], para una K extension dc F, cntonces tienen un factor comun no trivial en F[x]. En efecto, si fucran primos relativos como clcmcntos en FIX],cntonccs podrlan mcontrarsc dos polinomios a(x) y b(x) en F[x] tales quc a(x)f(x)+ b(x)g(x) = 1. Como esta rclaci6n tambitn se vcrifica para cstos elcmmtos vistos como elernmtos dc K[x], deberlan ser tambitn primos rclativos en Kbl. Vamos ahora con el lcma. Dc la observacion quc acabamos dc haccr podcmos suponer, sin pCrdida dc generalidad, quc las ralccs dc f(x) sc cncuentran todas en F (dc otra manera extendemos F hasta K, el c a m p dc descomposici6n dc f(x)). Si f(x) ticnc urn raiz multiple a entones f(x) = (x-a)"q(x) donde m > I. Pcro, como puedc calcularx dc inmediato, ((x-a)")' = m(x-a)"- I , dc dondc, scgun el lcrna 5.5,f'(x) = (x-u)"q'(x) +m(x-a)*- ' q(x) = (x-a)r(x), ya quc rn > I . Pcro csto nos dice quc f(x) y f'(x) ticncn x-a como factor corntin, con lo quc el lcma queda probad0 en una direcci6n. Por otra partc, si f(x) no time ninguna raiz m6ltiplc, cntonccs f(x) = (x-(x-a)..(x-a), dondc las u , son todas distintas (estarnos suponiendo quc f(x) cs m6nico). Pcro cntonccs f'(x) =
n

1 (x-a,)
I- I

...

(x-a,) . . . (x-a,) dondc la A detcrmina el ttrmino quc se ha suprimido. Afirrnamos quc ninguna raiz dc f(x) cs una raiz dc/'(x), pucs si/'(ai) = (a,-a,) # 0, ya quc las ralccs son todas distintas. Pcro si f(x) y /'(x)

n

J*I

ticnm un factor comun no trivial, tiencn una raiz comlin, a saber, cualquicr raiz dc cste factor comhn. El resultado ncto es que f(x) y /'(x) no ticncn ningun factor comun no trivial, con lo quc el lcrna ha sido probado en la otra dirccci6n. COROLARH) S i f ( x ) ~ F [ x ] irreducible, enronces : I. es 1 ) Si la caracferlsfiea de Fes 0, f(x) no tiene ralces rntikiple~. 2) Si la caracferlsrica de F es p # 0,f(x) Iiene una ralz mrilfiple sdlo si es & la f o r m f(x) = g(xp). Pruuba. Como f(x) cs irreducible, sus unicos factores en fix] son 1 y f(x). Si f(x) ticnc una ralz multiple, cntonccsf(x) y f'(x) ticnen un factor

228

CAMPOS

- Cap. 6

comun no trivial de acuerdo con el lema, de donde f ( x ) l f ' ( x ) . Pero c o r n el grado de f ' ( x ) es menor que el de f ( x ) , la unica forma posible de que eslo suceda es que f ' ( x ) sea 0. En caracterlstica 0 esto implica que f ( x ) es una constante, que no tiene ninguna ralz: cuando la caracteristica en p # 0, eslo obliga a que f ( x ) = g ( x p ) . Volveremos dentro de un momenlo a discutir las implicaciones del corolario I mas complftamente. Pero antes, para su posterior uso en el capitulo 7 en nuestro tratamiento de campos finitos, probaremos un caso mAs bien particular COROLAR~OSi F eS Un campo de caracfer~sricap # 0, enfonees el 2. polinomio xp" - X E ~ X ]riene, para n 3 1 , raices disfinfas. ,
Prueba. La derivada de x P " - x es p"xp"- ' - l = - 1, ya que F es de caracteristica p. Por tanto. x p - x y su derivada son ciertamente primos relativos, lo que, segrin el lema, implica que xp"-x no tiene raices multiples.

El corolario 1 no descarta la posibilidad de que en caracterlstica p # 0 un polinomio irreducible pueda tener raices multiples. Para &jar ideas, exhibimos un ejemplo en donde lo dicho es lo que realmente sucede. Sea F, un campo de caracteristica 2 y sea F = F,(x) el campo de las funciones rationales en x sobre F,. Afirmamos que el polinomio 1 ' - x en F[t] es irreducible sobre F y que sus raices son iguales. Para probar la irreducibilidad debemos demostrar que no hay ninguna f u n c i ~ nracional en F o ( x ) cuyo cuadrado sea x ; este es el contenido del problema 4. Para ver que r l - x tiene una raiz mliltiple, notese que su derivada (la derivada es con respecto a 1, pues x estando en F,se considera como una constante) es 21 = 0. Desde luego. el ejemplo anilogo funciona para cualquier caracteristica prima. Ahora que hemos visto que la posibilidad es una realidad, se sefiala una aguda diferencia entre 10s casos de caracteristica 0 y 10s de caracteristica p. La presencia de polinomios irreducibles con raices multiples en el ultimo caso, nos lleva hasla muchas sutilezas tan interesantes como complicadas. Su estudio requiere un tratamiento m b elaborado y sofisticado que preferimos evitar en esre nivel. Por ranto, para el resfo de esre caplfulo conrenimos en que fodos 10s campos que aparecen en el fexro propimenre dicho. son wmpos de ea?acferisrica 0.

D E F I N I C I ~ Nextensidn Kde Fesunaexlensidn simple de F si K La . para al@n a en K.

=

F(%).

En caracteristica 0 (o en extensiones propiamenle condicionadas en caracterlstica p # 0; vkase problema 14) todas las extensiones finitas son realizables como extensiones simples. Este resultado es.eI

55,

MAS ACERCA D L RAICLS

227

TEOREMA Si F es de caracreristico 0 y si o y b son olgebroicor sobre F. S.P. enronces exisre un elemento csF(a, 6 ) rolque F(a, b) = F(c).
Pruebo. Sean f ( x ) y g(x), de grados m y n, 10s polinomios irreducibles sobre F satisfechos por a y b respectivamente. Sea K una extension de F e n que lanto f ( x ) como g ( x ) se descomponen completamente. Como la caracteristica de F es 0 todas las raices de f ( x ) son distintas. y lo mismo ocurre con las de g(x). Sean las rakes de f ( x ) , a = a,. a,, ..., a. y las de g ( x ) . b = b , , b2. ..., 6,. Si j # I . entonces bj # b , = b. de donde la ecuacidn a,+&, = a , + i b , = o+i.b tiene solarnente una solucion 1en K , a saber,

. 0 /. =-. 1 - 0
b-b,

Como F es de caracteristica 0 tiene un numero infinito de elementos, de donde resulta que podemos encontrar un elemento y s F tal que a(+ ybj # o+gh para todo i y para toda j # I . Sea c = o+yb; nuestra tesis es que F(c) = F(o. b ) . Como csF(o, b) no hay duda de que F(c) c F(o. 6). Demostraremos que tanro o como b estan en F(c) de lo que se sigue que
F(a, b) c F(cJ. Como h satisface al polinomio g ( x ) sobre F, lo satisface tambien mando lo constderamos un polinomio sobre K = F(c). Ademas, si h ( r ) = f(c- yx). entonces h ( x ) s K [ x ] y h ( h ) = f(c-;'b) = f(a) = 0, ya que o = c-76. Luego en una extension de K. h(x), y g ( x ) tienen x-h como factor comun. Aseguramos que x - b es, en realidad, su miximo comljn divisor. Pues si b, # b es otra raiz de g(.O, entonces h(bj) = f(c-yb,) = 0, ya que, por nuestra election de ;,, c - yb, para j # I esquiva todas las raices a j de f(x). Ademas, como (x-b)'.+'g(x), (x-b)' no puede dividir al maximo comun divisor de h ( x ) y g(x). Asi pues, x - b es el maximo comun divisor de h ( x ) y g ( x ) sobre alguna extension de K. Pero entonces rienen un meximo comun divisor no trivial sobre K , que debe ser un divisor de x-b. Como el grado de I - b es I, vemos que el maxim0 comun divisor de g ( x ) y h(x) en K [ x ] es exactamente x-b. Luego x - b ~ K [ x ] . de donde b e K : recordando que K F(c), obtenemos que beF(c). Como a = c-yb, y como b. CEF(C), ~ E cFF(c), tenemos que a ~ F ( c ) , donde F(a, b) c F(c). Las dos relaciones de de contention opuestas nos dicen que F(a, b) = F(c).

Un s~mple argument0 de inducci6n extiende el resultado de dos elemenros a cualquier numero finito, es decir, si a , . .... a, son algebraicor sobre F, entonces hay un elemento c e F ( z , , ...,., tales que F(c) = F ( z , . .... z.). z) Luego el COROLARIO. Cualquier exrenridn .finira de un compo de caracrerisrica 0 er uno exrensidn simple.

1U1

UMPOS

- Cap. 6

I. Si F es de caracterlslica 0 y f ( x ) c F [ x ] es taI quef'lx) que f ( x ) a e F.

-

= 0, pmCbese

2. Si F es de caracterlstica p # 0 y si f ( x ) e F [ x ] es tal q u e f ' ( x ) = 0, prutbest quc A x ) = g(x7 para a l g h polinomio g ( x ) ~ F [ x ] .

3. PmCbese quc W x ) + g ( x ) ) ' p r a f ( x ) . g(x)eF[xI Y R E F .

-

f ' ( x ) + g ' ( x ) y quc (af(x))' = uf'(x)

4. Prutkse quc no hay ninguna funci6n racional en F(x) tal quc su cuadrado sea x.

5. ComplCtese h inducci6n nccesaria para establecer el corolario al tcorcma 5.p. Un elcmento a en una cxtensi6n K dc F se llama scparablc sobrc F si satisface un polinomio sobrc F quc no tienc ralccs multiples. Una cxtmsi6n K dc F se llama scparablc sobre F si todos SUP elementos son separables sobrc F. Un campo F st llama perfecto ai todas las cxtensiones finitas de F 'son separables.
6. Pruttme que cualquicr campo dc caractcristica 0 es perfecto.

7. a ) Si F cs dc caracterlstica p # 0 mukatrcse que para a , bcF, + b'". ( a + b)" = b ) Si F es de caracterlstica p f 0 y si K es una extension dc F, sea T = { n e K #.SF para algun n ) . PruCbese que Tes un subcampo de K.

8. Si K . 7, F son como en el problema 7(b), p d h c quc cualquier automofimo de K que dcja Ejos todos 10s clementos de F deja tambitn a o s todos 10s elementos de T.
*9. Dcmutstrcsc que un carnpo F de caracterlstica p # 0 es perfecto si y 5610 ai para cualquier a e F podernos cncontrar un b e F tal que bp = a.

10. Usando el resultado del problema 9, pruCbtse que cualquicr campo h i t o es perfecto.
**11. Si K es unn extensihdc F pru~btde que el conjunto de elementos en K quc son separables sobrc Fforma un subcampo de K.

12. Si F es de caractcristica p 0 y si K es una extcnsih finita de F, pmCbese que dado a c K o d " c f p a r a algun n o podcrnos mcontrnr un entero m tal que a F + F y es separable sobre F.

+

13. Si K y F son como cn el problema 12, y si n i n d n clcmento que csth en K,per0 no en F, es separable sobre F,p d b e s t que dado ~ E podemos K encontrar un entero n. depcndimte de a, tal quetF.sF.-

10. ELEMENTOS DE U TEORIA DL OALDIS

119

14. Si K es una extensi6n h i t a y separable de F, pruCbese que K es una extensi6n simple de F.

IS. Si uno de lor elementos a o b es separable sobre F, pruCbesc que F(a, b) es una extmsi6n simple de F.

6 ELEMENTOS DE LA TEORh DE CALOlS .

Dado un polinomio p(x) en FIX], anillo de polinornios en x sobre F, el asociaremos con p ( x ) un grupo al que llamaremos el grupo de Galois de p(x). Hay una relaci6n muy estrecha entrc la$ raices de un polinornio y su grupo de Galois; en realidad, el grupo de Galois resultark ser uncierto grupo de permutaciones de Ins ralocs del polinornio. Haremos un estudio de estas ideas en esta y las pr6ximas miones. lntroduciremos este grupo por medio del c a m p de descomposici6n de p(x) sobre F, quedando definido d grupo de Galois de p(x) como un cierto grupo de automorfismos de cste c a m p de descomposici6n. Es esta la raz6n de que en tantos de 10s teoremas que vamos ahora a ver nos ocupernos de 10s automor6smos de un campo. Entre 10s rubgrupos del grupo de Galois y 10s subcampos del campo dc descomposici6n, existe una hcrmosa dualidad que expresa el teorema fundamental de la teorla de Galois (tcorema 5.v). De esto derivarcmoa una condicidn para la solubilidad por medio de radicales de las ralces de un polinornio en tkrminos de la estructura algebraica de su grupo de Galois. De esta condici6n derivaremos, a su vez, el cllsico resultado de Abel sobre la no solubilidad por radicales del polinomio general de grado 5. Durante el proceso derivaremos, tambitn, como resultados colaterales, teoremas que, de por sl, son de gran interhs. Uno de ellos sera el teorema fundamental sobre funciones simhtricas. Nuestro enfoque del tema st basa en el tratamiento dado por Artin. RecuCrdese que estamos suponiendo que todos nuestros campos son de caracterlstica 0, de donde resulta que podemos haccr Cy haremos) libre uso del toorema 5.p y su corolario. Por un automorjsmo del campo K entenderemos, como es comln, una aplicaci6n a de K sobre s mismo tal que a(a+b) ; a(a)+a(b) y a(&) = f . a(a)a(b) para (I,beKcualesquiera. Dos automorfismos o y r de Ksedia que son distintos si #(a) Z r(a) para a1 menos un elemento a€K. Comenzamos con el aiguiente

TEOREMA ~ .Si K es un mmpo y si a , , ..., omson disrintos ouromorfis5. mos de K, enlonces es imposible enconrrar elemenros a , , ..., am, rectos 0. no en K, ralesquea,a,(u)+a,a,(u)+ ... +ama.(u) = Opararodo UEK.
Prueba. Supongamos que pudikramos encontrar un conjunto de eiemen10s a , , .... a, en K, no todos ccro, tales que a,a,(u)+ ... +4o,(u) 0

-

I30

CAMPOS

- Cmp. 6

para todo UEK. Enlonces podriamos encontrar una relacion la1 que tuviera tan pocos terminos como fuera posible; renumerando, si fuera preciso. podemos suponer que esta relacibn minima es donde a,, . ..,a son todos diferentes de 0. , Si m fuera igual a I enlonces a, ol (u) = 0 para todo UEK, lo que nos llevaria a a, = 0, en coptra de lo supuesto. Podemos, pues, suponer que 1)r > I. Como 10s automorfismos son distintos hay un elemento C E K tal que o, (c) # o.(r). Como cue K para todo ueK, la relacion ( I ) debe tambikn verificarse para cu, es decir, a,o, (cu)+a,o,(cu)+ ... +a,o.(cu) =0 para todo UEK. Usando la hipdtesis de que las o son automorfismos de K. esta relacion toma l a forma

Multiplicando la relacion ( I ) por a,(c) y restando el resultado de (2) obtenemos Si hacemos b, = a,(o,(c)-o,(c)) para i = 2, ..., m. entonces 10s b, estanenK,bm=a.(o.(c)-o,(c))#O,yaqueam#O,yom(c)-al(c)#0, aunque b,02 (u)+ ... + bo( ) , ,c = 0 para todo ucK. Esto produce una relaci611mas corta, en contra de la elcccion quc hicimos: luego el teorema esta probado.
DEFINICION. C es un grupo de automorfismos de K, entonces el Si campojjo de Ges e l conjunto de todos 10s elementos aeKtales que o(a) = a para lodo aeG.

N6tese que esta definicibn time sentido, incluso s i G no es un grupo, sino simplemente un conjunto de automorfismos de K. Pero el campo fijo de un conjunto de automorfismos y el del grupo de automorfismos generado por esle conjunto (en el grupo de todos 10s automorfismos de K ) son iguales (problema I), de donde nada perdemos por definir el concept0 solo para grupos de automorfismos. Ademas. unicamente estaremos interesados en 10s campos fijos de grupos de automorfismos. 1 Habiendo llamado en la anterior definicion eampo fijo de C a conjunto que alli s define, seria agradable comprobar que la terminologia empleada e en este caso es en verdad exacta. Es lo que nos dice el

Prueba. Sean a, b elementos del campo fijo de G. Para todo ofG, tenemos, pues. o(a) = a y a(b) = b. Pero entonccs- o(af b) = o(a)f

5 6.

ELEMEHTOS DE U TEORIA DE GALOIS

231

a(b) = a k b , y dc la misma forma, a(ab) = a(a)a(b) = ab; de donde a+b y ab estiin tambien en el campo fijo de G. Si b # 0,entonces a ( b - ' ) = a(b)- ' = b- ', de donde b- ' tambien se encuentra en el campo fijo de G. Luego hernos verificado que el campo fijo de G es, ciertamente, un subcampo de K.
Nos ocuparemos de 10s automorhsmos de un campo que se comportan de una forma determinada sobre un subcampo dado.

DEFINICI~N.K un campo y sea F u n subcampo de K. Entoncn, el Sea grupo de aulomorfrsmos de K relalivos a F, que representaremos por G(K, F), es el conjunto de todos 10s automorfismos de K que dejan fijos todos 10s elementos de F; es decir, el automorfisrno a dc K cstii en G(K, F ) si y 8610 si a(a) = a para todo LIEF.
Noes sorprendente, y es muy fhcil de probar, el siguicnte LEMA G(K, F ) es un svbgrupo del grupo de lodos 10s oulomorfismos 5.8 de K. Dejamos la pmeba de este lema a1 lector. Una observaci6n : K contiene el campo de 10s ninneros racionales F,, ya que K es de caracteristica 0 y es facil ver que el campo fijo de cualquier grupo dc automofismos de K , siendo un campo, debe contcncr a F,. De aqui quc todo numcro racional permanece fijo en todo automorhsmo de K. Hacemos una pausa para examinar unoscuantos ejemplos de 10s conceptos que acabamos de presentar.

EJEMPLO Sea K el campo de 10s n h e r o s complejos y sea F el campo I. de 10s numeros reales. Calculamos G(K, F). Si a es un automorfismo cualquiera de K, como i' = - 1 , a(i)' = a ( i 2 ) = a ( - 1) = - I , de dondc a(i)+ k i . Si, ademh, a deja fijos a todos 10s reales, entonces para cualquier a+bi donde a y b son reales. a(a+bi) = a(a)+a(b)j = a f bi. Cada una de estas posibilidades, es decir, la aplicaci6n a , (a+ bi) = a+ bi y a , (a+ bi) = a-bi define un automofimo de K ; a , es el automorfismo identidad y a , L a conjugation compleja. Asi pues, G(K, F)es un grupo de orden 2. LCuhl es el campo fijo de G(K, F)? Debe, ciertamente, contener a F, Lpero contiene algo miis? Si a + bi estii en el campo fijo de G ( K , F) entonces a+bi = a,(a+ bi) = a - bi de donde b = 0 y a = a+ b i ~ F . este caso En vemos que el campo fijo de G(K, F)es precisamente el mismo F.
E J E M P ~ Sea F, el campo de 10s numeros racionales y sea K = F o ( g ) 2. donde $2 es la ralz cubica real de 2. Todo elemento en K es de la forma a,+a, $?+a,(p)' donde a,, a, y a, son n6meros racionales. Si.0 es un

232

CAMPOS

-

Cap. 6

automorfismo dc K, cntonces a(<;I)' = ~ ( ( 3 2 ) ' ) = a(2) = 2, de dondc ~ ( 3 5 dcbe tambien ser una raiz clibica de 2 pcrtcnccicntc a K. Pcro hay ) solamenre una ralz ccbica rcal de 2, y como K cs u subcampo dcl campo n rcal, debemos tcner q u e a ( 3 ) = $9. Pero cntonces a(ao+a, <,2+a,($?)') = ao+a, ;5+a2($5)', es decir, a es el automorfismo identidad dc K. Vcmos. pues, que G(K. Fa) consta solo dc la aplicacion identidad. y en cste caso el campo f j o & G(K, Fa) no es Fa. sin0 que en realidad es bartante mayor, pues es rod0 K. EJEMPLO Sea Fo el campo dc lor numcros racionales y sea w = 3. , tenemos pues que o = I y que o satisface al polinomio x 4 + x 3 + ' xl+x+ l sobre Fo. Por el criterio dc Eiscnstein se puede probar quc .r4+x"x2 + x + 1 cs irreducible sobre Fa(vkasc el problcma 3). As1 pues, K = F0(w1 cs de grado 4 sobre Fo y lodo elemento dc K es de la forma a+ n, w+a,o'+a3r3dondetodoslos ao.a,.a,,a3est~ncnFa. Ahora bicn. , para cualquier automorfismo a de K. a(w) # I. ya quc a ( l ) = I. y a(w)' = a(w5) = a(l) = I. dedonde a(w) es tambitn una raiz quinta de la unidad. En consecuencia, a(w) puedc solamentc ser w. w2, w3 o w'. Afirmamos que cada una dc estas posibilidades ocurre realmente, pues definamos las cualro aplicaciones a,, a,, a y a por a,(ao+a,w+a,wl+.r,w') , , = a a + a , ( w 1 ) + a 1 ( w f ~ 1 + a 3 ( w 1 )para i = 1. 2.3.4. Cada uno dc ellos define 3, un automorfismo de K (problema 4). Por tanro, como aeG(K. Fa) csti completamentc dctcrminado por a(w1. G(K, Fo)cs un grupo de ordcn 4. con a, como su elemento unidad. Como a' = a a' = a y a,' = a,. , , , , G(K. Fa)es un grupoclclicodc orden 4. Se puede ficilmente probar que el campo fijo dc G(K. Fo) cs Fo (problcma 5). El subgrupo A = {a,. a dc ) , G(K. Fo)ticnccomo su campo fijo el conjunto de todos lor elementor no+ a,(w'+wJ), quc cs una exlension de Fode grado 2.
Cl"llJ.

Los ejemplos. aunquc ilustrativos, son aun demasiado cspeciales, pues pucde obscrvarsc que en cualquiera de ellos G(K, F) rcsulta ser un grupo ciclico. Esto cs cxtraordinariamcnte atipico, pues. en general. G(K. F) no ncccsita ser ni siquicra abeliano (vkase el teorcma 5.a). Pero. a pesar dc su caricter especial, traen a luz cicrtos hechos importanles. Por una parte. mucstran que debemos estudiar el efecto dc 10s automorhsmos sobrc las raices de 10s polinomios y. por otra, subrayan que F no neresarian~rf~te ha dc ser igual a todo e l campo fijo de GIK. F). Lor casos en que csto sucede son muy convenicnles y son s~tuaciones las quc den~ro poco dedia dc carcmos mucho tiempo y esfucrro. Calculamqs ahora una importante cola dc la magnilad de G(K. F).

TEOREMA . i K es una e.rrensidn ,Jiniro de F. ento~~res K. F) rs 5.~S G( grupofinirn . su orden. o ( G ( K. F)), sati.$are o(G(K. Fl) <[K: F]. I

r~ri

I6. ELEMENTOS DE LA TEORIA DE GALOIS

233

Prueba. Sea [ K :F ] = n y supongamos que u , , ..., u, es una base de K sobre F. Supongamos que podemos encontrar n+ l automorfismos distintos a , , a , , .. ., a,+ en G ( K , F). De acuerdo con el corolario a1 teorema 4.f el sistema de n ecuaciones lineales homogeneas en las n + 1 incognit a s x , , ...,x , + , :

.

,

tiene una solucion no trivial (no toda 0) x , = a , , ..., x,+ Luego

, = a,+,

en K

para i = 1, 2, . .., n. Como cada uno de 10s ai deja fijo a todo elemento de F y como un elemento arbitrario t de K es de la forma I = z , u , + ... +gnu, con z , , ..., z, en F , entonces, por el sistema de ecuaciones (I), tenemos a , a, ( t ) + ... a,,, a,+ ( t ) = 0 para toda ~ E K Pero esto cont,radice el resultado del . teorema 5.q. Luego el teorema 5.r ha sido probado.

,

+

El teorema 5.r es de importancia central en la teoria de Galois. Pero aparte del papel que alli juega nos sirve tambitn para probar un resultado clasico concerniente a las funciones racionales simetricas. Este resultado sobre funciones simetricas, a su vez juega un papel importante en la teoria de Galois. Hagamos primer0 algunas observaciones sobre el campo de las funciones racionales en n variables sobre un campo F. Recordemos que en la secci6n I I del capitulo 3 definimos el anillo de 10s polinomios en las n variables x , , ..., x, sobre F y de esto pasamos a definir el campo de las funciones racionales en x , .. ., x, , F ( x , .. ., x,). sobre F como el anillo de todos 10s cocientes de tales polinomios. Sea S, el grupo simetrico de grado n considerado como si actuara sobre el conjunto [ I , 2, .... n ] : para a c S , e i un entero con I ,< i ,< n, sea a ( i ) la imagen de i bajo a . Podemos hacer actuar a S, sobre F ( x , . ..., x,) en , la siguiente forma: para ~ E S y r ( x I , .... x , ) c F ( x , , .... x,), definimos la aplicacion que lleva r(.\-, . .. ., .r,) sobre r(x,,, ..., x,, ,). Representaremos a esta aplicacion de F ( x , , . . ., s,) sobre si mismo tambien por a. Es obvio que estas aplicaciones definen automorfismos de F ( x , , .. ., .\-,). ;CuaI es el campo fijo de F ( s , . .... .v,) respecto a S,? Consiste simplemente en todas las funciones racionales r ( s , . .... .v,) tales que r ( s , . .. ., s,) = r(x,,,,. . . ..

.

.

,,

,

234

CAMPOS

- Cap. 5

x,,,,) para todo U E S , . Pero estos son precisamente aquellos elementos enF ( x , , ..., x,) que se conocen como funciones racionales sirnktricas. Como son el campo fijo de S, forman un subcampo de F ( x l , ..., x,) llamado el campo de las funciones racionales simbtricas al que representaremos por S . Nos ocuparemos de estos tres problemas :

1) L qut es igual [ F ( x l , ..., x,) :S ] ? A 2 ) ~ Q u es G ( F ( x , , ..., x,), S ) ? t describir S en ttrminos de alguna extensidn simple par3 ) ~Podemos ticular de F?

Contestaremos a estas tres preguntas simultlneamente. Podemos presentar explicitamente algunas funciones particularmente sencillas de S construidas con x , , ..., x, conocidas como funciones simhtricm elementales en x , , ..., x,. Las definimos como sigue :

a, = x , x2

x,.

-

Probar que estas son funciones simttricas se deja como ejercicio. Para
n = 2 , 3 y 4 las escribimos explicitamente a continuacion. n = 2 a , = x,+x,.

5 6.

ELEMENTOS DE L TEORIA DE GALOIS A

235

Notese que cuando n = 2, x , y x , son las raices del polinomio I' - a , ?+a,, cuando n = 3, x , , x2 y x , son las raices de t 3 - a , f 2 + a 2 f- a 3 , y cuando n = 4 , x , , x , , x 3 y x4son, todas, raicesdet4-a,t3+a,t2-a3f+a4. Como a , , ...,a, estln, todos, en S el campo F(a,, ..., a,) obtenido por la adjuncion de a , , . .., a, a F debe encontrarse en S. Nuestro 'objetivo es ahora doble, a saber, probar que
I ) [ F ( x ] ..., x,):S] = n!. , 2) S = F(al , . .., a,).
4

Como el grupo S, es un grupo de automorfismos de F ( x I ,..., x,) que deja a S fijo, S, c G ( F ( x , ,..., x,), S). Luego, seglin el teorema 5.r, [ F ( x l ,.... x,):S] k o ( G ( F ( x I , x,), S ) )k o(S,) = n!. Si puditramos de..., mostrar que [F(x,, ..., x,): F(a, , ..., a,)] < n!, entonces, como F(a, , ..., a,), es un subcampo de S , tendriamos n! k [ F ( x I , ., x,): F(a, ..., a,)] = .. [ F ( x ,, ..., x,) :S ] [ S :F(a, ,. .., a,)] k n!. Pero entonces tendriamos que [ F ( x I , x,):S] = n!, [ S :F(a, , ..., a,)] = 1 y, por tanto, S = F(a,, ..., a,), ..., y, finalmente, S, = G ( F ( x I ,.. ., x,), S ) (esto ultimo por lo afirmado en la segunda oracion de este parrafo). Estas son precisamente las conclusiones que buscamos. Asi pues, para concluir con todo este asunto solo debemos probar que [ F ( x l ,.. ., x,): F(a, , ..., a,)] < n!. Para ver esto, observemos primero que el polinomio p(r) = rn-a, r n - ' + a 2 t n - 2... +(-])"a,, que tiene coeficientes en F(a, , ..., a,), se factoriza sobre F(x, , . .,x,) como p(t) = ( t - x , ) (t - x 2 ) .. . (r -x,) (este es en realidad el origen de las funciones simttricas elementales).Asi pues, p(t) de grado n sobre F(a, , ..., a,), se descompone en un product0 de factores lineales sobre F ( x , , ..., x,). No pyede descomponerse sobre un subcampo propio de F ( x I ,..., x,) que contenga a F(a, , . .., a,). pues este subcampo tendria entonces que contener tanto a F como a cada una de las raices de p(t), es decir, a x , ,x , , ..., x, ; pero entonces este subcampo seria todo F(x, , ..., x,). Asi pues, rernos que F ( x I ,..., x,) es elcarnpodedescornposicidndelpolinorniop(t) = t n - a , t n - I + ... +(-])"a, sobre F(a, , ..., a,). Como p(r) es de grado n, seg6n el teorema 5.h, tenemos [F(x,, . . ., x,): F(a, , ..., a,)] ,< n!. De donde todas nuestras afirmaciones quedan probadas. Resumimos todo este estudio en el siguiente basic0 e importante resultado.

.

TEOREMA Sea F un campo y F(x, , .. ., x,) el carnpo de las funciones 5.s. racionales en x , , ..., x, sobre F. Supongarnos que S es el carnpo de las funciones racionales sirne'tricas; entonces
I ) [F(x,, ..., x,):S] = n!. 2) G( F(x, , ..., x,), S ) = S,, el grupo sirne'trico de grado n. 3) Si a , , .... a, son las funciones sirne'tricas elernentales en x , , ..., x,, entonces S = F(a, , ..., a,).

236

CAMPOS

- Cap. 6

4) F(x,,

..., x,)

delpolinomiotn-a,t"-1+a,t"-2

es el campo de descomposicidn sobre F(a, , ...,a,) = S... +(-l)"~,.

Mencionamos anteriormente que dado un entero cualquiera n es posible construir un campo y un polinomio de grado n sobre este campo cuyo campo de descomposici6n sea del maximo grado posible, n!, sobre este campo. El teorema 5.s nos proporciona explicitamente tal ejemplo, pues si hacemos S = F(a,, ..., a,), el campo de las funciones rationales en n variables a , , .. ., a, y consideramos 4el campo de descomposici6n del polinomio tn-a l tn- +a, tn- ... + (- I)"a, sobre S, entonces vemos que es de grado n! sobre S. La parte (3) del teorema 5.s es un teorema muy clhsico. Afirma que una funcibn racional simktrica en n variables es una funcibn racional en las funciones simktricas elementales de estas variables. Este resultado puede hacerse a~in mas solido : un polinomio simttrico en n variables es un polinomio en sus funciones simttricas elementales (vkase el problema 7). Este resultado se conoce como el teorema sobre polinomios sime'tricos. En 10s ejemplos discutimos de grupos de automorfismos de campos y de campos fijos bajo tales grupos, vimos que podla muy bien suceder que F fuera realmente menor que el campo fijo total de G(K, F). Ciertamente, F esta siempre contenido en este campo, pero no necesariamente lo Ilena. Asi pues, imponer la condicion sobre una extension K de Fque Fsea precisamente el campo fijo de G(K, F) es una limitacion genuina sobre el tipo de extension de F que estamos considerando. Es en esta clase de extension en la que estamos mas interesados.

D E F I N I C IK N . una extensibn normal de F si K es una extension finita ~ es de F tal que F es el campo fijo de G(K, F).
Otro modo de decir lo mismo: si K es una extension normal de F, entonces todo elemento de K que no esta en F sufre alteracion por alg6n elemento de G(K, F). En 10s ejemplos discutidos, 10s ejemplos 1 y 3 eran extensiones normales, mientras que el ejemplo 2 no lo era. Una consecuencia inmediata de la hipotesis de normalidad es que nos permita calcular con gran precision el tamaiio del campo fijo de cualquier subgrupo de G(K, F) y, en particular, dar mhs fuerza al enunciado del teorema 5.r, cambiando la desigualdad que en t l aparece en una igualdad.

TEOREMA .Sea K una extensibn normal de F y sea H un subgrupo de 5.~ G(K, F ); sea K,, = {XE ( u(x) = x para toda U E H) el campo fijo de H. K Entonces : I ) [K:KH] = o(H). 2) H = G(K, K,) (En particular, cuando H = G(K, F), [K: F] = o(G(K, F)).l

i6.

ELEMENTOS DE I TEORIA DE GALOlS A

237

Prueba. Como todos 10s elementos de H dejan fijos a todos 10s elementos de K H ,es claro que H c G ( K , KH).De acuerdo con el teorema 5.r sabemos que [K:KH]2 o(G(K, K H ) ) ; y como o( G(K, K H ) ) o ( H ) tenemos las 2 desigualdades [K: KH]2 o (G(K, KH))2 o ( H ) . Si puditramos demostrar que [K:K H ]= o ( H ) se seguiria de inmediato que o ( H ) = o(G(K, KH)),y como un subgrupo de G(K, K H ) con el orden de G(K, K H ) tendriamos H = G(K, KH). Luego solo nos queda, por demostrar que [K:KH] = o ( H ) para haber demostrado todo. Segun el teorema 5.p existe un ~ E tal que K = KH(a); K esta a debe, por tanto, satisfacer un polinomio irreducible sobre KH de grado m = [K:KH] y ninglin polihomio no trivial de grado mas bajo (teorema 5.c). Sean 10s elementos de H 10s u , , u,, ..., uh donde u , es la identidad de G(K, F) y donde h = o(H). Consideremos las funciones simttricas elementales de a = ul (a), 0, (a), ..., a h(a),a saber :
4

-

Cada a i es invariante bajo cualquier a€ H (iPdbese!). Asi pues, por la definici6n de K H ,a , , a,, ..., ah son todos 10s elementos de K H . Pero a (lo mismo que u, (a), ..., uh(a)) es una raiz del polinomio p(x) = ( x - 0 , ) (x-u2(a)) ... (x-uh(a)) = x h - a l x h - I +a2xh-,+ ... +(que tiene todos sus coeficientes en K H . Por la naturaleza de a esto obliga a que h 2 m = [K:KH],de donde o ( H ) B [K:KH].Como ya sabemos que o ( H ) 9 [K:K H ]sabemos que o ( H ) = [ K :KH],la conclusion deseada. Cuando H = G(K, F), por la normalidad de K sobre F, KH = F ; por consiguiente, para este caso particular tenemos el resultado [ K : F ]= o(G(K, F)). Estamos acercandonos rhpidamente al teorema central de la teoria de Galois. Lo que aun falta es la relacion entre 10s campos de descomposicion y las extensiones normales. Llenamos esta falla con el

TEOREMA K es una wtensidn normalde F si y sdlo si K es el campo de 5.u. descomposicidn de algrin polinomio sobre F.
Prueba. En una direccion la prueba nos recordara mucho la del teorema 5.t.

238

CAMPOS

- Cap. 5

Supongarnos que K es una extension normal de F ; segun el teorema 5.p, K = F(a). Consideremos el polinomio p ( x ) = ( x - a , ( a ) )( x - a , ( a ) )... (x-a,(a)) sobre K, donde a , , a,, ..., a, son todos 10s elementos de G ( K , F). Desarrollando p ( x ) vemos que p ( x ) = x"- a , xn- +a, x"- + ... + (- I )"a, donde a , , ..., a, son las funciones simetricas elementales en a = a , (a), a,(a), ..., a,(a). Pero entonces a , , ..., a, son, cada una, invariantes con respecto a toda a € G ( K , F ) , de donde, por la normalidad de K sobre F, todas deben estar'en F. Por tanto, K descompone al polinomio p ( x ) F[x] ~ en un product0 de factoris lineales. Como a es una raiz de p ( x ) y como a genera K sobre F, a no puede estar en ningun subcampo propio de K que contenga a F. Luego K es el campo de descomposicion d e p ( x ) sobre F. Ahora en la otra direccion; esto es un poco mas complicado. Apartamos una pieza de la prueba en el LEMA 5.9. Sea K el campo de descomposicidn de f ( x ) en F[x]y sea p ( x ) unfactor irreducible def ( x )en F[x].S i las raices dep ( x )son a , ,..., a,, entonces para cada i existe un automor-smo o i en G(K,F) tal que a i ( a I )= a i .
Prueba. Como cualquier raiz de p ( x ) es una raiz de f ( x ) , tal raiz debe encontrarse en K. Sean a , , ai dos raices cualesquiera de p(x). De acuerdo con el teorema 5.i hay un isomorfismo r de F, = F ( a , ) sobre F; = F(ai) que lleva a , sobre ai y deja todos 10s elementos de F fijos. Ahora bien, K es el campo de descomposicion de f ( x ) considerado como un polinomio sobre F, : analogamente, K es el campo de descomposicion de f ( x ) considerado como un polinomio sobre F ; . Segun el teorerna 5.j hay un isomorfismo a i de K sobre K (luego un automorfismo de K ) que coincide con r sobre F , . Pero entonces a i ( a , ) = r ( a , ) = ai y a i deja a todos 10s elementos de Ffijos. Esto es, desde luego, exactamente lo que afirma el lema 5.9.

Volvemos ahora a nuestra tarea de completar la prueba del teorema 5.u. Supongamos que K es el campo de descomposici6n del polinomio f ( x ) en F[x]. Queremos demostrar que K es normal sobre F. Procedemos por induccion sobre [ K :F], suponiendo que para cualquier par de campos K, , Fl con [ K l :F,] menor que [ K: F], siempre que K, es el campo de descomposici6n sobre F, de un polinomio en F,[x], entonces K, es normal sobre P I . Si ~ ( x )F[x]se descompone en factores lineales sobre F, entonces K = F, E que ciertamente es una extension normal de F. Asi pues, supongarnos que f ( x ) tiene un factor irreducible p ( x ) ~ F [ x de grado r > I . Las r raices ] distintas a , , a,, . .., a, de p ( x ) todas se encuentran en K y K es el campo de descomposicion de f ( x ) considerado como un polinomio sobre F(a,).

16.

ELEMENTOS DE LA TEORIA DE GALOIS

Como

de acuerdo con nuestra hipotesis de induccidn, K es una extension normal de F(a !). Sea BEK fija para cualquier automorfismo a e G ( K , F ) ; queremos demostrar que 8 esta en F. "Ahora bien, cualquier automorfismo en G ( K , F ( a l ) ) deja, ciertamente, fija a F, de donde deja a 8 fija; por la normalidad de K sobre F(a,), esto implica que 8 esta en F(a,). Asi pues
1)

8 = Ao+A1al +A2a,2 +...+A_,alr-' donde A, ,...,

EF.

De conformidad con el lema 5.9 hay un automorfismo a i de K ,

sic G ( K , F), tal que a i ( a l ) = ai ; como Qte o i deja 8 y toda Aj fijas, aplicindolo a ( I ) obtenemos

2)

8

=

Ao+Alai+12ai

2

+...+i,_,a;-'

para i = 1, 2 , ...,r.

Asi pues, el polinomio q ( x ) = Ar-1xr-'+Ar-2xr-2+ ... +A,x+(A,-8) en K [ x ] ,de grado cuando m k r- 1, tiene las r distintas raices a,, a,, ..., a,. Esto puede suceder solamente si todos 10s coeficientes son cero; en particular A, - 8 = 0,de donde 8 = A,, luego esta en F. Esto completa la induccidn y prueba que K es una extension normal de F. El teorema 5.u esta completamente probado. DEFINICION. f ( x ) un polinomio en F[x]y sea K su campo de descomSea posicion sobre F. El grupo de Galois de f ( x ) es el grupo G(K, F ) de todos 10s automorfismos de K que dejan fijos todos 10s elementos de F. Notese que el grupo de Galois def ( x ) puede considerarse como un grupo de permutaciones de sus raices, pues si a es una raiz de f ( x ) y si U E G ( K F) , entonces a ( a ) es tambien una raiz de f(x). Llegamos ahora al resultado conocido como el teorema fundamental de la teoria de Galois. Establece una correspondencia biyectiva entre 10s subcampos del campo de descomposicion de f ( x ) y 10s subgrupos de su grupo de Galois. Ademas da un criterio para que un subcampo de una extension normal sea el mismo una extension normal de F. Este teorema fundamental se usara en la proxima seccion para derivar condiciones para la solubilidad por radicales de las raices de un polinomio. TEOREMA Sea f ( x ) un polinomio en F[x], K su campo de descompo5.v. sicion sobre F y G ( K , F ) su grupo de Galois. Para cualquier subcampo T d e K que contiene a F sea G ( K , T ) = { a € G ( K , F ) I a ( t ) = t para todo t~ T ) y para cualquier subgrupo H de G ( K , F ) sea K , = { X E K I o ( x ) = x para

240

CAMPOS

- Cbp. 5

todo H ) . Entonces la asociacibn de T con G(K, T ) establece una correspondencia biyectiva del conjunto de subcampos de K que contienen a F sobre el conjunto de subgrupos de G(K. F) tal que :
1) T = KG,,,,). 2) H = G(K, K,). 3) [K:TI = O ( G ( K , T)), [ T : q = indice de G(K, T ) en G(K, F). 4 ) T es una extensibn aormal de F si y sblo si G(K, T ) es un subgrupo normal de G(K, F). 5) Cuando T es una extensibn normal de F, entonces G ( T , F ) es isomorjb a G ( K F)IG(K, T ) .

Prueba. Como K es el campo de descomposicion de f ( x ) sobre F es tambitn el campo de descomposicion de f ( x ) sobre cualquier subcampo T que contenga a F; por tanto, seg6nel teorema 5.u, K es una extension normal de T. Asi pues, por la definicion de normalidad, Tes el campo fijo de G(K, T ) , es decir, T = KG(,,,), probando asi (1 ). Como K es una extension normal de F, de acuerdo con el teorema 5.t, dado un subgrupo H de G (K, F), entonces H = G ( K , K,) que es lo que se afirma en la parte (2). AdemPs, esto demuestra que cualquier subgrupo de G(K, F) se presenta en la forma G(K, T ) , de donde la asociacion de T con G(K, T ) transforma el conjunto de todos 10s subcampos de K que contienen a Fsobre el conjunto de todos 10s subgrupos de G(K, F). Que es inyectiva es claro, pues, si G(K, T , ) = G(K, T 2 ) , entonces, por la parte (I), T , = KG(,,,,) = K G ( K . T= )T2. ~ Como K es normal sobre T , tenemos, al aplicar de nuevo el teorema 5.t, [K:T ] = o(G(K, T ) ) ; pero entonces, o(G(K, F)) = [K:F] = [K:T:I[ T : q = o(G(K, T ) )[ T :F], de donde

en G(K, F). Y tsta es la parte (3). Las unicas partes que quedan por probar son las que conciernen a la normalidad. Haremos primer0 la siguiente observaci6n. T es una extensi6n normal de F si y so10 si para cada o~ G(K, F), o ( T ) c T. iPor quc!? Sabemos por el teorema 5.p que T = F(a); asi pues, si o ( T ) c T entonces u ( a ) ~ T para todo o e G ( K , F). Pero como vimos en la prueba del teorema 5.u esto implica que T es el campo de descomposicion de p(x) = (x-o)(a))
aeG(K.F)

n

que tiene coeficientes en F. Como campo de descomposici6n T , por el teorema 5.u, es una extensi6n normal de F. Reciprocamente, si T es una extensi6n normal de F, entonces T = F(a), donde el polinomio minimo de a, p(x), sobre Ftiene todas sus raices en T (teorema 5.4. Pero para cualquier o~ G(K, F), o(a) es tambih una raiz de p(x), de donde o ( 4 debe estar en T.

5 6.

ELEMENTOS DE LA TEORIA DE GALOIS

.

241

Como T estti generado por a sobre F tenemos que a(T) c T, para todo a € G(K, F). Asl pues, Tes una extensi6n normal de Fsi y s610 si para todo a € G(K, F), r€G(K, T ) y ~ E Ta, ( t ) ~ y, por tanto, r(a(t)) = a(t); es decir, si y s610 si T a - 'ra(t) = t. Pero esto dice que Tes normal sobre Fsi y s610 si a - G(K, T ) a c G(K, T ) para todo a € G(K, F). Siendo esta hltima condici6n precisamente la que define G(K, T) como un subgrupo normal de G(K, F),vemos que la parte (4) queda probada. Finalmente, si T es normal sobre F, dado a€G(K, F), como a(t) c T, a induce un automodismo a, de T definido por a,(t) = a(t) para todo ~ E TComo a, deja a todo elemento de F fijo, a, debe estar en G(T, F). . Ademtis, como es evidente, para cualquier a, $E G(K, F), (a$), = a, $ de , donde la aplicaci6n de G(K, F)en G(T, F)definida por a -+ a, es un homomodismo de G(K, F)en G(T, F). i Q d h el nhcleo de este homomodismo 1 Consiste en todos 10s elementos a en G(K, F) tal que a, es la aplicaci6n identidad sobre T. Es decir, el nhcleo es el conjunto de todos 10s a,€ G(K, F) tales que t = a,(t) = a(t); por la misma debici6n, tenemos que el nhcleo es exactamente G(K, T), La imagen de G(K,F) en G(T, F), se@n el teorema 2.d, es isomorfa a G(K, F)/G(K, T), cuyo orden es o(G(K, F))/ o(G(K, T)) = [T:I;l (por parte 3) = o(G(T, F)) (como establece el teorema 5.t.). Asi pues, la imagen de G(K, F) en G(T, F) es todo G(T, F) y, por tanto, G(T, F)es isomorfo a G(K, F)/G(K, T). Esto termina la prueba de la parte (5) y con eUo completamos la prueba del teorema 5.v.

'

.

Problemas
1. Si K es un campo y Sun conjunto de homomodismos de K, demuestre que el campo fijo de S y el de S (el subgrupo del grupo de todos 10s automorfismos de K generados por S) son idbnticos.

2. Prubbese el lema 5.8.
3. Usando el criterio de Eisenstein, prubbese que x4+x3+ x 2 + x + 1 es irreducible sobre el campo de 10s nhmeros racionales.
4. En el ejemplo 3 del texto, prubbese que cada una de las aplicaciones a, que alli se dehieron es un automorfismo de Fo(a).

5. En el ejemplo 3, prukbese que el campo fijo de Fo(w) bajo a, ,u2,a, y a4 es precisamcnte Fo.
6. Prubbese directamente que cualquier automodismo de K debe dejar fijos todos 10s racionales.

*7. Prubbese que un polinomio simbtrico en x, ,..., x, es un polinomio en las funciones simktricas elementales en x , ,..., x,.

242

.

CAMPOS

- Cap. 5

8. Exprksense 10s siguientes corno polinornios en las funciones simetricas elernentales en x, , x2 y x,.
a) x , ~ + x ~ ~ + x , ~ . 6) x , ~ + x ~ ~ + x , ~ . c) (XI - X ~ ) ~ ( X I , ) ~ ( X ~ -X -x3Y.

9. Si or, , or,, a, son las raices del polinornio clibico x3+ 7x2- 8x+ 3, encukntrese el polinomid clibico cuyas raices son :
a) or, , a 2 , a 3
2 2 2

.

*lo. Pruebense las.identidades de Newton, es decir, si o r , , or,, ..., orn son lasraices def(x) = x " + a , x " - ' + ~ , x " - ~ +... +any si sk = crIk+or2'+... + a t , entonces k = Osi k = 1,2,..., n. a) s k + ~ I ~ k - I + a 2 ~... - 2 + 6) s k + a I s k - + ... +ansk-, = 0 para k >n. , c) Para n = 5, apliquese la parte (a) para deterrninar s2, s3, s, y s, .
11. Pruebese que las funciones sirnitricas elernentales en x, , . . ., xn son, ciertarnente, funciones sirnetricas en x, , ..., xn.

12. Si p(x) = xn- I, prukbese que el grupo de Galois de p(x) sobre el carnpo de 10s nlirneros racionales es abeliano. El nurnero cornplejo w es una raiz n-Psima primitira de la unidad si wn = 1 pero wm # I para 0 < m < n. Fo denotari el carnpo de 10s nlirneros racionales.
13. a) Pruebese que hay 4(n) raices n-Csirnas prirnitivas de la unidad donde 4(n) es la funcion 4 de Euler. 6) Si w es una raiz n-esirna prirnitiva de la unidad, pruebese que Fo(w) es el campo de descornposicion de xn- I sobre Fo (y por tanto es una extension normal de F,). C) Si wI , . . ., w4(,, son las 4(n) raices n-esirnas prirnitivas de la unidad, prutbese que cualquier autornorfisrno de Fo(w,)lleva w, en alglin mi. d ) Pruebese que [Fo(w, ): Fo] ,< 4(n).

14. La notacion es corno la del problerna 13. *a) Pruebese que hay un autornorfisrno aide Fo(wl)que lleva w, en wi. b ) Pruebese que el polinorniop,(x) = (x-w,) (x-w,) ... (x-w4(,,)

17. SOLUBlLlDAD POR RADICALES

243

tiene coeficientes racionales. El polinomio pn(x) se llama el n-dim0 polinomio ciclotimico. *c) Pruebese que en realidad 10s coeficientes depn(x)son enteros. 15. Osense 10s resultados de 10s problemas 13 y 14 para probar que pn(x) es irreducible sobre Fopara todo n 2 1.
16. Para n = 3, 4, 6 y 8, calculese y,(x) explicitamente, demutstrese que tiene coeficientes enteros y prukbese directamente que es irreducible sobre Fo.

17. a) PruCbese que el grupo de Galois de x 3- 2 sobre Foes isomorfo a S,, el grupo simetrico de grado 3. b) Encutntrese el campo de descomposici6n K de x3 - 2 sobre Fo. c) Para cada subgrupo H de S, encuentrese K, y comprutbese que la correspondencia da en el teorema 5.v. d) Encukntrese una extension normal en K de grado 2 sobre Fo.

18. Si el campo F contiene una raiz ndsima primitiva de la unidad prudbese que el grupo de Galois de 2 -a, para a € F, es abeliano. '
1

7. SOLUBILIDAD POR RADICALES Dado el polinomio especifico x 2+ 3x+4 sobre el campo de 10s numeros racionales Fo,de acuerdo con la formula cuadrltica para sus raices, sabemos m que estas son (- 3 + p ) / 2 ; asi pues, el campo ~ , ( es el campo de descomposici6n de xZ+ 3x + 4 sobre Fo. Hay, por consiguiente, un elemento y = -7 en Fo tal que el carnpo extension Fo(o) donde oZ= y es tal que contiene todas las raices de x 2+ 3x + 4. Desde un punto de vista ligeramente diferente, dado el polinomio cuadritico general p(x) = x 2+ a, x+a, sobre F, podemos considerarlo como un polinomio particular sobre el campo F(a,, a,) de las funciones racionales en las dos variables a, y a, sobre F; en la extension obtenida por la adjuncion de w a F(al ,a,) donde 02= a, -4p,~F(a,, a,) encontramos todas las raices de p(x). Hay una f6rmula que expresa todas las raices dep(x) en terminos de a, ,a, y raices cuadradas de funciones racionales deal ya,. Para una ecuacion cubica la situacion es muy semejante; dada la ecuacion general clibica p(x) = x3 +a, x 2+a, x +a, puede darse una formula explicita, incluyendo combinaciones de raices cuadradas y raices citbicas de funciones racionales en a , , a, y a,. Aunque en forma algo complicada las fdrmulas de Cardano nos las dan explicitamente : Seanp = a, - (a, 2/3)y

CAMPOS - Cap. 5

y sea

(con raices cubicas propiamente escogidas); entonces las raices de p(x) son P+Q-(a,/3), oP+ozQ-(al/3) y 0 2 p + o ~ - ( a l / 3 )donde o f 1 es una raiz clbica de 1. Estas formulas solo nos sirven para ilustrar que, se&n la adjuncion de una cierta raiz cuadrada y luego una raiz cubica a F(a, ,a,, a3) llegamos a un campo en el que p(x) tiene sus raices. Para polinomios de cuarto grado, que no daremos explicitamente, mediante el uso de operaciones racionales y raices cuadradas podemos reducir el problema al de resolver cierta raiz cubics, de mod0 que tambibn aqui puede darse una formula que exprese las raices en tdrminos de combinaciones de radicales de funciones racionales de 10s coeficientes. Para polinomios de grado quinto o mhs alto, no puede darse tal formula universal radical, pues demostraremos que es imposible expresar sus rakes, en general, de este modo. Dado un campo F y un polinomio p(x) EF[x] decimos que p(x) es soluble por radicales sobre F si podemos encontrar una sucesi6n finita de campos F, = F(w,), F, = F (o,), ..., Fk= F,-, (w,) tal que olrl o l r 2 ~ F 1.., , EF, ., F - tal que las raices de p (x) se encuentren todas en F . , , Si K es el campo de descomposici6n de p(x) sobre F, entonces p(x) es soluble por radicales sobre F si podemos encontrar una sucesion de campos como anteriormente tales que K c F,.Una observation importante y que usaremoS posteriormente en la prueba del teorema 5.x, es que si puede encontrarse un tal F,, podemos, sin pdrdida de generalidad, suponer que sea una extension normal de F; dejamos la prueba de esta afirmacion como problema (problema 1). Por polinomio general de grado n sobre F, p (x) = x" +a, x" - ' + ... +a, entendemos lo siguiente : Sea F(a, , ...,a,) el campo de funciones racionales en las n variables a, , ...,a, sobre F, y considbrese el polinomio particular p(x) = x"+a,x"-'+ ... +a, sobre el campo F(a,, ..., a,). Decimos que es soluble por radicales si es soluble por radicales sobre F(a, , ..., a,). Esto expresa realmente la idea intuitiva de "encontrar una formula" para las raices de p(x) que implique combinaciones de raices mCsimas para varias m, de funciones racionales en a , , a,, ...,a,. Para n = 2, 3 y 4 seiialamos que esto puede hacerse siempre. Para n k 5; Abel prob6 que no puede hacerse. Pero esto no excluye la posibilidad de que un polinomio dado sobre F pueda resolverse por radicales. En realidad, daremos un criterio

,

17

SOLUBlLlDAD POR RADICALES

246

para esto en tCrminod del grupo de Galois del polinomio. Pero primer0 debemos desarrollar unos pocos resultados de teoria pura de grupos. Algunos de estos aparecieron como problemas al final del capitulo 2; pero, sin embargo, 10s haremos aqui oficialmente. DEHNICI~N. grupo G se dice que es soluble si podemos encontrar Un una cadena finita de subgrupos G = No 2 N, 2 N, =, ... 3 Nk = (e) donde cada Ni sea un subgrupo normal de N,-, y tal que ca& grupo factor N,- ,INi sea abeliano. Todo grupo abeliano es soluble, pues simplemente se toma No = G y N, = (e) para satisfacer la anterior definicion. El grupo simttrico de grado 3, S,, es soluble. En efecto, si tomamos N, = {e, (1, 2, 3), (1, 3, 2)), N, es un subgrupo normal de S, y S,/N, y N,/(e) son, ambos, abelianos por ser de 6rdenes 2 y 3, respectivamente. Se puede demostrar que S, es soluble (problema 3). Para n 2 5 demostraremos en el teorema 5.w que S, no es soluble. Busquemos una descripci6n alternativa para la solubili&d. Dado el grupo G y 10s elementos a y b de G, entonces el commufador de a y b es el elemento a - ' b- ab. El subgrupo conmufador, G', de Gesel subgrupo de G generado por todos 10s conmutadores de G. (No es necesariamente cierto que el conjunto de 10s conmutadores mismo forme un subgrupo de G.) Vimos en un ejercicio anterior que G' es un subgrupo normal de G. AdemBs, el grupo G/Gf es abeliano, pues &dos dos elementos cualesquiera en dl, aG', bG', con a, ~ E Gentonces , (aGf)(bG') = abG' = ba(b- 'a- ' ab) G' = (como a - ' b - ' a b ~ G ' ) = baG' = (bG1)(aG'). Por otra parte, si M es un subgrupo normal de G tal que G/M es abeliano, entonces M 3 G', pues &dos a, ~ E G entonces (aM)(bM) = (bM)(aM) de donde deducimos , abM = baM, luego a - b- 'abM = M y, por tanto, a- b- ' a b M. Como ~ M contiene todos 10s conmutadores, contiene a1 grupo que estos generan, es decir, a G'. G' es un grupo por derecho propio, asi que podemos hablar de su grupo conmutador G(2)= (GI)'. Este es el subgrupo de G generado por todos 10s elementos (a1)- '(6')- a'b' donde a', b ' G'. Es ficil probar que no solo es ~ G(,) un subgrupo normal de G', sino tambikn un subgrupo normal de G (problema 4). Continuando de esta forma definimos 10s subgrupos conmutadores mBs altos G("' por G("' = (G("- ")'. Todo G'"' es un subgrupo normal de G (problema 4) y G("- ')/G("' es un grupo abeliano. En ttrminos de estos subgrupos conmutadores mis altos de G, tenemos un criterio sucinto de solubilidad, a saber,

'

'

'

LEMA 5.10. G es soluble si y sblo si Qk) = (e) para algljn entero k :

246

CAMPOS

- Cap. 5

Prueba. Si G ( ~= (e) sea No = -G, N, = G', N, = G(", ...,Nk = G ' ~ )= (e). ) Tenemos G = No 2 N, =IN, 2 ... =IN, = (e); con cada Ni por normal en G, ciertamente, tambien normal en Ni-, . Finalmente,

luego es abeliano. Asi pues; segun la definici6n de solubilidad de un grupo, G es un grupo soluble. Reciprocamente, si G es un grupo soluble, hay una cadena G = No 3 N, 3 N, 3 . .. = N, = (e) donde cada Ni es normal en Ni-, y donde I Ni- ,INi es abeliano. Pero, entonces, el subgrupo conmutador N',-, de Ni- debe estar contenido en N,. Asi pues, N, 3 Nd = G', N, 3 N; 3(G')' = G(,), N, 3 N; 3(G(,))' = G(,), ..., Ni 3 G('), (e) = Nk 3 G(k).De donde resulta que G") = (e).

,

COROLARIO. G es un grupo soluble ,y si G es una imagen homomdrfica de Si G, entonces G es soluble. Prueba. Como G es una imagen homom6rfica de G, es inmediato que (G)(" es la imagen de G(k),Como G(" = (e) para alguna k, (G)'" = (e) para la misma k, de donde, de acuerdo con el lema, C es soluble. El siguiente lema es clave en la prueba de la familia infinita de grupos S,, con n 2 5, no es soluble; aqui S, es el grupo simktrico de grado n. LEMA 1. Sea G = S, donde n 2 5; entonces G(') para k = 1, 2, ..., 5.1 contiene todo ciclo de orden 3 de S, . Prueba. Observemos primer0 que para un grupo arbitrario G, si N es un subgrupo normal de G entonces N' debe tambiCn ser un subgrupo normal de G (problema 5). Afirmamos que si N es un subgrupo normal de G = S, donde n 2 5, que contiene todo ciclo de orden 3 en S,, entonces N' debe tambien contener todo ciclo de orden 3. Pues supongamos a = (I, 2, 3), b = (1,4, 5) de N (estamos aqui usando que n 2 5); entonces a - ' b- ab = (3, 2, I) (5,4, 1) (1, 2, 3) (1,4, 5) = (1,4, 2), como conmutador de elementos de N debe estar en N'. Como N' es un subgrupo normal de G, para cualquier ~ E S , , n- ' (l,4, 2)n debe estar tambiCn en N'. Escojamos n en S tal que n(1) = i , , , n(4) = i, y n(2) = i,, donde i, ,i, e i, son cualesquiera tres enteros distintos en el rango de I a n; entonces n- ' ( I , 4, 2)n = (i,, i,, i,) estA en N'. Luego N' contiene todos 10s ciclos de orden 3. Haciendo N = G, que es ciertamente normal en G y contiene todos 10s ciclos de orden tres, tenemos que G' contiene todos 10s ciclos de orden 3;

'

17.

SOLUBILIDAD POR RADICALES

247

como G' es normal en G, G(2' contiene todos 10s ciclos de orden 3 ; como 0 2es normal en G, G ' ~contiene todos 10s ciclos de orden 3. Continuando ) ) de esta forma llegamos a la conclusion de que G"' contiene todos 10s ciclos de orden 3 para cualquier k . Una consecuencia directa de este lema es el resultado interesante para la teoria de grupos de que TEOREMA Sn no es soluble para n > 5. 5.w.

-

Prueba. Si G = S n , segdn el lema 5.1 1, G'" contiene todos 10s ciclos de orden 3 de Sn para todo k . Por tanto, G") # ( e ) para toda k , de donde de acuerdo con el lema 5.10 G no puede ser soluble.
lnterrelacionamos ahora la solubilidad por radicales de p ( x ) con la solubilidad como grupo del grupo de Galois de p(x). La misma terminologia es altamente sugestiva de que una tal relacion existe. Pero primero necesitamos un resultado acerca del grupo de Galois de un cierto tipo de polinomio.
5.12. Supongamos que el campo F tenga todas las raices n-himas LEMA de la unidad (para un cierto determinado n ) y supongamos que a #O estci en F. Sea 2 - a € F[x]y sea K su campo de descomposicidn sobre F. Entonces:

1) K = F(u), donde u es cualquier raiz de 2 -a. 2) El grupo de Galois de 2 - a sobre F es abeliano. Prueba. Como F contiene a todas las raices n-tsimas de la unidad, notese que tn= 1 pero tm I para 0 c m c n. # contiene t = eZni1"; Si u~ K es cualquier raiz de x"-a, entonces u, t u , t 2 ..., r"- u son u, todas las raices de 2 - a . Que son raices, es evidente; que son distintas se sigue de que si t i u = t i u con 0 < i cj< n, entonces como u # 0 y (ti-t j ) u = 0, debemos tener ti = ti,lo que es imposible ya que ti-' = 1 con 0 <j- i c n. Como ~ E F todos 10s u, t u , ..., t -' u estdn en F(u), , " luego F(u) descompone 2 - a ; como ninglin subcampo propio de F(u) que contenga a F contiene tambitn a u, ninglin subcampo propio de F(u) puede descomponer a ?-a. Asi pues, F(u) es el campo de descomposici6n de 2-a, y hemos probado que K = F(u). Si o, T son dos elementos cualesquiera de x"-a, es decir, si o, r son automorfismos de K = F(u) que dejan todos 10s elementos de F fijos, entonces como tanto o ( u ) como r ( u ) son raices de ?-a, o ( u ) = t i u y r ( u ) = t i u para algunas i y j Asi pues, o r ( u ) = o ( t i u ) = t i o ( u ) (ya que . t i e F ) = t t i u = t i + j u ;anhlogamente, ro(u) = t i + j u . Por tanto, or y ro coinciden sobre u y sobre F, de donde, en todo K = F(u). Pero entonces or = ro, de donde el grupo de Galois es abeliano.

'

CAMPOS

- Cap. 6

Ndtese que el lema dice que cuando F tiene todas las raices n-tsimas de la unidad, entonces, adjuntando una rdz de 2 - a a F, donde ~ E Ftenemos , todo el campo de descomposici6n de 2 - a, luego Qte &be ser una extension normal de F. Suponemos para el resto de la seccidn que F es un campo que contiene todas las raices n-Psimas de la unidadpara todo entero n. Tenemos

TEOREMA Si p ( x ) ~ F [ x es soluble por radicales sobre F, entonces el 5.x. ] grupo de Galois sobre F de )(x) es un gmpo soluble.
Prueba. Sea K el campo de descomposici6n de p(x) sobre F; el grupo de Galois de p(x) sobre F es G(K, F). Como p(x) es soluble por radicales existe una sucesi6n de campos F c F, = F ( o , ) c F = F,(w2)c ... c F = Fk-,(ak), , , donde wlrlEF, w Z n ~ F 1.., OPE ., Fk- y donde K c F,. Como dijimos podemos suponer, sin @rdida de generalidad, que F es una extensi6n normal , de F. Como extensi6n normal de F, Fkes tambitn una extensi6n normal de cualquier carnpo intermedio, de donde Fkes una extension normal de cada una de las Fi Se@n el lema 5.12 toda Fi es una extension normal de Fi-, y como F , es normal sobre Fi-,, de acuerdo con el teorema 5.v, G(Fk, Fi) es un subgrupo normal en G(Fk,Fi- ,). Consideremos la cadena:

.

I

1)

G(Fk, F) 3 G(Fk, F,)

3

G(Fk, F2) 3 ... 3 G(Fk, Fk-1) ~ ( 4 .

Como acabamos de hacer notar, cada grupo en la cadena es un subgrupo normal en el que le precede. Como Fi es una extension normal de Fi-,, de acuerdo con el teorema fundamental de la teoria de Galois (teorema 5.v) el grupo de Fi sobre Fi-, , G(Fi, Fi-,) es isomorfo a G(F,, Fi-,)/G(F,, F,). Pero se@n el lenia 5.12, G(Fi, Fi-,) es un g u p o abeliano. Luego todos 10s grupos cociente G(Fk, Fi- ,)/G(Fk, Fi) de la cadena (1) es abeliano. iLueg0 el grupo G(F,, F) es soluble! Como K c Fkes una extensi6n normal de F (por ser un campo de descomposici6n), segtin el teorema 5.v, G(Fk,K) es un subgmpo normal de G(Fk,F) y G(K,F) es isomorfo a G(Fk,F)/G(Fk,K). Asi pues, G(K,F) es una imagen homom6rfica de G(Fk.F) que es un gmpo soluble; por el corolario del lema 5.10, el mismo G(K, F) debe entonces ser un grupo soluble. Como G(K,F) es el grupo de Galois de p(x) sobre F, el teorema ha sido probado. Hacemos dos observaciones sin prueba. 1) El reciproco del teorema 5.x es tambitn cierto, es decir, si el grupo de Galois de p(x) sobre F es soluble, entonces p(x) es soluble por radicales sobre F. 2) El teorema 5.x y su reciproco son ciertos incluso si F no contiene raices de la midad.

17. SOLUBILIDAD POR RADICALES

249

Recordando lo que se entiende por polinomio general de grad0 n sobre F, p(x) = Y + a , Y - + ... +a,, y lo que se entiende por soluble por radicales, cerramos el capftulo con el gran teorema clisico de Abel

'

TEOREMA ~ . El polinomio general de grado n 2 5 no es soluble por 5. radicales. Prueba. En el teorema 5.s demostramos que si F(a, , ..., a,) es el c a m p de las funciones rationales en las ;variables a,, ..., a,, entonces el grupo de Galois del polinomio p(t) = tn+a, tn- + ...+a, sobre F(al, ...,a,) era S,, el grupo simCtrico de grado n. De acuerdo con el teorema 5.w S, no es un grupo soluble cuando n 2 5, asl pues, segtin el teorema 5.x p(t) no es soluble por radicales sobre F(a, , ..., a,) cuando n 2 5.

'

*l.Si p(x) es soluble por radicales sobre F, pruCbeseque puede encontrarse una sucesi6n de campos

F c F, = F(a,) c F, = F, (a,) c

... c Fk = Fk-,(ak)

don& a l r l ~ Fa z r z ~ F l.,., a?eFk- I , con Fk conteniendo todas las , raices dep(x) tal que Fkes normal sobre F.
2. Prutbese que un subgrupo de un grupo soluble es soluble.

.

3. PruCbese que S, es un grupo soluble.

4. Si G es un grupo, pruCbese que todos 10s G(k)son subgrupos normales

de G.
5. Si N es un subgrupo normal de G, pruCbese que N' &be tambiCn ser un subgrupo normal de G.

6. PruCbese que el grupo alternante (el grupo de las permutaciones pares en S,) A,, tiene subg1-6pos normales no triviales para n 2 5.

ARTIN,E., Galois Theory, segunda edici6n. Notre Dame Mathematical Lectures, numero 2. POLLARD, Theory o Algebraic Numbers, Carus Monographs, n6mero 9. H., f John Wiley and Sons, Inc., Nueva York, 1950. B. VAN DER WAERDEN, L., Modern Algebra, vol. 1. Ungar Publishing Company, Nueva York, 1949. W~ISNER, Theory o Equations. The Macrnillan Company, Nueva York, L., f 1938.

250

CAMPOS - Cap. 5

SIEGEL, L., Transcendental Numbers, Annals of Mathematical Studies, C. nlimero 16. Princeton University Press, Princeton, Nueva Jersey, 1949. NIVEK,I., Irrational Numbers, Carus Monographs, nlimero 11. John Wiley & Sons, Inc., Nueva York, 1956.

T6picos para discusib en dase
NIVEN, "A simple proofpf the irrationality of IT", Bulletin o the American I., f Mathematical Society, vol. 53 (1947), pag. 509.

4 3.

MATRICES

265

7. PruCbese el corolario 2 al teoTema 6.f.
8. Si V es n-dimensional sobre F y si TEA (V) es nilpotente (es decir, tal . que Tk = 0 para alglin k), pruCbese que Tn = 0 (Sugerencia: si ce V usese el hecho de que v, vT, vT2, ..., L'T"deben ser linealmente independientes sobre F.)

.
3. MATRICES
Aunque ya llevamos algJn tiempo tratando de transformacianes, siempre lo hemos hecho en una forma impersonal y un poco lejana; para nosotros, una transformacion lineal ha sido un simbolo (muy a menudo T) que actua en una cierta forma sobre un espacio vectorial. Vemos, cuando pensamos en lo hasta aqui hecho, que fuera de 10s pocos ejemplos concretos con que nos hemos encontrado en 10s problemas, nunca nos hemos enfrentado con transformaciones lineales especificas. AI mismo tiempo, es claro que si hemos de proseguir con el tema un poco mas lejos a menudo se presentara la necesidad de hacer un estudio completo y detallado de una transformacion lineal dada. Para mencionar un problema preciso, si se nos presenta una transformacion lineal (y suponiendo por el momento que tenemos medios para reconocerla), jc6m0 podemos arreglarnoslas para encontrar, de una forma practica y calculable, sus raices caracteristicas? Lo que primer0 buscarnos es una notacion sencilla o, quiza mas precisamente, una representacion sencilla para las transformaciones lineales. Llegaremos a ello mediante el uso de una base particular del espacio vectorial y por el uso de la acci6n de una transformacibn lineal sobre esta base. Una vez que se ha conseguido todo esto, por medio de las operaciones en A ( V ) podemos inducir operaciones para 10s simbolos creados que hagan de ellos un algebra. Este nuevo objeto, infundido de una vida algebraica propia. puede estudiarse como una entidad matematica que tiene un interes por si misma. Este estudio es lo que comprende la llamada teoria de matrices. Pero ignorar el origen de estas matrices, es decir, investigar el conjunto de simbolos independientemente de lo que representan, puede ser costoso, porque estariamos desperdiciando una gran cantidad de informacion util. En lugar de ello, nosotros siempre usaremos las interrelaciones entre el abstract0 A(V) y lo concreto, el algebra de matrices, para obtener informacion de una sobre la otra. Sea V un espacio vectorial n-dimensional sobre un campo F y sea v, , ..., v, una base de V sobre F. Si TEA ( V) entonces T esta determinado en cualquier vector tan pronto como conozcamos su accion sobre una base de V. Como T transforma Ven V, u , T, c2 T, ..., c, Tdeben estar todos en V . Como elementos de V cada uno de estos es realizable de un linico mod0 como

266

TRANSFORMACIONES LINEALES

- Cap. 6

combinaci6n lineal de v, ,

..., v,

sobre F. Asf pues:

don& c a b aijeF. Este sistema de ecuaciones puede escribirse mhs compactamente como viT= zaijvj,
j= 1

para

i=1,2,...,n

.

El conjuntoordenado de n2 nlimeros a,) en F describe completamente a T. Nos serviran como medio para representar T.

DEFINICI~N. V un espacio vectorial de dimensi6n n sobre F y sea Sea v,, ..., v, una base para V sobre F. Si TeA(V) entonces la matriz de Ten la base v, , ..., v,, a la que representaremos por m(T), es

Una matriz es entonces un arreglo ordenado en forma & cuadrado de elementos de F con, hasta el momento,. ninguna otra caracterlstica, que representa el efecto de una transformaci6n lineal sobre una base &da. Examinemos un ejemplo. Sea F u n campo y sea V el conjunto de todos 10s polinomios en x de grado n- l o menor sobre F. Definamos D sobre V por (jYo+jY1x+ ... +jY,,-,xll-')D = jY1+2jY2x+ ... +i/3,xi-I ... +(n-1) /-In-, 9-'. Es trivial comprobar que D es una transformaci6n lineal sobre V; como el lector habrh visto, se trata simplemente del operador de diferenciaci6n. ~ C u h es la matriz de D ? La pregunta carece de sentido a menos que l especifiquemos una base de V En primer lugar, calculemos la matriz de D . en la base v, = 1, v, = x, v, = x2, .., vi = xi-', ., v, = x l l - I . Ahora

.

..

4 3.

MATRICES

bien,

v, Q = x n - I D = ( n - I ) X " - ~

Si volvemos a la propia definicion de matriz de una transformacion lineal en una base dada, vemos que la matriz de D en la base v , , ..., v,, m, ( D ) , es un realidad
o o o . . . 0 0

rn, ( D ) =

0 0

2

0 :3

Q 0 0 ... ( n - I )

Pero na& hay de especial en la base que acabamos de usar ni en como numeramos sus eiementos. Supongamos que nos limitamos a reordenar 10s elementos de esta base; obtenemos entonces una base tan buena como la anterior w , = xn- , w, = A?-', ..., wi = Y-', W, = 1. ~ C U % con ..., a, respecto a esta nueva base, la matriz de la misma transformaci6n lineal? Tenemos ahora,

'

= Ow, +(n-

1)w2+Ow, (n-i)x"-i-'

wi D =

x n - i ~=

= Ow,

+

+Owi+(n-i)wi+, +Owl+2+
= Ow, + O w 2 +

W,

D = I

L) = 0

..+,

= (C- l ) v i - , +Ovb+

+Ovl~2+(i-l)v,~,+Ovl

0

...
0

+ ... +OW,

+Ow,

+Own,

268

TRANSFORMACIONES LINEALES

-

lbp. 6

& donde m2(D), la matriz de D en esta base es

/O

(n- 1) 0 0

0 (n-2) 0

0 0

0 O\ 0 0

0 0 0 m2(D)=

.

-...
0

...
0 0

... 0 (n-3) .-. 0 ......... ... ...

0 0

0 1 0 0

0

...

Antes de terminar con este ejemplo, calculemos la matriz de D en otra base m h d e Vsobre F. Seau, = 1, u2 = l+x, u3 = l + x 2...., u, = I+x"-'; es fhcil verificar que u,, ...,u, forman una base & V sobre F. ~ C u hes la l matriz de D en esta base? Como ulD = ID = 0 = 0u,+0u2+ ... +Ou, u 2 D = ( l + x ) D = 1 = lul+Ou2 + ... +Ou, u3D = ( 1 + x 2 ) = 2x = 2(u2-u1) = -2u1+2u2+Ou3+ ~

...+ Ou,

la matriz m3(D) de D en esta base es

/

0
1

oo...
0 0 2 1 0 0 3

0

0 0
0

-2
-3
I

... ...

0 0 0 0 0 (n-1)

0 0 0 0

m3(D) =

. . . . .....
-(n-1) 0 0

---

Por el ejemplo que hemos estudiado vemos que las matrices de D, para las tres bases usadas dependfan completamente de las bases. Aunque diferentes las unas de las otras representan, sin embargo, a-la rnisma trans-

5 3. MATRICES

269
a

formaci6n lineal D, y podriamos haber reconstruido D partiendo de una cualquiera de ellas si conocitramos la base usada en su determinacibn. Pero, aunque diferente, seria de esperar que existiera alguna relaci6n entre ml(D), m2(D) y m,(D). Esta relaci6n sera la que determinaremos exactamente mas tarde. Como la base a usar en cualquier ocasi6n puede ser cualquiera, dada una transformaci6n lineal T (cuya definicidn, desputs de todo, no depende de ninguna base) es natural que busquemos una base en que la matriz de T tenga una forma particularmente sencilla. Por ejemplo, si T es una transformaci6n lineal sobre V, que es n dimensional sobre F, y si T tiene n raices caracteristicas distintas A,, ...,A,, en F, entonces, de acuerdo con el corolario 2 a1 teorema 6.f, podemos encontrar una base v, , ..., v, de V sobre F tal que viT = A,vi. En esta base T tiene como matriz la de forma particularmente sencilla,

Hemos visto que una vez que hemos escogido una base para V, a cada transformaci6n lineal se le asocia una matriz. Reciprocamente, una vez que hemos escogido una base fija v, , ..., v, de V sobre F, una matriz dada

da lugar a una transformaci6n lineal T definida sobre V por vi T =

1aijvj
j

sobre esta base. Notese que la matriz de la transformaci6n lineal T que acabamos de construir en la base v, , ..., v, es exactamente la matriz con la que comenzamos. Por tanto, toda posible ordenacidn en forma de cuadrado nos sirve como la matriz de alguna transformaci6n lineal en la base V1, . ., 0". Es claro lo que quiere decir cada una de las expresiones primer rengldn, segundo renglbn, ..., de una matriz, como analogamente, lo que debe entenderse por primera columna, segunda columna, ... . En la matriz

.

270

TRANSFORMACIONES LINEALES

- Cap. 6

el elemento a i j esti en el i-esimo renglon y j-esima columna; nos referimbs a tl como el elemento (i, j) (o la entrada (i, j)) de la matriz. Escribir todo el arreglo cuadrado de la matriz es algo pesado; en lugar de ello escribiremos una matriz como (aiJ); esto indica que la entrada (i, j) de la matriz es aij. Supongamos que V es un espacio vectorial de dimension n sobre F y v, , . .., v, es una base de V sobre F que quedarh fija en toda la discusion que sigue. Supongamos que S y T son transformaciones lineales sobre V (y sobre F) con matrices m(S) = (aii) y m(T) = (riJ), respectivamente, en la base dada. Nuestro objetivo es aplicar la estructura algebraica de A(V) al conjunto de matrices que tienen sus entradas en F. Para co menzar, como S = T si y solo si US= vT para todo V E V se tiene , que S = T si y solo si vi T = v i S para todos 10s v , , ., v, que forman una lo base de V sobre F. 0, que es equivalente, S = T si y so10 si ail = Ti] para todo i y todo j. Dadas m(S) = (aiJ) y m(T) = (rij), ipodemos escribir explicitamente m(S+ T)? Como m(S) = (aiJ), v i S = 1 aiJv,; anilogamente, viT = 1

..

rijvi, de donde ui(S+ T) = v i S + v i T =

x a i j ~ j +x rlivj
i

= l(aii
i

+ rij)ui.

i

Pero entonces, por lo que se entiende por matriz de una transformacion lineal en una base dada, m(S+ T) = (Aij) donde Aij = aij+ rlj para toda i y toda j Un chlculo de la misma clase muestra que para ye F, m(yS) = (piJ) . donde pij = raii para toda i y toda j. El c~lculo mis interesante, y tambitn el mhs complicado, es el de m(ST). Tenemos ahora vi(ST) = (0,s) T = ( x aikvk) = aik(vk Sin embargo, T T).
v, T =

i

i

1 ; lo que sustituido en la formula anterior, nos da rkivj
i

k

x
k

(Prutbese). Por tanto, m(ST)
UiJ

=

(vii), donde para todo i y para toda j ,

=

1 k

Tk~-

A primera vista, la regla para calcular la matriz del producto de dos transformaciones lineales en una base dada parece complicada. Sin embargo, n6tese que la entrada (i,j) se obtiene como sigue: consideremos 10s renglones de S como vectores y las columnas de T como vectores; entonces la entrada (i,j ) de m(ST) es simplemente el producto punto de la i-isima fila de S con la j-6sima columna de T. Ilustremos esto con un ejemplo. Supongamos que

13. MATRICES

Y

el producto punto del primer rengldn de S con la primera columna de T es (1) (- 1) +(2) (2) = 3, de donde la entrada (1, 1) de m(ST) es 3; el producto punto de la primera fila de S oon la segunda columna de T es (I) (0)+ (2) (3) = 6 , de donde la entrada (l,2) de m(ST) es 6 ; el producto punto del segundo renglon de S con la primera columna de T es (3) (- 1) +(4) (2) = 5, de donde la entrada (2, 1) de m(ST) es 5; finalmente, el producfo punto de la segunda fila de S con la segunda columna de T es (3) (0)+(4) (3) = 12, de donde la entrada (2,2) de m(ST) es 12. Asi pues,

La anterior discusion se ha hecho pensando principalmente en que sirviera de motivation para las construcciones que estamos a punto de presentar. Sea F un campo; una matriz n x n sobre F sera'un arreglo en forma de cuadrado de elementos en F,

(que representamos por (aij)). Sea F,, = {(aij) I aij€F); en Fn queremos introducir la nocidn de igualdad entre sus elementos, una adicion, una multiplicacion escalar por elementos de F y una multiplicaci6n de forma que se convierta en un llgebra sobre F. Usamos las propiedades de m(T) para TEA ( V ) como nuestra guia en todo esto. 1) Afirmamos que (aij) = (Bij), cuando tenemos dos matrices en Fn, si y solo si ail = Bij para to& i y para toda j . 2) Definimos (ai,)+(Bii) = lij) donde lij aij+Bij para to& i y para = toda j. 3) Para yeF, definimos y(aij) = (pij) donde pij = yaij para to& i y para todaj. 4) Definimos (aij) (Bij) = (vij), donde para toda i y toda j vij = aikhj.
k

Sea V un espacio vectorial de dimension n sobre F y sea v , , ..., vn una base de V sobre F ; la matriz m(T) en la base v , , ..., on asocia con TEA(V) un elemento m(T) en F,. Sin mls preambulo, afirmamos que la aplicacion de

272

TRANSFORMACIONES LINEALES - h p . 8

A ( V ) en F, definido al transformar T sobre m(T) es un isomorfismo de algebras de A(V) sobre F,. Por este isomorfismo F es un algebra asociativa , sobre F (corno puede tambikn verificarse directamente). Llamamos a F el , algebra de todas las matrices n x n sobre F. Toda base de V nos provee de un isomorfismo de algebras de A(V) sobre F,. Es un teorema que todo isomofismo de algebras de A(V) sobre F , es obtenible de tal forma. A la luz de la misma naturaleza espccifica del isomofismo entre A(V) y F, identificaremos a menudo una transformaci6n lineal con su matriz, en , , alguna base, y A ( V) con F . En realidad, F puede considerarse como A (V) actuando sobre el espacio vectorial V = F(") de todos 10s n-tuples sobre F, dondeparala baseu, =(1,0 ,..., O),v, =(0,1,0 ,...,0),..., un=(O,O ,...,0,1), (aij)€Fnactua como ui(aij) = i-ksima fila de (a,]). Resumimos lo que se ha hecho en el siguiente

TEOREMA El conjunto de todas las matrices n x n sobre F forma un 6.~. algebra asociatiua F, sobre F. Si V es un espacio vectorial de dimensidn n sobre F, entonces A(V) y F son isomorfos como algebras sobre F. Dada una , base cualquiera u, , ..., u, de V sobre F, si para TEA( V), m (T) es la matriz de T en la base v, , . .., u, , la aplicacibn T + m(T) nos proporciona un isomorfismo de algebras de A ( V) sobre F, . El cero respccto a la adici6n en F, es la matriz cero todas cuyas entradas son cero; a menudg la representaremos simplemente por 0. La matriz uno, que es el elemento unitario de F, respecto a la multiplicacion, es la matriz cuyas entradas estan en la diagonal I y fuera de la diagonal 0; la representaremos por I, I, (cuando queramos enfatizar las dimensiones de las matrices) o simplemente como I. Para a € F, las matrices

(10s espacios en blanco indican solamente entradas iguales a 0) se llaman matrices escalares. Por el isomorfismo entre A ( V) y F , es claro que TEA(V) , es invertible si y s610 si m(T), como matriz, tiene inversa en F,. Dada una transformacibn lineal TEA(V), si escogemos dos bases u, ,. .,u, y w,, ..., w, de V sobre F, cada una da lugar a una matriz, a saber, m, ( T ) y m,(T), las matricesde Ten las bases u, , ..., u, y w, , ..., w,, respectivamente. Como matrices, es decir, como elementos del algebra de matrices F,, iquk relaci6n hay entre m, (T) y m,(T)?

.

TEOREMA Si V es de dimensidn n sobre F y si TeA(V) tiene la 6.~. matriz m, (T) en la base v, , ..., u, y la matriz m,(T) en la base w, ,..., w, de V

13. MATRICES

273

(ambas sobre F), entonces hay un elemenro CEF tal que mz( T )= Cm, (T)C- '. , En realidad, si S es la transformacidn lineal de V dejnida por v,S = wi para i = 1,2, ..., n, enronces podemos escoger como C a m, (S). Prueba. Sea m,(T) = (a,,) y mz(T) = (Pi,); asi pues vIT = 1 aljuj, W I T CBijw,. =
i
i

Sea S la transformaci6n lineal -sobre V definida por viS = wi. Como u , , ..., u, y w,, ..., w, son bases de V sobre F, S transforma V sobre V de , donde, segun el teorema 6.d, S es invertible en A(V). Ahora bien, w,T = FBijwj; como wi = viS, a1 sustituir esto en la expresidn para w,T obtenemos (viS)T = 1 Bij(vjS). Pero entonces u,(ST) = ( 1 B,,v,)S; como S es invertible, esto se simplifica hasta obtener v,(STS- ') = 1 Bijvj. Por la misma definici6n de matriz de una transformaci6n lineal en unas bases dadas, m,(STS-') = Vij) = mz(T). Pero la aplicaci6n T+m,(T) es un isomorfismo de A ( V ) sobre F,; por tanto, ml (STS- ') = m, (S)m, (T)m, (S- ') = m, (S)m, (T)m, (S)- Reuniendo todo lo que hemos estado estudiando, obtenemos m2(T) = m,(S)m, (T)m, (S)- que es exactamente lo que se afirma en el teorema. Ilustramos este irltimo teorema con el ejemplo de la matriz de D que antes estudiamos, en varias bases. Para minimizar el c8lcul0, suponemos que V es el espacio vectorial de todos 10s polinomios sobre F de grado 3 o menor, y D serh, como antes, el operador diferencial definido pro (a,+ a1x+a2x2+a3x3)D a1+2a2x+3a3xZ. = Como anteriormente vimos, en la base v, = 1, v2 = x, v3 = x 2 y v4 = x3, la matriz D es
i i
I
J

'.

',

En la base u, = 1, u2 = 1+x, u3 = 1 +xZ, u4 = 1 +x3, la matriz de D es

274

TRANSFORMACIONES LINEALES

- Cap. 6

Sea S la transformacibn lineal de V definida por u, S = w, (= v;), v 2 S = w2 = 1 + x = v , + v ~ , v ~ S= 1 + x 2 = u , + ~ ~ y a d e m d s v , S = w3 = w4 = 1 x3 = v1 + v4. La matriz de Sen la base v1 , v2 ,v3 , o es ,

+

Un simple dlculo muestra que

Entonces

como debia ser, de acuerdo con el teorema. (Verifiquense todos 10s cilculos usados.) El teorema afirma que, si conocemos la matriz de una transformacibn lineal en una base cualquiera, podemos calcularla en cualquier otra base, siempre que conozcamos la transformaci6n lineal (o matriz) del cambio de base. Aun no hemos contestado la pregunta: &da una transformacibn lineal, ic6m0 se calculan sus raices caracteristicas? Esto llegard un poco mis tarde. Partiendo de la matriz de una transformaci6n lineal mostraremos

13.

MATRICES

275

como construir un polinomio cuyas raices Sean precisamente la. rakes caracteristicas de la transformaci6n lineal.
Problemas

1. Calculense 10s siguientes productos de matrices:

2. Verifiquense todos 10s chlculos hechos en el ejemplo que ilustra el teorema 6.h.

3. Prutbese directamente en F,,, usando las definiciones de suma y producto, que a) A(B+C) = AB+AC; b) (AB)C = A(BC);
para A, B y C pertenecientes a F,,. 4. Prutbese en F2 para cualesquiera dos elementos A y B, que ( A B BA)' es una matriz escalar.

-

5. Sea V el espacio vectorial de 10s polinomios de grado menor o igual que 3 sobre F. Definase T en V por ( a , + a , x + a 2 x 2+ a 3 x 3 )T = a , + a , ( x + l ) + a , ( ~ + l ) ~ + a ~ ( x +Calculese la matrizde Ten las bases: l)~.
a ) 1, x , x 2 , x 3 . b ) 1, I + x , I + x 2 , 1 + x 3 . c ) Si la matriz de la parte ( a ) es A y la en parte ( b ) es B, encukntrese una matriz C tal que B = C A C - .

'

278

TRANSFORMACIONES LINEALES

- Cap. 8

6. Sea V

= F ( , ) y supongamos que

es la matriz de T E A ( V ) en la base v , = (1, 0,O), v , = (0, I, 0) y v , = (0,0, I ). EncuCntrese la mkriz de 7 en las bases:

a) u , = (I, 1, 1),
b) ul = (1,

u2 = (0, 1,1), u2 = (1,2,0),

u3 = (0,0, 1). u3 = (1, 2, 1).

7. PruCbese que &da la matriz

(donde la caracteristica de F no es 2), entonces: a) A 3 - 6 A 2 + I I A - 6 = 0. b) Existe una matriz C E F , tal que

8. PruCbese que es imposible encontrar una matriz C E F , tal que

para cualesquiera a,

BE F.

9. Una matriz A E F, se dice que es una matriz diagonal si todas las entradas fuera de la diagonal principal de A son 0, es decir, si A = (aij) y a,j = 0 para i # j Si A es una matriz diagonal tal que sus entradas . sobre la diagonal principal son todas distintas, encudntrense to&s las matrices B E F , que conmutan cor. A, es decir, encutntrense todas las matrices B tales que BA = AB.

10. Usando el resultado del problema 9, pruCbese que solo las matrices en F, que conmutan con todas las matrices de F, son matrices escalares.

13.

MATRICES

11. Sea AEF, la matriz

todas cuyas entradas, except0 las de la superdiagonal, son 0, y cuyas entradas sobre la superdiagonal son todas iguales a 1. Prukbese que A" = 0 per0 An- 1 # 0.
*12. Si A es como en el problema 11, encukntrense todas las matrices en F, que conmutan con A y demukstrese que deben ser de la forma a,+ a , A + a 2 A 2 + ... + a , - l A " - l donde a,, a , , .., a, - EF.

.

,

13. Sea AEF, y sea C ( A ) = { B E F , 1 AB = BA). Sea C ( C ( A ) ) = { G E F , I GX = XG para todo X E C ( A ) ) . Prukbese que si G E C ( C ( A ) ) entonces G es de la forma a, + a , A, donde a,, a , EF.
14. Resuklvase el problema 13 para A E F probando que toda G EC ( C ( A ) ) ~ es de la forma a, +a , A + a 2 A2.

15. Definamos las matrices Eij en F, como sigue: Ei, es la matriz cuya finica entrada distinta de cero es la (i, j) que es igual a 1. Prukbese que:
a ) Las Eij forman una base de F, sobre F. b) EijEk, = 0 para j # k ; EIjEj[= E,,. c) Dadas i y j, existe una matriz C tal que C E , , C - ' = E j j . d ) Si i # j, existe una matriz C tal que C E I j C -' = E l , . e ) Encudntrense todas las BEF, que conmutan con E l l . f ) Encudntrense todas las B EF, que conmutan con E l l . 16. Sea F el campo de 10s numeros reales y sea C el campo & 10s n~meros complejos. Para a e C sea T,: C + C dada por xT, = xu, para todo X E C . Usando la base 1, i encudntrese la matriz de la transformaci6n lineal T,y obtdngase asi una representacion isom6rfica de 10s numeros complejos como matrices 2 x 2 sobre el c a m p de 10s numeros reales.

17. Sea Q el anillo con divisi6n & 10s cuaternios sobre el c a m p real. Usando la base 1, i, j, k de Q sobre F, prockdase como en el problema 16 para encontrar una representaci6n isom6rfica & Q por matrices 4 x 4 sobre el campo de 10s numeros reales.

278

TRANSFORMACIONES LINEALES

- Cap. 6

*IS. Combinense 10s resultados de 10s problemas 16 y 17 para encontrar una representaci6n isom6rfica de Q por matrices 2 x 2 sobre el campo de 10s n~imeroscomplejos. 19. Sea 3?l el conjunto de todas las matrices n x n que tienen entradas

0 y 1 de tal forma que hay un tinico I en cada rengl6n y en cada columna.
(Tales matrices se llaman matrices de permutacidn.) a) Si M E 92l describase A M en tkrminos de 10s renglones y las columnas de A: b) Si M e m describase M A en tCrminos de 10s renglones y las columnas de A.

20. Sea ?l en el problema 19. Pruebese que : como l a) fli tiene n! elementos. b) Si M E .m. entonces es invertible y su inversa esta tambien en 221. c) Proporci6nese la forma explicita de la inversa de M . d) Prukbese que es un grupo respecto a la multiplication de matrices. e) PruCbese que nri es isomorfo, como grupo, a S,,el grupo simetrico de grado n. 21. Sea A = (aij) tal que para todo i, 22. Sea A = (aij) tal que para todo j, raiz caracteristica de A.

C aij =
i

1. PruCbese que I es

una raiz caracteristica de A (es decir, que A - I no es invertible).

1 aij = I .
i

Pruebese que I es una

23. EncuCntrense las condiciones necesarias y suficientes que a, 8, y y 6
han de cumplir para que A = es invertible, escribase A-

(; $) sea invertible. Para 10s casos en que

A

'

explicitamente.

24. Si EeF, es tal que E Z = E # 0 prutbese que hay una matriz . C E F , tal que

donde la matriz unidad en la parte superior izquierda es r x r, donde r es el rango de E.

14.

FORMAS CANONICAS: FORMA TRIANGULAR

279

25. Si F es el campo real, prutbese que es imposible encontrar matrices

A,B pertenecientes a F, tales que AB- BA = 1.
26. Si F es de caractedstica 2, prutbese que en F, es posible encontrar matrices A, B tales que AB-BA = 1.

27. La matriz A se llama triangular si todas las entradas sobre la diagonal principal son 0. (Si todas las entradas debajo de la diagonal principal son 0 la matriz tambitn se llama triangular.) a) Si A es triangular y ninguna entrada en la diagonal principal es 0, prutbese que A es invertible. b) Si A es triangular y una entrada en la diagonal principal es 0, prutbese que A es singular. 28. Si A es triangular, prutbese que sus rdces caracteristicas son precisamente 10s elementos en su diagonal principal.
29. Si Nk = 0, NEF,, prutbese que 1 N es invertible y encutntrese su inversa como un polinornio en N.

+

30. Si A E F, es triangular y todas las entradas en'su diagonal principal son iguales a 0, prutbese que A" = 0.
31. Si AEF, es triangular y todas las entradas en su diagonal principal son iguales a a # OE F, encutntrese A- '.

32. Sean S, T transformaciones lineales sobre V tales que la matriz de S en una base es igual a la matriz de T en otra. Prutbese que existe una transformacibn lineal A sobre V tal que T = ASA- '.

4 FORMAS CAN~NICAS:F O R M A TRIANGULAR .
Sea V un espacio vectorial n-dimensional sobre un campo F. DEFINIC~~N. transformaciones lineales S, TEA(V) se dice que son Las tai semejantes si existe un elemento invertible CEA(V) que T = CSC- '. En vista de 10s resultados de la seccibn 3, esta definicibn se traduce en una acerca de las matrices. En realidad, como F, actca como A(V) sobre F'"),la delhicibn anterior define ya una semejanza entre matrices. Por ella, A, BEF, son semejantes si existe una CGF,invertible tal que B = CAC- ' La relacibn sobre A(V) delinida por la semejanza es una relacibn de equivalencia; la clase de equivalencia de un elemento se llamar6 su clase podemos dede semejanza. Dadas dos transformaciones lineales, ~ d m o teminar si son o no semejantes? Desde luego, podiamos examinar la clase de semejanza de una de estas para ver si la otra se encuentra en ella,

280

TRANSFORMACIONES LINEALES

- Cap. 6

pero este procedimiento no es realizable. En su lugar, intentaremos estableeer alguna clase de seiial en cada clase de semejanza y un amino para ir de cualquier elemento de la clase a su sefial. Probaremos la existencia de transformaciones lineales en cada clase de semejanza cuya matriz, en alguna base, es de una forma particularmente conveniente. Estas matrices se llamaran formas candnicas. Para determinar si dos transformaciones lineales son semejantes no necesitaremos otra cosa que calcular una forma can6nica particular para cada una y comprobar si estas son las mismas. Hay muchas posibles'formas can6nicas; solo consideraremos nosotros tres de Cstas, a saber, la forma triangular, la forma de Jordan y la forma can6nih rational, en Csta y las siguientes dos secciones. DEFINICI~N.subespacio Wde V es invariante bajo T E A( V )si WT c W El .

LEMA6.6. Si W c V es invariante bajo T, entonces T induce una transformacidn lineal T e n V/ W definida por (v+ W)T = vT+ W Si T satisface . el polinomio q ( x ) ~ F [ x ] , entonces tambibn lo satisface T, Si p, ( x ) es el polinomio minimo para 'P sobre F y si p(x) es el polinomio rninimo para T, entonces p, ( x ) 1 p (x).
Prueba. Sea 7 = V/W; 10s elementos de 7 son, por supuesto, las clases . laterales v+ W de W en V. Dados 6 = u+ W EP definimos 6T = vT+ W Verificar que T tiene todas las propiedades formales de una transformaci6n lineal sobre V es una facil tarea una vez que se ha establecido que Testa bien dejnida sobre V. Nos contentaremos, pues, con probar este hecho. Supongamos que 6 = v, + W = v, + W donde v, , v2E V. Debemos probar que v, T + W = v2 T + W Como v,+ W = v,+ W, v,-v, debe . estar en W y como W es invariante bajo T, ( v , -v,) T debe estar tambiCn , en W Por consiguiente 0 , T-v, T E W, de donde se sigue que v, T + W = . u, T + W, como queriamos probar. Sabemos ahora que T define una transformaci6n lineal sobre V = V / W. Si 6 = v+ WE^, entonces 6(p) vTZ+ W = (vT)T+ W = (vT+ = W) T = ((v+ W) T )T = 6 ( Q 2; asi pues ( ) = (T)'. Anhlogamente ? ( T ) k para cualquier k 2 0. Por consiguiente, para cualquier polinomio q ( x )F[x],q(T) = q(T). Para cualquier q ( x ) ~ F [ xcon q ( T ) = 0, como 6 ~ ] es la transformacibn 0 sobre V, 0 = q ( T ) = q ( T ) Sea p,(x) el polinomio minimo sobre F satisfecho por T. Si q ( T ) = 0 para q ( x )F[x],entonces p , ( x )1 q(x). Si p(x) es el polinomio rninimo para ~ T sobre F, entonces p ( T ) = 0, de donde p ( T ) = 0; en consecuencia, P l W I P(x).

m=

Como vimos en el teorema 6.f, todas las raices caracteristicas de T que se encuentran en F son raices del polinomio rninimo de T sobre F. Decimos

14. FORMAS CANONICAS: FORMA TRIANGULAR

281

que todas las raices caracteristicas de T e s t h en F si todas las raices del polinomio rninimo de T sobre F se encuentran en F. En el problema 27 a1 final de la liltima seccion, definimos como matriz triangular a toda aquella que tenga todas sus entradas sobre la diagonal . principal iguales a 0 0 lo que es lo mismo, si T es una transformacion lineal de V sobre F, la matriz de Ten la base v, , . .., v,, es triangular si
~1

-

T = all?, u,T = a,,o,+a,,v,

es decir, si vi T es una combination lineal solamente de vi y sus predecesores en la base.

TEOREMA Si TEA( V) tiene todas sus raices caracteristicas en F, enton6.~. ces hay una base de V en que la matriz de T es triangular.
Prueba. La prueba se hace por induccibn sobre la dimension de Vsobre F. Si dimF V = I entonces todo elemento en A(V) es un escalar y, por tanto, para tal caso el teorema es cierto. Supongamos que el teorema es cierto para todos 10s espacios vectoriales sobre F de dimension n - I, y sea V de dimension n sobre F. La transformacion lineal T sobre V tiene todas sus raices caracteristicas en F ; sea I,E F una raiz caracteristica de T. Existe en V un vector v, distinto de cero tal que u, T = I, v,. Sea W = {av, 1 aEF}; W es un subespacio unidimensional de V y es invariante bajo 7:Sea V = V/ W ; por el lema 4.8, , dim V = dim V- dim W = n - 1. De acuerdo con el lema 6.6, T induce una transformacion lineal Tsobre Vcuyo polinomio minimo sobre F divide a1 po\inomio minimo de T sobre F. Asi pues, todas las raices del polinomio minimo de Tpor raices del polinomio minimo de T, deben encontrarse en F. La transformacion lineal T en su accion sobre V satisface la hipotesis del teorema; como V es (n- 1)-dimensional sobre F, por nuestra hip6tesis de induccion, existe una base i,, i,, ..., 6, de Vsobre F tal que:
5,

T = a,,

6,

i3T = a,, i,

+ a,,

6,

Sean v,, ..., u, elementos de V que se transforman en 6,...., fin, respectivamente. Entonces c , , v,, ..., v,, forman una base de V (ver el problema 3

282

TRANSFORMACIONES LINEALES

- Cap. 6

a1 final de esta section). Como 6, T = a,, 6,, 6, T-a,, fi, = 0, de donde 0, T-a,, 0, deben estar en W Asi pues, 0, T-a,, . v, es un m6ltiplo & v, , digamos a,, v, , de donde tenemos, despuCs de trasponer, v, T = a,, v, + a,, v,. Anhlogamente, vi T-ai2v, -ai3 v3 - ... -aiiviE W, de donde vi T = ail v1 ai2V, ... +alivi. La base ul , ...,v, de V sobre F nos proporciona una base respecto a la cual todo vi T es una combinaci6n lineal de vi y sus predecesores en la base. Por lo tanto, la matriz de Ten esta base es triangular. Esto completa la inducci6p y prueba el teorema. Queremos reformular el teorema 6.j para matrices. Supongamos que la matriz AEF, tiene sus raices caracteristicas en F. A define una transformaci6n lineal T sobre F cuya matriz en la base

+

+

v, = (l,O, ..., O), v2 = (0, l,O,

..a,

O), ..., v, = (0, 0, ...,0, 1),

es precisamente A. Las raices caracteristicas de T, siendo iguales a las & A, estAn todas en F, de donde, seg6n el teorema 6.j, hay una base en F(")en la que la matriz de T es triangular. Pero, de acuerdo con el teorema 6.h, este cambio de base varia simplemente la matriz de T, es decir, la A, en la primera base, en CAC- ' para una C adecuada C c F . Asi pues ,

FORMA ALTERNADA DEL TEOREMA 6.1. Si la matriz AEF, tiene todas sus raices caracteristicas en F, entonces hay una matriz CEF, tal que CAC- ' es una matriz triangular.
El teorema 6.j (en cualquiera de sus formas) se describe usualmente diciendo que T (o A) puede ser llevada a unaforma triangular sobre F. Si volvemos nuestra mirada a1 problema 28, a1 final de la secci6n 3, veremos que despuCs de que T se ha llevado a la forma triangular, 10s elementos de la diagonal principal de su matriz juegan el siguiente significativo papel : son precisamente las raices caracteristicar de T. Concluimos la secci6n con el

.

TEOREMA. ~ .Si V es n-dimensional sobre F y si TEA(V) tiene todas sus 6 raices caracteristicas en F, entonces T satisface un polinomio de grado n sobre F.

v,,

Prueba. De acuerdo con el teorema 6.j, podemos encontrar una base . ., v, de V sobre F tal que:

.

v, T = Alv, v2 T = v1 +A2u2

viT = allv,+ para i = 1, 2,

... +al, l-,vi-l+Alvl

..,n.

14.

FORMAS CANONICAS: FORMA TRIANGULAR

0 lo que es equivalente:

para i = I, 2, ..., n. 'Que es v2(T-A,) ( T - A , ) ? Como resultado de v 2 ( T - I , ) = a , , v , y r , ( T - A , ) = 0,obtenemos r2(T-A,) ( T - R , ) = 0.Como

La continuacion de este tip0 de calculo nos lleva a:

L'I(T--Ii)( T - A i - , ) ... ( T - A , ) = 0, rz(T-Ai) (T-Aiui ( T - I i ) ( T - l i 1 ) .

.. ( T - I , )

= 0,
=

.. .,

... ( T - A , )

0.

En particular, para i = n, la matriz S = ( T - An) (T-A,- ,) ... ( T - I , ) satisface r , S = L', S = ... = rnS = 0. Como S suprime una base de V, S tiene que suprimir tambitn a todo V. Por lo tanto, S = 0 Por consiguiente, . T satisface el polinomio ( x - A , ) ( x - 2 , ) ... ( x - I n ) en F[x] de grado n, con lo que el teorema queda probado. Desgraciadamente esta en la naturaleza de las cosas que no to& transformation lineal sobre un espacio vectorial sobre todo campdF tenga todas sus raices caracteristicas en F. Que tal ocurra depende totalmente del campo F. Por ejemplo, si F es el campo de 10s numeros reales, entonces la ecuacion minima de

sobre F es x2 + 1 que no tiene raiz alguna sobre F. No tenemos, pues, ningun derecho a suponer que las raices caracteristicas se encuentren siempre en el campo en cuestion. Pero, podemos p.reguntarnos, ;no podemos ampliar ligeramente F hasta un nuevo campo K de mod0 que todo trabaje muy bien sobre K? Haremos la discusion para matrices; lo mismo podria hacerse para transformaciones lineales. Lo que se necesitaria seria lo siguiente: dado un espacio vectorial V sobre un campo F de dimension n, y dada una extension K de F, entonces podemos sumergir V en un espacio vectorial V , sobre K

284

TRANSFORMACIONES LINEALES

- Cap. 4

de dimension n sobre K. Una forma de hacer esto seria tomar una base c , , ..., v, de V sobre F y considerar V, como el conjunto de todos 10s a, v , + .. . +anon con las a,€K, considerando las vi linealmente independientes sobre K. Este pesado uso de una base es antiestktico; todo puede hacerse de mod0 independiente de toda base si introducimos el concept0 de product0 tensorial de espacios vectoriales. No lo haremos aqui; en su lugar argumentaremos con matrices (lo que es efectivamente el camino delineado anteriormente usando una base fija de V). Consideremos el algebra F,. Si K es cualquier extension del campo de F, entonces F c K,, el conjunto de las matrices n x n sobre K. Asi pues, , cualquier matriz sobre el campo F puede considerarse como una matriz sobre K. Si TEF tiene el polinomio minimo p(x) sobre F, considerada como , un elemento de K, puede concebiblemente satisfacer a un polinomio diferente po(x) sobre K. Pero entonces po(x) 1 p(x), ya que po(x) divide a todos 10s polinomios sobre K (y, por tanto, a todos 10s polinomios sobre F) que son satisfechos por T. Especializamos ahora a K. Por el teorema 5.h existe una extension finita K, de F e n la cual el polinomio minimo p(x), para T sobre F tiene todas sus raices. Como elemento de K,, itiene T, para esta K, todas sus raices caracteristicas en K? Como elemento de K, el polinomio minimo de T sobre K, po(x), divide a p(x) de mod0 que todas las raices de po(x) son raices de p(x) y, por tanto, se encuentran en K. Por consiguiente, como elemento de K,, T tiene todas raices caracteristicas en K. Asi pues, dada Ten F,, a1 irnos a1 campo de descomposici6n K, de su polinomio minimo llegamos a la situacion en que las hip6tesis de 10s teoremas 6.j y 6.k se satisfacen, no sobre F, sino sobre K. Por lo dicho, T puede, por ejemplo, ser llevada a la forma triangular sobre K y satisface un polinomio de grado n sobre K. A veces, cuando tenemos Yerte, sabiendo que cierto resultado es cierto sohre K podemos limitarnos a'F y saber que el resultado es tambikn verdadero sobre F. Pem llegar hasta $no es ninguna panacea, pues hay situaciones frecuentes donde 10s resultados para K no implican nada para F. Es por esto por lo que tenemos dos tipos de teoremas de "formas canonicas", aquellos en que se supone en que todas las raices caracteristicas de T se encuentran en F y aquellos en que no se hace tal supuesto. Una palabra fina1;'si TEF,, por la frase "una raiz caracteristica de T" entenderemos un elemento A del campo de descomposici6n K del polinomio minimo p(x) de T sobre F tal que A- T no es invertible en K,. Es un hecho (vCase el problema 5) que toda raiz del polinomio minimo de T sobre F es es una raiz caracteristica de T.
Problemas

1. Prudbese que la relaci6n de semejanza es una relaci6n de equivalencia en A ( V ) .

14.

FORMAS CANONICAS: FORMA TRIANGULAR

285

2. Si TEF, y si K 3 F, pmibese que como un elemento de K,, T es invertible si y so10 si es ya invertible en F,.
3. En la pmeba del teorema 6.j pruebese que v, , ..., v, es una base de V.
4. Proporcionese una prueba, usando c6lculo matricial, que si A es una matriz triangular n x n con entradas I, , ..., A,, sobre la diagonal, entonces (A-Al)(AyA2)

... (A-A,,)

= 0.

*5. Si TEF, tiene p(x) como polinomio minimo sobre F, pmebese que toda raiz de p(x) en su campo de descomposicion K, es una raiz caracteristica de T.

6. Si TEA(V) y si AEFes una raiz caracteristica de T en F, sea UA = {VE I vT = Iv). Si SEA(V) conmuta con T, prukbese que U , es invariante V bajo S.

*7. Si 32i es un conjunto conmutativo de elementos en A(V) tales que toda ME T tiene todas sus raices caracterlsticas en F, pmebese que hay E un CEA(V)tal que toda CMC- para ME 32i esth en forma triangular.

',

8. Sea W un subespacio de V invariante bajo TEA ( V). Cuando restringimos T a W, T induce una transformacion lineal T(definida por w T = wT para toda we W). Sea p(x) el polinomio minimo de f'sobre F.
a) Pruebese que p(x) 1 p(x), el polinomio minimo de T sobre F. b) Si T induce T sobre VIW, con T satisfaciendo el polinomio minimo p(x) sobre F, prukbese quep(x) I F(x)p(x). *c) Si P(x) y p(x) son primos relativos, prukbese quep(x) = P(x)F(x). *d) Proporci6nese un ejemplo de un T para el quep(x) # P(x)p(x).
N

9. Sea 322 un conjunto no vaclo de elementos en A(V),; el subespacio W c V se dice que es incariante bajo 31i si para todo ME 373, WM c W Si . W es invariante bajo 32i y es de dimension r sobre F, prukbese que existe una base de V sobre F tal que todo ME :XI tiene una matriz, en esta base, de la forma

donde M, es una matriz r x r y M2 es una matriz (n-r) x (n-r).

10. En el problema 9 probamos que M, es la matriz de una transformaci6n fi inducida por M sobre W, y que M2 es la matriz de la transformaci6n lineal inducida por M en V/ W.
*11. El conjunto no vacio 377 de transformaciones lineales en A(V) se llama conjunto irreducible si 10s subespacios de V invariantes bajo 373 son

286

TRANSFORMACIONES LINEALES

- Cap. 6

(0) y V Si XI es un conjunto irreducible de transformaciones lineales sobre i/ . y si D = {TEA(V)1 TM = MT para to& ME .XI, prukbese que D es un anillo con division.
*12. Resutlvase el problema I 1 usando el resultado (lema de Schur) del problema 14, final del capitulo 4. *13. Si F es tal que todos 10s elementos de A(V) tienen todas sus raices caracteristicasen F, prutbese que el D del problema 1 1 consiste solamente en escalares. 14. Sea F el campo de 10s nlimeros reales y sea

a) Prutbese que el conjunto 7ll consiste solamente en

es un conjunto irreducible. b) Encutntrese el conjunto D de todas las matrices que conmutan con

y prutbese que D es isomorfo al campo de 10s nlimeros complejos.
15. Sea F el campo de 10s nlimeros reales.

a) Prutbese que el conjunto

es un conjunto irreducible. A b) Encukntrense todas las AEF, tales que AM = M para to& ME fll. C) Prutbese que el conjunto de todas las A de la parte (b) es un anillo con division isomorfo a1 anillo con division de 10s cuaternios sobre el campo real.

1 5.

FORMAS CANONICAS: TRANSFORMACIONES NILPOTENTES

287

16. Un conjunto de transforrnaciones lineales, !XIcA(V), se llama descomponible si hay un subespacio W c V tal que V = W e W, , W # (0), W # V, y tanto W corno W, son invariantes respectoa TI. Si !XI no es descornponible se llama indescomponible.

a) Si TI es un conjunto descornponible de transformaciones lineales sobre V, prutbese que hay una base de V en que todo ME !XI tiene una matriz de la forrna

don& M, y M, son matrices cuadradas. b) Si V es un espacio vectorial n-dimensional sobre F y si TEA(Y) satisface Tn = 0, pero Tn- # 0, prutbese que el conjunto {T) (consistente en T) es indescornponible.

'

17. Sea TEA(V) y supongarnos que p(x) es el polinomio rninirno para T sobre F. a) Si p(x) es divisible por dos distintos polinornios irreducibles p, (x) y p,(x) en F[x], pruCbese que {T) es descomponible. b) Si para algdn TEA(V) es descomponible {T), pruCbese que el polinornio rninimo para T sobre F es la potencia de un polinornio irreducible.
18. Si TEA(V) es nilpotente, prutbese que T puede ser puesto en forrna triangular sobre F y en esa forrna todos 10s elernentos de la diagonal son 0. 19. Si TEA( V) tiene solarnente 0 corno una raiz caracteristica, prutbese que T es nilpotente.

5. FORMAS CAN~NICAS: TRANSFORMACIONES NILPOTENTES

Una clase de transformaciones lineales que tienen todas sus raices caracteristicas en F es la clase de las nilpotentes, pues corno todas sus raices caracteristicas son 0, es evidente que todas esdn en F. Por tanto, por el resultado de la secci6n previa, una transforrnaci6n lineal nilpotente puede siempre ser puesta en forrna triangular sobre F. Para algunos propcisitos, esto no es suficientemente agudo, y corno veremos pronto, puede decine bastante mas. Aunque la clase de las transforrnaciones lineales nilpotentes es bastante restringida, la verdad es que merece un estudio solo por sus propios rntritos. Pero, lo que adn es mas importante para nuestros propbsitos, una vez que

288

TRANSFORMACIONES LINEALES

- Cap. 6

hemos encontrado una buena forma canonica para ellas, nos es facfi encontrar una buena forrna canonica para todas las transformaciones lineales que tienen todas sus raices caracteristicas en F. Una palabra acerca del metodo que seguiremos en esta seccion. Podriamos estudiar estos problemas "b8sicos" o podriamos basarnos en 10s resultados acerca de la descomposicion de modulos que obtuvimos en el capitulo 4. Nos hemos decidido por un compromiso entre ambas posibilidades; estudiaremos el material en esta seccion y en la siguiente (sobre formas de Jordan) independientemente de la nocion de modulo y 10s resultados acerca de modulos desarrollados en el capitulo 4. Pero en la seccion que trata de la forma candnica racional cambiaremos completamente de punto de vista, introduciendo por medio de una transformacidn lineal dada una estructura de modulo sobre el espacio vectorial bajo discusion; haciendo uso del teorema 4.j tendremos, entonces, una descomposicion de un espacio vectorial, y la forma can6nica resultante correspondiente a una transformacibn lineal dada. Incluso aunque no usemos un enfoque basado en la teorla de modules, por ahora, el lector debe darse cuenta de la analogia entre 10s argumentos usados en la prueba del teorema 4.j con 10s utilizados para probar el lema 6.10. Antes de concentrar nuestros esfuerzos sobre transformaciones nilpotentes probemos un resultado de inter& que verifica transformaciones lineales cualesquiera.

LEMA Si V = V, @ V2@ ... @ Vk, donde cada espacio Vi es de 6.7. dimensibn nl y es invariante bajo T, un elemento de A(V), entonces puede encontrarse una base de V tal que la matriz de Ten esta base sea de la f o r m

donde cada A , es una matriz n, x n, y es la matriz de la transformacidn lineal inducida por T sobre Vi. Prueba. Escojamos una base de V como sigue: v,( '),..., u, (') es una base de V,, v , ( ~ ) ,..., G, es una base de V2, y asi sucesivamente. Como cada V,es invariante bajo T, oi') TE Vi, luego es una combination lineal de ul('), ..., on,('), y solamente de ellos. Asl pues, la matriz de Ten la base asi escogida es de la forma deseada. Que cada A , es la matriz de Ti, la transformacibn lineal inducida sobre Vi por TI es claro por la misma definicibn & matriz de una transformation lineal.

16.

FORMAS CANONICAS: TRANSFORMACIONES NILPOTENTES

289

Limitamos ahora nuestra atencion a las transformaciones nilpotentes. LEMA Si T E A( V) es nilpotente, entonces r , 6.8. donde /as m i € F, es inrertible si a, # 0.

+r l T + ... +am T m ,

Prueba. Si S es nilpotente y r , # OEF, un simple chlculo muestra que

si S r = 0. Ahora bien, si T r = 0, S = a 1 T + a , T 2 + ... + a m F debe tambien satisfacer Sr = 0 (prukbese). Luego para a, # 0 en F, a, S es invertible.

+

NOTACION. denotara la matriz t x t M,

cuyas entradas son 0, except0 en la superdiagonal donde todas son 1.

.

D E F I N I C I ~ NTEA(V) es nilpotente, entonces a k le llamamos fndice Si . de nilpotencia de T si T k = 0 pero T k - ' # 0. El resultado clave respecto a transformaciones nilpotentes es TEOREMA~ .Si TEA(V) es nilpotente, de indice de nilpotencia n,, 6. entonces puede encontrarse una base de V tal que la matriz de T en esta base tenga la forma

"'

M,,
= dim, V.

donden, a n 2 >

... > n r y d o n d e n , + n 2 + ... +nr

Prueba. La prueba sera un poco detallada, de mod0 que a1 hacerla separaremos algunas sus de partes como lemas.

290

TRANSFORMACIONES LINEALES

- Cap. 6

Como T n l = 0 pero T n l - # 0, podemos encontrar un vector L'E V <a1 que o T n l - # 0. Afirmamos que 10s veciores v, vT, . . ., v T n l - son linealmente independientes sobre F. En efecto, supongamos que cx, i5+cx2rT+ ... +an,vTn' - = 0 donde las a,€ F; sea a, la primera a distinta de cero. Tenemos entonces

'

'

'

'

invertible y, por tanto, vTS- = 0. Pero s < n , , luego esto contradice que cTnl - ' # 0. Luego ninglin a, distinto de cero existe y v, cT, ..., v T n l - se ha mostrado son linealmente independientes sobre F.

... + a n , T n l - 7 = 0. Como a, # 0, por el lema 6.8, as+ a s + ,T + .. . +cxnl Tnl-"s
vTs-'(a,+a,+,T+

'

Sea V , el subespacio de V generado por v , = L', r, = vT, ..., L?,, = r T n ' - I ; V I es invariante bajo T y, en la anterior base, la transforrnacion lineal inducida por T sobre V , tiene como matriz M a , . Hasta el momento hemos producido la esquina superior izquierda de la matriz del teorema. Debemos, de alguna forma, producir el resto de esta matriz. LEMA 6.9. S i U E V l es ral que u T " ' - ~= 0, donde 0 < k u = uo T k para algtjn u , V l . ~

< n , , entonces

Prueba. Como U E V , , u = a , v+a,uT+ ... + a , u ~ ~ +cxk+, L ; T ~ ... + + ( X , ~ L ' T " ~Asi. pues, O = uTnl-' = a , V T " ~ - , + ... + a k r ~ " l - ' . Pero -~ r T n l - k .... cTn'-' son linealmente independientes sobre F, de donde , cx, = cx2 = ... = ak = 0, y por lo tanto, u = a,+, UT'+ ... + a n l u T n l - ' = u o T k ,donde uo = ak+,r.+ ... +a n I v T " ~ - ~ E 'V , . El argumento, hasta el momento, no ha sido nada complicado. Se hace ahora un poco mhs denso.

'

v=

LEMA 6.10. Exisre un subespacio W de V , invarianre bajo T , ral que V , @ W.

Prueba. Sea W un subespacio de V , de la mayor dimension posible, tal que: I) V , n W = (0) 2) W es invariante bajo T.
Queremos ahora demostrar que V = V , W. Supongamos que asi no fuera; entonces existiria un elemento Z E V tal que 2 4 V , + W. Como T n l = 0, existe un entero k, 0 < k < n , tal que Z T ~ E I+ W y tal que Z T ' ~V , W V para i < k. Asi pues, ZT" = u+w donde U E V , y W E W. Pero entonces 0 = zTnl = ( z T ~ ) T I I \ = u T " I - ~ + -~ wTnl-'; pero, como tanto V , como W

+

+

1 5.

FORMAS CANONICAS: TRANSFORMACIONES NILPOTENTES

291

son invariantes bajo T, uTnl-'E V, y wTnl-'E W Como V, n W = (0) esto . = E nos dice que UT"'-& - W T " ' - ~V, n W = (O), de donde uTnl-' = 0. V, Segun el lema 6.9, u = uo Tk para algun u , ~ ; por tanto zTk = u+w = uoTk+ul. Seaz, = z-uo;entoncesz, Tk = z T ' - u , ~ ~= u - ~ W , y c o m o W es un invariante bajo T esto implica z, Tm6W para toda m> k. Por otra , parte, si i < k, z, Ti = zTi-uo Ti$ W+ W pues de otra forma zTi deberia estar en V, Wen contra de la eleccion de k. Sea W, el subespacio de V generado por W y z, , z, T, ..., z, Tk- Como z, 4 W, y como W, 2 W la dimension de W, debe ser mayor que la de W. , Ademas como z, T'E Wy como Wes invariante bajo T, W, debe ser invariante bajo T. Por la naturaleza maxima de W debe haber un elemento de la forma ~ ~ ~ + a , z , T+ ... +akz, Tk-I # 0 en W, n V, donde woe W NO +a2z, . todos 10s a , , ..., a, pueden ser cero; de otra forma tendriamos 0 # woe W n V, = (O), una contradiccion. Sea a, el primer a distinto de cero; entonces wo+z, T'- '(a,+a,+, T+ . .. +ak Tk-')e V,. Como a, # 0, por lema 6.8, a,+a,+, T+ ... +a,Tk-' es invertible y su inversa R, es un polinomio en T. Por tanto, W y V, son invariantes bajo R; pero, por lo anterior, woR+z, T"- ' E VI R c V,, lo que obliga a que z, Ts-' V, + E W c V, W Como s- I < k esto es imposible; por tanto V, + W = V. R . Como V, n W = (0), V = V, @ W, y el lema queda probado. El trabajo pesado, por el momento, se termin6; ahora vamos a completar la prueba del teorema 6.1. Segun el lema 6.10, V = V, @ W donde W es invariante bajo T. Usando las bases L',, . . .. o,, de V, y cualquier base de W como una base de V, por el lema 6.7, la matriz de Ten esta base tiene la forma

+

'.

+

donde A , es la matriz de T,, la transforrnacion lineal inducida sobre W por T. Como T"' = 0, TZn2 0 para algun n, < n, . Repitiendo el argument0 = usado para T, sobre W podemos descomponer W como hicimos con V (0, aplicar induction sobre la dimension del espacio vectorial de hue tratemos). Continuando este camino obtenemos una base de V en que la ~rlatriz T es de la forma de

Que n, +n, + ... +n, = dim V es claro, ya que la dimen$6n de la matriz es n x n donde n = dim V.

TRANSFORMACIONES LINEALES

- Cap. 6

D E F I N I C ~ ~ Nenteros n , , n, , ..., nr se llaman 10s invariantes de T. LOS . DEFINIC~~N. A ( V ) nilpotente, el subespacio M de V, de dimenSi T E es si6n m, que es invariante bajo T, se llama ciclico con respecto a T, si :
1 ) MT'" = (0),MTm-I # (0); 2) hay un elemento ZE M tal que z, IT,

...,zTm-

forma una base de M.

(Nota: La condicion (1) esth realmente implicada por la condici6n 2.)

LEMA 1. Si M, de dimensidn ,m, es ciclica con respecto a T , entonces 6.1 la dimensidn de MTk es m - k para todo k d m.
Prueba. Podemos obtener una base de MTk tomando la imagen de cualquier base de M bajo Tk. Usando la base z, IT, ...,zTm- de M obtenemos una base zTk, zTk+I , ..., zTm- l de MTk. Como esta base tiene m-k elementos, el lema queda probado. El teorema 6.1 nos dice que dado un nilpotente T en A ( V ) podemos encontrar enteros n, k n, B ... k n, y subespacios V , , ..., V, de V clclicos con respecto a T y de dimensiones n, , n, ,...,n, respectivamente, ya que v = V,@ ... @V,. i Es posible que podamos encontrar otros enteros m, 2 m, 3 ... k m, y otros subespacios U, , ..., Us de V, clclicos respecto a T y de dimensiones m , , ..., ma, respectivamente, tales que V = U,@ ... @ U,? Afirmamos que no es posible o, en otras palabras, que s = r y m , = n , ,m, = n,, ..., m, = n, . Supongamos qtle tste no fuera el caso; entonces habrla un primer entero i tal que m , # nl. Podemos suponer que mi < ni. Consideremos VTm'. Por una parte, como V = V,@ ... @ Vr. VTm' = V , Tm'@... @ ViT " @ ... @ VrTm'. '' Como dim V , Tm' = n, -mi, dim V, Tm' '= n,-m,, ...,dim VITm'= nl-ml (seglin lema 6.11E dim V T " " k ( n , nr,)+(n, - m,)+...+(nl-mi). Por otra parte, como V= U,@ ...@ Usy como U,Tm'=(0) para j 2 i , V F ' = U ,Tm'@ U,Tmi+ ...@ Ui-, 7"'. Asl pues dim VT"' = (m,-ml)

+ (m,-mi) + ... + ( m i - , -mi).
..., ni-, = m i - , , de donde ... +(nl-, -mi).

Por nuestra elecci6n de i, n, = m,. n, = m,. dim VTm' = (n, -m,)+(n, -mi)+

Pero esto contradice el hecho anteriormente probado de que dim VTm'k (n,-mi)+ ... +(ni-, - m l ) + ( n l - m l ) , y a q u e n l - m l > O . Asl pues, hay un linico conjunto de enteros n, k n, ... k n, tal que V es la suma directa de subespacios clclicos con respecto a T y de dimensiones n,, n,, ....n,. Es decir. hemos demosrrado que 10s invariantes de T son linicos.

Matricialmente, el argument0 que acabambs de mostrar ha probado que si n, 2 n, 2 ... 2 n, y m, 2 m, 2 ... 2 m,, entonces las matrices

son semejantes solamente si r = s y n, = m, , n, = m,, ...,n, = m,. Hasta el momento hemos probado la mitad mis dificil del
TEOREMA . DOS transformaciones Iineales nilpotentes son semejantes 6 ~ si y so'lo si tienen las mismas uariantes.

Prueba. La discusi6n que precede al teorema ha demostrado que si dos transformaciones lineales nilpotentes tienen diferentes invariantes, entonces no pueden ser semejantes, pues sus respectivas matrices

no pueden ser semejantes. Pasemos a comprobar la parte del teorema en la otra diteccibn. Si las dos transformaciones lineales nilpotentes S y T tienen 10s mismos invariantes n, 2 ... 2 n,, pot el teorema 6.1 hay bases v , , ..., u,, y w,, ..., w,, de V tales que la matriz de S en u,, ..., L;, y la de T en w , , ..., wn son, ambas, iguales a

Pero si A es la transformaci6n lineal definida sobre V por u,A = w i , entonces S = A,TA-' (iprudbese!, comphrese con el problema 32 al final de la secci6n 3), de donde S y T son semejhntes. Calculemos un ejemplo. Supongamos que

2 94

TRANSFORMACIONES LINEALES - C ~ D 6

act~ia sobre F, con base u , = (1,0, O), u, = (0. 1, 0) y u, = (0,0, 1). Sea L;, = U , ,o2 = U , T = u2 +-u,, o, = U, ; en la base u, , u,, o, la matriz de Tes

de forma que 10s invariantes de T son 2, 1. Si A es la matriz del cambio de base, es decir

un simple calculo muestra que

ATA-' =

Una observacion final: 10s invariantes de T determinan una particion de
n, la dimension de V. Reciprocamente, una particion de n, n , 2 n,, n , +n, +n, = n, determina 10s invariantes de la transformacion lineal

%la

o o o .

+ ...

...

nilpotente

As; pues, el nljmero de clases distintas de semejanza de /as matrices nilpotentes n x n es precisamente p(n), el nljmero de particiones de n.

6. FORMAS CANONICAS. UNA DESCOMPOSlClON DE V : FORMA DE JORDAN

Sea V un espacio vectorial de dimension finita sobre F y sea Tun elemento arbitrario de A,(V.). Supongamos que V , es un subespacio de V invariante bajo T. Por tanto, T induce una transformacion lineal TI sobre V , definida por u T , = uT para toda U E V , . Dado un polinomio cualquiera p ( x ) ~ F [ x ] . afirmamos que la transformacion lineal inducida por q(T) sobre V , es precisamente q(T,). (La prueba de esto se deja como ejercicio.) En par-

16.

FORMAS CANONICAS. U N A DESCOMPOSICION DE V: FORMA DE JORDAN

295

ticular, si q ( T ) = 0, entonces q ( T , ) = 0. Asi pues, T I satisface cualquier polinomio satisfecho por T sobre F. i Q u t podemos decir en la direccion opuesta ? LEMA 6.12. Supongamos que V = V ,@ V, donde V , y V, son subespacios de V inuariantes bajo T. Sean T , y T , las transformaciones lineales inducidas por T sobre V , y V,, respectivamente. Si el polinomio minimo de T I sohre F es p, ( x )mientras que el de T2 es p2 (x),entonces el polinomio minimo pura T sobre F es el minimo comlin mljltiplo de p,(x) y p, (x). Prueba. Si p(x) es el polinomio minimo para T sobre F, como hemos visto antes, tanto p ( T l ) como p(T,) son cero, de donde p , ( x ) ( p ( x ) y p,(x) ( p(x). Pero entonces el minimo comlin multiplo de p, ( x ) y p,(x) debe tambitn dividir a p(x). Por otra parte, si q(x) es el minimo comun multiplo de p, ( x ) y p,(x), consideremos q(T). Para r , E V , , como p, ( x ) q(x),v, q ( T ) = r , q ( T l )= 0; analogamente, para r , E V,, r,q(T) = 0. Dada cualquier r e V, r puede escribirse como r = L:, + v2 donde L?, l V , y L',EV 2 , en consecuencia de lo ) cual rq(T) = ( r ,+r,)q(T) = v I q ( T ) + v 2 q ( T = O.Asi pues, q ( T ) = 0 y T satisface q(x). Combinado con el resultado del primer parrafo, esto nos da el lema.

-

I

COROLARIO. V = V I @... @ V k , donde todo Vi es invariante bajo T Si y si pi ( x )es polinomio minimo sobre F de T i , la transformacibn lineal inducida por T sobre V i , entonces el polinomio minimo de T sobre F es el minimo comun multiplo de p, ( x ) ,p2 ( x ) ,...,pk (x). Dejamos la prueba del corolario al lector. Sea T E A , ( V ) y supongamos que p(x) en F[x]es el polinomio minimo de T sobre F. Seglin lema 3.21, podemos factorizar p(x) en F[x]en forma linica como p(x) = q , (x)" q2(x)12 qk(x)Ik, ... donde 10s q,(x) son polinomios irreducibles distintos en Fix] y donde I , , I,, ..., Ik son enteros positivos. Nuestro objetivo es descomponer V en suma directa de subespacios invariantes bajo T tales que sobre cada uno de Cstos la transformaci6n lineal inducida por Ttiene como polinomio minimo una potencia de un polinomio irreducible . Si k = I, V mismo sirve a nuestro propcjsito. Supongamos pues q u e k > 1. Sea V , = { r e v oq, (T)I1= 0}, V, = { V E v vq,(T)12 = 0}, ..., Vk = { V E V rqk(T)Ik= 0). Es una trivialidad que cada Vi es un subespacio de V. AdemPs, Vi es invariante bajo T, pues si U E V i , como T y q,(T) conmutan, ( u ~ ) q , ( T )= (uqi(T)ll) = OT = 0 . Por la definicion de Vi esto sitlia a " T uT en Vi. Sea Ti la transformaci6n lineal inducida por T sobre Vi.

I

1

TEOREMA~.N. Paracadai = 1,2, ..,k,Vi # ( 0 ) y V = V,@V,@ Vk.Elpolinomio minimo de Tl es qi{x)lr.

... @

296

TRANSFORMACIONES LINEALES

- Csp. 6

Prueba. Si k = I entonces V = V, y no hay nada que necesite probarse. Supongamos entonces que k > I . Primero necesitamos probar que todo Vi # (0). Con este fin introducimos 10s k polinomios:
~ I ( X )=

4 2 ( ~ ) ' ~ q 3 ( ~ )4r(x)Ik, I'...

Como k > I . li;(x) # p(x). de donde hi(T) # 0. Asi pues, dada i, hay un 1.e V tal que 11. = rlii(T) # 0. Pero u9qi(T)" = r(hi(T)qi(T)'i)= rp(T) = 0. En consecuencia, 1 ~ '# 0 esta en Vi y por tanto Vi # (0). En realidad hemos demostrado un poco mas, a saber, que VIii(T) # (0) esta en V,. Otra observacion acerca de /ii(x) viene ahora a cuento, si Vj para j # i, como qj(x)'j lii(x).rilli( T) = 0. Los polinomios lii(x). /12(x),. .., lik(x)son primos relativos. (ipruebese!) De aqui que segun el lema 3.20 podemos encontrar polinomios a , (x), ..., a,(.u) en F[x] tales que a , (x)h,(x)+ ... +a,(x)h,(x) = I . De donde tenemos. a,(T)Ii,(T)+ ... +&(T)h,(T) = 1, de donde, dado r e v , r = 1.1 = i ( a , (T)li,(T)+... +ak(T)Ilk(T)) ra, ( T ) h , ( T ) +... +rak(T)hk(T). = Ahora bien, cada rai(T)Iii(T)esta en VIi,(T), y como hemos probado anteriormente que VIii(T)c V,, hemos demostrado ahora LI como o = I., ... +r, , donde cada r i = [.ai(T)hi(T) esd en Vi. Luego V = V, v2+ ... v,. Debemos ahora verificar que esta suma es una suma directa. Para mostrar esto es suficiente probar que si ui+u2+ ... +uk = 0 con cada uie V,, entonces cada ui ='O. Supongamos, pues, que u, + u, + ... + u, = 0 y que algun ui, digamos u, , no es 0. Multipliquemos esta relacion por h, (T); obtenemos u, h, ( T ) + ... +u,Ii, ( T ) = Oh,(T) = 0. Ademas. ujh,(T) = 0 paraj # 1 yaqueujeVj; laecuacion sereduceasiau,h,(T)= 0. Pero u,q,(T)" = 0 y como 11,(x) y q,(x) son primos relativos, esto implica que u, = 0 (ipruebese!), lo que es, desde luego, incompatible con la hipotesis de que u, # 0. Hasta el momento hemos conseguido probar que v = V,$V,@ ... @V,. Para completar la prueba del teorema debemos todavia probar que el polinomio minimo de Ti sobre Vi es q(x)';. Por la definicion de V,. como Viqi(T)li = 0, qi(Ti)li= 0, de donde la ecuacion minima de Ti debe ser un divisor de qi(x)Ii, luego de la forma q,(x)fi con f i <Ii. Por el corolario al lema 6.12, el polinomio minimo de T sobre F es el minimo comlin miltiplo de q,(x)", ..., q,(x)** y debe, por tanto. ser q, (x)lr.. . q,(x)/*. Como este polinomio minimo es en realidad q, (x)'~.. q,(x)Ik debemos tener que .

I

+

+

+

16.

FORMAS CANONICAS. UNA DESCOMPOSICION DE V: FORMA DE JORDAN

297

fl

3 I , . f ,3 I , , ...,.fi B 1,. Combinada con la desigualdad de sentido opuesto que antes probamos, esto nos da el resultado buscado, que I , = f ; para i = 1, 2, ..., k , con lo que completamos la prueba del teorema. Si todas las raices caracteristicas de T sucediera que estaban en F entonces el polinomio minimo de T toma la forma particularmente sencilla q ( x ) = ( x - A I ) I 6 ... ( x - A,)', donde A , , ..., A, son las distintas raices caracteristicas de T. Los factores irreducibles q , ( x ) anteriores son simplemente q i ( x ) = x - A,. Notese que sobre V , , Ti solamente tiene A, como raiz caracteristica.

COROLARIO. toclas las distintas raices caracteristicas A , , . ., A, de T Si se encuentran en F, entonces V puede escribirse como V = V , @ @ V, donde V i = { C E V ( r ( T - Ai)" = 0) y donde Ti tiene solamertte una raiz caracteristica, A, , sobre V i

.

. ..

.

Volvamos a1 teorema por un momento; usamos la misma notacion ... @ V,, si la dimensi6n de V i es n , , por el lema 6.7 podemos encontrar una base de V tal que en esa base la rnatriz de T sea de la forma
T i , V i que en el teorema. Como V = V , @

'

donde cada A ; es una matriz ni x ni y es en realidad la matriz de Ti. ~ Q u C exactamente lo que andarnos buscando? Queremos encontrar es un elemento en la clase de semejanza de T que pueda distinguirse en alguna forma. A la luz del teorema 6.h esto puede reformularse como sigue: buscamos una base de V en que la matriz de T tenga una forma especialmente sencilla (y reconocible). De acuerdo con la anterior discusion, esta busqueda puede quedar limitada a las transformaciones lineales T i ,con lo que el problema general puede reducirse de la discusion de transformaciones lineales generales a la de las transformaciones lineales especiales, cuyos polinomios minimos son potencias de polinomios irreducibles. Para la situacidn especial en que todas las raices caracteristicas de T se encuentran en F es lo que vamos a hacer a continuacion. El caso general en el que no ponemos restriccion alguna sobre las raices caracteristicas de T lo estudiaremos en la pr6xima seccion. Estamos ahora en una feliz posicion. Hemos construido todas las piezas y todo lo que tenemos que hacer es juntarlas. Resulta de ello e importan!

298

TRANSFORMACIONES LINEALES

- Cap. 6

tisimo y utilisimo teorema en el que se exhibe lo que usualmente se llama
jorrna candnica de Jordan. Pero demos primer0 una definicion.

DEFINICION. matriz La

con 1 en la diagonal y I en la superdiagonal y 0 en las demis entradas es un
bloque basico de Jordan perteneciente a I..

TEOREMA ~ .Sea T E F ( ~ tcon todas sus distintas rakes caracteristicas 6. A ) I., , . . ., i,,, en F. Entonces puede encontrarse una base de V en que la matriz T
sea de la,/'orma

donde cada

y donde Bi,

...., B , , son bloques basicos de Jordan pertenecientes a Ri.

Prueba. Antes de comehar notemos que un bloque basic0 rn x rn de Jordan perteneciente a I es simplemente I. + M,, donde M, es la matriz que se ha definido al final del lema 6.8. De acuerdo con la combinaci6n del lema 6.7 y el corolario a1 teorema 6.n, podemos reducirnos al caso en que T tiene solamente una raiz caracteristica I, es decir, al caso en que T- I. es nilpotente. Asi pues, T = 1+ ( T - A ) , y

16.

FORMAS CANONICAS. UNA DESCOMPOSICION DE V: FORMA DE JORDAN

299

como T-A es nilpotente, seghn el teorema 6.1, hay una base en que su matriz es de la forma

Pero entonces la matriz de Tes de la forma

usando la primera observacion hecha en esta prueba acerca de la relacion entre un bloque de Jordan basico y las M,. Y esto completa el teorema. Usando el teorema 6.1 podriamos arreglar las cosas de forma que en cada J i , la dimensi6n de B i , 2 la dimensi6n de Biz 2 .... Cuando esto se ha hecho, entonces la matriz

se llama la forma de Jordan de T. N6tese que el teorema 6.p para matrices nilpotentes se reduce a1 teorema 6.1. Dejamos como ejercicio lo siguiente: dos transJormaciones lineales en
( A , V ) que tienen todas sus raices caracteristicas en F, son semejantes si y solo si pueden llei1arse a la misma forma de Jordan.

Asi pues, la forma de Jordan actua como un "determinador" para clases de semejanza de este tipo de transformaciones lineales. En tCrminos de matrices, el teorema 6.p puede formularse como sigue:
sea A E Fn y supongamos que K es el campo de descomposicion del polinomio minimo de A sobre F ; entonces puede encontrarse una matriz ini~ertible EK, C tat que C A C - estP en la forma de Jordan.

'

Dejamos 10s pocos puntos necesarios para hacer la traducci6n del teorema 6.p a su forma matricial como ejercicio para el lector. Una observacion final: si AEF" y si K n , donde K es el campo de des-

300

TRANSFORMACIONES LINEALES

- Cap. 8

composici6n del polinomio minimo de A sobre F,

donde cada J i corresponde a una raiz caracteristica distinta l i de A, entonces la mul!iplicidad de l i como raiz caracteristica de A es, por definicion n i , donde Ji es una matriz n i x n i . N6tese que la suma de las multiplicidades es exactamente n. Es claro que analogamente podriamos definir la multiplicidad de una raiz caracteristica de una transformacion lineal.

Problemas
1. Si S y T son transformaciones lineales nilpotentes que conmutan, pruibese que ST y S + T son transformaciones lineales nilpotentes.

2. Mediante un calculo matricial directo, demukstrese que

no son semejantes. 3. Si n , 2 q , y m , 2 m , , pruebese, mediante un calculo matricial directo que

son semejantes si y solo si n, = m , y n, = m,
*4. Si n , > n, 2 n, y m , 2 m, 2 m,, pruibese, por medio de un dlculo matricial directo que

son semejantes si y solo si n , = m , ,n, = m, y n, = m,. -

16.

FORMAS

CANONICAS. UNA

DESCOMPOSICION DE V: FORMA DE JORDAN

301

5. a ) PruCbese que la matriz

es nilpotente y encukntrense sus invariantes y forrna de Jordan. b) PruCbese que la rnatriz de la parte ( a ) no es semejante a

6. Pru6bese el lerna 6.12 y su corolario, incluso si las sumas que en C1 aparecen no son sumas directas.
7. PruCbese la afirrnacion hecha de que dos transforrnaciones lineales en A , ( V ) todas cuyas raices caracteristicas se encuentran en Fson sernejantes si y solo si sus forrnas de Jordan son iguales (except0 por una permutation en la ordenacion de las raices caracteristicas).
8. ComplCtese la prueba de la version matricial del teorerna 6.p, dada en el texto.
9. PruCbese que la matriz n x n
.- .

0 0 0

1 0

con entradas 1 en la subdiagonal y 0 todas las dernas, es sernejante a M,. 10. Si F tiene caracteristica p > 0 pruibese que A =

A = 1. P 11. Si F ' tiene caracteristica 0, pruebese que A = Am = 1 para m > 0 solamente si z = 0.

(A (A

;)

satisface

;)

satisface

302

TRANSFORMACIONES LINEALES

- Cap. 6

12. Encuentrense todas las formas de Jordan posibles para: a ) todas las matrices 8 x 8 que tienen x2(xcomo polinomio minimo: h ) todas las matrices IOx 10 sobre un campo de caracteristica diferente de 2, que tiene x 2 ( x - I)'(x+ I ) 3 como polinomio nlinimo.

13. Pruebese que la matriz n x n

es semejante a

si la caracteristica de F es 0 o si es p y p t n. ;CuBI es la multiplicidad de 0 como raiz caracteristica de A ? Una rnatriz A = (aij) se dice que es una matriz diagonal si a,, = 0 para i # j , es decir, si todas las entradas aparte de las de la diagonal principal son 0. Una matriz, o transformacidn lineal, se dice que es diagonalizable si es semejante a una matriz diagonal (tiene una base en la que su matriz es diagonal).

-

*14. Si T esta en A(V) entonces T es diagonalizable (si todas sus raices caracteristicas estan en F) si y solo si siempre que v(T-A)'" = 0, para L'E V y A E F, entonces u(T- A) = 0.

15. Usando el resultado del problema 14, prutbese que si E2 = E entonces E es diagonalizable.

16. Si E2 = E y F Z = F prutbese que son semejantes si y s61o si tienen el mismo rango.

17. Si la multiplicidad de cada una de las raices caracteristicas de T es 1, y si todas las raices caracteristicas de T esthn en F, prukbese que T es diagonalizable sobre F. *18. Si la caracteristica de F es 0 y si TEA ( V) satisface Tm = I , prukbese ; que si las raices caracteristicas de T estan en F entonces T es diagonalizable. (Sugerencia: usese la forma de Jordan de T.)

17.

FORMAS CANONICAS: FORMA CANONICA RACIONAL

303

*19. Si A , B E F son diagonalizables y si conmutan, pruebese que hay un elemento C EF,, tal que tanto C A C - ' como C B C - ' son diagonales.

20. Pruebese que el resultado del problema 19 es falso si A y B no conmutan.

7. FORMAS CANONICAS:FORMA

CANONICARACIONAL

La forma de Jordan es la mas comunmente usada para probar teoremas acerca de las transformaciones lineales y las matrices. Desgraciadamente tiene un serio inconveniente en 10s requerimientos que impone sobre la localizacion de las raices caracteristicas. Es cierto que si T E A , ( V ) (o AE F,,) no tiene sus raices caracteristicas en F, no tenemos mas que ir a una extension finita K de F en que todas las raices caracteristicas de T se encuentran y luego llevan T a su forma de Jordan sobre K . En realidad, este es un procedimiento operativo estandar; pero prueba resultados en K,, no en F,,. Muy a menudo el resultado en F,, puede deducirse del resultado en K,,, pero hay muchas ocasiones en que despuks que un resultado se ha establecido para AEF,, considerado como un elemento en K,, , no podemos volver de K, para obtener la informaci6n deseada en F,, . Asi pues, necesitamos alguna forma canonica para elementos en A , ( V ) (o en F,,) que no presupongan nada sobre la locaiizacion de las raices caracteristicas de sus elementos, una forma canonica y un conjunto de invariantes creados en A , ( V ) mismo usando solamente sus elementos y operaciones. La forma candnica rational, que describimos a continuacion en el teorema 6.q y su corolario, es una forma canonica de tal tipo. Sea T EA F ( V ) ;por medio de,T nos proponemos hacer de V un modulo sobre F [ x ] ,el anillo de 10s polinomios en x sobre F. Hacemos esto definiendo para cualquier polinomio , f ( x ) en F [ x ] , y cualquier ~ E Vf ( x ) r = l : f ( T ) . , Dejamos la verification al lector de que, bajo esta definicion de multiplicacion de elementos de V por elementos de F [ x ] , V se hace un F[x]-modulo. Como V es de dimension finita sobre F, esta finitamente generado sobre F, luego tanto mas sobre F [ x ] que contiene a F. Ademas. F [ x ] es un anillo euclidiano; luego como un modulo finitamente generado sobre F [ x ] , por el teorema 4.j, V es la suma directa de un numero finito de submodulos ciclicos. Por la misma forma en que hemos introducido la estructura de modulo sobre V , cada uno de estos submodulos ciclicos es invariante bajo T ; ademas, hay un elemento m,, en un tal submodulo M, tal que todo elemento m en M es de la forma m = m, f ( T ) para algun f ( x ) ~ F [ x ] . Para determinar la naturaleza de T sobre V sera, por tanto, bastante para nosotros conocer como parece T sobre un subm6dulo ciclico. Es esto precisamente lo que intentamos determinar. Pero efectuemos primero una descomposicion preliminar de -Y, como

304

TRANSFORMACIONES LINEALES - C ~ D6 .

hicimos en el teorema 6.n, de acuerdo con la descomposicion del polinomio minimo de T como product0 de polinomios irreducibles. Sea el polinomio minimo p ( x ) de T sobre F , p ( x ) = q , ( x ) " ... q,(x)'* donde 10s q i ( x ) son polinomios irreducibles distintos en F [ x ] y donde cada ei > 0; entonces, como vimos en el teorema 6.n, V = V , @ V,@ ...@ V, donde cada Vi es invariante bajo T y donde el polinomio minimo de T sobre Vi es q,(x)". Para resolver la naturaleza de un subm6dulo ciclico para un Tarbitrario vemos, por esta discusion. que es suficiente establecerla para un Tcuyo polinomio minimo sea una potencia de uno irreducible. Probamos el

LEMA6.1 3. Supongamos que T , en A , V ) , tiene como polinomio minimo ( sobre F el polinomio p ( x ) = y o y x ... yr- x r - xr. Supongamos, ademas, que V como mddulo (de acuerdo con lo antes descrito). es un mddulo ciclico (es decir, es ciclico respecto a T ) . Entonces hay una base de V sobre F tat que, en esta base, la matriz de T es

+ , +

+ ,

'+

Prueba. Como V es ciclico respecto a T , existe un vector r en V tal que todo elemento w en Ves de la forma w = 13f(T) para alglin,f(x) en F [ x ] . Ahora bien, si para algun polinomio s ( x ) en F [ x ] , v s ( T ) = 0,entonces ) para cualquier w en V, w s ( T ) = ( ~ l f ' ( T ) ) s ( T= l l s ( T ) j ' ( T ) = 0;luego s ( T ) aniquila a todo V y, por tan@, s ( T ) = 0 Pero entonces p ( x ) l s ( x ) ya que . p ( x ) es el polinomio minimo de T . Esta observacion implica de inmediato que v, vT, c T * , ..., pTr- son linealmente independientes sobre F, pues si asi no fuera, entonces a, r + a , P T + . .. + a r - , v T ' - = 0 con a,, .. ., aren F. Pero entonces u(a, + a , T + . . . + a r - , T r - ') = 0,y de aqui, seglin la anterior discusion, p(x)l (*,+a, x + . .. + a r - , x r - I ) , lo que es imposible ya que p ( x ) es de grado r salvo si a, = a , = .. . = a,-, = 0. Como T' = - yo- y , T - ... I- y r - , T r - I , es inmediato que Tr+', para k >, 0,es una combinacion lineal de I, T , ..., T r - ' y, por tanto, que f ( T ) para cualquier f ( x ) F [ x ] , es una combinacion lineal de I, T , ..., T r ~ sobre F. Como cualquier w en V es de la forma w = vf(T) tenemos que w es una combinacion lineal de v, 17T, . .., v T r - I . Hemos probado, en 10s liltimos dos parrafos, que 10s elementos u, vT, ..., ' forman una base de V sobre F. En esta base, como puede verificarse de inmediato, la matriz de T es exactamente como afirmibamos.

'

,

'

z l r -

5 7.

FORMAS CANONICAS: FORMA CANONICA RACIONAL

306

D E F I N I C ISi Nf(x) = yo+ y1 X + ~ . entonces la matriz r x r

... +y,-,

xr-' +xr

esth en F[x]

se llama matriz compaiiera de f (x). La representamos por CCf(x)). N6tese que el lema 6.13 dice que si V es ciclico respecto a T y si el polinomio minimo de T en F[x] es p(x), entonces para alguna base de V la matriz de T es C(p(x)). Nbtese, ademis que la rnatriz C(f(x)), para cualquier polinomio mdnico f (x) en F[x], satisface f (x) y tiene a f (x) como su polinomio minimo. (Vbase el problema 4 a1 final de esta seccidn; vbase tarnbibn el problema 29 a1 final de la secci6n 1.) Probamos ahora un importantisimo teorema. TEOREMA Si T en A,(V) tiene un polinomio minimo p(x)= q(x)', 6.~. donde q(x) es un polinomio mdnico irreducible en F[x], entonces puede encontrarse una base de V sobre Fen que la matriz de T sea de la forma

dondee = el > e,

... > e,.

Prueba. Puesto que V como modulo sobre F[x] esta finitarnente generado, y como F[x] es euclidiano, podemos descomponer V como V = V, @ ... @ V, donde.10~Vi son m6dulos ciclicos. Los Vi son, entonces, invariantes bajo T; si Ti es la transformaci6n lineal inducida por T sobre V,, su polinomio minimo debe ser un divisor de p(x) = q(x)', luego de la forma q ( ~ ) Podemos reordenar 10s espacios de forma que el 2 e, 5 ... 2 e,. ~. Ahora bien, q(T)" aniquila a cada Vi, de donde suprime a V, de donde q(T)"= 0 Luego el > e; como el es claramente cuando mas igual a e, . tenemos que el = e. Se&n el lema 6.13, como cada Vi es ciclico respecto a T podemos encontrar una base tal que la matriz de la transformaci6n lineal de T, sobre V,

306

TRANSFORMACIONES LINEALES - Cap. 6

es C(q(x)".) Asi pues, segim el teorema 6.n, podemos encontrar una base d e V tal que la matriz de Ten esta base es

COROLARIO. en A F ( V )tiene el polinomio minimo p(x) = q , (x)" ... Si T qk(x)Iksobre F, donde q , ( x ) ,. .., q k ( x )son polinomios irreducibles distintos en F[x],entonces puede enconrrarse una base de V en la que la marriz de T sea de laforma

donde cada

Prueba. Por el teorema 6.1, V puede ser descompuesto en la suma directa V = V ,$ ... $ V,, donde cada Vi es invariante bajo T y donde el polinomio rninimo de T i , la transforrnacion lineal inducida por T sobre V i , es qi(x)". Usando el lema 6.7 y el teorema anterior, obtenemos el corolario. Si el grado de qi(x) es d,, notese que la suma de todos 10s dieij es n, la dimension de V sobre F. D E F I N I C ILaNmatriz de T en el enunciado del corolario anterior se ~ . llama forma candnica racional de T.

..., qk(x)"'"

D E F I N I C ILOS.polinomios q,(x)"', q , (e)'12,..., q, (x)'~",..,q,(x)'*', ~N . en F[x]se llaman divisores elementales de T. iUna definition mhs!

5 7.

FORMAS CANONICAS: FORMA CANONICA RACIONAL

307

DEFINICION. Si dimF(V ) = n, entonces el polinomio caracteristico de T, pT(x),es el producto de sus divisores elementales.
Podremos identificar el polinomio caracteristico que acabamos de definir con otro polinomio que construiremosexplicitamente en la secci6n 9. El polinomio caracteristicode Tes un polinomio de grado n que se encuentra en F[x]. Tiene muchas propiedades importantes, una de las cuales es la contenida en la siguiente

OBSERVAC~ON. transformacidn lineal T e A F ( V ) satisface a su Toda polinomio caracteristico. Toda raiz caracteristica de T es una raiz de pT(x).
Nota 1. La primera parte de la anterior observacion es el enunciado de un teorema muy famoso, el reorema de Cayley-Hamilton. Pero llamarlo asi en la forma en que lo hemos expuesto resultaria un poco abusivo. El meollo del teorema de Cayley-Hamilton es el hecho de que T satisface pT(x) cuando a pT(x) se le da una forma concreta muy particular, fhcilmente construible partiendo de T. Pero incluso en la forma en que aparece, la observacion tiene un contenido bastante interesante, pues como el polinomio caracteristico es un polinomio de grado n, hemos probado que todo elemento de A F ( V )satisface un polinomio de grado n que se encuentra en F[x].Hasta ahora, solo habiamos probado esto (en el teorema 6. k) para transformaciones lineales que tenian todas sus raices caracteristicas en F. Nota 2. Tal como esta formulada, la segunda parte no dice nada, pues siempre que T satisface un polinomio, entonces toda raiz caracteristica de T satisface ese mismo polinomio; asi pues, p T ( x ) no seria nada especial si lo que se enuncia en el teorema fuera todo lo que es valido en 61. Pero la historia real es la siguiente: Toda raiz caracteristica de T es una raiz & pT(x), y reciprocamente, toda raiz de pT(x) es una raiz caracteristica de T ; ademas, la multiplicidad de cualquier raiz de pT(x),como una raiz del polinomio, es igual a su multiplicidad como raiz caructeristica de T. Podriamos probar lo dicho ahora, pero diferimos la prueba hasta mhs tarde, cuando seamos capaces de hacerla de una forma mas natural. Prueba de la observacrdn. Solamente tenemos que demostrar que T satisface a pT(x), pero esto es casi trivial. Como pT(x) es el producto de ql(x)CI1, 1 ( ~ ) C ...,,qk(x)ckl, y como e l l = e , , e l l = e l , ...,ekl = e,, q 12 ..., pT(x) es divisible por p(x) = q , (e)"'. . . q,(x)'*, el polinomio minimo de T. Como p ( T ) = 0 se sigue que p T ( T ) = 0. Hemos llamado a1 conjunto de 10s polinomios que aparecen en la forma racional can6nica de T 10s divisores elementales de T. Seria muy conveniente que Cstos determinasen una semejanza en A F ( V ) , pues entonces las clases de semejanza en A F ( V ) estarian en una correspondencia biyejctiva con

308

TRANSFORMACIONES LINEALES

- Cap. 6

conjuntos de polinomios en F[x].Nos proponemos hacer esto, per0 primer0 establecemos un resultado que implica que dos transformaciones lineales tienen 10s mismos divisores elementales.
TEOREMA Sean V y W dos espacios vectoriales sobre F y supongamos 6.R. que $ es un isomorfismo de. espacios uectoriales de V sobre W . Supongamos que S E AF( V) y T E AF ( W )son tales que para cualquier U E V ( U S $ = , ) (r$) T.) Entonces S y T tienen 10s mismos divisores elementales.

$ Prueba. Comenzamos con un simple chlculo. Si U E V, entonces (vS2) = ((cS)S ) $ = ( ( r S ) $ )T = ((c$) T )T = (u$) T 2 . ES claro que continuando anilogo proceso tendremos que (vSm)$= (v$)Tm para cualquier entero m k 0, de donde para cualquier polinomio f ( x ) ~ F [ xy]para cualquier V E V , ( ~ : f ( S ) )= (v*lf( T). Si f ( S ) = 0, entonces ( v $ ) f ( T ) = 0 para cualquier U E V y coma $ transforma V sobre W tendriamos que W f ( T ) = (0). a consecuencia de lo cual f ( T ) = 0. Reciprocamente, si g ( x )F[x]es tal que g ( T ) = 0, entonces ~ , para cualquier r e V (l.g(S)$ = 0 y como JI es un isomorfismo, esto nos dice que [g(S) ='O. Esto desde luego implica que g ( S ) = 0. Asi pues, S y T satisfacen el mismo conjunto de polinomios en F[x], donde deben tener el de mismo polinomio minimo

*

donde q , (x), ...,q k ( x ) polinomios irreducibles distintos en F[x]. son Si U es un subespacio de V invariante bajo S, entonces U$ es un subespacio de W invariante bajo T , pues (U$)T = (US)$ c U$, Como U y U$ son isomorfos, el polinomio minimo de S , , la transformation lineal inducida por S sobre U es la misma, de acuerdo con las observaciones anteriores que el polinomio minimo de T I ,la transformacidn lineal inducida spbre U$ por T. Ahora bien, como el polinomio minimo para S sobre V es p(x) = q , (x)" ... q , ( ~ ) ' ~ , como hemos visto en el teorema 6.q y su corolario, podemos tomar como el primer divisor elemental de S a1 polinomio 9 , (x)C1 y podemos encontrar un subespacio de V, de V que es invariante bajo S tal que :
I ) V = V, @ M donde M es invariante bajo S ; 2) 10s unicos divisores elementales de S , , la transformaci6n lineal inducida sobre V, por S, esq, (x)C1 ; 3) 10s otros divisores elementales de S son 10s de la transformaci6n lineal S2 inducida por S sobre M.

Combinamos ahora las afirmaciones hechas anteriormente y afirmamos:
1 ) W = W ,8N donde W , = V, $ y N = M$ son invariantes bajo T.

5 7.

FORMAS CANONICAS: FORMA CANONICA RACIONAL

309

2) El unico divisor elemental de T,, la transformacion lineal inducida por T sobre W, es q, (x)" (que es un dirisor elemental de T ya que el polinomio minimo de T es p(x) = q, (x)" ... q,(x)'"). 3) Los otros divisores elementales de T son 10s de la transformaci6n lineal T, inducida por T sobre N.

-

Como N = M$, M y N son espacios vectoriales isomorfos sobre F bajo el isomorfismo $, inducido por $. Ademas, si U E M entonces (US,)$, = (US)$ = (u$) T = (u$,) T,, de donde S, y T, estan en la misma relacion con respecto a $ que S y T estaban respecto a $. Por induccion sobre la , dimension (o repitiendo el argumento) S, y T, tienen 10s mismos divisores elementales. Pero como 10s divisores elementales de S son simplemente q1(x)'' y 10s de S, mientras que 10s de T son simplemente q, (x)" y 10s de T,, S y T deben tener 10s mismos divisores elementales, probando con ello el teorema. El teorema 6.q y su corolario nos dieron la forma canonica racional y 10s divisores elementales. Nos gustaria apurar un poco mas la situacion y ser capaces de afirmar alguna propiedad de unicidad. Es lo que hacemos en el TEOREMA LOSelementos S y T en A,( Y) ion semejantes (en A , V)) 6.s. ( si y sblo si tienen 10s misnlos dirisores elementales. Prueba. Probar esto es sencillo en una direccibn, pues supongamos que S y T tienen 10s mismos divisores elementales. Entonces hay dos bases de Y sobre F tales que la matriz de Sen la primera base es igual a la matriz de T en la segunda (y cada una de ellas igual a la matriz de forma racional canonica). Pero como ya hemos visto varias veces antes, esto implica que S y T son semejantes. Vamos ahora a ir en la otra direccion. Tambien aqui el argumento se asemeja estrechamente al usado en la seccion 5 en la prueba del teorema 6.m. Como alli fuimos muy cuidadosos con todos 10s detalles, creemos que aqui podemos permitirnos ser un poco mas esquemkicos. Observemos primero que en vista del teorema 6.n, podemos limitarnos al caso de la transformacion lineal cuyo polinomio minimo es una potencia de un polinomio irreducible. Asi pues, sin perdida de generalidad podemos suponer que el polinomio minimo de T es q(x)' donde q(x) es irreducible en F [ x ]y de grado d La forma canonica racional nos dice que podemos descomponer Yen la forma V = V , @ ...@ Vr donde 10s subespacios V i son invariantes bajo T y donde la transformacion lineal inducida por 7 sobre V i tiene como matriz C(q(xYi),la matriz compafiera de q(.u)". Suponemos que lo que realmente estamos intentando probar es lo siguiente: si V = U, @U,@ @Us donde 10s Uj son invariantes bajo T y donde la transformacion lined inducida

...

310

TRANSFORMACIONES LINEALES

- Cap. 6

por T sobre Uj tiene como matriz C(q(x)/j), f l 2 f22 .. . 2 1;. entonces r = s y e l = f,,el = ,/;, ..,,e, = f,. (Pruebese que la demostracion de esto es equivalente a la demostracion del teorema.) Supongamos entonces que tenemos las dos descomposiciones arriba descritas, V = V, $ . .. $ V, y V = U I Q . .. @U, y que algun ei ff J;. Entonces hay un primer entero m tal que em # ,fm mientras que e, = f,, .. ., em- = f m - , . Podemos suponer que em>.fm. Ahora bien, g(T)Im suprime Urn,Urn+, . .., U ,de donde , ,

,

Pero se puede demostrar que la dimensi6n de uiq(T)/" para i , < m es d(J.- fm) (iprudbese!), de donde

~ ~ , Por otra parte, V ~ ( T3) V, q(T)lm@ . . $ . . . @ V , ~ ( T ) ~ " 'y como Viq(T)fm tiene dimension d(ei- fm) para i < m, tenemos que

Como e, = f , , ..., ern-, = f m - , y em>fm esto contradice la igualdad antes probada. Hemos, pues, probado el teorema.

COROLARIO Supongarnos que las dos matrices A y Ben Fnson semejantes 1. en Kn donde K es una extensia'n de F. Entonces A y B son ya semejantes en Fn.
Prueba. Supongamos que A, BEF, son tales que B = C - 'AC con CEK,. Consideramos a Kn como si actuara sobre K'"', el espacio vectorial de n-tuples sobre K. Asi pues, F'"' esth contenido en K'"' y aunque es un espacio vectorial sobre F no es un espacio vectorial sobre K. La imagen de F'"', en K'"', bajo C no necesariamente incidira de nueclo en F'"' per0 en cualquier caso F'"'C es un subconjunto de K'"' que es un espacio cectorial sobre F (pruebese). Sea V el espacio vectorial F'"' sobre F, W el espacio V (V) vectorial F'"'C sobre F y para ~ E sea r$ = LC.Ahora bien, A E A ~ y &A,( W ) y para cualquier V, (rA)G = rAC = rCB = ( r $ ) B, de donde las condiciones del teorema 6.r se satisfacen. Asi pues, A y B tienen 10s mismos divisores elementales; de acuerdo con el teorema 6.s, A y B deben ser semejantes en F,. Una palabra de advertencia: el corolario no afirma que si A, BEF, son tales que B = C - ' AC son CEKn entonces C debe necesariamente estar en Fn;esto es falso. Lo que afirma simplemente es que si A, BEF, son tales que B = C - 'AC con CEK,, entonces existe un DEFn(posiblemente diferente a C) tal que B = D- 'AD.

5 7.

FORMAS

CANONICAS: FORMA CANONICA RACIONAL

'

311

Problemas
1. Verifiquese que V se hace un F[x] modulo bajo la definition dada.

-

2. En la prueba del teorema 6.s proporcionense demostraciones completas de todos 10s puntos en que se sefiala (prukbese).

*3. a) PruCbese que toda raiz del polinomio caracteristico de T es una raiz caracteristica de T. b) PruCbese que la multiplicidad de cualquier raiz de p,(x) es igual a su multiplicidad como una raiz caracteristica de T.
4. Pruebese que para f(x)€F[x], C(f(x)) satisface f(x) y tiene a f(x) como su polinomio minimo. iCual es su polinomio caracteristico?

5. Si F es el campo de 10s numeros racionales, encukntrense todas las formas canonicas racionales posiblzs y todos 10s divisores elementales para: a) Las matrices 6 x 6 en F que tienen (x- 1) (x2+ 1)' como poli, nomio minimo. b) Las matrices 15 x 15 en F,, que tienen (x2+ X + 1)' (x3+ 2)' como polinomio minimo. c) Las matrices 10 x 10 en F,, 'que tienen (x2+ 1)' (x3+ 1) como polinomio minimo.
6. a) Si K es una extension de F y si A esta en K,, pruCbese que A puede escribirse como A = 1 , A , + ... + I , A , , donde A , , .., A, estiin en F, y donde A,, ..., 1 , estan en K y son linealmente independientes sobre F. b) Con igual notacion que en la parte (a), pruCbese que si BEF, es tal que AB = 0 entonces A , B = A , B = ... = A,B = 0. c) Si C en F, conmuta con A pruCbese que C conmuta con cada uno de 10s A , , A , , ..., A,.

.

*7,. Si A , , ..., A, esthn en F, y son tales que para ciertos I , , ..., I , en K , una extension de F, 1 , A , + ... + I k A k es invertible en K,, prutbese que si F tiene un nzimero injinito de elemenros podemos encontrar a , , ..., a, en F tales que a , A , + ... + a , A, es invertible en F,,.

*8. Si F es un campojinito, pruCbese que el resultado del problema 7 es falso.

*9: Usando 10s resultados de 10s problemas 6 (a) y 7, pruCbese que si F tiene un numero infinito de elementos entonces siempre que A, BEF, son semejantes en K,,, donde K es una extension de F, entonces son semejantes en F,,. (Esto nos da una prueba, independiente de las formas canonicas del corolario 1 a1 teorema 6.s en el caso particular en que F es un campo infinito.)

31 2

TRANSFORMACIONES LINEALES

- Cap. 6

10. Usando chlculos con matrices (pero siguiendo 10s lineamientos marcados en el problema 9), pruebese que si F es el campo de 10s numeros reales y K el de 10s nGmeros complejos, entonces dos elementos en F, que son semejantes en K, son ya semejantes en F,.

8. TRAZA Y TRANSPUESTA
Desputs de la dificultosa marcha en las liltimas secciones, la falta de complicaciones del material sobre el que ahora vamos a tratar va a llegarnos como un agiadable respiro. Sea F un 'camp0 y A una matriz en Fn. D E F I N I C I ~ Nfraza de A es la suma de 10s elementos de la diagonal La . principal de A. Representaremos a la traza de A por tr A; si A
n

=

(zij), entonces

Las propiedades fundamentales de la funcion traza estan contenidas en el
. LEMA 6.14. Para A, BEFnJ. ;E F.

I ) tr (;.A) = i. tr A; 2) tr (A+B) = tr A+tr B; 3) tr (AB) = tr (BA).
Prrreba. Establecer ( I ) y (2) (que aseguran que la traza es una funcional lineal en Fn)es sencillo y se deja como' ejercicio para el lector. Solamente presentamos la prueba de la parte (3) del lema. Si A =
(2,)

y B=

(fiij). entonces ne = (yij) donde
k= 1

'iij =

k= 1

aspkj Y

B = (lrij) donde pi, = A Asi pues. (AB) = X y i i =
i

x
n

Bikzkj.

x
i

; si intercambiamos el orden de

sumaci6n en la ultima suma, tenemos

5 8.

TRAZA Y TRANSPUESTA

313

Prueba. Sea B = CA-I; entonces tr (ACA-I) tr (CA-'A) = tr C.

=

tr (AB) = tr (BA)

=

Este corolario es importante por dos razones; primere, nos permitira definir la traza de una transformacidn lineal arbitraria; segundo, nos permitiri encontrar una expresi6n alternativa para la traza de A.

DEFINICI~N. Si TEA(V) entonces tr T, la tram de T, es la traza de m , (T) donde m, (T) es la matriz de Ten una base cualquiera de V.
Afirmamos que la definici6n tiene sentido y depende solamente de T y no de cual sea la base de V que se emplee. En efecto, si m , ( T ) y m,(T) son matrices semejantes, entonces, segun el corolario al lema 6.14, ambas tienen la misma traza.

LEMA6.1 5. Si TEA ( V), er1tonce.v tr T es la slrrna de las raices caracteri ticas de T (usando-cada raiz caracteristica tantas 1-eces como su niultiplicid d ) .

d

Prueha.' Podemos suponer que T es una matriz en F, ; si K es el campo de descomposici6n para el polinomio mininio de Tsobre F. entonces en K,, por el teorema 6.p, T puede llevarse a su forma de Jordan, J. J es una matriz sobre cuya diagonal aparecen las raices caracteristicas de T, cada raiz que aparece tantas veces como unidades tiene su multiplicidad. Asi pues, tr J = suma de las raices caracteristicas de T; per0 como J es de la forma ATA-I, tr J = tr T, y esto prueba el lema.

Si T es nilpotente, entonces todas sus raices caracteristicas son 0, de donde, de acuerdo con el lema 6.15, tr T = 0 Pero si T es nilpotente, . entonces tambiCn lo son T2, T3, .. luego tr Ti = 0 para todo i 2 1. jY quC podemos decir en la otra direction, es decir, si tr Ti = 0, para i = 1, 2, ...?, jse sigue de ello que T es nilpotente? Con esta generalidad la contestaci6n es no, pues si F es un campo de caracteristica 2, entonces la matriz unidad

..

en F2tiene traza 0 (pues I I = 0)al igual que todas sus potencias. per0 es claro que la matriz unidad no es nilpotente. Pero si restringimos la caracteristica de F a 0,el resultado es verdaderamente cierto.

+

LEMA6.16. Si F es un campo de caracteristica 0 y si TcAF(V ) es fa1 que tr T'= 0 para totlo i 2 I . entonces T es nilpotente.

314

TRANSFORMACIONES LINEALES - Cap. 6

Prueba. Como TEA,(V), T satisface alglin polinomio minimo p(x) = x"'+a,xm-I+ ... + a r n ;comoTm+z,Tm-I+... +a,-, T+z, = 0, tomando trazas de ambos lados, tenemos
tr T m + a , tr T m - ' + ... +a,-, tr T+trz, = 0. Pero por hipotesis, tr Ti = 0 para i 2 I, luego tenemos tr a, = 0; si dim V = n, tr a, = na,, de donde na, = 0. Pero la caracteristica de F es 0; luego n # 0, de donde se sigue que a, = 0. Como el termino constante del polinomio minimo de Tes 0, por el teorema 6.b Tes singular y por tanto 0 es una raiz caracteristica de T. Podemos considerar a T como una matriz en F, y, por tanto, tambikn como una matriz en K,, donde Kes una extension de Fque, a su vez, contiene todas las raices caracceristicas de T. En K,, seglin el teorema 6.j, podemos poner T en forma triangular, y como 0 es una raiz caracteristica de T, podemos realmente llevarla a la forma

donde

es una matriz (n- I) x (n- I) (10s * indican partes en cuyas entradas no estamos interesados). Ahora

de donde 0 = tr Tk = tr TZk.Luego T , es una matriz (n - I ) x (n- I ) con la propiedad de que tr TZk= 0 para todo k 2 1. 0 bien usando induccion sobre n, o repitiendo el argument0 sobre T, que usamos para T, tenemos, como a,, . . ., a, son las raices caracteristicas de T,, que a, = .,. = an = 0. Luego cuando T se pone en forma triangular todas sus entradas en la diagonal principal son 0, lo que implica que T sea nilpotente (prukbese). Este lema, aunque pueda parecer particular, nos servirh en una gran cantidad de casos. Hacemos uso inmediato de CI para probar un resultado usualmente conocido como el lema de Jacobson.

5 8. TRAZA Y TRANSPUESTA

315

LEMA 6.17. Si F es de caracteristica 0 y si S y T, de A,(V), son tales que ST- T S conmuta con S, entonces ST- TS es nilpotente.
Prueba. Para cualquier k >, I, calculamos (ST-TS)'. Ahora bien, (ST- TS)' = (ST- TS)'- (ST- T S ) = (ST- TS)k- ST-(ST- TS)'- TS. Como ST- TS conmuta con S, el termino (ST- TS)k- ST puede escribirse en la forma S((ST- TSlk- I ) T. Si hacemos B = (ST- TS)k- T vemos que (ST- TS)k = SB- BS; de donde tr ((ST- T S ) k )= tr (SB- BS) = tr (SB)tr (BS) = 0 seglin el lema 6.14. El lema anterior nos dice ahora que ST- T S

.

'

'

'

'

debe ser nilpotente. La traza nos provee de una funcional lineal sobre Fn (y, por tanto, sobre A,( V)) en F, extremadamente litil. lntroducimos ahora una importante transformaci6n de Fnen si mismo. DEFINICION.A = ( a i j ) €Fn,entonces la transpuesta de A, escrita como Si A', es la matriz A' = ( y i j ) donde y i j = a j i para todas las i y j . La transpuesta de A es la matriz que se obtiene intercambiahdo 10s renglones de A con las columnas de A. Las propiedades formales basicas de la transpuesta, estan contenidas en LEMA 6.18. Para cualesquiera A, BEF, , 1 ) (A')' = A ; 2) ( A + B)' = A'+ B ' ; 3 ) (AB)' = B'A'.
Prueba. Laspruebas de las partes (I) y (2) son muy sencillas y se dejan como ejercicio para el lector; nos contentamos nosotros con la prueba de la parte (3). Supongamos que A = ( a i j ) y B = ( B i j ) ; entonces AB = (Aij) donde

Por tanto, por definition, (AB)' = ( p i j ) , donde p i j = ,Iji = Por otra parte, A' = ( y i j ) donde y i j = a j i y B' = ( t i j ) donde de donde el elemento (i, j ) de B'A' es

1 ajkPki.
k=l

n

t i j =p j i ,

1 t i k y k j = 1 Pkia
k= 1 k= l

n

n

jk

=

1 a,ikPki=
k= I

n

p i j . Es decir, (AB)' = B'A', con lo que hemos verificado la parte (3)del lema.

En la parte (3), si nos fijamos en el caso particular en que A; = B, obtenemos ( A 2 ) ' = (A')'. Continuando obtenemos (Ak)' = (A')k para todo entero positivo k. Cuando A es invertible, entonces ( A - I ) ' = (A_')- l .

316

TRANSFORMACIONES LINEALES

- Cap. 6

Existe otra propiedad de la transpuesta, a sab_er, si ;.EF entonces (;.A)' = AA' para toda AEF,,. Ahora bien, si AEF, satisface un polinomio r O A m + a, A m - ' ... +rm 0, obtenemos ( r o A m +... +rm)' = 0' = 0. Calculando = explicitamente ( r oAm ... r,)' usando las propiedades de la transpuesta, obtenemos ao(A ')"+a, (A1)"-' ... +rm 0, es decir, A' satisface = cualquier polinomio sobre F al que satisfaga A. Como A = (A')', por el mismo razonamiento, A satisface cualquier polinomio sobre F a que 1 satisfaga A'. En particular, A y A' tiene el mismo polinomio minimo sobre F y, por tanto, tienen las misr?ias raices caracteristicas. Puede demostrarse que todas las raices tienen la misma multiplicidad en A que en A'. Esto es evidente una vez que se establece que A y A' son realmente semejantes (vCase el problema 14).

+

+

+

+

D E F I N I C ILaN . ~ matriz A se dice que es una matriz sir~iPtricasi A'

= A.

DEFINIC~~N. La matriz A se dice que es una matriz antisir?i&trica si
A' = -A.
0

Cuando la caracteristica de F es 2, como I = - I. no podemos distinguir entre matrices simetricas y antisimetricas. Para lo q~re resta de esta seccidn, conrenkios de uria rez por todas que la caracteristica de F es dijkrente de 2. Tenemos procedimientos muy sencillos para producir matrices simetricas y matrices antisimetricas. Por ejemplo, si A es una matriz arbitraria, entonces A + A' es simttrica y A - A ' es antisimetrica. Si pensamos que vemos que toda matriz resulta ser la suma de A = f(A+A')+f(A-A'), una matriz simdtrica y otra antisimetrica. Esta descomposici6n es ~inica (vtase el problema 19). Otro metodo de producir matrices simttricas es el que sigue: s i A es una matriz arbitraria, entonces tanto AA' como A'A son simttricas. (N6tese que no tienen porqut ser iguales.) Esth en la naturaleza de todo matemhtico que, una vez que s ha dado e un concepto interesante surgido de una situaci6n particular, ha de intentar despojarlo de las particularidades de su origen y emplear las propiedades claves del concepto como medio de hacerlo mhs abstracto. Procedemos a seguir tal camino con la transpuesta. Tomamos, como propiedades formales de mayor interes, aquellas que aparecen en el enunciado del lema 6.18 que afirma que sobre F, la transpuesta define un antiautomorfismo de period0 2. , Nos lleva esto a la siguiente

D E F I N ~ CUna N . ~ ~ aplicacion de F, en F se llama adjunta sobre F, si , , ,
I ) (A*)* = A; 3) (A+B)* = A*+B*; 3) (AB)* = B*A*; para cualesquiera A, BEF . n

18.

TRAZA Y TRANSPUESTA

317

Notese en que no insistimos en que ().A)* = ;.A* para I E En realidad, F. en algunas de las adjuntas mas interesantes este no es el caso. Pasamos a discutir una tal. Sea F el campo de 10s numeros complejos; para A = ( r i j ) € sea A* = y i j ) donde y i j = ? i j i , el conjugado complejo de scij. En F,,, este caso * suele llanlarse adjunta liermitiana sobre F,,. Dentro de unas pocas secciones haremos u n estudio bastante extensivo de las matrices bajo la adjunta hermitiana. Todo lo que hemos dicho acerca de la transpuesta como, por ejemplo, 10s conceptos de simetria y antisimetria, puede ser aplicado a las adjuntas generales, y hablamos de elementos simetricos bajo * (es decir. de aquellos A tales que A* = A), de elementos antisimetricos bajo *, etc. En 10s ejercicios del final de esta seccion, hay muchos ejemplos y problemas que se refieren a adjuntas en general. Pero ahora, como diversion, juguemos un poco con la adjunta hermitiana. No llamamos a nada de lo que obtenemos un teorema, no porque no se. merezcan tal titulo, sino mas bien porque 10s volveremos a hacer mas tarde (y 10s designaremos entonces propiamente) partiendo de un punto de vista central. Asi pues, supongamos que F es el campo de 10s numeros complejos y que la adjunta * sobre F,, es la adjunta hermitiana. La matriz A se llama hermitiana si A" = A. Primera observacihn: si A # OEF,, entonces tr(AA*)>O. Segunda observacion : Como una consecuencia de la primera observacion, si A, , ..., A,EF,, y si A l A l * + A 2 A 2 * + ... +A,A,* = 0, entonces A, = A, = ... A, = 0. Tercera observacion: Si 1. es una matriz escalar, entonces I* = A. el conjugado complejo de 1.. Supongamos que AE F,, es hermitiana y que el numero complejo %+Pi. donde sc y p son reales e i 2 = - I , es una raiz caracteristica de A. Tenemos, pues, que A - (sc + Pi) no es invertible; pero entonces (A -(sc +Pi)) (A (%-Pi)) = (A -2)' + P 2 no es invertible. Pero si una matriz es singular debe eliminar una matriz distinta de cero (teorema 6.b, corolario 2). Debe P 0. haber, por tanto, una matriz C # 0 tal que C ( ( A - C X ) ~ + = ~ ) Multiplicamos esto a la derecha por C* y obtenemos:
C(A - r)' C*

+ P2 CC* = 0.

Sea D = C(A - 9 ) y E = PC. Como A* = Ayr es real, C(A - r ) ' C * = D D * ; como es real, P2CC* = EE*. Luego la ecuacion ( I ) toma la forma D D * + EE* = 0 ; por las observaciones antes hechas esto implica D = 0 y E = 0. Solamente vamos a usar la relacion E = 0. Como 0 = E = PC y como C # 0, debemos tener P = 0. ;Qut es exactamente lo que hemos probado? En realidad, hemos probado el bello e importanre resultado de que si Lrn nlitnero cotnplqjo . es una raiz caracteristica de una matriz liermitiana. ; entonces . debe ser real. Aprovechando las propiedades del campo de 10s ;

318

TRANSFORMACIONES LINEALES

- Cap. 6

n~imeros complejos se puede, realmente, reformular esto como sigue:
Las raices caracteristicas de una matriz hermitiana son, todas, reales. Continuamos con esta vena un poco mAs adelante. Para A E F , , sea B = A A * ; B es una matriz hermitiana. Si el nlimero real a es una raiz caracteristica de B, ipuede a ser un numero real arbitrario o debe estar

restringido de algun modo? Afirmamos que a debe ser no negativo. Pues si a fuera negativo entonces a = - P 2 , donde P es un numero real. Pero entonces B-a = B+P' = AA*+P' no es invertible, de donde hay un C # 0 tat que C ( A A * + P 2 ) = 0. Multiplicando por C * a la derecha y razonando como anteriormente, tenemos p = 0, una contradiccion. Hemos demostrado que cualquier raiz caracteristica real de AA* debe ser no negativa. En realidad, lo de "real" en la anterior afirmacion es supeduo y podriamos decir: para cualquier A E F , todas las raices caracteristicas de AA* son no negativas.
Problemas

1. PruCbese que tr ( A + B ) = tr A +tr B y que para AEF, tr (AA) = A tr A. 2. a ) Usando un argument0 basado en la traza pruebese que si la caracteristica de F es 0 entonces es imposible encontrar A, BEF, tales que AB- BA = 1. 6 ) En la parte (a), pruebese que en realidad 1 - ( A B - BA) no puede ser nilpotente.
3. a ) Sea f una funcion definida sobre F,, con valores en F tales que:

1) f ( A + B ) = f ( A ) + f ( B ) , 2 ) f ( W = Af(A), 3 ) f ( A B ) = f(BA), para todo A, BEF,, y para todo AEF. Prutbese que hay un elemento a , ~ F t a lque f ( A ) = a, tr A para todo A en F,. 6 ) Si la caracteristica de F es 0 y si la f de la parte ( a ) satisface la propiedad adicional de que f ( l ) = n, pruibese que f ( A ) = tr A para todo A E F,,. Notese que el problema 3 caracteriza la funci6n "traza".
*4. a ) Si el campo F tiene un numero infinito de elementos, pruebese que todo elemento en F, puede escribirse como la suma de

matrices regulares. 6 ) Si F tiene un numero infinito de elementos y sif, definido sobre F, y con sus valores en F, satisface
1) f ( A + B ) = f ( A ) + f ( B ) , 2 ) f ( W = Af(A), 3) f ( B A B - = f(All

18. TRAZA Y TRANSPUESTA

31 9

para toda AEF,, I,E y todo elemento invertible Ben F,, pruebese F que f ( A ) = a, tr A para un ~ , E F determinado y toda AEF,.
5. Pruebese que el lema de Jacobson para elementos A, B en F, si n es menor que la caracteristica de F. 6. a) Si CEF,, definamos la aplicacion dc sobre F, por d,(X) = XC- CX para coda XEF,. Pruebese que dc(XY) = (dc(X))Y+ X(dc(Y)). (;No le recuerda esto al lector la derivada?) 6) Usando la parte (a), pruebese que si AB- BA conmuta con A, entonces para cualquier polinomio q ( x ) ~ F [ x q(A)B- Bq(A) = ], q'(A) (AB- BA), donde q l ( x )es la derivada de q(x). *7. osese la parte (6) del problema 6 para dar una prueba del lema de Jacobson. (Sugerencia: Sea p(x) el polinomio minimo para A y co~~siderese 0 = p(A)B - Bp(A).) 8. a) Si A es una matriz triangular, pruibese que las entradas sobre la diagonal de A son exactamente todas las raices caracteristicas de A. 6) Si A es triangular y 10s elementos en su diagonal principal son 0, pruibese que A es nilpotente.

-

9. Para cualquier A, BEF, y LEF prudbese que (A')' = A, (A + B)' =
A'+ B' y (IA)' = I A ' .

10. Si A es invertible, prutbese que ( A -

I)'

= (A')-

'.

11. Si A es antisimttrica, prukbese que 10s elementos en su diagonal principal son, todos, cero.

12. Si A y B son matrices simdtricas, prukbese que AB es simdtrica si y solo si AB = BA.
13. Proporci6nese un ejemplo de una A tal que AA' # A'A. *14. DemuCstrese que A y A' son semejantes. 15. Los elementos simktricos en F, forman un espacio vectorial; encuentrese su dimensi6n y exhibase una de sus bases. *16. Denotemos por S el conjunto de 10s elementos simitricos de F,; pruebese que el subanillo de F, generado por S es, todo, F,. *17. Si la caracteristica de F e s 0 y AEF, tiene traza 0 (tr A = 0) pruCbese que hay una CEF, tal que CAC- tiene solamente 0 en su diagonal principal.

'

*18. Si F es de caracteristica 0 y AEF, tiene traza 0, pruCbese que existen B, CEF, tales que A = BC-CB. (Sugerencia: Primer paso, sup6ngase, por el resultado del problema 17, que todos 10s elementos diagonales de A son 0.)

320

TRANSFORMACIONES LINEALES - Cap. 6

19. a) Si * es cualquier adjunto sobre F,, sea S = {A ~ g , A* = A) y : sea K = {AEF,(A* = -A). Prutbese que S + K = F,. b) Si AEF, y A = B + C donde BES y CEK, prutbese que B y C son dnicos y determlnense. 20. a) Si A, BES prutbese que A.B+ BAES. b) Si A, BEK prutbese que AB- BAEK. ~ c) Si A E S BEK pruCbese que A B - B A E S ~que AB+BAEK. 21. Si 4 es un automorfismo del campo F definimos la aplicacion @ sobre F por: si A = (alj) entonces @(A) = (4(aij)). Prutbese que , @(A+B) = @(A)+@(B) que @(AB) = @(A)@(B)para toda A, BEF,. y 22. Si * y @ definen dos adjuntos sobre F,, prutbese que la aplicacion $ : ~ - , ( ~ * ) @ ~ a r a t o d~ ~ ~ , , s a t i s f a c e $ ( ~ +$(A)+$(B)y$(AB) = o = B) $(A) $ (B) para cualesquiera A, BEF . , 23. Si * es un adjunto cualquiera sobre F y I es una matriz escalar en , F,, prutbese que I * debe tambitn ser una matriz escalar.
*24. Supongamos que conocemos el siguiente teorema: si $ es un auto, , morfismo de F (es decir, $ transforma F sobre tl mismo, de tal mod0 que $(A B) = $(A)+ $(B) y $(AB) = $(A)+ $(B)) tal que $(I) = I para toda matriz escalar I , entonces hay un elemento PEF, tal que $(A) = PA P- para todo A E F . Basindose en este teorema, prutbese que : si * es , un adjunto de F, tal que I* = I para toda matriz escalar I , entonces existe una matriz PEF, tal que A* = PA'P- para to& AEF,. Ademis, P- 'P' debe ser un escalar.

+

'

'

25. Si PEF es tal que P - P' # 0 es un escalar, prutbese que la aplicacion , definida por A* = PA'P-' es un adjunto sobre F,. *26. Basindose en el teorema acerca de automorfismo enunciado en el problema 24, prutbese lo siguiente: Si * es un adjunto sobre F hay un , automorfismo 4 de F de period0 2 y un elemento PEF, tales que A* = P(@(A))'P- para todo A EF, (para notacion, vtase el problema 21). Ademas, P, debe satisfacer P - @(P)' es un escalar.

'

'

'

, Los problemas 24 y 26 indican que una adjunta general sobre F no esti tan alejada de la transpuesta como se habria creldo a primera' vista.
**27. Si $ es un automorfismo de F, tal que $(I) = I para todos 10s escalares, prutbese que hay un PEF, tal que $(A) = PAP-' para todo AEF,.

* la adjunta hermitianu sobre F, .

En el resto de 10s problemas, F serd el campo de 10s nzimeros complejos y

5 9.

DETERMINANTES

321

28. Si AEF,, pruebese que hay matrices hermitianas 6nicas B y C tales queA = B + ~ c( i 2 = -1). 29. PruCbese que tr A A* > 0 si A # 0. 30. Por calculo direct0 de las entradas de las matrices, pruCbese que si A , A , * + ... + A , A,* = 0, entonces A , = A , = = A, = 0.

...

31. Si A estl en F, y s BAA* = 0, pruebese que BA = 0. i 32. Si AEF, es hermitiana y BA' = 0, pruCbese que BA = 0. *33. Si A E F , es hermitiana y si 1, p son dos raices caracteristicas reales distintas de A y si C ( A - 1 ) = 0 y D ( A -p) = 0, pruebese que C D = D C = 0. (Sugerencia: Considtrese primer0 el caso en que C y D son hermitianos y luego apliquese el resultado del problema 31).
*34. a ) Suponiendo que todas las raices caracteristicas de la matriz hermitiana A estan en el campo de 10s nirmeros complejos, combinando 10s resultados de 10s problemas 32 y 33, y el hecho

de que las raices deben, por tanto, ser todas reales, y el resultado del corolario del teorema 6.n, pruebese que A puede ser puesta en forma diagonal; es decir, que hay una matriz P tal que PAP-' es diagonal. b) En la parte ( a ) prutbese que P puede escogerse de forma que PP* = 1.
35. Sea V, = { A E F , AA* = 1). Prutbese que V, es un grupo bajo la multiplicaci6n de matrices. 36. Si A conmuta con AA* - A*A, pruCbese que AA* = A*A. 9 . DETERMINANTES

I

La traza define una funci6n importante y irtil del anillo de las matrices F, (y de A , ( V ) ) en F; sus propiedades se relacionan en su mayor parte con las propiedades aditivas de las matrices. lntroduciremos ahora la funcibn, airn mas importante, conocida como el determinante, que transforma F, en F. Sus propiedades eSan estrechamente ligadas con las propiedades multiplicativas de las matrices. Aparte de su efectividad como argument0 para probar teoremas, el determinante es valioso para usos "practicos". Dada una matriz T, podemos construir en ttrminos de determinantes explicitos un polinomio concreto cuyas raices son las raices caracteristicas de T; a~in mas, la multiplicidad de una raiz de este polinomio es igual a su multiplicidad com'o raiz caracteristica de T. En realidad, el polinomio caracteristico de T, definido anteriormente, puede exhibirse como este polinomio determinante explicitamentel

322

TRANSFORMACIONES LINEALES

- Cap. 6

Los determinantes juegan tambitn un papel fundamental en la solucion de sistemas de ecuaciones lineales. Por esta direction es por la que motivaremos su &finici6n. Hay muchas formas de desarrollar la teoria de determinantes, algunas muy elegantes y otras muy aburridas. Nosotros hemos escogido un camino distinto del de cualquiera de estos extremos, pero que para nosotros tiene la ventaja de que podemos alcanzar 10s resultados necesarios para nuestra discusi6n & las transformaciones lineales con la mayor rapidez posible. En lo que sigue, F sera un campo arbitrario, F, el anillo de las matrices n x n sobre F, y F'")el espacio vectorial & n-adas sobre F Por una matriz . entenderemos dcitamente un elemento en F,,.Como es usual, las letras griegas indicarhn elementos de F (salvo advertencia en contra). Consideremos el sistema de ecuaciones

Nos preguntamos: ibajo quC condiciones sobre las a i j podemos resolver para x , y x2 con 8, y 8, dadas cualesquiera? 0, lo que es equivalente, dada la matriz

jcuindo esta matriz transforma F") sobre si mismo? Procediendo como en secundaria, eliminamos x , entre las dos ecuaciones; el criterio de solubilidad resulta, entonces, ser que a , a,, - a 1 2 a 2 , # 0. Pasamos ahora a1 sistema de tres ecuaciones lineales

,

y de nuevo nos preguntamos sobre las condiciones de solubilidad para @, ,P2 y P3 arbitrarias. Eliminando x , entre estas dos a la vez, y luego x2 de las restantes dos ecuaciones, obtenemos como criterio de solubilidad

Usando estos dos como modelo (y con el presentimiento de que psto va a funcionar) daremos el gran salto hasta el caso general y definiremos el determinante de una matriz arbitraria n x n sobre F. Pero fijCmonos antes un poco en la notacion.

19.

DETERMINANTES

323

Sea Snel grupo simktrico de grado n ; considerarnos que 10s elernentos de Sn estan actuando sobre el conjunto {I, 2, ..., n ) . Para aeS,,, a(i) denotara la imagen de i bajo a. (Carnbiarnos la notacion escribiendo la perrnutacion corno si actuara a la izquierda en lugar de. corno previarnente, a la derecha. Lo hacernos para facilitar la escritura de 10s subindices.) El sirnbolo ( - I)" para oeSn indica + I si o es una perrnutacion par, y - 1 . si es una perrnutacion impar. D E F I N I C I ~ N A = (oij), entonces el determinante de A, lo que se Si . escribe: det A, es el elernento de F ( - I )Qz,,(l,a2,(,, .. a,,,,,
rcS,

.

Usarernos a veces la notacion a,, zn1 para el deterrninante de la rnatriz

..-

@ ~ n

...

ann

a,, Notese que el deterrninante de una rnatriz A es la surna (si prescindimos, por el mornento, de 10s signos) de todos 10s productos posibles de entradas de A en 10s que aparezcan uno y solo uno de cada rengl6n y colurnna. En general es una labor pesada desarrollar el deterrninante de una matrizfijtrnonos que hay nada menos que n! tkrrnino;; en la expansi6n-mas para al rnenos un tipo de matriz podernos hacer este desarrollo visualmente, a saber
LEMA 6.19. El determinante de una matriz triangular es el producto de sus entradas en la diagonal principal.
Prueba. Ser triangular irnplica dos posibilidades, a saber, o todos 10s elernentos por encima de la diagonal principal son 0, o todos 10s elementos por debajo de la diagonal principal son 0. Probarernos aqui el resultado para A de la forrna

324

TRANSFORMACIONES LINEALES

- Cap. 6

e indicaremos el pequefio cambio en el argument0 a emplear para la otra clase de matrices triangulares. Como a,, = 0 salvo si i = 1, en la expansion de det A j la unica contribuci6n no nula viene de aquellos tkrminos donde a(]) = 1. Asi pues, como a es una permutacion, a(2) # 1 ; pero si a(2) > 2, a,, = 0; luego, ,(, para obtener una contribucion no nula a det A, a(2) = 2. Continuando de esta forma, debemos tener a(i) = i para todo i, lo que es lo mismo que decir que en la expansion de det A el unico termino distinto de cero se presenta cuando a es el elemento identidad de S,. De aqui que la suma , , de 10s ri! tdrminos se reduce a exactamente uno solo, a,, a,, ...a , que es lo que el teorema afirma. Si A es una triangular inferior comenzamos con el extremo opuesto probando que para una contribuci6n distinta de cero a(n) = n, luego que a(n-1) = n-1,etc. Algunos casos especiales son de interks: 1) Si

es diagonal, det A = All2

... A,.

2) Si

la matriz identidad, entonces det A = 1
3) Si

la matriz escalar, entonces det A = An.

Obskrvese tambiin que si un rengldn o columna de una marriz esrli compuesta solo de ceros, entonces el determinante es 0, pues cada ttrmino del desarrollo del determinante serh un product0 en el que a1 menos uno de 10s factores es 0, de donde cada ttrmino es 0. Dada la matriz A = (a,,) en F podemos considerar su primera fila , L', = (z, l , a,,, .. ., al,) como un vector en F'"), y antilogamente para su segunda fila, u,, y las restantes. Podemos considerar entonces det A como una funcion de 10s n vectores o,, ..., u,. Muchos resultados se pueden enunciar mhs sucintamente en estos ttrmjnos, por lo que a menudo consideraremos det A = d(ul, ..., 0,); en este caso la notacibn siempre se entiende que implica que u1 es el primer rengldn, u, el segundo, y asl sucesivamente, de A. Una observaci6n miis: aunque estamos trabajando sobre un c a m p , podriamos sin la menor dificultad suponer que esthbamos trabajando sobre un anillo conmutativo, except0 en las obvias ocasiones en que dividimos por elementos. Esta observaci6n solamente vendrl a cuento cuando discutamos determinantes de matrices que tengan entradas polinomiales, lo que haremos dentro de poco en esta misma secci6n.

LEMA 6.20. S i AEF y y E F, entonces d(ul , ..., ui- l , yo,, v,+ ... 0,) = , yd(u1, ., ui- 1 , ui, U I + 1, .., 0,). N6tese que el lema dice que si todos 10s elementos de un rengl6n de A son multiplicados por un elemento fijo y de F, entonces el determinante de A queda tambitn multiplicado por y.
Prueba. Como solamente las entradas de la i-tsima fila han cambiado, el desarrollo de d(u, , ..., v,- , yo,, ui+ , ..., u,) es

,

,

como esto es igrral a y igual a yd(ul, ..., v,).

oes,

1 (-1)"

a,,(,,

...

... a,.(.),

es claro que es

Antes de probar el resultado, veamos quC es lo que dice y lo que no dice. No dice que det A+det B = det(A + B); esto es falso como puede verse en el ejemplo

donde det A = det B = 0 mientras que det (A+ B) = 1. Dice que si A y B son matrices iguales en 'todas partes salvo en el i-ksimo renglbn-entonces

326

TRANSFORMACIONES LINEALES - Cap. 6

la nueva matriz obtenida de A y B usando todos 10s renglones de A except0 el i-esima. y usando como i-esimo renglon la sumz de 10s i-esimos renglones de A y B, tiene un determinante igual a det A +det B. Si

entonces

si

illi

Prltrba. Si c., = ( z , , ,...,z,,) ..... r i = (pi,. ..., pi,,).entonces

=

(ziI,....!xi,,) I; .....

=

(z,, ,...,z,,) y

Las propiedades que aparecen en 10s lemas 6.19. 6.20 y 6.2 1. junto con las que aparecen en el pr6ximo lema, puede demostrarse que caracterizan a la funcion determinante (vkase el problema 13 al final de esta seccibn). Asi pues, la propiedad formal exhibida en el siguiente lema es basica en la teorla de determinantes.

LEMA6.22. Si dos renglones de A son igrrales (es decir. si or =us para r # s), entonces det A = 0.
Prueba. Sea A = (aij) y supongamos que para ciertos r, s con r # s zrj = aSj para todo j Consideremos el desarrollo . det A =

1 (ncS.

I)"z~,,( l)

Zra(r1

zm(r)... zna(n).

En el desarrollo, apareamos 10s tkrminos como sigue: Para aeS, apareamos ... a,,,,, con el termino ( - 1): al,o,l,... a,,,,, el tkrmino ( - l)"z

,,,,,

,,

donde r es la transposicion (u(r), u(s)). Como r es una transposicion y r Z = 1, esto nos &, ciertamente, un aparejamiento. Pero como a,(,, = as,(,,, por hipotesis, y as,(,, = a,,,(,,, tenemos que a,,(,, = a,(,,. Anllogamente, as,(,, = a,,,(,, . Por otra parte, para i # r y i # s, como ru(i) = u(i), ,c ( x = air,(i,. Luego 10s tCrminos a,,(,, ...a,,(,, y a,,,(,, ... a,,(,, son iguales. El primer0 aparece con el signo (- 1)" y el segundo con el signo (- 1)'" en la expansion de det A. Como r es una transposici6n y por tanto una permutation impar, ( - I)'" = -(- 1)". Por tanto, en el aparejamiento, 10s tCrminos apareados se cancelan mutuamente en la suma, de donde det A = 0. (La prueba no depende de la caracterlstica de F y es igualmente vhli& incluso en el caso de caracteristica 2.) De acuerdo con 10s resultados hasta ahora obtenidos, podemos determinar el efecto sobre un determinante de una matriz && de una permutacion de sus renglones. LEMA 6.23. El intercambio de dos renglones de A cambia el signo de su determinante. Prueba. Como hay dos renglones iguales, s e g h el lema 6.22, d(u, , ..., 01-1, Ui+uj, UI+I,..., uj-1, 17j+1,..., 0,) = 0. Usando el lema 6.21 varias veces po&mos desarrollar esto para obtener d(v,, ..., v,-, , v,, ..., ~ j - ~ , u..., 0,) j, d(u1, ..., ~ ~ - uj, , ..., ~ j - l , u i , ..-, + d(ul,...,v1-l, 1 0,) u,, ..., uj01, ..., on) d(u1, ..., 0,- uj, ..., ujuj, ..., 0,) = 0. Pero ca& uno de 10s 6ltimos dos ttrminos tiene en tl dos renglones iguales. de donde, seglin el lema 6.22, cada uno es 0. La anterior relacion se reduce entonces a d(v,, ..., v,-, , u,, ..., vj-, , vj, ..., v,) d(vl, ..., vluj, ..., vj- vi, ..., 0,) = 0, que es precisamente lo que el lema afirma.
u ~ + u j 9

+

+

,,

,,

,,

+

,,

COROLARIO. la matriz B se obtiene de la A mediante una permutacidn Si de 10s renglones de A, entonces det A = f det B, siendo el signo + 1 si la permutacidn es par, y - 1 si la permutacidn es impar. , Estamos ahora !en position de unir piezas para probar la propiedad algebraica bhsica & la funci6n determinante, a saber, que preserva 10s productos. Como un homomorfismo de la estructura multiplicativa de F en , F el determinante adquirirh ciertas caractedsticas importantes. TEOREMA Pura A, BEF , det (AB) = (det A) (det B). 6.f. , Prueba. Sea A = (a,,) y B = (&); Sean las filas & B 10s vectores u, , u,, ..., u,. Introducimos 10s n vectores w, , ...,w como sigue: ,

328

TRANSFORMACIONES LINEALES - Cap. 6

Consideremos d(w,, ..., w,); desarrollando este determinante y haciendo un uso mliltiple de 10s lemas 6.20 y 6.21, obtenemos

En esta suma mliltiple i, , ..., in van tomando independientemente todos 10s valores desde I hasta n. Pero, si cualesquiera dos i, = is entonces u,, = ui, de donde d(ui,, ..., uic, ..., ui,, ..., urn)= 0 por el lema 6.22. En otras palabras, 10s unicos ttrminos en la suma que pueden dar una contribuci6n distinta de cero son aquellos para 10s que todo 10s i,, i,, ..., in son distintos, es decir, aquellos para 10s que la aplicacion
u =

1
(i,

2 i,

n

-

i,,)

es una permutacion de 1, 2, ..., n. Ademls, cualquier permutacion tal es posible. Observernos finalmente que seglin el corolario del lema 6.23, cuando

es una permutacion, entonces d(uil, u,,, (det B. Tenemos asi

..., u,.)

= (- l ) a d ( ~ I , u,) =

...,

d(wl , --., ) = 4

aeS.

1

a,,(,)(-

1)' det B

= (det B) (det A).

Deseamos ahora identificar ahora -d(w, , ..., w,) como det (AB). Pero cornow, = a , , u , + ... +a,,u,, tenernos que d(w, , ..., w,) es det C, donde el primer rengl6n de C es w, , la segunda es w, , etc. Pero si desarrollamos w, en tCrminos de coordenadas obtenemos

que es el primer renglon de AB. Analogamente uj, es el segundo renglon de AB, y asi sucesivamente, para el resto de 10s renglones. Luego C = AB. Como det (AB) = det C = d(u7,. .... u.,) = (det A) (det B), hemos probado el teorema. COROLARIO Si A es inrerrible entonces det A # 0 y det (A - ) = I. (det A)-

-

'

Prueba. Como A A - I = I, d e t ( A A - I ) = det I = I. Luego segun el teorema. I = det (AA - I ) = (det A) (det A - I ) . Esta relacion afirma enI tonces que det A # 0 y det A - = det A

'

COROLARIO Si A es invertible, entonces para toda B, det (ABA2. det B.

I)

=

Prueba. Usando el teorema en la forma en que s aplico a (AB)Ae tenemos det ((AB) A - I ) = det (AB) det ( A - I ) = det A det B det ( A - I ) . Aplicando el corolario I esto s reduce a det B. Luego det ( A B A - I ) = e det B.

El corolario 2 nos permite definir el determinante de una transformacion lineal. Pues si TEA( V) y m, ( T ) es la matriz de Ten alguna base de V, para otra base, si m,(T) es la matriz en esta segunda base. entonces. segdn el teorema 6.h, m,(T) = Cm, ( T ) C - I , de donde det (m,(T)) = det (m, ( T ) ) segdn el anterior corolario 2. Es decir. la matriz de Ten cualquier base tiene e l misma determinante. Luego la definicibn: det T = det m, ( T ) es en realidad iridependiente de la base y provee a A ( V ) de una funcion determinante. En uno de 10s primeros problemas, la finalidad del problema era la de probar que A', la matriz transpuesta de la A, es semejante a A. Si esto fuera cierto (y lo es), entonces A' y A de acuerdo con el corolario 2 anterior tendrian el mismo determinante. No es, pues, motivo de asombro que podamos dar una prueba directa de este hecho. LEMA6.24. det A = det A'.
Prueba. Sea A = (aij) y A ' = (bij): desde luego,

pij

= zji. Ahora bien

mientras que

330

TRANSFORMACIONES LINEALES

- Cap. 6

Per0 el tkrrnino ( - I )"z,,,,, . . . a,,,,, es igual a ( - I)'a,,.. . a,,(pruebese). Pero a y a - ' son de la rnisrna paridad, es decir, si a es irnpar, entonces tarnbien lo es a - I , rnientras que si a es par entonces a - es par. Luego

,,,,

,,,,.

Finalrnente, corno a recorre S,, a det A' =
n'

'

recorre tarnbien por ello S,,. Luego

' E S,,

(-

l)n~'zln-~ll,~~~~nn-l,n~

= det A.

A la luz del lema 6.24, el intercambio de 10s renglones y las colurnnas de una matriz no cambia su determinante. Pero entonces 10s lemas 6.20, 6.2 1, 6.22 y 6.23 que son rdlidos para operaciones con renglones de la mafriz,
se ~Serifican igualmenfe para las columnas de la mafriz.

Hacernos un uso inrnediato de la observacion para derivar la regla de
Cramer para la resoluci6n de un sistema de ecuaciones lineales.

Dado el sistema de ecuaciones lineales:

llamarnos a A = (a,,) la rnatriz del sistema y a A = det A el deferminanfe
del sisfema.

Supongamos que A # 0 ; es decir, que

De acuerdo con el lema 6.20 (en su forma modificada para columnas en lugar de para renglones),
a,,

zIIxi

a - V

RIB

xiA =

anl

.-. a,, xi

- - a

an,

Pero corno una consecuencia de 10s lernas 6.21 y 6.22, podemos aiiadir

5 9.

DETERMINANTES

331

cualquier multiplo de una columna a otra sin cambiar el determinante (vtase el problema 5). Anadase a la i-tsima de x i A , x, veces la primera colurnna, x , veces la segunda. .. .. xi veces 1a.j-esima (para todo j # i ) . Asi pues

y usando a,, x ,

+... +a,,xn

=

2,.

vemos finalmente que

De donde. .rj = -. Esto es
A TEOREMA (REGLA CRAMER). es delemiinante A del sistema de 6.u. DE Si ecrracione.~ lineales

Ai

us dijkrente de cero, entonces la solucidn del sistema ~'iene dada por x i =

Ai -' A

rlonde A , es el determinante obtenido de A a1 reemplazar en la i-hima columna par P I , Dz. fin.

....

Ejeniplo. El sistema x,+2xz+3x, = - 5 Ix,+x,+x, x,+x,+x,

= -7
= 0

tiene determinante

332

TRANSFORMACIONES LINEALES

- Cap. 6

de donde

Podemos relacionar la invertibilidad de una matriz (o transformacion lineal) con el valor de su determinante. El determinante nos provee, por tanto, de u n criterio de invertibilidad.

TEOREMA A es inrerrible si +v sblo si det A # 0. 6.v.
Prueba. Si A es invertible. hemos visto en el corolario I del teorema 6.t. que det A # 0. Supongamos ahora que el det A # 0 donde A = (zij). Segun la regla de Cramer, podemos resolver el sistema

para x , .... x, dando /3,, ..., 3 arbitrarios. Como una transformacion /, lineal sobre F'"'. A ' es pues*suprayectiva, en realidad el vector ( P I , . ., 8,)

.

.

es la imagen bajo A' de -1,., - . Por ser suprayectiva, seglin el teo.. rema 6.d, A' es invertible, de donde A es invertible (pru~bese). Podemos ver el teorema 6.v desde un punto de vista alternarivo y probablemente mas interesante. Dada A E F , podemos sumergirla en K, donde K es una extension de F escogida de mod0 tal que en K,, A pueda ser puesta en forma triangular. Hay, por tanto, un BE K, tal que

: (

2)

aqui A , , . . ., A, son todas las raices caracteristicas de A , cada una apareciendo tantas veces como unidades tiene su multiplicidad como raices caracteristicas de A. Asi pues, det A = det ( B A B - I ) = A, A, ... segun el lema 6.19. Pero A es invertible si y solo si ninguna de sus raices caracteristicas es cero;

5 9.

DETERMINANTES

333

pero det A # 0 si y solo si i., i 2 i., # 0, es decir, si ninguna de las ... raices caracteristicas de A es 0.Luego A es invertible si y solo si det A # 0. Este argument0 alternativo tiene algunas ventajas, pues al efectuarlo probamos realmente un subresultado interesante por si mismo, a saber
,

-

LEMA 6.25. det A es el producto, contando /as niultiplicidades, de las raices caracteristicas de A.

DEFINICION. Dada AEF,,, la ecuacidn secular de A es el polinomio det ( x - A ) en F [ x ] . Generalmente lo que hemos llamado la ecuacion secular de A se suele llamar polinomio caracteristico de A. Pero hemos definido ya el polinomio caracteristico de A como el producto de sus divisores elementales. Es un
hecho (rkase el problenia 8 ) yue el polinomio caracteristico de A es igual a su ecuacidn secular, pero corno nosotros no necesitarnos desarrollar esto

explicitamente en el texto. introducirnos el tCrmino de ecuacion secular. Calculemos un ejemplo. Si

en tonces

de donde d e t ( x - A ) = ( x - 1 ) x - ( - 2 ) ( - 3 ) ecuacion secular de

= x2-x-6.

Asi pues, la

es x 2 - X - 6 . Unas cuantas observaciones acerca de la ecuacibn secular: Si i. es una raiz de det ( x - A), entonces det (I.- A ) = 0;de donde, segun el teorerna 6.v, 1.- A no es invertible. Asi pues, I. es una raiz caracteristica de A. Reciprocamente. si i. es una raiz caracteristica de A, i.- A no es invertible, de donde det (i.- A ) = 0 y. por tanto, i. es una raiz de det ( x - A). Asi pues, el polinomio explicit0 y computable "ecuacion secular de A", nos proporciona
un polinonlio cuyas raices son exactamente las raices caracteristicas de A.

Necesitamos subir un escalon mis y probar que una raiz dada entra como una raiz de la ecuacion secular precisamente tantas veces como sa multiplici-

334

TRANSFORMACIONES LINEALES

- Cap. 6

dad como raiz caracteristica de A. En efecto, si Ai es la raiz caracteristica cte A con multiplicidad m i , podemos poner A en forma triangular de mod0 que

donde cada Ai aparece en la diagonal mi veces. Pero B(x-A)B-'
= x-BAB-' =

de modo que det ( x - A ) = det ( B ( x - A ) B - I ) = ( x - i . , ) m l ( x - j . l ) m l. . . ( x - l , ) " * , y, por tanto, cada i.,, cuya multiplicidad como raizcaracteristica de A es m i , es una raiz del polinomio det(x- A ) de multiplicidad exactamente igual a m i . Y hemos probado el
TEOREMA Las raices caracteristicas de A son las raices, con la 6.w. multiplicidad correcta, de la ecuacion secular, det ( x - A ) , de A.

Damos termino a esta seccion con el significativo e historic0 teorema de
Cayley- Hamilton.

TEOREMA Toda A E Fn satis/ace su ecuacion secular. 6.x.
Prueba. Dada cualquier matriz invertible B E K , , donde K es una extension cualquiera de F, A E F y BAB- ' satisfacen 10s mismos polinomios. Ademas, como det ( x - BAB- ' ) = det ( B ( x - A ) B - I ) = det ( x - A ) , BAB- ' y A tienen la misma ecuacion secular. Si podemos demostrar que algun B A B - ' satisface su ecuacion secular, se seguira de ello entonces que A tambien la satisface. Pero podemos escoger K 2 F y B E K , de mod0 que BAB- sea triangular; en tal caso ya vimos bastante antes (teorema 6 . k ) que una matriz triangular satisface su ecuaci6n secular. Luego el teorema queda probado.

1. Si F es el campo de 10s numeros complejos. evaluense 10s siguientes determinantes :

2.

para que caracteristicas de Fson 0 10s siguientes determinantes?

3. Si A es una matriz con entradas enteras tales que A - es tambitn una matriz con entradas enteras, i,c~lSles pueden ser 10s valores de det A ?

336

TRANSFORMACIONES LINEALES

- Cap. 6

4. Prutbese que si se suma el mliltiplo de un rengl6n a otro no se cambia el valor del determinante.

*5. Dada la matriz A = (ajj), sea A i j la matriz obtenida de la A quitando el i-esimo renglon y la ,j-esima columna. Sea M I.J. = ( - 1)"' det Aij. A Mij se le suele llamar cofactor de ail. PruCbese que det A = airMi, + ... +ainM,.
6. a) Si A y B son submatrices ccadradas, prutbese que

det

(

:]
A2

= (det A ) (det B ) .

h ) Generalicese la parte !a) a

det

[ 1)
...

donde cada A ; es una submatriz cuadrada.

7. Si C(f) es la matriz compafiera del polinomio j'(x), prutbese que la ' ecuacion secular de C(j )esjlx).

8. Usando 10s problemas 6 y 7 prutbese que la ecuacion secular de A es su polinomio caracteristico. (Vtase la secci6.n I ; esto prueba la observacion que antes hicimos de que las raices de p,(x) aparecen con multiplicidades iguales a sus multiplicidades como raices caracteristicas de T.)

9. Usando el problema 8, proporcionese una prueba alternativa del teorema de Cayley-Hamilton.
10. Si F es el campo de 10s numeros rationales, calclilense la ecuacion secular y las raices caracteristicas con sus multiplicidades de

11. Para cada una de las matrices de problema 10, verifiquese, por calculo matricial directo, que satisface su ecuaci6n secular. -

*12. Si el rango de A es r, prukbese que hay una submatriz cuadrada r x r de A de determinante distinto de 0, y si r <n, que no hay ninguna submatriz ( r I ) x ( r I ) de A con esta propiedad.

-

+

+

*13. Seaf una funcion de n variables de F'") a F tal que: a) ,f(r,, ..., c,) = 0 para r i = L;.EF(") con i # j . 6) f ( r l , ..., a r i , ..., r n ) = a f ( r I ,

.... r,) para toda i y ZEF.

Pruebese que primera fila de A,

,f'(~5,,

..., 11,)
L,,

= det A para cualquier AEF,, donde r i es la la segunda, r'tc.

14. h e s e el problema 13 para probar que det A' = det A. a) PruCbese que AB y BA tienen la misma ecuacion secular (carac-

teristica).
6) Proporcionese un ejemplo en donde AB y BA
110 tengan

el mismo

polinomio minimo. 16. Si A es triangular prukbese, por un calculo directo, que A satisface su ecuacion secular.
17. usese la regla de Cramer para calcular las soluciones en el campo real de 10s sistemas: a) x+y+z
=t

I

b) x+y+z+w

= I
=

2x+3y+4z = I x-y-z = 0

x+2y+32+4w x+y+4z+5w x+y+5z+6w

0

= I = 0.

18. a) Sea GL(n, F ) el conjunto de todos elementos de Fn cuyo determinante es diferente de 0 PruCbese que GL(n. F ) es un grupo .

bajo la multiplicacion de matrices. b) Sea D(n, F ) = { A E GL(n, F ) ldet A = 1 ). Pruebese que D(n. F ) es un subgrupo normal de GL(n, F). C ) PruCbese que GL(n, F)/D(n, F ) es isomorfo al grupo de elementos distintos de cero de F bajo la multiplicacion.
19. Si K es un campo extensibn de F, sea E(n. K. F ) = {AeGL(n, K ) ( det A E F ) . a) PruCbese que E(n, K, F ) es un subgrupo normal de GL(n. K ) . *b) Determinese GL(n, K)/E(n, K, F).

338

TRANSFORMACIONES LiNEALES - Cap. 6

*U). Si F es el campo de 10s numeros racionales, prudbese que cuandosN es un subgrupo normal de D(2, F ) entonces o N = D(2, F ) o N consiste solamente en matrices escalares.

10. TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

En nuestras consideraciones previas acerca de las transformaciones lineales, la naturaleza especifica del campo F ha jugado un papel relativarnente insignificante. Cuando se hizo sentir fue usualmente respecto a la presencia o ausencia de raices caracteristicas. Ahora, por primera vez, restringiremos el campo F -generalmente sera el carnpo de 10s nurneros complejos, per0 a veces sera el de 10s numeros reales- y haremos un gran uso de las propiedades de 10s nurneros complejos y reales. A menos que
explicitamente se diga lo contrario, en toda esta seccidn F representarci a1 ;amPo de 10s ntjmeros complejos.

Haremos tambidn un uso extensivo y constante de las nociones y resultados de la seccion 4, capitulo 4, sobre espacios con product0 interior. Aconsejamos al lector que revise y asimile por completo tal material antes de seguir mas adelante. Una observation mas acerca de 10s numeros cornplejos: hasta ahora hernos evitado usar resultados que no hubieran sido probados en el libro. Ahora, sin embargo, nos vernos forzados a desviarnos de esta norma y a ernplear un hecho basico referente al campo de 10s nurneros complejos, el llarnado "teoreina fundamental del cilgebra", sin que aqui lo dernostrernos. Nos desagrada sacar tal resultado corno quien dice del aire, enunciarlo corno un hecho y pasar sin mas a hacer uso de dl. Desgraciadarnente, es esencial para lo que sigue y hacer aqui una digresion para probarlo nos llevaria dernasiado lejos. Esperamos que la mayoria de 10s lectores habran estudiado ya su dernostracion en un curso sobre variables cornplejas.

HECHO. Un polinomio con coeficientes que son ntjmeros complejos tiene I todas sus raices en el campo complejo.
El hecho 1 puede reformularse diciendo que 10s linicos polinornios irreducibles no constantes sobre el campo de 10s nurneros cornplejos son 10s de grado I .

HECHO Los tjnicos polinomios irreducibles no constantes sobre el 2. campo de 10s ntjmeros reales son 10s de grado I o grado 2.
La f6rmula para las raices de una ecuacion cuadratica nos perrnite probar facilrnente la equivalencia de 10s hechos 1 y 2. -

1 10. TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

339

La irnplicaci6n inrnediata, para nosotros, del hecho I, serh que to& transformacidn lineal de las que aqui consideraremos ten&d sus rafces caracteristicas en el campo de los ntimeros complejos. En lo que sigue, V seri un espacio vectorial de dirnensi6n finita con producto interior sobre F, el carnpo de 10s nirrneros cornplejos; el producto interior de dos elementos de V se escribirh, corno antes se hizo, corno (0, w), LEMA 6.26. Si TcA(V) es tal que (vT, v) = 0 para todo T = 0.
VEV ,

-

entonces

Prueba. Como (uT, v) = 0 para V E V dados u, iuc V ((u + w) T, u + w) = , , 0. Desarrollando esto y haciendo uso de que (r:T, a) = (wT, w) = 0, obtenemos 1) (uT, w) +(w T, u) = 0 para cualesquiera u, W E V . Como la ecuaci6n (I) se verifica para w arbitrario en V, debe aun verificarse si reemplazamos en ella w por iw, donde i2 = - 1 ;pero (uT, iw) = - i(uT, w), mientras que ((iw) T, u) = i(wT, u). Sustituyendo estos valores en (I) y cancelando i tenemos Surnando (I) y (2) tenernos (wT, u) = 0 para cualesquiera u y w de V , de donde, en particular, (wT, wT) = 0. Por las propiedades delinitoriris de un producto interior esto implica que wT = 0 para todo WE V, de donde T = 0. (Nola: si V es un espacio con producto interior sobre el c a m p real, el lema puede ser falso. Por ejemplo, sea V = {(a, /3))a, 8 reales, donde el producto interior es el producto punto. Sea T la transformacibn lineal que manda (a, 8 ) en (-8, a). Una simple comprobaci6n nos dice que (vT, v) = 0 para cualquier vc V, sin embargo, T # 0.) DEFINICI~N. transformaci6n lineal TcA(V) se diceque es unitaria si La (uT, oT) = (u, o) para cualesquiera u, oc V. Una transformaci6n unitaria es una que preserva toda la estructura de V , su suma, su multiplication por escalares y su producto interior. N6tese que una transformaci6n unitaria preserva la longitud, puesto que

I I ~ I I = JIG? =

Jm) IIVTII.
=
V E V,

iEs lo reciproco cierto? La contestacibn nos la da el LEMA 6.27. Si (oT, oT) = (o, u) para to& u,
U E V;

entonces T es unitaria.

Prueba. La prueba tiene el mismo estilo que la del lema 6.26. Sean por hipotesis ((u+ o) T, (u+ v) T) = (u+ v, u+ v). Desa~ollando y

340

TRANSFORMACIONES LINEALES

-C s a 6

simplificando, tenemos
1) (uT, oT)+(i?T, T ) = (u. r ) + ( r , u), u

para cualesquiera u; L:E V. Reem plazando en ( 1 ) I: pro ir y calculando esto nos da 2) - ( u T , o T ) + ( r T , u T ) = -(u. r ) + ( r , u ) . Sumando (I) y ( 2 ) obtenemos (uT. r T ) = (u, o) para cualesquiera
u, V E V, de donde T es unitario.

Caracteritamos la propiedad de ser unitario en terminos de la accion sobre una base de V.
TEOREMA ~ .La transformacidn lineal T sobre V es unitaria si y s6lo si 6. lleoa una bare ortonormal de V en una base ortonormal de V.

Prueba. Supongamos que { r , , .... r,) es una base ortonormal de V ; por tanto, ( r i . r j ) = 0 si i # j, mientras que ( r i . vi) = 1 . Queremos demostrar que si T es unitario, entonces { r , T, ..., v n T ) es tambitin una base ortonormal de V. Pero ( r i T, r j T ) = ( t i ,r j ) = 0 para i # j y (v,T, oi T ) = ( c i , ri) = I , de donde ciertamente { r , T, ..., rn T ) es una base ortonormal de V. Por otra parte, si T E A ( V )es tal que tanto { o , , ...,on) como {o, T, ..., L, T } son bases ortonormales de V, para u. U ' E V tenemos entonces ;

n

de donde por la ortonormalidad de las pi, (u, W ) =
i= 1

gigi.

Per0 uT =

.

giri T y u*T =. x'/?,ri T, de donde por la ortonormalidad de las
1= 1
n

i= I

ri T , (uT, u7T) =

i= 1

2 r i d i = (u. W ) , lo que prueba que T es unitaria.

El teorema 6. y nos dice que un cambio de base de una base ortonormal a otra base tambien ortonormal es precisamente lo que produce una transformacion lineal unitaria.
LEMA 6.28. Si T E A( V ), entonces dada cualquier rE V , existe un elemento V, que depende de r y de T. tal que (uT. r ) = (u, w) para toda U E V. Este elemento 'queda linicamente determinado por r y T.
U'E

Prueba. Para probar el lema es suficiente exhibir un W E V que trabaje para todos 10s elementos de una base de V. Sea { u , ...., u,} una base

110.

TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

34 1

ortonormal de V ; definimos =
.

1 ( u i ~ , Un facil calculo muestra que (')ui.
i = 1

(ui,w)=(uiT,c.), de donde el elemento tc. tiene la propiedad deseada. Que u1es unico puede verse como sigue: Supongamos que (uT,v) = (u,ul,) = (u, w,); entonces (u, ul, - 117,) = 0 para toda U E V, lo que obliga al poner P u = U ' ~ - U ' ~ a q u e r c , = u.,. El lema 6.28 nos permite dar la siguiente DEFINICION. T E A (V ) , entonces el adjunto liermitiano de T , al que Si representaremos por T*, se define por (uT, 1.) = (u, rT*) para cualesquiera u, l l E v. Dado
L.E V acabamos

de obtener una expresion explicita para rT* (como

w ) y prodriamos usar esta expresion para probar las distintas propiedades que

deseamos tenga T*. Pero preferimos hacerlo de mod0 que no tengamos que depender de una base determinada. LEMA 6.29. Si T E A (V ) ,etttonces T*t.-A(V ) . Ademas: I ) (T*)* = T, 2) ( S + T ) * = S*+T*, 3) (AS)* = IS*, 4 ) (ST)* = T*S*, para S, T E A ( V )cualesquiera y todo 1. Prueba. Debemos primer0 probar que T* es una transformacion lineal sobre V. Si u, u, u. estan en V, entonces (u, ( r + u ~ ) T *= (uT, U + W ) = ) (uT, u ) (uT, w) = ( u ,rT*) (11. utT*) = (u,rT* UTT*), consecuencia en de lo cual (L'+w) T* = i.T* KT*. Analogamente, para AE F, (u, ( l v )T*) = (uT, Ac) = I(uT, L.) = ;(U,rT*) = (u,j.(i.T*)), de donde (Av)T* = A(;T*). Con lo que hemos probado que T* es una transformacion lineal sobre V. Para ver que (T*)' = T, notemos que (u.r(T*)*)= (uT*,1,) = (v,uT*) = (rT, U ) = (u, uT) para todo u. L.E V. de donde c.(T*)* = uT lo que implica que (T*)* = T. Dejamos las pruebas de ( S + T)* = S* + T* y de (AT) = IT* para el lector. Finalmente, (u, ST)*)' = (uST, v) = (US, oT*) = (u, cT*S*) para u, L.E V cualesquiera; esto implica v(ST)* = ilT*S* para cualquier C E V lo que nos dice que (ST)' = T* S*. Como consecuencia del l h a tenemos que la adjunta hermitiana define una adjunta, en el sentido de la section 8, sobre A(V). La adjunta hermitiana nos permite dar una descripcion alternativa para las transformaciones unitarias en terminos de la relacion de T y T*.

+

+ +

+

LEMA 6.30. T E A( V )es trnittrria .si !. stilo .\i TT" = I .

342

TRANSFORMACIONES LINEALES

- Cap. 6

Prueba. Si T es unitaria, entonces para todo u, V E V (u, vTT*) = , (uT, oT) = (u, o), de donde TT* = 1. Por otra parte, si TT* = 1, entonces (u, o) = (u, o n * ) = (uT, vT), lo que implica que T es unitaria.

TEOREMA Si {ol,..., on) es una bare ortonormal de V y si la matriz 6.2. de TEA(V) en esta base es (alj), entonces la rnatriz de T* en esta base es (Bij), dondeBij = ajl.
Prueba. Como las matrices de T y T* en esta base son, respectivarnente, (a$ Y (Pij), entonen oi T =
1x1

x
n

aijvj y v1 T* =
1

i= 1

f Pijvj. Ahora

bien,

de las 0,. Lo que prueba el teorema. Este teorema nos interesa muy en particular a la luz de lo que hicimos anteriormente en la secci6n 8. Pues la adjunta hermitiana abstracta definida sobre el espacio con producto interior V cuando cs trasladado a matrices , en una base ortonormal de V no se hace otra cosa que la adjunta hermitiana , concreta explicita que definimos para las matrices. Usando la representation matricial en una base ortonormal, afirmamos que TEA(V) es unitaria si y solo si siempre que (alj) es la matriz de Ten en esta base ortonormal, entonces
n

I= 1

x
n

aljEik= 0 para j # k, mientras que

/a,,/'
i= 1

= 1. En ttrminos de productos punto sobre espacios vectoriales

complejos, esto nos dice que 10s renglones de la matriz de T forman un conjunto ortonormal de vectores en F'") bajo el producto punto.

DEFINICI~N. ( V) se llama autoadjunta o herrnitiana si T* = T. TEA
Si T* = - T, entonces llamamos a T antiherrnitiana. Dada cualquier SEA(V),
2

+ '* ' y como 2

son y2i hermitianas, S = A+iB, donde tanto A como B

son hermitianas. En la secci6n 8, usando el chlculo de matrices, probamos que cualquier raiz caracterlstica compleja de una matriz hermitiana es real; a la luz del hecho 1, esto puede cambiarse para que diga: To& raiz caracteristica de una matriz hermitiana es real. Volvemos ahora a probar esto desde el punto de vista, mhs uniforme, de un espacio con producto interior.

5 10. TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NOAMALES

343

TEOREMA Si T E A ( V ) es hermitiana, entonces todas sus raices 6.2,.
caracteristicas son reales. Prueba. Sea A una raiz caracteristica de T ; hay pues una v # 0 en V tal que uT = Ac. Calculamos: A(u, r ) = (Ar, 1') = (oT, o) = (v, oT*) = (1: L ~ T ) (L', = Ac) = X(r, como # 0, como tenemos A = 1, 1 es real.
11);
( 1 3 , ~ )

Deseamos describir formas canonicas para transformaciones lineales unitarias, hermitianas e incluso de tipos mas generales que serhn tambiCn mas sencillas que las formas de Jordan. Es por esto por lo que apartcen 10s siguientes lemas que, aunque de interes independiente, son en su mayor parte de naturaleza mas bien tkcnica. LEMA 1. Si S E A ( V )y si cSS* = 0, entonces rS = 0. 6.3
Prueba. Consideremos (vSS*, c ) ; como rSS* = 0, 0 = (vSS*, v) = (US,v(S*)*) = (US,U S ) segun el lema 6.29. En un espacio con product0 interior esto implica que vS = 0.

Si ~ COROLARIO. T es hermitiana y V T = 0 para k 2 1, entonces vT = 0.
Prueba. Mostramos que si vT2" = 0, entonces cT = 0; pues si S = T2"-', entonces S* = S y SS* = T2", de donde (rSS*, r ) = 0 implica que 0 = vS = uT2"-'. Continuando hacia abajo en esta forma, obtenemos vT = 0. Si vTk = 0, entonces rT2" = 0 para 2" > k, de donde vT = 0.

lntrdducimos una clase de transformaciones lineales que contiene como casos especiales las transformaciones unitarias, hermitianas y antihermitianas. D E F I N I C ~T E A( v ) se dice que es normal si T* T* T ~N. = En lugar de probar 10s teoremas que siguen para transformaciones unitarias y para transformaciones hermitianas separadamente, lo que haremos serii probarlos para transformaciones normales y derivar, como corolarios, 10s resultados deseados para las unitarias y hermitianas.
V E V, entonces

6.32. Si N es una transformacidn lineal normal y si cN = 0 para LEMA vN* = 0.

Prueba. Consideremos (vN*, ilN*); por definition, (i'N*, ON*)= (vN*N, V ) = (vNN*, o), ya que NN* = N*N. Pero 1.N = 0, de donde ciertamente vNN* = 0. De esta forma obtenemos que (r.N*.I'N*) = 0, de donde forzosamente ha de tenerse cN* = 0.

344

TRANSFORMACIONES LINEALES - Cap. 6

N

jv si

COROLARIO i I, es una raiz caracteristica de la transformacion normal I. S 1.N = i.o, entonces r N * = l r .

Priieha. Como N es normal, N N * = N * N , de donde tenemos ( N - A) (N-i.)* = ( N - I ) ( N * - X ) = NN*-AN*-XN+AX = N*N-E.N*-XN+ i.2 = ( N * - 2 ) ( N - I ) = ( N - I ) * ( N - I ) , es decir. N - I . es normal. Como r ( N - i.) = 0 , por La normalidad de N - 1. se tiene del lema: r ( N - A)* = 0 . de donde i.N* = X i t i

El corolario enuncia el interesante hecho de que si i. es una raiz caracteristica de la transformacion normal N , no solamer~tees una raiz caracteristica de N * , sino que cualquier vector caracteristico de N perteneciente a i. es un vector caracteristico de N* perteneciente a X y viceversa.
etitonces (E.1 = 1 .

COROLARIOSi T es unitaria y si 1. es una ,raiz caracteristica de T , 2.

Prireba. Como T es unitaria, es normal. Sea I una raiz caracteristica de T y supongamos que tlT = I r con r # 0 en V. Por el corolario 1 , r T * =Xr, luego r = ilTT* = ArT* = A h , ya que T T * = I . Luego tenemos 11 = I , lo que nos dice ( I ) = 1.

Hacemos una pausa para ver adonde vamos. Nuestro objetivo ininediato es probar que una tiansformacion normal N puede llevarse a la forma diagonal por una unitaria. Si i,,, ..., A, son raices caracteristicas distintas de V. usando el teorema 6.n podemos descomponer V como V = V, ... @ V,. donde para L.,E Vi, oi(N-A,)"' = 0.De acuerdo con esto, necesitamos estudiar dos cosas, a saber: la relacion entre vectores que se encuentran en distintos V,, y la naturaleza caracteristica de cada V,. Cuando estas dos cosas hayan sido estudiadas, seremos capaces de reunirlas para probar el teorema deseado. LEMA 6.33 Si N es normal y v N k = 0,entonces i!N = 0.
Prueba. Sea S = N N * ; S es hermitiana, y s e g h la normalidad de N , r S k = ~ ( N N * ) '= U N ' ( N * ) ~ 0.De acuerdo con el corolario al lema 6.31. = deducimos que U S = 0,es decir, o N N * = 0.Aplicando el lema 6.31 se tiene que ilN = 0.

COROLARIO.i N es normal y si para I E F , ~ ( N - r l )= 0, entonces S ~ r N = Ic.
Prueba. De la normalidad de N,se sigue que N - A es normal, de donde, a1 aplicar el lema que acabamos de probar a N - A obtenemos el corolario.

1 10. TRANSFORMACIONES

H R I I N S UNITARIAS E MTA A .

Y NORMALES

345

Siguiendo con la discusidn que precedia al liltimo lema, este corolario demueslra que todo ivctor en V, es un irector caracteristic.~de N perteneciente a la r a i l caracteristica A,. Hemos delern~inado naluraleza de V, ; la ahora procederemos a investigar la interrelacibn entre dos distintas V,. LEMA 6.34. Sea N una trans/ormacibn normal y supongamos que 3. y p son dos raices caracteristicas distintas de N. Si 1%. u* son rle V y tales que PN = Irl, u-N = pul, entonces (I., u1) = 0.
Prueba. Calculamos ( r N , u)) de dos formas diferentes. Como una consecuencia de que ilN = 217, ( P N .w ) = (Ar, K ! ) = A(r, w ) . Como ulN = pul, usando el lema 6.32 obtenemos que ulN* = pw. de donde ( r N , u 3 )= (I.,u l N * ) = (17,Pu') = j ~ ( r ul). La comparacion de 10s dos calculos, nos da , I ( [ . ,LP) = p ( i 3 , y como # 11, de ello resulta que (1.. u,) = 0. u').

Todo el trabajo preliminar ya ha sido hecho para que podamos probar este basico y bello teorema: TEOREMA. ~ Si . N es una trans/ormacidn lineal normal sobre V, 6 ~ entonces existe una base ortonorrnal, consistente en rectore$ caracteristicos de N , en la cual la matriz de N es diagonal. Equii?alentemente,si N es una matriz normal, existe una mafriz unitaria U tal que U N U - ( = U N U * ) es diagonal.
Prueba. Completamos el esquema informal que hemos hecho de la prueba antes de la demostracion del lema 6.33. Sea N normal y sea A , , . . ., A, las distintas raices caracteristicas de N. Por el corolario al teorema 6 . 4 podemos descomponer V en la ,forma V = V , O ... 0 V, donde toda a , € V i es aniquilada por ( N Por el corolario al lema 6.33, V i consiste solamente en vectores caracteristicos de N pertenecientes a la raiz caracteristica A,. El producto interior de V induce un producto interior sobre V , ; por el teorema 4.h. podemos encontrar una base de V i ortonormal respecto a su producto interior. Por el lema 6.34, 10s elementos pertenecientes a distintos V i son ortogonales. Luego la union de las bases ortonormales de las V i nos proporciona una base ortonormal de V. Esta base consiste en 10s vectores caracteristicos de N , de donde en esta base la rnatriz de N es diagonal. No probamos el equivalente matricial dejandolo como un problema; solamente seiialamos que dos hechos son necesarios:

1 ) Una transformaci6n unitaria (teorema 6.y) cambia una base ortonormal por una base tambitn ortonormal. 2) En un cambio de base, la matriz de una transformacion lineal se cambia por conjugacion por.la matriz del carnbio de base (teorema 6.h).

346

TRANSFORMACIONES LINEALES - Cap. 6

Los dos corolarios que siguen son casos muy particulares del teorema 6.2,. per0 como cada uno de ellos es tan importante por si mismo, 10s enunciamos como corolarios para subrayarlos. COROLARIOSi T es una transjbrmacidn unitaria, entonces hay una base I. ortonormal en la que la matriz de T es diagonal; equiualentemente, si T es una matriz unitaria, entonces hay una matriz unitaria U fa1 que UTU - (= U T U * ) es diagonal.

'

COROLARIO Si T es una transformacidn lineal hermitiana, entonces 2. existe una base ortonormal en l a que la matriz de T es diagonal; equiualentemente, si T es una matriz hermitiana, entonces existe una matriz unitaria U fa1 que UTU- ( = UTU*) es diagonal.

'

El teorema probado es el resultado bhsico para las transformaciones normales, pues las caracteriza en forma neta como precisamente aquellas transformaciones que pueden llevarse a la forma diagonal por unitarias. Tambien muestra que la distincion entre transformaciones normales, hermitianas y unitarias es solamente una distincion causada por la naturaleza de sus raices caracteristicas. Precisamos esto en el LEMA 6.35. L a transformacidn normal N es:
I ) Hermitiana si y solo si sus raices caracteristicas son reales;

2 ) Unitaria si y solo si sus raices caracteristicas son todas de valor absolute I .
Prueba. Argumentamos usando matrices. Si N es hermitiana, entonces es normal y todas sus raices caracteristicas son reales. Si N es normal y tiene solamente raices caracteristicas reales, entonces para alguna matriz unitaria U, U N U - ' = UNU* = D donde D es una matriz diagonal con elementos reales en la diagonal. Asi pues, D* = D ; como D* = ((/NU*)* = UN*U*, la relacion D* = D, implica UN*U* = UNU*, y como U es invertible obtenemos N* = N. Luego N es hermitiana. Dejamos al lector la prueba de la parte referente a las transformaciones unitarias.

Si A es una transformaci6n lineal cualquiera sobre V, entonces tr (AA*) puede calcularse usando la representation matricial de A en cualquier base de V. Escogemos una base ortonormal de V; en esta base si la matriz de A es ( a i j ) entonces la de A* es ( p i j ) donde pij = i j i Un chlculo simple nos . muestra entonces que tr ( A A * ) = laij(2y esto es cero si y s61o si todo

1

1.1

a,j = 0,es decir, si y s61o si A = 0.En una palabra, tr (AA*) = 0 si y s61o

5 10. TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

347

si A = 0. Este es un criterio util para mostrar que una transformaci6n lineal dada es 0. llustramos esto en el siguiente LEMA 6.36. Si N es normal y AN = NA, entonces AN* = N*A.
Prueba. Queremos demostrar que X = AN*- N*A es 0; lo que haremos es probar que tr XX* = 0, y deducir de'esto que X = 0. Como N conmuta con A y con N * , debe conmutar con AN*- N*A, asi pues XX* = ( A N * - N * A ) (NA*- A * N ) = ( A N * - N * A ) N A * - ( A N * N * A ) A * N = N { ( A N * - N * A ) A * ) - { ( A N * - ' N * A ) A * ) N. Como XX* es de la forma NB- BN, la traza de XX* es 0. Luego X = 0, y AN* = N*A.

Acabamos de ver que N* conmuta con todas las transformaciones lineales que conmutan con N, cuando N es normal; esto es suficiente para que forzosamente N* sea una expresion polinomial en N. Pero esto puede dernostrarse directamente como una consecuencia del teorema 6.z2 (vease el problerna 14). La transformacion lineal T es herrnitiana si y solo si ( r T , 11) es real para todo v~ V (vkase el problema 19). De especial interks son aquellas transformaciones lineales hermitianas para las que ( r T , r ) 2 0 para todo r e V. Las llamamos transformaciones lineales no negatiras y denotamos el hecho de que una transformacibn lineal sea no negativa escribiendo T 2 0. Si T 2 0 y ademas ( r T , L') > 0 para r # 0 entonces llamamos a T positka (o positii.amente definida) y escribimos T > 0. Queremos distinguir a estas transformaciones lineales por sus raices caracteristicas. LEMA 6.37. La transformacibn lineal hermitiana T es no negatira (positica) si y sdlo si todas sus raices caracteri'sti *asson no negatiras (positiras).
Prueba. Supongamos que T 2 0 ; si 1 es una raiz caracteristica de T, entonces uT = l r ? para algun r # 0. Luego 0 < ( r T , r ) = (Au, r ) = 1(c, u); como ( r , u) > 0, se deduce que 12 0. Reciprocamente, si Tes hermitiana con raices caracteristicas no negativas. entonces podemos encontrar una base ortonormal { r , , ..., r,) consistente en vectores caracteristicos de T. Para cada r , , r i T = ,Ii r i , donde l i 2 0. Dado ~ E Vr , = L a i c i de donde cT = x a i r i T = Xi.,.airi. Per0 entonces (vT, v) = ( I l i a i : , , L a i c i ) = Lliaicxi por la ortonormalidad de las r i . Como l i 2 0 y aicxi 2 0, se tiene ( r T . r ) 2 0, de donde T 2 0. Los resultados correspondientes para el caso "positivo" se dejan como ejercicio.

LEMA 6.38. T 2 0 si y s61o si T

= AA* para alguna A.

Prueba. Demostramos primer0 que AA* 0. Dado ~ E V(uAA*, L ! ) = , ( r A , P A ) = 0, de donde AA* 2 0.

348

TRANSFORMACIONES LINEALES

- Cap. 6

Por otra parte. si 7 2 0 podemos encontrar una rnatriz unitaria U tal que-

donde cada ibi una raiz caracteristica de 7. luego toda i i 2 0.Sea es

como cada i i 2 0,cada hermitiana: per0

pies real, luego S hermitiana. Por tanto U*SU es

Hemos representado a 7 en la forrna AA*, donde A = U*SU. Notese que realrnente hernos probado un poco mhs; a saber, si al construir S hubieramos escogido la raiz no negativa para cada l i , entonces S, y U*SU, habria sido no negativa. Luego T 2 0 es el cuadrado de una transformacion lineal no negativa; es decir, toda 7 3 0 tiene una raiz cuadrada no negativa. Esta raiz cuadrada no negativa puede demostrarse que es unica (vease el problema 24). Cerramos esta seccion con una discusion sobre las matrices unirarias y hermitianas sobre el campo real. En este caso, las matrices unitarias se llaman ortogonales, y satisfacen QQ' = I . Las hermitianas son en este caso exactamente simetricas. Afirmamos que una niatriz real simitrica puede llecarse a la ,forma diagonalpor una matriz ort~gonal. A una matriz real simitrica: Podemos Sea considerar a A actuando sobre un espacio real V con product0 interior. Considerada como una matriz compleja, A es hermitiana y por tanto todas sus raices caracteristicas son reales. Si estas son A,, . . ., ik entonces V puede descomponerse en V = V, @ .. . @ V,, donde L : ~ ( A = 0 para r i e Vi. Como en la prueba del teorema 6.33 esto trae como consecuencia obligada riA = i.iri. Usando exactarnente la misma prueba que la que usamos en el lema 6.34, mostrarnos que para vie Vi, L'/E Vj con i # j,

fii

1 10. TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

349

(i.,, r j ) = 0. Podernos, pues. encontrar una base ortonorrnal de V todos cuyos elernentos Sean vectores caracteristicos de A . El carnhio de bases. de la base ortonorrnal {( 1, 0, . . ., 0). (0. 1 , 0.. . ., 0). . . ., (0, . . .. 0. 1 ) : a esta nueva base se efectua rnediante una rnatriz unitaria real. es deci~.por una ortogonal. Asi pues. A puede llevarse a forrna diagonal por una niatriz ortogonal. probando nuestra afirrnacion. Deterrninar forrnas canonicas para las matrices ortogonales reales sobre el carnpo real es un poco mas cornplicado, tanto en su respuesta corno en su ejecucion. Pasarnos ahora a estudiar este problerna; per0 antes varnos a hacer una observacion general acerca de todas las transforrnaciones unitarias. Si W es un subespacio de V invariante bajo la transforrnacion unitaria 7, ;es cierto que W', el cornplernento ortogonal de W, es tarnbien invariante bajo T? Sea W E W y X E W'; tenernos entonces: (KT. x T ) = ( 1 1 . . x ) = 0: corno W es invariante bajo T y Tes regular, WT = W, de donde xT, para X E W', es ortogonal para todo W. Luego es cierto que ( W 1 ) T cW'. Recuerdese que V = W e W'. Sea Q una rnatriz ortogonal real; entonces T = Q + Q- ' = Q + Q' es sirnetrica, de donde tiene raices caracteristicas reales. Si estas son i., , .. .. i.,, entonces V puede descomponerse en V = V, @ .. . Q V,, donde r , e Vi implica r i T = Airi. Las Vi son mutuamente ortogonales. Afirmamos que cada Vi es invariante bajo Q (pruebese). Luego, para discutir la accion de Q sobre V, es suficiente describirla sobre cada Vi. Sobre V,, corno Air, = r i T = r i ( Q + Q - I ) , multiplicando por Q tenemos L.,(Q~-A, + 1 ) = 0. Se presentan dos casos particulares, a saber: Q Ai = 2 y li = -2 (que pueden, desde luego, no ocurrir). pues entonces r i ( Q + 1)' = 0, lo que nos lleva a ri(Qf I ) = 0. Sobre estos espacios. Q actua corno I o corno - I . Si X i # 2, - 2, entonces Q no tiene ningun vector caracteristico sobre V,, de donde para 17 # OE Vi, L', L'Qson linealmente independientes. El subespacio que generan, W, es invariante bajo Q, ya que r Q 2 = I,,i.Q- 1.. Ahora , bien, V, = W e W' con W' invariante bajo Q. Luego podemos presentar a Vi corno la suma directa de dos subespacios bidimensionales mutuamente ortogonales invariantes bajo Q. Para encontrar formas canonicas de Q sobre V, (de donde sobre V), solamente debemos resolver el problerna para matrices ortogonales reales 2 x 2. Sea Q una matriz ortogonal real 2 x 2 que satisface Q2 -i.Q+ I = 0:

supongamos que Q =
1) a2+p2 = I,

. La ortogonalidad de Q implica :

2) y 2 + 6 2 = I ,

3) ay+p6 = 0 ;

350

TRANSFORMACIONES LINEALES - Cap. 6

como Q2 - 1 Q + I

=

0 el determinante de Q es I, de donde .

Afirmamos que las ecuaciones 1, . .., 4, implican que a = d, B = - y. Como rx2+B2 = I, 191 < 1, de donde podemos' escribir 9 = cos 8 para algun angulo real 8; en estos ttrminos = sen 8. Por tanto, la matriz Q toma la forma

Todos 10s espacios usados en todas nuestras decomposiciones eran mutuamente ortogonales, luego eligiendo bases ortogonales en cada uno de eilos obtenemos una base ortonormal de V. En esta base la matriz de Q es

Como hemos ido de una base ortonormal a otra tambikn ortonormal, y como esto se ha conseguido por una matriz ortogonal, dada una matriz ortogonal real Q podemos encontrar una matriz ortogonal T tal que TQT- ' (= TQT*) es de la forma que acabamo~de describir.

5 10.

TRANSFORMACIONES HERMITIANAS, UNITARIAS Y NORMALES

Problemas

-

1. Determinese cuales de las siguientes matrices son unitarias, cuales hermitianas. cuales normales.

2. Para aquellas matrices del problema I que sean normales, encuintrense sus raices caracteristicas y llevense a la forma diagonal por una matriz unitaria.

3. Si T es unitaria, prutbese usando tan solo la definicion ( L ~ T T ) = u, (v, u) que T es no singular.
4. Si Q es una matriz ortogonal real. prutbese que det Q =

+I

5. Si Q es una matriz real simitrica que satisface Qk = I para k Z 1, prutbese que Q 2 = 1.
6. Complitese la prueba del lema 6.29 mostrando que (S+ T)* = S* + T* y (AT)* = AT*.

7. Prutbense las propiedades de * en el lema 6.29 haciendo uso de la forma explicita de w = uT* dada en la prueba del lema 6.28.
8. Si T es antihermitiana, pruibese que todas sus raices caracteristicas son imaginarias puras.
9. Si T es una matriz real antisimitrica n x n, prutbese que si n es impar entonces det T = 0.

10. Por un calculo matricial directo, prutbese que una matriz real sirnttrica 2 x 2 puede ser puesta en forrna diagonal por una ortogonal.
11. Cornpldtese la prueba delineada para la parte de equivalencia de matrices del teorema 6.2,.

352

TRANSFORMACIONES LINEALES - Cap. 6

12. Pruebese que una transformacion normal es unitaria si y solo si las raices caracteristicas son todas de valor absoluto igual a I . 13. Si N , , . . .. N, es un numero finito de transforrnaciones normales que conmutan. pruebese que existe una transformacion unitaria T tal que todas las T N , T ' son diagonales. 14. Si N es normal. pruebese que N * = p ( N ) para algun polinomio p ( x ) . 15. Si N es normal y si A N = 0 pruebese que A N * = 0. . 16. Pruebese que A es normal si y solo si A conmuta con AA*. 17. Si N es normal pruebese que N = Z L i E i donde E i 2 = E i , Ei* = E i , y las Li son las raices caracteristicas de N . ( A ksta se le llama la resolucibn espectral de N . ) 18. Si N es una transformacion normal sobre V y sif(x) y g ( x ) son dos polinomios primos relatives con coefi~ient~s reales, pruibese que si r f ( N ) = 0 y u , g ( N ) = 0 para r , u. en V , entonces (1:. u1) = 0. .

19. Pruebese que una transformacion lineal T sobre V es hermitiana si y solo si ( r T , 1.) es real para todo a € V.
20. Pruebese que T > 0 si y solo si T es hermitiana y tiene todas sus raices caracteristicas positivas. 21. Si A 2 0 y B a 0 y A B = BA, prudbese que A B 2 0. 22. Prukbese que si A negativa rinica.

a 0, entonces

A tiene una raiz cuadrada no

23. Si A 2 0 y ( r A , 11) = 0, prukbese que r A = 0.
24. a ) Si A

a 0 y A* conmuta con la transformacion hermitiana B, entonces A conmuta con B. b) Prutbese la parte ( a ) sin exigir que B sea hermitiano.

25. Sea A = ( a i j )una matriz n x n real simetrica. Sea

A, = ( a 1 1
a,,

...
a.a

als)

a,

a) Si A > 0, prutbese que A, > 0 para s = 1. 2, ...,n. b ) Si A > 0, prukbese que det A, > 0 para s = 1, 2, ..., n. c ) Si det A , > O para s = 1, 2, ..., n, prutbese que A >0. d) Si A 2 0, pruebese que A, 2 0 para s = 1, 2, n.

...,

1 11.

FORMAS CUADRATICAS REALES

363

e) Si A 2 0, pruCbese que det A, 2 0 para s = 1, 2, ...,n. j ) Proporcionese un ejemplo de una A tal que det A, 2 0 para toda s = 1,2, ..., n y, sin embargo, A no sea no negativo.

26. Prudbese que cualquier matriz compleja puede ser llevada a la forma triangular por una matriz unitaria.

Cerramos el capitulo con una breve discusi6n sobre formas cuadrhticas sobre el campo de 10s numeros reales. Sea V un espacio real con producto interior y supongamos que A es una transformaci6n lineal (real) simdtrica sobre V. La funci6n valuada en el campo real Q(u) definida sobre V por Q(v) = (vA, v) se llama la jorma cuadratica asociada con A. Si consideramos, c6mo podemos hacer sin p4rdida de generalidad, que A es una matriz simdtrica real n x n, (all) actuando sobre F(") y que el producto interior para (S,, ..., 6,) y (y,, ..., y,) en Fen) es el nlimero real S, y, +S2 y2 ... +Sn y,, para un vector arbitrario v = (x,, ...,xn) en Fen), un simple ciilculo muestra que Q(v) = (vA, v) = a,, x, ... +a,,xn2 + 2 C ailxixl.

+

+

i< j

y, , x i 2 +

Por otra parte, dada una funci6n cuadriitica cualquiera en n variables .. . ynnxn2+2 yijxix,, con coeficientes reales y,], es claro C

+

que podemos realizarla como la forma cuadratica asociada con la matriz real simCtrica C = (y,]). En el espacio euclidiano n-dimensional una funci6n cuadrhtica sirve para definir las superficies cuadricas. Por ejemplo, en el plano real la forma ax2+Pxy+ yy2 & lugar a una secci6n c6nica (posiblemente con su eje mayor inclinado). No es ildgico pensar que las propiedades geomitricas de esta secci6n c6nica deben estar ligadas intimamente con la matriz simdtrica

r<i

con la que su forma cuadratica estii asociada. Recordemos que en geometria analitica elemental se prueba que por una rotaci6n de ejes adecuada la ecuacion ax2+/3xy+ yy2 puede, en el Recornuevo sistema de coordenadas, tomar la forma a, ( x ' ) ~ y, (Y')~. demos que a , + y , = a + y y ay-/3'/4 = a, y,. Luego a, y y, son las rakes caracterbticas de la matriz

+

354

TRANSFORMACIONES LIN.EALES

- Cap. 6

la rotacion de ejes es tan solo un cambio de bases por una transformacion ortogonal, y lo que hicimos en la geometria fue simplemente llevar la matriz simetrica a su forma diagonal por una matriz ortogonal. La naturaleza de ax2+Dxy+ y y 2 como conica estaba basicamente determinada por la magnitud y signo de sus raices caracteristicas a , y y , . Una discusion analoga puede llevarse a efecto para clasificar las superficies cuadricas en el espacio tridimensional y, ciertamente, para supeficies cuadricas en espacios de dimension n. Lo que esencialmente determina la naturaleza geometrica de la superficie cuhdrica asociada con a , , x , + . . . + a,,xn2 + 2 a i j x i x j es la magnitud y signo de las raices caracteristicas de
i< j

la matriz ( a i j ) . Si no estuviesemos interesados en el achatamiento relativo de la superficie cuadrica (por ejemplo, si consideramos una elipse como una circunferencia aplastada), entonces podriamos ignorar la magnitud de las raices caracteristicas distintas de cero y el factor determinante de la forma de la superficie cuidrica seria el nlimero de raices caracteristicas 0 y el nlimero de positivas (y de negativas). Estas cosas motivan, y al mismo tiempo se clarifican en ella, la discusion que sigue, que culmina en la ley de inercia de Sylrester. Sea A una matriz real simetrica y consideremos su forma cuadratica asociada Q ( I . ) ((.A, 1.). Si T es una transformacion lineal real no singular = cualquiera, dado ~ E F ' " 'I. = u ' T para alglin weF("),de donde ((,A, v) = , (ulTA, wT) = (u'TAT', w ) . Luego A y TAT'definen, efectivamente, la misma forma cuadritica. Sugiere esto la siguiente

D E F I N I C I ~ N . matrices simttricas reales A y B son congruente3 si hay DOS una matriz real no singular T tal que B = TAT'.
LEMA 6.39. La congruencia es una relacidn de equitlalencia.
Prueba. Escribamos, cuando A es congruente a B, A

r B.

1) A = A pues A = I A l ' .

2) Si A r B entonces B = TAT' donde T es no singular, de donde A = SBS' donde S = T - I . Luego B r A.
3) Si A r B y B r C, entonces B = TAT' mientras que C = RBR', de donde C = RTAT'R' = (RT)A(RT)', y por tanto A z C. Corno la relacion satisface las condiciones definitorias para una relacidn de equivalencia, el lema queda probado. El principal teorema que concierne a las congruencias es su caracterizacicin, contenida en la fey de Sylvester.

1 11.

FORMAS CUADRATICAS REALES

366

TEOREMA ~ Dada la matriz real simkrrica A hay una matriz inoerrible 6 . ~ .
T tal que

donde I, e I, son respecrivamenre las matrices unirarias r x r y s x s y donde 0, es la 0 matriz t x t. Los enreros r+s, el rango de A, y r-s, la signatura de A, caracrerizan la clase de congruencia de A. Es decir, dos matrices sirnktricas reales son congruenres si y sblo si tienen el mismo rango y la misma s i g ~ t u r a . Prueba. Como A es real simktrica sus raices caracteristicas son todas reales; Sean I , , ..., I , sus raices caracteristicas positivas y - I , + , , ..,&+, sus raices negativas. Por la discusi6n al final de la secci6n 10 podemos encontrar una matriz ortogonal real C tal que

.

donde r = n - r -s. Sea D la matriz diagonal real

TRANSFORMACIONES LINEALES

- Cap. 6

un simple ciilculo muestra que

'

Luego hay 'una matriz de la forma requerida en la clase de congruencia de A. Nuestra tarea es ahora demostrar que esta es la unica matriz en la clase de congruencia de A de esta forma o. lo que es equivalente. que

son congruentes solamente si r = r', s = s' y t = t'. Supongamos que M = TLT' donde T es invertible. Por el lema 6.3 el rango de M es igual al de L: como el rango de M es n- t' mientras que el de L es n - t , tenemos, t = t'. Supongamos que r < r': como n = r + s + t = r1+s'+ t', y como t = t'. debemos tener s > s'. Sea U el subespacio de F ( " )de todos 10s vectores que tienen las primeras y las ultimas t coordenadas iguales a 0; U es de dimensibn s y'para rr # Oen U,(uL, u) < 0. Sea W el subespacio de F'"' para el que 10s componentes r'+ I, ..., r ' + s son todos 0; sobre W, (wM. 1 ~ 2 0 para cualquier W E W. Como T es ) invertible, y como W es (n - s')-dimensional, WT es (n -sl)-dimensional. Para U ~ E (u~M, 2 0; de donde (wTLT', w ) 2 0; es decir, (wTL. uyT) 2 0. W, u') Por tanto, sobre WT, (u,TL, 1cT) 2 0 para todos 10s elementos. Ahora bien, dim (WT)+dim (U) = (n-s')+r = n+s-sf > n; luego seglin el corolario a1 lema 4.8, WTn U # 0. Pero esto no tiene sentido, pues si x # OE WTn U , por una parte, estando en U,(xL, x) < 0, mientras que por la otra, estando en WT, (xL. x) 2 0. Luego r = r' y s = s'. El rango r+s, y la signatura r-s, determinan desde luego r y s, y por lo tanto t = (n- r-s), de donde determinan la clase de congruencia.

Problemas
1. Determinense el rango y la signatura de cada una de las siguientes formas cuadriiticas reales:

a)

X,

+'2xI xr + x Z 2 .

6) x , 2 + x , x z + 2 x , x 3 + 2 x 2 2 + 4 ~ 2 ~ 3 + 2 x 3 2 .

8 11.

FORMAS CUADRATICAS REALES

367

2. Si A es una matriz simktrica con entradas complejas, prudbese que podemos encontrar una matriz invertible compleja B tal que

y que r , el rango de A, determina la clase de congruencia de A respecto a la congruencia compleja.

3. Si Fes un campo de caracteristica diferente de 2, dada AEF,, que existe una BE F tal que BAB' es diagonal. ,

pmdbese

4. PruCbese que el resultado del problema 3 es falso si la caracteristica de F es 2.

HALMOS, PAUL R. Finite Dimensional Vector Spaces, segunda edici6n. D. Van Nostrand Company, Inc.. Princeton, Nueva Jersey, 1958.

Topicos selectos

EN ESTE liltimo capltulo nos hemos marcado dos objetivos. El primero de ellos es presentar algunos resultados matemfiticos que penetren m8s profundamente que la mayor parte del material que hasta ahora hemos visto, resultados que Sean mas sofrsticados y un poco apartados del desarrollo general que hemos seguido. Nuestro segundo objetivo es escoger resultados de esta clase cuya discusi6n, ademas. haga uso de una gran seccion transversa de ideas y teoremas de 10s anteriormente expuestos en este libro. Con estas tinalidades en mente hemos escogido tres temas como puntos focales de este capitulo. El primero de estos es un teorema famoso probado por Wedderburn en 1905 ("A Theorem on Finite Algebras". Transactions o the- American f

360

TOPICOS SELECTOS

- Cap. 7

Mathematical Society, vo1.6 (1905), paginas 349-352) que afirma que un anillo con divisidn que tiene solamente un numero finito de elementos debe ser un campo conmutativo. Daremos dos pruebas de este teorema, totalmente diferentes una de otra. La primera seguira fielmente la prueba original de Wedderburn y usara un argument0 tip0 conteo; se apoyara en gran medida sobre resultados que desarrollamos en el capitulo sobre teoria de grupos. La segunda usara una mezcla de argumentos de la teoria de grupos y de la teoria de campos. y sacarh un gran partido del material que estudiamos en estas dos teorias. La segunda prueba tiene la evidente ventaja de que en su curso de ejecuci6n obtendremos ciertos resultados colaterales que nos permitirhn proceder a la prueba, en el caso de 10s anillos con division, de un ,bell0 teorema debido a Jacobson ("Structure Theory for f Algebraic Algebras of Bounded Degree", Annals o Mathematics, vol. 46 (1945). paginas 695-707) que es una generalization de gran alcance del teorema de Wedderburn. Nuestro segundo gran tema es un teorema debido a Frobenius ("Uber lineare Substitutionen und bilinearen Formen", Rerue fiir die reine und angewandte Mathematik, vol. 84 (1877). especialmente las phginas 59-63) anillos con division algebraicos sobre el campo de que afirma que 10s ~inicos todos 10s numeros reales son el campo de 10s numeros reales, el campo de 10s numeros complejos y el anillo con division de 10s cuaternios reales. El teorema sefiala un papel linico para 10s cuaternios y es sorprendente, en cierto modo, que Hamilton 10s descubriera en su forma, podriamos decir, un poco ad hoc. Nuestra prueba del teorema de Frobenius, ahora completamente elemental, es una variacion de un enfoque marcado por Dickson y Albert; empleara resultados de la teoria de polinomios y de la teoria de campos. Nuestro tercer objetivo es el teorema de que todo entero positivo puede representarse como la suma de cuatro cuadrados. Este famoso resultado parece que fue conjeturado ya por el primitivo matemhtico griego Diofantos. Fermat trabaj6 en su demostraci6n sin tixito y anuncio con tristeza su derrota (en un escrito donde el, sin embargo, resolvi6 el teorema de 10s dos cuadrados que nosotros probamos en la secci6n 8 del capitulo 3). Euler abrio grandes brechas que, aprovechadas por Lagrange, permitieron que Cste, en 1770, diera una primera prueba completa. Nuestro enfoque serh completamente distinto del de Lagrange. Tiene sus raices en el trabajo de Adolfo Hurwitz y empleara una generalizaci6n de 10s anillos euclidianos. Usando nuestras tecnicas de teoria de anillos sobre un cierto anillo de cuaternios, el teorema de Lagrange caera como una consecuencia. En nuestra marcha hacia el establecimiento de estos teoremas, cosecharemos muchas ideas y resultados interesantes de por sl. Esto es caracteristico de un buen teorema - su prueba invariablemente conduce a resultados colaterales de casi igual interts.

1. CAMPOS FINITOS

Antes que podamos entrar en una discusion del teorema de Wedderburn y de 10s anillos finitos con division, es esencial que investiguemos la naturaleza de 10s campos que tienen solo un numero finito de elementos. Tales campos se llaman camposfinitos. Es claro que existen campos finitos, pues el anillo Jp de 10s enteros modulo cualquier primo p nos da un ejemplo de tal campo. En esta secci6n determinaremos todos 10s posibles campos finitos y muchas de las importantes propiedades que poseen. Comenzamos con el LEMA 7.1. Sea F un campo finito con q elementos y supongamos que F c K donde K es tambikn un campo finito. Entonces K tiene q" elementos donde n = [ K :4.
Prueba. K es un espacio vectorial sobre F y como K es finito es ciertamente de dimension finita como espacio vectorial sobre F. Supongarnos que [K: F ] = n ; entonces K tiene una base de n elementos sobre F. Sea r , , . .., i:, una tal base. Entonces todo elemento en K tiene una representacion linica en la formaa,o,+a,c,+ ... +anondondea,, a ,,..., a, esdn todasen F. Asi pues, el numero de elementos en K es el numero de a, L', + a, V , + ... + anrnque se producen cuando las I,, a,, . .., a,, van tomando valores sobre F. Como cada coeficiente puede tomar q valores, K debe tener q" elementos.
,

COROLARIO Sea F un campofinito; entonces F tiene pmelementos donde I. el nrimero primo p es la caracteristica de F.
Prueba. Como F tiene un numero finito de elementos, el corolario 2 al teorema 2.a, f l = 0 donde f es el numero de elementos de F. Asi pues, F tiene caracteristica p para algljn numero primo p. Por tanto F contiene un campo Fo isomorfo a J p . Como Fo tiene p elementos, F tiene pm elementos donde m = [ F : Fo] segun el lema 7.1.

COROLARIO Si el campo finito F tiene pm elementos, entonces todo a € F 2.
satisface a
Pn =

a.

Prueba. Si a = 0, la afirmacion del corolario es trivialmente cierta.

Por otra parte, 10s elementos distintos de cero de F forman un grupo bajo la multiplicaci6n de orden pm- I, luego, segun el corolario 2 al teorema 2.a. aPm-' = I para todo a # 0 en F. Multiplicando esta relacion por a obtenemos aPm= a. De este ljltimo corolario podemos ficilmente pasar al

302

TOPICOS SELECTOS

- Cap. 7

LEMA 7.2. Si el campo jinito F tiene pm elementos, entonces el polinomb xP"'- x en F [ x ] se ,factoriza en F [ x ] como xP"'- x = l ( x - A). l
LEF

Prueba. De acuerdo con el lema 5.2, el polinomio xp"'-x tiene cuando mas pm raices en F. Pero, segun el corolario 2 a1 lema 7.1, conocemos p" de tales raices, a saber, todos 10s elementos de F. Por el corolario al lema 5.1 l podemos concluir que xP"'-x = l ( x - A ) .
AEF

COROLARIO. el campo F tiene pm elementos, entonces F es el campo de Si descomposicibn del polinomio xp" - x.
Prueba. Por el lema 7.2, xp"'-x se descompone en F. Pero no puede descomponerse en un campo mas pequeiio. porque ese campo tendria que tener todas las raices de este polinomio y, por tanto, tendria que tener al menos pm elementos. De esta manera, F es el campo de descomposicion de

xP"'- X.

Como vimos en el capitulo 5 (teorema 5.j) cualesquiera dos campos de descomposicion sobre un campo dado de un polinomio dado son isomorfos. A la luz del corolario al lema 7.2 podemos enunciar 7.3. Cualesquiera dos campos finitos 9ue tienen el mismo ntimero LEMA de elementos son isomorfos.
Prueba. Si estos campos tienen pm elementos, por el anterior corolario ambos son campos de descomposici6n del polinomio x P m - x , sobre J,. luego ambos son isomorfos.

Asi pues, para cualquier entero m y cualquier numero primo p hay, salvo isomorfismo, cuando mas un campo que tienepmelementos. El proposito del proximo lema es demostrar que para cualquier numero primo p y cualquier entero m hay un campo que tiene pm elementos. Cuando hayamos hecho esto, sabremos que hay exactamente un campo con pm elementos, donde p es un primo arbitrario y m entero arbitrario. LEMA 7.4. Para todo numero primo p y todo entero posirivo m exisre un campo con pm elementos.
Prueba. Consideremos el polinomio x P m - x en J,[x], el anillo de polinomios en x sobre J,, el campo de 10s enteros mod p. Sea K el campo a ~ de descomposici6n de este polinomio. En K sea F = { a ~ K l = a } . Los elementos de F son, pues, las raices de x p - x que, seglin el corolario 2 a1 lema 5.6 son distintas, de donde F tiene pmelementos. Afirmamos ahora que

4 1.

CAMPOS FlNlTOS

363

F es un campo. Si a, b E F, entonces up" = a, bP"' = b, y asi ( ~ b ) ~= ar" bP"' "' = ab; luego abeF. Ademas, como la caracteristica es p, (a+b)"' = aPmf bPm= a k b , de donde a_+beF. Por consiguiente Fes un subcampo de K y, por tanto, un campo. A mostrar que el campo F tiene pm elementos, 1 hemos probado el lema 7.4.
Combinando 10s lemas 7.3 y 7.4, tenemos
TEOREMA 7.A. Para todo nljmero primo p y todo entero positiro m, hay un campo ljnico 9ue tiene pmelemenros.

Volvamos ahora, por un momento, a la teoria de Ics grupos. El resultado de la teoria de 10s grupos que buscamos, determinarl la estructura de cualquier subgrupo rnultiplicativo finito del grupo de elementos distintos de cero de un campo y, en particular, determinara la estructura multiplicativa de cualquier campo finito.
LEMA Sea G un grupo abeliano Jinito con la propiedad de que la 7.5. relacidn x" = e se satisface por, a lo mas. n elementos de G, para todo entero n. Entonces G es un grupo ciclico.
Prueba. Si el orden de G es una potencia de algun numero primo y entonces el resultado es muy sencillo. Supongamos, en efecto, que a e G es un elemento cuyo orden es todo lo grande que sea posible; su orden debe ser q' para algun entero r. Los elementos e, a, a', ..., aq'-' nos dan 9' soluciones distintas de la ecuaci6n xqr = e que, por nuestra hipbtesis, implica que estas son todas las soluciones de la ecuaci6n. Ahora bien, si beG, su orden es q" donde s < r , de donde b = (bq')q'-' = e. Por la ' observaci6n anteriormente hecha, esto obliga a que b = a' para algdn i, y por lo tanto G es ciclico. El grupo abeliano finito general G, puede realizarse como G = S,, S,, .. . Sqkdonde las qi son 10s distintos divisores primos de o ( G ) y donde 10s S~ son 10s subgrupos de Sylow de G. Ademas, todo elemento g e G puede escribirse de forma Jinica como g = s, s,. ..s,, donde si€Sqi (vCase la seccidn 7, capitulo 2). Cualquier soluci6n de 2 = e en Sqi es una de x" = e ' en G , de forma que todo Sqi hereda la hip6tesis que hemos impuesto sobre G. Por las observaciones del primer parrafo de la prueba, cada S,, es un grupo ciclico; sea a i un generador de Sqi Afirmamos que c = a , a,. ..a, es un generador ciclico de G. Para verificar esto, todo lo que tenemos que hacer es probar que o ( G ) divide a m, el orden de c. Como c = e, tenemos ' " que a I m a z m.. a,"' = e. Por la unicidad de la representation de un elemento . de G como un product0 de elementos en las S,,, concluimos que aim = e para ioda i. Luego o ( S q i ) J mpara toda i. Luego o ( G ) = o(Sqi)o(Sq,) ... o(S,,)(m. Pero m ( o ( G ) , luego o ( G ) = m. Lo que prueba que G es ciclico.

.

364

TOPICOS SELECTOS

- Cap. 7

El lema 7.5 tiene una consecuencia importante.
7.6. LEMA Sea K un campo y sea G un subgrupo finito del grupo multiplicatilio de elementos distintos de cero de K. Entonces G es un grupo ciclico.
Prueba. Como K es un campo, cualquier polinomio de grado n en K [ x ] tiene cuando mas n raices en K. Luego, en particular, para cualquier entero n. el polinomio i -I tiene cuando mas n raices en K, y tambikn cuando mls, n raices en G, evidentemente. La hipotesis del lema 7.5 se satisface, luego G es ciclico.

Aun cuando la situation de un campo finito es un caso particular tan solo del lema 7.6, es de interks en tantos campos que lo subrayamos enunciandolo corno un TEOREMA El grupo multiplicatii~ode elementos distintos de cero de un 7.8. campo finito es ciclico.
Prueba. Sea F un campo finito. Aplicando simplemente el lema 7.6 con F = K y G = grupo de elementos distintos de cero de F, tenemos el resultado.

Concluimos esta seccion usando un argument0 de conteo para probar la existencia de soluciones de ciertas ecuaciones en un carnpo finito. Necesitaremos el resultado en una demostracion del teorerna de Wedderburn.
7.7. LEMA Si F es un campofinito y a # 0, /? # 0 son dos elementos de F, entonces p o d e m encontrar elementos a y b en F tales que I aa2 +/?b2 = 0.

+

Prueba. Si la caracteristica de F es 2, F tiene 2" elementos y cada elernento x en F satisface x2" = X . Asi pues, cada elemento en F es un cuadrado. En particular a- ' = a2 para alguna ae F. Usando esta a y b = 0 tenemos l +aa2 + /?b2 = I +aa- ' +O = 1 + 1 = 0, en donde la liltima igualdad es una consecuencia d.el hecho de que la caracteristica de F es 2. Si la caracteristicade Fes un ndmero impar primop, F tiene p" elernentos. Sea Wa = {I +ax21xeF). iCuhntos elementos hay en W,? Debemos cornprobar cuantas veces I +ax2 = I +ay2, Pero esta relacion obliga a que ax2 = ay2 y, pot tanto, corno a # 0, a que x2 = y 2 . Finalmente, esto nos lleva a que x = fy. Luego para x # 0 tenemos de cada par x y - x un elemento en W , y para x = 0 obtenemos I E W,. Luego W , tiene p"+l elementos. Anhlagamente Wp = { -/?x21 x E F } tiene I + -pR-l =2 2

p"+l elementos. Corno tanto
2

Wa como Wp tiene miis de la mitad de 10s

$ 2 . TEOREMA DE WEDDERBURN SOBRE ANILLOS FlNlTOa CON DIVISION

365

elementos de F deben tener una interseccion no vacia. Sea CE W , n W g. Como C E W,, c = l +aa2 para algun a c F ; como c c W p , c = -/3b2 para algun ~ E F Por tanto, l + a a 2 = -Bb2, que por transposicion nos da el . resultado deseado, I +aa2 +/3b2 = 0.
Problemas

1. De acuerdo con el teorema 7.b, 10s elementos distintos de cero de J , forman un grupo ciclico bajo la multiplicaci6n. Cualquier generador de este grupo se llama una raiz primiti~lade p. a ) Encukntrense las raices primitivas de: 17, 23, 3 1. b) ~Cuantas raices primitivas tiene un primo p?

2. Usando el teorema 7b pruebese que x 2 solo si el primo impar p es de la forma 4n+ 1.

=

- 1 mod p es soluble si y

3. Si a es un entero no divisible por el primo impar p pruCbese que x2 = a mod p es soluble para alglin entero x si y solo si a ' ~ - " ' r 1 mod p. ~ (Se llama a esto el criterio de Euler para que a sea un residuo cuadratico mod p.)
4. Usando el resultado del problema 3 determinese si a ) 3 es un cuadrado mod 17. b ) 10 es un cuadrado mod 13.

5. Si el campo F tiene pn elementos prukbese que 10s automorfismos de F forman un grupo ciclico de orden n.
6. Si F es un campo finito, por 10s cuaternios sobre F entenderemos el conjunto de todos 10s a , + a , i + a , j + a , k donde a,, a , , a , , a , € F y donde la suma y la multiplicacion se efectuan como en 10s cuaternios reales (es decir, i2 = j2 = k2 = ijk = - I, etc.). PruCbese que 10s cuaternios sobre un s campo finito no forman un anillo con division.

2. TEOREMA D E WEDDERBURN SOBRE ANILLOS FINITOS CON DIVISION
En 1905, Wedderburn prob6 el teorema, considerado ahora como clasico, de que un anillo finito con division debia ser un campo conmutativo. Este resultado ha captado la imaginacion de la mayoria de 10s matemhticos, por lo inesperado de su contenido en que dos cosas aparentemente tan ajenas como son el numero de elementos de un cierto sistema algebraic0 y la multiplicacion en ese sistema, aparecen de pronto en una estrecha interrelacion. Aparte de su intrinseca belleza el resultado ha sido muy-importante

366

TOPICOS SELECTOS - Cap. 7

y litil. pues surge en 10s m b variados contextos. Para citar solo un ejemplo;

la unica prueba conocida del hecho puramente geomktrico de que en una geometria finita la configuracion de Desargues implica la de Pappus (para la definicion de estos terminos vCase cualquier buen texto de geometria proyectiva) consiste en reducir el problema geomttrico a uno algebraico, y este problema algebraico tiene una solucion basada en el teorema de Wedderburn. Para 10s algebristas, el teorema de Wedderburn ha' servido como trampolin para saltar a una gran Brea de investigacion, durante algunas decadas, concerniente a la conmutatividad de anillos.
TEOREMA~ .Un anillo finito con dirisidn es necesariamente un campo 7.

conmutatiro. Primeraprueba. Sea K un anillo finito con division y sea Z = {zEKI zx = xz para todo x e K ) su centro. Si Z tiene q elementos entonces, como en la prueba del lema 7. I, se sigue que K tiene qnelementos. Nuestro objetivo es probar que Z = K, o lo que es equivalente, que n = 1. Si aeK, sea N(a) = {xeKlxa = ax). N(a) claramente contiene a Z, y, como una simple comprobacion revela, N(a) es un subanillo con division de K. Asi pues, N(a) contiene qn'"' elementos para algun entero n(a). Afirmamos que n(a) divide a n. En efecto, 10s elementos distintos de cero de N(a) forman un subgrupo de orden qn'"'- 1 del grupo, bajo la multiplication, de elementos distintos de cero de K, que tiene qn- I elementos. De acuerdo con el teorema de Lagrange (teorema 2.a) q n ( " ) - 1 es un divisor de q n - 1 ; per0 esto obliga a que n(a) sea un divisor d e n (vease el problema I al final de esta seccion). En el grupo de elementos distintos de cero de K tenemos la relacion de conjugacion usada en el capitulo 2, a saber, a es conjugado de b si a = x - bx para algun x # 0 en K. Segun el teorema 2.h el numero de elementos de K conjugados de a es el indice del normalizador de a en el grupo de elementos distintos de cero de

'

K. Por tanto, el numero de conjugados de a en K es - Aliora bien, . qnlo) I a e Z si y solo si n(a) = n, luego, por la ecuacion de clase (vease el corolario al teorema 2.h)

qn - 1

donde la suma es efectuada sobre una a en cada clase conjugada para a no en el centro. El problema se ha reducido a probar que ninguna ecuacion tal como la (I) puede verificarse en 10s enteros. Hasta este punto hemos seguido la prueba del articulo original de Wedderburn con casi absoluta fidelidad. Wedderburn

12.

TEOREMA D E W E D D E R B U R N SOBRE ANILLOS FlNlTOS CON DIVISION

367

prosigue hasta desechar la posibilidad de la ecuacidn ( I ) haciendo uso del siguiente resultado de la teoria de numeros debido a Birkhoff y Vandiver: para n > 1 existe un numero primo que es un divisor de qn- I , pero no es un divisor de ningun qm- l donde m es un divisor propio de n, con las excepciones de 26- 1 = 63 cuyos factores primos ya se presentaron como divisores de 22- I y 2 3 - 1, y n = 2, y 9 un primo de la forma 2'- 1. Si admitimos este resultado, ~comoacabariamos la prueba? Este numero primo seria un divisor del primer miembro de (I) y tambien un divisor de cada ttrmino de la suma que aparece en el segundo miembro pues divide a qn- I , pero no a q"'"' - I ;luego este primo dividiria tambien a q- I dAndonos una contradiccion. El caso 26- 1 se tendria tambikn que desechar, pero esto es sencillo. En el caso n = 2, la otra posibilidad no cubierta por el anterior argumento, no hay ningun subcampo entre Z y K lo que obliga a que Z = K. (iprutbese! Vtase el problema 2.) Pero no queremos aplicar el resultado de Birkhoff y Vandiver sin probarlo y su prueba nos llevaria a una digresion demasiado larga. Buscamos, pues, otro artificio. Nuestra finalidad es encontrar un entero que divida a qn- 1 , para todos 10s divisores n(a) de n, pero que no divida a q - I. Una

p') 1 -

vez hecho esto, la ecuacion (I) sera imposible salvo para n = I y, por tanto, el teorema de Wedderburn habra sido probado. El medio que emplearemos con este proposito es la teoria de polinomios ciclot6micos. (Los hemos mencionado en 10s problemas al final de la secci6n 6, capitulo 5.) Consideremos el p'olinomio x" - 1 como elemento de C[x] donde C es el campo de 10s nlimeros complejos. En C[x]

donde este producto se toma sobre todos 10s 1que satisfacen 2 = 1. Un numero complejo 0 se dice que es una raiz primitiva n-ksima de la unidad si 8" = 1 pero 8m # I para cualquier entero positivo m c n. Los numeros complejos que satisfacen x" = 1 forman un subgrupo finito, bajo la multiplicacidn, de 10s numeros complejos, de donde, seglin el teorema 7.b, este grupo es ciclico. Cualquier generador ciclico de este gr'upo debe, entonces, ser una raiz nCsima primitiva de la unidad, de donde sabemos que tales rakes primitivas existen. (Alternativamente, 0 = eZXi'" nos da una raiz primitiva de la unidad.) Sea @,(x) = n(x-0) donde este producto se toma sobre todas las raices n-tsimas primitivas de la unidad. Este polinomio se llama polinomio ciclotdmico. Enumeramos 10s primeros polinomios ciclotornicos: @, (x) = x-l,@,(x) = X + 1,rn3(x) = x 2 + x + I,@.+(x) x ~ + ~ , @ ~ ( x 4)+ x 3 + = = x x 2 + x + 1, Q6(x) = x2-x+ I . Notese que todos ellos son polinomios m6nimos con coeficientes enteros.

368

TOPlCOS SELECTOS

- Cap. 7

Nuestro primer objetivo es probar que, en general, @,(x) es un polinomib m6nico con coeficientes enteros. Reagrupamos la forma factorizada de 3- I como se nos da en (2), y obtenemos

Por induccion, suponemos que ad(x)es un polinomio m6nico con coeficientes enteros para d 1 n, d # n. Luego 2 - l = mn(x)g(x) donde g(x) es un ' polinomio monico con coeficientes enteros. Por tanto

que, a1 dividirse realmente (o por comparacion de coeficientes), nos dice que mn(x)es un polinomio monico con coeficientes enteros. Afirmarnos ahora que para cualquier divisor d de n, donde d # n,

en el sentido de aue el cociente es un volinomio con coeficientes enteros. Para ver esto observemos primer0 qui xd- I = mk(x), y como todo

n
kid

divisor de d es tambitn un divisor de n, reagrupando ttrminos en el segundo miembto de (3) obtenemos xd- 1 sobre el segundo miembro; ademhs, como d < n, xd- l no envuelve a @,(x). Por tanto, Y - 1 = @,(x) (xd- l)f(x) donde f (x) = Qk(x) tiene coeficientes enteros y por tanto

n
kin

k +d

on (x)

I=
xd- l

en el sentido de que el cociente es un polinomio con 'coeficientes enteros. Y esto establece nuestra afirrnacion. Para cualquier entero t, @,(t) es un entero y, por lo anteriormente dicho, como un entero divide a (tn- l)((td- I). En particular, volviendo a la ecuacion (I),

y @,(q)I (qn- I ) ; luego por (I), @,(q) l(q - 1). Afirmamos, sin embargo., que si n > 1 entonces I@,(q))> q- I . Pues @,(q) = n(q-8) donde 8 toma 10s valores de todas las raices primitivas n-tsimas de la unidad y Jq- 8 ) > q- 1 para todo 8 # 1 una raiz de la unidad (prutbese) de donde IcDn(q)l =

12.

TEOREMA DE WEDDERBURN SOBRE ANILLOS FlNlTOS CON DIVISION

369

IlI(/- 01 > q - I . Es claro entonces que @,(q) no puede dividir a q - I. lo que nos lleva a una contradiccion. Debemos por tanto suponer que n = 1. lo que obliga a admitir el teorema de Wedderburn.

Segundaprueha. Antes de examinar explicitamente 10s anillos finitos con division una vez mhs, probamos algunos lemas preliminares.

7.8. LEMA Sea R un anillo y sea a€ R. Sea Ta la aplicacidn de R en si mismo dejnida por xTa = xu - ux. Entonces

Prueba. iQue es X T , ~ ?xTa2 = (xTa)Ta= (xu-ax)Ta = ( x u - a x ) a a(xa-ax) = xu2 -2axa+a2x. iQui podemos decir acerca de X T , ~ ? xTa3 = ( x T a 2 ) T a= ( x u 2 - 2 a x a + a 2 x ) a - a ( x a 2 - 2 a x a + a 2 x ) = xu33axa2 3a2xa-a3x. Continuando de esta forma o por induction. obtenemos

+

el resultado del lema 7.8. COROLARIO. R es un anillo en el que px = 0 para toda XE-R,donde p es Si un numero primo. entonces xTaPm xuPn' apn'x. = Prueba. De acuerdo con la f6rmula del lema 7.8, si p = 2, XT,' = x u 2 - a 2 x , ya que 2axa = 0 Asi pues. ,xTa4 = ( x u 2 - a 2 x ) a 2- a 2 ( x a 2 . a 2 x ) = xu4-a4x, y asi sucesivamente hasta xTa2".

Sip es u n primo impar. de nuevo, seg~in formula del lema 7.8. la

y como

para i < p , todos 10s tirminos medios desaparecen y nos quedamos con xTaP = xuP-aPx = xTaP. Ahora bien, xTaP2= X(T,,,)~ = xTaP2.y asl sucesivamente por las potencias mhs altas dep.

7.9. Sea D un anillo con dirlisidn de caracteristica p > 0 con cenfro 2, LEMA y sea P = {O, 1, 2, . . ., (p- 1)) el subcampo de Z isomorfo a J,. Sapongarnos

370

TOPICOS SELECTOS - Cap. 7

que a€ D, a $ Z es tal que aP" = a para algrin n 2 I. Entonces existe una x i D tal que I ) xax-' # a . 2) xax- E P(a), el campo obtenidopor la adjuncibn de a a P.

'

Prueba. Definamos la aplicacion Ta de D en si mismo por yTa = ya-ay para todo Y E D. P(a) es un campo finito, ya que a es algebraic0 sobre P y tiene, digamos, pm elementos. Todos ellos satisfacen up" = u. De acuerdo con el corolario al lema 7.8, yTaPm= yap" - up"y = ya-ay = yTa, luego Tap"'= Ta. Ahora bien, si AE P(a), (Ax)Ta= (1x)a-a(1x) =ixa- l a x =A(xa-ax) = i.(xTa),ya que A conmuta con a. Asi pues, la aplicacion A de D en si mismo 1 definida por 1I:y +Ay conmuta con Ta para todo AE P(a). Ahora bien, el (u - A ) por el lema 7.2. Como Ta conmufa con polinomio up"'- u =
I. E P ( a )

n

l.I para fodo I E P(a), y como T~~~ T a , tenemos que 0 = T,~"- Ta = =
Si para todo 1 # 0 en P(a), Ta-11 no aniquila a ningun elemento distinto de cero en D (si y ( T a - i f ) - 0 implica y = 0), como T a ( T a - I ,I ) .. . (Ta- 1 I ) = 0,donde 1., , ..., I, son 10s elementos distintos de cero de P(a), , tendriamos, Ta = 0. Es decir, 0 = yTa = ya-ay para todo ED, lo que obligaria a que a e Z en contra de la hipotesis. Luego hay un i. # 0 en P(a) y un x # 0 en D tales que x(Ta-AI) = 0 Escribiendo esto explicitamente, . xu-ax-).x = 0;de donde xax- = a+;, esta en P(a) y no es igual a a ya que I # 0 Lo que prueba el lema. .

'

COROLARIO. el lema 7.9, xaxEn

' = a'

# a para alglin entero i.

Prueba. Sea a de orden s; entonces en el campo P(a) todas las raices del " " polinomio u I son I , a, a2. ..., a ' ya que estas son, todas, raices distintas y son s en total. Como (xax-I)" xu"-' = I, y como xax- ' E P(a),xax- es una raiz en P(a)de u I , de donde xax- ' = a'. "
Tenemos ya todas las piezas que necesitabamos para efectuar nuestra segunda prueba del teorema de Wedderburn. Sea D un anillo finito con division y sea Z su centro. Por induccion, podemos suponer que cualquier anillo con division que tenga menos elementos que D es un campo conmutativo. Hagamos notar primer0 que si a, ED son tales que b'a = ab' pero ba # ab, entonces ~ ' E ZEn efecto, consideremos N(bl) = {xEDIb'x = . xb'). N(bl)es un subanillo con division de D; si no fuera D, por nuestra hipotesis de induccion seria conmutativo. Pero tanto a como b se encuentran en N(bl)y no conmutan, luego N(bl)no es conmutativo, luego debe ser todo D. Luego ~ ' E Z .

5 2.

TEOREMA DE W E D D E R B U R N SOBRE ANILLOS FlNlTOS CON DIVISION

371

Todo elemento distinto de cero en D tiene orden finito; luego alguna potencia positiva de el cae en Z . Dado W E Dsea el orden de w relativo a Z el entero positivo minimo m(u1) tal que u."'~""EZ. Escojamos un elemento a en D, per0 no en Z , que tenga el minimo orden relativo a Z posible, y sea tal orden r. A.firmamos que r es un nljmero prirno, pues si r = r , r , con I < r , < r , < r. entonces a'' no esta en Z . per0 (ar')" = a r e Z , luego a" tiene un orden relativo a Z menor que el de a. Por el corolario al lema 7.9, hay un X E D tal que xax- = a' # a ; = x(xax- ' ) x - ' = x a i x - ' = (xax- I ) ' = (ai)' = ai2. Analoluego gamente, tenemos x r - ' ax-"- " - a i i r - " Pero r es un nlimero primo, luego por el pequeiio teorema de Fermat (corolario al teorema 2.a), i r - ' = I +u,r, 1 ) = a' +"or - aaUor= i a donde i = aUoreZ. Asi pues, . de donde Xr - l a = l a x r - I . Como x $ Z , por la naturaleza minima de r , x r - ' E Z . Por la observacion del parrafo anterior, corno xa # ax, x r - ' a # axr-' y por lo tanto I # I . Sea b = x r - ; entonces bab- ' = i a ; por consiguiente, ).'ar = (bab-I)' = b a r b - ' = a', ya que a r e Z . Esta relacion obliga a que ).' = I . Afirmamos que si Y E D, entonces siempre que y r = I ha de tenerse y = 1' para algun i, pues en el campo Z ( y ) hay cuando mas r raices del polinomio ur - I ; 10s elementos I. i., .. ., i r - de Z son todos distintos, ya que 1es R2, del orden primo r y todos ellos constituyen las r raices de u r - 1 en ZQ), en consecuencia de lo cual y = 1'. Como A' = 1. br = Arbr = (Ib)' = ( a - ba)' = a- bra, de donde obtenemos abr = bra. Como a conmuta con br, pero no conmuta con b por la observacion antes hecha, br debe estar en Z . Segun el teorema 7.b, el grupo multiplicative de 10s elementos distintos de cero de Z es ciclico; sea ~ E un generador. Entonces a' = yi, b = y k ; si , j = sr, entonces a' = y, Z ' " de donde (a\y")' = I ; esto implicaria que a\y" i i , lo que implica ~ E en Z contra de a$ Z . De donde r k j ; anhlogamente r k k . Sea a , = ah y b, = b i ; un calculo direct0 partiendo de ha = ;.ah nos lleva a a , b, = pbla, donde .p = n j k e Z . Como el numero primo r que es el orden de i , no divide ni a j ni a k , i . j k = I , de donde 11 # I. Notese que ur = 1 . Veamos donde estamos. Hemos producido dos elementos a, y 6, tales que : 1) a l r = bIr = XEZ; 2) a , b , = pb, a , . con p # I en Z . 3) pr = 1.

.

'

'

Calculamos ( a , - ' b , ) ' ; ( a l - ' b , ) 2 = a l - ' b 1 a , - ' b l = a , - ' ( b , a , - ' ) b l = a, -'(pa, - b,)b, = pa,-'bl Si caiculamos ( a , - b , ) ) encontramos que es igual a ~ i "' a , - 3 b l Continuando de esta forma obtenemos (al-' 6,)' = + 2 + . " + ( r -I ) - r blr = +Z+".+(r- I ) = p r i r - " I 2 , Si r es un primo a1 impar, corno pr = I, tenemos p r ' r - ' " 2 = I, de donde (a1-'b,)' = 1. Siendo una solucion de y r = I, a , - 6 , = i' de mod0 que b, = A'a, ; per0

'

).

'.

'

'

372

TOPICOS SELECTOS

- Cap. 7

entonces pb, a, = a, b, = b, a , , lo que contradice p # I . Luego si r es in ndmero primo impar, el teorema estP probado. Debemos ahora descartar el caso r = 2. En esta situacion especial tenemosdoselementosa,. b,eD talesquea12= b12= zeZ.a, 6, = jtblal dondep2=Iyp#I.Asipues,p=-Iya,b,= -h,a,#h,a,;como consecuencia, la caracteristica de D no es 2. De acuerdo con el lerna 7.7 podemos encontrar elementos C, qeZ tales que I + i2 -zq2 = 0. Consideremos (a, + Cb, + qa, b, 12; al computar esto encontsamos que (a, Cb, +Val b1)2= a ( ] + C2 -zq2) = 0.Estando en un anillo con division esto implica que a,+Cb,+qa,b, = 0; luego 0 # 2aI2 = a , ( a , +jh,+ gal 6,) + (a, + [b, +qal b,)a, = 0. Esta contradiccion termina la prueba y el teorema de Wedderburn queda establecido.

+

Esta segunda prueba tiene la ventaja de que podemos utilizar partes de ella para establecer un resultado notable debido a Jacobson, a saber, TEOREMA ~ (JACOBSON). D un anillo con dirisidn tal que para todo 7. . Sea a e D existe un entero positiro n(a) > 1, dependiente de a, tal q~re a"'"' = a. Entonces D es un campo conmutatiro. Pruebrr. Si a # 0 esta en D, entonces a" = a y (2a)" = 2a para algunos enteros n, m > I . Sea s = (n- I ) (m- I)+ I; s > 1 y un simple cllculo muestra que a' = a y (241)' = 2a. Pero (247)" = 2"a" ='a, de donde 2'0 = 20 de lo que se obtiene ( 2 L 2 ) a = 0.Asi pues. D tiene caracteristica p > 0. Si P c Z es el campo que tienep elementos (isomorfo a J,), como a es algebraic0 sobre P, P(a) tiene un numero finito de elementos. en realidad pb elementos para alfin entero h. Asi pues. como aeP(a). aph= a. Por tanto, si a $ Z todas las condicionesdel lema 7.9 se satisfacen, de donde existe una b€D tal que

Por el mismo argumento, bPk = b para algun entero k > I . Sea
pk

W = {xeDlx =
i=1

1 pijaib'
j= I

P"

donde pije P}. W es finito y es cerrado

respecto a la adicion. Por virtud de (1) es tambiCn cerrado respecto a la multiplication (iverifiquese!). Luego W es un anillo finito con division ; por el teorema de Wedderburn es conmutativo. Pero a y b estan ambas en W; por tanto, ab = ba en contra de que a'b = ba. Y esto prueba el teorema. El teorema de Jacobson realmente se verifica para cualquier anillo R que satisfaga 6 " = a para todo a € R, no solamente para anillos con division. '' La transicion del caso de anillo con division a1 caso general aunque no

$2.

TEOREMA DE W E D D E R B U R N SOBRE ANTILLOS FlNlTOS CON DIVISION

373

dificil exige la aplicacion del axiorna de election, y discutirlo nos llevarla demasiado lejos.

I. Si t > I es un entero y (tm- I ) 1 (tn- I), pruebese que m In.

2. Si D es un anillo con division, pruebese que su dimensi6n (como espacio vectorial) sobre su centro no puede ser mayor que 2.
3. Pruebese que cualquier subanillo finito de un anillo con divisi6n es un anillo con division.
4. a ) Sea D un anillo con division de caracteristica p # 0 y sea G un subgrupo finito del grupo de elementos distintos de 0 de D bajo la multiplicacion. Pruebese que G es abeliano. (Sugerencia: considerese el subconjunto {XE x = ZA,gi, A,€ P, g , G}.) Dl ~ b ) Pruebese en la parte (a) que G es realrnente ciclico. *5. a) Si R es un anillo finito en el que x" = x, para todo XER donde n > I, pruebese que R es conmutativo. b ) Si R es un anillo fihito en el que x 2 = 0 implica que x = 0, pruebese que R es conmutativo.
*6. Sea D un anillo con division y supongamos que ED solamente tiene un nurnero finito de conjugados (es decir, solamente un ndmero finito de elernentos x- ' ax). Pruebese que a tiene solamente un conjugado y debe estar en el centro de D.

7. ljsese el resultado del problema 6 para probar que si un polinomio de grado n con coeficientes en el centro de un anillo con divisi6n tiene n + 1 raices en el anillo con division, entonces tiene un numero infinito de rakes en ese anillo con division.

*8. Sea D un anillo con division y K un subanillo con divisi6n de D tal que xKx- ' c K para todo x # 0 de D. Pruebese que o K c Z, el centro de D, o K = D. (Este resultado se conoce como el teorema de Brauer-CartanHua.)
*9. Sea D un anillo con division y K un subanillo con division de D. Supongamos que el grupo de elementos distintos de cero de Kes un subgrupo de indice finito en el grupo (bajo la multiplicacion) dk elementos distintos de cero de D. Pruebese que entonces o D es finito o K = D.
10. Si 0 # 1 es una raiz de la unidad y si q es un entero positivo, prudbese que lq-Ot>q-I.

374

TOPICOS SPLECTOS

- Cap. 7

3. TEOREMA DE FROBENIUS

En 1877, Frobenius clasifico todos 10s anillos que tienen el carnpo de 10s numeros reales en su centro y que satisfacen, adernas. una condicion que describiremos posteriorrnente. La finalidad de esta secci6n es presentar este trabajo de Frobenius. En el capitulo 6 sefialamos dos importantes hechos acerca del campo de 10s numeros complejos. Los recordarnos aqui :

HECHO I . Todo polinornio de grado n sobre el campo de 10s numeros complejos tiene todas sus n raices en el campo de 10s nurneros cornplejos.
HECHO LOS 6nicos polinornios irreducibles sobre el carnpo de 10s 2. numeros reales son de grado I o 2. DEFINICION. algebra con division D se dice que es algebraica sobre Una un campo F si : I ) Festa contenido en el centro de D; 2) todo a€ D satisface un polinornio no trivial con coeficientes en F.

Si D, corno espacio vectorial, es de dimension finita sobre el campo F que esta contenido en su centro, se puede rnostrar facilrnente que D es algebraico sobre F (vease el problerna 1 al final de esta seccion). Pero puede suceder que D sea algebraico sobre F y, sin embargo, no sea de dimension finita sobre F. Cornenzarnos nuestra discusi6n sobre anillos algebraicos con divisi6n sobre el campo real investigando, en primer lugar. cuhles son 10s algebraicos sobre el carnpo cornplejo.
LEMA 7.10. Sea C el campo de 10s nljmeros complejos y supongarnos que el anillo con dirisidn D es algebraico sobre C. Entonces D = C.

Prueba. Supongarnos que a€ D. Corno D es algebraico sobre C , an+ ... + a n - , a + a, = 0 para algunas c i , , u2, . .., a, en C . Ahora bien, el polinornio p ( x ) = x"+ci, Y- ' + ... +a,- ,x+cin en C[x]puede, por el hecho I, factorizarse en C [ x ]en un producto de factores lineales; es decir, p ( x ) = ( x - 1 1 )( x - A 2 ) ... (x-I.,) donde A , , I , , ..., A, estan todos en C. Como C esta en el centro de D, todo elemento de C conmuta con a, de donde p(d) = ( a - A , ) ( a - A 2 ) . . . (a-A,). Pero, por hipbtesis, p(a) = 0, luego ( a - A , ) ( a - 1 , ) .. . ( a - I,) = 0. Corno un producto en un anillo con division es solo cero en el caso de que uno de 10s factores, a1 menos, sea cero, concluimos que a - 1 , = 0 para algun k, de donde a = ,Ik,entonces se tiene que a e C . Por tanto, todo elemento de D es de C ; como C c D, se obtiene D = C .
z,

a"-

'+

13.

TEOREMA DE FROBENlUS

375

Estamos ahora en posicion de probar el clisico resultado de Frobenius, a saber TEOREMA (FROBENIUS). D un anillo con divisidn algebraico 7.~ Sea sobre F, el campo de 10s.ntimeros reales. Entonces D es isomorfo a uno de 10s siguientes: el campo de 10s n~imerosreales, el campo de 10s ntimehos complejos, o el anillo con diuisidn de 10s cuaternios reales. Prueba. La prueba consta de tres partes. En la primera, y mas sencilla, resolvemos la cuestion para el caso conmutativo; en la segunda, suponiendo que D no es conmutativo, construimos una replica de 10s cuaternios reales en D; en la tercera parte mostramos que esta rkplica de 10s cuaternios satisface completamente a D. Supongamos que D # F y que a estl en D, pero no en F. De acuerdo con nuestras hipotesis, a satisface algun polinomio sobre F, de donde alg6n polinomio irreducible sobre F. Si esta ecuacion es lineal, a debe estar en F en contra de lo supuesto. Asi que podemos suponer que a 2-2aa+/l = 0 donde a, BE F. Luego (a - a)2 = a 2- 8; afirmamos que a 2 - /l < 0, pues, de otra forma tendria una raiz cuadrada 6 y tendriamos a-a = +S y, por tanto, a estaria en F. Como a 2- p < 0 se puede escribir como - y 2 donde y E F. En consecuencia (a- a)' =

- y ',

de donde

a # F podemos encontrar reales a, y tales que

(.- Y ria>'=
=

ar

I. Asi pues si
1.

U E D,

Si D es conmutativo, escojamos a e D, a$ F y sea i =

a-a -donde a, y en F

Y

se escogen de mod0 que hagan i2 = - 1. Por tanto, D contiene a F(i), un campo isomorfo al campo de 10s numeros complejos. Como D es conmutativo y algebraico sobre F es evidentemente tambien algebraico sobre F(i). Segun el lema 7.10 concluimos que D = F(i). Luego si D es conmutativo entonces es F o F(i). Supongamos, entonces, que D no es conmutativo. Afirmamos que el centro de D debe ser exactamente F. Si asf no fuera, habria un a en el centro que no %ria de F. Pero entonces para algunas a, yeF, . ( = -I
i Y )

- 1 de

forma que el centro contendria un campo isomorfo al'& ios numeros complejos. Pero, de acuerdo con el lema 7.10, si 10s numeros complejos (o un campo isomorfo a cllos) estuviese en el centro de D entonces D = C, luego D seria conmutativo. Por tanto, Fes el centro de D. a-a i2 = - 1. Como Sea asD, a#F; para algunas a, ~ E Fi ,= -satisface Y i#F, i no esta en el centro de D. Por lo tanto hay un elemento beD tal que

376

TOPICOS SELECTOS - Cap. 7

c = h i - i h # 0.Calcularnos ic+ci; ic+ci = i ( b i - i b ) + ( b i - i h ) i = ihi-i2h h i 2 - i h i = 0. ya que i 2 = - I . Asi pues, ic = - c i ; deducimos de esto que ic2 = - c ( i c ) = - C ( - c i ) = c 2 i , es decir. c 2 conmuta con i. Ahora bien. c satisface alguna ecuacion cuadratica sobre F, c2+Ac+p = 0. Corno c2 y i t conmutan con i. Ac debe tambitn conrnutar con i : es decir. Aci = iAc = Air = - k i , de donde 2Aci = 0, y corno 2ci # 0. tenemos que j. = 0. Luego c2 = - p ; corno c $ F (pues ci = -ic # i c ) podemos decir, corno antes hicirnos, que 11 es positivo y por lo tanto kt = v 2 donde

+

Y E F .Por lo tanto. c 2 =

-

\i2;

sea j = -. Entoncesj satisface
v

C

Sea k = ii. Las i, j, k que hernos construido se cornportan corno las de 10s cuaternios. de donde T = {z, + z , i + z2J+ 2, k 1 z, , 2 , , z2 , 2, E F ) forrna un subanillo con division de D isomorfo a 10s cuaternios reales. iHernos construido una rtplica T, del anillo con division de 10s cuaternios reales en D! Nuestro ultimo objetivo es dernostrar que T = D. Si r e D satisface r 2 = - I, sea N ( r ) = { x e D l x r = r x } . N ( r ) es un subanillo con division de D ; adernas, r , y por lo tanto todos 10s *,+a, r , zo , z , E F, estan en el centro de N ( r ) . Segdn el lerna 7.10, de ello se sigue que N ( r ) = { z o+ z , r 1 a,, a , E F . Luego si x r = r x entonces x = a. + a , r para algunas zo a , en F.

.

Supongarnos que u E D, u $ F . Para algunos a,

u12 = I . Afirmamos que wi+iw conrnuta tanto con i corno con w ; para i(uli+iw) = iu3i+i2w = iwi+ w i 2 = (iw+ w i ) i ya que i 2 = - 1. Analogamente. w(lci+iw) = (wi+iw)w. Por la observacibn del phrafo anterior, u'i+iuT = z ; + z ; i = ao+a, W. Si w # T esta ultima relacion implica z , = 0 (pues de otra forma podriamos resolver para w en terminos de i). Luego u>i+iui = Z ~ E F Analogarnente. wj+jw = P,EF y w k + k w = ~ , E F . Sea .

-

B E F, u1 = -sat isface B

u-a

Entonces

14.

CUATERNIOS ENTEROS Y EL TEOREMA DE LOS CUATRO CUADRADOS

377

analogamente zi+,j: = 0 y z k + k z = 0. Afirmamos que estas relaciones obligan a : ser 0. En efecto. 0 = zk k z = :ij+ ij: = ( z i + iz),j+ i(,jz- ; j ) = a i ( j z - z j ) . pues z i + i z = 0. Pero i # 0. y como estamos en un anillo con division de ello se sigue que ,I:-zj = 0. Pero ,j:+zj = 0. Luego 2.1: = 0. y como 2 j # 0, tenemos := 0. Volviendo a la expresicin para z tel1enlos

+

-

de donde u 9 eT, en contradiccion con ut$ T. Luego, ciertamente, i ~ T. Como e
w = U-51

, u = /lu1+z y p o l lo tanto,

I I E 7'.

Hemos probado qile cualquier

1)
elemento de D esth en T. Como T c D concluimos que D = T ; como T es isomorfo a 10s cuaternios reales tenemos que D es isomorfo al anillo con division de 10s cuaternios reales. Pero esto es. exactamente. el enunciado del teorema.
Problemas

1. Si el anillo con division D es de dimension finita como espacio vectorial sobre el campo F contenido en el centro de D, pruebese que D es algebraico sobre F.
2. Proporcionese un ejemplo de un campo K algebraico sobre otro campo F, per0 no finito dimensional sobre F.
A es un anillo algebraico sobre un campo F y A no tiene divisores de se que A es un anillo con division.

4. CUATERNlOS ENTEROS Y EL TEOREMA DE LOS CUATRO CUADRADOS
En el capitulo 3 consideramos cierta clase particular de dominios enteros. la de 10s dominios euclidianos. Cuando 10s resultados de esta clase de anillos se aplicaban al anillo de 10s enteros gaussianos obteniamos, como una consecuencia, el famoso resultado de Fermat de que todo numero primo de la forma 4n I es la suma de dos cuadrados. Consideraremos ahora un subanillo particular del de 10s cuaternios que en todos 10s aspectos, salvo en el de su falta de conmutatividad. parecera un anillo euclidiano. A causa de ello sera posible caracterizar explicitamente a sus ideales izquierdos. Esta caracterizacion de 10s ideales izquierdos nos llevara rapidamente a una prueba del teorema clasico de Lagrange, de que todo en tero posi tivo es una suma de cuatro cuadrados.

+

378

TOPICOS SELECTOS

- Cap. 7

Sea Q el anillo con division de 10s cuaternios reales. Procedemos a introducir una operacion adjunta en Q, *, por la siguiente DEFINICION. x = r , r , i + r , j + r 3k en Q, el adjunto de x , al que Para denotaremos por x*, estl definido por x* = r , - r , i - r 2j- r 3k . LEMA 1 . El adjunlo en Q satisface 7.1
I ) x** = x
2 ) (Sx yy)* = Sx* 4 ) (xy)* = y * x *

+

+

+ yy*

para todo x , y en Q y cualesquiera reales S y y. Prueba. Si x = ao+a, i + r 2 j + a 3 k , entonces x* = r , - r , i - r 2 j - r 3 k . luego x** = (x*)* = a,+a, i + r 2 j + r 3 k , lo que prueba ( I ) . Sean x = r o + r ,i + r 2 j + r 3 k y y = Po+ PI i + P 2 j + P 3 k elementos de Q y Sean 6 y y numeros reales arbitrarios. Entonces 6x+ yy = ( 6 r o + yp,) + (Sa, + yP,)i + (Sa, + yP2)j + (Sr, + ~/3,)k, luego, por la definicion de *,

2 (ax+ YY)* = ( r o o + y P o ) - (Sr,+ yP1)i - ( 6 ~ + r P 2 ) j - (6r3+ rP3)k = S(ao-a, i - r 2 j - a 3 k ) y ( p O - p , i - P 2 j - P 3 k ) = ax*+ yy*. LO que es claro que prueba (2). A la luz de (2), para probar (3) es suficiente hacerlo para una base de Q sobre 10s reales. Lo probamos para la base 1, i , j, k . Ahora bien, i j = k , de donde (ij)* = k* = - k = ,ji = ( - j ) ( - i ) = j * i * . Analogamente (ik)* = k * i * , (jk)* = k * j * . Ademas, (i2)* = ( - 1)" = - I = ( i * ) ' , y analogamente para j y k. Como (3) es cierto para 10s elementos de la base y (2) se verifica, (3)

+

es cierto para todas las combinaciones lineales de 10s elementos de la base con coeficientes reales, de donde (3) se verifica para x y y de Q arbitrarios. D E F I N I C ~Si N E Q entonces la norma de x , a la que representaremos ~ X. por N ( x ) , esta definida por N ( x ) = xx*. Notese que si x = ao+a, i + a 2 j + a 3 k , entonces N ( x ) = xx* = (ao+ali+a2j+a3k) (ao-a,i-a2j-a3k) = a o 2 + a , 2 + r 2 2 + a 3 2 ; por tanto, N ( 0 ) = 0 y N ( x ) es un numero real positiro para x # 0 en Q. En particular, para cualquier nimero real r , N ( a ) = a2. Si x # 0, notese
I que x - I = -x*. N (a)

LEMA 7.12. Para lodo x,

Y E Q,

N(xy) = N(x)N(y).

Prueba. Por la misms definicion de la norma, N ( x y ) = ( x y ) ( x y ) * ; por parte ( 3 ) del lema 7.1 1 , (xy)* = y*x* y por lo tanto N ( x y ) = xyy*x*. Pero yy* = N ( y ) es un numero real y por tanto esta en elsentro de Q; en

§

4.

CUATERNIOS ENTEROS Y EL TEOREMA DE LOS CUATRO CUADRADOS

379

particular debe conmutar con x*. Por consiguiente, N ( x y ) = x ( y y * ) x * =
( x x * ) (YJ*) = N ( x ) N ( y ) .

.
,

Como una consecuencia inmediata del lema 7.12 se tiene. LEMA7.13 (IDENTIDADLAGRANGE). a,, a I , a 2 , a, y Po, B, , B 2 , /3, DE Si
son nlinieros reales, entonces (a,

( ~ o P o - ~ I -a2P2-a3B3)'+(aoB1 + ~ I B O + PI P , + a 2 P o + ~ 3 8 1 ) ~+ (ao83+a1 P2-a182+a3BoI2-

+ a , + a2 + a,

2,

(PO PI P2 8, 2 , = ~ , P ~ - ~ , B ~ ) ~ +(aoB2-a1

+

+

+

Prueha. Hay desde luego una prueba obvia de este resultado, la de efectuar las multiplicaciones en ambos miembros y comparar 10s resultados. Pero una forma mas fhcil de reconstruir el resultado y a1 mismo tiempo probarlo, es observar que el primer miembro es N ( x ) N ( y ) , mientras que el segundo miembro es N ( x y ) con, x = a o + a l i + a 2 j + a 3 k y y = Po+Pl i+ p , j + P , k . De acuerdo con el lema 7.12, N ( x ) N ( y ) = N ( x y ) , luego la identidad de Lagrange.

La identidad de Lagrange nos dice que la suma de cuatro cuadrados por la suma de cuatro cuad~ados de nuevo, de una forma muy especifica, la es, suma de cuatro cuadrados. Un resultado muy impresionante de Adolf Hurwitz dice que si la suma de n cuadrados por la suma de n cuadrados es de nuevo una suma de n cuadrados, donde esta ~iltimasuma tiene terminos bilinealmente calculables partiendo de las otras.dos sumas, entonces n = 1, 2, 4 u 8. Hay, en realidad, una identidad para el product0 de sumas de ocho cuadrados, pero es demasiado largo y complicado para transcribirlo en este lugar. Veamos ahora por que es oportuno introducir el anillo de Hurwitz de cuaternios reales. Sea I = +(I + i+j+ k ) y
H = { m o I + m I i + m 2 j + m 3 k ) m o , m , , m,, m, enteros).

LEMA 7.14. H es un subanillo de Q. Si X E H , entonces x * H y N ( x ) es un ~ enter0 positivo para todo elemento disrinro de cero x de H. Dejamos la prueba del lema 7.14 para el lector. No ofrece dificultad alguna. En cierto modo, H podria parecernos un anillo un poco extraiio, arbitrario. iPor que usar 10s cuaternios ( ? iPor quC no considerar simplemente el anillo mas natural Q, = { m o + m l i + m 2 j + m 3 k lm,, m , , m , , m, enteros? La contestation es que Q, no es suficientemente grande, mientras que H es, segun el lema clave que sigue algo que parece suficiente. Necesitamos este lema por que nos va a permitir caracterizar 10s ideales izquierdos del anillo. Esta posibilidad quiza fue la raz6n por la que Hurwitz se inclin6 a trabajar en H en lugar de en Q,,

380

TOPICOS SELECTOS

- Cap. 7

LEMA I5 (ALGORTIMOL A U I V I S I ~ N 7. DE IZQUIERDA). a ?. h elenienros Sran rlr H cot1 h # 0. Etitonces existeti (lo.\ elrtilrtitos c ?. d m H. tales <lire a = r . h + t l \ . N ( d )< N ( h ) .
Pnreha. Antes de probar el lema, veamos que es lo que nos dice. Si observamos la seccion del capitulo 3 que trata de 10s anillos euclidianos, podemos ver que el lema 7.15 nos asegura que, except0 por su falta de conmutatividad, H tiene todas las propiedades de u n anillo euclidiano. El hecho de que 10s elementos de H puedan fallar en cuanto a conmutatividad se refiere, no nos preocupa. Ciertamente, debemos tener un poco de cuidado para no saltar a conclusiones erroneas; por ejemplo, a = ch+r/, per0 no tenemos ningun derecho a suponer que a es tambien igual a bc+c/, pues b y c es posible que no conmuten. Pero esto no influira en ningun argument0 de 10s q ue usenios. Debemos conienzar por probar el lema en un caso muy particular, a saber, aquel en que a es u n elemento arbitrario de H, per0 h es u n entero positivo n. Supongamos que a = to < + t , i + t z , j + t 3 k donde t,,. t , , t , y r , son enteros y que h = n donde ti es un entero positibo. Sea c = x , < + x , i + s 2 . j + x , k donde .yo. .v, x , y .r3 son enteros auli por determinar. Queremos escogerlosen tal forma que hagan que obligadamente N ( a - c t i ) < . N ( n ) = ti2. Pero

.

Si pudiksemos escoger 10s enteros x,, x , , x , , x , de tal forma que se tuviera
to-nxol < + n , ( t o + 2 t l - n ( l o f 2 x l ) l < n n l t o + 2 1 , t i 21, - n ( t o 2 x 3 )I n entonces lendriamos

+

<

y Ito+

que es el resultado deseado. Pero afirmamos que esto siempre puede hacerse:
I ) Hay u n entero x, tal que t o = x , n + r

donde - 2

n

< r. < ti ; para 2

este x , , ( t o - x , n J = ( r J<

n

2

-.

3 4.

CUATERNIOS ENTEROS Y EL TEOREMA DE LOS CUATRO CUADRADOS

381

I ) Hay iln entero k lal que to I t , = k t i r y 0 < r < n. Si k - t o es par, pcingase 2.r, = k - t,, ; entonces to 21, = (2x, to)n r y It,+ 21, (2.\-, + t,,)tl( = r < ti. Si, por otra parte, k - to es impar, hagamos I.\-, = k-t,,+1;entoncest0+Zt, =(2.rl+t,-I)n+r =(2x,+to)n+ r-ti. de donde I t o + 2 t , - ( I x , + t o ) t i ) = ( r - t i I C t i ya que O < r < t i . Podemos, pues, encontrar un entero .r, que satisfaga 1to+2t, (I.r,+ t l , ) t l l < 11. 3) Corno en ( 2 ) . podemos encontrar enteros s2 y x, que satisfacen 1 to 2t2 - ( I x 2 tO)ti1 < t i y Ito 21, -(2.r3 to)nl < t i respectivamenle.

+

+

+

-

+

+

+

+

+

+

En el caso especial en que a es un elemento arbitrario de H y h es un entero positico. hemos niostrado que el lema es cierto. Vamos ahora al caso general en que a y b son elenientos arbitrarios de H y h # 0. Segun el lema 7.14. n = hh* es un entero positivo. luego exisle un CE H tal que ah* = oi+d, donde N ( d , ) < N(n). Luego N(uh* -cn) < N(t1); pero t i = hh* de donde tenemos N(ab*-&be) < N(n) y, por tanto. N ( ( a- ch)h") < NO?) = N(bh*). De acuerdo con el lema 7.12. esto se reduce a N(a-ch) N ( b * ) < N(h)N(be);como N ( b * ) > 0 tenemos N(a-cb) < N(b). Haciendo d = a - cb tenemos a = ch d donde N ( d ) < N(b). Y esto completa la prueba del lema. Como en el caso conmutativo, podemos deducir del lema 7.15 el

+

LEMA 7.16. Sea L un irleal iiquierdo ile H. Entonces existe un elemento /a/ c/ue toclo elentento en L es un 11iLltip10iztluierdo de 11 : en otras palabras, existe L r n LIE L tal (/lie todo XE L es de la/ornia x = r u dotide r E H.
UE L

Prirehu. Si L = (0) nada hay que probar. simplemente hacemos 11 = 0. Podemos. pues. suponer que L tiene elementos distintos del cero. Las normas de 10s elementos distintos de cero son enteros positivos (lema 7.14) de donde hay un elemento 11 # 0 en L cuya norma es minima entre las de 10s elementos distintos de cero de L. Si XEL, segun el lema 7.15, x = crt+d donde N(t1) < N(u). Pero d esta en L porque x y u. y por tanto cu, estan en L que es un ideal izquierdo. Luego N ( d ) = 0 y, por tanto, d = 0. De donde es una consecuencia que x = cv. Antes de que podamos probar el teorema de 10s cuatro cuadrados. que es la finalidad de esta seccion, necesitamos un lema mas, a saber

LEMA 7.17. S i a~ H entonces a -

' E H st' y solo s i N(a) = 1.

, Prueba. Si tanto a como a - esthn en H entonces. segun el lema 7.14, tanto N(a) como N ( a - I ) son enteros positivos. Pero aa- = I. de donde, de acuerdo con el lema 7.12. N(a) N ( a - ') = N(aa- I ) = N ( I ) = 1. Luego ha de tenerse N(a) = 1.

'

382

TOPICOS SELECTOS - Cap. 7

Por otra parte, si a€ H y N ( a ) = I, entonces aa* = N ( a ) = I y a- ' = a*. Pero segun el lema 7.14, como a € H tenemos ~ * E Hde donde a- ' = a* , estl tambien en H . Hemos determinado bastante de la estructura de H para usarlo en forma efectiva en el estudio de las propiedades de 10s enteros. Probamos ahora el clasico teorema de Lagrange.
TEOREMA~ .Todo entero positiro puede expresarse como la suma de 10s 7. cuadrados de cuatro enteros.
Prueba. Dado un entero positivo n afirmamos en el teorema que n = x o Z+ x , + x , + x , para cuatro enteros x,, x , , x, y x , . Como todo entero

se factoriza en un product0 de numeros primos, si todo numero primo fuera realizable como una suma de cuatro cuadrados, teniendo en cuenta la identidad de Lagrange (lema 7.13), todo entero seria expresable como una suma de cuatro cuadrados. Hemos reducido el problema para poder considerar tan solo n~imeros primos n. El numero primo 2 es claro que puede escribirse como la suma de cuatro cuadrados: 2 = 1 + 1 + 0 2 + 0 2 . Luego, sin perdida de generalidad, podemos suponer que n es un nljmero primo impar. Como es costumbre, lo denotamos por p. Consideremos 10s cuaternios Wp sobre 'Jp, 10s enteros mod p ; Wp= {x,+z,i+a,j+a,k~a,, a , , z,, a , ~ J p j . Wp es un anillo finito; ademas, como p # 2 no es conmutativo, pues i j = -ji # ji. Luego, segcn el teorema de Wedderburn, no puede ser un anillo con division, de donde segun el problema I al final de la seccion 5 del capitulo 3, debe tener un ideal izquierdo que no sea ni ( 0 ) ni Wp. Pero entonces el ideal bilateral V en H definido por V = { x , ( + x , i+ x,j+x,k lp divide a x,, x , , x, y x,) no puede ser un ideal izquierdo maximo de H , ya que H / V es isomorfo a W,. (i Pruebese!) (Si V fuera un ideal maximo izquierdo en H. H / V , y por tanto W,, no tendria otros ideales izquierdos que ( 0 ) y H I V ) . Hay, pues, un ideal izquierdo L de H que satisface: L # H , L # V, y L 2 V. De acuerdo con el lema 7.16, hay un elemer~tou e L tal que todo elemento de L es un multiple izquierdo de u. Como p~ V, P E L , de donde p = cu para algun C E H . Como u$ V, c no puede tener un inverso en H , pues de otra forma u = c- p estaria en V. Luego N ( c ) > 1 por lema 7.17. Como L # H, u no puede tener un inverso en H , de donde N ( u ) > 1. Luego p = cu, P 2 = N ( p ) = N(cu) = N(c)N(u). Pero N(c) y N(u) son enteros, pues tanto c como u estan en H, ambos son mayores que I y ambos dividen a p 2 . La unica forma de que esto sea posible es que N(c) = N(u) = p. Como U E H , u = m,(+m,i+m,j+m,k donde m,, m , , m,, m, son enteros; luego 2u = 2mo(+2m,i+2m,j+2m,k = (m,+m,i+m,j+m,k) +2ml i+2m,j+2m3k = mo+(2ml +mo)i+(2m, +mo)j+(2m,+mo)k. Por Pero tanto, N(2u) = m, + (2ml + m,), + (2m, + m,)' + (2m3 rn,),. +

'

5 4.

CUATERNIOS ENTEROS Y EL TEOREMA D E LOS CUATRO CUADRADOS

383
*

N(2u) = N ( 2 ) N ( u ) = 4p ya que N ( 2 ) = 4 y N(u) = p. Hemos demostrado que 4p = mo2+ ( 2 m , + m o ) 2 (2m2+mo)2 (2m3+ m o ) 2 . Y ya casi hemos

+

+

terminado. Para terminar la prueba introducimos un viejo truco de Euler: Si 2a = xO2 x I + x~~ + x j 2 , donde a, x,, x , , x2 y x, son enteros, entonces + a = yo2+ y , + y 2 2+ y 3 2 para algunos enteros y o , y , , y , , y,. Para ver esto notese que corno 2a es par, 10s x son todos pares, todos impares, o dos pares y dos impares. En cualquiera de 10s tres casos podemos renurnerar 10s x y aparearlos de forma que

sean todos enteros. Pero

Como 4p es una suma de cuatro cuadrados, segun la observacion que acabamos de hacer 2 p tambiCn 10s es; corno 2p es una suma de cuatro cuadrados, p tambien debe ser igual a una tal suma. Luego p = ao2+ a , + para algunos enteros a,. a , , a , , a , , y el teorema de Lagrange ha quedado establecido. Este teorerna es el punto de partida de una gran area de investigacibn en teoria de numeros, la del llamado problema de Waring. Se pregunta en Cste si todo entero puede escribirse corno una suma de un numero fijo de potencias k-esimas. Por ejernplo, puede demostrarse que todo entero es la suma de nueve cubos, diecinueve cuartas potencias, etc. En el presente siglo el gran maternaticp Hilbert demostro que el problema de Waring tiene una respuesta afirmativa.

Problemas

I. PruCbese el lema 7.14.
2. EncuCntrense todos 10s elementos a de Qo tales que a - ' esta tambiin
en Qo.

3. Pruibese que hay exactamente 24 elementos a en H tales que a-I esth tarnbiin en H.Determinense todos ellos.

384

TOPICOS SELECTOS

Cap. 7

4. Proporcitinese un ejemplo de illla (I y ulia h. h # 0. ell (tales qile sea I , , iniposible encontrar y J en Q, que satisfagon u = ( . / I + ( / d o ~ i d e ( d ) < N rV(h).

5. Prukhese qile si U E H elitonces exislen enreros z. /I tales que
u 2 + . l u + / I = 0.

6. Pru~hese qile hay un entero positivo que no puede escribirse como la silnia de trcs cuadrados.

"7. Ex1iih;ise 1111 nuniero i n f n i t o de enteros positives que no puedan escrihirse como la sunia de tres cuadrados.

1,ecturas suplementarias
Para ilna discusion niLs profunda de campos finitos: ALBERT, A. A., F ~ ~ ~ i c l a ~ ~ Coriceprs of' Higlier Algebra. University of Chicago Press, ie~iral Chicago, 1956. , Para muchas pruebas del reorema de 10s cuatro cuadrados y una discusi6n del problema de Waring: HARDY, G. H. y WRIGHT, E. M., An Ilitrod ~ ~ c r i olo the Tlieory of Nir~~ibers, n segunda edicion. Clarendon Press, Oxford, Inglaterra, 1945. Para otra prueba del teorema de Wedderburn: ARTIN, E., "Ober einen Satz von Herrn J. H. Wedderburn", Abhancll~ingen.Hamburg, Mathemarisches Seminar, vol. 5 ( 1928). pags. 245-250.

lndice analitico
ABEL,229, 244, 249 Abeliano, grupo, 41 Adjunci6n de un elemento a un campo,
2111

~djunto(sj,317, 320 cuaternios, 377 hermitiana, 317, 320, 341, 342 ALBERT, 360, 384 Algebra, 253 booleana, 20 con divisi6n algebraica sobre F, de todas las matrices n X n sobre 272 de transformaciones lineales, 252 lineal, 252 teorema fundamental del, 338 Algebraica, extensi6n, 204 Algebraico, elemento, 200, 201 de grado n, 203 nlimero. 205-206 entero, 206 Algoritmo: de divisi6n izquierda, 380 euclidiano, 29 Alternante, grupo, 249 de grado n, 86 Angulo, trisecci6n del, 222 Anillo(s), 103, 253 asociativo, 104 Base(s), 162, 166 booleano, 1 12 dual, 174 cociente, 117, 1 19 ortonormal, 340 con elemento unitario, 104 dadas, matriz de una transformaci6n conmutativo, 104 de divisi6n, 109 lineal respecto a, 266 Bessel, desigualdad de, 187 de matrices rationales 2 X 2, 106 Binaria, relacibn, 22 de polinomios, 136 B ~ K H O F 36, 367 F. de polinomios en n variables, 146 de todas las funciones reales conti- Biyectiva. correspondencia(s), 26 nuas, 121 conjunto de todas las, 26. 39 de transformaciones lineales. 158 Booleana, ilgebra, 20 euclidiano, 126, 377 Booleano, anillo. 112 Brauer-Cartan-Hua, teorema de. 373 ' homomorfismos de, 113 BURNSIDE. 102 isomorfismos de, 115 no asociativo, 104 po!inomio sobre un, 146 Campo(s), 105, 109 unldad de un, 128 adjunci6n de elementos a un, 200 Aniquilador de un subespacio, 175 automofismos de, 229 -

Antihermitiana, 342 Antisimetrica, matriz, 3 16 Aplicacion(es) 21, 22 composition de, 24 conjunto de todos los, inyectiva, 26, 39 identidad, 22 igualdad de, 24 inverso de un, 26 producto de, 24 restrlcci6n a un subconjunto, 28 suprayectiva, 23 inyectiva, 23 ARTIN,229, 249, 384 Asociados, 129, 147 Asociativa(s), ley(es), 25, 34, 39 Asociativo, anillo, 104 Autoadjunta, matriz, 342 Automorfismo(s): campo fijo de un grupo de, 230 de grupos, 72 de K relativos a T, grupo de los, 231 de un grupo, 72 del campo, 229 exteriores, grupo de 10s. 76 interiores, 73 interiores, grupo de 10s. 73, 74 Axioma de elecci6n, 120

Campos, de cocientes, 123. 1 5 2 de descompsici6n. 2 1 . 2 16-21 . 236. 4 9 238 -- de h~ncionesracionales en n variables. 146 simktricas, 236 extension de un. 198 fijo de un grupo de automorfismos, 230 finito. 105. 361, 363. 364 perfecto. 228 Cancelacion, leyes de, 43 Canbnica(s) forma(s), 280 de Jordan, 298 racionales. 303, 306 Caracteristica, 333 de un dominio entero, 112 finita, l 12 Caracteristicas. rakes. 26 1, 28 1-282, 284 multiplicidad de las, 300 Caracteristico, polinomio, 307 subgrupo, de C,76 vector, 263 Cardan, formulas de, 243 Cartesiano, producto, 16 CAUCHY. 92 Cauchy. teorema de. 67. 92 CAYLEY. 77 Cayley-Hamilton, teorema de, 255, 307, 335, 336 Cayley, teorema de, 77 Centralizador, 55 Centro de un grupo, 55, 74 Cero, divisores de, 109 matriz, 272 Cerrado respecto a una operaci6n, 39 Ciclica, descomposici6n, 94 Ciclico, 190 grupo, 42, 47 enerador de un, 55 m& ulo, 190 subespacio. 292 subgrupo. 47 Ciclotomico, polinomio, 243, 367 Clase(s): de congruencia, 33, 257 de conjugados. 89, 95 de equivalencia, 18 de semejanza, 279 ecuaci6n de, 90, 366 lateral derecha, 54 izquierda, 54 Cociente, anillo, 1 15, 117, 119 espacio. 160 estructura, 58 grupo, 56, 58 m6dul0, 189, 194 Cocientes, c a m p de, 123, 125 Coeficientes, 1 37 Cofactor. 336 Columna de una matriz. 269 Comhinaci6n lineal, 163 Compa!era, matriz. 305 Complejo, espacio vectorial, 178

Complemento, 1 6 Complemento ortogonal. 182 Composici6n de aplicaciones, 24 Congruencia. clases de, 33, 357 mbdulo n, 33 m a u l 0 un subgrupo, 48 Congruente. 354 Conjugaci6n. 88 Conjugado(s). 84 clases de, 89. 95 elementos, 88 subgrupos. 1 1 0 Conjunto(s): ajenos. 1 5 ajenos, 1 4 mutuamente. 1 5 de indices, 14 de 10s enteros m6dulo n: 34 de subconjuntos, 23 de todas las aplicaciones inyectivas. 26, 39 diferencia de, I 5 jmagen de un. bajo un mapeo. 23 ~nfinito.28 intersection de, 14 ortonormal, 183 teoria de, 12 uni6n de, 1 . 1 3 5 vacio, I 3 Conmutador(es), 245 de C. 71. 245 subgrupos, mih altos, 245 Conmutativas, leyes, 34 Conmutativo(s) anillo, 104 anillos de polinomios sobre anillos, 145 grupo, 40 Construcci6n con regla y comphs, 220 Construcci6n o prueba invariante, 174, 175 ~onstr"ctible, 222 nlimero, 220 Contenido de un polinomio, 143, 147 Correspondencia biyectiva. 26 Cramer, regla de, 330, 331 Crilerio: .~ de Eisenstein, 144, 232, 24 1 de Euler, 365 Cuaternio(s), 1 18, 2 12, 220, 286, 365, 375 adjunto de un, 378 enteros, 377 norma de un, 378 Cuatro cuadrados. teorema de los, 377 Cubo, duplicacion del, 222, 223
~

De dimension finita, 163 De Euclides. algoritmo. 29

Dliu W.?I'RI)EN, VAN, 249

Dcfinida psitiva, 347

De Morgan. reglas de. 1 9

De las casillas, ley. 110

I)crech:~. clase lateral, dc rln sl~hprl~po. 4 X inverlihle ;I la. 255 -

Derecho, ideal. I I9 Derivada, 142, 224 Desargues, teorema de, 366 Descomponible, conjunto de transformaciones lineales. 287 Descomposicicin en ciclos, 94 Desigualdad: de Bessel. I87 de Schwarz. 18 1. 187 del triangulo, I87 Determinante(s), 32 1 de un sistema de ccuaciones lineales. 330 de una matriz. 323 de una transformacicjn lineal. 329 Diagonal, matriz, 276. 302 subconjunto, 16 Diagonalizable. 302 DICKSON. 360 DiecisietePgono regular, 224 Diferencia. conjunto, I5 (O cociente), rncjdulo, I89 simttrica de dos conjuntos, 19 Ditdrico, grupo, 61 Dimension, 168 DIOFANTO, 360 Directa, suma: de m6dulos. 190 exterior, 160 interior, 160 Distributiva(s) ley(es), 34. 104 Divisor(es), 29 elementales, 308. 309 Division algebraica, blgebra con. 374 algoritmo de la, para polinornios, 139 anillo con, 109 Divisibilidad, 127 Dominjo: de factorizacihn linica. 148 entero, 109 Dual(es). base(s), 174 espacro(s). 17 1 , 173 seiundo, 174 Duplication del cubo, 222, 223 de clase, 90, 366 Eisenstein, criterio de. 144. 232. 241 Elecci6n. axioma de. 120 Elementales. divisores, de una transforrnacicin lineal, 306-309 funciones sirnttricas, 234, 236 F,lernento(s): adjuncicin de un, a un carnpo, 200 algehraico, 200 conjugados, 88 en un rncjdulo, orden de, 195 identidad. 39 orden de un, 50 period0 de un, 50 primo. 130. 147 separable. 228 Eneiigono regular, 224

Entcro, dominio, I09 caracteristica de un. 1 12 F.nlero(s). 28 algebraicos. 206 g;iussl;inos. 133 p;~1icipaci6nde un. 93 prinios rclativos. 30 Entcros rncidulo 11. conjunfo de, 34 Equivalencia. clase de, 18 Fscalar (es). 156. 178 matrices, 272 F.spacio(s): cociente. 160 con proaucto interior. 178, 180. 338 dual. 171. 173 vectorial, 156 vectorial complejo. 178 vectorial real. 178 Espectral. resoluci6n. 352 Expansi6n lineal. 163 Extension: algebraica, 204 de un, campo, 198 finita. 198-201 grado de una. 198 normal, 236, 237, 240 separable. 229 simple. 226, 227 Exterior, suma directa, 160 Exteriores, grupo de automorfismos, 76 Euclidiano, anillo. 126, 377 EULER, 1, 360, 383 5 Euler, criterio de, 365 funci6n T de. 5 1. 77, 219. 242 Factor. grupo, 58 Factorizacidn bnica, dominio de, 148 teorerna de. 3 1, 131 FEIT. 67 FERMAT, 126, 133, 135, 360, 377 51, Fermat, pequeiio teorema de, 371 Finita, caracteristica, 1 12 Finitamente generado($, m6dulo(s), 190 teorema fundamental sobre, 190 Finito(s): carnpo(s), 105, 361, 363, 364 grupo, 40 grupos abelianos, teorerna sobre, 192 Forma(s): can6nica. 280 canonica de Jordan, 298 de Jordan, 299 racional canonica, 303, 306 real cuadritica, 353 triangular, 279, 282 F6rrnulas de Cardan, 243 FROBENIUS, 374 360. Frobenius. teorema de, 374 Funcional lineal. 173, 188 Funciones: anillo de todas las. reales cotinuas. 121 racionales, 139. 233 racionales simttricas, 233, 234 simttricas elernentales, 234. 236

(it]>, entrada, 270 Ideal(es), 1 15, 116, 120 derecho, 119 izquierdo, 118 m4xim0, 120 primo, 151 principal. 127 radical de un, 152 Idernpotente, 260 Identidad, elemento, 39 aplicaci611, 22 Identidades: de Lagrange, 379, 382 de Newton, 242 Igualdad de dos conjuntos. 13 Igualdad de aplicaciones, 24 Imagen, 22 de un conjunto bajo una aplicaci6n, 23 inversa, 23, 6 4 , Impar, perrnutaclon, 86 Independencia lineal, 162 fndice: de H en G, .49 de nilpotencia, 289 Inercia, ley de Sylvester de la, 354 Infinito, conjunto, 28 Interior, producto, 178, 180 espacios con, 178, 180, 338 Interior, surna directa, 160 Interior(es), automorfismo(s), 73 grupo de, 73, 74 Interseccibn de conjuntos, 14, 15 Invariante, construccibn o prueba, 174, 175 subespacio, 280, 285 Invariantes: de transformaciones lineales nilpotentes, 292, 293, 294 de un grupo abeliano finito, 193 Inversa, imagen, 23, 64 HALMOS, 195, 357 Inverso de una aplicaci6n, 26 Inverso, elemento, 39 HALL,102 HAMILTON, 107, 360 Invertible, transformaci6n lineal, 255 HARDY, 384 Irreducible, conjunto de transformacioHERMITE, 207, 208 nes lineales, 286 Hermitiano(a), adjunto, 317, 320, 341, elemento, 147 342 m6dul0, 195 rnatriz, 317, 321 polinomio, 140 transformaci6n, 338, 343, 347 lineales homogineas, 177 transformaci6n lineal, 346 rango de un sisterna de, lineales, 177 HexBgono, regular, 223 secular, 333 HILBERT, 207, 383 Isomorfismo: Horn: de anillos, 115

GALOIS, 198 56. Galois, grupo de. 229, 239. 247, 248 teoria de. 216, 229. 237 teorema fundamental de la teoria de, 239 Gauss, lema de, 143, 145, 147 Gaussianos, enteros. 133 GELFOND, 207 Generado por: U, subgrupo, 7 1 W, subgrupo de G, 47 Generador de un grupo ciclico. 55 Grado n: algebraic0 de, 203 de f ( x ) , 146 de un polinomio, 138 de una extensibn, 198 grupo alternado de, 86 grupo sirnktrico de, 40, 81, 233, 246, 249, 278 Gram-Schmidt, proctso de ortogonalizacion de, 183 Grupo(s), 39 abeliano, 40 alternante, 249 alternante de grado n, 86 autornorfismos de un, 72 centro de un, 55, 74 cicliw, 42, 47 cociente, 56, 58 conmutativo, 40 de automorfismos, c a m p fijo de un, 230 de automorfismos de K relativos a F , 23 1 de automorfismos exteriores de G, 76 de automorfismos interiores, 73, 74 de Galois, 229, 239, 247, 248 de permutaciones, 81 dikdrico, 61 factor, 58 finito, 40 generador de un, ciclico, 55 homornorfismos de, 61 isomorfismo de, 64 isomorfos. 64 orden de un, 40 simktrico, 93, 323 simple, 66 soluble, 99, 246

( u , v ) , 158 (V,W), 172, 173, 351 HomogCneas, ecuaciones lineales, 177 Homomorfismo(s), 61, 1 13 de anillos, 1 13 de espacios vectoriales, I58 . de grupos, 61 de m6dulos, 190, 194 ndcleo de un, 62. 114 HURWITZ, 207, 360, 379

Isomorfismos. Matriz(es), de espacios vectoriales, 158 permutation, 278 de grupos, 64 semisimitrica, 3 16 de m6dulos, 194 simCtrica real, 348 Isomorfos, anillos, 115 teoria de las 252, 265 espacios vectoriales, 158 transpuesta de una, 315 .grupos, 64 traza de una, 312 Izquierdo(a), algoritmo de divisi6n. 380 triangular, 28 1-282 unidad, 272 clase lateral, 54 Mbximo. ideal, 120 ideal, 118 Mdximo comdn divisor. 29. 128 invertible, 255 McCoy, 153 JACOBSON, 360, 372 MCKAY, 102 92, Jacobson, lema de, 314, 319 Minimo, polinomio, 202. 256 teorema de, 372 Minimo comdn mdltiplo. 34. 132 Jordan, bloque de, 298 M6dulo(s), 188. 304 forma canonica de, 298 ciclico, 190 forma de, 299 de una congruencia. 33 diferencia o cociente de. I89 LAGRANGE, 360, 377 49, finitamente generado. 190 Lagrange, identidad de. 379, 382 finitamente generados, teorema fr~ndi~teorema de, 50, 382, 383 mental sobre, 190 Lema: homomorfismo entre. 190. 194 de Gauss, 143, 145, 147 irreducible, 194 de Jacobson. 3 14, 31 9 isomorfismo entre, 194 de Schur, 195 orden de un elemento en un, 195 Ley(es): rango de un, 191 asoclativa, 25, 34, 39 sobre R, 189 conmutativa, 34 M6nic0, polinomio, 144 de cancelaci6r1, 43 Morgan, leyes de De, 19 de inercia de Sylvester, 354 MOTZKIN.127, 153 de las casillas, 110 Mdltiple, rafz, 225 de Sylvester, 354 Multiplicative, sistema, 125 distributiva, 34 Multiplicidad de una raiz, 21 1 doblemente distributiva, 104 Multiplicidad de una raiz caracteristica. LINDEMANN, 207 300 Lineal(es): Mdltiplo, minimo comdn, 34 blgebra, 252 Mutuamente ajenos, 15 com binacih, 163 ecuaclones; n-variables: determ~nantede un sistema de, 330 anillo de polimonios en. 146 homogkneas, 177 c a m p de las funciones racionales en. rango de un sistema de, 177 146. expansi6n, 163 polinomlos en, 233 funcional, 173, 188 Newton, identidades de, 242 independencia, 162 Nilpotencia, indice de, 289 Linealmente dependientes, vectores, 164 Nilpotentes, transformaciones lineales. LIOUVILLE, 207 287, 288 Longitud, 178, 180 invariantes de, 292. 293, 294 NIVEN,207, 250 MACLANE. 36 No abeliano, 40 Matrices n X n sobre F. 271 No asociativos, anillos, 104 Algebra de todas las, 272 No negativas, transformaciones lineales. Matriz(es), 265 347 columna de una, 270 No triviales, subgrupos, 46 compafiera, 305 Norma, 180 de una transformaci6n lineal respecto de cuaternios, 378 a bases dadas, 266 Normal(es), extensi6n. 236, 237, 240 determinante de una, 323 subgrupo(s), 56, 57 diagonal, 276, 302 transformaci6n lineal. 338, 343, 34.5 escalar, 272 Nbcleo. 158 renglbn de una, 270 de un homomorfismo, 62, 1 14 hermitiana. 317, 321 Nbmero(s): ortogonal, 349 algebraicos, 205-206 _

Ndmero(s1 constructible. 220 primo, 30 trascsndente, 205, 207

Orhita de S respecto a e, 83 Orden: de G , 40 de un elemento. 5 1 de un elemento en un m5dulo. 195 Operation, cerrado respecto a una, 39 Ortogonal(es), 182, 349, 350 complemento, 182 matrices, 349 Ortogonalizacion, proceso de Gram- R-modulo. 189 Schmidt, 183 unitario, 189 Ortonormal, base, 340 Racional(es), forma. can6nica. 303. 306 conjunto, 183 func~ones,139, 233 campo de, 235 psubgrupo de Sylow, 98 simttricas, 233. 234 Pappus, teorema de, 366 polinomios sobre un campo, 143 Par, permutaci6n. 85 Radical de un ideal, 152 Partici6n(es), 193, 294 Radicales, soluble por, 243, 244, 247, de un entero, 93 249 Pentadecagono regular, 224 Raiz ti-2s-(ma primitiva de la unidad, 242 Pentigono regular, 223 Raiz(es), 2 1 1 , 224 Pequefio teorema de Fe~.mat,37 1 caracteristicas, 261, 28 1. 282. 284 Perfecto, campo, 228 de polinomios, 21 1 Periodo de un elemento. 5 1 multiples, 225 Permutacion(es), grupos de. 8 1 multiplicidad de una, 21 1 impar, 86 Rango, 356 matriz de una, 278 de un m6dul0, 191 par, 85 de un sistema de ecuaciones lineales, Perpendicularidad, 178, 182 176 Pi (7). funcihn, de Eules. 5 1. 77. 2 19. 242 de una transformaci6n lineal, 257. 258 Pol~nomio(s): Keal(es): anillo de, 136 anillo de las funciones continuas, 121 anillos de, sobrc con~nutativos.145 cuaternios, 107 caracteristico, 307 espacio vectorial, 178 ciclot6mic0, 243, 367 formas cuadriticas, 353 contenido de un, 143 matriz simttrica, 348 en n variables, 233 Reflexividad de relaciones. 17 general de grado tr. 244 Regla de Cramer. 330. 33 I., grado de un, 138 Regla y compis. construcclon con, 220 irreducible, 140 Reglas de De Morgan. 19 minimo, 202, 255 Regular: mbnico, 144 diecisieteigono. 224 primitivo, 143 heptigono, 223 raices de un, 210 hexigono. 223 simktrico, 236 n-igono, 224 sobre el campo racional. 143 pentadecigono, 224 sobre un anillo. 146 pentigono. 223 valor de un, 200 transformacion lineal, 255 POLLARD, 249 Relaci6n(es): Positiva, transformacion lineal. 347, binarias, 22 Positivamente definida. transformacron lide equivalencia. 17 neal, 347 reflexividad de una, 17 Primitiva, 148 simetria de una. 17 raiz n-tsima, de la unidad. 242. 367 transitividad de una. 17 Relativos, primos, 130 plinomio, 143 enteros primos, 30 r e de un primo. 365 Primo, elemento. 1 30. 147 Rengldn de una matriz, 269 Residuo cuadratico, 100, 365 ideal, 151 Res~duo,teorema de1,-200 numero, 30

Primo. elemento. raiz primitiva de un. 365 Primos relativos, 130 Principales, anillo de ideales, 127 Principio de las casillas, l I0 Producto: cartesiano, 16 de aplicaciones, 24 interior, 178, 180 punto, 179 Propio, subconjunto, 13 Proyeccion, 22 Punto, producto, 178

Resoluci6n espectral, 352 Restriction de una aplicacion a un subconjunto, 28 153 SAMUEL, Schwarz. desigualdad de. 181. 187 SCHNEIDER, 207 Schur, lema de, 195 Secular, ecuacion, 333 SEGAL, 102 Segundo dual, 174 Semejanza, 279 Semicampo, 108 Separable, elemento, 228 extension. 229 SIEGEL, 207; 250 Signatura, 355, 356 Sirnetria de relaciones, 17 SimCtrica(s), diferencia, de dos conjuntos, 19 funciones. elementales. 234. 236 funcionei rationales, 233, 234 campo de las, 235 matriz, 316 matriz real. 348 SimCtricos, grupos, 93, 323 grupos de grado n, 42, 81, 233, 246, 249, 278 SimCtricos, polinomios, 236 teoremas sobre, 236 Sim~le. extension. 226. 227

Submodulo, 190 Suma: directa exterior, 160 directa interior, 160 Suprayectivas, aplicaciones, 23 SYLOW. 97 92, Sylow, teorema de, 68, 97, 98 101, 82 Sylvester, ley de, 354 Sylvester, ley de inercia de. 354 Teorema: de Brauer-Cartan-Hua. 373 de Cauchy, 67. 92 de Cavlev. 77 de caylei-~amilton, 255, 307, 335, 336 de Desargues. 366 de factorizacibn Cnica, 31, 141 de Frobenius. 374 de Jacobson, 372 de la teoria de Galois, fundamental,
239

de ~agrange, 50, 382, 383 de 10s cuatro cuadrados, 377 de Pappus, 366 de Sylow, 68, 97, 98, 101 de Wedderburn, 361, 365, 367, 382 de Wilson, 99, 135 del Blgebra, fundamental, 338 del residuo, 210 fundamental del algebra, 338 fundamental de la teoria de Galois. ~ i l g u i a r ;257 239 transformacidn lineal, 255 fundamental sobre 10s grupos abelianos Sistema de ecuaciones lineales: finitos, 192 rango de un, 176 fundamental sobre 10s modulos finitadeterminante de un. 330 mente generados, 190 125 Sistema m~lti~licativo; pequefio de Fermat, 371 Soluble, grupo, 99, 245 sobre 10s grupos abelianos finitos, funw r radicales, 243, 244, 247, 249 damental, 192 sobre 10s mddulos finitamente gemraconjunto de, 23 dos, fundamental, 190 diagonal. 16 sobre polinomios simCtricos. 236 propio, 13 restriccion de una aplicacion a un, 28 Teoria: de conjuntos, 12 Subespacio, 158 de Galois. 216, 229, 237 aniquilador de un, 175 de matrices, 252, 265 ciclico, 292 THOMPSON, 66 invariante, 280. 285 Trascendentes, nhmeros, 205, 207 Subgrupo(s), 46 Transformation (es) lineal (es), 253 caracteristico, 76 i l p b r a de las 252 ciclico generado por ( I , 47 clase lateral derecha de un, 48 anillo de, 158 conjugado, 101 conjunto dcsconiponible de, 287 conmutador, 71, 245 determ~nantede una, 329 conmutador superior. 245 divisores elementalus dc una, 306 derecha, clase lateral, de un, 48 hurmitiana, 342, 346 generado por a, ciclico, 47 invariantes de una, n~lpolente,294 pcnerado p)r G, 7 1 ~nvertible,255 ~ c n c r ; ~ poro It'. 47 ~l irreducible, conjunto de, 216 1141 lrivii~l.4 0 ~natrizde unn, en unas bases dadas, 111)1111:11. 3 0 . ;7 266 1) \ \ I l l \ \ . ' S I nilpotente, 287, 288 I1 l\l;ll. 4 0 no negirliva. 347

L'ransformaci6n (es) not tnal. 343, 345, 347
p1~41\l\il,

347

de una, 257, 258 regular. 255 \inbnlar. 255 t ~ i u ude una, 313 unitaria, 340, 346 I ransitividad de relacioaes, 17 I'ran~posiciones, 85 I l4an5puesta. 3 12 de una matriz, 315
1.1nb.o

't (aza. 312, 319 de u n s matriz. 312

Vacio, conjunto, 13 Valor de un polinomio, 200 Valor propio, 261 VANDER WAERDEN, 249 VANDIVER, 367 Vector(es). 157 caracteristicos. 263 linealmente dependientes, 164 Vectorial(es), espacio(s), 155 complejo, 178 homomorfismo entre, 158 isomofismo entre, 158 real, 178 , WAERDEN, VAN DER, 249 Waring, problema de. 383 WEDDERBURN, 366 359, Wedderburn, teorema de 361, 365, 367,

de unlt t r a n s f k a c i o n lineal, 313 'I'riangular, 279 formo, 279, 282 . mat I iz. 279-282 l I iiingulo, desigualdad dcl. 187 rt iwcci6n de un bwulo. 222

WIELANDT, 97 Wilson, teorema de, 99, 135 Unidad en un algebra de matrices, 272 WRIGHT,384 Unidad cn ud anillo. 128 ,I-64ma raia. prirnitiva de, 242. 367 Unitin tie conjuntos, 13, 15 2 X 2, anillo de las matrices racional'es, Unitwio, K-mdulo, 189 U ~ k a r i a ,transformaci6n. 338, 342, 346 106

WEISNG~~~~

382

Esra o h terntino d e imprimirse el dia 4 d e noviembre d e 1980, en 10s talleres d e 1,itogriiifca Ingramex, S. A.. se encuadernb en Ediciones ,y Encuadernaciones Trillos, S. A., se timron 2 000 c.iettlplares, mtis sobrantes de reposicibn

.

hacer practicas sobre 10s resultddos obtenidos. Otrcip problerhas se han *luido no tanto para ser resueltm en ,su totalidad, sino mas bien para que el estudiante, a1 intentar su soluci6n, maneje y se ejercite en 10s diferentes aspedos del tema, teniendo asi oportunidad, precisamente por la dikultad que ofrece la soluci6n, de conocer varios caminos hacia la misma. Otros problemas se han incluido como material preliminar o precursor de conceptos que proseguirhn en el orden del aprendizaje.

'

-

a

OBRA A F ~ N
Anhlisis matemhtieo
Curso de introdmi&

Teoria de 10s grupos
Marehall Hall Jr.
La presente obra ofrece una exposici6n muy completa de un aspect0 tan fandamental del algebra moderna como es la teorfa de 10s grupos. Supone del estudiante un conocimiento elemental de Algebra moderna. Entre sus campos de aplicaci6n figuran - ademas de las ciencias puras - la eetadlatica superior, la ingenieria y la economia. Todos 10s fundamentos de la materia aparecen clara y detalladamente tratados y se reaumen gran parte de 10s temas de mayor inter& de la teoria de 10s grupos: grupoa abelianos infinitos, estru~turade 10s grupos, redes de subgrupos, representaci6n de grupos, etc. En el liltimo capitulo se desarrolla una presentaci6n algebraica de diatintos t6picos,de la geometria proyectiva, de gran inter&. Es un texto pdcticarnente autosuficiente, no requbre obra auxiliar alguna para su cabal comprensi6n. Por otra parte, ofrece una selecta bibliografia mediante la cual todo estudiante o investigador podr8. orientarse en 10s temas que sean de su particular inter&.

a

,

1

.

.

I

-

L a presente obra ha sido pen-

-'

Sign up to vote on this title
UsefulNot useful