You are on page 1of 115

Álgebra

Ingenierı́a en Informática

Universidad de Alcalá

José Enrique Morais San Miguel


20 de enero de 2005
Computer science is no more about computers than astronomy is about
telescopes.

E.W. Dijkstra
Índice general

1. Preliminares 1
1.1. Teorı́a de conjuntos y aplicaciones. . . . . . . . . . . . . . . . . . . . 1
1.1.1. Definición de conjunto. Paradoja de Russell . . . . . . . . . . 1
1.1.2. Subconjuntos. Operaciones entre conjuntos . . . . . . . . . . . 2
1.1.3. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Relaciones de orden y de equivalencia . . . . . . . . . . . . . . . . . . 10
1.2.1. Relaciones de equivalencia . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Relaciones de orden . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Números naturales. Principio de inducción . . . . . . . . . . . . . . . 13
1.3.1. Números naturales . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.2. Principio de inducción . . . . . . . . . . . . . . . . . . . . . . 14
1.4. Cardinal de un conjunto . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.1. ¿Qué significa contar? . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2. Cardinal de un conjunto . . . . . . . . . . . . . . . . . . . . . 17
1.5. Operaciones internas . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.1. El anillo Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2. Divisibilidad en Z 25
2.1. División euclı́dea en Z. Máximo común divisor . . . . . . . . . . . . . 25
2.2. Algoritmo de Euclides. Teorema de Lamé . . . . . . . . . . . . . . . . 29
2.2.1. Teorema de Lamé . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Identidad de Bézout. Algoritmo extendido de Euclides . . . . . . . . . 33
2.4. Ecuaciones diofánticas lineales . . . . . . . . . . . . . . . . . . . . . . 37
2.5. Mı́nimo común múltiplo . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3. Congruencias 47
3.1. Aritmética modular. Teorema chino de los restos . . . . . . . . . . . . 47
3.1.1. Aritmética modular . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.2. Teorema chino de los restos . . . . . . . . . . . . . . . . . . . 48
3.1.3. El grupo multiplicativo Z∗m . . . . . . . . . . . . . . . . . . . . 53
3.2. Teorema de Euler-Fermat . . . . . . . . . . . . . . . . . . . . . . . . 57

i
3.3. Un test de primalidad eficiente . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1. Algoritmo binario para el cálculo de potencias . . . . . . . . . 59
3.3.2. Test de Miller-Rabin . . . . . . . . . . . . . . . . . . . . . . . 60
3.4. Sistema criptográfico de clave pública RSA . . . . . . . . . . . . . . . 62
3.5. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4. El anillo de polinomios K[x] 71


4.1. Polinomios y divisibilidad . . . . . . . . . . . . . . . . . . . . . . . . 71
4.1.1. División euclı́dea . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.2. Cuerpos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5. Matrices y sistemas de ecuaciones lineales 75


5.1. Matrices sobre un cuerpo. Definiciones y notación . . . . . . . . . . . 75
5.1.1. Operaciones con matrices . . . . . . . . . . . . . . . . . . . . 77
5.2. Rango de una familia de vectores de K n . . . . . . . . . . . . . . . . 77
5.3. Rango por filas y por columnas de una matriz . . . . . . . . . . . . . 80
5.4. Rango de una matriz. Matrices elementales . . . . . . . . . . . . . . . 84
5.4.1. Matrices elementales . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.2. Rango de una matriz . . . . . . . . . . . . . . . . . . . . . . . 86
5.4.3. Aplicación al cálculo de inversas de matrices regulares . . . . . 87
5.5. Combinación lineal. Variedades lineales . . . . . . . . . . . . . . . . . 88
5.6. Sistemas de ecuaciones lineales. . . . . . . . . . . . . . . . . . . . . . 90
5.6.1. Nulidad de una matriz . . . . . . . . . . . . . . . . . . . . . . 90
5.6.2. Resolución de sistemas lineales . . . . . . . . . . . . . . . . . . 92
5.7. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6. Diagonalización de matrices 101


6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.1.1. Un ejemplo preliminar . . . . . . . . . . . . . . . . . . . . . . 101
6.1.2. Planteamiento general del problema . . . . . . . . . . . . . . . 103
6.2. Algoritmo de diagonalización . . . . . . . . . . . . . . . . . . . . . . . 104
6.3. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 108

7. Espacios vectoriales y aplicaciones lineales 111


7.1. Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.2. Aplicaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.3. Códigos correctores de errores . . . . . . . . . . . . . . . . . . . . . . 111
7.4. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Capı́tulo 1

Preliminares

1.1. Teorı́a de conjuntos y aplicaciones.


1.1.1. Definición de conjunto. Paradoja de Russell
Si acudimos a un diccionario, la definición que se nos da de conjunto es, más o menos,
del siguiente tenor: Totalidad de los entes matemáticos que tienen una propiedad
común.1
En esta definición, y de manera implı́cita, estamos suponiendo que tenemos una
colección de objetos (matemáticos o no, eso es lo de menos) y que disponemos de un
criterio que nos permite saber si tal o cual objeto pertenece a dicha colección o no
(se tratarı́a de ver si cumple o no la propiedad) . Es decir, si mi colección de objetos
es A y x es un objeto podemos determinar si x ∈ A (x pertenece a A) o x ∈ / A
(x no pertenece a A). Aparentemente, esta definición de conjunto es perfectamente
coherente, pero plantea serios problemas como veremos a continuación. El lógico
galés Bertrand Russell (1872-1970)2 , considerado uno de los grandes en la Lógica
del Siglo XX escribió : “Normally, a class 3 is not a member of itself. Mankind, for
example, is not a man”. Pero si consideramos el conjunto de todos los conjuntos,
éste se contendrı́a a sı́ mismo. En consecuencia, Russell explicaba en 1901 la que ha
pasado a la historia como paradoja de Russell en los siguientes términos:

Form now the assemblage of classes which are not members of them-
selves. This is a class: is it a member of itself or not? If it is, it is one
of those classes that are members of themselves, i.e. it is not a member
of itself. If it is not, it is not one of the classes that are not members
of themselves, i.e it is a member of itself. Thus the two hypothesis- that
1
Esta definición está extraı́da de la versión de 2001 del Diccionario de la RAE.
2
Una pequeña biografı́a de Russell, con especial atención a sus aportaciones matemáticas,
puede consultarse en http://www-groups.dcs.st-andrews.ac.uk/~history/Mathematicians/
Russell.html
3
Aquı́ clase debe entenderse como conjunto definido como en el diccionario.

1
2 CAPÍTULO 1. PRELIMINARES

it is, and that is not, a member of itself-each implies its contradictory.


This is a contradiction.

Utilizando notación matemática al uso, la paradoja se escribe como sigue:


Sea S = {X : X conjunto y X ∈
/ X}. Se tiene que si S ∈ S, entonces, S ∈
/ S; y si
S∈/ S, entonces S ∈ S.
Existen diversas formas de evitar esta paradoja (axiomática a la Zermelo-Fraenkel, a
la Gödel-Bernays,...) pero no entraremos en ellas. Por ejemplo, una rápida introduc-
ción a la axiomática “à la Gödel-Bernays”se encuentra en 4 . Digamos únicamente
que, en la axiomática “à la Gödel-Bernays”, se llama clase a lo que el diccionario
definı́a como conjunto y se dice que una clase es un conjunto si, y sólo si, existe otra
clase B tal que A ∈ B. De esta forma, la clase S definida anteriormente, es decir,

S = {X : X conjunto y X ∈
/ X}
no es un conjunto, evitando la paradoja de Russell.

1.1.2. Subconjuntos. Operaciones entre conjuntos


Aun teniendo presente la paradoja de Russell, a lo largo del curso no nos vamos
a encontrar con situaciones como esta, es decir, siempre que definamos una clase
será siempre un conjunto y, de esta forma, aceptaremos la definición del diccionario.
Asimismo, asumimos que cada vez que hagamos una operación entre conjuntos
(unión, intersección, producto cartesiano,...) el resultado será siempre un conjun-
to. Si en algún momento nos damos de bruces con una clase que no es un conjunto,
lo señalaremos.
Junto a la propia definición de conjunto y al concepto de pertenencia, aparece otra
noción básica: la igualdad de conjuntos. Se dirá que dos conjuntos son iguales si
poseen los mismos elementos, aceptando la veracidad de las siguientes propiedades
para la igualdad:

Todo conjunto es igual a sı́ mismo.

Si A y B son conjuntos y A = B, entonces B = A.

Si A, B y C son conjuntos y A = B y B = C, entonces A = C.

Subconjuntos
Un conjunto B se dice subconjunto de otro conjunto A, y se escribe B ⊂ A, si
todo elemento de B también lo es de A, es decir,
4
T.W. Hungerford. Algebra. Springer–Verlag (1987)
1.1. TEORÍA DE CONJUNTOS Y APLICACIONES. 3

para todo x ∈ B , x ∈ B implica x ∈ A.


Si B es subconjunto de A también se suele decir que A incluye a B o que B está in-
cluido en A.

Ejemplo 1.1

El conjunto formado por las alumnas de la Universidad de Alcalá es un sub-


conjunto del conjunto de todos los estudiantes de la Universidad de Alcalá.

El conjunto dado por

{x ∈ N : x = 2n, para algún n ∈ N}

es un subconjunto de los números naturales.

Por otro lado, se tiene que

A = B ⇐⇒ A ⊂ B y B ⊂ A.
El conjunto vacı́o (denotado ∅) es el conjunto que no tiene ningún elemento. Puesto
que la condición x ∈ ∅ es siempre falsa, por lo anterior ∅ es subconjunto de cualquier
conjunto. Puesto que, por otro lado, todo conjunto es subconjunto de sı́ mismo,
llamaremos subconjuntos propios de un conjunto a todos los subconjuntos de él que
no sean ni el vacı́o, ni el propio conjunto. Por ejemplo, el conjunto de los números
naturales pares es un subconjunto propio del conjunto de números naturales.

Operaciones entre conjuntos


A partir de un conjunto dado o de varios conjuntos dados, podemos construir nuevos
conjuntos. De esto nos ocuparemos en lo que resta de Subsección.
Dado un conjunto A se define otro conjunto, conocido como el conjunto de partes
de A y denotado por P(A), que es el conjunto de todos los subconjuntos de él. Por
ejemplo, si

A = {a, b, c},

P(A) = {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}.
Supongamos ahora que tenemos dos conjuntos A y B. A partir de ellos, podemos
construir los siguientes conjuntos (¡conviene que se comparen estas nociones y sus
propiedades con la de los conectivos lógicos,{∨, ∧, ¬}, que seguro se introducirán en
la asignatura de Lógica!):
4 CAPÍTULO 1. PRELIMINARES
S
La unión de A y de B, escrito A B, se define como {x : x ∈ A o x ∈ B}.
T
La intersección
T de A y de B, escrito A B se define como {x : x ∈ A y x ∈
B}. Si A B = ∅, se dice que A y B son disjuntos.
El complementario de B en A, escrito A \ B, es el subconjunto de A dado
por {x : x ∈ A y x ∈
/ B}.

Los conceptos de unión e intersección pueden extenderse a una familia (finita o no)
de conjuntos cualesquiera.
Para las propiedades que siguen, supondremos que todos los conjuntos involucrados
son subconjuntos de otro prefijado U y denotaremos por Ac el complementario de
A en U . Asimismo, I denota un conjunto de ı́ndices.
T[ [ \
1. A ( Bi ) = (A Bi )
i∈I i∈I
[\ \ [
2. A ( Bi ) = (A Bi )
i∈I i∈I
[ \ \ [
3. ( Ai )c = Aci y ( Ai )c = Aci (Leyes de Morgan)
i∈I i∈I i∈I i∈I
S T
4. A B = B ⇐⇒ A ⊂ B ⇐⇒ A B=A

Dado que es el primer resultado que nos aparece en las notas, demostraremos algunas
de estas propiedades con todo lujo de detalles.
Propiedad 1. Por lo que hemos visto sobre la igualdad de los conjuntos, la propiedad
1 es equivalente a

\[ [ \
A ( Bi ) ⊂ (A Bi ) y (1.1)
i∈I i∈I
[ \ \[
(A Bi ) ⊂ A ( Bi ) (1.2)
i∈I i∈I

Probemos (1.1) en primer lugar. Para ello,[deberemos mostrar que todo elemento
T[ \ T[
de A ( Bi ) es también un elemento de (A Bi ). Sea, pues, x ∈ A ( Bi ).
i∈I i∈I i∈I
Por definición
[ [ como decir que x ∈ A
de intersección de conjuntos, esto es tanto
yx∈ Bi . Ahora bien, por definición de unión, x ∈ Bi implica que existe al
i∈I i∈I
menos un i ∈ I tal que x ∈ Bi . Si a esta última condición le añadimos[ahora
\ que
T
x ∈ A, se tiene que x ∈ A Bi para el i anterior. En consecuencia, x ∈ (A Bi )
i∈I
como querı́amos demostrar.
1.1. TEORÍA DE CONJUNTOS Y APLICACIONES. 5
[ \
Probemos ahora (1.2). Al igual que antes, hay que mostrar que si x ∈ (A Bi ),
i∈I
T[ [ \
entonces x ∈ A ( Bi ). Decir que x ∈ (A Bi ) es lo mismo que decir que para
i∈I
T i∈I
algún i ∈[I, x ∈ A Bi , es decir, que x ∈ A y x ∈ [
B . Ahora bien, x ∈ Bi implica
T i
que x ∈ Bi y como x ∈ A, se tiene que x ∈ A ( Bi ).
i∈I i∈I

[ \
Prueba de las leyes de Morgan. Probemos que ( Ai )c = Aci . Decir que
i∈I i∈I

[
x ∈ ( Ai )c
i∈I

es lo mismo que decir que [


x∈
/ Ai .
i∈I

A su vez, esta última condición es equivalente a

para todo i ∈ I, x ∈
/ Ai .

De nuevo, esta última afirmación es equivalente a

para todo i ∈ I, x ∈ Aci ,

y esto último es equivalente a


\
x∈ Aci .
i∈I

La siguiente construcción tiene gran interés y reaparecerá a menudo en el curso, en


especial en la parte dedicada al Álgebra Lineal. Es lo que se conoce como producto
cartesiano. Supongamos dados dos conjuntos A y B. El producto cartesiano de A
por B, escrito A × B, es el conjunto definido por

A × B = {(a, b) : a ∈ A, b ∈ B}.
Obsérvese que ∅ × B = ∅ = A × ∅. A los elementos de A × B se les llama pares
ordenados. En forma clara, este mismo concepto se extiende a una familia finita de
conjuntos. Supongamos dados conjuntos A1 , . . . , An . Se define A1 × A2 × · · · × An
como el conjunto

A1 × A2 × · · · × An = {(a1 , a2 , . . . , an ) : a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An }.
6 CAPÍTULO 1. PRELIMINARES

En el caso de que A = B, A × B se suele escribir A2 y si A1 = A2 = · · · = An = A,


A1 × A2 × · · · × An se denota por An .
Finalmente, estudiamos un tipo de construcción de interés en Informática, tal cual
es el conjunto de palabras sobre un alfabeto finito. Supongamos dado un
conjunto finito Σ (por ejemplo, el alfabeto español {a,b,c,d, . . . , n,ñ, . . . , x,y,z} o
{0, 1}) que llamaremos alfabeto. Se llama palabra de longitud n a una n−tupla
de elementos de Σ, es decir, α = (α1 , . . . , αn ) ∈ Σn . Habitualmente, se omiten los
paréntesis y las comas y se escribe

α1 . . . αn .
Si n = 0, Σ0 se define como el conjunto formada únicamente por la palabra vacı́a
que se denota λ.
Por poner unos ejemplos, si Σ es el alfabeto español, patata es una palabra de
longitud 6 (está formada por 6 letras), supercalifragilistico es una palabra de longitud
21, ascvbghe tiene longitud 8,...
De esta forma, se define como el conjunto de palabras sobre el alfabeto finito Σ, y
se denota Σ∗ a
[
Σ∗ = Σn .
n∈N

1.1.3. Aplicaciones
Antes de definir de manera precisa el concepto de aplicación, estudiemos un ejemplo
ilustrativo. En tiempos que parecen ya muy lejanos (cuando la “mili”era obligatoria),
todos los mozos de una quinta tenı́an que pasar por un proceso que incluı́a, entre
otras cosas, la medida de su talla. Este proceso, asociar a cada mozo un número (su
talla en centı́metros) es un ejemplo tı́pico de aplicación. Dado un conjunto, en este
caso los mozos del reemplazo, a cada uno de ellos se le asocia un único elemento de
otro conjunto (en este caso, un número natural).

Definición 1.2 Dados conjuntos, A y B, una aplicación f de A en B (escrito


f : A → B) asigna a cada elemento a ∈ A un único elemento b ∈ B. Al conjunto
A se le dice dominio y a B rango. Dos funciones son iguales si poseen el mismo
dominio y toman igual valor para elementos iguales del dominio. Si S ⊂ A, podemos
definir una aplicación de S en B, llamada restricción de f a S y denotada por f |S ,
que a cada elemento de S le asigna el mismo valor que f .

Ejemplo 1.3

La aplicación que a cada ciudadano español le asigna un número (el DNI).

La aplicación talla estudiada anteriormente.


1.1. TEORÍA DE CONJUNTOS Y APLICACIONES. 7

f : N → N dado por f (n) = 2n. Esta última es una forma tı́pica de expresar
una aplicación: decir cuál es la imagen de un elemento genérico del dominio.

Definición 1.4 (Composición de aplicaciones) Sean f : A → B y g : B → C


dos aplicaciones. La composición de las aplicaciones f y g, denotada por g ◦ f , es
una aplicación de A en C dada por

(g ◦ f )(a) = g(f (a)).

Dada una aplicación f : A → B se denomina conjunto imagen al subconjunto de B


definido por:

{b ∈ B : b = f (a) para algún a ∈ A},


y a menudo se denota por Imf . Por otro lado, si T ⊂ B la imagen inversa de T por
f es el conjunto

{a ∈ A : f (a) ∈ T }
que, habitualmente se denota por f −1 (T ). Si T está compuesto por un único ele-
mento, T = {b}, se suelen omitir las llaves y se escribe f −1 (b).

Proposición 1.5 Sea f : A → B una aplicación. Se puede ver que:

para S ⊂ A, S ⊂ f −1 (f (S));

para T ⊂ B, f (f −1 (T )) ⊂ T .

Asimismo, si {Ti : i ∈ I} es una familia de subconjuntos de B, se verifica


[ [
f −1 ( Ti ) = f −1 (Ti )
i∈I i∈I
\ \
f −1 ( Ti ) = f −1 (Ti )
i∈I i∈I

Nota: El recı́proco a las dos primeras afirmaciones del resultado anterior no es, en
general, cierto. Por ejemplo, sean J el conjunto de jugadores de la liga española en
la temporada actual y f la aplicación que a cada jugador le asocia su altura. Si S
es el conjunto formado únicamente por Benayoun (S = {Benayoun}), puesto que su
altura es de 178 cm, f −1 (f (S)) es el conjunto de todos los jugadores que miden 178
cm. Entre ellos estará el propio Benayoun, pero también muchos otros. ¿Por qué no
se da la igualdad? Simplemente, porque hay más jugadores, aparte de Benayoun,
que miden 178 cm.
8 CAPÍTULO 1. PRELIMINARES

Consideramos ahora la aplicación f : N → N dada por f (n) = 2 ∗ n y sea T el


conjunto de números naturales múltiplos de 3, es decir, T = {0, 3, 6, 9, 12, 15, . . .}.
En este caso, f −1 (T ) = T y f (f −1 (T )) es el conjunto de naturales múltiplos de 6.
En este caso, la igualdad no es cierta porque, naturalmente, no todos los múltiplos
de 3 son pares.

En la proposición anterior, la igualdad en las dos primeras afirmaciones se satisface


siempre sólo para algunos tipos particulares de funciones. Estudiemos, ahora, estas
funciones.

Definición 1.6 (Aplicaciones inyectivas, sobreyectivas y biyectivas) Sea


f : A → B una aplicación.

f se dice inyectiva si

para todo a, a0 ∈ A con f (a) = f (a0 ) =⇒ a = a0 .

f se dice sobreyectiva si

para todo b ∈ B, b = f (a) para algún a ∈ A.

f se dice biyectiva si es inyectiva y sobreyectiva.

Ejercicio 1.7 Sea f : A → B una aplicación. Probar que:

si f es inyectiva y S ⊂ A, S = f −1 (f (S)) y que


si f es sobreyectiva y T ⊂ B, f (f −1 (T )) = T

De las definiciones anteriores se deduce que para todo conjunto A la llamada apli-
cación identidad, IA , definida por IA (a) = a, es biyectiva.
Hasta este momento, hemos definido una operación entre funciones (la composición)
y de entre todas las funciones hemos distinguido algunas especiales (las inyectivas,
sobreyectivas y biyectivas). ¿Cómo se comporta la composición frente a estas apli-
caciones especiales? La respuesta a esta pregunta se encuentra en los siguientes
resultados.

Proposición 1.8 Sean f : A → B y g : B → C aplicaciones. Entonces,

f y g inyectivas =⇒ g ◦ f es inyectiva;
f y g sobreyectivas =⇒ g ◦ f es sobreyectiva
g ◦ f inyectiva =⇒ f es inyectiva;
g ◦ f sobreyectiva =⇒ g es sobreyectiva.
1.1. TEORÍA DE CONJUNTOS Y APLICACIONES. 9

Teorema 1.9 Sea f : A → B una aplicación y A 6= ∅.

1. f es inyectiva si, y sólo si, existe una aplicación g : B → A tal que g ◦ f = IA .

2. f es sobreyectiva si, y sólo si, existe una aplicación h : B → A tal que f ◦ h =


IB .

Demostración.– 1.- Supongamos, primero que existe g tal que g ◦ f = IA . Como IA


es inyectiva, por lo anterior, la existencia de g garantiza la inyectividad de A.
Supongamos, ahora que f es inyectiva. Entonces, para cada b ∈ f (A), existe un
único a tal que f (a) = b. Sea ahora a0 un elemento cualquiera de A. La aplicación

a, si b ∈ f (A) y f (a) = b
g(x) =
a0 , si b ∈
/ f (A)
verifica g ◦ f = IA .
2.- Si existe h tal que f ◦ h = IB , puesto que IB es sobreyectiva, la Proposición
anterior me garantiza que f es sobreyectiva.
Supongamos ahora que f es sobreyectiva. Eso quiere decir que para cualquier b ∈ B,
f −1 (b) ⊂ A no es vacı́o. En consecuencia podemos elegir ab ∈ f −1 (b). La aplicación
h(b) = ab verifica la tesis del enunciado

Nota. En la prueba del Teorema anterior hemos dado por hecho que en cualquier
conjunto no vacı́o podemos escoger siempre un elemento. Aunque no entraremos en
ello, los axiomas tı́picos de la teorı́a de conjuntos no nos garantizan que podamos ha-
cerlo. En consecuencia, se suele asumir que esto siempre es posible constituyéndose
entonces como un axioma más. Existen distintas versiones de este axioma que se
conoce como Axioma de elección.
La aplicación g del Teorema anterior se suele llamar inversa a izquierda de f y la h
inversa a derecha de f . Si una aplicación f : A → B posee una inversa a izquierda
g y una inversa a derecha h, se tiene:

g = g ◦ IB = g ◦ (f ◦ h) = (g ◦ f ) ◦ h = IA ◦ h = h
y la aplicación g = h se dice inversa a derecha e izquierda de f . Asimismo, este
argumento prueba que si existe inversa a derecha e izquierda de f ésta es única.
Ahora, juntando los dos apartados del Teorema y las consideraciones previas, se
tiene que si f : A → B es una aplicación, entonces

f es biyectiva ⇐⇒ f posee inversa a izquierda y derecha.


La única aplicación que es inversa a derecha e izquierda de f se denota por f −1 y
se llama inversa de f .
10 CAPÍTULO 1. PRELIMINARES

1.2. Relaciones de orden y de equivalencia


1.2.1. Relaciones de equivalencia
Una relación en un conjunto A no es más que un subconjunto R del producto
cartesiano A × A. De esta forma se dice que dos elementos están relacionados, aRb,
si el par (a, b) pertenece al subconjunto R. Supongamos que tomamos un grupo de
personas y R el conjunto de pares ordenados de personas que son del mismo sexo.
Dos personas están relacionadas si, y sólo si, son del mismo sexo.
Las propiedades que puede tener una relación son:

reflexiva: aRa para todo a de A,

simétrica: aRb =⇒ bRa,

antisimétrica : aRb y bRa =⇒ a = b

transitiva: aRb y bRc =⇒ aRc

Ası́, la relación anteriormente definida es reflexiva, simétrica y transitiva. Obsérvese


que, de esta forma, hemos clasificado a nuestro grupo en dos, a saber, hombres y mu-
jeres. Esto es ası́, justamente, por verificar esa relación las citadas tres propiedades.

Definición 1.10 Una relación que verifique las propiedades reflexiva, simétrica y
transitiva se denomina relación de equivalencia.

Ejemplo 1.11

Relación de congruencia módulo un natural n > 0 en Z definida por

r congruente con s módulo n ⇐⇒ r − s es múltiplo de n

Relación de paralelismo entre rectas del plano.

La relación de equipotencia entre conjuntos definida por

A y B equipotentes ⇐⇒ existe una aplicación biyectiva f : A → B.

Como ya hemos dicho, las relaciones de equivalencia sirven para clasificar los ele-
mentos del conjunto A en lo que se conoce como clases de equivalencia. La clase de
un elemento a es:

ā = [a] = {x ∈ A : xRa}.
1.2. RELACIONES DE ORDEN Y DE EQUIVALENCIA 11

El conjunto de todas las clases de equivalencia en A se denota por A/R y se denomina


conjunto cociente de A por R. En el ejemplo del grupo de personas, sólo tenemos 2
clases de equivalencia como ya dijimos: la compuesta por los hombres y la compuesta
por las mujeres. Además, la unión de ambas clases de equivalencia es el conjunto de
personas que estamos considerando y su intersección es vacı́a.

Ejercicio 1.12 Si n es un número natural, ¿cuántas clases tenemos para la relación


de congruencia módulo n?

Estudiemos de manera más profunda estas las clases de equivalencia y, en conse-


cuencia, el conjunto cociente. Se tiene:

(i) Para cada a ∈ A, la clase ā es no vacı́a como consecuencia de la propiedad


reflexiva. Además, a ∈ ā, por lo que
[ [
ā = A = ā
a∈A ā∈A/R

(ii) ā = b̄ ⇐⇒ aRb

(iii) Dados a, b ∈ A, o ā = b̄ o ā ∩ b̄ = ∅.

Las propiedades (i) y (iii) suelen resumirse diciendo que el conjunto de clases de
equivalencia forman una partición del conjunto A. En general, una partición de un
conjunto A es un conjunto de subconjuntos {Ai : i ∈ I} de A tales que su unión
es todo A y son disjuntos dos a dos, es decir, Ai ∩ Aj = ∅ si i 6= j. Se puede ver
que toda relación de equivalencia en A forma una partición de A (lo hemos visto) y
que toda partición de A da lugar a una relación de equivalencia (dos elementos de
A estarán relacionados si pertenecen al mismo subconjunto de la partición).

1.2.2. Relaciones de orden


En términos coloquiales, si las clases de equivalencia servı́an para clasificar, las
relaciones de orden, como su propio nombre indica, sirven para ordenar los elementos
de un conjunto.

Definición 1.13 Una relación que verifique las propiedades reflexiva, antisimétrica
y transitiva se denomina relación de orden. Esta relación se denota, habitualmente,
por ≤.

Ejemplo 1.14

La relación de inclusión en P(A) para un conjunto A.


12 CAPÍTULO 1. PRELIMINARES

La relación ≤ en Z, Q o R.

En los dos ejemplos anteriores, se percibe una radical diferencia. En P(A) dos ele-
mentos no son siempre comparables: por ejemplo, si A = {1, 2, 3, 4}, los subconjuntos
{1, 2} y {2, 3} no verifican ni {1, 2} ⊂ {2, 3} ni {2, 3} ⊂ {1, 2}. Sin embargo, dados
dos números enteros, por ejemplo, siempre uno de ellos es menor o igual que el otro.
Un conjunto con una relación de orden en la que dos elementos son siempre compa-
rables, se dice totalmente ordenado. Si no, se dice parcialmente ordenado.
En un conjunto con una relación de orden, algunos elementos reciben nombres es-
peciales:

mı́nimo: a ∈ A tal que a ≤ x para todo x ∈ A

máximo: a ∈ A tal que x ≤ a para todo x ∈ A

Por ejemplo, el conjunto de números naturales posee mı́nimo para la relación de


orden habitual, mientras que no posee máximo. En el caso de las partes de un
conjunto A con la inclusión como relación de orden, se tiene que el conjunto vacı́o
es mı́nimo y el propio conjunto A es máximo.
Por otro lado, en relación a un subconjunto X de A se dice que a ∈ A es

cota inferior, si a ≤ x para todo x ∈ X;

ı́nfimo, si es la mayor de las cotas inferiores;

cota superior, si x ≤ a para todo x ∈ X;

supremo, si es la menor de las cotas superiores.

Cuando se tiene una relación de orden ≤, la notación a < b significa que a ≤ b y


a 6= b, mientras que la notación b ≥ a significa, obviamente, que a ≤ b.
Para concluir, una última definición: un conjunto con una relación de orden se dice
bien ordenado si todo subconjunto no vacı́o tiene mı́nimo, es decir, existe ı́nfimo
y éste pertenece al subconjunto.
1.3. NÚMEROS NATURALES. PRINCIPIO DE INDUCCIÓN 13

1.3. Números naturales. Principio de inducción


1.3.1. Números naturales
El conjunto de los números naturales se define usando la conocida como Axiomática
de Peano que data de 1889. Esto es,

1. 0 es un número natural

2. Para cada número natural x existe otro número natural x0 llamado sucesor de
x, tal que

a) 0 no es sucesor de ningún número natural


b) Si x0 = y 0 , entonces x = y

3. Axioma de Inducción : Si S es un subconjunto de N que verifica :

a) 0 ∈ S,
b) Si x está en S, su sucesor también.

Entonces, S = N.

Antes de continuar, algunos pequeños comentarios sobre estos axiomas:


El primero de ellos postula la existencia de un elemento que consideramos el primero
de todos para la ordenación que introduce el segundo postulado. El segundo postu-
lado garantiza la infinitud de N y, por último, el tercero nos garantiza que el único
conjunto que se puede construir a partir de los dos primeros postulados es el de los
números naturales.
Usando los axiomas de Peano, es posible definir la suma en N. En la forma habitual,
llamemos 1 al sucesor de 0, 2 al sucesor de 1, 3 al sucesor de 2,... De esta forma,
podemos definir n + 0 = n y una vez definido n + m, definimos n + m0 := (n + m)0 ,
por ejemplo, n + 1 = (n + 0)0 = n0 . La multiplicación puede también definirse a
partir de estos axiomas de la forma que sigue:

n · 1 := n

una vez definido n · m, definimos n · m0 := (n · m) + n

A pesar de que no entraremos en ello señalemos que, a partir de estas definiciones,


se pueden demostrar las propiedades habituales de las operaciones aritméticas suma
y producto en N (conmutatividad de la suma y del producto, asociatividad de suma
y producto, existencia de elemento neutro para la suma y elemento identidad para
el producto, distributividad,...).
Amén de las operaciones aritméticas ya señaladas, sabemos que en N se tiene un or-
den que puede deducirse del segundo postulado de los axiomas de Peano. Señalemos,
14 CAPÍTULO 1. PRELIMINARES

únicamente, que este orden es el habitual en N y que con este orden, el conjunto de
los números naturales está bien ordenado, es decir, todo subconjunto no vacı́o de N
admite mı́nimo. Obsérvese que el mı́nimo de N es 0.
Para finalizar esta pequeña introducción a los números naturales, probemos una
ligera variación en nuestro axioma de inducción. La razón última para probar este
enunciado, amén de consideraciones que señalaremos más adelante, radica en el
hecho de que vamos a utilizar un tipo de razonamiento usual en Matemáticas. A
saber, la reducción al absurdo.

Teorema 1.15 Sea S un subconjunto de N que verifica

1. n0 ∈ S y

2. para todo n ≥ n0 , n ∈ S =⇒ n + 1 ∈ S.
Entonces, {x ∈ N : x ≥ n0 } ⊂ S.

Demostración.– Supongamos que la inclusión no se verifica. En ese caso, el conjunto


X = {x ∈ N : x ≥ n0 y x ∈ / S} es no vacı́o. Dada la buena ordenación de N, esto
implica que el conjunto X posee mı́nimo, digamos α. Como n0 pertenece a S, se
tendrá que α > n0 , o dicho de otra manera, si β es el inmediato antecesor de α, es
decir, α = β + 1, β ≥ n0 . Puesto que α es el mı́nimo de X y β ≥ n0 , se tendrá β ∈ S.
Ahora bien, por 2 se tendrá que β + 1 = α ∈ S, llegando a una contradicción.

1.3.2. Principio de inducción


El Teorema 1.15 se puede trasladar de manera casi inmediata a un resultado de gran
utilidad para la prueba de ciertos resultados. Pero antes, una anécdota atribuida al
gran matemático Carl Friedrich Gauss (1777-1855). Cuenta la leyenda (véase, por
ejemplo, 5 ), que de niño Gauss asistı́a a la escuela local de Brunswick, dirigida por
un maestro que gustaba de la rutina. Un dı́a, el maestro tuvo la feliz idea de hacer
sumar a sus alumnos todos los números del 1 al 100, ordenándoles además que, según
fuesen acabando cada uno esta poco grata tarea, debı́an poner su pizarra sobre la
mesa. A los pocos segundos, Gauss colocó la pizarra sobre su mesa, diciendo: “Ya
está”. El maestro le miró con desdén y dejó al resto de los alumnos con su tarea.
Cuando acabaron todos, se encontró con la sorpresa de que la única pizarra en la que
aparecı́a el resultado correcto, 5050, era la de Gauss. Obviamente, Gauss habı́a hecho
el cálculo mental de sumar la progresión aritmética 1 + 2 + · · · + 99 + 100 asociando
parejas de términos igualmente alejados de los extremos, es decir, esencialmente
usando la fórmula
5
Carl B. Boyer. Historia de la Matemática, Alianza Editorial
1.3. NÚMEROS NATURALES. PRINCIPIO DE INDUCCIÓN 15

n(n + 1)
1 + 2 + ··· + n = .
2
Esta fórmula es un caso claro del tipo de problemas que podemos atacar con el
Teorema 1.15. Tenemos una serie de afirmaciones, una por cada número natural, y
queremos verificar la veracidad de cada una de ellas. Para ello, definimos el conjunto
S como

n(n + 1)
S = {n ∈ N : 1 + 2 + · · · + n = }
2
Se tiene que 1 ∈ S por cuanto
1·2
1= .
2
Además si suponemos que n ∈ S, es decir,
n(n + 1)
1 + 2 + ··· + n = ,
2
es fácil ver que también es cierto

(n + 1)(n + 2)
1 + 2 + · · · + n + (n + 1) = ,
2
o, lo que es lo mismo, (n + 1) ∈ S. Aplicando el Teorema 1.15, habremos demostrado
que la fórmula es cierta para cualquier número natural mayor o igual que 1.
El mismo razonamiento que hemos hecho con la suma aritmética, puede realizarse
para cualquier conjunto de proposiciones que dependan de un parámetro natural.

Corolario 1.16 (Principio de inducción) Supongamos que para cada natural


n ≥ n0 se tiene una proposición P (n) que puede ser cierta o falsa. Si

1. P (n0 ) es cierta y
2. para todo n ≥ n0 , P (n) cierta =⇒ P (n + 1) es cierta.
Entonces, P (n) es cierta para todo n ≥ n0 .

Asimismo, por argumentos no demasiado complicados, podemos formular el princi-


pio de inducción de esta otra manera:

Corolario 1.17 Supongamos que para cada natural n ≥ n0 se tiene una proposición
P (n) que puede ser cierta o falsa. Si

1. P (n0 ) es cierta y
2. para todo n ≥ n0 , P (m) cierta para todo m con n0 ≤ m ≤ n =⇒ P (n + 1) es
cierta.
Entonces, P (n) es cierta para todo n ≥ n0 .
16 CAPÍTULO 1. PRELIMINARES

Ejemplo 1.18 (Más ejemplos de aplicación del principio de inducción)


1.- Probar que
1
12 + 22 + 32 + · · · + n2 = n(n + 1)(2n + 1) para todo n ≥ 1
6

1
a) La fórmula es cierta para n = 1, pues 1 = 1 · 2 · 3.
6
b) Supongamos que la fórmula es cierta para n. Si eso implica que la fórmula es
cierta para n + 1, tendrı́amos probada la fórmula para cualquier natural ≥ 1. Se
tiene, aplicando la hipótesis de la veracidad de la fórmula para n (hipótesis de
inducción), que
1
12 + 22 + 32 + · · · + n2 + (n + 1)2 = n(n + 1)(2n + 1) + (n + 1)2 .
6
Unas pequeñas cuentas prueban que
1
12 + 22 + 32 + · · · + n2 + (n + 1)2 = (n + 1)(n + 2)(2n + 3),
6
con lo que habrı́amos terminado.

2.- Probar que 32n − 1 es múltiplo de 8 para todo natural ≥ 1.


a) Como 32 − 1 = 8, la afirmación es cierta para n = 1.
b) Lo que tenemos que ver ahora es

32n − 1 múltiplo de 8 =⇒ 32(n+1) − 1 múltiplo de 8


Ahora bien,

32(n+1) − 1 = 32n+2 − 1 = 32n · 32 − 1 = 32n · 32 − 32 + 32 − 1 = 32 (32n − 1) + (32 − 1)

Aplicando que 32n − 1 es múltiplo de 8 y que 32 − 1 = 8 también, se concluye que


32(n+1) − 1 es múltiplo de 8.

1.4. Cardinal de un conjunto


1.4.1. ¿Qué significa contar?
Supongamos que tomamos el tren en el apeadero del Campus para trasladarnos a
la estación de Atocha. ¿Cómo contamos el número de paradas entre una y otra
estación? La primera vez que se para el tren es en Alcalá y a esa parada le asig-
namos el número natural 1. La siguiente parada es La Garena a la que le asignamos
1.4. CARDINAL DE UN CONJUNTO 17

el número 2. De esta manera continuamos hasta llegar a la estación de Atocha


que será la undécima y a la que, lógicamente, le asignaremos el número 11. La
próxima vez que queramos hacer este recorrido no necesitaremos fijarnos en las
paradas; simplemente, tendremos que ir contando hasta once y en ese momento
habremos de descender del tren. En términos matemáticos, ¿qué es lo que hemos
hecho? Sencillamente, establecer una biyección entre el conjunto de paradas y el
conjunto {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11}.
El supuesto anterior es un ejemplo del hecho siguiente: contar es construir una
aplicación biyectiva. Dicho de otra manera, decir que un conjunto tiene n elementos
es tanto como dar una biyección entre dicho conjunto y {1, 2, . . . , n}. Dando otra
vuelta de tuerca, contar es, necesariamente, introducir un orden en un conjunto
finito.
A través de los argumentos anteriores, podemos asegurar que dos conjuntos finitos
tienen el mismo número de elementos si, y sólo si, existe una biyección entre ambos.
Al número de elementos de un conjunto finito A se le llama cardinal de A y se escribe
|A| o #A. Si hablamos de conjuntos finitos y de su cardinal, es fácil establecer algunas
propiedades básicas. Sean, pues A y B conjuntos finitos.

Si A ⊂ B y A 6= B, |A| < |B|. Por lo tanto, no existe ninguna biyección entre


A y B, es decir, si A es finito, ningún subconjunto propio es equipotente a A.
S
Si A y B son disjuntos, |A B| = |A| + |B|.

|A × B| = |A| · |B|.

Si f : A → B es inyectiva, |A| ≤ |B|

Si f : A → B es sobreyectiva, |A| ≥ |B|

1.4.2. Cardinal de un conjunto


En la Subsección anterior, abstrayendo el significado de contar, hemos estableci-
do una definición de lo que llamamos cardinal de un conjunto finito y algunas
propiedades básicas; entre ellas, la imposibilidad de que un conjunto finito sea
equipotente a un subconjunto propio. ¿Ocurre lo mismo con los conjuntos infini-
tos? Consideremos, por ejemplo, el conjunto N de los números naturales y 2N el
conjunto de números naturales pares que es un subconjunto propio de N. Es fácil
ver que la aplicación f : N → 2N, dada por f (n) = 2n es biyectiva, es decir, ¡el
“número de naturales”es igual al “número de naturales pares”!
La forma en la que la definición de cardinal se extiende a cualquier conjunto, finito
o no, es, esencialmente, la misma que la dada para el caso finito.

Definición 1.19 (Cardinal de un conjunto) El cardinal de un conjunto A, es-


crito |A| o #A, es la clase de equivalencia de A bajo la relación de equipotencia.
18 CAPÍTULO 1. PRELIMINARES

Veamos, en primer lugar, que la definición se corresponde con la dada anteriormente


para conjuntos finitos. En efecto, puesto que todo conjunto A con n elementos es
biyectable con In = {1, 2, . . . , n}, podemos identificar su clase con el número n,
por lo que el cardinal de un conjunto finito se puede identificar con el número de
elementos.
El primer cardinal no finito es el cardinal de N que se denomina ℵ0 (se puede
demostrar que todo conjunto infinito contiene un subconjunto que es equipotente a
N). A los conjuntos que tienen el mismo cardinal que N, es decir, que son equipotentes
a N se les llama numerables. Por ejemplo, 2N es numerable. ¿Qué quiere decir que
un conjunto sea numerable? Si retomamos los axiomas de Peano, una caracterı́stica
esencial de N es que sus elementos están numerados: 0 es el primero, 1 el segundo, 2
el tercero,. . . Por lo tanto, que un conjunto sea numerable querrá decir que podemos
escoger en dicho conjunto un primer elemento, un segundo elemento, etc. Dicho
de manera más sencilla, un conjunto es numerable si podemos poner en fila sus
elementos. Por ejemplo, el conjunto de los números enteros es numerable, porque
podemos ponerlos en fila como sigue:

0, 1, −1, 2, −2, 3, −3, 4, −4, 5, −5 . . . .

Ejercicio 1.20

1. Mostrar una biyección entre Z y el conjunto de enteros impares.

2. Demostrar que N × N es numerable. (Indicación: Todo número natural distinto


de cero puede expresarse como una potencia de dos multiplicada por un número
impar).

Algunas propiedades de los conjuntos numerables, que damos sin demostración, son
las siguientes:

Todo subconjunto de un conjunto numerable o es finito o es numerable.

La unión finita o numerable de conjuntos numerables es numerable.

El producto cartesiano de un número finito de conjuntos numerables es nu-


merable.

Finalizamos esta Sección dedicada a los cardinales, señalando que ℵ0 no es el único


cardinal infinito. Puede verse que el conjunto de los números reales no es numerable.
Se conjetura que entre ℵ0 y |R| no hay ningún otro cardinal, aunque sin demostración
por ahora. A esta conjetura se la denomina Hipótesis del continuo.
1.5. OPERACIONES INTERNAS 19

1.5. Operaciones internas


Una de los puntos esenciales del Álgebra es el de abstraer modelos que se adaptan
a situaciones diversas. Un ejemplo tı́pico es el de considerar las cuatro operaciones
aritméticas básicas (suma, resta, multiplicación y división) y situarlas en un paisaje
abstracto que se adapta a diversas situaciones como iremos viendo.
Consideremos, por ejemplo, la suma de números enteros. Esta operación, puede
pensarse como una aplicación de Z × Z en Z, a saber,

+ : Z × Z −→ Z, (m, n) → m + n
Visto esto, se define operación interna ∗ en un conjunto A a una regla que asocia
a cada par (a, b) de A2 otro elemento de A, a ∗ b. Como en el caso de la suma una
operación interna puede considerarse como una aplicación de A × A en A:

∗ : A × A −→ A, (a, b) → a ∗ b
Si volvemos a la operación suma de enteros, sabemos que verifica varias propiedades:
es conmutativa (a+b = b+a, posee elemento neutro (a+0 = a), es asociativa y todo
elemento posee un único elemento opuesto (a+(−a) = 0). Estas mismas propiedades
son las mismas que puede tener cualquier operación interna:

asociativa: a ∗ (b ∗ c) = (a ∗ b) ∗ c para todo a, b, c ∈ A

conmutativa: a ∗ b = b ∗ a para todo a, b ∈ A

elemento identidad : e ∈ A tal que e ∗ a = a ∗ e = a para todo a ∈ A

elemento inverso de un elemento a ∈ A: a0 ∈ A tal que a0 ∗ a = a ∗ a0 = e.

Nota. Las notaciones más usuales para las operaciones internas, por analogı́a con
las operaciones aritméticas, son + y ·. Como para la suma de enteros, si se utiliza
notación aditiva (es decir, + como operación) el elemento identidad, usualmente
llamado neutro, se denota 0 y el inverso de a, generalmente llamado opuesto, se de-
nota por −a. Si la notación es multiplicativa (es decir, · como operación) el elemento
identidad se denota 1 y el inverso de a se suele escribir a−1 .

Definición 1.21 (Grupo) Un conjunto A equipado con una operación interna ∗


se dice que es un grupo si la operación es asociativa, posee elemento neutro y todo
elemento posee inverso. Si la operación es además conmutativa, el grupo se dice
conmutativo o abeliano.

Naturalmente, hay conjuntos que admiten más de una operación interna. Por ejem-
plo, en Z se tienen dos operaciones aritméticas: la suma y el producto de enteros.
20 CAPÍTULO 1. PRELIMINARES

Sabemos que estas dos operaciones verifican lo que se conoce como propiedad dis-
tributiva, es decir,

a(b + c) = ab + bc , (a + b)c = ac + bc para todo a, b, c ∈ Z.

Definición 1.22 (Anillo) Un anillo es un conjunto no vacı́o R junto con dos op-
eraciones internas (usualmente denotadas como suma (+) y producto ( ·)) tales
que:

1. (R, +) es un grupo abeliano;

2. (ab)c = a(bc) para todo a, b, c ∈ R;

3. a(b + c) = ab + bc (a + b)c = ac + bc (propiedad distributiva)

Si el producto es conmutativo, se dice que el anillo es conmutativo y si existe ele-


mento identidad para el producto, se llama anillo con elemento identidad.

Por ejemplo, (Z, +, ·) es un anillo conmutativo con elemento identidad. Esto implica
que en Z hay suma, resta y multiplicación. Sin embargo, aún nos queda por con-
siderar la cuarta operación básica de la aritmética: la división. Pero para hablar de
división, necesitamos que todo elemento tenga un inverso con respecto a la multi-
plicación. En el caso de Z, debemos ampliar nuestro conjunto a los racionales, Q,
para que esto sea posible. Si un anillo, en el que 1 6= 0, todo elemento no nulo posee
inverso, se dice que es un cuerpo. Por ejemplo, Q es un cuerpo.

1.5.1. El anillo Z
Los números enteros forman un conjunto, Z, en el que hay dos operaciones y un
orden. Junto a las operaciones, suma y producto en Z, hemos visto que tiene estruc-
tura de anillo conmutativo con elemento identidad. El orden es total, compatible
con la estructura de anillo y es un buen orden para los enteros ≥ 0. Resumimos las
propiedades esenciales de Z como sigue:
Operaciones. En Z hay dos operaciones, suma y producto, que le dan estructura
de anillo conmutativo con elemento identidad:
Z1. (Z, +) es un grupo conmutativo.
Z2. El producto es asociativo, tiene elemento identidad y es conmutativo.
Z3. El producto es distributivo con respecto a la suma.
El producto posee una propiedad que no todos los anillos poseen:
Z4. ab = 0 =⇒ a = 0 ó b = 0
Los anillos que verifican esta propiedad (y con 1 6= 0 )se llaman dominios de
integridad.
1.5. OPERACIONES INTERNAS 21

Orden. En el conjunto de los enteros hay una relación de orden, es decir, una
relación ≤ con las propiedades:
Z5. reflexiva, simétrica y transitiva.
Este orden es un orden total, es decir,
Z6. para todo a, b ∈ Z, a ≤ b o b ≤ a.
Asimismo, el orden es compatible con las operaciones aritméticas:
Z7. a ≤ b y c ∈ Z =⇒ a + c ≤ b + c,
Z8. a ≤ b y c ≥ 0 =⇒ ac ≤ bc,
y el conjunto de números enteros positivos, es decir, N está bien ordenado:
Z8. Todo subconjunto no vacı́o de N tiene mı́nimo.

Observación 1.23 Al igual que para los axiomas de Peano con respecto a los
números de Peano, las propiedades Z1-Z9 pueden considerarse como los axiomas
que definen los números enteros.
22 CAPÍTULO 1. PRELIMINARES

1.6. Problemas propuestos


Nota. En todos los problemas anillo quiere decir anillo conmutativo con elemento
identidad.

Problema 1.1 .- Sea A un conjunto finito con n elementos. Probar que |P(A)| =
2n y estudiar cuántas aplicaciones biyectivas de A en A se pueden construir.

Problema 1.2 .- Dados dos conjuntos A y B, se llama diferencia simétrica de


ambos y se escribe A∆B al conjunto
[
A∆B = (A \ B) (B \ A).
S T
Demostrar que A∆B = (A B) \ (A B).

Problema 1.3 .- Sean f : Z → Z y g : Z → Z definidas por f (s) = s + 1 y


g(s) = s2 .

a) Estudiar si son inyectivas, sobreyectivas o biyectivas.

b) Describe las aplicaciones g ◦ f y f ◦ g y comprueba que no son iguales. (De


esta forma, queda demostrado que la composición de aplicaciones no es, en
general, conmutativa).

Problema 1.4 .- Supongamos que en un conjunto A tenemos definida una relación


de orden denotada por ≤. Probar que la relación

(α1 , . . . , αn ) ≤ (β1 , . . . , βn ) ⇐⇒ αi ≤ βi ∀i ∈ {1, 2, . . . , n}

es una relación de orden en An . Si el orden es total en A, ¿también lo es el orden


ası́ definido en An ?

Problema 1.5 .- Considérese la siguiente relación en Z × Z \ {0}

(a, b) R (c, d) ⇐⇒ ad = bc.

Probar que dicha relación es de equivalencia. ¿Quién es el conjunto cociente Z × Z \


{0}/R?

Problema 1.6 .- Utilizar el apartado 2 del ejercicio 1.20 de los apuntes para probar
que la unión numerable de conjuntos numerables es numerable.
1.6. PROBLEMAS PROPUESTOS 23

Problema 1.7 .- Probar, mediante el uso del principio de inducción, las fórmulas
o afirmaciones siguientes :

rn+1 − 1
1 + r + r2 + · · · + rn =
r−1

1 + 1 · 1! + 2 · 2! + · · · (n − 1)(n − 1)! = n!

3 3 3 n2 (n + 1)2
3 3
1 + 2 + 3 + · · · + (n − 1) + n =
4

Si a > 0, (1 + a)n ≥ 1 + na

7n − 6n − 1 es múltiplo de 36 para todo n ≥ 1

Problema 1.8 .- Demostrar que la propiedad

n2 + 5n + 1 es par
es cierta para n + 1 si la suponemos cierta para n. ¿Para cuántos números naturales
es cierta la propiedad?

Problema 1.9 .- Demostrar que los términos de la sucesión de Fibonacci (F0 =


0, F1 = 1, Fn = Fn−1 + Fn−2 si n ≥ 2) están dados por la fórmula:
 √  n  √ n
1+ 5
2
− 1−2 5
Fn = √ .
5

Problema 1.10 .- Sea α y β dos números reales tales que la ecuación X 2 −αX −β
tiene dos raı́ces distintas, que denotaremos por r y s. Considérese la sucesión definida
por u0 = 0, u1 = 1 y un = αun−1 + βun−2 si n ≥ 2. Demostrar que
r n − sn
un = .
r−s

Problema 1.11 .- Comprobar que en un conjunto con una operación

a) el elemento identidad, si existe, es único, y

b) si la operación es asociativa y posee elemento unidad, el elemento inverso, si


existe, es único.
24 CAPÍTULO 1. PRELIMINARES

Problema 1.12 .- Probar que en un anillo

a) a · 0 = 0,

b) a(−b) = −(ab),

c) (−a)(−b) = ab.

Problema 1.13 .- Sea A un anillo. Supongamos que 1 = 0 en A. ¿Quién es A?

Problema 1.14 .- Sea A un anillo y sea A∗ el conjunto de las unidades de A, es


decir,

A∗ = {a ∈ A : existe a−1 }.
Probar que A∗ junto a la multiplicación es un grupo abeliano.

Problema 1.15 .- En un anillo A, un elemento x se dice nilpotente si xn = 0


para algún n. Probar que si x ∈ A es nilpotente, 1 + x es una unidad de A. (Pista:
recuérdese la primera fórmula probada en el Ejercicio 1.7.)

Problema 1.16 .- Un anillo se dice de Boole si x2 = x para todo x ∈ A. Probar


que, en ese caso, 2x = 0 para todo x ∈ A.

Problema 1.17 .- Sean A1 , A2 , . . . , An anillos. Definimos suma y producto en A1 ×


A2 × · · · × An componente a componente, es decir, (a1 , . . . , an ) + (b1 , . . . , bn ) =
(a1 + b1 , . . . , an + bn ) y (a1 , . . . , an ) · (b1 , . . . , bn ) = (a1 · b1 , . . . , an · bn ). Probar que,
con estas operaciones, A1 × A2 × · · · × An tiene estructura de anillo con elemento
unidad (1, . . . , 1). Si A1 , A2 , . . . , An son cuerpos, ¿A1 × A2 × . . . × An es cuerpo con
estas operaciones?

Problema 1.18 .- Si A y B son anillos, se dice que una aplicación f : A → B es


homomorfismo si respeta las operaciones, es decir,

1. f (a + b) = f (a) + f (b),

2. f (a · b) = f (a) · f (b) y

3. f (1) = 1.

Si, además, f es biyectiva se dice isomorfismo y se dice que los anillos A y B son
isomorfos. Probar que si f : A → B es homomorfismo, se verifica

f (0A ) = 0B

Si a es una unidad de A, f (a) es una unidad de B. De hecho, f (a)−1 = f (a−1 ).


Capı́tulo 2

Divisibilidad en Z

2.1. División euclı́dea en Z. Máximo común divi-


sor
Definición 2.1 Dados dos números enteros a y b, con b 6= 0, se dice que b divide
a a o que a es múltiplo de b o que b es divisor de a, si existe otro entero q tal que
a = bq. Se escribe

b|a

Naturalmente, todo número entero a distinto de 1 y −1 tiene, al menos, cuatro


divisores, a saber, ±1 y ±a. A estos divisores se les conoce con el nombre de divisores
(o factores) triviales de a. Otras propiedades, de todos conocidas, de la divisibilidad
se recogen en la siguiente Proposición:

Proposición 2.2 En las propiedades siguientes todos los números serán enteros y
|a| denotará el valor absoluto de a.

1) d|a ⇐⇒ −d|a ⇐⇒ d| − a,

2) d|a, a 6= 0 y d ≥ 0 =⇒ 1 ≤ d ≤ |a|,

3) d|1 =⇒ d = 1 o d = −1,

4) a|b y b|a =⇒ b = a o b = −a,

5) a|b y b|c =⇒ a|c,

6) a|b y a|c =⇒ a|b + c,

7) a|b y a|c =⇒ a|bc,

8) a|b y c ∈ Z =⇒ ac|bc,

25
26 CAPÍTULO 2. DIVISIBILIDAD EN Z

9) a|b y c|d =⇒ ac|bd,

10) ac|bc y c 6= 0 =⇒ a|b.

Nota. La prueba de estas propiedades requiere el uso de la Definición 2.1 y de los


axiomas que definen los números enteros. Como la prueba de dichas propiedades es
sencilla, la dejaremos como ejercicio.

De entre todos los números enteros, adquieren una singular importancia los cono-
cidos como números primos que, desde siempre, han fascinado a los matemáticos
y al resto de los mortales. Por poner un ejemplo, en la pelı́cula Contact dirigida
por Robert Zemeckis en 1997 y cuyo guión se basa en una novela de Carl Sagan, el
primer mensaje que recibe de los extraterrestres la Dra. Arroway, interpretada por
Jodie Foster, es una sucesión de números primos.

Definición 2.3 Un entero p > 1 se dice primo si sus únicos divisores positivos son
los triviales, es decir, 1 y p.

Los primeros primos son:

2, 3, 5, 7, 11, 13, 17, 19, 23, ...


Nótese que 1 no es primo.

Teorema 2.4 (Euclides, Libro IX de los Elementos, aprox. 300 a. C.) Todo
número entero mayor que 1 es producto de primos.

Demostración.– Inducción en la talla.

En particular, todo entero no nulo es producto de uno de los números ±1 y de


números primos. Veremos más adelante que esta expresión es, esencialmente, única.

Teorema 2.5 (Euclides, Libro IX de los Elementos) Existen infinitos números


primos.

La prueba de este resultado es sencilla y su interés radica en el hecho de que es


una de las primeras demostraciones conocidas en las que se utilizó la reducción al
absurdo.

Demostración.– Supongamos que hay un número finito, digamos n, de primos a los


que denotaremos por p1 , p2 , . . . , pn . Consideremos el número
2.1. DIVISIÓN EUCLÍDEA EN Z. MÁXIMO COMÚN DIVISOR 27

N = p1 p2 · · · pn + 1.
Por el teorema anterior, sabemos que N es producto de primos. Sea, pues, p un
factor primo de N . Este primo ha de ser uno de los p1 , p2 , . . . , pn , digamos p = pi .
Entonces, pi divide a N − p1 p2 · · · pn que es igual a 1, con lo que hemos llegado a
una contradicción.

Una de las primeras tareas matemáticas (y algorı́tmicas) que realizamos en nuestra


vida es la de aprender a dividir números naturales con resto. La forma en la que nos
enseñan a dividir, basada en la búsqueda de un natural que “quepa”(si no la mejor
desde un punto de vista de eficiencia) es, en cierto modo, la misma idea en la que
se basa la demostración del siguiente teorema.

Teorema 2.6 (División euclı́dea) Si a y b son dos enteros, b 6= 0, existe un único


par de enteros q y r tales que:

a = bq + r y 0 ≤ r < |b|.
A q y a r se les conoce, respectivamente, como cociente y resto de la división euclı́dea
de a por b.

Demostración.– Empecemos por demostrar la existencia de cociente y resto.


Supongamos, primero, que b > 0 y sea S = {x ∈ Z : bx ≤ a}. Este conjunto S es
no vacı́o (−|a| pertenece a S) y está acotado superiormente (por ejemplo, por |a|).
En consecuencia, tiene máximo. Llamaremos q a este máximo y r = a − bq. Por
construcción, se tiene que a = bq + r. Veamos que r verifica lo exigido. En efecto,

r ≥ 0 (por pertenecer q a S)
r < |b| = b. Si r ≥ b, se tendrı́a b(q +1) = bq +b ≤ bq +r = a y, en consecuencia
q + 1 pertenecerı́a a S contradiciendo el hecho de q es el máximo de S.

Si b < 0, aplicamos el caso anterior a −b.


Para probar la unicidad supongamos que q1 , r1 y q2 , r2 verifican las condiciones del
teorema, es decir,

a = bq1 + r1 con 0 ≤ r1 < |b| y

a = bq2 + r2 con 0 ≤ r2 < |b|


y que r1 ≤ r2 . Restando, se tiene b(q1 −q2 ) = r2 −r1 . Por lo tanto, |b| divide a r2 −r1 ,
pero también se tiene que 0 ≤ r2 − r1 < |b|. Esto sólo es posible si r2 − r1 = 0. Por
lo tanto, r2 = r1 y, en consecuencia q2 = q1 .
28 CAPÍTULO 2. DIVISIBILIDAD EN Z

Definición 2.7 (Máximo común divisor) Si d|a y d|b decimos que d es un divi-
sor común (o factor común) de a y b; por ejemplo, 1 es un divisor común a cualquier
par de enteros a y b. Si a y b no son los dos nulos, el Teorema 2.6 prueba que ninguno
de sus divisores comunes puede ser mayor que max(|a|, |b|), por lo que podemos ase-
gurar que de entre todos sus divisores comunes debe existir uno que sea el mayor de
ellos. Este es el máximo común divisor de a y b que denotaremos por mcd(a, b);
siendo el único entero d que satisface

d|a y d|b (por ser d un divisor común),

Si c|a y c|b, c|d (pues d es el mayor de los divisores comunes de a y b).

Sin embargo, el caso a = b = 0 debe ser excluido; cualquier entero divide a 0


y es, por tanto, un divisor común de a y b, por lo que, en este caso, no existe
un máximo común divisor. Esta definición puede obviamente extenderse al máximo
común divisor de cualquier conjunto finito de enteros (no todos nulos).

Nota. Dos números enteros a y b se dicen coprimos o primos entre sı́ si no poseen
factores comunes no triviales, esto es, si mcd(a, b) = 1.
Al igual que hicimos con la divisibilidad, recogemos en la siguiente Proposición
algunas propiedades básicas del máximo común divisor.

Proposición 2.8 En las propiedades siguientes todos los números son enteros y |a|
denotará el valor absoluto de a.

1) mcd(a, b) = mcd(b, a),

2) mcd(a, b, c) = mcd(mcd(a, b), c) = mcd(a, mcd(b, c)),

3) mcd(a, 0) = mcd(a, a) = |a|,

4) mcd(a, b) = mcd(−a, b) = mcd(|a|, |b|),

5) mcd(ca, cb) = |c|mcd(a, b),

6) mcd(a, b) = mcd(a, b + ac),


 
a a
7) mcd , = 1,
mcd(a, b) mcd(a, b)

Una de las primeras aplicaciones del máximo común divisor que suele realizarse en la
escuela es la reducción del tamaño de numerador y denominador en la aritmética con
números racionales. Obviamente, esto requerirá, sobre todo si se piensa en números
2.2. ALGORITMO DE EUCLIDES. TEOREMA DE LAMÉ 29

de gran tamaño, de un algoritmo eficiente1 para su cálculo. Afortunadamente (no


siempre es el caso para otros problemas) se dispone de un método que, sorprenden-
temente, se hallaba ya en los Elementos de Euclides. Según D. Knuth, the oldest
nontrivial algorithm that has survived to the present day.

2.2. Algoritmo de Euclides. Teorema de Lamé


Trataremos, en esta Sección, de construir un algoritmo eficiente para el cálculo del
máximo común divisor y estudiar algunas de sus propiedades. Naturalmente, la
propia definición de máximo común divisor proporciona un algoritmo para calcular
mcd(a, b): construir la lista de divisores de a y b y tomar el mayor de los comunes.
Sin embargo, para grandes números, este algoritmo es, ciertamente, inaplicable.
El algoritmo de Euclides que estudiaremos para el cálculo del máximo común divisor
se basa en la sencilla observación siguiente:

d|a y d|b ⇐⇒ d|b y d|r,


siendo r el resto de la división de a por b. Esto quiere decir que los divisores comunes
de a y b son los divisores comunes de a y r, por lo que mcd(a, b) = mcd(b, r).
El algoritmo de Euclides explota la idea anterior para simplificar el cálculo del
máximo común divisor reduciendo el tamaño de los enteros sin alterar su máximo
común divisor. Eliminando casos triviales, podemos suponer que a > b > 0. Sean
r0 = a, r1 = b. Dividiendo, se tendrá que r0 = q1 r1 + r2 con 0 ≤ r2 < r1 = b.
Si r2 = 0, entonces b|a, por lo que mcd(a, b) = b y hemos terminado. Si r2 6= 0,
dividimos r1 entre r2 y escribimos r2 = q2 r2 + r3 con 0 ≤ r3 < r2 y repetimos
el proceso. Dado que la sucesión de restos es decreciente (r1 > r2 > r3 > ...), en
algún momento habremos de encontrar un resto rn+1 igual a 0. Los dos últimos
pasos podemos escribirlos de la forma rn−2 = qn−1 rn−1 + rn con 0 < rn < rn−1 , y
rn−1 = qn rn + rn+1 con rn+1 = 0.

Teorema 2.9 En el proceso anterior, rn es el máximo común divisor de a y b.


Además, el máximo común divisor es único.

1
En el contexto informático, eficiente quiere decir que, una vez convenientemente programado,
pueda ser ejecutado por un ordenador en un tiempo y utilización de recursos de memoria razonables.
No nos entretendremos en discutir qué quiere decir razonable, que serı́a objeto de la asignatura
Complejidad Computacional u otras.
30 CAPÍTULO 2. DIVISIBILIDAD EN Z

Tras las consideraciones anteriores, podemos escribir el algoritmo de Euclides como


sigue, donde rem(a, b) representa el resto de dividir a entre b:

Entrada : a, b ∈ Z
mientras b 6= 0, hacer
t ←− |a|
a ←− |b|
b ←− rem(t, a)
salida : a

Pseudo–código del algoritmo de Euclides.

Naturalmente, el algoritmo anterior puede extenderse al cálculo del máximo común


divisor de más de dos enteros. Supongamos dados t enteros positivos a1 , . . . , at y sea
R0 = (a1 , . . . , at ). Supongamos que i es el ı́ndice de la coordenada más pequeña de
R0 . En este caso es fácil ver que mcd(a1 , . . . , at ) es igual a

mcd(rem(a1 , ai ), . . . , rem(ai−1 , ai ), ai , rem(ai+1 , ai ), . . . , rem(at , ai ))

Esta idea conduce al siguiente algoritmo.

entrada : (a1 , a2 , . . . , at ) ∈ Zt
Inicializar A := (|a1 |, |a2 |, . . . , |at |)
mientras A contenga, al menos, dos coordenadas no nulas hacer
Calcular el ı́ndice i del menor entero no nulo de A
A ←− (rem(a1 , ai ), . . . , rem(ai−1 , ai ), ai , rem(ai+1 , ai ), . . . , rem(at , ai ))
salida : ai

Pseudo–código del algoritmo de Euclides para t enteros.

Ejemplo 2.10 Calcular el mcd de 120, 146 y 180. En este caso, se tiene:

mcd(120, 146, 180) = mcd(120, 26, 60) = mcd(16, 26, 8) = mcd(0, 2, 8) =


= mcd(0, 2, 0) = 2.
2.2. ALGORITMO DE EUCLIDES. TEOREMA DE LAMÉ 31

2.2.1. Teorema de Lamé


Examinamos el algoritmo de Euclides sobre una entrada (a, b) tomando nota de
cocientes y de restos. Si r0 = a y r1 = b, se tiene:

r 0 = q1 r 1 + r 2
r 1 = q2 r 2 + r 3
..
. (2.1)
rn−2 = qn−1 rn−1 + rn
rn−1 = qn rn
Hemos probado con anterioridad que rn = mcd(a, b). Notemos, por otro lado, que
el último cociente, qn es mayor o igual que 2 (salvo que n = 1).
Denotemos por E(a, b) el número de divisiones que realiza el algoritmo de Euclides
si el input es (a, b). El objetivo es probar una buena cota superior para E(a, b).
Sea Fn el n–ésimo número de Fibonacci que, recordemos, está definido por F0 = 0,
F1 = 1 y Fn = Fn−1 + Fn−2 si n ≥ 2.
Lema 2.11 Sean a y b enteros tales que a > b > 0 y supongamos que E(a, b) = n.
Entonces, a ≥ Fn+2 y b ≥ Fn+1

Demostración.– Utilizaremos la notación de 2.1 y probaremos que r0 ≥ Fn+2 y


r1 ≥ Fn+1 por inducción en n.
El enunciado es cierto para n = 1. En este caso, el algoritmo de Euclides consta
de una única división, r0 = q0 r1 y puesto que r0 > r1 , los menores enteros que lo
verifican son r1 = 1 = F2 y r0 = 2 = F3 .
Supongamos ahora que el enunciado es cierto para i < n; queremos probarlo para n.
El primer paso del algoritmo de Euclides es r0 = q1 r1 + r2 y sabemos que E(r1 , r2 ) =
n − 1. Por lo tanto, r1 ≥ Fn+1 y r2 ≥ Fn . Por lo tanto, r0 ≥ r1 + r2 ≥ Fn+2 .
A partir del Lema anterior y utilizando que
αn − β n
Fn = √ ,
5
√ √
1+ 5 1− 5
donde α = 2
yβ= 2
, se tiene
Corolario 2.12 Si a√> b > 0, E(a, b) < c1 log(u) + c2 − 2 + c3 u−1 , donde c1 =
1
log α
= 2,08, c2 = log
log α
5 1
= 1,67 y c3 = √5 log α
= 0,93. (log logaritmo natural). Si
se escribe la cota anterior en términos de la talla binaria de a (es decir, log2 a) se
obtiene, redondeando, que

E(a, b) ≤ 1,90 log2 a − 0,33


32 CAPÍTULO 2. DIVISIBILIDAD EN Z

Demostración.– Supongamos que E(a, b) = n. Por el lema 2.11, sabemos que, en ese
caso, a ≥ Fn+2 . Entonces,

αn+2 − β n+2 αn+2 − 1


a≥ √ > √ .
5 5

En consecuencia, (n + 2) log α ≤ log(1 + a 5). Ahora, usando el hecho de que
log(x + 1) = log x + log 1 + x1 y la estimación log 1 + x1 < x1 para obtener
√ 1
(n + 2) log α < log(a 5) + √ ,
a 5
se obtiene el resultado.

Observación 2.13 Queda algo alejado del curso hacer consideraciones sobre la efi-
ciencia de los algoritmos introducidos. Sin embargo, deje el lector que se le ofrezca
un resultado que demuestra bien a las claras las posibilidades del Algoritmo de Eu-
clides. A partir del resultado anterior se puede probar que el número de operaciones
binarias necesarias para calcular el mcd usando Euclides es

k · (log2 a)(log2 b)
Olvidándonos de la constante k, si los enteros a y b tienen talla binaria 10000 (aprox-
imadamente 3000 dı́gitos en base 10), habrá que realizar, más o menos, cien millones
de operaciones binarias. Dado que, por ejemplo, los primeros procesadores Pentium
realizaban entre 100 y 112 millones de operaciones binarias por segundo, un orde-
nador equipado con uno de dichos procesadores, nos darı́a la respuesta en algo menos
de un segundo.
Por otro lado, si usamos la factorización en producto de primos para calcular el
máximo común divisor, la situación no es, ni mucho menos, tan boyante. En la
práctica, el mejor de los algoritmos de factorización conocidos (que utiliza técnicas
matemáticas ciertamente sofisticadas) no puede factorizar, ni aún usando el Super-
Computer de IBM, enteros de varios cientos de dı́gitos (aunque nadie ha probado
aún que nunca pueda encontrarse un algoritmo eficiente). Esta dificultad de la fac-
torización es una de las ideas claves por la que el sistema criptográfico RSA que
estudiaremos más adelante se haya convertido en el sistema criptográfico de uso
común.
Por último, señalemos que la falta de una prueba que demuestre que no es posible
encontrar un algoritmo eficiente para la factorización está estrechamente ligada a
uno de los problemas centrales de la Informática como es la Conjetura de Cook2 .
2
En la página http://www.claymath.org/prizeproblems/pvsnp.htm del Clay Mathematics
Institute existe información (sencilla descripción del problema, artı́culo más profundo sobre el
asunto e incluso un vı́deo de una charla divulgativa) sobre esta conjetura. De hecho, el Instituto
Clay ofrece un millón de dólares a quien sea capaz de resolver esta conjetura.
2.3. IDENTIDAD DE BÉZOUT. ALGORITMO EXTENDIDO DE EUCLIDES33

2.3. Identidad de Bézout. Algoritmo extendido de


Euclides
Definición 2.14 Dados enteros a y b y su máximo común divisor d = mcd(a, b),
se denomina identidad de Bézout a una expresión de la forma

ax + by = d x, y ∈ Z.

El objetivo fundamental de esta sección, junto a la prueba del Teorema Fundamental


de la Aritmética, es el demostrar que siempre existen tales enteros x e y y encontrar
un algoritmo para su cálculo. Pero antes, veamos un ejemplo. Aplicando el algoritmo
de Euclides a a = 180 y b = 146, se tiene la siguiente sucesión de identidades:

180 = 1 ∗ 146 + 34 (2.2)


146 = 4 ∗ 34 + 10 (2.3)
34 = 3 ∗ 10 + 4 (2.4)
10 = 2∗4+2 (2.5)
4 = 2∗2 (2.6)

Supongamos que queremos encontrar una identidad de Bézout, es decir, encontrar


enteros x e y tales que

180 ∗ x + 146 ∗ y = 2
Para ello, podemos volver hacia atrás en las identidades anteriores, es decir, de (2.5)
se tiene

2 = 10 − 2 ∗ 4.
Ahora, de (2.4) podemos despejar 4 y llegar a

2 = 7 ∗ 10 − 2 ∗ 34.
De nuevo, usando (2.3) llegamos a

2 = 7 ∗ 146 − 30 ∗ 34.
Finalmente, usando (2.2) se tiene

2 = −30 ∗ 180 + 37 ∗ 146.


Esta forma de proceder implicarı́a que para resolver una identidad de Bézout,
habrı́amos de aplicar el algoritmo de Euclides (tomando nota de restos y cocientes)
34 CAPÍTULO 2. DIVISIBILIDAD EN Z

y después volver hacia atrás utilizando dichos restos y cocientes. Sin embargo, pode-
mos organizar los cálculos de manera que esto no sea necesario. Para ello, usaremos
los cocientes para construir xk e yk tales que:

axk + byk = rk (0 ≤ k ≤ n).


De este modo, si k = n, tendrı́amos resuelto nuestro problema.
Para k = 0, basta tomar x0 = 1 e y0 = 0 y si k = 1, x1 = 0 e y1 = 1. Ahora
supongamos que hemos encontrado xk e yk para todo ı́ndice 0 ≤ k ≤ s y queremos
calcular xs+1 e ys+1 . Se tendrı́a:

rs+1 = rs−1 − rs qs = axs−1 + bys−1 − qs (axs + bys ) = a(xs−1 − qs xs ) + b(ys−1 − qs ys )

Lo que hemos visto es que las sucesiones de enteros definidas por:

x0 = 1, x1 = 0, xk+1 = xk−1 − qk xk

y0 = 0, y1 = 1, yk+1 = yk−1 − qk yk
verifican

axk + byk = rk (0 ≤ k ≤ n).


De paso, esta construcción demuestra que:

Teorema 2.15 Para todo par de enteros a y b no los dos nulos, existen enteros x
e y tales que se verifica la identidad de Bézout:

ax + by = mcd(a, b)

Ejercicio. Probar que a y b son coprimos si, y sólo si, existen enteros x e y tales que
ax + by = 1.

Interpretación matricial del Algoritmo extendido de Euclides


Llamemos, al igual que antes, r0 = a y r1 = b. Asimismo, consideremos las matrices
 
  r0 r1
x0 x1
R0 = = I S0 =  x 0 x 1 
y0 y1
y0 y1
Obsérvese que det(R0 ) = 1. El primer paso en el algoritmo de Euclides extendido
consiste en dividir r0 por r1 , r0 = r1 q1 + r2 , sustituir el par (r0 , r1 ) por (r1 , r2 ) y
2.3. IDENTIDAD DE BÉZOUT. ALGORITMO EXTENDIDO DE EUCLIDES35

calcular x2 = x0 − x1 q1 e y2 = y0 − y1 q1 . En consecuencia, podemos pensar que si


llamamos Q1 a la matriz
 
0 1
Q1 = ,
1 −q1
se tiene
 
  r1 r2
x1 x2
R1 = = R0 Q1 y S1 =  x1 x2  = S0 Q1
y1 y2
y1 y2
Además, es fácil ver que este producto por Q1 consiste, en realidad, en restar a la
primera columna de S0 la segunda multiplicada por q1 e intercambiar las columnas
de S0 . Por otro lado, se tiene que det(R1 ) = −1, es decir, x1 y2 − x2 y1 = −1 lo que
implica que mcd(x2 , y2 ) = 1. Este proceso se continúa obteniendo matrices
 
xk xk+1
Rk = = Rk−1 Qk = R0 Q1 · · · Qk
yk yk+1
y
 
rk rk+1
Sk =  x k xk+1  = Sk−1 Qk = S0 Q1 · · · Qk
yk yk+1
que verifican

det(Rk ) = (−1)k , axk + byk = rk , axk+1 + bxk+1 = rk+1 ,


lo que, en particular, implica que mcd(xk , yk ) = 1. El algoritmo sigue hasta que en
el lugar (1, 2) de una de las matrices Sk aparezca un cero. De este modo, si en el
algoritmo extendido de Euclides se realizan n divisiones, se tendrá
 
  rn 0
xn xn+1
Rn = = Rn−1 Qn y S1 =  xn xn+1  = Sn−1 Qn ,
yn yn+1
yn yn+1
con lo que se tiene:

axn + byn = mcd(a, b), axn+1 + byn+1 = 0, mcd(xn , yn ) = mcd(xn+1 , yn+1 ) = 1.

La última de las igualdades se obtiene de det(Rn ) = (−1)n . En particular se tendrá,


si b 6= 0, que la fracción xyn+1
n+1
es reducida e igual a − ab . Dicho de otra manera,

|b| |a|
|xn+1 | = e |yn+1 | =
mcd(a, b) mcd(a, b)
36 CAPÍTULO 2. DIVISIBILIDAD EN Z

De hecho, la construcción anterior no sólo proporciona una prueba del Teorema sino
que nos da un algoritmo para su cálculo.3 En la forma en la que aparece descrito a
continuación, coc(A, B) denota el cociente de la división euclı́dea de A por B.

Input : a, b ∈ Z
Inicializar :
 
a b
S :=  1 0 
0 1
while s12 6= 0, do
 
0 1
Q←
1 −coc(s11 , s12 )
S ←S·Q
endwhile
Output : s11 , x = s21 , y = s31

Algoritmo Extendido de Euclides.

Obsérvese que como subproducto del algoritmo anterior, se obtienen xn+1 e yn+1
cuya utilidad se verá en la resolución de ecuaciones diofánticas lineales

A partir del Teorema 2.15, podemos demostrar la anunciada unicidad de la factori-


zación de un número entero, pero antes un resultado previo.

Teorema 2.16 Si a|bc y mcd(a, b) = 1, entonces a|c. En particular, si p es primo


y p|ab, entonces p|a o p|b.

Demostración.– Gracias a la identidad de Bézout sabemos que existen enteros x e


y tales que ax + by = 1. Multiplicando por c se tiene c = cax + cby, con lo que a
divide a los dos sumandos a la derecha y, por lo tanto, a c.

A partir del Teorema anterior y pagando un bajo precio, en forma de sencillo argu-
mento inductivo, se puede probar que

Si p es primo y p|a1 · · · ak , entonces p divide a algún ai


Todas estas disquisiciones realizadas sobre la relación entre números primos y di-
visibilidad nos ponen en condiciones de probar la unicidad, ya anunciada, de la
expresión de un número entero como producto de ±1 y números primos.
3
En clase de problemas veremos cómo extender este algoritmo para más de dos enteros.
2.4. ECUACIONES DIOFÁNTICAS LINEALES 37

Teorema 2.17 (Teorema fundamental de la aritmética) Todo entero positi-


vo
puede expresarse como producto de potencias no triviales de números primos

n = pα1 1 pα2 2 · · · pαk k


y, salvo, reordenación de los factores, esta factorización es única.

Demostración del Teorema Fundamental de la Aritmética.– La existencia de la fac-


torización se sigue del Teorema 2.4 y, por lo tanto, sólo queda probar la unicidad.
Sea S el conjunto de enteros positivos que admiten dos factorizaciones distintas y,
supongamos, por reducción al absurdo, que este conjunto es no vacı́o. Por la buena
ordenación de N, sabemos que, en ese caso, el conjunto S admite mı́nimo, digamos
n. Se tendrán dos factorizaciones distintas de n:

n = pα1 1 pα2 2 · · · pαk k y

n = q1β1 q2β2 · · · qsβs .


Es claro que p1 divide a q1β1 q2β2 · · · qsβs y, por lo tanto, a alguno de los qiβi . Aún más, se
tendrá que p1 divide a alguno de los qi lo que implica que es igual a alguno de los qi .
Reordenando los qi , podemos suponer que p1 = q1 . En consecuencia, se tendrá que
n
= pα1 1 −1 pα2 2 · · · pαk k = q1β1 −1 q2β2 · · · qsβs .
p1
Puesto que las factorizaciones de n consideradas eran distintas, tenemos dos facto-
rizaciones distintas del entero positivo pn1 < n, lo que contradice el hecho de que n
sea el mı́nimo de S.

2.4. Ecuaciones diofánticas lineales


Se llaman ecuaciones diofánticas a aquéllas de las que nos interesan las soluciones
enteras. Un caso interesante es de las ecuaciones diofánticas lineales en dos variables

aX + bY = c a, b, c ∈ Z (2.7)

Puesto que el caso a = b = 0 no tiene ningún interés, supondremos que (a, b) 6= (0, 0).
Utilizando el Algoritmo de Euclides extendido, sabemos encontrar una solución si
c = mcd(a, b). Del mismo modo, es obvio encontrar una solución si mcd(a, b) divide a
c. Dicho de otra manera, la ecuación diofántica tiene solución si c divide a mcd(a, b).
38 CAPÍTULO 2. DIVISIBILIDAD EN Z

¿Y si mcd(a, b) no divide a c? En este caso, no puede haber solución: si existiesen


enteros x e y tales que

ax + by = c,
se tendrı́a que todo factor común de a y de b también lo serı́a de c. En particular,
el máximo común divisor de a y de b dividirı́a a c.
Recopilando, hemos demostrado que la ecuación diofántica 2.7 tiene solución si,
y sólo si, c divide a mcd(a, b). De hecho, sabemos cómo encontrar una solución:
aplicamos el algoritmo extendido de Euclides a a y b obteniendo x0 e y0 tales que
c c
ax0 + by0 = mcd(a, b). Es claro que ( mcd(a,b) x0 , mcd(a,b) y0 ) es solución de 2.7. Sin
embargo, hasta ahora no nos hemos preocupado por saber si hay más de una solución
y, en el caso de que haya más de una, saber cuáles son todas las soluciones. Para
analizar este problema, estudiemos la ecuación diofántica

aX + bY = 0 (2.8)

por cuanto si (x1 , y1 ) es solución cualquiera de la ecuación diofántica 2.7 y (x0 , y0 )


solución de 2.8, es fácil ver que (x1 + x0 , y1 + y0 ) es solución de 2.7. Una solución
obvia ( y la más “pequeña”) a la ecuación diofántica 2.8 es
 
b a
,− ,
mcd(a, b) mcd(a, b)
pero también lo son todas las de la forma
 
b a
t , −t , con t ∈ Z.
mcd(a, b) mcd(a, b)
Ası́ pues, si (x1 , y1 ) es solución cualquiera de 2.7 el conjunto
 
b a
{ x1 + t, y1 − t : t ∈ Z},
mcd(a, b) mcd(a, b)
es un conjunto de infinitas soluciones de 2.7. ¿Hay más? Para verlo, sea (x, y) una
solución de 2.7. Por lo tanto,

ax1 + by1 = c y

ax + by = c.
Restando, se tiene a(x − x1 ) + b(y − y1 ) = 0 y, dividiendo por mcd(a, b),

a b
(x − x1 ) + (y − y1 ) = 0. (2.9)
mcd(a, b) mcd(a, b)
2.5. MÍNIMO COMÚN MÚLTIPLO 39

Ahora, supongamos que b 6= 0 (si b = 0 y a 6= 0, harı́amos el mismo argumento que


sigue con a). Como
 
a b
mcd , =1
mcd(a, b) mcd(a, b)
b a b
y mcd(a,b)
divide a (x − x1 ) mcd(a,b) , se tiene que mcd(a,b)
divide a (x − x1 ), es decir,

b
x − x1 = t , para algún t ∈ Z.
mcd(a, b)
Sustituyendo en 2.9, se obtiene que

b
y − y1 = −t .
mcd(a, b)

Los argumentos anteriores prueban que el siguiente resultado es cierto.

Proposición 2.18 Dados enteros a, b, c la ecuación diofántica

aX + bY = c
tiene solución si, y sólo si, mcd(a, b) divide a c. En caso de que tenga solución tiene
infinitas, dadas por
 
b a
{ x1 + t, y1 − t : t ∈ Z},
mcd(a, b) mcd(a, b)
donde (x1 , y1 ) es una solución particular cualquiera.

De hecho, hemos encontrado un algoritmo para resolver ecuaciones diofánticas de


la forma 2.7, ya que basta encontrar una solución particular cualquiera y, para ello
podemos utilizar el algoritmo extendido de Euclides.

2.5. Mı́nimo común múltiplo


Definición 2.19 Si a y b son dos enteros, un múltiplo común de a y b es un entero
c tal que a|c y b|c. Si a y b son ambos no nulos, existen múltiplos comunes positivos
(por ejemplo |ab|), por lo que la buena ordenación de N nos asegura la existen-
cia de un mı́nimo común múltiplo, es decir, el menor múltiplo común positivo.
Normalmente, se escribe mcm(a, b).

De hecho, se tiene que el mı́nimo común múltiplo de a y b es el único entero positivo


m que verifica:

1) a|m y b|m (por ser múltiplo común)


40 CAPÍTULO 2. DIVISIBILIDAD EN Z

2) Si c es un entero que verifica a|c y b|c, entonces, m|c (por ser el menor de los
múltiplos comunes).

El mı́nimo común múltiplo está estrechamente ligado al máximo común divisor. Esta
ligazón viene dada por el siguiente resultado.

Teorema 2.20 Sean a y b dos enteros. Se tiene

|ab| = mcd(a, b) · mcm(a, b).

Demostración.– Se trata de probar que el entero positivo

|ab|
m=
mcd(a, b)

es el mı́nimo común múltiplo de a y b, es decir, que verifica las dos propiedades


anteriores.
En primer lugar, es claro que a|m por cuanto mcd(a, b) divide a b y, por lo tanto,
podemos escribir

|b|
m = |a| · .
mcd(a, b)
De igual forma puede verse que b|m.
Por otro lado, supongamos que c es un entero que es múltiplo común de a y b, es
decir,

c = au para algún entero u y c = bv para algún entero v.


Se tiene, entonces que
a b
u= v
mcd(a, b) mcd(a, b)
a b a
y, como mcd(a,b)
y mcd(a,b)
son primos entre sı́, que mcd(a,b)
divide a v, es decir,
a
v=k para algún entero k.
mcd(a, b)
Finalmente, se tendrá
ab
c = bv = k para algún entero k.
mcd(a, b)
2.6. PROBLEMAS PROPUESTOS 41

2.6. Problemas propuestos


Problema 2.1 .- (Expresión de números natural en bases distintas de la decimal)
Demostrar que, dado un natural q > 0, todo número natural n puede expresarse de
manera única en la forma

ak q k + ak−1 q k−1 + · · · + a1 q + a0 ,
con 0 ≤ ak < q, donde k el único natural para el que se verifica q k ≤ n < q k+1 .

Problema 2.2 .- Sea

ak ak−1 . . . a1 a0 , ai ∈ {0, 1}
la expresión en base 2 (binaria) de un cierto número natural. Expresar, en base 2,
cociente y resto de la división por 2 de dicho número.

Problema 2.3 .- Si (A, +, ·) es un anillo conmutativo con elemento unidad, un


subconjunto I se llama ideal si

a + b ∈ I para todo a, b ∈ I

x ∈ A y a ∈ I =⇒ xa ∈ I.

(1) Probar que si a1 , . . . , an son elementos cualesquiera del anillo A, el conjunto

(a1 , . . . , an ) = {a1 x1 + a2 x2 + . . . + an xn : xi ∈ A}

es un ideal de A. Todo ideal que se puede expresar de esta forma, se dice


finitamente generado. Si n = 1, se denomina principal.

(2) Probar que en Z todo ideal es principal. Un anillo sin divisores de cero y que
verifica esta propiedad se dice dominio de ideales principales.

(3) Sean ahora, (a) y (b) dos ideales de Z. ¿Quién es el menor ideal que contiene
a ambos? ¿Quién es la intersección de (a) y (b)?

Problema 2.4 .- Dados a y b enteros no nulos, los podemos escribir en la forma


n
Y n
Y
a = ± pαi i , a = ± pβi i , αi , βi ≥ 0.
i=1 i=1

donde los pi son todos los primos que dividen a ab. Comprobar que
n n
min{αi ,βi } max{αi ,βi }
Y Y
mcd(a, b) = pi y mcm(a, b) = pi
i=1 i=1
42 CAPÍTULO 2. DIVISIBILIDAD EN Z

Problema 2.5 .- Para cada uno de los pares de enteros siguientes, calcular el
máximo común divisor utilizando el algoritmo de Euclides:

(i) 34, 21; (ii) 136, 51; (iii) 481, 325; (iv) 8711, 3206; (v) 1134, 1221;

En cada uno de los casos, resuelve la correspondiente identidad de Bézout.

Problema 2.6 .- El algoritmo de Euclides puede hacerse ligeramente más rápido


si permitimos restos negativos en la forma que sigue

ri−1 = ri qi + ri+1 con − |ri /2| < ri+1 ≤ |ri /2|.


Por ejemplo, si aplicamos este método para calcular el máximo común divisor de 59
y 49, se tiene

mcd(59, 49) = mcd(49, 10) = mcd(10, −1) = mcd(−1, 0) = 1.


Utilizar este algoritmo, conocido como del mı́nimo resto, para calcular los máximos
comunes divisores del ejercicio anterior y resolver las correspondientes identidades
de Bézout.

Problema 2.7 .- Demostrar las siguientes propiedades del máximo común divisor.

a b
1. Si a y b son pares, mcd(a, b) = 2mcd ,
2 2
a 
2. Si a es par y b es impar, mcd(a, b) = mcd , b
2
 
|a − b|
3. Si a y b son impares, mcd(a, b) = mcd ,b
2

A partir de las propiedades anteriores, construir un algoritmo para calcular el máxi-


mo común divisor de dos enteros realizando únicamente divisiones por 2. (Nota:
Este algoritmo se conoce como algoritmo binario para el cálculo del mcd y es debido
a J. Stein que publicó su resultado en 1967).

Problema 2.8 .- Considérese la siguiente variante del algoritmo binario para el


cómputo de mcd(a, b). Asumamos que a y b no son los dos pares.

1) Si a es par, sustituimos (a, b) por (a/2, b).

2) Si b es par, sustituimos (a, b) por (a, b/2).


a+b a−b

3) Si a y b son impares, sustituimos (a, b) por 2
, 2 .
2.6. PROBLEMAS PROPUESTOS 43

El algoritmo consiste en repetir los pasos (1)-(3) en ese orden. Si a o b es cero,


paramos y devolvemos como mcd(a, b) el otro número en valor absoluto. Por ejemplo,
para calcular mcd(15, 6) utilizando este algoritmo, se tendrı́a:

(15, 6) → (15, 3) → (9, 6) → (9, 3) → (6, 3) → (3, 3) → (3, 0)

Demostrar que este algoritmo siempre acaba y que la respuesta es correcta. (Indi-
cación: Para probar que el algoritmo termina, considera la aplicación f (a, b) = a2 +b2
y comprueba que cada vez que se da un paso en el algoritmo su valor decrece).

Problema 2.9 .- Probar las siguientes propiedades de la sucesión de Fibonacci:

Dos términos consecutivos de la sucesión son coprimos, es decir,

mcd(Fn−1 , Fn ) = 1 para n ≥ 1

El mayor natural menor que Fn+2 /Fn+1 (escrito bFn+2 /Fn+1 c) es 1.


El resto de la división de Fn+1 por Fn es Fn−1 .

Problema 2.10 .- Descomponer de todas las formas posibles el número racional


100/273 en suma de dos fracciones positivas con denominadores 21 y 13.

Problema 2.11 .- (Algoritmo extendido de Euclides para t enteros) Basándose en


la interpretación matricial del algoritmo extendido de Euclides, diseñar un algoritmo
para calcular, dados enteros a1 , . . . , at , una identidad de Bézout del tipo

a1 x1 + a2 x2 + · · · + at xt = mcd(a1 , . . . , at ).
Aplicar dicho algoritmo a la resolución de ecuaciones diofánticas de la forma

a1 X1 + a2 X2 + · · · + an Xn = b.

Problema 2.12 .- Para cada una de las ecuaciones diofánticas siguientes, estudiar
si tienen solución y, en su caso, calcular todas las soluciones:

25X + 36Y = 10 ; 40X + 50Y = 3 ;

200X − 1768Y = 8 ; 213X + 1123Y = 18 ;

30X + 1107Y + 3030303Z = 25 ; 10X + 11Y + 20Z = 10 ;

3X + 7Y + 12Z + 21T = 22 ; 2200X + 1221Y − 2332Z + 101101T = 12.


44 CAPÍTULO 2. DIVISIBILIDAD EN Z

Problema 2.13 .- Resolver el sistema de ecuaciones diofánticas lineales:


11X + 3Y + 5Z = 20
n
3X + 7Y + 10Z = 10

Problema 2.14 .- Supongamos que el máximo común divisor de a y b es un primo


p. ¿Cuáles son los posibles valores del máximo común divisor de a2 y b? ¿Y del
máximo común divisor de a3 y b? Si m.c.d(a, b) = p, ¿cuánto vale m.c.d(a3 , b3 )?

Problema 2.15 .- Una empresa alemana está replanteándose sus planes de ac-
tividad. Tiene una fábrica en España con un millar de empleados españoles y un
centenar de ejecutivos alemanes y está estudiando una reestructuración de plantilla.
Obviamente sin informar a los sindicatos; aunque estos sospechan que va a haber
algún despido. Un representante sindical encuentra en una fotocopiadora un docu-
mento del estudio de reestructuración de plantilla (olvidado por error, obviamente)
en que se puede leer
El 80.9 por ciento de los que van a ser despedidos está casado.
El 43.5 por ciento de los que van a ser despedidos está pagando hipoteca.
Deducir qué piensan hacer los alemanes con la empresa.

Problema 2.16 .- Un turista estadounidense va a pasar unos dı́as de vacaciones


en Parı́s, Madrid y Cracovia y desea cambiar 810 dólares en euros y en zlotys.
Sabiendo que el euro se cotiza a 0,90 dólares y un zloty a 0,24, ¿de cuántas formas
posibles puede hacer el cambio si necesita para su estancia en Cracovia, al menos,
3000 zlotys?

Problema 2.17 .- Sean dados dos números naturales no nulos a y b. ¿Es posible es-
1
cribir el número racional m.c.m. (a,b)
como suma de dos racionales de denominadores
a y b? En caso de respuesta afirmativa, esbozar un algoritmo para el cálculo de
dichos racionales.

Problema 2.18 .- Una cierta empresa fabrica tres productos A, B y C que vende a
590, 410 y 300 euros respectivamente. Calcular cuántas unidades de cada producto
se vendieron en un dı́a determinado sabiendo que:

La recaudación por la venta de los productos fue de 32420 euros.


Se vendieron más unidades de A que de B.
El número de unidades de C vendidas fue mayor que 83.

Problema 2.19 .- Resolver el siguiente problema: Si un gallo cuesta siete mon-


edas, una gallina cinco monedas y tres pollos una moneda, ¿de cuántas formas
distintas pueden comprarse un total de trescientas aves (gallos, gallinas y pollos) si
disponemos de quinientas monedas? Escribir cada una de estas formas posibles.
2.6. PROBLEMAS PROPUESTOS 45

Problema 2.20 .- Una compañı́a aérea ofrece tres tipos de billetes en sus vuelos
de Madrid a Parı́s. Los billetes de clase preferente cuestan 150 euros, los de clase
turista con derecho a comida 110 y el resto 67. Si, en un vuelo concreto un total
de 100 pasajeros pagaron un total de 10766 euros, ¿cuántos billetes de cada tipo se
vendieron?

Problema 2.21 .- Probar que para cada número natural n, existen siempre n
números compuestos consecutivos.

Problema 2.22 .- Si mn es un cuadrado perfecto y mcd(m, n) = 1, demostrar que


m y n son también cuadrados perfectos.

Problema 2.23 .- (Números de Fermat)

i) Demostrar que si 2m + 1 es primo, m es una potencia de 2, es decir, m = 2n


para algún natural n.
n
Nota. Los números de la forma 22 + 1 se llaman números de Fermat y si
son primos, se les dice primos de Fermat. Pierre de Fermat (1601-1665) con-
n
jeturó que todos los números de la forma 22 + 1 eran primos, pues pudo
comprobar que eso era cierto para n = 0, 1, 2, 3, 4. Sin embargo, en 1732 Leon-
hard Euler (1707-1783) demostró que 641 era factor de 232 + 1 = 4294967297.
A fecha de hoy, los únicos primos de Fermat conocidos son los que se corre-
sponden con n = 0, 1, 2, 3, 4, aunque no se sabe si hay más.

ii) Demostrar que dos números de Fermat distintos son siempre primos entre sı́.

Problema 2.24 .- Un primo de Mersenne es un número primo de la forma 2n − 1.


Demostrar que si 2n − 1 es primo, n ha de ser primo.
Nota. En 1644, Mersenne conjeturó que 2p − 1 era primo para p = 2, 3, 5, 7, 13,
17, 19, 31, 67, 127, 257 y para ningún otro primo menor que 257. En la lista de
Mersenne, habı́a errores por cuanto los números correspondientes a 67 y 257 no son
primos y le faltaban los correspondientes a 61 y 89. A fecha de hoy, sólo se conocen
38 primos de Fermat, el mayor de los cuales es 26972593 −1, número éste que tiene más
de 2 millones de dı́gitos decimales. Una lista de los primos de Mersenne conocidos
puede verse en http://www.utm.edu/research/primes/mersenne.shtml#known.
P
Problema 2.25 .- Dado un entero positivo n, sea σ(n) = d la suma de todos
d|n
sus divisores positivos. Por ejemplo, σ(27) = 1 + 3 + 9 + 27 = 40. Demostrar que si
mcd(m, n) = 1, σ(nm) = σ(n)σ(m) y encontrar una fórmula para calcular σ(n) a
partir de la descomposición de n en factores primos.
46 CAPÍTULO 2. DIVISIBILIDAD EN Z

Problema 2.26 .- Un número perfecto es un entero positivo que es igual a la


suma de sus divisores distintos de él mismo (p.e., 6 es perfecto pues 6 = 1 + 2 +
3). Demostrar que los números perfectos pares son exactamente los de la forma
2k−1 (2k − 1), con 2k − 1 un primo de Mersenne. (Indicación: Para ver que un número
perfecto par tiene esa forma, escrı́belo primero en la forma 2k−1 n0 con n0 impar,
demostrar que n0 es divisible por 2k − 1 y comprueba que n0 tiene que ser primo
estudiando σ(n0 )).
Nota: No se sabe si existen números perfectos impares. Por otro lado, los primeros
números perfectos son: 6 = 21 (22 − 1), 28 = 22 (23 − 1), 496 = 24 · (25 − 1), 8128 =
26 · (27 − 1), 33550336 = 212 (213 − 1),...

Problema 2.27 .- Sean a y b números positivos coprimos. Demostrar que para


todo entero positivo n > ab, existen números enteros positivos x e y tales que

n = ax + by
A partir de lo anterior, deducir que todo número entero > 11 puede escribirse como
suma de dos números compuestos.
Capı́tulo 3

Congruencias

3.1. Aritmética modular. Teorema chino de los


restos
3.1.1. Aritmética modular
Empezamos recordando la relación de equivalencia

a ≡ b (mod n) ⇐⇒ a − b es múltiplo de n,
siendo n, un número entero positivo.
Es fácil ver que esta relación de equivalencia puede reescribirse en la forma

a ≡ b (mod n) ⇐⇒ el resto de la división euclı́dea de a y de b por n es el mismo.


De esta forma, es claro que se tienen n clases de equivalencia en el conjunto cociente
que suele escribirse en la forma Z/nZ o Zn , cada una de ellas correspondiente a uno
de los posibles restos, es decir, 0, 1,. . ., n − 1. Es, de hecho, habitual identificar las
clases de equivalencia con los citados números.
En el conjunto Zn se pueden definir dos operaciones, suma y producto, de la manera
siguiente:
Si a y b son dos clases de equivalencia, se define a + b = a + b.
Si a y b son dos clases de equivalencia, se define a · b = a · b.

Tal y como hemos definido suma y producto, parece que dependen del representante
elegido en cada clase. Sin embargo, esto no es cierto:
Proposición 3.1 Las operaciones suma y producto en Zn están bien definidas y
dotan a Zn de estructura de anillo conmutativo con elemento identidad.

47
48 CAPÍTULO 3. CONGRUENCIAS

Observación 3.2 Una aplicación sencilla de las congruencias es la obtención de


criterios de divisibilidad. Ası́, por ejemplo, podemos obtener un criterio para saber
si un entero n es divisible por 11, sin realizar la división.
Sea x = xn xn−1 . . . x2 x1 x0 un número natural escrito en base diez, es decir,

x = xn · 10n + xn−1 · 10n−1 + · · · + x1 · 10 + x0 y 0 ≤ xj ≤ 9, ∀ j ∈ {0, . . . , n}

Como 10 ≡ −1 (mod 11), se tendrá que xi · 10i ≡ (−1)i xi (mod 11) y, por lo tanto,
n
X
x≡ (−1)i xi (mod 11).
i=0
n
(−1)i xi ≡ 0 (mod 11), es
P
En consecuencia, x es divisible por 11 si, y sólo si,
i=0
decir, si la suma de los dı́gitos que ocupan un lugar par menos la suma de los que
ocupan un lugar impar es múltiplo de 11.

3.1.2. Teorema chino de los restos


Usando el algoritmo extendido de Euclides es fácil resolver congruencias del tipo

ax ≡ b (mod n),

ya que dicha congruencia tiene solución si, y sólo si, la ecuación diofántica

ax + ny = b
tiene solución. De hecho, se tiene:

Proposición 3.3 La congruencia ax ≡ b (mod n) tiene solución si, y sólo si,


d = mcd(a, n) divide a b. Además, si existe solución, ésta es única módulo n/d.

Demostración.– Lo único que debemos probar es que la solución es única módulo nd .


Esto se deduce del hecho de que las soluciones de la ecuación diofántica ax + ny = b
son de la forma:
n
x = x0 + d
t
a ,
y = y0 − d
t
con t cualquier número entero y (x0 , y0 ) una solución cualquiera de ax + ny = b.

¿Qué ocurre si no tengo una única congruencia, sino varias? La respuesta a esta
pregunta viene dada por el conocido como Teorema Chino de los Restos y su poste-
rior extensión. El nombre del Teorema deriva del texto Suan–ching ( “Aritmética”)
3.1. ARITMÉTICA MODULAR. TEOREMA CHINO DE LOS RESTOS 49

escrito por el matemático chino Sun–Tsu. Dentro de ese texto aparece la resolución
del ejercicio siguiente:
¿Cuál es el número entero positivo más pequeño tal que el resto de dividirlo por 11
es 2, el resto de dividirlo por 5 es 3 y el resto de dividirlo por 7 es 2?
El problema, trasladado al lenguaje de congruencias, es el de encontrar el menor
entero positivo a tal que:

a ≡ 2 (mod 11), a ≡ 3 (mod 5), a ≡ 2 (mod 7).

Resolvamos el problema de Sun–Tsu. Si a ≡ 2 (mod 11), entonces a tiene la forma

a = 2 + 11t1 para algún entero t1 .


Si exigimos que a ≡ 3 (mod 5), tendremos que 2 + 11t1 ≡ 3 (mod 5), es decir,
t1 ≡ 1 (mod 5). Dicho de otra manera, t1 = 1 + 5t2 para algún entero t2 , por lo que
a tiene la forma

a = 13 + 55t2 para algún entero t2 .


Finalmente, a debe verificar a ≡ 2 (mod 7), es decir, 13 + 55t2 ≡ 2 (mod 7). Por
lo tanto, 6t2 ≡ 3 (mod 7) y, resolviendo esta congruencia, se tiene que t2 = 4 + 7t3
para algún entero t3 . En definitiva, a debe tener la forma

a = 233 + 385t3 para algún entero t3 .


El menor de los enteros que verifican las congruencias es 233, que es la respuesta al
ejercicio planteado por Sun–Tsu.
Para un caso general, se tiene:

Teorema 3.4 (Teorema chino de los restos) Sean m1 , . . . , mn números enteros


positivos coprimos dos a dos, es decir, mcd(mi , mj ) = 1 si i 6= j, y sean b1 , . . . , bn
enteros cualesquiera. Entonces, el sistema de congruencias

x ≡ b1 (mod m1 ), . . . , x ≡ bn (mod mn )
posee una única solución entera entre 0 y m1 · · · mn − 1, es decir, una única solución
entera módulo m1 · · · mn .

Demostración.– Supongamos que somos capaces de encontrar enteros Ek (uno para


cada k entre 1 y n) tales que:


0 (mod mj ), si j 6= k
Ek ≡ (3.1)
1 (mod mk ).
50 CAPÍTULO 3. CONGRUENCIAS

n
X
Si existen tales Ek , x = Ek bk es solución de nuestro problema.
k=1

Para encontrar los Ek , sean M = m1 · · · mn y Mk = mMk para k = 1, . . . , n. Puesto


que los mi son coprimos dos a dos, se tiene que mcd(mk , Mk ) = 1 y, por lo tanto,
que existen enteros tk y sk tales que

sk Mk + tk mk = 1, k = 1, . . . , n
Es fácil ver que los enteros Ek = sk Mk verifican 3.1. Claramente, Ek es múltiplo de
mj si j 6= k y, por construcción, congruente con 1 módulo mk .
Para concluir la demostración, queda ver que la solución es única módulo M . Su-
pongamos dos soluciones x e y. Se tiene, entonces, que

x − y ≡ 0 (mod mi ) ∀ i ∈ {1, 2, . . . , n},

es decir, x − y es múltiplo de todos los mi y, en consecuencia, del mı́nimo común


múltiplo de m1 , m2 , . . . , mn que, al ser coprimos dos a dos es, justamente, M . Por
lo tanto, x ≡ y (mod M ).

Observación 3.5 Aplicación del Teorema Chino a la aritmética modular.


Una de las aplicaciones más importantes del Teorema Chino de los Restos es la de
reducir cálculos módulo M a cálculos módulo mk (mantenemos la misma notación
que en la demostración del Teorema). Puede argüirse, con razón, que la ganancia
puede ser pı́rrica por cuanto el cómputo de los correspondientes Ek involucra la mul-
tiplicación de números casi del mismo tamaño que M . Pero una vez que calculados
los Ek se puede disponer de ellos de una vez para siempre y si han de hacerse muchos
cálculos módulo M , la ganancia puede ser sustancial.

Ejercicio: Manteniendo la notación de la demostración del Teorema Chino de los


restos, probar que Ej Ek ≡ 0 (mod M ) si j 6= k y Ek2 ≡ 1 (mod M ). Probar que,
para todo entero a, si a ≡ ak (mod mk ), se tiene
m
X
a≡ Ek ak (mod M ).
k=1

Ahora, llamemos a los coeficientes ak coordenadas de a. Probar que si b tiene coorde-


nadas bk , entonces ak ±bk y ak bk son las coordenadas de a±b y de ab, respectivamente.

Observación 3.6 Veamos como podemos interpretar el Teorema Chino de los restos
y el ejercicio anterior. En primer lugar, el Teorema Chino de los Restos establece
una biyección entre ZM y Zm1 × · · · × Zmn . Por otro lado, consideremos la aplicación
ψ dada por:
3.1. ARITMÉTICA MODULAR. TEOREMA CHINO DE LOS RESTOS 51

ψ : ZM → Zm1 × · · · × Zmn , ψ(a) → (a1 , . . . , an ),


donde los ak son las coordenadas de a como se han definido en el Ejercicio. El
teorema Chino de los Restos me dice cómo construir ψ −1 .
Por otro lado, recordemos que podemos dotar a Zm1 ×· · ·×Zmn de estructura de anillo
(conmutativo y con elemento identidad) definiendo suma y producto componente a
componente. Lo que nos dice el ejercicio es que ψ(a + b) = ψ(a) + ψ(b) y ψ(a · b) =
ψ(a) · ψ(b), es decir, que ψ es un homomorfismo de anillos y, al ser biyectivo, es un
isomorfo de anillos.

En el Teorema Chino de los Restos, se supone que los módulos son siempre cop-
rimos dos a dos. En esas condiciones, el correspondiente sistema de congruencias
tiene solución y sabemos encontrarla. ¿Qué se puede decir si los módulos no son
necesariamente coprimos dos a dos? La respuesta está en el siguiente Teorema.

Teorema 3.7 El sistema de congruencias

x ≡ b1 (mod m1 ), . . . , x ≡ bn (mod mn )
tiene solución si, y sólo si, bi ≡ bj (mod mcd(mi , mj )) para todo i 6= j. Si existe
solución, es única módulo mcm(m1 , m2 , . . . , mn ).

Demostración.– Supongamos, en primer lugar, que existe solución del sistema de


congruencias. Si x es una solución, x ≡ bi (mod mi ) y x ≡ bj (mod mj ). En
consecuencia, x ≡ bi (mod mcd(mi , mj )) y x ≡ bj (mod mcd(mi , mj )), de donde se
deduce que bj ≡ bi (mod mcd(mi , mj )).
La unicidad módulo mcm(m1 , m2 , . . . , mn ) se sigue por idénticos argumentos al caso
del Teorema Chino de los Restos.
Para completar la prueba, habrá que mostrar que existe una solución si se verifica la
condición del Teorema. Para ello, generalizaremos el argumento dado para resolver
el problema de Sun-Tsu que, recordemos, se basa en la reducción de un par de
congruencias a una sola1 . Supongamos, pues, que debemos resolver

x ≡ b1 (mod m1 )
x ≡ b2 (mod m2 ).
Entonces, x = b1 + tm1 para algún t ∈ Z. Por lo tanto, b1 + tm1 ≡ b2 (mod m2 )
y, en consecuencia, tm1 ≡ b2 − b1 (mod m2 ). Ahora, puesto que, por hipótesis,
d = mcd(m1 , m2 ) divide a b2 − b1 , la congruencia
1
Esta construcción es debida a C.F. Gauss
52 CAPÍTULO 3. CONGRUENCIAS

m1 b2 − b1
t ≡ (mod m2 /d)
d d
tiene una única solución t ≡ a (mod m2 /d). Esto es, t = a + t1 md2 para algún t1 ∈ Z.
Sustituyendo esta expresión en a = b1 + tm1 se tiene
m1 m2
x = b1 + am1 + t1 .
d
De hecho, x ≡ b1 + am1 (mod mcm(m1 , m2 )). Repitiendo esta construcción n − 1
veces, se obtiene una solución del sistema de congruencias

Ejemplo 3.8 Resolver el sistema de congruencias



 x ≡ 2 (mod 27)
x ≡ 11 (mod 18)
x ≡ 3 (mod 4)

La primera congruencia implica que

x = 2 + 27t1

para algún entero t1 . Sustituyendo la citada expresión en la segunda congruencia,


se tendrá que 2 + 27t1 ≡ 11 (mod 18), es decir, 27t1 ≡ 9 (mod 18). Dividiendo por
9 = mcd(27, 18), se tiene 3t1 ≡ 1 (mod 2), por lo que t1 tiene que ser congruente a
1 módulo 2, es decir, t1 = 1 + 2t2 . En consecuencia,

x = 29 + 54t2 para algún t2


Ahora, si sustituimos en la tercera congruencia, se tiene que 54t2 ≡ −26 (mod 4).
De nuevo, puesto que 2 = mcd(54, 4), se tiene que t2 debe verificar la congruencia
27t2 ≡ −13 (mod 2), es decir, t2 ≡ 1 (mod 2) o, lo que es lo mismo, t2 = 1 + 2t3 . En
consecuencia,

{x = 83 + 108t3 : t3 ∈ Z}
es el conjunto de soluciones del sistema de congruencias.

Observación 3.9 A partir del enunciado del Teorema anterior y de su prueba,


llamando M = mcm(m1 , . . . , mn ), se puede demostrar que es posible decidir si un
sistema de congruencias del tipo analizado en el Teorema tiene solución en tiempo
O((log2 M )2 ). Si tiene solución, se puede encontrar la única solución módulo M en
tiempo O((log2 M )2 ).
3.1. ARITMÉTICA MODULAR. TEOREMA CHINO DE LOS RESTOS 53

3.1.3. El grupo multiplicativo Z∗m


En su momento, se probó que el conjunto de unidades de un anillo forma un grupo
multiplicativo (véase Problema 1.14). En el caso que nos ocupa, puesto que Zm es
un anillo conmutativo con elemento unidad, sabemos que Z∗m es un grupo abeliano.
La primera pregunta es, pues, cuáles son los elementos de Z∗m . La respuesta a esta
pregunta no es demasiado complicada:
Dado a ∈ Zm posee inverso si, y sólo si, existe x tal que ax ≡ 1(mod m), es decir,
si, y sólo si, ax + my = 1 para algún entero y. Dicho de otro modo, a es inversible
en Zm , si, y sólo si, la ecuación diofántica

ax + my = 1 (3.2)

tiene solución. Pero eso, es equivalente a mcd(a, m) = 1. En consecuencia, se tiene:

Proposición 3.10 Un elemento a ∈ Zm es unidad si, y sólo si, mcd(a, m) = 1, es


decir, Z∗m = {ā ∈ Zm : mcd(a, m) = 1}

Por otro lado, es claro, en virtud de lo anterior, que:

Teorema 3.11 El anillo Zm es cuerpo si, y sólo si, m es primo.

Por otro lado, como grupo multiplicativo Z∗p (con p primo) tiene una forma muy
particular. Tomemos, por ejemplo, p = 7. En Z7 , se tiene que

31 = 3, 32 = 2, 33 = 6, 34 = 4, 35 = 5 y 36 = 1,
es decir, todos los elementos de Z∗7 pueden expresarse como potencias de 3. La
pregunta natural, ahora, es : ¿esta propiedad se verifica para cualquier primo? Dicho
de otra manera: dado p primo, ¿existe a ∈ Zp tal que Z∗p = {a, a2 , a3 , . . . , ap−1 }?
La respuesta a la pregunta es afirmativa, pero la demostración requiere un cierto
trabajo previo. En particular, debemos introducir alguna terminologı́a y asumir
como ciertos (ya los probaremos en su momento) tanto el Teorema de Euler-Fermat,
como el Pequeño Teorema de Fermat (véanse los Teoremas 3.24 y 3.26). Asimismo,
los lemas que siguen (lemas 3.13 a 3.19 ) pueden considerarse como una preparación
para el resultado.
Respecto al Teorema de Euler-Fermat, por el momento sólo nos interesa el hecho de
que si a es una unidad en Zm , existe siempre un natural n tal que an ≡ 1 (mod m).
Es este hecho el que garantiza que la siguiente definición es correcta.

Definición 3.12 Si a es un elemento de Z∗m , se llama orden de a en Z∗m , y se escribe


ordm (a), al menor entero positivo d que verifica ad ≡ 1 (mod m).
54 CAPÍTULO 3. CONGRUENCIAS

Por ejemplo, ord(3) = 6 en Z∗7 . Obsérvese que además, por otro lado, ordp (a) ≤ p−1
asumiendo la veracidad del Pequeño Teorema de Fermat (Teorema 3.26).

Lema 3.13 Si an ≡ 1 (mod m), entonces ordm (a) divide a n.

Demostración.– Sea n con an ≡ 1 (mod m) y llamemos d a ordm (a). Es claro que, por
definición de orden, n ≥ d. Consideremos la división euclı́dea de n por d: n = qd + r
con q ≥ 1 y 0 ≤ r < d. En Zm se verifica:
q
1 = an = aqd+r = aqd · ar = ad · ar = ar ,
de donde se concluye, por definición de orden, que r = 0.

Lema 3.14 Sea a un entero con mcd(a, m) = 1. Si ae ≡ af ≡ 1 (mod m), entonces


ad ≡ 1 (mod m), donde d = mcd(e, f ).

Demostración.– Si d = mcd(e, f ), existen enteros x e y tales que d = ex + f y. En


tal caso, se tiene que
y
ad ≡ aex+f y ≡ aex · af y ≡ (ae )x · af ≡ 1 (mod m)

Lema 3.15 Sea f (x) = xd + ad−1 xd−1 + · · · + a1 x + a0 un polinomio con coeficientes


enteros. Entonces, la ecuación f (x) ≡ 0 (mod p) tiene, a lo sumo, d soluciones en
Zp .

Demostración.– Procederemos por inducción en el grado del polinomio d. Para d = 1


la afirmación es obvia. Si d > 1 y haciendo uso de la identidad

X n − Y n = (X − Y )(X n−1 + X n−2 Y + · · · + XY n−2 + Y n−1 )


válida para cualesquiera números enteros (de hecho, para cualesquiera números
reales), se puede ver que existe un polinomio g(x) de grado d − 1 y coeficiente
director (coeficiente de la máxima potencia de x) 1 que verifica:

f (x) = (x − a)g(x) + f (a) para todo x ∈ Z.


Si f (a) ≡ 0 (mod p), se tiene que f (x) ≡ (x − a)g(x) (mod p) para todo entero
x. Puesto que p es primo, f (x) es cero módulo p si, y sólo si, x − a o g(x) son
cero módulo p. En consecuencia, como, por hipótesis de inducción, la congruencia
g(x) ≡ 0 (mod p) tiene, a lo más, d − 1 soluciones módulo p, la congruencia f (x) ≡
0 (mod p) tendrá, a lo sumo, d soluciones módulo p.
3.1. ARITMÉTICA MODULAR. TEOREMA CHINO DE LOS RESTOS 55

Observación 3.16 Es importante señalar que el Lema anterior no es cierto, en


general, si eliminamos la condición de primalidad. Por ejemplo, x2 ≡ 1 (mod 8)
tiene cuatro soluciones módulo 8; a saber, 1, 3, 5 y 7.
Lema 3.17 La congruencia X p−1 ≡ 1 (mod p) tiene, exactamente, p−1 soluciones
en Zp .

Demostración.– Por el Pequeño Teorema de Fermat (Teorema 3.26), sabemos que


1, 2, 3, . . . , p − 1 son soluciones de la ecuación. Además, el Lema anterior garantiza
que no hay más.

Lema 3.18 Si d|(p − 1), la congruencia xd ≡ 1 (mod p) tiene, exactamente, d


soluciones en Zp .

Demostración.– Por el Lema 3.15 sabemos que la congruencia tiene, a lo más, d


soluciones. Sea k el cociente resultante de dividir p − 1 entre d, es decir, p − 1 = d · k,
y consideremos la identidad

xk − 1 = (x − 1)(xk−1 + · · · + x + 1).
Sustituyendo en dicha identidad x por xd , se tiene:

xp−1 − 1 = (xd − 1)(xp−d−1 + · · · + xd + 1).


Por lo tanto, si la congruencia xd ≡ 1 (mod p) no tuviese exactamente d soluciones
la congruencia xp−1 ≡ 1 (mod p) no podrı́a tener exactamente p − 1 soluciones,
contradiciendo el Lema 3.18.

Lema 3.19 Sean a y b enteros con ordp (a) = m y ordp (b) = n en Z∗p . Si m y n son
coprimos, el orden de ab en Z∗p es igual a mn.

Demostración.– Llamemos d a ordp (ab). En primer lugar, es claro que (ab)mn ≡


1 (mod p), por lo que, en virtud del Lema 3.13, d divide a mn. Supongamos, ahora,
que d 6= mn. En tal caso, existirá un primo p1 que verifica (ab)mn/p1 ≡ 1 (mod p).
Puesto que mcd(n, m) = 1, p1 dividirá a m o a n, pero no a los dos al mismo tiempo.
Supongamos que p1 |m (si p1 |n el argumento serı́a análogo) y que p1 no divide a n.
Se tendrá:

1 ≡ (ab)mn/p1 ≡ amn/p1 (bn )m/p ≡ amn/p1 (mod p).


Ahora, teniendo en cuenta que mcd(mn/p1 , m) = m/p1 aplicamos el Lema 3.14 y
deducimos que am/p1 ≡ 1 (mod p), lo que contradice que m sea el orden de a en Zp .
En consecuencia, d = mn.
56 CAPÍTULO 3. CONGRUENCIAS

Teorema 3.20 Si p es primo, existe a ∈ Z∗p tal que

Z∗p = {a, a2 , a3 , · · · , ap−1 }.


En términos de teorı́a de grupos, se dice que Z∗p es un grupo cı́clico y que a es un
generador de Z∗p .

n
pei i la factorización en primos de p − 1. Por el Lema 3.17,
Q
Demostración.– Sea
i=1
e
pi i
la congruencia x ≡ 1 tiene exactamente pei i soluciones módulo p, mientras que la
ei −1
congruencia xpi ≡ 1 tiene pei i −1 soluciones módulo p. Por lo tanto, existe gi que
ei ei −1
p p
verifica gi i = 1, pero gi i 6= 1 en Zp . Es claro que el orden de gi en Zp es igual a
n
ei Q
pi . Si g = gi , el Lema 3.19 garantiza que el orden de g en Zp es p − 1.
i=1

Sabemos que para p primo, el grupo Z∗p es cı́clico. Cabe preguntarse si existen otros
enteros positivos m para los que Z∗m sea cı́clico. La respuesta está contenida en el
siguiente Teorema debido a C.F. Gauss que apareciera publicado por primera vez
en el libro Disquisitiones Arithmeticae del propio Gauss publicado en 1801.

Teorema 3.21 El grupo Z∗m es cı́clico si y, sólo si, m = 2, 4, pk , 2pk con p > 2
primo.

Función de Euler
Definición 3.22 Para un número entero positivo m, sea ϕ(m) el número de enteros
entre 0 y m que son primos con m. La función ϕ recibe el nombre de Función de
Euler. Por lo tanto,

ϕ(m) = #(Z∗m ).

Ası́ por ejemplo, ϕ(7) = 6, ϕ(51) = 32 o ϕ(48) = 16.


¿Qué valores toma la función de Euler y cómo podemos calcularla? En primer lugar,
el caso más sencillo: si p es primo, es obvio que ϕ(p) = p − 1 por cuanto todos los
enteros positivos menores que p son coprimos con p. Es algo más complicado, aunque
no deje de ser sencillo, calcular ϕ(q) con q = pα . Los enteros positivos no coprimos
con pα son p, 2p, 3p, . . . , pα . En consecuencia, tenemos pα−1 numeros enteros positivos
menores que q no coprimos con él y, por lo tanto,
 
α−1 1
ϕ(q) = q − p =q 1− si q = pα (p primo)
p
3.2. TEOREMA DE EULER-FERMAT 57

Naturalmente, no todo número natural es primario (primario ≡ potencia de primo),


aunque sı́ es producto de primarios. De esta manera, si suponemos que la función ϕ
verifica

ϕ(m1 · m2 ) = ϕ(m1 ) · ϕ(m2 ), si mcd(m1 , m2 ) = 1 y que

n
Y
m= pαk k ,
k=1

podrı́amos calcular ϕ(n) de manera sencilla, pues


n n   n  
Y Y 1 Y 1
ϕ(m) = ϕ (pαk k ) = pαk k 1− =m 1− .
k=1 k=1
pk k=1
pk
Para demostrar que la fórmula anterior es correcta bastará ver que:

Teorema 3.23 La función ϕ verifica

ϕ(m1 · m2 ) = ϕ(m1 ) · ϕ(m2 ), si mcd(m1 , m2 ) = 1

Demostración.– Retomando la notación introducida en la Subsección 3.1.2 (más


concretamente en la Observación 3.6) y la definición de ϕ bastará probar que

a ∈ Z∗m1 m2 ⇐⇒ ψ(a) ∈ Z∗m1 × Z∗m2


o, lo que es lo mismo, que

mcd(a, m1 m2 ) = 1 ⇐⇒ mcd(a, m1 ) = 1 y mcd(a, m2 ) = 1


y, esta última afirmación es cierta al ser m1 y m2 coprimos.

3.2. Teorema de Euler-Fermat


Teorema 3.24 (Euler-Fermat) Si a y n son coprimos,

aϕ(n) ≡ 1 (mod n).

Demostración.– Sean k = ϕ(n) y m1 , m2 , . . . , mk los enteros positivos menores que


n y primos con n. Consideremos ahora los números

am1 , am2 , . . . , amk .


58 CAPÍTULO 3. CONGRUENCIAS

Se tiene que todos ellos son coprimos con n y, además, son todos distintos módulo
n. En efecto, si ami ≡ amj (mod n), n dividirı́a a a(mi − mj ) y eso implicarı́a,
puesto que mcd(a, n) = 1, que mi ≡ mj (mod n). En consecuencia,

{m1 , . . . , mk } = {am1 , . . . , amk }.

De esta última observación se deduce que

ak m1 · · · mk ≡ m1 · · · mk (mod n)

y, como, los mi son inversibles en Zn , que ak ≡ 1 (mod n).

Observación 3.25 El Teorema anterior es útil, entre otras cosas, si tratamos con
grandes potencias de números enteros. Supongamos, por ejemplo que queremos cal-
cular el resto de la división euclı́dea de 21010 por 23. Como 23 es primo, sabemos
que 222 ≡ 1 (mod 23), y como 1010 = 45 · 22 + 20, se tiene:

21010 ≡ (222 )45 220 ≡ 220 ≡ (25 )4 ≡ (92 )2 ≡ 122 ≡ 6 (mod 23).

Corolario 3.26 (Pequeño Teorema de Fermat) Si p es primo,

ap ≡ a (mod p)

Observación 3.27 El Teorema 3.26 es consecuencia inmediata del Teorema de


Euler-Fermat, sin más que tener en cuenta que ϕ(p) = p − 1 y que si a ≡ 0 (mod p)
es obvio que ap ≡ a (mod p).

Corolario 3.28 (Teorema de Wilson)

p es primo ⇐⇒ (p − 1)! ≡ −1 (mod p)

Demostración.– Como la ecuación xp−1 −1 ≡ 0 (mod p) tiene como únicas soluciones


1, 2, . . . , p − 1, se tiene

xp−1 − 1 ≡ (x − 1)(x − 2) · · · (x − p + 1) (mod p).

Poniendo x = 0, se sigue el resultado.


3.3. UN TEST DE PRIMALIDAD EFICIENTE 59

3.3. Un test de primalidad eficiente


Uno de los problemas fundamentales cuando se trata de enteros, es el de decidir
si un número dado es primo o no. Desde un punto de vista meramente teórico, el
Teorema de Wilson (Teorema 3.28) resuelve el problema de decidir la primalidad
de un entero positivo dado n: bastarı́a calcular el factorial (n − 1)! y estudiar si
es, o no, congruente con −1 módulo n. Sin embargo, en la práctica, el cálculo del
factorial es un problema complicado desde el punto de vista computacional. Dicho de
forma sencilla, incluso para números no demasiado grandes, el cálculo del factorial
requerirı́a demasiado tiempo de ejecución y demasiado espacio de memoria.2
El objetivo de esta Sección será el de dar un test de primalidad eficiente, si bien de
tipo probabilı́stico: el test de Miller-Rabin. De todas formas, no lo justificaremos y
nos limitaremos a describirlo.3
El algoritmo de Miller-Rabin se basa, entre otras cosas, en la facilidad para el cálculo
de potencias. De demostrar esta última afirmación nos ocupamos en la siguiente
Subsección.

3.3.1. Algoritmo binario para el cálculo de potencias


Supongamos que necesitamos calcular la potencia trigésimo séptima de un entero a.
La manera más ingenua de hacerlo es calcular las potencias sucesivas,

a, a2 , a3 , . . . , a36 , a37 ,

lo que implica realizar 36 productos.


Sin embargo,

a37 = a · a36 = a · (a2 )18 = a · (a4 )9 = a · a4 · (a4 )8 = a · a4 · a32 .


¿Cuántas productos necesito si actúo de esta manera? En primer lugar, 5 productos
para calcular a4 y a32 haciendo (cada flecha significa elevar al cuadrado):

a → a2 → a4 → a8 → a16 → a32 .
Con otros dos productos más, calculo a37 . En total, 7 productos frente a los 36 por
el método ingenuo.
2
Siendo más precisos, lo único que podemos afirmar es que, a fecha de hoy, nadie sabe calcular
de forma eficiente el factorial, aunque tampoco nadie haya sido capaz de probar que no sea posible.
Obsérvese, por otro lado, la analogı́a entre esta situación y la ya comentada para la factorización
de enteros.
3
El fundamento de este test de primalidad, ası́ como su complejidad computacional, puede
consultarse en el libro Algorithmic Number Theory. Volume I: Efficient Algorithms de Eric Bach
y Jeffrey Shallit (MIT Press, 1996).
60 CAPÍTULO 3. CONGRUENCIAS

En realidad, ¿qué hemos hecho? Simplemente, calcular la representación binaria del


exponente, en este caso, 37 = 1 + 22 + 25 (37 = (100101)2 ). Este razonamiento
es fácilmente extensible a cualquier otro exponente: si quiero calcular aα y α =
2k + αk−1 2k−1 + · · · + α2 22 + α1 2 + α0 , se tendrá que:
2 k−1 k
aα = aα0 · aα1 2 · aα2 2 · · · aαk−1 2 · a2 .
¿Cuántas multiplicaciones necesito realizar? En primer lugar, k multiplicaciones para
k
calcular a2 , a4 , . . . , a2 y, después, tantas como unos tenga la expresión binaria del
exponente menos una. En el caso peor (todos los αi iguales a uno), 2k o dicho de
otra manera, 2(blog2 αc).
El siguiente algoritmo recoge cómo calcular una potencia de un entero, utilizando
el esquema anterior que, recordemos, consiste en calcular la expresión binaria del
exponente.

Entrada: a, α
t ←− 1
f ←− a
mientras α 6= 0, hacer
si (α = 1 módulo 2)
entonces t ← tf
α ← bα/2c
f ← f2
Salida: t

Por otro lado, lo anterior es aplicable siempre que se tenga un producto: para calcular
potencias de matrices, polinomios, enteros módulo m,... Consideremos, por ejemplo,
el cómputo de los números de Fibonacci. Si se usa el hecho de que Fk+1 = Fk + Fk−1 ,
se necesitarán realizar k adiciones para obtener Fk+1 . Sin embargo, utilizando que
 k  
1 1 Fk+1 Fk
= , (3.3)
1 0 Fk Fk−1
se necesitarán únicamente 2 log2 k productos de matrices 2 × 2. La forma usual de
multiplicar matrices 2 × 2 exige 8 productos y 4 sumas, luego en total 12 opera-
ciones aritméticas. En consecuencia, para calcular Fk+1 , Fk y Fk−1 de una tacada se
necesitarán, únicamente, 24 · blog2 kc operaciones aritméticas. En realidad, no son
necesarias tantas operaciones como se demuestra en el Problema 3.25.

3.3.2. Test de Miller-Rabin


Visto el algoritmo binario, volvamos al objetivo principal de la Sección, es decir,
la determinación de la primalidad, o no, de un número natural dado. Una primera
3.3. UN TEST DE PRIMALIDAD EFICIENTE 61

idea, ya barajada y desechada en estas notas, es el uso del Teorema de Wilson. Otra
posible idea serı́a el uso del Pequeño Teorema de Fermat (Teorema 3.26): Si existe
un entero a tal que an 6≡ a (mod) n, el entero n será compuesto. Lamentablemente,
el recı́proco del Teorema de Fermat es falso, es decir, existen números compuestos
que verifican que an ≡ a para todo a < n. A estos, se les denomina números de
Carmichael, de los que el más pequeño es 561.
Existen diversos métodos para saber si un número dado es primo o no, de los que
el más eficiente es el método de Adleman-Huang. Sin embargo, el fundamento de la
mayorı́a de ellos excede con mucho el alcance del curso. Proponemos uno de ellos
que, sin ser el mejor, sı́ que ofrece como ventaja la facilidad de implementación:
el algoritmo de Miller-Rabin. Es un método de tipo probabilı́stico, basado en el
Teorema de Fermat y que evita los números de Carmichael con gran probabilidad
de acierto. En estas notas, nos limitaremos a describirlo:

Input: n un número entero impar.


(1) Escoger, aleatoriamente, a en {1, . . . , n − 1}.
(2) Expresar n − 1 = 2s · d, con d impar y s ≥ 1.
(3) Calcular sucesivamente
a0 ≡ ad (mod n), a1 ≡ a20 (mod n), . . . , ak ≡ a2k−1 (mod n)
hasta que (k = s o ak ≡ 1 (mod n).)
(4) Si (k = s) y ak 6≡ 1 devolver compuesto
si no, si (k = 0) entonces devolver primo
si no, si (ak−1 6≡ −1) devolver compuesto
si no, devolver primo
Test de Miller–Rabin.

Ya hemos anunciado que este algoritmo es de tipo probabilı́stico, es decir, para


algunos casos existe una cierta probabilidad de responder de manera errónea. ¿Para
qué casos? ¿Con qué probabilidad? La respuesta a estas preguntas se encuentra en
el resultado que sigue:
Teorema 3.29 (Caracterı́sticas del test de Miller-Rabin) El test de Miller-
Rabin verifica las siguientes propiedades :
1. Si n ∈ N es un número primo impar, el algoritmo siempre produce primo.
2. Si n ∈ N es un número compuesto, el algoritmo produce compuesto para, al
menos, 3/4 de los a.
De esta forma, la probabilidad de error del algoritmo de Miller-Rabin está aco-
tada superiormente por 1/4. Por otro lado, el algoritmo utiliza un número de
operaciones binarias proporcional a (log2 n)3 .
62 CAPÍTULO 3. CONGRUENCIAS

3.4. Sistema criptográfico de clave pública RSA


El objetivo que nos planteamos en esta Sección es el de la descripción de un sistema
criptográfico conocido como RSA.4 . La idea de este sistema, como la de cualquier
otro sistema criptográfico, es la de transmitir mensajes por canales “inseguros”(esto
es, accesibles a individuos distintos del emisor y del receptor) sin que estos puedan
ser comprendidos más que por el emisor y el receptor del mensaje. Lógicamente,
esto exige un proceso de codificación del mensaje y una posterior decodificación del
mismo.
Para explicar el funcionamiento del sistema RSA, asumimos que todos los mensajes
que enviamos son números. De esta forma, cada individuo de una red de clave pública
selecciona los siguientes elementos :

1. Dos números primos grandes p y q.

2. Halla n = pq, ϕ(n) := (p − 1)(q − 1).

3. Elige un entero e tal que , 1 < e < ϕ(n) y mcd(e, φ(n)) = 1. El número e puede
ser elegido como el resto de la división de n por φ(n). Obviamente, el máximo
común divisor de n y φ(n) es 1 en este caso. Para evitar los casos triviales, el
número e ha de verificar 2e > pq. Ahora, obsérvese que e = p + q − 1.

4. Halla d = e−1 (el inverso de e en Z∗ϕ(n) ).

5. Define clave Pública como (n,e) y se guarda, como clave privada, d.

Codificación de un mensaje: Alicia (con clave pública (nA , eA ) y privada dA )


quiere enviar un mensaje M a Benito (con clave pública (nB , eB ) y privada dB ) y
hace como sigue:

Puesto que Alicia conoce la clave pública de Benito, puede calcular el crip-
tograma C := M eB (mod nB ) y esto es lo que envı́a por el canal, de tal forma
que todo el mundo puede leerlo.

Decodificación de un mensaje : Llegado el criptograma C a Benito, este lo lee.


Para decodificarlo, hace :

Calcula el criptograma C dB (mod nB ) utilizando su clave privada dB conocida


únicamente por él. Como, por otro lado,

C dB ≡ (M eB )dB ≡ M (mod nB )

es capaz de leer el mensaje.


4
El acrónimo RSA contiene las iniciales de los creadores, en 1978, de este sistema: R.L. Rivest,
A. Shamir y L.A. Adleman
3.4. SISTEMA CRIPTOGRÁFICO DE CLAVE PÚBLICA RSA 63

Observación 3.30 (Vulnerabilidad de RSA.) La seguridad del sistema RSA se


fundamenta en la carencia de algoritmos eficientes de factorización de números en-
teros. Para romper un sistema criptográfico del tipo RSA, habrı́a que factorizar
previamente n, ya que no hay ninguna otra manera de calcular ϕ(n), para, posteri-
ormente, utilizar e con el ánimo de calcular la clave privada d. El conocimiento de
la clave privada permitirı́a la posterior decodificación de todos los mensajes enviados
por un individuo con clave pública (n, e). En estos momentos, claves públicas de 1024
bits (esto es, p y q se escriben con 155 cifras decimales cada uno cifras cada uno)
son invulnerables con la algorı́tmica actual y las potencias de cálculo disponibles
Señalemos, finalmente, que todos los cálculos que conlleva RSA (cálculo de poten-
cias, inversos modulares,...) se pueden realizar de forma eficiente con el uso de los
algoritmos que hemos desarrollado a lo largo del tema, excepto el encontrar los pri-
mos grandes.
64 CAPÍTULO 3. CONGRUENCIAS

3.5. Problemas propuestos


Problema 3.1 .- Demostrar las siguientes propiedades de las congruencias:

a ≡ b (mod n) y d|n =⇒ a ≡ b (mod d).


n
ka ≡ kb (mod n) y k 6= 0 ⇐⇒ a ≡ b (mod mcd(n,k)
).

a ≡ b (mod n) y a ≡ b (mod m) ⇐⇒ a ≡ b (mod mcm(m, n)).

Problema 3.2 .- Encontrar todos los números naturales n que verifiquen

97 ≡ 287 (mod n).

Problema 3.3 .- Demostrar que si p es primo y a2 ≡ b2 (mod p), se tiene que


p|(a + b) o p|(a − b). ¿Puede decirse lo mismo si p no es primo?

Problema 3.4 .- Estudiar la existencia de solución de las ecuaciones que siguen y,


en el caso de que tengan solución, calcular todas las soluciones enteras.

(a) 24X ≡ 7 (mod 40) (b) 13X ≡ 7 (mod 10) (c) 525X ≡ 237 (mod 423)
(d) 1215X ≡ 560 (mod 2755) (e) 2X ≡ 1 (mod 3) (f ) 234X ≡ 3 (mod 244)
(g) 20X ≡ 30 (mod 4) (h) 20X ≡ 4 (mod 30) (i) 3X ≡ 2 (mod 7)

Problema 3.5 .- Encontrar las soluciones enteras de los sistemas siguientes:


 
3x + 6y ≡ 2 (mod 8) 11x + 3y ≡ 5 (mod 7)
(a) (b)
5x + 3y ≡ 0 (mod 8) 3x + 7y ≡ 3 (mod 7)

Problema 3.6 .- Estudiar la existencia de solución y, en su caso, resolver:


 
 x ≡ 3 (mod 4)  x ≡ 1 (mod 7)
(a) x ≡ 5 (mod 7) (b) x ≡ 0 (mod 5)
x ≡ 6 (mod 9) x ≡ 1 (mod 3)
 
 
 x ≡ 5 (mod 8)  x ≡ 2 (mod 5)
(c) x ≡ 1 (mod 20) (d) x ≡ 4 (mod 10)
x ≡ 3 (mod 7) x ≡ 38 (mod 47)
 


 x≡1 (mod 3)
x ≡ 0 (mod 5)



(e) x≡4 (mod 7)
x ≡ 5 (mod 27)




x ≡ 6 (mod 1233)

3.5. PROBLEMAS PROPUESTOS 65

Problema 3.7 .- Estudia para qué números enteros positivos a el sistema de con-
gruencias

 x ≡ 1 (mod 7)
x ≡ 2 (mod 54)
x ≡ a (mod 189)

tiene solución y resuélvelo para el menor de todos ellos.

Problema 3.8 .- ¿Queda unı́vocamente determinado un número positivo sabiendo


que es estrictamente menor que 1106 y conociendo el resto de dividirlo por 23, 16 y
3?

Problema 3.9 .- Demostrar, usando únicamente congruencias, que para todo na-
tural n, el número

32n+5 + 24n+1

es múltiplo de 7.

Problema 3.10 .- Encontrar las tres últimas cifras decimales de 31234 .

Problema 3.11 .- Calcular el resto de la división de 16541255 por 23. Hacer lo


mismo con 31767 y 29.

Problema 3.12 .- Dados números natural n y b, denotemos por (ak · · · a1 a0 )b la


representación de n en base b (n = ak bk + ak−1 bk−1 + · · · + a1 b + a0 ). Demostrar que
se verifica:
Si d es un divisor de b y j y k son enteros positivos con j < k, (ak · · · a1 a0 )b es
divisible por dj si, y sólo si, (aj−1 · · · a1 a0 )b es divisible por dj .

Problema 3.13 .- Encontrar todos los números enteros positivos x que verifican
las siguientes condiciones:

a) 6x ≡ 4 (mod 10)

b) El resto de dividir x por 8 es igual a y + 5, con

y ≡ (1843)138648568243871569 (mod 11)

y 0 ≤ y < 11.
66 CAPÍTULO 3. CONGRUENCIAS

Problema 3.14 .- Un sistema de congruencias




 x ≡ a1 (mod b1 )
 x ≡ a2 (mod b2 )

.. ..


 . .
 x ≡ a (mod b )
n n

con los módulos bi distintos y mayores que uno, se dice completo si todo número
entero satisface, al menos, una de las congruencias. Demostrar que el sistema de
congruencias


 x ≡ 0 (mod 2)
 x ≡ 0 (mod 3)


x ≡ 1 (mod 4)
x ≡ 1 (mod 6)




x ≡ 11 (mod 12)

es completo.
Problema 3.15 .- Un barco pirata naufraga y doce de sus tripulantes consiguen
llegar a una isla desierta. Su primera tarea es la de dedicarse a recoger cocos que
acumulan en una pila para repartı́rselos equitativamente a la mañana siguiente.
Aunque ninguno dice nada, todos los piratas se dan cuenta de que si se hace el
reparto equitativo sobrarı́an 3 cocos, ası́ que a lo largo de la noche se levantan
todos ellos y se comen 3 cocos sin que el resto se entere. Esa misma noche mueren
dos piratas y el resto decide repartirse los cocos, descubriendo que esta vez sobran
cinco. Explicar por qué se desencadena una trifulca entre los piratas sobrevivientes
y encontrar el mı́nimo número de cocos recogidos por los piratas sabiendo que eran
más de quinientos.
Problema 3.16 .- Una anciana va al mercado y un caballo pisa su bolsa y rompe
los huevos que llevaba en ella. El jinete se ofrece a repararle los daños y le pregunta
a la anciana cuántos huevos llevaba. Ella no recuerda el número exacto, pero sı́ que
si los sacaba de dos en dos, finalmente le quedaba uno en la bolsa y lo mismo le
ocurrı́a si los sacaba de tres en tres, de cuatro en cuatro, de cinco en cinco y de seis
en seis. Sin embargo, si los sacaba de siete en siete, la bolsa quedaba vacı́a. ¿Cuál
es el menor número de huevos que llevaba la anciana en su bolsa? 5
Problema 3.17 .- Tres agricultores se dividen una cierta cantidad de arroz en
partes iguales obteniendo cada uno una cantidad natural de kilos. Cada uno de los
agricultores vende su propio arroz en mercados distintos que utilizan pesos de 100
kilos, 45 kilos y 31 kilos y sólo compran múltiplos enteros de estos pesos. ¿Cuál es
la menor cantidad de arroz que se han divido los agricultores si regresan a casa con
60, 25 y 15 kilos de arroz respectivamente?
5
Este problema fue propuesto y resuelto por el matemático indio Brahmagupta (nacido alrede-
dor del año 598).
3.5. PROBLEMAS PROPUESTOS 67

Problema 3.18 .- Responder las dos preguntas siguientes:

i) ¿Existe algún número entero b ∈ Z que verifique 14 b ≡ 5 (mod 294)?

ii) Sea a un número natural tal que 0 ≤ a < 500 y tal que las tres últimas cifras
decimales de 17a son 001. ¿Quién es a?

Problema 3.19 .- (Residuos cuadráticos ) Un entero a se dice residuo cuadrático


módulo n si mcd(a, n) = 1 y la ecuación

x2 ≡ a (mod n)
posee solución. Por ejemplo, en Z11 , los residuos cuadráticos son 1, 3, 4, 5 y 9.

i) Sea n = 2, 4, pk , 2pk (p primo impar). Demostrar que a es residuo cuadrático


si, y sólo si, aϕ(n)/2 ≡ 1 (mod n).

ii) Sea p un primo impar y mcd(a, p) = 1. Demostrar que a es residuo cuadrático


p−1
módulo p si a 2 ≡ 1 (mod p) y que a no es residuo cuadrático módulo p si
p−1
a 2 ≡ −1 (mod p).

iii) Demostrar que en Zp (p primo impar) hay tantos residuos cuadráticos como
no residuos cuadráticos.

iv) Demostrar que la ecuación X 2 + 1 ≡ 0 (mod p) tiene solución si, y sólo si,
p = 2 o p ≡ 1 (mod 4).

Problema 3.20 .- Demostrar que las ecuaciones X 2 + Y 2 = 5Z 2 y X 2 + Y 2 = 13Z 2


tienen soluciones enteras no triviales (es decir, distintas de X = 0, Y = 0, Z = 0).
Demostrar que las ecuaciones X 2 +Y 2 = 3Z 2 y X 2 +Y 2 = 11Z 2 no tienen soluciones
enteras distintas de la trivial.

Problema 3.21 .- En este ejercicio vamos a probar que 2 es residuo cuadrático


módulo un primo impar p si, y sólo si, p ≡ ±1 (mod 8).6

Consideremos los conjuntos


p−1
C = {1, 2, . . . , },
2
2C = {2, 4, . . . , p − 1},

p−1
A = {a1 , a2 , . . . , ar } = {x ∈ 2C : x > },
2
6
El argumento que vamos a utilizar es debido a Gauss.
68 CAPÍTULO 3. CONGRUENCIAS

p−1
B = {b1 , b2 , . . . , bt } = {x ∈ 2C : x ≤ }
2
y
D = {p − a1 , . . . , p − ar , b1 , . . . , bt }.
Si denotamos π(T ) el producto de los elementos de un conjunto T , demostrar
que

p−1
(−1)r π(C) ≡ 2 2 π(C) (mod p)

y deducir que 2 es residuo cuadrático módulo p si r es par y no es residuo


cuadrático si r es impar.

Si denotamos por |T | la suma de los elementos de un conjunto T demostrar


que:

2|C| = |A| + |B| y |C| = pr − |A| + |B|.

Usando el apartado anterior y estas identidades, concluir el enunciado del


ejercicio.

Problema 3.22 .- Lo hecho en el Ejercicio anterior puede aplicarse al estudio de


la primalidad de los números de Mersenne. Demostrar que si q es un factor primo
de 2p − 1, se tiene:

q ≡ 1 (mod p) y q ≡ ±1 (mod 8).


Usar este resultado para probar que 213 − 1 y 217 − 1 son primos. Encontrar también
factores no triviales de 223 − 1, 229 − 1, 237 − 1 y 243 − 1.

Problema 3.23 .- Sea r un natural con 1 ≤ r ≤ 9 y considérese la sucesión de


números enteros (dados en base 10):

r, rr, rrr, rrrr, rrrrr, ...


(p.e., si r = 1, la sucesión es 1, 11, 111, 1111, . . .). Estudiar para qué primos y para
qué enteros r (1 ≤ r ≤ 9) es cierta la afirmación:

p divide a infinitos términos de la sucesión r, rr, rrr, rrrr, rrrrr, ...


Indicación: Estudiar por separado los casos p = 2, 3, 5.

Problema 3.24 .- Probar las siguientes propiedades de la sucesión de Fibonacci:

i) (−1)k = Fk−1 Fk+2 − Fk Fk+1 . (k ≥ 1)

ii) Fn+k+1 = Fn Fk + Fn+1 Fk+1 . (k, n ≥ 0)


3.5. PROBLEMAS PROPUESTOS 69

iii) Si k ≥ 1, Fk divide a Fnk para cualquier natural n ≥ 1.

iv) Si Fn es primo, entonces n es primo (salvo n = 4.) (Nota: El recı́proco no es


cierto. Por ejemplo, F19 = 4181 = 37 ∗ 113).

Indicación: Empléese la ecuación (3.3) de los apuntes.

Problema 3.25 .- Probar que se puede calcular el k-ésimo número de Fibonacci


realizando, únicamente, 6 · blog2 kc sumas y 6 · blog2 kc productos.

Problema 3.26 .- Comprobar que el millonésimo número de Fibonacci es divisible


por 7.
70 CAPÍTULO 3. CONGRUENCIAS
Capı́tulo 4

El anillo de polinomios K[x]

Notación: A lo largo del Capı́tulo, K denotará siempre un cuerpo.

4.1. Polinomios y divisibilidad


Definición 4.1 (Anillo de polinomios) El anillo de polinomios con coeficientes
en un cuerpo K, es el conjunto

K[X] = {a0 + a1 X + · · · + an X n : ai ∈ K}

junto con las operaciones suma y producto de polinomios definidos en la forma usual.

d
ai X i con ad 6= 0
P
Todo polinomio no nulo puede escribirse en la forma f (X) =
i=0
para algún d ≥ 0. En este caso, el número natural d se dice grado del polinomio y lo
denotaremos por gr(f ). De esta forma, las llamadas constantes (los elementos de K)
son los polinomios de grado cero. Asimismo, se define gr(0) = −∞. Con respecto a
las propiedades aritméticas, el grado verifica:

1. gr(f · g) = gr(f ) + gr(g)

2. gr(f + g) = máx{gr(f ), gr(g)}

En lo referente a la divisibilidad, el anillo de polinomios tiene un comportamiento


análogo al anillo de los números enteros. Esto es debido a que es un dominio de
integridad y que posee división euclı́dea (el papel del valor absoluto lo juega ahora
el grado).

71
72 CAPÍTULO 4. EL ANILLO DE POLINOMIOS K[X]

4.1.1. División euclı́dea


Si en el caso de los enteros se tenı́a una aplicación:

| · | : Z −→ N
y que dados cualesquiera a y b, existı́an q y r enteros tales que:

a = q · b + r, con r positivo y r < |b|,


en el caso del anillo de polinomios el papel de esa aplicación lo juega la aplicación
grado :

gr(·) : K[X] −→ N
y se tiene que, para cualesquiera polinomios f (X) y g(X), existen polinomios q(X)
y r(X) tales que:

f (X) = g(X)q(X) + r(X), gr(r) < gr(g)

Unidades: De las propiedades del grado, se deduce que los únicos elementos in-
versibles en el anillo K[X] son las constantes.

Polinomios mónicos: Se llaman polinomios mónicos a aquellos cuyo coeficiente


director (es decir, el coeficiente de la potencia mayor de X) es 1. Estos polinomios
mónicos juegan el papel que, en el caso del anillo de los enteros, jugaban los números
positivos. Del mismo modo que en Z, todo entero podı́a escribirse como el producto
de una unidad (±1) por un entero positivo, en este caso todo polinomio puede
escribirse como una unidad en K[X] por un polinomio mónico. En efecto, cualquier
d
ai X i , lo podemos escribir, ya que ad 6= 0, en la forma:
P
polinomio f (X) =
i=0
 
d ad−1 d−1 ad−2 d−2 a1 a0
f (X) = ad X + X + X + ··· + X +
ad ad ad ad

Primos: Un polinomio mónico no constante se dice primo (o irreducible) si los


únicos polinomios mónicos que lo dividen son el 1 y el propio polinomio. Usando
el mismo argumento que en el caso de los enteros, se puede demostrar que existen
infinitos (véase el Teorema 2.5 y su demostración). Es evidente que los polinomios
mónicos de grado uno son todos primos, independientemente de K. En general, la
forma de los polinomios primos depende del cuerpo de coeficientes. Ası́, se tiene:

K = Q. Existen polinomios primos de cualquier grado. Por ejemplo, X n + p es


irreducible para cualquier entero primo p (si no fuese primo, tampoco lo serı́a
p).
4.1. POLINOMIOS Y DIVISIBILIDAD 73

K = R. Los polinomios primos en este caso son de dos tipos:

• X − α, para cualquier número real α y


• (X − α)2 + β 2 , con α ∈ R y β ∈ R \ {0}.

K = C. Los únicos polinomios primos son los mónicos de grado uno. (Teorema
Fundamental del Álgebra)

K = Zp . Existen polinomios primos de cualquier grado.

Teorema 4.2 (Criterio de Einsenstein) Sea f (x) = a0 + a1 x + · · · an xn ∈ Z[x].

Máximo común divisor, Algoritmo de Euclides, Identidad de Bézout.


Todo lo que sabemos de Z con respecto al máximo común divisor, identidad de
Bézout, factorización única en primos, ecuaciones diofánticas lineales,... funciona
exactamente igual en el caso de los anillos de polinomios K[X], incluido lo referente
a los algoritmos de Euclides y Euclides extendido.

Ejemplo 4.3 Encontrar una identidad de Bézout para los polinomios g(X) = X 3 +1
y f (X) = X 4 + X 3 + 2X 2 + X + 1 de Q[X]:
 4 
X + X 3 + 2X 2 + X + 1 X3 + 1
 1 0 
0 1
Dado que f (X) = g(X)(X + 1) + 2X 2 , sustituimos la matriz anterior por
 
2X 2 X3 + 1
 1 0 
−(X + 1) 1
Ahora, como X 3 + 1 = 12 X · 2X 2 + 1, se llega a la matriz:
 
2X 2 1
 1 − 12 X ,
1 2 1
−(X + 1) 2
X + 2X + 1
de donde se deduce que los polinomios son coprimos y la siguiente identidad de
Bézout:
   
1 1 2 1
1 = − X f (X) + X + X + 1 g(X)
2 2 2

Congruencias. Al igual que en el caso de los enteros, podemos definir la relación


de equivalencia ser congruente módulo un polinomio mónico f (X) ∈ K[X]:
74 CAPÍTULO 4. EL ANILLO DE POLINOMIOS K[X]

Dos polinomios g(X) y h(X) en K[X] se dicen congruentes módulo un


polinomio mónico f (X) si, y sólo si, f (X) divide a g(X) − h(X).

Del mismo modo que en el caso de los enteros, se puede dotar al conjunto cociente
resultante de la relación de equivalencia anterior de estructura de anillo. Habitual-
mente, este anillo se denota por:

K[X]/(f (X)).
Se tiene:

Teorema 4.4 El anillo K[X]/(f (X)) es un cuerpo si, y sólo si, f (X) es un poli-
nomio irreducible.

4.2. Cuerpos finitos


En todo lo estudiado hasta ahora sólo nos hemos encontrado con un único tipo de
cuerpos de cardenal finito de elementos: el cuerpo formado por los enteros módulo
un primo Zp . ¿Hay más?
El Teorema 4.4 nos permite responder afirmativamente a la pregunta anterior:
Supongamos dado un polinomio irreducible f (X) de grado α en Zp [X]. El Teorema
citado garantiza que Zp [X]/(f (X)) es un cuerpo que tiene, exactamente, pα elemen-
tos. Ası́ pues, dado que en Zp [X] existen polinomios irreducibles de cualquier grado,
sabemos que para cada número primario pα , existe un cuerpo con exactamente

Ejemplo 4.5 Construir un cuerpo con exactamente 27 elementos.

Puesto que 27 = 33 , si p(x) es un polinomio irreducible en Z3 [x] de grado 3,


Z3 [x]/(p(x)) tiene estructura de cuerpo y 27 elementos. Por lo tanto, para construir
un cuerpo con 27 elementos, únicamente hay que encontrar un polinomio irreducible
de grado 3 en Z3 [x]. Puesto que el grado es 3, esto es equivalente a encontrar un
polinomio de grado 3 en Z3 [x], sin raı́ces en Z3 . Como x3 = x para todo x ∈ Z3 ,
podemos tomar p(x) = x3 − x + 1. Esto es,

Z3 [x]/(x3 − x + 1)
es un cuerpo con 27 elementos.
Capı́tulo 5

Matrices y sistemas de ecuaciones


lineales

5.1. Matrices sobre un cuerpo. Definiciones y no-


tación
Esta primera Sección está dedicada a la introducción de la terminologı́a usual aso-
ciada a las matrices. En primer lugar, definimos el propio concepto de matriz sobre
un cuerpo K.

Definición 5.1 Dados números naturales n y m, se dice matriz m × n sobre K a


un cuadro de elementos de la forma:

a11 · · · a1n
A = ... · · · ...
am1 · · · amn
Habitualmente, escribiremos:
 
a11 · · · a1n
A =  ... · · · ... 
 
am1 · · · amn
Cuando m = n, se dirá que la matriz es cuadrada de orden n. Por otro lado, de
manera abreviada escribiremos A = (aij ).

Notación: El conjunto de matrices m × n sobre un cuerpo K habitualmente se


denota por Mm×n (K), mientras que el conjunto de matrices cuadradas de orden n
se denota por Mn (K).
Una matriz m × n está formada por m n−tuplas, conocidas por el nombre de filas,
a saber:

75
76 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

A1 = (a11 . . . a1n )
..
.
An = (am1 . . . amn )
De manera similar, podemos considerarla formada por n m−tuplas, llamadas colum-
nas de la matriz:
   
a11 a1n
. .
A1 =  ..  · · · An =  .. 
am1 amn

Definición 5.2 Dada una matriz A m × n sobre K, se dice traspuesta de A a la


matriz n × m cuyo término (i, j) es el término (j, i) de A. Se escribe At .

Definición 5.3 Una matriz cuadrada se dice simétrica si At = A y se dice anti-


simétrica si aij = −aji .

Definición 5.4 Sea A = (aij ) una matriz m × n sobre un cuerpo K.

1. Se llama diagonal principal de A a la familia (a11 , . . . , ass ) donde s es igual a


la cantidad mı́n{m, n}.

2. La matriz A se dice triangular superior si m = 1 o aij = 0, ∀ i > j. Es decir,


si todos los elementos por debajo de su diagonal principal son cero.

3. La matriz A se dice triangular inferior si n = 1 o aij = 0, ∀ i < j. Es decir,


si todos los elementos por encima de su diagonal principal son cero.

4. Una matriz cuadrada se dice diagonal si aij = 0 ∀ i 6= j. En tal caso, escribire-


mos diag[a11 , . . . , ann ].

5. Una matriz se dice escalar si es diagonal y a11 = . . . = ann .

6. Se llama matriz identidad de orden n, y se escribe In , a la matriz escalar cuyos


términos diagonales son todos iguales a 1K .

7. Se dice matriz cero a la matriz cuyos términos son todos nulos. Se escribe (0).
5.2. RANGO DE UNA FAMILIA DE VECTORES DE K N 77

5.1.1. Operaciones con matrices


Repasamos, a continuación, las operaciones usuales que se pueden realizar entre y
con matrices.

Definición 5.5 (Operaciones con matrices) Se definen :

1. Suma de matrices: Si A = (aij ) y B = (bij ) son dos matrices de Mm×n (K),


se define
A + B := (aij + bij )1≤i≤m,1≤j≤n .

2. Producto de una matriz por una constante: Si A = (aij ) es una matriz


de Mm×n (K) y λ ∈ K,

λA := (λaij )1≤i≤m,1≤j≤n .

3. Producto de dos matrices: Dadas matrices A ∈ Mm×n (K) y B ∈ Mn×t (K),


A · B es la matriz m × t con coeficientes en K definida por:
n
!
X
A · B := aik bkj .
k=1 1≤i≤m,1≤j≤t

Si consideramos el conjunto Mn (K) junto a las operaciones suma y producto que


hemos definido anteriormente, se puede probar que éstas dotan al conjunto de estruc-
tura de anillo (no conmutativo) con elemento identidad. En este caso, las unidades
del anillo reciben un nombre especial: se les llama matrices regulares.

5.2. Rango de una familia de vectores de K n


Una solución de un sistema de ecuaciones lineales m×n es una n–tupla de elementos
de K. Por otro lado, una matriz se puede interpretar como un conjunto de vectores,
es decir, elementos de algún K n (fila o columna). Conviene pues, estudiar algunas
nociones en torno a los vectores de K n . Empecemos, pues, por el principio.
Los elementos de K n se denominan vectores y los de K escalares. Vectores notables
son:

(0) = (0, 0, . . . , 0) (vector nulo)


e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
.. .. ..
. . .
en = (0, 0, . . . , 1)
Tales vectores se suman y multiplican por escalares (es decir, elementos del cuerpo
K) en la manera conocida.
78 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

El objetivo final de la Sección es el de definir el concepto de rango de una familia de


vectores en K n y diseñar un algoritmo para su cálculo. Pero antes, una definición:

Definición 5.6 Una familia {v1 , . . . , vm } de vectores de K n se dice:

1. libre si

t1 v1 + · · · + tn vn = (0) =⇒ t1 = . . . = tn = 0,

2. y ligada si no es libre.

Ejemplo 5.7 1. La familia {(1, 2), (3, 2)} de vectores de R2 es una familia libre.

2. La familia {(1, 2, 3), (2, 1, 0), (1, −1, −3)} es una familia ligada, pues se verifica
(1, −1, −3) = −(1, 2, 3) + (2, 1, 0).

3. Cualquier familia que contenga al vector nulo es ligada.

4. Cualquier familia que contenga vectores repetidos es ligada.

El siguiente Lema técnico, cuya prueba dejamos como ejercicio, lo utilizaremos en


el resultado principal de esta Sección (Proposición 5.11).

Lema 5.8 Si {v, v1 , . . . , vm } es ligada y {v1 , . . . , vm } es libre, existen escalares ti


tales que v = t1 v1 + . . . + tm vm .

Llegados a este punto, podemos definir el concepto de rango que es clave en el


desarrollo del resto del Capı́tulo.

Definición 5.9 (Rango de una familia de vectores) Dada una familia de vec-
tores de K n , se dice rango al máximo tamaño de sus subfamilias libres.

Ejemplo 5.10 El rango de la familia {(0, 0, 0), (1, 2, 3), (π, 2, 1), (1, 2, 3)} ⊆ R3 es
2, pues cualquier familia con mayor número de elementos√ contendrá al vector nulo
o dos vectores repetidos y la subfamilia {(1, 2, 3), (π, 2, 1)} es libre.

Aunque en el ejemplo anterior nos ha sido sencillo el cálculo del rango, en general,
ésta no es una tarea sencilla utilizando como única herramienta la definición. El
algoritmo que estudiaremos para el cálculo del rango está basado en el concepto de
operación elemental que se presenta en la siguiente Proposición:

Proposición 5.11 (Operaciones elementales de vectores) Dada una familia


de vectores de K n , V := {v1 , . . . , vm }, las siguientes operaciones no alteran el rango
de la misma:

1. Intercambiar el orden de dos vectores.


5.2. RANGO DE UNA FAMILIA DE VECTORES DE K N 79

2. Sustituir un vector por él más un múltiplo de otro.


3. Multiplicar un vector por un escalar no nulo.

Las operaciones anteriores las llamaremos operaciones de tipo 1, 2 y 3 respectiva-


mente.

Demostración.– Siendo evidente que las operaciones de tipo 1 no alteran el rango,


estudiaremos qué es lo que ocurre con las de tipo 2 y de tipo 3, empezando por estas
últimas. Supongamos la operación de tipo 3

{v1 , v2 , . . . , vn } −→ {sv1 , v2 , . . . , vn } (5.1)


y veamos que no varı́a el rango. Sea r el rango de V y veamos que

rang({sv1 , . . . , vn }) ≥ r.

Si existe una familia libre de V con r vectores que no contenga a v1 , ha de ser


subfamilia libre de {sv1 , v2 , . . . , vn } y, por lo tanto, se verifica la desigualdad (5.1).
Si no, sea {v1 , vi2 , . . . , vir } la familia libre que debe existir; entonces es claro que
{sv1 , vi1 , . . . , vir } es subfamilia libre de V y, también en este caso, se verifica (5.1)
Por otro lado,

rang({sv1 , v2 , . . . , vn }) ≤ rang({s−1 sv1 , v2 , . . . , vn }) = rang(V) (5.2)

Uniendo las desigualdades (5.1) y (5.2) se concluye que

rang({sv1 , v2 , . . . , vn }) = rang(V).
Para las operaciones de tipo 2 podemos suponer que la operación es:

{v1 , v2 , . . . , vn } −→ {v1 + tv2 , v2 , . . . , vn }


Probaremos, como hicimos antes, que

r = rang(V) ≤ rang({v1 + tv2 , v2 , . . . , vn }).


Si existe una subfamilia libre de V que no contenga a v1 , nada habrı́a que probar.
En caso contrario, sea {v1 , vi2 , . . . , vir } la familia libre que debe existir; entonces
{v2 , vi2 , . . . , vir } es ligada y, según el Lema 5.8 v2 = t2 vi2 + · · · + tr vir . Ahora, es fácil
ver que {v1 + tv2 , vi2 , . . . , vir } es una subfamilia libre de {v1 + tv2 , v2 , . . . , vn }.
Por otro lado,

rang({v1 + tv2 , v2 , . . . , vn }) ≤ rang({v1 + tv2 − tv2 , v2 , . . . , vn }) = rang(V).


80 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

5.3. Rango por filas y por columnas de una matriz


Las definiciones de rango por filas y por columnas de una matriz A ∈ Mm×n son las
esperables, es decir, el rango por filas de A, escrito rf (A), es el rango de las filas de
A vistas como vectores de K n , mientras que el rango por columnas, escrito rc (A) es
el rango de las columnas de A vistas como vectores de K m .

Definición 5.12 Una matriz m × n sobre K se dice escalonada por filas si m = 1


o:

Sus filas cero son las últimas.

El primer elemento no nulo de cada fila no nula, denominado pivote, está a la


derecha del pivote de la fila superior.

En virtud de la definición, las matrices escalonadas por filas tienen la siguiente


forma:
 
0 ··· 0 a1j a1j+1 · · · · · · · · · · · · · · · a1n
 0 ··· ··· ··· ··· 0 a2h · · · · · · · · · a2n 
 .. .
 
 . ··· ··· · · · · · · · · · · · · · · · · · · · · · ..


 . 
 0 ··· ···
 · · · · · · · · · · · · 0 ars · · · .. 

 0 ··· ··· ··· ··· ··· ··· ··· ··· ··· 0 
 
 . .
 .. · · · · · · · · · · · · · · · · · · · · · · · · · · · ..


0 ··· ··· ··· ··· ··· ··· ··· ··· ··· 0

Definición 5.13 Una matriz A m × n sobre K se dice reducida por filas si es


escalonada por filas y además:

1. Sus pivotes son todos 1.

2. En la columna que ocupa cada pivote, los elementos anteriores a éste son todos
cero.

Definición 5.14 Una matriz A m × n sobre K se dice reducida (respectivamente


escalonada) por columnas si su traspuesta lo es por filas.

Ejemplo 5.15 1.- La matriz 4 × 5


 
2 3 4 5 0
0 2 1 3 0
  es escalonada por filas pero no reducida.
0 0 0 1 2
0 0 0 0 1
5.3. RANGO POR FILAS Y POR COLUMNAS DE UNA MATRIZ 81

2.- La matriz

 
2 3 4 5 0
0 0 0 2 0
  es triangular superior, pero no escalonada por filas.
0 0 1 2 3
0 0 0 0 1

3.- La matriz
 
1 3 0 0 0
0 0 1 0 0
  es reducida por filas.
0 0 0 1 0
0 0 0 0 1

Observación 5.16 El interés de las matrices escalonadas reside en el hecho de su


rango por filas se lee directamente (basta contar el número de filas no nulas). El
interés de las matrices reducidas es que se corresponden con sistemas fácilmente
resolubles.

En virtud de lo discutido hasta ahora,

Teorema 5.17 Sea A ∈ Mm×n (K). Son equivalentes:

i) rf (A) = r

ii) Existe un número finito de operaciones elementales (de tipo 1 y 2) en las filas
de A que conducen a una matriz escalonada por filas con, exactamente, las
m − r últimas filas nulas.

iii) Existe un número finito de operaciones elementales en las filas de A que con-
ducen a una matriz reducida por filas con, exactamente, las m − r últimas filas
nulas.

Demostración.– Para probar que ii) implica iii), sea F la matriz obtenido en ii) y
ci el pivote de la fila i. Multiplicando la fila por c−1
i hacemos que el pivote sea 1.
Ahora, haciendo operaciones elementales en las filas, es fácil conseguir que todos los
elementos por encima de cada pivote sean cero.
Es también claro que iii) implica i) (ya que las operaciones elementales no varı́an
el rango por filas). Por lo tanto, únicamente queda ver que i) implica ii). Para
probarlo, razonaremos por inducción en m (número de filas) construyendo, de paso,
un algoritmo para el cálculo del rango por filas.
Si m = 1 la implicación es obvia, pues estarı́amos ante una matriz fila.
82 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

Supongamos que m > 1; si la matriz es la matriz nula, nada habrı́a que hacer. Si
la matriz no es nula, sea Aj la primera columna no cero y aij el primer término no
nulo de dicha columna. Entonces, permutando la fila i y la fila 1, si i 6= 1, podemos
situar aij en el lugar (1, j):

0 ··· · · · a1n 0 ··· ···


   
0 0 0 aij ain
 .. . . . .. .. ..   .. . . . .. .. .. 
 . . . .   . . . . 
A =  0 ··· 0 aij · · · ain  −→ A1 =  0 · · · 0 0 · · · a1n 
   
 . . .. .. ..   . . .. .. .. 
 .. . .  .. . .

. . . . . . 
0 ··· 0 amj · · · amn 0 ··· 0 amj · · · amn
Ahora, mediante operaciones elementales en las filas de A1 (restándole a la fila
k−ésima, la primera multiplicada por akj /aij )) podemos hacer ceros en la columna
j por debajo del pivote de la primera fila. Llegamos ası́ a una matriz B de la forma

0 · · · 0 aij · · · ain
 
 .. . . . .. .. .. 
 . . . . 
B =  0 · · · 0 0 · · · a1n 
 
 . .
 .. . . ... ... .. 
. 
0 · · · 0 0 · · · amn
Si llamamos C a la submatriz de B formada por las filas 2, . . . , m y por las columnas
j + 1, . . . , n, es claro que ésta tiene rango r − 1. Aplicando la hipótesis de inducción,
existirán un número finito de operaciones elementales en las filas de C que conducen
a una matriz E escalonada por filas con las m − r últimas filas nulas. Ahora, la
matriz:
 
0 · · · 0 aij aij+1 · · · ain
 0 ··· ··· 0 
F =  ..
 
.. E

 . ··· ··· . 
0 ··· ··· 0
es escalonada por filas. Basta notar, para acabar, que hacer operaciones elementales
en C equivale a hacer operaciones en B.

Para comprender cómo funciona el algoritmo subyacente a la demostración de la


Proposición inmediatamente anterior, apliquémoslo a un ejemplo concreto:

Ejemplo 5.18 Calcúlese el rango por filas de la matriz racional:


 
1 2 3 0
2 4 3 2
A= 3 2

1 3
6 8 7 5
5.3. RANGO POR FILAS Y POR COLUMNAS DE UNA MATRIZ 83

En este caso, la primera columna no nula es la primera y el primer elemento de la


misma es también el primero. Debemos hacer ceros por debajo del elemento (1, 1)
de la matriz. Para ello, a la segunda fila le restamos la primera multiplicada por 2,
a la tercera la primera multiplicada por 3 y a la cuarta la primera multiplicada por
6, llegando a la matriz:
 
1 2 3 0
0 0 −3 2 
A1 =  0 −4 −8 3 

0 −4 −11 5
Ahora, la primera columna no nula de la submatriz
 
0 −3 2
C =  −4 −8 3 
−4 −11 5
es la primera cuyo primer elemento no nulo es el segundo. Ası́ debemos intercambiar
las filas primera y segunda de la submatriz C o, lo que es lo mismo, las filas segunda
y tercera de A1 . Llegamos ası́ a la matriz
 
1 2 3 0
 0 −4 −8 3 
A2 =  
0 0 −3 2 
0 −4 −11 5
Ahora restando a la cuarta fila de A2 la segunda, llegamos a
 
1 2 3 0
 0 −4 −8 3
A3 =   0 0 −3

2
0 0 −3 2
Por último, restando a la cuarta fila de A3 la tercera, llegamos a la matriz escalonada
por filas
 
1 2 3 0
 0 −4 −8 3 
 ,
0 0 −3 2 
0 0 0 0
luego el rango por filas de A es 3.

Observación 5.19 Mutatis mutandi, todo lo dicho hasta ahora para el rango por
filas, puede decirse igualmente para el rango por columnas. Por ejemplo, el Teorema
5.17 anterior y su demostración se trasladan al caso de columnas cambiando la
palabra fila por la palabra columna.
84 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

En otro orden de cosas es fácil probar, a partir del Teorema 5.17 los dos corolarios
siguientes (que pueden ser escritos igualmente en términos de columnas):

Corolario 5.20 Si rf (A) = r y A es escalonada por filas, un número finito de


operaciones elementales en las columnas de A conducen a la matriz
 
Ir 0
,
0 0
que denotaremos por [Ir , 0].

Ahora, juntando el Teorema 5.17 con el Corolario inmediatamente anterior se tiene:

Corolario 5.21 Si rf (A) = r, existe un número finito de operaciones elementales


en filas y columnas de A que conducen a la matriz [Ir , 0].

5.4. Rango de una matriz. Matrices elementales


En esta Sección trataremos de mostrar que los rangos por fila y por columna intro-
ducidos en la Sección anterior son iguales. Para llegar a ello, en primer lugar veremos
como ”simular”mediante productos de matrices las operaciones elementales tanto en
filas como en columnas. Con este fin, se introducen las conocidas como matrices e-
lementales.

5.4.1. Matrices elementales


Empecemos definiendo las ya anunciadas matrices elementales:

Definición 5.22 (Matrices elementales) Se dice matriz elemental de orden n:

1. de tipo 1, Pij , a la matriz que resulta de permutar en la matriz identidad (In )


las filas i y j;

2. de tipo 2, Pij (t) (i 6= j), a la matriz que resulta de sumarle a la fila i de la


matriz identidad (In ), la fila j multiplicada por t;

3. de tipo 3, Qi (s), a la matriz que resulta de multiplicar la fila i de la matriz


identidad (In ) por un escalar s distinto de cero.

Estas matrices elementales, simulan, como ya hemos adelantado las operaciones


elementales:1
1
La demostración de la Proposición 5.23 no aporta gran cosa, luego asumiremos su veracidad.
Sin embargo, resulta de interés que uno se convenza de su veracidad, verificándola en ejemplos
concretos.
5.4. RANGO DE UNA MATRIZ. MATRICES ELEMENTALES 85

Proposición 5.23 Sea A una matriz m × n sobre K. Entonces,


i) Pij A es la matriz que resulta de permutar en A las filas i y j.
ii) APij es la matriz que resulta de permutar en A las columnas i y j.
iii) Pij (t)A es la matriz que resulta de sumarle a la fila i de A la fila j multiplicada
por t.
iv) APij (t) es la matriz que resulta de sumarle a la columna j de A la columna i
multiplicada por t.
v) Qi (s)A es la matriz que resulta de multiplicar la fila i de A por s.
vi) AQi (s) es la matriz que resulta de multiplicar la columna i de A por s.
Por otro lado, puesto que toda operación elemental es reversible, se tiene:
Corolario 5.24 Las matrices elementales son regulares. En concreto,
i) Pij Pji = In .
ii) Pij (t)Pij (−t) = In .
iii) Qi (s)Qi (s−1 ) = In .
Rescribiendo los resultados obtenidos en la Sección anterior ( Teorema 5.17 y los
corolarios subsiguientes) con el nuevo lenguaje introducido, se tiene:
Corolario 5.25 Sea A ∈ Mm×n (K) de rango por filas r. Entonces,
i) Existen matrices elementales P1 , . . . , Ps tales que

Pt · · · P1 A = F es escalonada por filas.


ii) Existe una matriz regular P tal que

P A = F es escalonada por filas.


iii) Existen matrices elementales P1 , . . . , Ps , Q1 . . . , Qs tales que

Pt · · · P1 AQ1 · · · , Qs = [Ir , 0].


iii) Existen matrices regulares P y Q tales que

P AQ = [Ir , 0].
Observación 5.26 Al igual que ocurrı́a con la sección anterior, lo dicho para el
rango por filas en el resultado anterior, se traslada, de forma inmediata, al rango
por columnas.
86 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

5.4.2. Rango de una matriz


El resultado contenido en el Corolario 5.25 es la clave para probar que rango por
filas y por columnas son iguales.

Teorema 5.27 Sea A una matriz de Mm×n (K). Entonces, el rango por filas y el
rango por columnas de A coinciden. A esta cantidad se le conoce como rango de A
y lo denotaremos por rg(A). En particular, se tiene que rg(A) = rg(At ).

Demostración.– Llamemos r al rango por filas de A. Entonces, existe una matriz


regular P tal que P A = F es escalonada por filas con las últimas m − r filas
nulas. Si tomamos las columnas de F en las que se encuentran los pivotes, éstas son
linealmente independientes, luego se tiene r ≤ rc (F ).
Por otro lado, sea s = rc (F ) y F j1 , . . . , F js s columnas de F que forman familia
libre. En tal caso, puesto que A = P −1 F , la columna j−ésima de A, Aj , es igual a
Aj = P −1 F j . En consecuencia,
s
X s
X
jk
ck A = (0) =⇒ ck F jk = (0) =⇒ c1 = c2 = . . . = ck = 0.
k=0 k=0

De lo anterior se deduce que rc (F ) = s ≤ rc (A); luego, por lo tanto, rf (A) ≤ rc (A).


Ahora, aplicando esta desigualdad a la matriz transpuesta, se concluye que rc (A) ≤
rf (A) y, finalmente, la igualdad de rangos por fila y por columna.

El Teorema 5.27 nos permite deducir algunos resultados de interés, que enunciamos
a continuación.

Corolario 5.28 El rango de cualquier familia de K n es menor o igual que n.

Corolario 5.29 Una matriz A ∈ Mn (K) es regular si, y sólo si, rg(A) = n.

Demostración.– Supongamos, en primer lugar, que la matriz es regular y sea

t1 A1 + t2 A2 + · · · + tn An

una combinación lineal de sus columnas. Si se iguala esta combinación al vector


nulo, se tendrá que

t1
 
 t2 
A ...  = (0),

tn
de donde, multiplicando la igualdad por A−1 , se tiene que t1 = . . . = tn = 0. En
consecuencia, las columnas de A forman una familia libre y, por lo tanto, rg(A) = n.
5.4. RANGO DE UNA MATRIZ. MATRICES ELEMENTALES 87

Recı́procamente, si suponemos que el rango de A es n, existirán, por el Corolario


5.25, matrices regulares P y Q tales que P AQ = In . De esta igualdad se deduce que
A = P −1 Q−1 . Por lo tanto, A es regular.

De más fácil prueba es el último resultado que presentaremos en esta Sección:

Corolario 5.30

i) Hacer operaciones elementales en las filas y/o las columnas de una matriz no
varı́a su rango.

ii) Una matriz cuadrada es regular si, y sólo si, es producto de matrices elemen-
tales.

iii) Si P y Q son matrices regulares y A es otra matriz rg(P A) = rg(A) =


rg(AQ) = rg(P AQ); es decir, el producto por matrices regulares no altera
el rango.

5.4.3. Aplicación al cálculo de inversas de matrices regulares


Los resultados anteriores son útiles para calcular la inversa de una matriz regular.
Si A es regular, es producto de matrices elementales:

A = P1 . . . Pr ,
luego
In = Pr−1 . . . P1−1 A.
Ası́ pues,

A−1 = Pr−1 . . . P1−1 = Pr−1 . . . P1−1 In


y dado que la inversa de una matriz elemental es elemental (véase Corolario 5.24),
haciendo operaciones elementales en las filas de A es posible obtener la matriz ele-
mental. Realizando exactamente las mismas operaciones sobre la matriz identidad,
se obtiene la inversa de A.
Los cálculos puede efectuarse al mismo tiempo de la siguiente forma:

Qr . . . Q1 A = In | Qr . . . Q1 In = A−1
 
A | In ∼

Ejemplo 5.31 Calcular la inversa de


 
2 3 4
A= 5 6 6 
3 1 2
88 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

   
2 3 4 | 1 0 0 P31 (−3/2) 2 3 4 | 1 0 0
P (−7/3)
 5 6 6 | 0 1 0  P21 (−5/2)  0 −3/2 −4 | −5/2 1 0  32

3 1 2 | 0 0 1 ∼ 0 −7/2 −4 | −3/2 0 1
 
2 3 4 | 1 0 0
 0 −3/2 P23 (3/4)
−4 | −5/2 1 0 

0 0 16/3 | 13/3 −7/3 1
 
2 3 4 | 1 0 0
 0 −3/2 P13 (−3/4)
0 | 3/4 −3/4 3/4 

0 0 16/3 | 13/3 −7/3 1
 
2 3 0 | −9/4 7/4 −3/4
 0 −3/2 0 | 3/4 −3/4 3/4  P12 (2)

0 0 16/3 | 13/3 −7/3 1
  Q3 (3/16)
2 0 0 | −3/4 1/4 3/4
Q (−2/3)
 0 −3/2 0 | 3/4 −3/4 3/4  2
Q1 (1/2)
0 0 16/3 | 13/3 −7/3 1

 
1 0 0 | −3/8 1/8 3/8
 0 1 0 | −1/2 1/2 −1/2 
0 0 1 | 13/16 −7/16 3/16
Por lo tanto,
 
−3/8 1/8 3/8
A−1 =  −1/2 1/2 −1/2 
13/16 −7/16 3/16

5.5. Combinación lineal. Variedades lineales


Lo que resta de Capı́tulo está dedicado a la resolución de sistemas de ecuaciones
lineales. Pensemos, pues, en un sistema lineal de m ecuaciones y n incógnitas:


 a11 x1 + · · · + a1n xn = b1

.. .. .. .. (5.3)
 . . . .
 a x + ··· + a x = b
m1 1 mn n m

Usando la terminologı́a habitual en estos casos, llamaremos matriz de coeficientes


a la matriz A = (aij ) y vector de términos independientes a la matriz columna
b = (b1 , . . . , bm )t . De esta forma, podemos escribir, denotando X = (x1 , . . . , xn )t , el
sistema en la forma AX = b.
5.5. COMBINACIÓN LINEAL. VARIEDADES LINEALES 89

El sistema (5.3) tiene solución si, y sólo si, existen escalares t1 , . . . , tn tales que
     
b1 a11 an1
 ...  = t1  ...  + · · · + tn  ...  .
bm am1 amn
De esta observación casi trivial surge el concepto de combinación lineal de vectores:

Definición 5.32 Dada una familia de vectores {v1 , . . . , vn } en K m , diremos que el


vector v es combinación lineal de la familia si existen escalares t1 , . . . , tn tales que:

v = t1 v1 + . . . + tn vn .

Con este nuevo lenguaje, el sistema (5.3) tiene solución si, y sólo si, el vector de
términos independientes es c.l.2 de las columnas de la matriz de coeficientes.

Definición 5.33 Se dice variedad lineal a un subconjunto S de K m para el que ex-


isten vectores {v1 , . . . , vn } cuyo conjunto de combinaciones lineales es justamente
S. Se escribe S = K < v1 , . . . , vn > y se dice que {v1 , . . . , vn } es un sistema gener-
ador de S. Si el sistema generador es una familia libre, se le denomina base. Por
convenio, ∅ es la única base de (0).

Un resultado de utilidad es el siguiente:

Proposición 5.34

u ∈ K < v1 , . . . , vn > ⇐⇒ rg(v1 , . . . , vn ) = rg(v1 , . . . , vn , u)

Demostración.– Supongamos, en primer lugar, que u ∈ K < v1 , . . . , vm >. Entonces,


haciendo operaciones elementales podemos transformar la familia {v1 , . . . , vn , u} en
la familia {v1 , . . . , vn , 0}, de donde se sigue la igualdad de rangos.
Recı́procamente, sea r el rango común de ambas familias y sea {vi1 , . . . , vir } una
familia libre de {v1 , . . . , vn }. Como {vi1 , . . . , vir , u} es ligada, aplicando el Lema 5.8,
se sigue que u es c.l. de los vectores vi1 , . . . , vir .

Reinterpretando el resultado anterior en términos de sistemas de ecuaciones, se tiene


que un sistema AX = b tiene solución si, y sólo si, el rango de la matriz (A|b) es
igual al rango de A.

Proposición 5.35 Dos bases cualesquiera de una variedad lineal S tienen la misma
cantidad de vectores. A esta cantidad se le dice dimensión de la variedad lineal y se
escribe dimS.
2
A partir de ahora, la abreviación c.l. significará combinación lineal
90 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

Corolario 5.36 Dada una familia de vectores, sea r su rango y S la variedad lineal
que generan. Entonces:

1. Existe una subfamilia r de vectores que es base de S.

2. Toda familia libre de S posee a lo sumo r vectores.

3. Toda familia libre de S con r vectores es base.

Nota: El escalonamiento por filas proporciona un algoritmo para el cálculo de una


base de una variedad lineal S a partir de un sistema generador: se construye una
matriz cuyas filas sean los vectores dados y se escalona por filas; las filas no nulas
de la matriz escalonada por filas forman una base de S.

5.6. Sistemas de ecuaciones lineales.


5.6.1. Nulidad de una matriz
En la resolución de sistemas de ecuaciones lineales, aparecen dos variedades lineales
claves asociadas a la matriz de coeficientes. En primer lugar, la variedad generada
por las columnas de dicha matriz (ya que la pertenencia, o no, a dicha variedad
lineal del vector de términos independientes marca la existencia, o no, de solución)
y la variedad lineal conocida como nulidad o subespacio nulo.

Definición 5.37 Se dice nulidad o subespacio nulo de una matriz A ∈ Mm×n (K)
al conjunto de soluciones del sistema homogéneo AX = (0). Se escribe N (A).

Teorema 5.38 Si A ∈ Mm×n (K) es una matriz de rango r, N (A) es una variedad
lineal de dimensión n − r. Además, si N es una matriz regular tal que
n−r
z }| {
AN = [B, 0, . . . , 0],

sus últimas n − r columnas constituyen una base de la nulidad de N (A).

Demostración.– Sean P y Q matrices regulares tales que P AQ = [Ir , 0]. Es claro,


por lo tanto, que las columnas Qr+1 , . . . , Qn de Q forman una familia libre de N (A)
y que en consecuencia K < Qr+1 , . . . , Qn >⊆ N (A).
Por otro lado, sea S ∈ N (A). Como las columnas de Q son base de K n , podemos
escribir S como c.l. de éstas, es decir,

S = t1 Q1 + . . . + tn Qn .
Multiplicando a la izquierda la igualdad por A se obtiene
5.6. SISTEMAS DE ECUACIONES LINEALES. 91

(0) = t1 AQ1 + . . . + tn AQn ,


lo que implica, multiplicando ahora a la izquierda por P que
n
X r
X
(0) = tj P AQj =⇒ tj ej = (0) =⇒ tj = 0 , j = 1, . . . , r.
j=1 j=1
r+1
Es decir, que S es c.l. de Q , . . . , Qn , con lo que S ∈ K < Qr+1 , . . . , Qn > com-
pletando la demostración.

Observación 5.39 Basados en el Teorema anterior, podemos diseñar una algorit-


mo para calcular una base de la nulidad de una matriz dada A ∈ Mm×n (K):
Construida la matriz

A
 −−  ,
In
la escalonamos por columnas llegando a una matriz de la forma
 
G
 −−  ,
N
siendo G escalonada por columnas. Si r es el número de columnas no nulas de G,
las últimas n − r columnas de N forman una base de la nulidad de A

Ejemplo 5.40 : Calcular una base de la nulidad de la matriz racional:


 
1 1 2 0
A= 2 2 1 3 
1 3 0 2
 
A
Siguiendo el algoritmo propuesto, construimos la matriz  −−  :
In
y la escalonamos por columnas:
     
1 1 2 0 1 0 0 0 1 0 0 0

 2 2 1 3 

 2
 0 −3 3 


 2 −3 0 3


 1 3 0 2 
  1 2 −2 2   1 −2 2 2

 ∼  
 ∼
 



 P12 (−1) 





 ∼
 1 0 0 0 
  1 −1 −2 0 
 P32
 1 −2 −1 0  P24 (1)
 P 13 (−2)   

 0 1 0 0 

 0
 1 0 0 

 0
 0 1 0 

 0 0 1 0   0 0 1 0   0 1 0 0 
0 0 0 1 0 0 0 1 0 0 0 1
92 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

 
1 0 0 0

 2 −3 0 0



 1 −2 2 0


∼  


P24 (1)  1 −2 −1 −2 


 0 0 1 0 
 
 0 1 0 1 
0 0 0 1
Por lo tanto, N (A) = Q < (−2, 0, 1, 1) >.

Tras el resultado fundamental sobre la nulidad, estamos en condiciones de discutir


completamente la existencia y unicidad de solución de los sistemas de ecuaciones
lineales:

Teorema 5.41 (Rouché-Frobenius) Sea AX = b un sistema de m ecuaciones


lineales con m incógnitas. Entonces,

i) El sistema tiene solución si, y sólo si, rg(A) = rg(A|b).

ii) Si (s1 , . . . , sn ) es una solución, el conjunto de soluciones es:

{(t1 , . . . , tn ) : (t1 , . . . , tn ) − (s1 , . . . , sn ) ∈ N (A)},


es decir, dos soluciones cualesquiera del sistema se diferencian en un elemento
de la nulidad de la matriz de coeficientes.

iii) Si existe solución, es única si, y sólo si, rg(A) = n.

Observación 5.42 A partir del Teorema de Rouché-Frobenius, podemos expresar


el conjunto de soluciones de un sistema AX = b en la forma

(t1 , . . . , tn ) + N (A),
donde (t1 , . . . , tn ) es una solución particular cualquiera del sistema.

5.6.2. Resolución de sistemas lineales


Si AX = B es un sistema compatible de n incógnitas con rango de A igual a r, el
método de resolución que propondremos aquı́ consiste en la resolución de n − r + 1
sistemas en los que la matriz de coeficientes es triangular superior y regular. Para
llegar a esto, antes una pequeña observación:
5.6. SISTEMAS DE ECUACIONES LINEALES. 93

Observación 5.43 Si AX = b es un sistema y realizamos operaciones elementales


en las filas de (A|b) obteniendo una matriz (C|d), el conjunto de soluciones de los
sistemas AX = b y CX = d es el mismo, como no es difı́cil comprobar.

El objetivo primero será, en consecuencia, intentar simplificar el sistema sin mo-


dificar el conjunto de soluciones y, en un segundo término, encontrar una solución
particular y una base de la nulidad de A. Antes de explicar cómo haremos esto,
un pequeño ejemplo: supongamos dado el siguiente sistema sobre el cuerpo de los
números racionales

 x + y + 2z + t + w = 0
2x + 2y + z + t + 3w = 3
x + 3y + t + 2w = 2

Aplicando el proceso de escalonamiento por filas se llega al sistema equivalente3 :



 x + y + 2z + t + w = 0
2y − 2z + w = 2
− 3z − t + w = 3

¿Cómo calcular ahora una solución particular? ¿Cómo hallar una base de la nulidad
de la matriz de coeficientes?
Si en el último de los sistemas, hacemos t = 0 y w = 0, es decir, escogemos las
columnas correspondientes a los pivotes, nos quedamos con el sistema:

 x + y + 2z = 0
2y − 2z = 2
− 3z = 3

que es un sistema cuadrado, triangular superior, compatible y determinado cuya


solución es: x = 2, y = 0, z = −1. En consecuencia, (2, 0, −1, 0, 0) es una solución
particular del sistema inicial. No queda más que encontrar una base de la nulidad,
es decir, una base del conjunto de soluciones del sistema:


 x + y + 2z + t + w = 0
2y − 2z + w = 0 (5.4)
− 3z − t + w = 0

Una solución la podemos encontrar haciendo t = 0 y w = 1 y resolviendo el sistema:



 x + y + 2z = −1
2y − 2z = −1
− 3z = −1

3
Dos sistemas se dicen equivalentes si su conjunto de soluciones es el mismo
94 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

cuya única solución es x = −3/2, y = −1/6, z = 1/3. En consecuencia, el vector


V1 = (−3/2, −1/6, 1/3, 0, 1) es un vector de la nulidad de la matriz de coeficientes.
Como la dimensión de esta nulidad es dos (el número de incógnitas es 5 mientras
que el rango de la matriz de coeficientes es 3), necesitamos otra solución, V2 , que
forme familia libre con V1 . Para ello hacemos t = 1 y w = 0 en (5.4) obteniendo :

 x + y + 2z = −1
2y − 2z = 0
− 3z = 1

cuya única solución es x = 0, y = −1/3 ,z = −1/3. Ası́ pues, podemos tomar


V2 = (0, −1/3, −1/3, 1, 0).
De esta forma, la solución es:

(2, 0, −1, 0, 0) + Q < (−3/2, −1/6, 1/3, 0, 1), (0, −1/3, −1/3, 1, 0) >=
= (2, 0, −1, 0, 0) + Q < (−9, −1, 2, 0, 6), (0, −1, −1, 3, 0) >
o, dicho de otro modo,


 x = 2 − 9λ
 y = −λ − µ


z = −1 + 2λ − µ λ, µ ∈ Q
t = 3µ




w = 6λ

El método aplicado en el ejemplo es extensible a cualquier sistema de ecuaciones


lineales dando lugar al algoritmo que exponemos a continuación:

Algoritmo de resolución de sistemas de ecuaciones lineales


Sea AX = b con A ∈ m × n(K). Se hace:

1. Reducir por filas la matriz ampliada (A|b) llegando a una matriz (C|d).

2. a) Si rg(C|d) 6= rg(C), el sistema no tiene solución.


b) Si rg(C|d) = rg(C) = n, el sistema tiene una única solución y, además,
CX = d es un sistema triangular superior, resoluble yendo “de abajo a
arriba”.
c) Si rg(C|d) = rg(C) = r < n, el sistema posee infinitas soluciones que
podemos describir en la forma (t1 , . . . , tn ) + N (A) con (t1 , . . . , tn ) una
solución cualquiera del sistema y dim N (A) = n − r.
1) Para calcular la solución particular, sean xi1 , . . . xir las incógnitas
correspondientes a las r columnas que contienen los pivotes. Haciendo
cero el resto de incógnitas y resolviendo el sistema triangular inferior
regular que nos queda, obtenemos una solución particular.
5.6. SISTEMAS DE ECUACIONES LINEALES. 95

2) Para obtener n − r soluciones linealmente independientes de AX =


(0) procedemos de la siguiente forma:
Sean xj1 , . . . xjn−r las incógnitas correspondientes a las columnas no
ocupadas por los pivotes. Para cada k, resolvemos el sistema que
se obtiene al hacer xjk = 1 y el resto de las incógnitas cero en
AX = (0). Es fácil ver que las n−r soluciones del sistema homogéneo
ası́ obtenidas son linealmente independientes.

Ejemplo 5.44 Discutir y resolver, sobre el cuerpo de los números reales, el sistema

 (a + 2)x + y + z = a−1
ax + (a − 1)y + z = a−1
(a + 1)x + (a + 1)z = a − 1

La matriz ampliada es
 
a+2 1 1 a−1
 a a−1 1 a−1 
a+1 0 a+1 a−1
Para obtener un 1 en el lugar (1, 1) de la matriz, intercambiamos las columnas
primera y segunda, tomando nota del cambio de orden introducido de esta manera
en las incógnitas:

 y x z 
1 a+2 1 (a − 1)
 a−1 (5.5)
a 1 (a − 1) 
0 a+1 a+1 a−1

Restándole a la segunda fila la primera multiplicada por a − 1 se llega a

 y x z 
1 a+2 1 (a − 1)
 0 −(a + 3)(a − 2) 2 − a (5.6)
(a − 1)(2 − a) 
0 a+1 a+1 a−1

Llegados a este punto distinguimos dos casos:


Caso 1: a = −1.- En este caso, la matriz del paso anterior (5.6) es
 
1 1 1 −2
 0 6 3 −6 
0 0 0 −2
luego en este caso el sistema es incompatible.
96 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

Caso 2: a 6= −1.- Si a 6= −1, podemos dividir la tercera fila por a + 1 e intercambiar


posteriormente las filas segunda y tercera para obtener:

 yx z 
1 a+2 1 a−1
 0 a−1
1 1 a+1

0 −(a + 3)(a − 2) 2 − a (a − 1)(2 − a)

y, sumándole a la tercera fila la segunda multiplicada por (a + 3)(a − 2) se llega a


la matriz:

y x z
a−1
 
1 a+2 1
 

 0 a−1 
 1 1 a+1


 
−2(a−1)(a−2)
0 0 (a + 2)(a − 2) a+1
5.7. PROBLEMAS PROPUESTOS 97

5.7. Problemas propuestos


Problema 5.1 .- Probar que:
(AB)t = B t At
(AB)−1 = B −1 A−1
(At )−1 = (A−1 )t
Problema 5.2 .- Probar que las únicas matrices cuadradas que conmutan con todas
las demás son las matrices escalares, es decir, las matrices diagonales con el mismo
elemento en la diagonal.
Problema 5.3 .- Probar que el producto de matrices triangulares superiores (re-
spectivamente, inferiores) es una matriz triangular superior (respectivamente, infe-
rior). Asimismo, demostrar que la inversa de una matriz tringular superior (respec-
tivamente, inferior) regular es triangular superior (respectivamente, inferior).
2
Problema 5.4 .- Calcula B −1 , sabiendo que se cumple que 12 (B − I) = 21 (B −
I).
 
2 −1
Problema 5.5 .- Dada la matriz A = encontrar todas las matrices B
1 3
tales que AB = BA.
Problema 5.6 .- Demostrar que la relación definida en el conjunto de matrices
Mn (K) por:

A y B son equivalentes ⇐⇒ ∃ matrices regulares P y Q tales que P AQ = B


es una relación de equivalencia. Describir el conjunto cociente.
Problema 5.7 .- Calcular el rango de las siguientes matrices tanto sobre el cuerpo
de los números racionales como sobre Z5 :
 
1 2 3 0  
2 4 3 2 0 2 3 4
3 2 1 3 2 3 5 4
  
4 8 13 12
6 8 7 5
Problema 5.8 .- Según los valores de a y de b, discutir el rango de las matrices
racionales:
 
  1 b a b a+b+1
a+2 1 1 a−1 
2 3b a 2b 3a + 2b + 1 
 a a−1 1 a − 1  1 b 2a 2b

2b + 2 
a+1 0 a+1 a−1
1 2b 0 2b a + 2b
98 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

Problema 5.9 .- En clase de teorı́a se ha demostrado que, dada una matriz A ∈


Mm×n (K) con rango r, existen matrices regulares P y Q tales que:

P AQ = [Ir , 0].
Dar una algoritmo para el cálculo de tales matrices P y Q.
Problema 5.10 (Factorización LU) .- Demostrar que, dada una matriz A ∈
Mm×n (K), existen matrices L ∈ Mm (K) triangular inferior con 1K en la diago-
nal principal, U ∈ Mm×n (K) triangular superior y P matriz permutación4 tales que
P A = LU . Dar un algoritmo para el cálculo de dichas matrices L y U .
(Indicación: Téngase en cuenta que las matrices escalonadas por filas son triangu-
lares superiores.)
Problema 5.11 .- Calcular las inversas de las matrices racionales
 
  2 3 4 1
2 3 4 5 6
5 6 6  6 0 
3 1 2 2
3 1 2
3 5 6 7
Problema 5.12 .- Discutir, en función de los parámetros a y b, si las matrices de
coeficientes reales
  
a 2a 1 a 2b a + b
 3a −1 a + 2   4a 5b 2a + 2b 
−3 0 3 7a 8b 2a + 2b
son regulares y, en su caso, calcular la inversa.
Problema 5.13 .- En el conjunto de matrices simétricas de Mn (R) se considera la
siguiente relación:

A es congruente con B ⇐⇒ ∃P regular tal que P AP t = B


i) Demostrar que la relación anterior es una relación de equivalencia. Asimis-
mo demostrar que dos matrices congruentes tienen, necesariamente, el mismo
rango.
ii) Se puede probar que toda matriz simétrica A en Mn (R) es congruente a una
diagonal. Dando por hecho que la afirmación anterior es cierta, probar que
toda matriz simétrica en Mn (R) es congruente a una matriz diagonal D de la
forma:

D = diag[1, . . . , 1, −1, . . . , −1, 0 . . . , 0],


donde el número total de elementos no nulos de D es igual al rango de A.
4
Una matriz permutación es una matriz producto de matrices elementales de tipo 1.
5.7. PROBLEMAS PROPUESTOS 99

Problema 5.14 .- Calcular los siguientes determinantes:



n
n − 1 n − 2 ··· 3 2 1


0 1 1 · · · 1

1
n n − 1 ··· 4 3 2

2 1 n · · · 5 4 3

1 0 1 · · · 1

. . . . · · · · · · ...

..

1 1 0 · · · 1 ··· ···


.. . . .
. · · · · · · . . . .. .
.. ··· · · · · · · . . · · · ..


1 1 1 ··· 0
. . .
.. · · · · · · · · · . . ..

···

n − 1 n − 2 n − 3 ··· 2 1 n

1+x 1 · · · 1 1 a1 a2 · · · an−1
1 1
1 1 + x ··· 1 1 a2 a2 · · · an−1
2 2
.. . . .. .. ..
. ··· . . . ··· ··· ··· .
2 n−1

1 1 ··· 1 + x 1 an an · · · an

Problema 5.15 .- Dada la matriz cuadrada de talla n cuyo término (i, j) es 2 si


i 6= j e i si i = j, calcular su determinante.

Problema 5.16 .- Hacer lo mismo que en el ejercicio anterior con la matriz cuadra-
da de talla n cuyo cuyo término (i, j) es a si i 6= j y t si i = j.

Problema 5.17 .- Probar, usando el Teorema de Rouché–Fröbenius, que la inversa


de una matriz regular es única. (Nota: Interprétese la ecuación matricial como un
conjunto de sistemas de ecuaciones lineales).

Problema 5.18 .- Un sistema de ecuaciones lineales se dice sobredeterminado


si posee más ecuaciones que incógnitas y se dice infradeterminado si posee menos
ecuaciones que incógnitas. Dar un ejemplo de sistema sobredeterminado con solu-
ción única. ¿Podemos encontrar un sistema infradeterminado con solución única?
Explicar la respuesta.

Problema 5.19 .- Discutir y resolver, en su caso, los siguientes sistemas sobre el


cuerpo de los números racionales:

x+y+z+t=0


x−y−z+t=0


 −x −y+z+t=0
x − 3y + 5z + 9t = 0
4x − y + 2z + t = 0


2x + 3y − z − 2t = 0

 7y − 4z − 5t = 0

2x − 11y + 7z + 8t = 0
100 CAPÍTULO 5. MATRICES Y SISTEMAS DE ECUACIONES LINEALES

Problema 5.20 .- Idem sobre el cuerpo de los números reales.


( 2x − my + 4z = 0 ( mx + y + z + t = m
x + y + 7z = 0 x + my + z = 1
mx − y + 13z = 0 x + y + mz = 1
(m + 2)x + (m + 2)y + (m + 1)z = 2m + 2


x + my + z = 1

 mx + y + (m − 1)z = m

x+y+z =m+1


 (m + 2)x + (2m + 4)y + (3m + 6)z = 0
(m + 2)x + (m + 2)y + (3m + 6)z = −(m + 2)


 (m + 2)x + (3m + 6)y + (3m + 6)z = m + 2
(m + 2)x + (3m + 6)y + (4m + 5)z = 4m + 2

Problema 5.21 .- Idem según los valores de a sobre el cuerpo de los números
racionales.
2x + y − 4z = a + 1


−x + 5y − z = a − 12

 x + 6y − 5z = a + 2

2x − 4y + 5z = a
 ax + y + z + t = a

x + ay + z + t = a

 x + y + az + t = a

x + y + z + at = a

 (a + 2)x + y + z = a − 1
ax + (a − 1)y + z = a − 1
(a + 1)x + (a + 1)z = a − 1


 (4 − a)x + 2y + z = 0
2x + (4 − a)y + 2z = 0
2x + 4y + (8 − a)z = 0



 (4a + 12)x + (2a + 13)y + (2a + 6)z = 7 − a
(2a + 6)x + (4a + 5)y + (a + 3)z = 4a


 (2a + 6)x + (2a + 6)y + (a + 3)z = a + 3
(3a + 6)x + (2a + 6)y + (a + 3)z = 0

Problema 5.22 .- Discutir y resolver, en su caso, los sistemas sobre Z5 :


(x − y + z = 3
5x − 2y − z = 5
−3x − 4y + 3z = 1
( x + 2y − 5z + 4t = 5
2x − 3y + 2z + 3t = 0
4x − 7y + z − 6t = −5
Capı́tulo 6

Diagonalización de matrices

6.1. Introducción
6.1.1. Un ejemplo preliminar
Antes de plantearlo de manera general, estudiaremos un ejemplo que servirá para
situar el problema.
Supongamos que, en una ciudad, conviven tres fábricas de pan que controlan el
mercado de la venta de pan en régimen de oligopolio. A lo largo del tiempo, algunos
consumidores cambian de fábrica por diversas razones: publicidad, precio u otras.
Queremos modelizar y analizar el movimiento del mercado, asumiendo, para simpli-
ficar el modelo, que la misma fracción de consumidores cambia de una empresa a
otra durante cada perı́odo de tiempo (un mes, por ejemplo).
Supongamos que, al inicio del estudio, las tres empresas, que llamaremos 1, 2 y 3,
controlan las fracciones x0 , y0 y z0 del mercado respectivamente. Dada la situación
de oligopolio, se tendrá:

x0 + y0 + z0 = 1

Supongamos ahora que después de un mes, la empresa 1 ha conseguido mantener


una fracción a11 de los consumidores que tenı́a, atrayendo, además, una fracción a12
de los clientes de la empresa 2 y una fracción a13 de los clientes de la empresa 3. Si
el número de consumidores es fijo, digamos N , podemos escribir, donde x1 denota
la fracción del mercado controlada por 1 después del primer mes:

x1 N = a11 (x0 N ) + a12 (y0 N ) + a13 (z0 N )

Similares ecuaciones se obtendrán para las fracciones de mercado y1 y z1 controladas


por las empresas 2 y 3 respectivamente, ası́ que, dividiendo dichas ecuaciones por
N , se tendrá

101
102 CAPÍTULO 6. DIAGONALIZACIÓN DE MATRICES


 x1 = a11 x0 + a12 y0 + a13 z0
y1 = a21 x0 + a22 y0 + a23 z0
z1 = a31 x0 + a32 y0 + a33 z0

donde aii representa la fracción de los consumidores de la empresa i mantenidos por


i y aij la fracción de los consumidores de la empresa j atraı́dos por la empresa i. En
términos matriciales, tenemos
  
x1 x0
X1 = AX0 , donde X1 =  y1  X0 =  y0  A = (aij )
z1 z0
Sobre la matriz A se puede decir:

0 ≤ aij ≤ 1

La suma de los elementos de cada columna es igual a 1, es decir, a1i +a2i +a3i =
1 para i = 1, 2 y 3.

Si, como asumimos al principio, las fracciones de clientes que cambian de una em-
presa a otra cada mes se mantienen constantes, y llamamos xr , yr y zr las fracciones
controladas por 1, 2 y 3 en el mes r desde el comienzo del estudio, se tiene:
   
xr+1 xr
 yr+1  = A  yr 
zr+1 zr
y, en consecuencia,
   
xr+1 x0
 yr+1  = Ar+1  y0 
zr+1 z0
Es claro, intuitivamente que para cualquier r, xr + yr + zr = 1, propiedad que
probaremos por inducción sobre r. Para r = 0, la propiedad es cierta. Si la propiedad
es cierta para r, se tiene:
     
xr+1 xr xr
( 1 1 1 ) yr+1 = ( 1 1 1 ) A yr = ( 1 1 1 ) yr  = 1
    
zr+1 zr zr
donde la última igualdad es cierta por la hipótesis de inducción.
Resumiendo lo visto anteriormente, el análisis de este mercado implica el cálculo de
potencias (posiblemente, grandes) de A.
6.1. INTRODUCCIÓN 103

Ejemplo 6.1 Como matriz A del modelo anterior tomemos


 4 1 1

5 5 10
 
 1 7 3

A=
 10 10 10


 
1 1 3
10 10 5

y supongamos que queremos saber cuál será la fracción de mercado controlada por
cada empresa dentro de veinte años. Esto implicarı́a el cálculo de A240 . El cálculo
de dicha potencia se simplifica enormemente sabiendo que las matrices

1 −1 79
   1 
2
0 0
   
   3

P =  −2
 1 1  y D= 0 5 0 
 

   
4
1 0 7 0 0 1
verifican que A = P DP −1 , ya que A240 = P D240 P −1 y

1 240
  
2
0 0
 
 
D 240
= 3 240
.

 0 5
0 
 
0 0 1

6.1.2. Planteamiento general del problema


El ejemplo anterior pone de manifiesto la necesidad de calcular grandes potencias
de matrices. Del mismo modo, queda claro que dicha labor se simplifica supuesta la
existencia de una matriz regular P que convierte a la matriz dada en diagonal. En
consecuencia, se define:

Definición 6.2 Dada una matriz cuadrada A ∈ Mn (K), se dice diagonalizable


si existen una matriz diagonal, D = diag[d1 , . . . , dn ], y una matriz regular, P ∈
Mn (K), tales que:

A = P DP −1 .

Habitualmente, se dice que dos matrices A y B en Mn (K) son semejantes si, y


sólo si, existe una matriz regular tal que P −1 AP = B. De este modo, se tiene que
una matriz cuadrada es diagonalizable si, y sólo si, es semejante a una diagonal.
A partir de este momento, estudiaremos cómo saber si una matriz es diagonalizable
y, en su caso, cómo calcular las matrices diagonal y regular correspondientes.
104 CAPÍTULO 6. DIAGONALIZACIÓN DE MATRICES

6.2. Algoritmo de diagonalización


Supongamos dada una matriz diagonalizable A y sean D = diag[d1 , . . . , dn ] y P
regular tales que P −1 AP = D. En este caso, podemos reescribir esta igualdad en la
forma:

AP = P diag[d1 , . . . , dn ].

Ası́ pues, la columna j−ésima de P debe ser una solución del sistema homogéneo

(di I − A)X = (0), (6.1)

lo que, por otro lado, implica det(di I − A) = 0. Como la matriz P es regular, sus
columnas forman una base de K n formada por soluciones de sistemas de la forma
6.1. Estas consideraciones previas nos llevan a introducir los conceptos recogidos en
la siguiente definición:

Definición 6.3 Sea A una matriz de talla n sobre K.

i) Se dice polinomio caracterı́stico de A al polinomio pA (λ) = det(λIn − A).

ii) Se llama valor propio a cualquiera de las raı́ces del polinomio caracterı́stico.

iii) Se dice vector propio asociado al valor propio λ a un vector no nulo v que
verifique Av = tv; es decir, un vector de la nulidad de la matriz tI − A.

La traducción de la discusión anterior al nuevo lenguaje introducido nos permite


enunciar el siguiente resultado:

Proposición 6.4 Una matriz cuadrada es diagonalizable sobre K si, y sólo si, existe
una base de K n formada por vectores propios de A.

Ejemplo 6.5 Sea A la matriz dada por


 
1 0 0
A= 0 3 1 
0 4 2
Su polinomio caracterı́stico es λ3 − 6λ2 + 7λ − 2 cuyas raı́ces son:
1 √  1 √ 
λ1 = 1, λ2 = 5 + 17 , λ3 = 5 − 17 .
2 2
Resolviendo los correspondientes sistemas, se obtiene que una base de vectores pro-
pios viene dada por:
6.2. ALGORITMO DE DIAGONALIZACIÓN 105

√  √ 
   
1 1
v1 = (1, 0, 0), v2 = 0, 1, −1 + 17 v3 = 0, 1, −1 − 17
2 2
siendo el vector vi vector propio asociado a λi para i = 1, 2, 3.
En consecuencia, si

   
1 0√  0 1 0 0
1 0 1 1
D=  0 2
5 + 17 0√   y P = 
√ √

1 1 17 1 17
0 0 2
5 − 17 0 −2 + 2
−2 − 2

se tiene A = P DP −1 .

El ejemplo anterior pone de manifiesto que el hecho de que una matriz sea diago-
nalizable depende fuertemente del cuerpo sobre el que se trabaje. Ası́, la matriz del
ejemplo es diagonalizable sobre R pero no sobre Q. Del mismo modo, la matriz
 
0 −1
1 0
es diagonalizable sobre C pero no sobre R.

Proposición 6.6 Dos matrices semejantes poseen el mismo polinomio caracterı́sti-


co.

Demostración.– Sean dadas dos matrices semejantes A y B, y sea P una matriz


regular P tal que B = P −1 AP . Entonces,

pB (λ) = det(λIn − B) = det(λIn − P −1 AP ) = det(P (λIn − P −1 AP )P −1 ) =

= det(λIn − A) = pA (λ).

Observación 6.7 El recı́proco a la Proposición


  anterior no es, en general, cierto
1 1
como lo el hecho de que las matrices e I2 tengan el mismo polinomio
0 1
caracterı́stico, pero que no sean semejantes.

De la discusiones anteriores, y en particular de la Proposición 6.4, para saber si


una matriz es diagonalizable, buscaremos los valores propios, esto es, las raı́ces en
K del polinomio caracterı́stico, digamos, d1 , . . . , dr y resolveremos los r sistemas
homogéneos (di I − A)X = (0). Si podemos construir, por columnas, una matriz
regular P , se tendrá:
106 CAPÍTULO 6. DIAGONALIZACIÓN DE MATRICES

P −1 AP = diag[d1 , . . . , d1 , . . . , dr , . . . , dr ]
Naturalmente, puesto que la matriz P debe ser regular, sus columnas deben formar
una familia libre, por lo que las soluciones de los sistemas (di I − A)X = (0) deben
cumplir la misma condición. El problema en la construcción de P , puede venir por
dos razones:

1. Al yuxtaponer los vectores columnas obtenidos de dos sistemas distintos de la


forma (di I − A)X = (0) resultan no ser linealmente independientes.
2. El número de columnas obtenidas de esa manera es inferior a la talla de la
matriz inicial A.

La primera de las razones esgrimidas con anterioridad no es problema, como se en-


carga de demostrar el siguiente resultado (que se puede parafrasear diciendo que
vectores propios asociados a valores propios distintos son linealmente independi-
entes):

Proposición 6.8 Sean {d1 , . . . , dr } los valores propios de A y para cada i, sea S i
un vector propio asociado a di . Entonces, la familia {S 1 . . . , S r } es una familia libre.

Demostración.– Razonaremos por inducción sobre r (el número de valores propios


distintos), siendo el caso r = 1 obvio.
Supongamos, ahora, r ≥ 2 y sea la c.l.

t1 S 1 + · · · + tr S r = (0) (6.2)
Multiplicando por A, se tiene

t1 S 1 + · · · + tr S r = (0) (6.3)
Del mismo modo, multiplicando 6.2 por dr se obtiene

t1 dr S 1 + · · · + tr dr S r = (0) (6.4)
Restando las igualdades 6.3 y 6.4

t1 (d1 − dr )S 1 + · · · + tr−1 (dr−1 − dr )S r−1 = (0)


Ahora, dado que dj 6= dr , los vectores (dj −dr )S j son soluciones de (dj I −A)X = (0)
y, por hipótesis de inducción, son linealmente independientes. Por lo tanto, t1 = · · · =
tr−1 = 0K y sustituyendo en 6.2, se tiene que también tr = 0K .
6.2. ALGORITMO DE DIAGONALIZACIÓN 107

Observación 6.9 Dada una matriz A y un valor propio de la misma, d, designare-


mos por S(d) a la nulidad de la matriz dI − A.

Se tiene, por lo tanto:

Corolario 6.10 Sea {d1 , . . . , dr } el conjunto de valores propios de una matriz A ∈


Mn (K). Entonces,
r
X
dimS(dj ) ≤ n
i=1

Corolario 6.11 Sea A una matriz cuadrada de talla n sobre K y {d1 , . . . , dr } el


conjunto de valores propios de A. Entonces, son equivalentes:

i) A es diagonalizable
r
P
ii) dimS(dj ) = n
i=1

r
P
iii) n − rg(dj I − A) = n
i=1

Estamos en condiciones de dar un algoritmo para la diagonalización de una matriz


cuadrada:

entrada : A ∈ Mn (K)
(1) Calcular las raı́ces del polinomio det(λIn − A).
Si no existen raı́ces, escribir la matriz A no es diagonalizable sobre K.
FIN
Sean (d1 , . . . , dr ) las raı́ces en K de det(λIn − A).
(2) Para cada j calcular mj := n − rg(dj In − A).
Pr
(3) Si mj < n, escribir la matriz A no es diagonalizable sobre K. FIN
i=1
m
(4) Si no, para cada j calcular una base, Pj1 , . . . , Pj j de la nulidad de la matriz
dj In − A.
(5) Devolver P = [P11 , . . . , P1m1 , . . . , Pr1 , . . . , Prmr ] y D = diag[d1 , . . . , d1 , . . . , dr , . . . , dr ].

Algoritmo de diagonalización.
108 CAPÍTULO 6. DIAGONALIZACIÓN DE MATRICES

6.3. Problemas propuestos


Problema 6.1 .- Demostrar que la relación de semejanza entre matrices de Mn (K)
es una relación de equivalencia.

Problema 6.2 .- Sea A = (aij ) ∈ Mn (K) una matriz que verifica que
n
X
aij = 1
i=1

para todo j ∈ {1, . . . , n}. Demostrar que 1 es valor propio de A.

Problema 6.3 .- Probar que si t es valor propio de A, tk lo es de Ak .

Problema 6.4 .- Probar:

a) A y At poseen mismo polinomio caracterı́stico.

b) Sea A una matriz antisimétrica. Entonces, se tiene que λ es valor propio de A


si, y sólo si, −λ es valor propio de −A.

c) A es regular si, y sólo si, 0 es valor propio de A.

d) Si A es antisimétrica y de orden impar, 0 es valor propio de A

Problema 6.5 .- Sea A la matriz real


 
3 −2 a
A =  −1 a 1 .
1 2 3
Probar que la matriz posee un valor propio real independientemente del valor del
parámetro a.

Problema 6.6 .- Sea


 
4 1 2
A =  −2 1 −2  .
−2 −1 0
¿Es diagonalizable A sobre Z5 ? En caso de respuesta afirmativa, diagonalizarla.

Problema 6.7 .- Calcular los vectores y valores propios de la matriz de orden n


cuyos términos son 1K , salvo los de la diagonal principal que valen 0K . Probar que
A es diagonalizable y diagonalizarla, es decir, encontrar una matriz P regular tal
que P −1 AP es diagonal.
6.3. PROBLEMAS PROPUESTOS 109

Problema 6.8 .- ¿Se puede diagonalizar la matriz real


 
cos α −sen α
0 ≤ α < π?
sen α cos α
¿Y vista como matriz compleja? En los casos de respuesta afirmativa, diagonalizarla.

Problema 6.9 .- Sea A ∈ Mn (K). Probar que si posee n valores propios distintos
(en K) es diagonalizable sobre K.

Problema 6.10 .- Probar que si A y B son matrices cuadradas, AB y BA poseen


los mismo valores propios.

Problema 6.11 .- Consideremos la matriz racional


 
0 a 1 b
 0 1 0 1 
A=  0 0 −1 a2 

0 0 0 3

a) Explicar, sin hacer ninguna cuenta, por qué la matriz A es siempre diag-
onalizable sobre Q, independientemente de los valores de los parámetros a y
b.
b) Diagonalizar A.

Problema 6.12 .- Estudiar si las siguientes matrices son diagonalizables sobre R


y, en su caso, diagonalizarlas:
 
  1 −9 8 2
12 10 0  0 3 −1 0 
A=  10 8 0  , B =   0

0 2 0 
1 1 3
−1 −8 7 4
   
−2 12 −15 2 1/9 −3
C= 1 5 5  , D =  0 2/3 0 
0 0 1 0 1/18 1/2
Problema 6.13 .- Estudiar si las matrices del ejercicio anterior son diagonalizables
sobre C y sobre Z5 .

Problema 6.14 .- Estudiar en función de los parámetros a, b, c si las matrices


siguientes son diagonalizables:
 
  0 0 0 0
1 0 0  a 0 0 0 
A =  a b 0 , B =   0 b 0 0


1 c b
0 0 c 0
110 CAPÍTULO 6. DIAGONALIZACIÓN DE MATRICES

   
2a − 1 1 − a 1 − a 1 0 0
C = a−1 1 1 − a , D =  a 1 0 
a−1 1−a 1 b c 2

Problema 6.15 .- Calcular, usando diagonalización de matrices, el término general


de la sucesión recurrente definida por

u0 = 1, u1 = 2,
un+1 = 3un − 2un−1 , si n ≥ 1.

Problema 6.16 .- Resolver cada uno de los sistemas de ecuaciones diferenciales


ordinarias lineales que tienen por matriz de coeficientes las matrices del Ejercicio
6.12 que sean diagonalizables sobre los reales.
Capı́tulo 7

Espacios vectoriales y aplicaciones


lineales

7.1. Espacios vectoriales


Definición 7.1 Se dice espacio vectorial sobre un cuerpo K1 a un grupo abeliano
(V, +) dotado de una operación externa:

K ×V −→ V
(t, v) 7−→ tv
que verifica:

i) t(v + w) = tv + tw, ∀t ∈ K ∀v, w ∈ V .

ii) (t + s)v = tv + sv ∀t, s ∈ K ∀v ∈ V

iii) t(sv) = (ts)v ∀t, s ∈ K ∀v ∈ V

iv) 1K v = v ∀v ∈ V

7.2. Aplicaciones lineales


7.3. Códigos correctores de errores
7.4. Problemas propuestos

1
también llamado K−espacio vectorial.

111