You are on page 1of 32

CAPÍTULO 5

Inversa generalizada e inversa condicional de matrices�
Este capítulo consta de cuatro secciones. Las dos primeras versan sobre la definición, propiedades y cálculo de la inversa generalizada de una matriz. La tercera sección trata sobre la definición y el cálculo de inversas condicionales de una matriz. En la última sección se verán algunas aplicaciones de la inversa generalizada y de la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimos cuadrados.

5.1.

Inversa generalizada de una matriz

La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]). Antes de dar la definición de inversas generalizada de una matriz, veamos un par de teoremas que serán útiles en el desarrollo del resto del capítulo. 5.1. Teorema. Si A es una matriz m × n de rango r > 0� entonces existen matrices invertibles Pm×m y Qn×n tales que P AQ es igual a: 1. 2. 3. » Ir � Ir � Ir – � � – si r < n y r < m.

» ˆ

si r = n < m. � ˜ si r = m < n .

4. Ir si r = n = m. Demostración� Se hará aquí sólo la demostración del inciso (1). Si R es la forma escalonada reducida de A� entonces R = P A� P es un producto de matrices elementales, (véase el apartado 1.7). Las últimas m − r filas de R son nulas y R tienen la estructura siguiente: 2 6 6 6 6 6 4 0 0 0 . . . 0 ··· ··· ··· ··· 0 0 0 . . . 0 1 0 0 . . . 0 a1k 0 0 . . . 0 ··· ··· ··· ··· 0 1 0 . . . 0 a1k� a2k� 0 . . . 0 ··· ··· ··· 0 a1k�� a2k�� 0 . . . 0 0 1 . . . 0 a1k��� a2k��� a3k��� . . . 0 ··· ··· ··· ··· 3 7 7 7 7 7 5

ahora bien, efectuando las operaciones elementales sobre las columnas de la matriz R se obtiene
99

5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional

F =

»

Ir �

� �

Así que F = RQ� donde Q es un producto de marices elementales (por columnas). Por lo tanto; F = RQ = P AQ, donde P y Q son matrices invertibles. �

5.2. Ejemplo. Considere la matriz 1 A = 4 −1 2 2 2 −2 4 1 0 2 3 3 −2 5 6

claramente las dos primeras filas son linealmente independientes, y la tercera es un múltiplo escalar de la primera fila de A. por lo tanto, el número máximo de filas linealmente independientes de A es 2; o sea, A tiene rango 2. Por el teorema anterior existen matrices invertibles P y Q tales que » I2 � � � – 1 =4 0 0 2 0 1 0 0 0 0 3 0 0 5. 0

P AQ =

Ahora se procede a calcular las matrices invertibles P y Q siguiendo las pautas de la demostración del teorema anterior.

Paso 1: Se encuentra una matriz invertible P tal que P A = R, donde R es la forma escalonada reducida de A. 1 4 −1 2 2 1 4 0 0 2 1 4 0 0 2 2 −2 4 2 0 0 2 0 0 1 1 0 0 1 0 1 0 2 3 1 0 2 1 0 3 −2 6 1 1 −2 0 1 −2 1 0 0 0 1 0 −1 1 0 0 1 0 3 0 0 5 1 3 0 0 5 1

[ A | I3 ]

=

f ilas

f ilas

3 0 0 5 = [ R | P ]. 1

Paso 2: Se encuentra una matriz invertible Q tal que RQ = F� donde F = » I2 � 100 � � – .

Inversa generalizada e inversa condicional 2 6 6 6 4 1 0 0 1 0 0 1 0 0 1 0 0 2 0 0 0 1 0 0 1 0 0 1 0 0 1 0 2 0 0 0 0 0 0 0 0 2 1 0 2 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 −2 1 0 0 −2 1 0 0 0 0 0 1 0 0 0 1 3 7 7 7 5 3 7 7 7 5

5.1. G-Inversa y C-inversa

[ R | I4 ]

=

col.

2 6 6 6 4 2 6 6 6 4 2 6 6 6 4

col.

−2 0 0 1 −2 0 −1 1

3 7 7 7 5 3 7 7 7 5

col.

= Las matrices invertibles

[ F | Q ].

son tales que:

0 P =4 1 −2

2

−1 1 0

3 0 0 5 1 » I2 � � �

y

1 6 0 6 Q=4 0 0 1 =4 0 0 2 0 1 0 0 0 0

2

0 0 1 0

−2 1 0 0

3 −2 0 7 7 −1 5 1

P AQ =

5.3. Teorema. Si A es una matriz m × n de rango r > 0� entonces existen matrices Bm×r y Cr×n , de rango r, tales que A = B · C. Demostración� Considere distintas posibilidades para rango de la matriz A, ρ�A) = r. 1. Si r = m� entonces A = BC , donde B = Ir y C = A. 2. Si r = n� entonces A = BC , donde B = A y C = Ir . 3. Si r < n y r < m� entonces por el teorema 5.1(1) existen matrices invertibles P y Q tales que: – » Ir � . P AQ = � � De aquí que: A = = = P −1 P −1 BC� » » Ir � Ir � � � – ˆ – Q−1 � ˜ Q−1

3 0 0 5. 0

Ir

101

5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional

El teorema queda entonces demostrado.

donde B ∈ �m×r y C ∈ �r×n son las matrices de rango r, dadas por – » ˆ ˜ Ir y C = Ir � Q−1 . B = P −1 � �

Una forma de calcular las matrices B y C que aparecen en el teorema anterior, en el caso en que r < n y r < m� tal como aparece en la demostración, es calculando primero las matrices invertibles P y Q tales que: – » Ir � � P AQ = � � después calcular las matrices P −1 y Q−1 , y por último obtener: – » ˆ Ir B = P −1 y C = Ir � � ˜ Q−1 .

Para el caso en que la matriz A no sea de rango fila completo, existe una demostración alternativa, la cual presentamos a continuación. Como veremos, esta demostración facilitará un algoritmo más económico para calcular matrices B y C adecuadas. Demostración� [Otra prueba del teorema 5.3 para r < m] Suponga que A es una matriz de rango r < m. Sea P una matriz invertible de orden m tal que P A = R, donde R es la forma escalonada reducida de A (véase apartado 1.7). Puesto que r < m, R tiene la estructura siguiente: 2 3 C 5� R=4 � donde C es una matriz r × n de rango r. Ahora, si escribimos P −1 particionada adecuadamente ˆ ˜ D � P −1 = B donde B es una matriz m × r de rango r. Dado que P A = R se tiene A = P −1 R ˆ B = = D ˜ 2 4 C � 3 5 � Ahora se presenta a continuación un método basado en esta demostración para calcular matrices B y C , de rango r� tales que A = BC . 5.4. Algoritmo. Considere una matriz A de tamaño m × n Paso 1 Forme la matriz [ Am×n | Im ] . Paso 2 Efectúe operaciones elementales en las filas de A hasta obtener su forma escalonada reducida, y en las columnas de Im , siguiendo las siguientes pautas: i) Si se intercambian las filas i y j de A� entonces intercambie las columnas i y j de Im . ii) Si se multiplica la i-ésima fila de A por el número α �= 0, entonces se multiplica la i-ésima columna de Im por el número α−1 . 102

BC

Inversa generalizada e inversa condicional

5.1. G-Inversa y C-inversa

iii) Si a la j -ésima fila de A se le suma α veces la i-ésima fila de A (α �= 0), entonces a la i-ésima columna de Im se le suma �−α) veces la j -ésima columna de Im . Al final de este paso se obtiene la matriz [ R | P −1 ] ˆ ˜ Paso 3 B = Primeras r columnas de P −1 , C = [Primeras r filas de R]. 5.5. Ejemplo. La matriz del ejemplo 5.2 1 A = 4 −1 2 2 2 −2 4 1 0 2 3 3 −2 5 6

tiene rango 2. Existen por lo tanto matrices B3×2 y C2×4 de rango 2 tales que A = BC. Las matrices B y C se pueden ahora calcular siguiendo los pasos indicados anteriormente. 3 2 1 2 1 3 1 0 0 [ A | I3 ] = 4 −1 −2 0 −2 0 1 0 5 2 4 2 6 0 0 1 2 3 1 2 0 2 1 1 0 → 4 0 0 1 1 −1 0 0 5 0 0 0 0 2 2 1 = [ R | P −1 ] .

Así, tomando las primeras 2 columnas de R y las 2 primeras filas de P −1 se obtiene respectivamente las matrices 2 3 » – 1 1 1 2 0 2 4 −1 0 5 B= y C= � 0 0 1 1 2 2 las cuales tienen rango 2 y son tales que: 2 3 – 1 1 » 1 2 0 2 BC = 4 −1 0 5 0 0 1 1 2 2 2 3 1 2 1 3 = 4 −1 −2 0 −2 5 = A . 2 4 2 6

5.6. Definición (Inversa generalizada o pseudoinversa). Sea A una matriz m × n. Si M es una matriz n × m tal que: 1. 2. 3. 4. AM es una matriz simétrica. M A es una matriz simétrica. AM A = A . M AM = M�

entonces se dice que M es una inversa generalizada (pseudoinversa) de A� o simplemente que M es una g-inversa de A. 2 3 » – 3 −7 1 4 1 1 2 2 −1 5 es una g-inversa de la matriz A = . 5.7. Ejemplo. Verifique que la matriz M = −1 0 1 11 3 4 En efecto, 103

5.1. G-Inversa y C-inversa 1. AM = 2. M A = 1 11 » 11 0 10 3 −1 0 11 3 2 3 – = I2 es una matriz simétrica. 3 −1 3 5 es una matriz simétrica. 10 3 −7 −1 5 . 4

Inversa generalizada e inversa condicional

3. AM A = I2 A = A .

1 4 11

2

5.8. Observación.

2 3 1 4 2 4. M AM = M I2 = 11 3

1. Si A es invertible, entonces la matriz A−1 es una g-inversa de A. 2. Si A = �m×n � entonces la matriz M = �n×m es una g-inversa de A. 5.9. Teorema (Existencia de una g-inversa). Toda matriz A de tamaño m × n tiene una inversa generalizada. Demostración� De acuerdo con la observación 5.8(2), la demostración es trivial en el caso en que A = �. Suponga ahora que que A �= � tiene rango r > 0. Por el teorema 5.3, existen matrices B de tamaño m × r y C de tamaño r × n, ambas de rango r tales que A = BC. Puesto que B y C tiene rango r, las matrices B T B y CC T son invertibles (véase el teorema 1.56). Finalmente, se considera la matriz ` ´−1 ` T ´−1 T M = C T CC T B . B B El resultado quedará comprobado, se se verifica que M es una g-inversa de A. Es decir, si se verifica que se satisfacen las condiciones de la definición 5.6. En efecto: Las matrices AM y M A son simétricas puesto que ` ´−1 T ` ´−1 ` T ´−1 T AM = BCC T CC T B = B BT B B B B y

` ´−1 ` T ´−1 T ` ´−1 M A = C T CC T B BC = C T CC T C B B ` T ´−1 T B BC = BC = A� y De otro lado, AM A = B B B ` ´−1 ` ´−1 ` T ´−1 T M AM = C T CC T CC T CC T B B B ` ´−1 ` T ´−1 T = C T CC T B = M. B B Es decir, AM A = A y M AM = A, por lo tanto, M es una g-inversa de A. 5.10. Teorema. [Unicidad de la g-inversa]Toda matriz A tiene una única g-inversa.

Demostración� Supongamos que M1 y M2 son dos g-inversas de una matriz A. Utilizando la definición de g-inversa de una matriz se obtiene la cadena siguiente de igualdades: AM2 = = M1 �AM1 A)M2 = �AM1 )�AM2 ) = �AM1 )T �AM2 )T ��AM2 )�AM1 ))T = ��AM2 A)M1 )T = �AM1 )T = AM1 . = = M1 AM1 = �M1 A)M1 = �M2 A)M1 = M2 �AM1 ) M2 �AM2 ) = M2 AM2 = M2 . 104

De aquí que AM2 = AM1 . En forma análoga se obtiene que M2 A = M1 A. Por lo tanto

Inversa generalizada e inversa condicional

5.1. G-Inversa y C-inversa �

5.11. Nota. En lo sucesivo, la g-inversa de una matriz la se denotará con el nombre de la matriz y con el signo + como exponente. Por ejemplo, por A+ � B + denotarán respectivamente las inversas generalizadas de las matrices A y B . 5.12. Teorema (Propiedades de la g-inversa). Para cualquier matriz A tiene que: a) b) c) d) e) �A+ )+ = A. �αA)+ = α−1 A+ � para todo escalar α �= 0. �AT )+ = �A+ )T �AAT )+ = �AT )+ A+ �AT A)+ = A+ �AT )+

Demostración� Por el teorema anterior, toda matriz tiene una única g-inversa. Sólo resta verificar en cada caso, que se satisfacen las condiciones de la definición 5.6. Para ello se hará la demostración sólo para el inciso (e) suponiendo, que las afirmaciones (a)-(d) son válidas (las verificaciones quedan a cargo del lector) y se aplicarán las propiedades de la definición 5.6: ´` ´ ` 1. Inicialmente se verifica que la matriz AT A A+ �AT )+ es simétrica, para ello se muestra que ` ´ para la matriz M = A+ �AT )+ se satisface la igualdad AT A M = A+ A. En efecto: ” ” “ ”“ “ = AT A A+ �AT )+ AT A M
�c)

=

AT �AA+ )�A+ )T

AT �AA+ )T �A+ )T ` + ´T = A AA+ A+ def. ` + ´T = A A = A+ A . ` + T +´ ` T ´ A A es simétrica, para ello muestra como antes, de 2. Ahora se verifica que la matriz A �A ) ` ´ que la matriz M = A+ �AT )+ satisface la igualdad M AT A = A+ A. En efecto: ”“ ” “ ” “ = A+ �AT )+ AT A M AT A
�c)

def. =

=

A+ �A+ )T AT A

def. = def. =

A+ �AA+ )T A def. A+ AA+ A = A+ A.

3. La matriz M = A+ �AT )+ satisface la igualdad �AT A)M �AT A) = AT A. ”“ “ ”“ ” AT A A+ �AT )+ AT A �AT A)M �AT A) = ` + ´“ T ” �1) = A A A A = �A+ A)T AT A = ` 105

´T def. ` ´T A�A+ A) A = AA+ A A = AT A.

5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional

4. La matriz M = A+ �AT )+ satisface la igualdad M �AT A)M = M. En efecto ”“ ” “ ”“ = A+ �AT )+ AT A A+ �AT )+ M �AT A)M = M ` + ´ “ + T +” �2) = A A A �A ) ` + ´ “ ”+ = A AA+ AT def. = A+ �AT )+ . � 5.13. Observación. No siempre es cierto que �AB )+ = B + A+ . Para mostrar este hecho basta considerar un ejemplo (ver ejemplo siguiente). » – ˆ ˜ 1 5.14. Ejemplo. Si A = 1 1 y B = � entonces AB = [3]. Por lo tanto �AB )+ = 1/3. De acuerdo 2 » – ˆ ˜ 1 1 2 , de donde se tiene que y B+ = 1 con el corolario 5.16, A+ = 1 2 5 1 » – ˜1 1 1 1ˆ 1 2 = [3] = [3/10] �= [3] = �AB )+ . B + A+ = 5 2 1 10

5�1 Ejercicios
En los ejercicios 1 al 9, responda verdadero o falso justificando su respuesta. 1. 2. 3. 4. 5. 6. 7. 8. Si las matrices B ∈ �m×r y C ∈ �r×m tienen el mismo rango, entonces �BC )+ = C + B + . Si S es una matriz simétrica, entonces S + es una matriz simétrica. Si S es una matriz simétrica tal que S 2 = S� entonces S + = S . Si S es una matriz simétrica tal que S 3 = S� entonces S + = S . Para toda matriz A se tiene que A+ = �AT A)+ AT . Para toda matriz A se tiene que A+ = AT �AAT )+ . Para toda matriz A se tiene que �AA+ )2 = AA+ y �A+ A)2 = A+ A. Si A ∈ �m×n tiene rango m� entonces el sistema de ecuaciones lineales Ax = y tiene solución para cualquier y ∈ �m×1 . 9. Si A ∈ �m×n tiene rango n y si el sistema de ecuaciones lineales Ax = y tiene solución, entonces el sistema tiene solución única.

En los ejercicios 10 al 21 demuestre la afirmación correspondiente entonces BC + = � y CB + = �. 10. Si BC T»= �, – ˆ ˜ B C+ . 11. Si A = y BC T = � entonces A+ = B + C ˆ 12. Si B es una matriz simétrica m×m y si C T B = �� donde C T es la matriz C T = 1 entonces la g-inversa de la matriz: – » B A= T C ˆ + ˜ + 1/m C . es A = B 106

1

···

1

˜

1×m

Inversa generalizada e inversa condicional

5.2. Cálculo de la g-inversa

13. Si D = [dij ]n×n es una matriz diagonal, entonces D+ =[aij ]n×n es una matriz diagonal, donde ( si dii �= 0 1/dii , aij = . 0 � si dii = 0 – » + » – B � B � . 14. Si A = entonces A+ = � C+ � C + + 15. Si S es una matriz simétrica, entonces SS = S S. 16. Si A es una matriz tal que AT A = AAT � entonces A+ A = AA+ . 17. Si A es una matriz m × n, donde �A�ij = 1 para i = 1� 2� . . . � m y j = 1� 2� . . . � n� entonces 1 A+ = A. mn 18. Si P ∈ �n×n y Q ∈ �m×m son matices ortogonales, entonces para cualquier matriz m × n� A, se tiene que �P AQ)+ = QT A+ P T . 19. Si S es una matriz simétrica no negativa, entonces S + es una matriz no negativa. 20. Para cada matriz m × n� A; AB = AA+ sii B es tal que ABA = A y AB es simétrica. 21. Si B es una c-inversa de A� entonces la matriz BAB también lo es.

5.2.

Cálculo de la g-inversa de una matriz

En esta sección se verán algunos teoremas que pueden usarse para calcular la g-inversa de una matriz. Empezamos con el siguiente resultado, el cual se deduce de los teoremas 5.3, 5.9 y 5.10. 5.15. Teorema. Sea A una matriz m × n de rango r > 0. 1. 2. 3. 4. Si Si Si Si y r = n = m, entonces A es invertible y A+ = A−1 . ` ´−1 . r = m < n, entonces A+ = AT AAT ` ´ −1 T r = n < m, entonces A+ = AT A A . r < n y r < m, entonces existen matrices B ∈ �m×r y C ∈ �r×n de rango r tales que A = B · C ` ´−1 ` T ´−1 T B . B B A+ = C T CC T

5.16. Corolario. Sea a un vector no nulo de n componentes. ` ´−1 T 1. Si a ∈ �1×n � entonces a+ = aaT a . ` T ´−1 T + 2. Si a ∈ �n×1 � entonces a = a a a . » 1 1 1 −1 A+ 2 3 –

5.17. Ejemplo. Ilustre el teorema 5.15 con alguna matrices sencillas. 1. La matriz A = 2. La matriz A = » – 3 −2 es invertible, así que A+ = A−1 = . −1 1 – 2 3 tiene rango 2, así que: −1 1 2 3 » – 1 −1 1 3 0 T` T ´−1 = A AA = 4 2 −1 5 42 0 14 3 1 2 3 3 −14 1 4 6 −14 5 = 42 9 14 107

»

5.2. Cálculo de la g-inversa 1 3. La matriz A = 4 3 5 A+ 2 3 2 4 5 tiene rango 2, así que: 6 » ` T ´−1 T 1 56 = A A A = 24 −44 » – 1 −32 −8 16 = 26 8 −10 24 1 A = 4 −1 2 2 2 −2 4 1 0 2

Inversa generalizada e inversa condicional

−44 35

–»

1 2

3 4

5 6

4. La matriz A dada por

son tales que A = BC. Luego

Del ejemplo 5.5 se sabe ρ�A) = 2 y que las matrices 2 3 » 1 1 1 B = 4 −1 0 5 y C= 0 2 2 A+ =

3 3 −2 5 6 2 0 0 1 2 1 –

` ´−1 ` T ´−1 T C T CC T B . B B −2 1 6 6 −4 24 4 9 5 2 −20 −40 55 15 3 −4 −8 7 7 18 5 10

=

5. Para la matriz A =

ˆ

1

2 a
+

3

˜ =

�= � se tiene que:

3 1 6. La matriz A = 4 1 5 �= � se tiene que, 1 “ ”−1 ˜ 1ˆ 1 1 1 . aT a aT = a+ = 3 5.18. Teorema. Sea A ∈ �m×n una matriz de rango r > 0. Entonces la g-inversa de A se puede calcular siguiendo los pasos dados a continuación: 1. Calcule M = AT A. 2. Haga C1 = I . 1 3. Calcule Ci+1 = Tr�Ci M )I − Ci M� para i = 1� 2� . . . � r − 1. i r 4. Calcule Cr AT � ésta es la matriz A+ . Tr �Cr M ) Además, se tiene que Cr+1 M = � y Tr �Cr M ) �= 0. Para la demostración de este teorema, remitimos al lector a [3] (teorema 6.5.8). Obsérvese además, que la condición Cr+1 M = � permite proceder sin conocer de antemano el rango de A. 108

2

2 3 1 ”−1 “ 1 4 T T 2 5 aa a = 14 3

Inversa generalizada e inversa condicional 5.19. Ejemplo. Considere la matriz 1 A = 4 −1 2 2 2 −2 4 1 0 2 3 3 −2 5 6

5.2. Cálculo de la g-inversa

del ejemplo 5.17(4). Calcule A+ utilizando el teorema anterior. Para ello se puede calcualar M = At A. Esto es, 2 y considere C1 = I4 . Entonces se tiene que:

6 6 12 M =6 4 5 17

12 24 10 34 2

5 10 5 15

3 17 34 7 7 15 5 49 −12 60 −10 −34 −5 −10 79 −15 −20 −40 55 15 3 −17 −34 7 7. −15 5 35 3 −4 −8 7 7 18 5 10

Como C3 M = �� entonces ρ�A) = 2� y además

78 6 −12 6 C2 = Tr �C1 M ) I − C1 M = 4 −5 −17 2

−2 2 2 6 −4 + T 6 C2 A = A = Tr �C2 M ) 140 4 9 5

El siguiente teorema presenta una forma alternativa para calcular la g-inversa de una matriz. Para su demostración, remitimos a [9] (véase páginas. 14-15). 5.20. Teorema. Sea A ∈ �m×n una matriz de rango r > 0. La g-inversa de A se puede calcular mediante los siguientes pasos: 1. Forme la matriz [ A | Im ]. 2. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalonada reducida de A. Al final de este paso se obtiene una matriz que descrita por bloques queda así: » Er×n ��m−r)×n ˆ Em×n | Pr×m P�m−r)×m Pm×m ˜ – si si r<m

ó

r = m.
+

(Si r = m = n� A es invertible, E = I y P = A = A ). 3. Forme la matriz: – » Er×n Er×n AT si r < m P�m−r)×m ��m−r)×n ó ˆ ˜ si r = m . Em×n AT | Em×n

−1

4. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalonada reducida. Al final de este paso se obtiene la matriz h ` + ´T i . Im | A 109

5.2. Cálculo de la g-inversa

Inversa generalizada e inversa condicional

ˆ Con el objeto de calcular A+ utilizando el teorema anterior, se forma la matriz A | operaciones elementales en las filas hasta encontrar la forma escalonada reducida de A. 1 2 1 3 4 −1 −2 0 −2 2 4 2 6 2 0 1 2 0 2 4 0 0 1 1 1 0 0 0 0 −2 – » E2×4 P2×3 . �1×4 P1×3 2 1 0 0 −1 1 0 0 1 0 3 0 0 5 1 3

5.21. Ejemplo. Considere de nuevo la matriz A del ejemplo 5.19 2 3 1 2 1 3 4 −1 −2 0 −2 5 . A= 2 4 2 6

I3

˜

y se aplican

[ A | I3 ]

=

→ = Se construye ahora la matriz de la forma »

0 0 5 1

E2×4 AT P1×3

E2×4 �1×4

y se aplican de nuevo operaciones elementales en las filas, hasta izquierdo de este arreglo 3 2 2 11 −9 22 E2×4 AT E2×4 5 = 4 4 −2 4 8 P1×3 �1×4 −2 0 1 2 1 6 6 6 6 6 0 6 6 4 0 h 0 1 0 0 0 1 −

obtener la matriz identidad I3 en el lado 1 0 0 2 0 0 − 2 35 4 7 0 1 0 3 2 1 5 0

1 35 2 7

9 70

− − i .

− −

11 14 9 35

2 35

4 35

1 3 14 7 7 7 3 7 7 14 7 7 5 1 7

= Así que 1 − 6 35 6 6 6 6 −2 6 35 6 A+ = 6 6 9 6 6 70 6 6 4 2 35 2 − − 2 7 4 7

I3 | �A+ )T

11 14 3 14

3 2 35 7 7 7 2 4 7 −2 7 − 7 35 7 1 6 −4 6 7= 4 9 7 70 9 7 5 35 7 7 7 5 1 7 − 110

−20 −40 55 15

3 −4 −8 7 7 18 5 10

Inversa generalizada e inversa condicional 5.22. Ejemplo. Considere la matriz A del ejemplo 5.17(2) » – 1 2 3 A= � −1 −1 1 y siga los pasos del ejemplo anterior (teorema 5.20) para calcular A+ .

5.2. Cálculo de la g-inversa

[ A | I2 ]

= → =

» » ˆ

1 −1 1 0 0 1

2 −1 −5 4

3 1

1 0 −1 1 ˜ .

0 1

– –

−2 1

E2×4 ˜

P2×3

Se construye ahora la matriz

ˆ

E2×3 AT

|

E2×3

y se reduce para obtener

ˆ

E2×3 A

T

E2×3

˜

=

2 4 2 6 6 4

−14 14 1 0 0 1

−6 3 1 14 −

1 0

0 1 2 14

−5 4

3 5

= Así que 2 1 6 14 6 6 6 2 A+ = 6 6 14 6 4 3 14

1 1 − 3 3 i h I2 | �A+ )T .

3 3 14 7 7 5 1 3

1 3 2 3 7 3 7 6 7 6 1 6 1 7 6 − 7= 42 6 3 7 4 7 5 9 1 3 −

−14

7 7 −14 7 7 5 14

3

5�2 Ejercicios
1. Para cualquier matriz A se tiene que: ρ�A) = ρ�A+ ) = ρ�AA+ )= ρ�A+ A). 2. Calcule la g-inversa de cada una de las matrices siguientes: » – ˆ ˜ 1 2 �ii) A2 = �i) A1 = 0 0 0 3 5 �iii) A1 = ˆ 1 2 3 ˜ �iv ) 3 1 4 1 5 A4 = 2 111 2

5.3. C-inversa

Inversa generalizada e inversa condicional

�v )

7 A5 = 4 7 7 1 6 3 A7 = 6 4 0 0 2 6 −3 6 A9 = 6 6 1 4 1 1 2 2

2

7 7 7

3 7 7 5 7 3 2 4 7 7 0 5 0 −1 1 1 1 1 5.3. −1 2 1 1 1 3 7 7 7 7 5

�vi)

1 A6 = 4 0 0 1 6 1 A8 = 6 4 0 0 2

2

0 5 0 2 2 0 0

3 0 0 5 0 0 0 3 3 3 0 0 7 7 3 5 3

�vii)

�viii)

�ix)

Inversa condicional de una matriz

Al igual que el concepto de inversa generalizada de una matriz, el concepto de inversa condicional es de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]) y en la caracterización del conjunto solución de sistemas lineales de ecuaciones. 5.23. Definición. Sea A una matriz m × n. Si M es una matriz n × m tal que: AM A = A� entonces se dice que M es una inversa condicional de A o simplemente, que M es una c-inversa de A. 5.24. Observación. De acuerdo con el teorema 5.10, toda matriz A tiene una única inversa generalizada A+ . ésta es a su vez por definición una c-inversa de A. Así que, toda matriz A tiene al menos una c-inversa. Se verá aquí, que una matriz A puede tener varias (incluso infinitas) inversas condicionales, salvo cuando la matriz A es invertible, en cuyo caso A−1 es la única c-inversa. Nota. El teorema 5.27 dará una caracterización del conjunto de todas las inversas condicionales de A (c-inversas de A). 5.25. Teorema. Sea A ∈ �m×n una matriz de rango r. Entonces: 1. W = {N ∈ �n×m : AN A = �} es un subespacio de �n×m . 2. La dimensión del espacio W mencionado en (1) es m · n − r2 . Demostración� Para demostrar el inciso (1) basta demostrar, según el teorema 1.15, que el conjunto W es cerrado bajo la suma y la multiplicación por un escalar. En efecto, Sean N1 y N2 dos elementos (matrices) del conjunto W, entonces A�N1 + N2 )A = AN1 A + AN2 A = � + � = �� esto implica que N1 + N2 ∈ W. ésto es, W es cerrado bajo la suma. De otro lado, para cualquier escalar α ∈ R se tiene que A�αN1 )A = αAN1 A = α� = ��

ésto implica que, αN1 ∈ W. Es decir, W es cerrado bajo la multiplicación por un escalar. El conjunto W es entonces un subespacio vectorial de �n×m , lo que completa la demostración del inciso (1). 112

Inversa generalizada e inversa condicional

5.3. C-inversa

Hagamos ahora la demostración del inciso (2) en el caso en la matriz A ∈ �m×n tenga rango r con 0 < r < m´ ın {m� n}. Las demostraciones en los demás casos son similares. Sea entonces A una matriz m × n de rango r� con 0 < r < m´ ın {m� n}. De acuerdo con el inciso (1) del teorema 5.1, existen matrices invertibles P ∈ �m×m y Q ∈ �n×n tales que: – – » » Ir � Ir � o A = P −1 Q−1 . (5.1) P AQ = � � � �

Considere ahora matrices arbitrarias X ∈ �r×r � Y ∈ �r×�m−r) � Z ∈ ��n−r)×r y W ∈ ��n−r)×�m−r) y la matriz N ∈ �n×m dada por » – X Y N =Q P. Z W Ahora N ∈ W sii AN A = �. De (5.1) » AN A = P −1 » = P −1 se sigue que – » Ir � X Q−1 Q � � Z – X � Q−1 . � � Y W – P P −1 » Ir � � � – Q−1

De aquí se deduce AN A = � sii X = �. Esto es, N ∈ W sii N es de la forma: » – � Y N =Q P. Z W Ahora se demuestra que la dimensión de W es m · n − r2 . Para ello, se hace uso del hecho que el espacio de matrices �k×j tiene dimensión k · j . En efecto, considere los espacios �r×�m−r) � ��n−r)×r y ��n−r)×�m−r) con las bases respectivas �1 ��2 ��3 , siendo �1 = {Y1 � Y2 � . . . � Yr·�m−r) }, �1 = {Z1 � Z2 � . . . � Zr·�n−r) } y �3 = {W1 � W2 � . . . � W�n−r)·�m−r) }. Es fácil mostrar entonces que el conjunto � = {N� N2 � . . . � Nm·n−r·r } con – » � Yi P ; i = 1� 2� . . . � m · r − r2 Ni = Q � � » – � � Nr�m−r)+j = Q P ; j = 1� 2� . . . � n · r − r2 Zj � – » � � P ; k = 1� 2� . . . � �n − r) · �m − r)� Nr�m+n−2r)+k = Q � Wk es una base de W. � Mc A de todas las c-inversas, 5.26. Teorema. Sea A una matriz m × n. El conjunto es una variedad lineal de dimensión m · n − r2 . Mc A

= {M ∈ �n×m : AM A = A} �

c Demostración� Por el teorema 5.16 Mc A es no vacío, sea entonces M0 un elemento de MA . Se verifica si y sólo si M se puede escribir como la suma de M y un elemento N ∈ W. Esto entonces, que M ∈ Mc 0 A es, si y sólo si M = M0 + N para algún N ∈ W, siendo W el conjunto dado en el teorema 5.25.

Si M = M0 + N� con N ∈ W, entonces AM A = AM0 A + AN A = A + � = A. Esto es, M ∈ Mc A . De otra parte, si M ∈ Mc A � entonces se puede escribir M = = M + M0 − M0 113 M0 + �M − M0 ) = M0 + N �

5.3. C-inversa donde N = M − M0 . Puesto que

Inversa generalizada e inversa condicional

A�M − M0 )A = AM A − AM0 A = A − A = � � se tiene entonces que N = M − M0 ∈ W y de aquí se sigue que: Mc A = {M + N� N ∈ W} . � El teorema siguiente establece cómo determinar los elementos de Mc A. 5.27. Teorema. Sea A una matriz m × n de rango r. Sean P ∈ �m×m y Q ∈ �n×n matrices invertibles como en el teorema 5.1. 1. Si A = �, entonces Mc A = �n×m . ˘ + ¯ ˘ −1 ¯ 2. Si r = n = m, entonces Mc = A . A = A 3. Si r = m < n, entonces Mc A = 4. Si r = n < m, entonces – ff  » Ir P : Y ∈ ��n−r)×m . Q Y X ˜ ¯ P : X ∈ �n×�m−r) .

5. Si 0 < r < n y 0 < r < m� entonces el conjunto Mc A está dado por  » – Ir X Mc Q P : Z ∈ ��n−r)×�m−r) � A = Y Z Y ∈ ��n−r)×m � X ∈ �n×�m−r)

˘ ˆ Ir Mc A = Q

Demostración� De acuerdo con los teoremas 5.25 y 5.26, se tiene que en cada caso Mc A es una variedad � lineal de dimensión mn − r2 . De otro lado, se puede verificar que si M ∈ Mc A , entonces AM A = A. 5.28. Ejemplo. Sea 1 A = 4 −1 2 2 2 −2 4 1 0 2 3 3 −2 5 � 6

la matriz del ejemplo 5.2. De dicho ejemplo se sabe que las matrices invertibles 2 3 2 3 1 0 −2 −2 0 −1 0 6 0 0 1 0 7 7 1 0 5 y Q=6 P =4 1 4 0 1 0 −1 5 −2 0 1 0 0 0 1 – » I2 � � ρ�A) = r = 2. En este caso, son tales que P AQ = � � – ff  » I2 X P : X ∈ �2×1 � Y ∈ �2×2 � Z ∈ �2×1 � Q Mc A = Y Z 114

Inversa generalizada e inversa condicional

5.3. C-inversa

En lo que resta de esta sección se abordará un método alternativo para calcular una c-inversa de una matriz. Considere inicialmente el caso de matrices cuadradas. �

representará, el conjunto de todas las inversas condicionales de A� En particular, si tomamos X = �� Y = � y Z = �� se tiene que una c-inversa de A es: 2 3 0 −1 0 – » 6 0 0 0 7 I2 0 7. P =6 M0 = Q 4 1 0 0 1 0 5 0 0 0

5.29. Definición. Una matriz cuadrada H = [hij ]n×n tiene la forma Hermite superior, si satisface las condiciones siguientes: 1. 2. 3. 4. H es triangular superior. h2 ii = hii ; esto es, hii = 0 ó hii = 1� i = 1� 2� . . . � n. Si hii = 0, entonces la i-ésima fila es nula, esto es, Hi = �. Si hii = 1, entonces el resto de los elementos de la i-ésima columna son nulos; es decir, H i = I i es la i-ésima columna de la matriz idéntica.

5.30. Ejemplo. La matriz

tiene la forma Hermite superior.

1 6 0 6 H=4 0 0

2

2 0 0 0

0 0 1 0

3 0 0 7 7 0 5 1

El siguiente teorema establece que una matriz Hermite superior es idempotente. La demostración de dicho resultado es consecuencia directa de la definición y se deja como un ejercicio para el lector. 5.31. Teorema. Si H es una matriz que tiene la forma Hermite superior, entonces H 2 = H. Demostración� Si A� B ∈ �n×m son matrices triangulares superiores, entonces AB es triangular superior y �AB �ii = �A�ii �B �ii (ver ejercicio 2 de la sección 2.1). De esto se sigue que: 1. H 2 es triangular superior. 2. �H 2 �ii = �H �ii �H �ii = h2 ii = hii . De otra parte,
2 3 Si hii = 0, entonces Hi = � y Hi = Hi H = �. i 4 Si hii = 1, entonces Hi = I y �H 2 )i = HH i = HI i = H i = I i .

� 5.32. Teorema. Para toda matriz cuadrada A existe una matriz invertible B tal que BA = H tiene la forma Hermite superior. 115

5.3. C-inversa

Inversa generalizada e inversa condicional

Demostración� Sea P una matriz invertible tal que P A = R es la forma escalonada reducida de A. Si R tiene la forma Hermite superior, entonces la matriz B = P satisface la condición de que BA = R = H . Si R no tiene la forma Hermite superior, intercambiamos las filas de R hasta que el primer elemento no nulo (de izquierda a derecha) de cada fila no nula de R, sea un elemento de la diagonal. Así se tiene una matriz H que tiene la forma Hermite superior. Así que existen matrices elementales (por filas) E1 � E2 � . . . � Ek tales que E1 E 2 · · · E k R = H o sea: E1 E2 · · · Ek P A = H.

En consecuencia, la matriz invertible B = E1 E2 · · · Ek P es tal que BA = H tiene la forma Hermite superior. � 5.33. Ejemplo. Para la matriz cuadrada: 1 A=4 1 2 5/2 P = 4 −1/2 0 2 2 2 2 2 4 3 3 5 5� 10 3 0 0 5 1 3 0 1 5� 0

la matriz invertible

es tal que

−3/2 1/2 −2 2 0 0

donde R es la forma escalonada resucida de A. Intercambiando las filas 2 y 3 de R se obtiene la matriz: 2 3 1 2 0 4 0 0 0 5� H= 0 0 1 la cual tiene la forma Hermite superior. Además, 2 5/2 0 B=4 −1/2 es invertible y es tal que BA = H . � −3/2 −2 1/2 3 0 1 5 0

1 PA = R = 4 0 0

5.34. Teorema. Sea A una matriz cuadrada. Si B es una matriz invertible tal que BA = H tiene la forma Hermite superior, entonces B es una c-inversa de A.

Demostración� Como H tiene la forma Hermite superior, por el teorema 5.31, H 2 = H. Así que BABA = H 2 = H = BA� o sea: BABA = BA. Premultiplicando los dos miembros de la última igualdad por la matriz B −1 se obtiene: ABA = A� esto es, B es una c-inversa de A. 116 �

Inversa generalizada e inversa condicional 5.35. Ejemplo. Considere la matriz A del ejemplo 5.33, 3 2 1 2 3 5 5. A=4 1 2 2 4 10 Se sabe de dicho ejemplo, que la matriz invertible 2 5/2 0 B=4 −1/2 −3/2 −2 1/2 3 0 1 5� 0

5.3. C-inversa

es tal que BA = H tiene la forma Hermite superior. Por lo tanto, por teorema anterior, B es una c-inversa de A. � El siguiente corolario presenta una forma de calcular una c-inversa para el caso de matrices rectangulares. 5.36. Corolario. Sea A una matriz m × n ˆ ˜ 1. Si m > n, sea A∗ = A � , donde � es la matriz nula m × �m − n). Sea además B ∗ una matriz ∗ ∗ invertible tal que B A = H tiene la forma Hermite superior. Si escribimos la matriz B ∗ entonces particionada así: 3 2 B ∗ 5� B =4 B1 donde B es una matriz » n× – m, entonces B es una c-inversa de A. A , donde � es la matriz nula �n − m) × m. Sea además B ∗ una matriz 2. Si n > m, sea A∗ = � ∗ ∗ invertible tal que B A = H tiene la forma Hermite superior. Si escribimos la matriz B ∗ entonces particionada así: ˆ ˜ B ∗ = B B1 � donde B es una matriz n × m, entonces B es una c-inversa de A. Demostración� Se presenta aquí sólo la demostración del ˆinciso (1). ˜ Para ello suponga que A es una matriz m × n, con m > n y considere la matriz cuadrada A∗ = A � n×n .

De esto se sigue que ABA = A. Es decir, B es una c-inversa de A. 5.37. Ejemplo. Encontre una c-inversa para la matriz: 2 3 1 −1 A = 4 2 −1 5 . 0 1 3×2 2 3 1 −1 0 Sea A∗ = 4 2 −1 0 5 . 0 1 0 3×3 117

Según el teorema 5.32, existe una matriz invertible B ∗ � tal que B ∗ A∗ = H tiene la forma Hermite superior. Dicha matriz B ∗ es una c-inversa de A∗ (teorema 5.32), así que, A∗ B ∗ A∗ = A∗ � o sea: 2 3 B ˆ ˜ ˆ ˜ ∗ ∗ ∗ 5 A � A � 4 A B A = B1 ˆ ˜ ˆ ˜ ABA � = A � = A∗ . = �

5.3. C-inversa

Inversa generalizada e inversa condicional

Efectuando los cálculos pertinentes se encuentra que la matriz invertible: 3 2 3 2 −1 1 0 B ∗ 5 1 0 5=4 B = 4 −2 B1 2 −1 1 es tal que B ∗ A∗ = H tiene la forma Hermite superior. Por lo tanto, por el corolario anterior, la matriz » – −1 1 0 B= −2 1 0 2×3 es una c-inversa de A. �

5�3 Ejercicios
En los ejercicios 1 al 3, responda verdadero o falso justificando su respuesta. 1. Para toda c-inversa Ac de A se tiene que �AAc )2 = AAc y �Ac A)2 = Ac A. 2. Si Ac es una c-inversa de A, entonces A es una c-inversa de Ac . 3. Si Ac es una c-inversa de A, entonces �Ac )T es una c-inversa de AT . En los ejercicios 4 al 9 haga la demostración correspondiente 4. Si Ac es una c-inversa de A, entonces ρ�Ac ) ≥ ρ�A) = ρ�AAc ) = ρ�Ac A). 5. Si Ac es una c-inversa de A, entonces Tr�AAc ) = Tr�Ac A) = ρ�A). (sugerencia véase el ejercicio 7 de la sección de ejercicios 3.2). 6. Sea A una matriz m × n. Entonces ρ�A) = m sii AA+ = I sii AAc = I para cada c-inversa Ac de A. 7. Sea A una matriz m × n. Entonces ρ�A) = n sii A+ A = I sii Ac A = I para cada c-inversa Ac de A. 8. Si B es una c-inversa de A� entonces también lo es BAB . 9. Si B c y C c son c-inversas de las matrices B y C respectivamente, entonces una c-inversa de la matriz » c – » – B � B � . A= es Ac = c � C � C 2 3 1 2 3 c c c 4 2 5 3 5 � dé dos c-inversa Ac 10. Para la matriz A = 1 y A2 tales que ρ�A1 ) > ρ�A) y ρ�A2 ) = 1 3 0 ρ�A). 11. Determine el conjunto de todas las c-inversas de las matrices » – » – 1 1 1 2 3 � A2 = � A1 = 1 1 1 3 3 2 3 » – 1 2 1 2 4 1 3 5� A3 = . A4 = 1 3 2 5 118

Inversa generalizada e inversa condicional 5.4.

5.4. Mínimos cuadrados

Sistemas de ecuaciones lineales: g-inversa y c-inversa de una matriz. mínimos cuadrados.

En esta sección se verán algunas aplicaciones de la g-inversa y la c-inversa de una matriz a los sistemas de ecuaciones lineales y al problema de los mínimos cuadrados. 5.38. Teorema. Sea A ∈ �m×n una matriz y sea y ∈ �m×1 un vector. El sistema de ecuaciones lineales Ax = y es consistente sii AAc y = y para cada c-inversa Ac de A. Demostración� Suponga que el sistema de ecuaciones lineales Ax = y es consistente. ésto quiere decir, que existe al menos un x0 tal que: Ax0 = y . Sea ahora Ac una c-inversa de A� entonces: AAc y = = = AAc Ax0 Ax0 y.

Suponga ahora, que para cada c-inversa Ac de A, se tiene que AAc y = y. Entonces para cada c-inversa Ac , el vector x0 = Ac y es una solución del sistema de ecuaciones lineales Ax = y. Por lo tanto, el sistema es consistente. � 5.39. Teorema. Sea A una matriz m × n y sea Ac una c-inversa de A. Si el sistema de ecuaciones lineales Ax = y es consistente, entonces su solución general es (5.1) x = Ac y + �I − Ac A)h� h ∈ �n×1 .

Demostración� Puesto que por hipótesis el sistema de ecuaciones lineales Ax = y es consistente, entonces por el teorema anterior, AAc y = y. En consecuencia, para cada x de la forma (5.1): Ax = = = = esto es, x es una solución del sistema dado. De otro lado, si x0 es solución del sistema dado, entonces Ax0 = y . Premultiplicando los miembros de la última igualdad por Ac se obtiene Ac Ax0 = Ac y � de donde: � = Ac y − Ac Ax0 . Sumando x0 a los dos lados de la última igualdad se llega a: x0 = = = Ac y + x0 − Ac Ax0 Ac y + �I − Ac A)x0 Ac y + �I − Ac A)h� � AAc y + A�I − Ac A)h y + �A − A)h y + �h y�

donde h = x0 . Esto es, x0 se puede expresar en la forma 5.1.

Puesto que A+ es una c-inversa de A� se tiene el siguiente corolario. 119

5.4. Mínimos cuadrados

Inversa generalizada e inversa condicional

5.40. Corolario. Sea A una matriz m × n. Si el sistema de ecuaciones lineales Ax = y es consistente, entones su solución general es (5.2) x = A+ y + �I − A+ A)h� h ∈ �n×1 .

Problema de los Mínimos Cuadrados Como se estableció en el teorema 1.51(3), para un sistema de ecuaciones Ax = y se presenta una y sólo una de las opciones siguientes: (i) El sistema tiene infinitas soluciones. (ii) El sistema tiene solución única. (iii) El sistema no tiene solución. En el trabajo experimental generalmente se da generalmente la opción (iii), es decir, que el vector y no es un elemento del espacio columna de la matriz A, (y ∈ / C �A)) (véase figura 5.1). En este caso se puede preguntar, si existe una solución aproximada del sistema, para una definición conveniente de solución aproximada. Un problema que se presenta con frecuencia en el trabajo experimental es:
IR
m

y

� (A) 

0

.

A   x

A   x0

A   x

Figura 5�1� Problema de los mínimos cuadrados Dado una serie de puntos �x1 � y1 ); �x2 � y2 ); . . . ; �xn � yn ). obtener una relación y = f �x) entre las dos variables x y y� “adaptando” (en algún sentido) una curva a dicho conjunto de puntos. Como los datos se obtienen experimentalmente, generalmente existe un �error� en ellos (errores de aproximación), lo que hace prácticamente imposible encontrar una curva de la forma deseada que pase por todos los puntos. Por medio de consideraciones teóricas o simplemente por �acomodo� de los puntos, se decide la forma general de la curva y = f �x) que mejor se adapte. Algunas posibilidades son (ver figura 5.2): 1. Funciones lineales (rectas): y = f �x) = a + bx; a� b ∈ R 2. Polinomios de grado dos: y = f �x) = a + bx + cx2 ; a� b� c ∈ R. 3. Polinomios de grado tres: y = f �x) = a + bx + cx2 + dx3 ; a� b� c� d ∈ R.

A. Adaptación de puntos a una línea recta Considere los puntos �x1 � y1 ); �x2 � y2 ); . . . ; �xn � yn )� los cuales se pretende ajustar mediante la gráfica de la línea recta y = f �x) = a + bx. Si los puntos correspondientes a los datos fuesen colineales, la recta pasaría 120

Inversa generalizada e inversa condicional
y y y

5.4. Mínimos cuadrados

x

x

x

(1) Aproximacion lineal ´

(2) Aproximacion cuadratica (3) Aproximacion cubica ´ ´ ´ ´

Figura 5�2� Ajuste por mínimos cuadrados por todos los n puntos y, en consecuencia, los coeficientes desconocidos a y b satisfarían la ecuación de la recta. Esto es, se tendrían las siguientes igualdades: y1 y2 . . . yn = = . . . = a + bx1 a + bx2 . . . a + bxn .

Estas igualdades se pueden escribir, utilizando notación matricial, así: 3 2 3 2 y1 1 x1 2 3 a 6 y2 7 6 1 x 2 7 7 6 74 6 5 = Ax . (5.3) y=6 . 7=6 . 7 . . 4 . . 5 4 . . . 5 b yn 1 xn

Si los puntos que corresponden a los datos no son colineales, es imposible encontrar coeficientes a y b que satisfagan (5.3). En este caso, independientemente de la forma en que se escojan a y b, la diferencia Ax − y� entre los dos miembros de (5.3) no será cero. Entonces, el objetivo es encontrar un vector x =

minimice la longitud del vector Ax − y, esto es, que minimice � Ax − y �� lo que es equivalente a minimizar su cuadrado, � Ax − y �2 .

»

a∗ b∗

que

– a∗ es un vector que minimiza tal longitud, a la línea recta y = a∗ + b∗ x se le denomina recta ∗ b de ajuste por mínimos cuadrados de los datos. La figura 5.3 ilustra la adaptación de una línea recta por el método de los mínimos cuadrados. Se tiene que � Ax − y �� y Si x0 = » � Ax − y �2 = �a∗ + b∗ x1 − y1 )2 + �a∗ + b∗ x2 − y2 )2 + · · · + �a∗ + b∗ xn − yn )2 121

5.4. Mínimos cuadrados son minimizados por el vector x0 = »

Inversa generalizada e inversa condicional

– a∗ . En dicha figura se ve que |a∗ + b∗ xi − yi | corresponde a la ∗ b “distancia vertical”, di � tomada desde el punto �xi � yi ) hasta la recta y = a∗ + b∗ x . Si se toma a di como el “error vertical” en el punto �xi � yi ), la recta de ajuste minimiza la cantidad:
2 2 d2 1 + d2 + · · · + dn �

que es la suma de los cuadrados de los “errores verticales”. De allí el nombre de método de los mínimos cuadrados.
y (           ) x   , y    n n dn (          ) x  , y   1 1 d1 d2 d3 (          ) x  , y   3 3 x (         ) x  , y   2 2
* * y= a+ b x

Figura 5�3� Ajuste lineal por mínimos cuadrados

A continuación se darán dos definiciones motivadas por la discusión anterior. En el ejemplo 5.50 se explicará cómo se adaptar, por mínimos cuadrados, una línea recta y = a + bx a una serien de n puntos �x1 � y1 ); �x2 � y2 ); . . . ; �xn � yn ) dados. 5.41. Definición (Solución M nima Cuadrada). Se dice que el vector x0 es una solución mínima cuadrada (S.M.C.) del sistema de ecuaciones lineales Ax = y� si para todo vector x se tiene que: � Ax0 − y � ≤ � Ax − y � . 5.42. Definición (Mejor Solución Aproximada). Se dice que el vector x0 es una mejor solución aproximada (M.S.A.) del sistema de ecuaciones lineales Ax = y� si: 1. Para todo vector x se tiene que: � Ax0 − y � ≤ � Ax − y �. 2. Para todo vector x �= x0 tal que � Ax0 − y � < � Ax∗ − y � se tiene que

� x0 � < � x∗ �. Nota. Observe que una M.S.A de un sistema de ecuaciones lineales Ax = y es una S.M.C. del mismo. 5.43. Teorema. Sea A una matriz m × n y sea y un vector Rm . Si Ac es una c-inversa de A tal que AAc es simétrica, entonces para todo vector x ∈ Rn se tiene que: � Ax − y �2 = � Ax − AAc y �2 + � AAc y − y �2 . 122

Inversa generalizada e inversa condicional

5.4. Mínimos cuadrados

Demostración� Por hipótesis AAc = �AAc )T . Así que para todo vector x se tiene que: � Ax − y �2 = = � �Ax − AAc y) + �AAc y − y)�2 +� AAc y − y �2 � Ax − AAc y �2 + 2�Ax − AAc y)T �AAc y − y)

En efecto tenemos:

El teorema quedará demostrado si verificamos que el segundo término de esta igualdad es cero, esto es, si comprobamos la igualdad �Ax − AAc y)T �AAc y − y) = 0. �Ax − AAc y)T �AAc y − y) = = = = �x − Ac y)T AT ��AAc )T − I )y �x − Ac y)T �AT �AAc )T − AT )y �x − Ac y)T ��AAc A)T − AT )y �x − Ac y)T �AT − AT )y = � . �

5.44. Teorema. Sea A una matriz m × n y sea y un vector Rm . Si Ac es una c-inversa de A tal que AAc es simétrica, entonces x0 = Ac y es una S.M.C. para el sistema Ax = y. Demostración� Por hipótesis y por el teorema anterior se tiene que x0 = Ac y es tal que: Para todo vector x. De aquí que para todo vector x: � Ax − y �2 = � Ax − Ax0 �2 + � Ax0 − y �2 ≥ � Ax0 − y �2 . � Ax0 − y � ≤ � Ax − y �� �

esto es, x0 = Ac y es una S.M.C. para el sistema Ax = y.

5.45. Teorema. Sea A una matriz m × n y sea y un vector Rm . El sistema de ecuaciones lineales Ax = y tiene una única M.S.A., a saber x0 = A+ y. Demostración� Por definición de g-inversa se tiene que A+ es en particular una c-inversa de A que satisface la propiedad de que AA+ es una matriz simétrica, entonces por el teorema 5.43 se tiene para todo x que: � Ax − y �2 = � Ax − AA+ y �2 + � AA+ y − y �2 ≥ � AA+ y − y �2 . � AA+ y − y � ≤ � Ax − y �

De aquí que para todo vector x : (5.4)

Esto es, x0 = A+ y es una S.M.C. para el sistema Ax = y. Se quiere demostrar ahora x0 = A+ y que la M.S.A. para ello se muestra, que si x∗ �= x0 es otra S.M.C. del sistema Ax = y (esto es si x∗ satisface Ax∗ = AA+ y) entonces se tiene que � x0 � < � x∗ �. Para ello se verifica primero que para todo x se satisface la igualdad (5.5) � A+ y + �I − A+ A)x2 � = � A+ y �2 + � �I − A+ A)x �2 . 123

5.4. Mínimos cuadrados En efecto se tiene que: � A+ y + �I − A+ A)x�2 =

Inversa generalizada e inversa condicional

La igualdad (5.5) se obtendrá entonces si verifica que el segundo término de la igualdad anterior es cero. Esto último se sigue fácilmente de h i �A+ y)T �I − A+ A)x = yT �A+ )T − �A+ )T �AA+ )T x h i = yT �A+ )T − �A+ AA+ )T x = yT ��)x = � Tómese ahora un vector x∗ �= x0 , tal que Ax∗ = AA+ y. Multiplicando por A+ obtenemos A+ Ax∗ = A+ y. De aquí y de (5.5) aplicada a x∗ se tiene que: � x∗ �2 = = = = > � A+ y + x∗ − A+ y�2 � A+ y + x∗ − A+ Ax∗ �2

� �I − A+ A)x �2 .

� A+ y �2 + 2�A+ y)T �I − A+ A)x +

� A+ y + �I − A+ A)x∗ �2 � A+ y �2 = � x0 �2 .

� A+ y �2 + � �I − A+ A)x∗ �2

� 5.46. Observación. El teorema anterior establece que todo sistema de ecuaciones lineales Ax = y tiene una única M.S.A., x0 = A+ y. Por esto, se hablará de aquí en adelante de la mejor solución aproximada (M.S.A.) de un sistema de ecuaciones lineales. Ahora bien, puesto que la mejor solución aproximada del sistema de ecuaciones lineales Ax = y es una solución mínima cuadrada, se tiene el siguiente teorema. 5.47. Corolario. Todo sistema de ecuaciones lineales Ax = y tiene al menos una S.M.C. 5.48. Ejemplo. Para el sistema de ecuaciones lineales 2 2 3 – 1 1 » x Ax = 4 1 1 5 =4 y 1 1 2 3 » – 1 » – 1 1 1 1 4 1 + 2 5= se tiene que x0 = A y = es 1 1 6 1 1 3 √ � Ax0 − y � = 2; √ 3 1 2 5 = y� 3 la M.S.A. Además:

así que para todo vector x se tiene que:

y si existe un vector x∗ tal que � Ax∗ − y � =

2 ≤ � Ax − y �� √ 2, entonces se debe tener que: √ � x0 � = 2 < � x∗ �. �

5.49. Teorema. Sea A una matriz m × n y sea y un vector Rm . Si ρ�A) = n, entonces el sistema de ecuaciones lineales Ax = y tiene una única S.M.C. que es justamente la M.S.A. dada por: x0 = A+ y. 124

Inversa generalizada e inversa condicional

5.4. Mínimos cuadrados

Demostración� Sea x∗ una S.M.C. del sistema de ecuaciones Ax = y. Por definición se tiene para todo x ∈ Rn , entonces que � Ax∗ − y � ≤ � Ax − y �� en particular, para el vector x0 = A+ y se tiene: (5.6) � Ax∗ − y � ≤ � AA+ y − y �. De otra parte, como A+ es una c-inversa de A tal que AA+ es simétrica, entonces se tiene (ver teorema 5.43) � Ax − y �2 = � Ax − AA+ y �2 + � AA+ y − y �2 En particular, para el vector x∗ se tiene: (5.7) � Ax∗ − y �2 � AA+ y − y �2 = � Ax∗ − AA+ y �2 + � AA+ y − y �2 . � Ax∗ − AA+ y �2 + � AA+ y − y �2 ∀x ∈ Rn .

De (5.6) y (5.7) se sigue que: = � Ax∗ − y �2 ≤ � AA+ y − y �2 ‚ ‚ De aquí que ‚ Ax∗ − AA+ y ‚ = 0 y por lo tanto: ` ≤

Ax∗ = AA+ y . ´ −1 T A (teorema 5.15), en consecuencia: Puesto que ρ�A) = n, entonces A+ = AT A ´−1 T ` A � se obtiene: Premultiplicando esta igualdad por AT A x∗ = = “ ”−1 AT y. Ax∗ = A AT A

“ ”−1 AT A AT Ax∗ “ ”−1 “ ”−1 AT A AT A AT A AT y “ ”−1 AT A AT y = A+ y = x0 . �

5.50. Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados (ver figura 5.4), que se adapte a los puntos: �0� 1); �1� 3); �2� 4); �3� 4) . Para ello se debe encontrar una S.M.C. del sistema 3 2 2 1 0 1 x1 6 1 x2 7 6 1 1 7 6 6 = A=4 1 x3 5 4 1 2 1 x4 1 3 y el vector incógnita x está dada por x= de ecuaciones lineales Ax = y, donde 3 2 3 2 3 1 y1 7 6 y2 7 6 3 7 7 6 7� 7 y=6 5 4 y3 5 = 4 4 5 y4 4 » a b – .

125

5.4. Mínimos cuadrados

Inversa generalizada e inversa condicional

Puesto que ρ�A) = 2� entonces por el teorema anterior, el sistema dado tiene una única S.M.C., a saber: = = A+ y = �AT A)−1 AT y 1 10 » » 7 −3 – = 4 −1 » a∗ b∗ 1 1 – −2 3 – 2 3 1 6 3 7 6 7 4 4 5 4

x0

=

1.5 1

En consecuencia, la recta de ajuste, por mínimos cuadrados, de los datos dados es: y = a∗ + b∗ x = 1.5 + x. �

y y= 1.5+ x (2,4) (1,3) (3,4)

(0,1) x

Figura 5�4� Ajuste lineal ejemplo 5.50

5.51. Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados, que se adapte a los puntos: �1� 1); �1� 2) . Observe que en este caso los puntos dados pertenecen a la recta, de pendiente infinita, x = 1.(ver figura 5.5(a)) 126

Inversa generalizada e inversa condicional

5.4. Mínimos cuadrados

y

x =  1

y y= 3/2x

(1,2) (1,1) x
a)   Ajuste por una recta de pendiente infinita

(1,2) (1,1)

y= 3/4+ 3/4x

x
b)   Ajuste por rectas de pendiente no infinita

Figura 5�5� Ajuste lineal ejemplo 5.51

Una S.M.C. del sistema dado es: x0 =

Ahora bien, si se busca una recta y = a + bx� que no tenga pendiente infinita, que se adapte por mínimos cuadrados, a los puntos dados, entonces se debe encontrar una S.M.C. del sistema de ecuaciones lineales (ver figura 5.5(b)) –» – » –» – » a 1 1 a 1 x1 = Ax = 1 x2 b 1 1 b – » – » 1 y1 = y. = = y2 2 A+ y = 1 4 » 1 1 1 1 –» 1 2 – = » 3/4 3/4 – = » a∗ b∗ – .

Así que una recta de ajuste, por mínimos cuadrados, de los puntos dados es: 3 3 y = a ∗ + b∗ x = + x . 4 4 De otra parte, la matriz » – 0 0 Ac = 1/2 1/2 c es una c-inversa de A, AA es simétrica. En efecto, » 1/2 1/2 » 0 3/2 1/2 1/2 – – »

AAc = Por lo tanto, de acuerdo con el teorema 5.44,

.

x0 = Ac y =

=

a ˆ ˆ b

es también una S.M.C. Así que otra recta de ajuste por mínimos cuadrados, de los puntos dados es (ver figura 5.5(b)): 3 y = a ∗ + b∗ x = x . � 2 127

5.4. Mínimos cuadrados B. Adaptación a polinomios de grado n.

Inversa generalizada e inversa condicional

La técnica descrita antes para adaptar una recta a n puntos dados, se generaliza fácilmente a la adaptación, por mínimos cuadrados, de un polinomio de cualquier grado a un conjunto de puntos dados. A continuación se muestra cómo adaptar un polinomio de grado ≤ m� y = a0 + a1 x + a2 x2 + . . . + am xm a un conjunto de n puntos �x1 � y1 ); �x2 � y2 ); . . . ; �xn � yn )� mediante la técnica de los mínimos cuadrados. Sustituyendo estos n valores de x y y en la ecuación polinómica se obtienen las n ecuaciones siguientes: 2 6 6 6 4 y1 y2 . . . yn 3 2 1 1 . . . 1 x1 x2 . . . xn x2 1 x2 2 . . . 2 xn ··· ··· .. . ··· xm 1 xm 2 . . . m xn 32 76 76 76 54 a0 a1 . . . am 3 7 7 7 5

7 6 7 6 7=6 5 4

De lo que se trata nuevamente, es de encontrar una S.M.C. del sistema de ecuaciones lineales Ax = y. 5.52. Ejemplo. Encontrar un polinomio de grado dos que mejor se ajuste, por mínimos cuadrados, a los puntos: �−1� 0); �0� −2); �1� −1); �2� 0) . Se debe encontrar una S.M.C. del sistema de ecuaciones 2 3 1 −1 1 2 6 1 0 0 7 74 Ax = 6 4 1 1 1 5 1 2 4 = = lineales: 2 3 0 a1 6 −2 a2 5 = 6 4 −1 a3 0 3

Puesto que ρ�A) = 3� el sistema dado tiene una única S.M.C., la cual está dada por: x0 A+ y = �AT A)−1 AT y 2 2 3 0 3 11 9 −3 6 1 4 −2 6 5 −1 3 7 1 4 −1 20 5 −5 −5 5 0 2 3 2 3 −31 −1.55 1 4 −13 5 = 4 −0.65 5 20 15 0.75

7 7 = y. 5

3 7 7 5

=

En consecuencia, existe un único polinomio de grado dos que se ajuste por mínimos cuadrados de los datos dados. Este polinomio está dado por (ver figura 5.6): y = −1.55 − 0.65x + 0.75x2 . 128 �

Inversa generalizada e inversa condicional
y y= −1.55−0.65x+ 0.75x
2

5.4. Mínimos cuadrados

(−1,0) (2,0) (1,−1) x

(0,−2)

Figura 5�6� Ajuste cuadrático ejemplo 5.52

5�4 Ejercicios
1. Si el sistema de ecuaciones lineales Ax = y tiene solución, demuestre entonces que la solución x = A+ y es única sii A+ A = I� y en este caso A+ y = Ac y para toda c-inversa Ac de A. 2. Si x1 � x2 � . . . � xn son P soluciones del sistema de ecuaciones lineales Ax = y, y si λ1 � λ2 � . . . � λn son escalares tales que n i=1 λi = 1, demuestre entonces x= es una solución del sistema Ax = y. 3. Sea y = a + bx una línea recta que se quiere adaptar, por mínimos cuadrados, a los puntos �x1 � y1 ); �x2 � y2 ); . . . ; �xn � yn ). Utilice el teorema 5.39 y la regla de Cramer para demostrar que si para algún i y para algún j , xi �= xj � entonces existe una única recta de ajuste, por mínimos cuadrados, a los puntos dados: y = a ∗ + b∗ x Δa Δb y b∗ = , donde: y que a∗ = Δ Δ 2 3 Pn n i=1 xi 5 Δ = det 4 P Pn n 2 i=1 xi i=1 xi 3 2 Pn Pn i=1 yi i=1 xi 5 Δa = det 4 P Pn n 2 x y x i i i i=1 i=1 2 3 Pn n i=1 yi 4 5 Δb = det P Pn n x x y i=1 i i=1 i i 129
n X i=1

λi xi

5.4. Mínimos cuadrados

Inversa generalizada e inversa condicional

4. Encuentre la M.S.A. del sistema de ecuaciones lineales Ax = y� donde: 2 3 2 3 2 2 2 1 6 2 6 2 7 2 2 7 7 7 A=6 y y=6 4 1 −1 4 3 5 . 0 5 2 −2 0 4 5. Encuentre la M.S.A del sistema de ecuaciones 8 x + 2y > > > <−x + y >2x − 3y > > : 3x + y lineales =1 =1 =2 = 3.

6. Encuentre la ecuación de la recta que mejor se ajuste por mínimos cuadrados a los puntos: �0� 1); �1� 3); �2� 2); �3� 4).

9. Suponga que las variables x y y se relacionan por medio de la ecuación y = a · bx ; a > 0� b > 0. a ) Verique que dicha ecuación se puede transformar en la ecuación y ∗ = a∗ + b∗ x �

7. Obtenga la ecuación del polinomio de grado dos que mejor se adapte, por mínimos cuadrados, a los puntos: �−1� 4); �0� 2); �1� 0); �2� 1). 8. Dé, si las hay, dos S.M.C. diferentes del sistema de ecuaciones lineales: » –» – » – x 1 2 2 Ax = = . y 0 2 2

donde y ∗ = ln y� a∗ = ln a y b∗ = ln b. Y viceversa. b ) Determine, los valores de las constantes a > 0� b > 0 en el modelo y = a · bx que mejor se adapte a los datos x -1 1 2 y 1 6 10 Estime el valor de y para x = 5. Para ello encuentre la recta y ∗ = a∗ + b∗ x que mejor se adapte, por mínimos cuadrados a los puntos de la forma �x� ln y ). 10. Determine la ecuación del plano z = a + bx + cy que mejor se adapte, por mínimos cuadrados, a los puntos �0� 1� 5)� �1� 0� 2)� �1� 1� 7)� (1,-1,-1).

130