You are on page 1of 217

线 性 代 数

张 巍 阚海斌 倪卫明 编著

科 学 出 版 社

北 京
内 容 简 介

本书按照高等院校理工科各专业线性代数教学要求而编写,全书共七章, 包括矩
阵、线性方程组、行列式、线性空间与线性变换、特征值与二次型、矩阵分解、矩阵
的 Jordan 标准形. 本书力求深入浅出, 在介绍抽象的数学概念时会交代其来龙去脉,
突出其实际应用背景. 书中有大量精选例题和习题, 较难的印有*, 可以根据情况
选用.
本书是高等学校理工科各专业线性代数教材, 也可供工程技术类人员、研究生和
教师参考.

图书在版编目(CIP)数据
线性代数 / 张巍, 阚海斌, 倪卫明编著. -- 北京 : 科学出版社, 2016.7

ISBN 978-7-03-049409-2

Ⅰ. ①线… Ⅱ. ①张… ②阚… ③倪… Ⅲ. ①线性代数 Ⅳ. ①O151.2


中国版本图书馆 CIP 数据核字(2016)第 165496 号

责任编辑:王艳丽/责任校对:
责任印制:/封面设计:

科 学 出 版 社 出版
北京东黄城根北街 16 号
邮政编码:100717
http://www.sciencep.com

文林印务有限公司印刷
科学出版社发行 各地新华书店经销
*
2016 年 1 月第 一 版 开本:B5(720×1000)
2016 年 1 月第一次印刷 印张:00
字数:000 000
定价:00.00 元
(如有印装质量问题,我社负责调换)
前 言

线性代数对于自然科学、技术科学及社会科学等各专业学生均是一门非常重
要的基础课程, 其核心内容包括矩阵理论、线性方程组理论、向量空间理论等, 这
些概念与理论为许多专业领域中的实际问题提供了表述精确的数学语言, 并为分
析问题与解决问题提供了强有力的数学工具.
本书几乎涵盖国内外已有线性代数课程的全部内容, 比国内大多数教材的内
容更加丰富, 在很多重要知识点的阐述方面, 讲解角度更加新颖、更加体系化. 特
别针对技术科学类学生, 对工程技术专业中常用的线性代数的基本概念、基本理
论和基本方法作了较深入的讨论和阐述, 力求条理清楚、重点突出, 定理证明简洁
清晰, 例题分析典型直观, 使读者在较短时间内系统地掌握线性代数的基本内容.
第 1 章介绍矩阵. 主要介绍了矩阵乘法、 初等变换, 以及秩的概念. 从元素、
行、列等不同角度讲解矩阵乘法, 使读者充分理解为什么这样定义矩阵乘法. 特别
强调矩阵乘积 𝐴𝐵 的第 𝑗 列是矩阵 𝐴 的所有列的线性组合, 组合系数为 𝐵 的第
𝑗 列各元素. 从向量线性组合的角度讲解矩阵乘法, 将矩阵与向量乘积 𝐴𝑥 作为关
于 𝐴 的列的线性组合, 使读者一开始就建立向量的线性组合这一重要概念.
第 2 章介绍线性方程组. 首先从行的角度考察线性方程组, 求解线性方程组等
价于求所有超平面的公共点;其次从列的角度考察线性方程组, 求解线性方程组
等价于求向量的线性组合系数. 从横纵两个角度讲解线性方程组有解的条件, 而不
是抽象地叙述理论, 使读者更直观、更深刻掌握线性方程组理论, 也加深了对第 1
章矩阵理论的理解, 为后续向量空间的学习打下基础, 并将线性方程组理论和向量
空间思想联系在一起. 在本章最后,基于线性方程组的理论系统地讲解了逆矩阵.
第 3 章介绍行列式. 结合矩阵的初等变换讲解行列式的性质使读者温故而知
新. 在讲解伴随矩阵的基础上, 引入行列式按行(列)展开的计算方法以及 Cramer
法则.
第 4 章介绍线性空间与线性变换. 主要介绍了基、子空间、内积空间、线性
变换等基本概念. 从向量投影角度讲解 Schmidt 正交化, 使读者深刻理解 Schmidt
正交化过程每一步的含义, 避免了硬记公式、学过就忘. 结合线性方程组理论, 以
向量正交投影为基础, 引入线性方程组无解情况下求其最小二乘解的意义和方法.
第 5 章介绍特征值与二次型. 介绍了特征值、特征向量、二次型、正定矩阵
等概念, 讨论了矩阵可对角化的条件, 揭示矩阵可对角化的内在原因是每个特征值
的几何重数与代数重数相等. 结合二次型引入了 Rayleigh 商, 这个概念对于技术
ii 前 言

科学类学生后续专业课程的学习是很有用的.
第 6 章介绍矩阵分解. 矩阵分解在解决实际工程问题中起着很大的作用. 将矩
阵表示为多个特殊矩阵的乘积, 实际上是对该矩阵中数据的预处理, 将其分解成多
个部分. 本章着重介绍了最常用的矩阵 LU 分解、QR 分解、 Cholesky 分解、谱分
解和奇异值分解.
第 7 章介绍矩阵的 Jordan 标准形. Jordan 标准形是初等矩阵理论一个核心内
容, 我们采用比较简单的 𝜆-矩阵的方法, 介绍了 𝜆-矩阵的标准形、 不变因子与初
等因子、两个矩阵相似当且仅当它们的特征矩阵等价, 从而证明任何一个矩阵都
相似于一个 Jordan 形矩阵. 然后, 把矩阵看成一个线性变换, 证明存在一组基, 使
得这个线性变换在这组基下的矩阵是 Jordan 形矩阵.
全书编写由阚海斌老师负责统筹安排, 其中第 1, 2, 5, 6 章由张巍老师编写、
第 3 章由张巍与阚海斌老师编写、第 4 章由张巍与倪卫明老师编写、第 7 章由阚
海斌与倪卫明老师编写. 最后, 阚海斌老师对全书作了修改和审定. 复旦大学 2015
级技术科学试验班的同学们为每章习题的编写提供了不少帮助, 对此表示衷心的
感谢.
限于编者的水平与经验, 不妥之处在所难免, 恳请各位专家、学者和读者提出
宝贵意见.
编 者
2016年2月29日
目 录

第1章 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 矩阵与向量的概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 矩阵的基本概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 向量的基本概念 ..........................................3


1.2 矩阵与向量的运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 ..................................... 4
矩阵(向量)的线性运算

1.2.2 向量的内积与矩阵的乘法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2.3 方阵的幂 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 分块矩阵及其运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1 分块矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.2 分块矩阵的基本运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4 矩阵的初等变换与秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.1 矩阵的初等变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2 矩阵的标准形与秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
第2章 线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1 横看线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.1 齐次线性方程组的解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.1.2 非齐次线性方程组的解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.2 纵看线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.1 线性相关与向量组的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.2.2 齐次线性方程组的基础解系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.2.3 非齐次线性方程组解的结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2.3 逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.1 可逆矩阵的定义与性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
iv 目 录

2.3.2 用初等变换求逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.3.3 正交阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.4 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
第3章 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1 行列式的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1.1 逆序数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.1.2 行列式的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.2 行列式的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.3 伴随矩阵与行列式按行(列)展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3.1 伴随矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3.2 行列式按行(列)展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.3.3 Cramer 法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.4 行列式与矩阵的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
第4章 线性空间与线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.1 线性空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2 基 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.1 基和坐标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.2 过渡矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.3 子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3.1 子空间的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4.3.2 零空间与列空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104


4.3.3 子空间的交与和 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.4 内积空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.4.1 内积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4.4.2 正交投影与最小二乘解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.4.3 Schmidt 正交化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

4.4.4 正交补空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

4.5 线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122


目 录 v

4.5.1 线性映射与线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4.5.2 线性变换的表示矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.5.3 正交变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127


4.6 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
第5章 特征值与二次型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.1 特征值与特征向量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.1.1 特征值与特征向量的概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.1.2 特征值与特征向量的求法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.1.3 特征向量的线性无关性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

5.2 矩阵的对角化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140


5.2.1 矩阵可对角化的条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

5.2.2 实对称矩阵的对角化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

5.3 二次型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148


5.3.1 二次型的基本概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.3.2 二次型的标准形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

5.3.3 Rayleigh 商 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

5.4 正定矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152


5.4.1 正定矩阵与半正定矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

5.4.2 负定矩阵与半负定矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

5.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
第6章 矩阵分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.1 LU 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.2 QR 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.3 Cholesky 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.4 谱分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.5 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.6 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
第7章 矩阵的Jordan 标准形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.1 多项式矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
vi 目 录

7.1.1 多项式矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

7.1.2 多项式矩阵的初等变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

7.1.3 不变因子和初等因子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

7.2 Jordan 标准形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190


7.2.1 多项式方阵的相似判定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

7.2.2 Jordan 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

7.3 Jordan 标准形的几何意义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200


7.4 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
第1章 矩 阵

1.1 矩阵与向量的概念
1.1.1 矩阵的基本概念

定义 1.1.1 由若干个数排成的 𝑚 行 𝑛 列矩形阵列


 
𝑎11 𝑎12 ··· 𝑎1𝑛
 
 𝑎
 21 𝑎22 ··· 𝑎2𝑛 

 .. .. ..
 

 . . . 
 
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛

称为 𝑚 × 𝑛 矩 阵(matrix). 习惯上用大写英文字母 𝐴 或者 [𝑎𝑖𝑗 ] 表示矩阵. 有时为了


指明行数与列数, 也可记为 𝐴𝑚×𝑛 或者 [𝑎𝑖𝑗 ]𝑚×𝑛 . 𝑎𝑖𝑗 称为矩阵的第 𝑖 行第 𝑗 列元

素 (entry), 在本书中有时也采用记号 entry(𝐴, 𝑖, 𝑗) 表示矩阵 𝐴 的第 𝑖 行第 𝑗 列元素.
设行数相等、 列数相等的两个矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 与 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 若它们的
所有元素对应相等, 即𝑎𝑖𝑗 = 𝑏𝑖𝑗 (𝑖 = 1, · · · , 𝑚; 𝑗 = 1, · · · , 𝑛), 则称矩阵 𝐴 与 𝐵 相
等, 记作 𝐴 = 𝐵.
定义 1.1.2 设 𝑚 × 𝑛 矩阵
 
𝑎11 𝑎12 ··· 𝑎1𝑛
 
 𝑎
 21 𝑎22 ··· 𝑎2𝑛 

𝐴=
 .. .. ..


 . . . 
 
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛

若将矩阵 𝐴 的行和列依次互换, 得到的 𝑛 × 𝑚 矩阵


 
𝑎11 𝑎21 · · · 𝑎𝑚1
 
 𝑎
 12 𝑎22 · · · 𝑎𝑚2 

 .. .. ..
 

 . . . 
 
𝑎1𝑛 𝑎2𝑛 · · · 𝑎𝑚𝑛
2 第1章 矩 阵

称为矩阵 𝐴 的转
转置矩 阵 (transpose matrix), 记作𝐴T . 显然, (𝐴T )T = 𝐴.
根据定义, 矩阵 𝐴 的第 𝑖 行第 𝑗 列元素与其转置矩阵 𝐴T 的第 𝑗 行第 𝑖 列元素
相同, 即 entry(𝐴, 𝑖, 𝑗) = entry(𝐴T , 𝑗, 𝑖).
例1.1.1 矩阵  
−1 0 1
 
𝐴=
 0 1 −1 

2 0 1
 
2 1 0 
𝐵=
2 3 1

的转置矩阵分别为  
−1 0 2
𝐴T = 
 
 0 1 0 

1 −1 1
 
2 2
𝐵T = 
 
 1 3 

0 1

若 矩 阵 的 所 有 元 素 均 为 0, 则 该 矩 阵 称 为 零 矩 阵 (zero matrix), 记 作 𝑂 或
者 𝑂𝑚×𝑛 .

当 𝑚 = 𝑛 时, 称 𝐴𝑚×𝑛 为 𝑛 阶方
方 阵 (square matrix); 该方阵从左上角至右下角
P𝑛
的元素 𝑎11 , 𝑎22 , · · · , 𝑎𝑛𝑛 称为对角线元素; 方阵 𝐴 的对角线元素之和 𝑖=1 𝑎𝑖𝑖 称
为该方阵的迹
迹(trace), 记作 tr(𝐴).
定义 1.1.3 若 𝑛 阶方阵 𝐴 满足 𝐴T = 𝐴, 则称 𝐴 为 对 称阵 (symmetric matrix).

若 𝑛 阶方阵 𝐴 的非对角线元素均为零, 即
 
𝑎1 0 ··· 0
 
0
 𝑎2 · · · 0 
𝐴=
 .. .. .. 

. . .
 
0 0 · · · 𝑎𝑛

则称该方阵为对
对角 阵(diagonal matrix), 记为 diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ). 显然, 对角阵是特
殊的对称阵. 特别地, 如果对角阵的对角线元素相等, 则该对角阵又称为纯
纯量 阵 .
1.1 矩阵与向量的概念 3

若方阵的所有对角线元素均为 1, 所有非对角线元素均为 0, 即
 
1 0 ··· 0
 

 0 1 ··· 0 
.. .. .. 
 


 . . . 

0 0 ··· 1

则称该方阵为单
单位 阵 (identity matrix), 记作 𝐼 或 𝐼𝑛 (其中 𝑛 表示阶数). 显然, 单位阵
是特殊的对称阵、对角阵、纯量阵.
定 义 1.1.4 设 𝑛 阶方阵 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 当 1 6 𝑗 < 𝑖 6 𝑛 时, 𝑎𝑖𝑗 = 0, 称 𝐴 为上
三角阵, 如下列第 1 个矩阵所示; 当 1 6 𝑖 < 𝑗 6 𝑛 时, 𝑎𝑖𝑗 = 0, 称 𝐴 为下三角阵, 如
下列第 2 个矩阵所示.
 
𝑎11 𝑎12 · · · 𝑎1𝑛
 
 0
 𝑎22 · · · 𝑎2𝑛 

 .. .. ..
 

 . . . 
 
0 0 · · · 𝑎𝑛𝑛
 
𝑎11 0 ··· 0
 
 𝑎
 21 𝑎22 ··· 0 

 .. .. ..
 

 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

上三角阵和下三角阵统称为三
三角 阵 (triangular matrix). 如果上(下)三角阵的主
对角线元素均为 0, 则称为严格上(下)三角阵.

1.1.2 向量的基本概念

定 义 1.1.5 由 𝑛 个数构成的有序数组 [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ] 称为 𝑛 元向量或 𝑛 维向


量(vector), 其中 𝑎𝑖 称为该 𝑛 元向量的第 𝑖 个元素, 习惯上用希腊字母 𝛼 或 𝛽 等表
示一个向量.
定 义1.1.6 设两个 𝑛 元向量 𝛼 与 𝛽, 若它们的所有对应元素相等时, 称向量 𝛼
与 𝛽 相等, 记作 𝛼 = 𝛽.
若向量的所有元素均为 0, 则该向量称为零
零向 量 (zero vector), 记作 0.
一个 𝑛 元向量可写成一行也可写成一列, 𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ] 称为 𝑛 元行向
4 第1章 矩 阵

量(row vector),  
𝑎1
 

 𝑎2 

𝛼=
 ..



 . 

𝑎𝑛

称为 𝑛 元列向量 (column vector). 𝑛 元行向量的转置是 𝑛 元列向量, 反之亦然. 书写


时为了节省空间, 通常将 𝑛 元列向量写成 𝑛 元行向量的转置 [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T .
本书所讲的 𝑛 元向量, 若不加声明一般均指 𝑛 元列向量.
𝑛 × 𝑚 矩阵的每一行可视为一个 𝑚 元行向量, 每一列可视为一个 𝑛 元列向量.
𝑚 元行向量可看作一个 1 × 𝑚 矩阵, 𝑛 元列向量可看作一个 𝑛 × 1 矩阵.

1.2 矩阵与向量的运算

1.2.1 矩阵(向量)的线性运算

定 义 1.2.1 设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 𝐶 = [𝑐𝑖𝑗 ]𝑚×𝑛 , 若满足 𝑐𝑖𝑗 =
𝑎𝑖𝑗 + 𝑏𝑖𝑗 (𝑖 = 1, · · · , 𝑚; 𝑗 = 1, · · · , 𝑛), 则 称 矩 阵 𝐶 为 𝐴 与 𝐵 的 和, 记 作 𝐶 =
𝐴 + 𝐵.
上述计算矩阵和的运算称为矩阵的加法.
两个矩阵只有在行数相等且列数相等时才可相加.
可以验证矩阵的加法满足:
(1) 𝐴 + 𝐵 = 𝐵 + 𝐴(交换律);
(2) (𝐴 + 𝐵) + 𝐶 = 𝐴 + (𝐵 + 𝐶)(结合律);
(3) (𝐴 + 𝐵)T = 𝐴T + 𝐵 T .
其中 𝐴, 𝐵 为行数相等且列数相等的矩阵.
定 义1.2.2 设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 𝑘 为某个数, 若满足 𝑏𝑖𝑗 =
𝑘𝑎𝑖𝑗 (𝑖 = 1, · · · , 𝑚; 𝑗 = 1, · · · , 𝑛), 则称 𝐵 为数 𝑘 与矩阵 𝐴 的数量乘积, 记作 𝐵 =
𝑘𝐴. 上述计算数与矩阵乘积的运算称为矩阵的数乘. 特别地, 若 𝑘 = −1, 则 𝐵 =
−𝐴, 称矩阵 𝐵 为 𝐴 的负矩阵.
数与任意一个矩阵相乘总是可行的.
设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 矩阵的减法可定义为: 𝐴 − 𝐵 = 𝐴 +
(−𝐵).
可以验证矩阵的数乘满足:
1.2 矩阵与向量的运算 5

(1) 𝑘(𝑙𝐴) = (𝑘𝑙)𝐴(结合律);


(2) (𝑘 + 𝑙)𝐴 = 𝑘𝐴 + 𝑙𝐴(分配律);
(3) 𝑘(𝐴 + 𝐵) = 𝑘𝐴 + 𝑘𝐵(分配律);
(4) (𝑘𝐴)T = 𝑘𝐴T .
其中 𝑘, 𝑙 为数, 𝐴, 𝐵 为行数相等且列数相等的矩阵.
由于 𝑛 元向量可看作是一个特殊的矩阵, 因此 𝑛 元向量的加法、 数乘运算与
矩阵的加法、 数乘运算定义一致. 通常将矩阵(向量)的加法、 数乘运算统称为矩
阵(向量)的线性运算.
定 义1.2.3 设一组 𝑛 元向量 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 , 𝛽, 若存在一组数 𝑘1 , 𝑘2 , · · · , 𝑘𝑚 ,
使得 𝛽 = 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑚 𝛼𝑚 , 则称向量 𝛽 是 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 的线性组
合(linear combination), 或称 𝛽 可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 线性表出, 𝑘1 , 𝑘2 , · · · , 𝑘𝑚 称为
线性组合系数或线性表出系数.
显然, 𝑛 元零向量 0 可由任意一组 𝑛 元向量线性表出.

1.2.2 向量的内积与矩阵的乘法

定 义1.2.4 设两个 𝑛 元向量 𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ] 与 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ], 向


P𝑛
量 𝛼 的元素与向量 𝛽 的对应元素乘积之和 𝑖=1 𝑎𝑖 𝑏𝑖 称为向量 𝛼 与 𝛽 的内积, 记
作 ⟨𝛼, 𝛽⟩.
注 上述定义中对向量是行向量还是列向量不作限制, 即 𝛼 可以是行向量也
可以是列向量, 同样, 𝛽 可以是行向量也可以是列向量.
定义 1.2.5 设矩阵 𝐴 = [𝑎𝑖𝑘 ]𝑚×𝑙 , 𝐵 = [𝑏𝑘𝑗 ]𝑙×𝑛 , 𝐶 = [𝑐𝑖𝑗 ]𝑚×𝑛 , 若满足

𝑙
X
𝑐𝑖𝑗 = 𝑎𝑖𝑘 𝑏𝑘𝑗 (𝑖 = 1, 2, · · · , 𝑚; 𝑗 = 1, 2, · · · , 𝑛)
𝑘=1

则称矩阵 𝐶 为 𝐴 与 𝐵 的乘积, 记作 𝐶 = 𝐴𝐵. 上述计算矩阵乘积的运算称为矩阵


的乘法.
仅当矩阵 𝐴 的列数等于矩阵 𝐵 的行数时, 矩阵 𝐴 与矩阵 𝐵 方可相乘; 乘
积 𝐴𝐵 也是一个矩阵, 其行数等于矩阵 𝐴 的行数, 其列数等于矩阵 𝐵 的列数; 乘积
矩阵 𝐴𝐵 的第 𝑖 行第 𝑗 列元素等于 𝐴 的第 𝑖 行向量与 𝐵 的第 𝑗 列向量的内积.
为了方便起见, 采用记号 entry(𝐴𝐵, 𝑖, 𝑗) 表示乘积矩阵 𝐴𝐵 的第 𝑖 行第 𝑗 列元
素, row(𝐴, 𝑖) 表示矩阵 𝐴 的第 𝑖 行元素组成的行向量, col(𝐵, 𝑗) 表示矩阵 𝐵 的
第 𝑗 列元素组成的列向量, 则上述矩阵乘法定义可表述为
entry(𝐴𝐵, 𝑖, 𝑗) = ⟨row(𝐴, 𝑖), col(𝐵, 𝑗)⟩
6 第1章 矩 阵

由 于 𝑙 元 行 向 量 row(𝐴, 𝑖) 和 𝑙 元 列 向 量 col(𝐵, 𝑗) 分 别 可 以 看 作 是 1 × 𝑙 矩 阵
和 𝑙 × 1 矩阵, 根据 矩阵乘法的 定义, row(𝐴, 𝑖) 与 col(𝐵, 𝑗) 的乘积等于它们的
内积 row(𝐴, 𝑖)col(𝐵, 𝑗) = ⟨row(𝐴, 𝑖), col(𝐵, 𝑗)⟩, 因此上式还可写为:
(1) entry(𝐴𝐵, 𝑖, 𝑗) = row(𝐴, 𝑖)col(𝐵, 𝑗).
进一步, 不难验证以下有用的等式:
P𝑙
(2) row(𝐴𝐵, 𝑖) = row(𝐴, 𝑖)𝐵 = 𝑘=1 𝑎𝑖𝑘 row(𝐵, 𝑘).
P𝑙
(3) col(𝐴𝐵, 𝑗) = 𝐴col(𝐵, 𝑗) = 𝑘=1 𝑏𝑘𝑗 col(𝐴, 𝑘).

(2) 式表明矩阵乘积 𝐴𝐵 的第 𝑖 行向量是矩阵 𝐵 的所有行向量的线性组合, 组


合系数为 𝐴 的第 𝑖 行各元素, 即 row(𝐴𝐵, 𝑖) 只与矩阵 𝐴 的第 𝑖 行有关, 与 𝐴 的其
余行无关; (3) 式表明矩阵乘积 𝐴𝐵 的第 𝑗 列向量是矩阵 𝐴 的所有列向量的线性组
合, 组合系数为 𝐵 的第 𝑗 列各元素, 即 col(𝐴𝐵, 𝑗) 只与矩阵 𝐵 的第 𝑗 列有关, 与 𝐵
的其余列无关.
可以看出, (1) 式提供了逐个元素求矩阵乘积的算法, 是最细粒度的计算方式;
(2) 式和(3) 式分别提供了逐行和逐列求矩阵乘积的算法, 是较粗粒度的计算方式.
在矩阵乘法的实际计算和问题分析中, (2)式和(3)式有时能使我们对矩阵乘积的计
算更加便捷、认识更加清晰.
更进一步, 还可验证以下等式:
P𝑙
(4) 𝐴𝐵 = 𝑘=1 col(𝐴, 𝑘)row(𝐵, 𝑘).
从(4) 式看出, 矩阵乘积 𝐴𝐵 等于若干个 𝑚 × 𝑛 矩阵 col(𝐴, 𝑘)row(𝐵, 𝑘) 的和.
例 1.2.1 设
   
−1 0 2 2 2
   
𝐴=
 0 1 ,
0  𝐵=
 1 3 

1 −1 1 0 1

求 𝐴𝐵 的第 2 行以及第 1 列.
解 𝐴𝐵 的第 2 行

row(𝐴𝐵, 2) = row(𝐴, 2)𝐵


= 0 × row(𝐵, 1) + 1 × row(𝐵, 2) + 0 × row(𝐵, 3)
= row(𝐵, 2) = [1, 3]

𝐴𝐵 的第 1 列
1.2 矩阵与向量的运算 7

col(𝐴𝐵, 1) = 𝐴col(𝐵, 1)
       
−1 0 2 −2
       
=2×
 0 +1× 1 +0× 0 = 1 
      

1 −1 1 1

例1.2.2 设
     
1 −1  2 0  1 1 
𝐴= , 𝐵= , 𝐶=
−1 1 0 −2 −1 −1

求 𝐴𝐵, 𝐴𝐶, 𝐶𝐴.



    
1 −1   2 0   2 2 
𝐴𝐵 =  =
−1 1 0 −2 −2 −2
    
1 −1   1 1   2 2 
𝐴𝐶 =  =
−1 1 −1 −1 −2 −2
    
1 1   1 −1   0 0 
𝐶𝐴 =  =
−1 −1 −1 1 0 0

从例1.2.2可以看出:
(1) 矩阵乘法的交换律不成立. 首先, 矩阵 𝐴 可以左乘矩阵 𝐶 并不意味着可以
右乘 𝐶, 可能 𝐴𝐶 与 𝐶𝐴 并非同时有意义; 其次, 即使同时有意义, 也不一定相等.
在矩阵相乘时, 必须考虑是否有意义, 而且说明是左乘还是右乘.
(2) 已知 𝐴𝐶 = 𝑂, 无法推出 𝐴 = 𝑂 或 𝐶 = 𝑂; 已知 𝐴𝐶 = 𝑂, 𝐴 ̸= 𝑂, 无法
推出 𝐶 = 𝑂.
(3) 已 知 𝐴𝐵 = 𝐴𝐶, 𝐴 ̸= 𝑂, 无 法 推 出 𝐵 = 𝐶. 这 是 因 为 𝐴𝐵 = 𝐴𝐶,
即 𝐴(𝐵−𝐶) = 𝑂, 尽管 𝐴 ̸= 𝑂, 但由 (2) 知, 不能推出 𝐵 − 𝐶 = 𝑂.
可以验证矩阵的乘法满足:
(1) (𝐴𝐵)𝐶 = 𝐴(𝐵𝐶) (结合律);
(2) 𝐶(𝐴 + 𝐵) = 𝐶𝐴 + 𝐶𝐵 (分配律);
(3) (𝐴 + 𝐵)𝐶 = 𝐴𝐶 + 𝐵𝐶 (分配律);
(4) 𝑘(𝐴𝐵) = (𝑘𝐴)𝐵 = 𝐴(𝑘𝐵).
8 第1章 矩 阵

其中 𝑘为数, 矩阵 𝐴, 𝐵, 𝐶 的阶数使上述各式有意义.
性质 1.2.1 设矩阵 𝐴𝑚×𝑙 , 𝐵𝑙×𝑛 , 则 (𝐴𝐵)T = 𝐵 T 𝐴T .
证明
𝑙
X
entry((𝐴𝐵)T , 𝑖, 𝑗) = entry(𝐴𝐵, 𝑗, 𝑖) = row(𝐴, 𝑗)col(𝐵, 𝑖) = 𝑎𝑗𝑘 𝑏𝑘𝑖
𝑘=1

entry(𝐵 T 𝐴T , 𝑖, 𝑗) = row(𝐵 T , 𝑖)col(𝐴T , 𝑗) = col(𝐵, 𝑖)T row(𝐴, 𝑗)T


𝑙
X
= 𝑏𝑘𝑖 𝑎𝑗𝑘
𝑘=1

故 entry((𝐴𝐵)T , 𝑖, 𝑗) = entry(𝐵 T 𝐴T , 𝑖, 𝑗), 从而 (𝐴𝐵)T = 𝐵 T 𝐴T .


性质 1.2.2 设矩阵 𝐴𝑚×𝑛 , 𝐵𝑛×𝑚 , 则 tr(𝐴𝐵) = tr(𝐵𝐴).

证明

𝑚
X 𝑚
X 𝑚 X
X 𝑛
tr(𝐴𝐵) = entry(𝐴𝐵, 𝑖, 𝑖) = row(𝐴, 𝑖)col(𝐵, 𝑖) = 𝑎𝑖𝑘 𝑏𝑘𝑖
𝑖=1 𝑖=1 𝑖=1 𝑘=1
X𝑛 X𝑛 X𝑛 X 𝑚
tr(𝐴𝐵) = entry(𝐴𝐵, 𝑘, 𝑘) = row(𝐵, 𝑘)col(𝐴, 𝑘) = 𝑏𝑘𝑖 𝑎𝑖𝑘
𝑘=1 𝑘=1 𝑘=1 𝑖=1

故 tr(𝐴𝐵) = tr(𝐵𝐴).
例1.2.3 设

𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T , 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ]


 
𝑎1 𝑏1 𝑎1 𝑏2 · · · 𝑎1 𝑏𝑛
 
 𝑎 𝑏
 2 1 𝑎2 𝑏2 · · · 𝑎2 𝑏𝑛 

𝛼𝛽 = 
 .. .. ..


 . . . 
 
𝑎𝑛 𝑏1 𝑎𝑛 𝑏2 · · · 𝑎𝑛 𝑏𝑛
𝑛
X
𝛽𝛼 = 𝑎𝑖 𝑏𝑖
𝑖=1
1.2 矩阵与向量的运算 9

例1.2.4 设
 
𝑎11 𝑎12 · · · 𝑎1𝑛
 
 𝑎
 21 𝑎22 · · · 𝑎2𝑛 
𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T

𝐴=
 .. .. ..
,

 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

则  P𝑛 
𝑎 𝑥
 𝑗=1 1𝑗 𝑗 
 
 P𝑛 
 𝑎2𝑗 𝑥𝑗  𝑛
X
𝑥T 𝐴𝑥 =
 
𝐴𝑥 =  𝑗=1 , 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗
..
 
  𝑖,𝑗=1

 . 

 P𝑛 
𝑎𝑛𝑗 𝑥𝑗
𝑗=1

性 质1.2.3 设 𝐴 为 𝑚 × 𝑛 矩阵, 𝐼𝑚 和 𝐼𝑛 分别为 𝑚 阶单位阵和 𝑛 阶单位阵,


则 𝐼𝑚 𝐴 = 𝐴𝐼𝑛 = 𝐴.
性 质 1.2.4 设 𝐴 = diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ), 𝐵 = diag(𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ), 则𝐴𝐵 =
𝐵𝐴 = diag(𝑎1 𝑏1 , 𝑎2 𝑏2 , · · · , 𝑎𝑛 𝑏𝑛 ).
上述 2 个性质可由矩阵乘法法则直接得到, 读者自行完成证明.
性 质1.2.5 设 𝐴 与 𝐵 均为 𝑛 阶上(下)三角阵, 则 𝐴𝐵 是上(下)三角阵.
证明 因为 𝐴 与 𝐵 均为 𝑛 阶上三角阵,故

row(𝐴, 𝑖) = [0, · · · , 0, 𝑎𝑖𝑖 , · · · , 𝑎𝑖𝑛 ]


col(𝐵, 𝑗) = [𝑏1𝑗 , · · · , 𝑏𝑗𝑗 , 0, · · · , 0]T

当 𝑖 > 𝑗 时,

𝑛
X
entry(𝐴𝐵, 𝑖, 𝑗) = row(𝐴, 𝑖)col(𝐵, 𝑗) = 𝑎𝑖𝑘 𝑏𝑘𝑗 = 0
𝑘=1

从而 𝐴𝐵 是上三角阵. 类似地可证, 两个下三角阵的积是下三角阵.


例1.2.5 设 𝑛 阶矩阵 𝐴 和 𝐵 的每列元素之和均为1,
(1) 计算 1T 𝐴 和 1T 𝐵, 其中 1 为 𝑛 元列向量 1 = [1, 1, · · · , 1]T ;
(2) 证明矩阵 𝐴𝐵 的每列元素之和均为 1.
10 第1章 矩 阵

解 (1)易知 1T 𝐴 和 1T 𝐵 均为 1 × 𝑛 矩阵, 即 𝑛 元行向量, 因为 𝐴 和 𝐵 的每


列元素之和均为 1,

𝑛
X 𝑛
X
1T col(𝐴, 𝑗) = 𝑎𝑖𝑗 = 1, 1T col(𝐵, 𝑗) = 𝑏𝑖𝑗 = 1 (𝑗 = 1, 2, · · · , 𝑛)
𝑖=1 𝑖=1

所以 col(1T 𝐴, 𝑗) = 1T col(𝐴, 𝑗) = 1, col(1T 𝐵, 𝑗) = 1T col(𝐵, 𝑗) = 1, 即 1 × 𝑛 矩


阵 1T 𝐴 和 1T 𝐵 的每一列均为1, 故 1T 𝐴 = 1T , 1T 𝐵 = 1T .
(2)因为矩阵 𝐴𝐵 的第 𝑗 列元素之和为

1T col(𝐴𝐵, 𝑗) = 1T 𝐴col(𝐵, 𝑗) = (1T 𝐴)col(𝐵, 𝑗) = 1T col(𝐵, 𝑗) = 1

1.2.3 方阵的幂

定 义 1.2.6 设 𝐴 是 𝑛 阶方阵, 𝑘 为非负整数, 则 𝑘 个 𝐴 的乘积称为方阵 𝐴 的 𝑘


次幂, 记作 𝐴𝑘 , 并规定 𝐴0 = 𝐼.
由定义可得 𝐴𝑘 𝐴𝑙 = 𝐴𝑘+𝑙 , (𝐴𝑘 )𝑙 = 𝐴(𝑘𝑙) , 其中 𝐴 为方阵, 𝑘, 𝑙 为非负整数.
需要注意的是 (𝐴𝐵)𝑘 = (𝐴𝐵)(𝐴𝐵) · · · (𝐴𝐵) ̸= 𝐴𝑘 𝐵 𝑘 , (𝐴 + 𝐵)2 = 𝐴2 +
| {z }
𝑘
𝐴𝐵 + 𝐵𝐴 + 𝐵 2 ̸= 𝐴2 + 2𝐴𝐵 + 𝐵 2 . 这是因为矩阵乘法交换律一般不成立. 当且
仅当 𝐴𝐵 = 𝐵𝐴 时, 上两式中最右边的等号才成立.

(𝐴 + 𝐼)(𝐴 − 𝐼) = (𝐴 − 𝐼)(𝐴 + 𝐼) = 𝐴2 − 𝐼

这是因为 𝐴𝐼 = 𝐼𝐴 = 𝐴.
不难验证, 如果 𝐴 = diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ), 则 𝐴𝑘 = diag(𝑎𝑘1 , 𝑎𝑘2 , · · · , 𝑎𝑘𝑛 ).

1.3 分块矩阵及其运算

1.3.1 分块矩阵

矩阵分块是通过在矩阵的行或列之间划几条水平或竖直分割线, 将给定的矩
阵分成若干较低阶的子矩阵(submatrix). 对于同一矩阵, 可以有不同的分块方式. 分
块是为了使问题简化. 在实际问题中, 要结合给定矩阵的特点采用分块策略. 一般
1.3 分块矩阵及其运算 11

地, 设 𝑚 × 𝑛 矩阵 𝐴, 将矩阵 𝐴 分块, 得
 
𝐴11 𝐴12 · · · 𝐴1𝑞
 
 𝐴
 21 𝐴22 · · · 𝐴2𝑞 

𝐴=
 .. .. ..


 . . . 
 
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞

其中 𝐴𝑖𝑗 (𝑖 = 1, 2, · · · , 𝑝; 𝑗 = 1, 2, · · · , 𝑞)为 𝑚𝑖 × 𝑛𝑗 子矩阵, 同一行的子矩阵行数相


同, 同一列的子矩阵列数相同, 且 𝑚1 + 𝑚2 + · · · + 𝑚𝑝 = 𝑚, 𝑛1 + 𝑛2 + · · · + 𝑛𝑞 = 𝑛.
例1.3.1 设矩阵  
5 0 0 0 0 0
 

 0 2 0 0 0 0 

 
 0 1 2 0 0 0 
𝐴=
 


 0 0 1 2 0 0 

 

 0 0 0 0 7 0 

0 0 0 0 0 7

根据其特点, 可分块为
 
5 0 0 0 0 0
 

 0 2 0 0 0 0 

 
 0 1 2 0 0 0 
𝐴=
 


 0 0 1 2 0 0 

 

 0 0 0 0 7 0 

0 0 0 0 0 7

记  
2 0 0  
  7 0 
𝐴11 = [5], 𝐴22 =
 1 2 ,
0  𝐴33 =
0 7
0 1 2

则  
𝐴11 𝑂 𝑂
 
𝐴=
 𝑂 𝐴22 𝑂 

𝑂 𝑂 𝐴33
12 第1章 矩 阵

例1.3.2 设 𝑚 × 𝑛 矩阵 𝐴, 如果按行分块将矩阵的每一行作为一个子矩阵, 得
 
row(𝐴, 1)
 
 row(𝐴, 2) 
 
𝐴=
 ..



 . 

row(𝐴, 𝑚)

如果按列分块将矩阵的每一列作为一个子矩阵, 我们可以得到

𝐴 = [col(𝐴, 1), col(𝐴, 2), · · · , col(𝐴, 𝑛)]

1.3.2 分块矩阵的基本运算

1.转置

设分块矩阵  
𝐴11 𝐴12 · · · 𝐴1𝑞
 
 𝐴
 21 𝐴22 · · · 𝐴2𝑞 

𝐴=
 .. .. ..


 . . . 
 
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞

则其转置矩阵为  
𝐴T
11 𝐴T
21 · · · 𝐴T
𝑝1
 
 𝐴T 𝐴T · · · 𝐴T 
 12 22 𝑝2
𝐴T = 

 .. .. ..


 . . . 
 
𝐴T
1𝑞 𝐴T
2𝑞 · · · 𝐴T
𝑝𝑞

2.加法

设 𝐴与 𝐵 均为 𝑚 × 𝑛 矩阵, 对 𝐴 与 𝐵 以相同的方式进行分块,
   
𝐴11 𝐴12 · · · 𝐴1𝑞 𝐵11 𝐵12 · · · 𝐵1𝑞
   
 𝐴
 21 𝐴22 · · · 𝐴2𝑞 

 𝐵
 21 𝐵22 · · · 𝐵2𝑞 

𝐴=
 .. .. ..
,
 𝐵=
 .. .. ..


 . . .   . . . 
   
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞 𝐵𝑝1 𝐵𝑝2 · · · 𝐵𝑝𝑞
1.3 分块矩阵及其运算 13

其中 𝐴𝑖𝑗 , 𝐵𝑖𝑗 (𝑖 = 1, 2, · · · , 𝑝; 𝑗 = 1, 2, · · · , 𝑞) 均为 𝑚𝑖 × 𝑛𝑗 矩阵, 则


 
𝐴11 + 𝐵11 𝐴12 + 𝐵12 · · · 𝐴1𝑞 + 𝐵1𝑞
 
 𝐴 +𝐵
 21 21 𝐴22 + 𝐵22 · · · 𝐴2𝑞 + 𝐵2𝑞 

𝐴+𝐵 =
 .. .. ..



 . . . 

𝐴𝑝1 + 𝐵𝑝1 𝐴𝑝2 + 𝐵𝑝2 · · · 𝐴𝑝𝑞 + 𝐵𝑝𝑞

3.数乘

设 𝑘为数, 𝐴 为 𝑚 × 𝑛 矩阵, 𝐴 的分块方式同上, 则


 
𝑘𝐴11 𝑘𝐴12 · · · 𝑘𝐴1𝑞
 
 𝑘𝐴
 21 𝑘𝐴22 · · · 𝑘𝐴2𝑞 

𝑘𝐴 = 
 .. .. ..



 . . . 

𝑘𝐴𝑝1 𝑘𝐴𝑝2 · · · 𝑘𝐴𝑝𝑞

4.乘法

设 𝐴 与 𝐵 分别为 𝑚 × 𝑠 和 𝑠 × 𝑛 矩阵, 对矩阵 𝐴 的列分块方式与对矩阵 𝐵 的


行分块方式一致,
   
𝐴11 𝐴12 · · · 𝐴1𝑡 𝐵11 𝐵12 · · · 𝐵1𝑞
   
 𝐴
 21 𝐴22 · · · 𝐴2𝑡 

 𝐵
 21 𝐵22 · · · 𝐵2𝑞 

𝐴=
 .. .. ..
,
 𝐵=
 .. .. ..


 . . .   . . . 
   
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑡 𝐵𝑡1 𝐵𝑡2 · · · 𝐵𝑡𝑞

其中 𝐴𝑖𝑘 是 𝑚𝑖 × 𝑠𝑘 子矩阵, 𝐵𝑘𝑗 是 𝑠𝑘 × 𝑛𝑗 子矩阵 (𝑖 = 1, 2, · · · , 𝑝; 𝑘 = 1, 2, · · · , 𝑡;


𝑗 = 1, 2, · · · , 𝑞), 则

 
𝐶11 · · · 𝐶1𝑗 · · · 𝐶1𝑞
 .. .. .. 
. . .
 
 
 
𝐴𝐵 =  𝐶𝑖1 ··· 𝐶𝑖𝑗 ··· 𝐶𝑖𝑞
 

 
 . .. ..
 ..

 . . 

𝐶𝑝1 · · · 𝐶𝑝𝑗 · · · 𝐶𝑝𝑞
14 第1章 矩 阵

其中
𝑡
X
𝐶𝑖𝑗 = 𝐴𝑖𝑘 𝐵𝑘𝑗
𝑘=1

上述分块矩阵的转置、加法、数乘、乘法, 均可由矩阵的转置、加法、数乘、
乘法等运算规则导出, 留给读者自行验证.
例1.3.3 设
   
1 5 1 0 0 0 0 0 0
   
 2
 −1 0 1 0 

 0
 0 0 4 

   
𝐴=
 3 ,
0 0 0 1  𝐵=
 2 4 8 0 

   
 3 0 0 0 0   1 21 0 
   
0 3 0 0 0 3 −1 0 0

利用分块矩阵计算 𝐴𝐵.
解 将矩阵 𝐴, 𝐵 分块如下

 
1 5 1 0 0
 
 2 −1 0 1 0   
𝐴 𝐼3 
 
 11
 
𝐴=
 3 0 0 0 =
1 
  3𝐼2 𝑂2×3
 3 0 0 0 0 
 
0 3 0 0 0

 
0 0 0 0
 
 0 0 0 4   
𝑂 𝐵
 
 2×3 12
 
𝐵=
 2 4 =
8 0  
  𝐵21 𝑂3×1
 1 2 1 0 
 
3 −1 0 0


  
𝐴
 11
𝐼3  𝑂2×3 𝐵12 
𝐴𝐵 =
3𝐼2 𝑂2×3 𝐵21 𝑂3×1
 
𝐵
 21
𝐴11 𝐵12 
=
𝑂2×3 3𝐵21
1.3 分块矩阵及其运算 15

由于    
1 5   20  
  0   0 
𝐴11 𝐵12 =
 2 −1    =  −4  , 3𝐵12 =
4 12
  
3 0 0

于是得  
2 4 8 20
 
 1
 2 1 −4 

 
𝐴𝐵 = 
 3 −1 0 0 
 
 0 0 0 0 
 
0 0 0 12

例1.3.4 设 𝐴 与 𝐵 分别为 𝑚 × 𝑙 和 𝑙 × 𝑛 矩阵, 若对矩阵 𝐴 按行分块, 矩阵 𝐵


不分块, 则由分块矩阵的乘法, 有
   
row(𝐴, 1) row(𝐴, 1)𝐵
   
 row(𝐴, 2)   row(𝐴, 2)𝐵 
   
𝐴𝐵 = 
 ..
𝐵 = 
  ..



 . 


 . 

row(𝐴, 𝑚) row(𝐴, 𝑚)𝐵

若对矩阵 𝐴 不分块, 矩阵 𝐵 按列分块, 则

𝐴𝐵 = 𝐴[col(𝐵, 1), col(𝐵, 2), · · · , col(𝐵, 𝑛)]


= [𝐴col(𝐵, 1), 𝐴col(𝐵, 2), · · · , 𝐴col(𝐵, 𝑛)]

若对矩阵𝐴 按行分块, 矩阵 𝐵 按列分块, 则


 
row(𝐴, 1)
 
 row(𝐴, 2) 
 
𝐴𝐵 =   [col(𝐵, 1), col(𝐵, 2), · · · , col(𝐵, 𝑛)]
 .. 

 . 

row(𝐴, 𝑚)
𝑙
X
= col(𝐴, 𝑘)row(𝐵, 𝑘)
𝑘=1

这就利用分块矩阵的方法验证了1.2 节的等式
16 第1章 矩 阵

row(𝐴𝐵, 𝑖) = row(𝐴, 𝑖)𝐵


col(𝐴𝐵, 𝑗) = 𝐴col(𝐵, 𝑗)
𝑙
X
𝐴𝐵 = col(𝐴, 𝑘)row(𝐵, 𝑘)
𝑘=1

例1.3.5 设 𝑚 × 𝑛 矩阵 𝐴 按列分块 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ], 则

𝐴𝐴T = 𝛼1 𝛼T + 𝛼2 𝛼T T
2 + · · · + 𝛼 𝑛 𝛼𝑛

 
𝛼T T T
1 𝛼1 𝛼1 𝛼2 · · · 𝛼1 𝛼𝑛
 
 𝛼T 𝛼 𝛼T T
2 𝛼2 · · · 𝛼2 𝛼𝑛

T
 2 1 
𝐴 𝐴=
 .. .. ..



 . . . 

𝛼T T T
𝑛 𝛼1 𝛼𝑛 𝛼2 · · · 𝛼 𝑛 𝛼𝑛

1.4 矩阵的初等变换与秩

1.4.1 矩阵的初等变换

定义 1.4.1 矩阵 𝐴 的初等行(列)变换是指下列 3 种变换:


(1)将 𝐴 的第 𝑖 行(列)与第 𝑗 行(列)对换;
(2)将 𝐴 的第 𝑖 行(列)乘以非零常数 𝑘;
(3)将 𝐴 第 𝑖 行(列)的 𝑘 倍加到第 𝑗 行(列).
矩阵的初等行变换与初等列变换统称为矩阵的初等变换.

如果对矩阵 𝐴 进行了一次初等行(列)变换, 为使其变回原来的矩阵, 只需再进


行一次相应的逆变换即可:

(1)将 𝐴 的第 𝑖 行(列)与第 𝑗 行(列)对换;


1
(2)将 𝐴 的第 𝑖 行(列)乘以非零常数 ;
𝑘
(3)将 𝐴 第 𝑖 行(列)的 −𝑘 倍加到第 𝑗 行(列).
显然, 上述三种逆变换本身也是初等变换.
矩阵的 3 种初等行变换可分别采用如下记号:
1.4 矩阵的初等变换与秩 17

   
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
   
   

 . . . 


 . . . 

   
 𝑎𝑖1
 𝑎𝑖2 ··· 𝑎𝑖𝑛 

 𝑎𝑗1
 𝑎𝑗2 ··· 𝑎𝑗𝑛 

 . .. ..  𝑅𝑖𝑗  . .. .. 
 .. . .  −−→  .. . . 
   
   
 𝑎
 𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛 

 𝑎
 𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 

 .. .. ..  .. .. ..
   
 
 . . .   . . . 
   
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛
   
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
 .. .. ..   .. .. .. 
. . . . . .
   
   
   
 𝑘𝑅𝑖 
 𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛  −−→  𝑘𝑎𝑖1 𝑘𝑎𝑖2 · · · 𝑘𝑎𝑖𝑛
 

   
 . .. ..  . .. ..
 ..  ..
 
 . . 
  . . 

𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 ··· 𝑎𝑚𝑛

   
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
   
   

 . . . 


 . . . 

   
 𝑎𝑖1
 𝑎𝑖2 ··· 𝑎𝑖𝑛 


 𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 

 . .. ..  𝑅𝑗 +𝑘𝑅𝑖  .. .. .. 
 .. . .  −−−−−→  . . . 
   
   
 𝑎
 𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛 

 𝑎 + 𝑘𝑎
 𝑗1 𝑖1 𝑎𝑗2 + 𝑘𝑎𝑖2 · · · 𝑎𝑗𝑛 + 𝑘𝑎𝑖3 

 .. .. .. .. .. ..
   
  
 . . .   . . . 
   
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 ··· 𝑎𝑚𝑛

相应的3 种初等列变换可分别在箭号 −→ 上方记为 𝐶𝑖𝑗 , 𝑘𝐶𝑖 , 𝐶𝑗 + 𝑘𝐶𝑖 . 因为矩阵


经初等变换所得的矩阵与原矩阵并不相等, 故进行初等变换不能用等号, 一般用箭
号 −→.
例 1.4.1 设矩阵  
0 1 1 2
 
𝐴=
 2 3 2 5 

3 1 −1 −1

现对其作如下初等行变换
18 第1章 矩 阵

 
2 3 2 5
 
2 3 2 5  
𝑅12  𝑅3 − 32 𝑅1 

𝐴 −−→  2  −−−−−→  0 1 1 2 
 0 1 1  
7 17
 
0 − −4 −
 
3 1 −1 −1 2 2
 
2 3 2 5
 
𝑅3 + 27 𝑅2

−−−−−→  0 11 2 

1 3
 
0 0 − −
 
2 2
 
2 3 2 5
𝑅3 ×(−2)  
−−−−−→   0 1 1 2 

0 0 1 3

定 义1.4.2 由 单 位 矩 阵 𝐼𝑛 经 过 一 次 初 等 变 换 得 到 的 矩 阵, 称 为 初 等 矩
阵(elementary matrix). 初等矩阵通常记作大写英文字母 𝐸.

对于 3 种初等变换, 相应的初等矩阵分别为:

(1) 第一类初等矩阵 𝐸𝑖𝑗 表示将单位阵 𝐼𝑛 的第 𝑖 行(列)与第 𝑗 行 (列)对换后得


到的矩阵
 
1
 
 .. 

 . 

 

 0 ··· 1 i 行


𝐸𝑖𝑗 =  .. .. 
 . . 

j 行
 

 1 ··· 0 
..
 
.
 
 
 
1

(2) 第二类初等矩阵 𝐸𝑖 (𝑘) 表示将单位阵 𝐼𝑛 的第 𝑖 行(列)乘以非零常数 𝑘 后得


到的矩阵
 
1
..
 
.
 
 
 
𝐸𝑖 (𝑘) =  𝑘 i 行
 
 
 .. 

 . 

1
1.4 矩阵的初等变换与秩 19

(3) 第三类初等矩阵 𝐸𝑖𝑗 (𝑘) 表示将单位阵 𝐼𝑛 的第 𝑖 行(第 𝑗 列) 乘以任意常数 𝑘


后加到第 𝑗 行(第 𝑖 列)上得到的矩阵

 
1
 
 .. 

 . 

 

 1 ··· 0 i 行

 .. .. 
𝐸𝑖𝑗 (𝑘) =
 . . 

j 行
 

 𝑘 ··· 1 
..
 
.
 
 
 
1

定 理 1.4.1 对矩阵 𝐴𝑚×𝑛 作一次初等行变换, 相当于在 𝐴𝑚×𝑛 的左边乘上一


个相应的 𝑚 阶初等矩阵; 对矩阵 𝐴𝑚×𝑛 作一次初等列变换, 相当于在 𝐴𝑚×𝑛 的右
边乘上一个相应的 𝑛 阶初等矩阵.
证明 下面只对初等行变换进行证明, 对初等列变换的证明类似. 对矩阵 𝐴
按行分块
 
row(𝐴, 1)
 
 row(𝐴, 2) 
 
𝐴=
 ..



 . 

row(𝐴, 𝑚)


    
1 row(𝐴, 1) row(𝐴, 1)
.. ..
    
 ..    

 . 
 . 


 . 

    

 0 ··· 1   row(𝐴, 𝑖) 
 
 row(𝐴, 𝑗)



 .. ..  .
.
  .. 
𝐸𝑖𝑗 𝐴 = 
 . . 
 .  =
  . 

    

 1 ··· 0   row(𝐴, 𝑗) 
 
 row(𝐴, 𝑖)




..

..  
.. 
.
    



 . 


 . 

1 row(𝐴, 𝑚) row(𝐴, 𝑚)

这相当于将 𝐴 的第 𝑖 行与第 𝑗 行对换;


20 第1章 矩 阵

    
1 row(𝐴, 1) row(𝐴, 1)

..
 ..   .. 
. . .
    
    
    
𝐸𝑖 (𝑘)𝐴 =  𝑘   row(𝐴, 𝑖)  =  𝑘row(𝐴, 𝑖)
    

    
 ..  ..   .. 

 . 
 .  
  . 

1 row(𝐴, 𝑚) row(𝐴, 𝑚)

这相当于将 𝐴 的第 𝑖 行乘以非零常数 𝑘;
  
1 row(𝐴, 1)
..
  
 ..  

 . 
 . 

  

 1 ··· 0   row(𝐴, 𝑖) 
 
 .. ..  .. 
𝐸𝑖𝑗 (𝑘)𝐴 = 
 . . 
 . 

  

 𝑘 ··· 1   row(𝐴, 𝑗) 
 

..

.. 
.
  



 . 

1 row(𝐴, 𝑚)
 
row(𝐴, 1)
..
 
 

 . 

 

 row(𝐴, 𝑖) 

 .. 
=
 . 

 
 𝑘row(𝐴, 𝑖) + row(𝐴, 𝑗) 
 

 .. 


 . 

row(𝐴, 𝑚)

这相当于将 𝐴 的第 𝑖 行的 𝑘 倍加到第 𝑗 行.

1.4.2 矩阵的标准形与秩

定 义 1.4.3 若 𝑚 × 𝑛 矩阵的左上角子矩阵为单位阵 𝐼𝑟 , 其余子矩阵为零矩阵,


即  

𝐼𝑟 𝑂𝑟×(𝑛−𝑟) 
𝑂(𝑚−𝑟)×𝑟 𝑂(𝑚−𝑟)×(𝑛−𝑟)
1.4 矩阵的初等变换与秩 21

则称该矩阵为 𝑚 × 𝑛 矩阵的标
标准 形 .
由矩阵初等变换的定义, 可以得到下面的引理.
引理 1.4.1 设两个 𝑚 × 𝑛 矩阵的标准形如下所示
   
𝐼𝑟 𝑂  𝐼𝑟 𝑂 
𝑃1 =  1 , 𝑃2 =  2
𝑂 𝑂 𝑂 𝑂

如果 𝑟1 ̸= 𝑟2 , 则 𝑃2 不能由 𝑃1 经过初等变换得到.
定理 1.4.2 任一非零矩阵经有限次初等变换可化为标准形
 
𝐼
 𝑟
𝑂 
𝑂 𝑂

且对于给定的矩阵,其标准形中 𝑟 的值是唯一确定的.
证明 设 𝑚 × 𝑛 矩阵
 
𝑎11 𝑎12 ··· 𝑎1𝑛
 
 𝑎
 21 𝑎22 ··· 𝑎2𝑛 

𝐴=
 .. .. ..


 . . . 
 
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛

不妨设 𝑎11 ̸= 0. 假如 𝑎11 = 0, 可经第一种初等变换, 将 𝐴 中的某一非零元素


调换至第一行第一列.
对 𝐴 进行初等变换
   
1 𝑏12 ··· 𝑏1𝑛 1 𝑏12 ··· 𝑏1𝑛
   
1
 𝑎 𝑎22 ··· 𝑎2𝑛  𝑅𝑖 −𝑎𝑖1 𝑅1  0 𝑏22 ··· 𝑏2𝑛 
𝑎11 𝑅1
 21  (𝑖=2,··· ,𝑚)  
𝐴 −−−−→ 
 .. .. ..
−
 −−−−−− → .. .. ..


 . . .   . . . 
   
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 0 𝑏𝑚2 · · · 𝑏𝑚𝑛
 
1 0 ··· 0

𝐶𝑗 −𝑏1𝑗 𝐶1


(𝑗=2,··· ,𝑛)
 0 𝑏22 ··· 𝑏2𝑛 

−−−−−−→ 
 .. .. ..
,𝐵


 . . . 

0 𝑏𝑚2 · · · 𝑏𝑚𝑛
22 第1章 矩 阵

令  
𝑏22 ··· 𝑏2𝑛
.. ..
 
𝐴1 = 
 
 . . 

𝑏𝑚2 · · · 𝑏𝑚𝑛

若 𝐴1 = 𝑂, 则 𝐵 已是标准形了; 若 𝐴1 ̸= 𝑂, 同样可不妨设 𝑏22 ̸= 0, 继续对 𝐵 进行


初等变换得

   
1 0 0 ··· 0 1 0 0 ··· 0
   

 0 1 𝑐23 ··· 𝑐2𝑛 


 0 1 0 ··· 0 

   
→
𝐵−
 0 𝑏32 𝑏33 ··· 𝑏3𝑛 →
−
  0 0 𝑐33 ··· 𝑐3𝑛 ,𝐶

.. .. .. .. .. .. .. ..
   
   

 . . . .  
  . . . . 

0 𝑏𝑚2 𝑏𝑚3 · · · 𝑏𝑚𝑛 0 𝑐 𝑐𝑚3 · · · 𝑐𝑚𝑛

令  
𝑐33 ··· 𝑐3𝑛
.. ..
 
𝐴2 = 
 
 . . 

𝑐𝑚3 · · · 𝑐𝑚𝑛

同样, 若 𝐴2 = 𝑂, 则 𝐶 已是标准形了; 若 𝐴2 ̸= 𝑂, 继续上述步骤, 这样重复有


限次可得矩阵的标准形.
下面证明标准形中 𝑟 的唯一性.
假定矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 经不同的初等变换分别化为标准形 𝐵 和 𝐶:
   
𝐼 𝑟1 𝑂  𝐼 𝑟2 𝑂 
𝐵= , 𝐶=
𝑂 𝑂 𝑂 𝑂

其中 𝑟1 ̸= 𝑟2 . 由于标准形 𝐵 是由矩阵 𝐴 经初等变换得到的, 因此 𝐵 经过相应初等


变换的逆变换可变回原来的矩阵 𝐴. 因为初等变换的逆变换仍是初等变换, 即 𝐵
经过初等变换可化为矩阵 𝐴, 而由假定 𝐴 还可经初等变换进一步化为 𝐶, 这表
明 𝐵 经过一系列初等变换最终可化为 𝐶, 由前面的引理知这与 𝑟1 ̸= 𝑟2 矛盾.
定 义 1.4.4 定 理1.4.2 中, 矩 阵 𝐴 对 应 的 标 准 形 中 𝑟 的 值 称 为 矩 阵 𝐴 的
秩 (rank), 记作 rank(𝐴) 或 𝑟(𝐴).
规定零矩阵的秩为零: rank(𝑂) = 0.
1.4 矩阵的初等变换与秩 23

由定义 1.4.4 可知: 矩阵 𝐴𝑚×𝑛 的秩满足 rank(𝐴) 6 min{𝑚, 𝑛}.


特别地, 当 rank(𝐴) = 𝑚 < 𝑛 时, 𝐴 的标准形为 [𝐼𝑚 , 𝑂];
当 rank(𝐴) = 𝑛 < 𝑚 时, 𝐴 的标准形为 [𝐼𝑛 , 𝑂]T ;
当 rank(𝐴) = 𝑚 = 𝑛 时, 𝐴 的标准形为 𝐼𝑛 .
从定理1.4.2对标准形中 𝑟 的唯一性证明可得如下结论.
推论 1.4.1 矩阵经过初等变换后其秩不变.
矩阵的秩不随初等变换而改变, 因此秩是反映矩阵内在特性的一个数.
例1.4.2 用初等变换将下列矩阵化为标准形, 并求该矩阵的秩.
 
0 2 −4
 
 −1 −4 5 
 
 
𝐴=
 3 1 7 
 
 0
 5 −10 

2 3 0

现对其作如下初等行变换
   
−1 −4 5 −1 −4 5
   
 0 2 −4   0 2 −4 
 𝑅 3 +3𝑅1 
  
𝑅12  𝑅 5 +2𝑅 
1 

𝐴 −−→  3 1 7  −−−−−→  0 −11 22 

   
 0
 5 −10 

 0
 5 −10 

2 3 0 0 −5 10
   
−1 0 0 1 0 0
   
𝐶2 −4𝐶1
 0
 2 −4 

 0
 𝐶1 ×(−1) 2 0 

𝐶3 +5𝐶1   𝐶3 +2𝐶2 
−−−−−→ 
 0 −11 22  −−−−−→  0
 −11 0 

   
 0
 5 −10 
  0
 5 0 

0 −5 10 0 −5 0
   
1 0 0 1 0 0
   
 0 2 0   0 1 0 
   
  𝐶2 ×(− 12 )  

− 
 0 0 0 
 −
− −− −− →  0
 0 0 

   
 0 0 0 
  0 0 0 
  
0 0 0 0 0 0
24 第1章 矩 阵

从上述矩阵的标准形可知矩阵的秩为 2.
例1.4.3 求证: 分块矩阵  

𝐴 𝑂 
𝑂 𝐵

的秩为 rank(𝐴) + rank(𝐵).

证明 设 rank(𝐴) = 𝑟1 , rank(𝐵) = 𝑟2 , 存在可逆阵 𝑃1 , 𝑄1 和 𝑃2 , 𝑄2 , 使得


   
𝐼𝑟 𝑂  𝐼𝑟 𝑂 
𝑃1 𝐴𝑄1 =  1 , 𝑃2 𝐵𝑄2 =  2
𝑂 𝑂 𝑂 𝑂

因此
   

𝑃1 𝑂   𝐴 𝑂   𝑄1 𝑂 
𝑂 𝑃2 𝑂 𝐵 𝑂 𝑄2
 
  𝐼 𝑟1
 
𝑃1 𝐴𝑄1 𝑂  𝑂 
= = 
 
𝑂 𝑃2 𝐵𝑄2 
 𝐼𝑟 2 

𝑂

即经过若干次初等变换
 
  𝐼𝑟 1
 
𝐴 𝑂   𝑂 

− 
  

𝑂 𝐵 
 𝐼 𝑟2 

𝑂

因此分块矩阵  

𝐴 𝑂 
𝑂 𝐵

的秩为 𝑟1 + 𝑟2 .  
𝐴 𝐶 
例1.4.4 求证: 分块矩阵 的秩大于等于 rank(𝐴) + rank(𝐵).
𝑂 𝐵

证明 采用与上例相同的记号与证法.设 rank(𝐴) = 𝑟1 , rank(𝐵) = 𝑟2 , 存在可


1.4 矩阵的初等变换与秩 25

逆阵 𝑃1 , 𝑄1 和 𝑃2 , 𝑄2 , 使得
   
𝐼𝑟 𝑂  𝐼𝑟 𝑂 
𝑃1 𝐴𝑄1 =  1 , 𝑃2 𝐵𝑄2 =  2
𝑂 𝑂 𝑂 𝑂

因此
     
𝑃
 1
𝑂   𝐴 𝐶   𝑄1 𝑂   𝑃1 𝐴𝑄1 𝑃1 𝐶𝑄2 
=
𝑂 𝑃2 𝑂 𝐵 𝑂 𝑄2 𝑂 𝑃2 𝐵𝑄2
 
𝐼 𝑟1 𝑂 𝐶11 𝐶12
 
 𝑂 𝑂 𝐶21 𝐶22 
=
 

 𝑂 𝑂 𝐼 𝑟2 𝑂 
 
𝑂 𝑂 𝑂 𝑂

在上面的分块矩阵中实施第三类分块初等变换, 用 𝐼𝑟1 消去同行的矩阵, 用 𝐼𝑟2 消


去同列的矩阵, 再将 𝐶22 对换到第二行第二列的位置:
     
𝐼 𝑟1 𝑂 𝐶11 𝐶12 𝐼 𝑟1 𝑂 𝑂 𝑂 𝐼 𝑟1
  
 
 𝑂 𝑂 𝐶21 𝐶22   𝑂 𝑂 𝑂 𝐶22   𝐶22 
→−  →− 
     
 
 𝑂 𝑂 𝐼 𝑟2 𝑂 
  𝑂 𝑂 𝐼𝑟2 𝑂 
  𝐼 𝑟2 
   
𝑂 𝑂 𝑂 𝑂 𝑂 𝑂 𝑂 𝑂 𝑂

即经过若干次初等变换
 
  𝐼 𝑟1
 
𝐴 𝐶   𝐶22 

− 
  

𝑂 𝐵 
 𝐼 𝑟2 

𝑂

因此分块矩阵  

𝐴 𝐶 
𝑂 𝐵

的秩为 𝑟1 + rank(𝐶22 ) + 𝑟2 > rank(𝐴) + rank(𝐵).

由前面关于矩阵秩的定义、定理和推论, 可得如下结论.
26 第1章 矩 阵

定理 1.4.3 设 𝑚 × 𝑛 矩阵 𝐴 与 𝐵, 下列三个命题等价:

(1) 矩阵 𝐴 与 𝐵 的秩相等;

(2) 矩阵 𝐴 与 𝐵 具有相同的标准形;

(3) 矩阵 𝐴 经有限次初等变换可化为 𝐵.
定理 1.4.4 rank(𝐴T ) = rank(𝐴).

证明 设 rank(𝐴𝑚×𝑛 ) = 𝑟, 则矩阵 𝐴 经过若干次初等行变换和初等列变换可


化为标准形  

𝐼𝑟 𝑂𝑟×(𝑛−𝑟) 
𝑂(𝑚−𝑟)×𝑟 𝑂(𝑚−𝑟)×(𝑛−𝑟)

因此, 转置矩阵 𝐴T 经过相应的若干次初等列变换和初等行变换可化为标准形


 

𝐼𝑟 𝑂𝑟×(𝑚−𝑟) 
𝑂(𝑛−𝑟)×𝑟 𝑂(𝑛−𝑟)×(𝑚−𝑟)

故 rank(𝐴T ) = 𝑟.
定 义 1.4.5 若矩阵的每个非零行的上方没有零行, 且各个非零行自左向
右的第一个非零元素 𝑎1𝑗1 , 𝑎2𝑗2 , · · · , 𝑎𝑟𝑗𝑟 所在列的编号满足 𝑗1 < 𝑗2 < · · · < 𝑗𝑟 ,
则 称 该 矩 阵 为 阶 梯 型 矩 阵. 阶 梯 型 矩 阵 中 各 非 零 行 自 左 向 右 第 一 个 非 零 元
素 𝑎1𝑗1 , 𝑎2𝑗2 , · · · , 𝑎𝑟𝑗𝑟 所在的列第 𝑗1 列, 第 𝑗2 列, · · · , 第 𝑗𝑟 列可作为矩阵的主
主元 列 .

显然, 阶梯型矩阵中各非零行自左向右第一个非零元素 𝑎1𝑗1 , 𝑎2𝑗2 , · · · , 𝑎𝑟𝑗𝑟 的


左方、下方、左下方所有元素均为零.
定 义 1.4.6 若阶梯型矩阵中各非零行自左向右第一个非零元素均为 1, 它们
所在列的其余元素均为 0, 则称该阶梯型矩阵为最
最简 阶 梯 型 矩 阵 .

由前面定理 1.4.2 的证明过程还可以得出下面结论.


定 理 1.4.5 任一非零矩阵只经初等行变换可化为(最简)阶梯型矩阵.
推论 1.4.2 非零矩阵的秩等于其(最简)阶梯型中主元列的个数.

通常我们求矩阵秩的方法是对矩阵进行初等变换, 将其化为一个容易求秩的
矩阵, 如化为阶梯型的矩阵, 直接看出阶梯型矩阵主元列的个数, 从而快速求得原
矩阵的秩.
例1.4.5 下列矩阵 𝐴 只经过初等行变换化为阶梯型, 进一步作初等行变换化
为最简阶梯型:
1.5 习 题 27

   
1 0 1 −1 −3 1 0 1 −1 −3
   
 1 2 −1 0 −1   0 2 −2 1 2 
𝐴= →−
   

 4
 6 −2 −4 3 
  0
 0 0 1 −3 

2 −2 4 −7 4 0 0 0 0 0
 
1 0 1 0 −6
 
 0 1 −1 0 2.5 

−
 

 0
 0 0 1 −3  
0 0 0 0 0

可以得出, 矩阵 𝐴 的秩为 3, 矩阵的第一列、第二列和第四列可作为主元列.

1.5 习 题
1. 计算下列矩阵的乘积:
  
4 3 1 7
(1) 1 −2 3   2 ;
  

5 7 0 1
 
3
(2)[ 1 2 3 ]  2 ;
 

1
 
2
(3) 1  [ −1 2 ];
 

3
 
– ™ 1 3 1
2 1 4 0  0 −1 2 
(4) ;


1 −1 3 4  1 −3 1 
4 0 −2
  
𝑎11 𝑎12 𝑎13 𝑥1
(5)[ 𝑥1 𝑥2 𝑥3 ]  𝑎12 𝑎22 𝑎23   𝑥2 .
  

𝑎13 𝑎23 𝑎33 𝑥3


   
1 1 1 1 2 3
2. 设 𝐴 =  1 1 −1 , 𝐵 =  −1 −2 4 , 求 3𝐴𝐵 − 2𝐴.
   

1 −1 1 0 5 1
– ™
1 3
3. 设 𝐴 = , 求 𝐴50 和 𝐴51 .
1 −3
4. (1) 设 𝐴, 𝐵 为 𝑛 阶矩阵, 且 𝐴 为对称矩阵, 证明 𝐵 T 𝐴𝐵 也是对称矩阵;
28 第1章 矩 阵

(2) 设 𝐴, 𝐵 为 𝑛 阶对称矩阵, 证明 𝐴𝐵 是对称矩阵的充分必要条件是 𝐴𝐵 = 𝐵𝐴.


5. 证明矩阵 𝐴 = 𝑂 的充分必要条件是方阵 𝐴T 𝐴 = 𝑂.
6. 设

– ™
   
𝑎 0 0 0 1 0
cos 𝜃 sin 𝜃
𝐴= 0 𝑏 0 , 𝐵= 0 0 1 , 𝐶=
   
− sin 𝜃 cos 𝜃
0 0 𝑐 0 0 0

求 𝐴5 , 𝐵 3 , 𝐶 𝑛 .
    
𝑎 1 1 3 𝑏
7. 已知  3 0 1   𝑎  =  6 , 求 𝑎 和 𝑏.
    

0 2 −1 −3 𝑏

8. 若 𝐴 是 𝑛 阶方阵且 𝐴𝑛 = 𝑂, 试证:

(𝐼𝑛 − 𝐴)(𝐼𝑛 + 𝐴 + 𝐴2 + · · · + 𝐴𝑛−1 ) = 𝐼𝑛

9. 计算下列矩阵的 𝑛 次方幂:
1 1
h i
(1)设 𝐴 = 𝛼T 𝛽, 其中 𝛼 = [1, 2, 3], 𝛽 = 1, , , 求 𝐴𝑛 ;
2 3
 
1 2 3
(2)设 𝐵 = 2 4 6, 求 𝐵 𝑛 ;
 

3 6 9
 
1 −1 −1 −1
−1 1 −1 −1
(3)设 𝐶 =  , 求 𝐶 𝑛 ;
 
−1 −1 1 −1
−1 −1 −1 1
 
1 1 0
(4)设 𝐷 = 0 1 1, 求 𝐷 𝑛 .
 

0 0 1
10. 试证:
(1) 与所有 𝑛 阶对角阵乘法可交换的矩阵也必是 𝑛 阶对角阵;
(2) 与所有 𝑛 阶矩阵乘法可交换的矩阵是纯量阵.
11. 证明: 两个对角元为 1 的上三角阵乘积仍是对角元为 1 的上三角阵.
   
𝑥1 𝑦1
𝑥2 𝑦2
   
   
12. 设 𝑛 元向量 𝑥 =  ..
, 𝑦 =  ..
. 若 𝐴 = 𝑦𝑥T , 求 𝐴𝑘 (𝑘 ∈ N+ ).
   
 .   . 
𝑥𝑛 𝑦𝑛
1.5 习 题 29

 1 
 2 
 0 
 
 . 
13. 设 𝑛(𝑛 > 2) 元向量 𝑥 =  , 𝐴 = 𝐼𝑛 − 𝑥𝑥T , 𝐵 = 𝐼𝑛 + 2𝑥𝑥T , 求 𝐴𝐵.
 .. 
 
 0 
 
1
2
14. 设 𝐴 是 𝑚 × 𝑛 矩阵. 证明: 若对于任何 𝑛 元列向量 𝑥 成立 𝐴𝑥 = 0, 则 𝐴 = 𝑂𝑚×𝑛 .
15. 设 𝑛 阶方阵 𝐴, 𝐵 满足 𝐴2 = 𝐴, 𝐵 2 = 𝐵, 且 (𝐴 + 𝐵)2 = 𝐴 + 𝐵, 证明: 𝐴𝐵 = 𝑂.
 
1 0 1
16. 设 𝐴 =  0 2 0 , 求 𝐴𝑛 − 2𝐴𝑛−1 (𝑛 > 2).
 

1 0 1
17. 设 𝑛 阶方阵 𝐴, 𝐵 满足 𝐴2 = −𝐴, 𝐵 2 = −𝐵, 且 (𝐴 + 𝐵)2 = −𝐴 − 𝐵, 证明: 𝐴𝐵 = 𝑂.
 
1 0 1
18. 设 𝐴 =  0 2 0 , 𝑛 为正整数, 求 𝐴𝑛 − 2𝐴𝑛−1 .
 

1 0 1

19. 设 𝐴 = 𝐼 − 𝛼𝛼 , 其中 𝛼 为非零 𝑛 × 1 矩阵, 试证: 𝐴2 = 𝐴 的充要条件是 𝛼T 𝛼 = 1.


T

20. 设 𝑛 维向量 𝛼 = [𝑎, 0, · · · , 0, 𝑎]T , 𝑎 < 0, 𝐼 为 𝑛 阶单位矩阵, 矩阵

1
𝐴 = 𝐼 − 𝛼𝛼T , 𝐵=𝐼+ 𝛼𝛼T
𝑎

其中 𝐴𝐵 = 𝐼, 𝐼 为 𝑛 阶单位矩阵, 求 𝛼.
 
1 0 1
21. 设矩阵𝐴 =  0 2 0 , 矩阵 𝑋 满足 𝐴𝑋 + 𝐼 = 𝐴2 + 𝑋, 其中 𝐼 为 3 阶单位矩阵,
 

1 0 1
试求出矩阵 𝑋.
22. 计算下列矩阵的 𝑘 次幂, 其中 𝑘 为正整数:
   
1 𝑎 0 1 2 4
(1)𝐴 =  0 1 𝑎 ; (2)𝐴 =  2 4 8 .
   

0 0 1 3 6 12
23. 设 𝐴, 𝐵 是两个 𝑛 阶矩阵, 若 tr(𝐴𝐵𝐶) =tr(𝐶𝐵𝐴) 对任意 𝑛 阶矩阵 𝐶 成立, 求证
𝐴𝐵 = 𝐵𝐴.
24. 设
   
1 0 0 0 1 0 1 0
 0 1 0 0   −1 2 0 1 
𝐴= , 𝐵=
   

 −1 2 1 0   1 0 4 1 
1 1 0 1 −1 −1 2 0

利用分块矩阵求 𝐴𝐵.
30 第1章 矩 阵

25. 求矩阵 𝐴, 𝐵 的秩, 其中:

 
1 2 3
𝐴= 2 3 −5 
 

4 7 1

 
3 2 0 5 0
 3 −2 3 6 −1 
𝐵=
 

 2 0 1 5 −3 
1 6 −4 −1 4

26. 设
 
1 2 −1 1
𝐴= 3 2 𝜆 −1 
 

5 6 3 𝜇

已知 rank(𝐴) = 2, 求 𝜆 和 𝜇 的值.

27. 求证: 矩阵添加一行(列), 其秩或者不变或者增加 1.

28. 设 𝐴 是 𝑛 阶方阵, 满足 𝐴2 = 𝐼𝑛 , 求证: rank(𝐴 + 𝐼𝑛 )+rank(𝐴 − 𝐼𝑛 ) = 𝑛.

29. 设 𝐴 为 𝑛 阶矩阵, 则 rank(𝐴) = 1 的充分必要条件是存在矩阵 𝐵𝑛×1 和 𝐶1×𝑛 (𝐵 ̸=


𝑂, 𝐶 ̸= 𝑂), 使得 𝐴 = 𝐵𝐶.

30. 设 𝐴 为 𝑚 × 𝑛 矩阵, 且 rank(𝐴) = 𝑟, 从 𝐴 中 任取 𝑠 行构成一个 𝑠 × 𝑛 矩阵 𝐵, 证明:


rank(𝐵) > 𝑟 + 𝑠 − 𝑚.

31. 设 𝑛(𝑛 > 3) 阶矩阵


 
1 𝑎 𝑎 ··· 𝑎
···
 
 𝑎 1 𝑎 𝑎 
 
𝐴=
 𝑎 𝑎 1 ··· 𝑎 

 .. .. .. .. 
. . . .
 
 
𝑎 𝑎 𝑎 ··· 1

若矩阵 𝐴 的秩为 𝑛 − 1, 求 𝑎.

32. 用初等行变换将下列矩阵化为阶梯型矩阵:
   
1 2 3 4 1 0 −1 5 12
 0 −1 0 −2   6 7 8 0 −9 
(1) ; (2) .
   
 1 1 3 2   26 21 26 −10 −51 
2 2 6 4 15 14 13 −15 −54

33. 判断下列矩阵是否有相同的最简阶梯型:
1.5 习 题 31

   
1 2 3 1 −1 5
(1) 2 4 6 ,  0 3 3 ;
   

0 1 2 0 2 2
   
−1 0 4 1 −1 5
(2) 3 0 −1  ,  −1 4 −2 .
   

0 1 −1 0 3 3
第2章 线性方程组

2.1 横看线性方程组

线性方程组的一般形式为



 𝑎11 𝑥1 + 𝑎12 𝑥2 + · · · + 𝑎1𝑛 𝑥𝑛 = 𝑏1



 𝑎21 𝑥1 + 𝑎22 𝑥2 + · · · + 𝑎2𝑛 𝑥𝑛 = 𝑏2




 ······


𝑎 𝑥 + 𝑎 𝑥 + ··· + 𝑎 𝑥 = 𝑏

𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 𝑚

上述线性方程组含有 𝑚 个方程, 𝑛 个未知变量 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 , 可简记为


𝑛
X
𝑎𝑖𝑗 𝑥𝑗 = 𝑏𝑖 (𝑖 = 1, 2, · · · , 𝑚)
𝑗=1

若引入矩阵和向量

𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 𝑏 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑚 ]T

则该线性方程组可写成矩阵形式 𝐴𝑥 = 𝑏, 其中 𝐴 称为线性方程组的系
系数 矩 阵 . 显
然, 线性方程组等号左边与系数矩阵是一一对应的. 由于线性方程组的解 𝑥 为 𝑛
元列向量, 故可称其为解向量.
若 𝑏 = 0, 则称 𝐴𝑥 = 𝑏 为齐
齐次 线 性 方 程 组 ; 若 𝑏 ̸= 0, 则称 𝐴𝑥 = 𝑏 为非
非齐 次
线性方程组.

2.1.1 齐次线性方程组的解

设齐次线性方程组 𝐴𝑥 = 0, 其中 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 0 为 𝑚


元零向量, 显然, 𝑛 元零向量是 𝐴𝑥 = 0 的解, 故齐次线性方程组一定有解. 因此,
我们主要考察齐次线性方程组是否有非零解.
求解线性方程组的基本方法是 Gauss 消元法. 在用 Gauss 消元法求解线性方
2.1 横看线性方程组 33

程组的过程中, 一般包括以下变换:
(1) 对调两个方程的位置;
(2) 用一个非零常数乘以某一方程;
(3) 某一方程的 𝑘 倍加到另一方程上去.
显然, 以上三种变换不会改变方程组的解. 通过 Gauss 消元法将线性方程组化
为尽可能简洁的同解线性方程组.
由于一个齐次线性方程组与其系数矩阵是一一对应的, 对齐次线性方程组进
行以上三种变换, 等价于对系数矩阵进行三种相应的初等行变换, 得到与原方程组
同解的新方程组的系数矩阵, 所以可利用对系数矩阵的初等行变换实现 Gauss 消
元法.
定 理 2.1.1 齐次线性方程组只有零解当且仅当系数矩阵的秩等于未知量的
个数; 齐次线性方程组有非零解当且仅当系数矩阵的秩小于未知量的个数.
证明 设齐次线性方程组 𝐴𝑥 = 0 的系数矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 的秩 rank(𝐴) =
𝑟 > 0, 对系数矩阵作初等行变换化为阶梯型矩阵和最简阶梯型矩阵:
 
0 · · · 𝑐1𝑗1 · · · 𝑐1𝑗2 . . . 𝑐1𝑗𝑟 𝑐1(𝑗𝑟 +1) · · · 𝑐1𝑛
 

 0 ··· 0 · · · 𝑐2𝑗2 · · · 𝑐2𝑗𝑟 𝑐2(𝑗𝑟 +1) · · · 𝑐2𝑛 

 .. .. .. .. .. .. 
. . . . . .
 
 
 
𝐴→
−  0 ··· 0 ··· 0 · · · 𝑐𝑟𝑗𝑟 𝑐𝑟(𝑗𝑟 +1) · · · 𝑐𝑟𝑛 
 
 
0 ··· 0 ··· 0 ··· 0 0 ··· 0 
 

.. .. .. .. .. .. 
 


 . . . . . . 

0 ··· 0 ··· 0 ··· 0 0 ··· 0
 
0 · · · 1 · · · 0 · · · 0 𝑐˜1(𝑗𝑟 +1) · · · 𝑐˜1𝑛
 

 0 · · · 0 · · · 1 · · · 0 𝑐˜2(𝑗𝑟 +1) · · · 𝑐˜2𝑛 

 .. .. .. .. .. .. 
. . . . . .
 
 
 

−  0 · · · 0 · · · 0 · · · 1 𝑐˜𝑟(𝑗𝑟 +1) · · · 𝑐˜𝑟𝑛 
 
 
0 ··· 0 ··· 0 ··· 0 0 ··· 0 
 

.. .. .. .. .. .. 
 


 . . . . . . 

0 ··· 0 ··· 0 ··· 0 0 ··· 0

其中, 𝑐1𝑗1 , 𝑐2𝑗2 , · · · , 𝑐𝑟𝑗𝑟 ̸= 0. 因为只进行了初等行变换, 系数矩阵 𝐴 对应的齐次线


性方程组与其阶梯型矩阵对应的齐次线性方程组同解. 上述阶梯型矩阵的第 𝑟 + 1
行开始至第 𝑚 行均代表方程 0𝑥1 + · · · + 0𝑥𝑛 = 0. 这表明在线性方程组原有的 𝑚
34 第2章 线性方程组

个方程中真正起作用的只有 𝑟 个方程. 系数矩阵的秩实际上是相应线性方程组中


实际有用的方程的个数. 当且仅当系数矩阵的秩(即实际有用的方程的个数)等于
未知量的个数时方程有唯一解; 当且仅当系数矩阵的秩(即实际有用的方程的个
数)小于未知量的个数时方程有无穷多解.
如果 rank(𝐴) = 0, 则 𝐴 是零矩阵, 显然所有 𝑛 元向量均为 𝐴𝑥 = 0 的解.
从上面的证明过程可以看出, 齐次线性方程组有非零解的原因在于方程组中
真正起作用是方程个数 𝑟 (即线性约束条件的数目)小于未知量的个数, 表现为系
数矩阵的秩小于未知量的个数. 设上述系数矩阵的主元列为第 𝑗1 列, 第 𝑗2 列, · · · ,
第 𝑗𝑟 列, 将 𝑥𝑗1 , 𝑥𝑗2 , · · · , 𝑥𝑗𝑟 看作主元变量, 其余 𝑛 − 𝑟 个变量看作自由变量, 记为
𝑥𝑘1 , 𝑥𝑘2 , · · · , 𝑥𝑘𝑛−𝑟 , 自由变量可取任意值.
为清晰起见, 可对上述最简阶梯型矩阵进一步作第一种初等列变换(交换两
列), 这相当于对未知变量重新编号, 使得最简阶梯型矩阵的左上角为 𝑟 阶单位阵
 
1 · · · 0 · · · 0 𝑐˜1𝑘1 · · · 𝑐˜1𝑘𝑛−𝑟
 

 0 · · · 1 · · · 0 𝑐˜2𝑘1 · · · 𝑐˜2𝑘𝑛−𝑟 

 .. .. .. .. .. 
. . . . .
 
 
 
0 · · · 0 · · · 1 𝑐˜𝑟𝑘1 · · · 𝑐˜𝑟𝑘𝑛−𝑟
 
 
 
0 ··· 0 ··· 0 0 ··· 0
 
 
.. .. .. .. ..
 
 

 . . . . . 

0 ··· 0 ··· 0 0 ··· 0

因此该齐次线性方程组所有的解可以写成



 𝑥𝑗1 = −˜
𝑐1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟






 𝑥𝑗2 = −˜
𝑐2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟


······






𝑥𝑗𝑟 = −˜
𝑐 𝑟𝑘1 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟



𝑥𝑘1 = 𝑡𝑘1







······





𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟

其中 𝑡𝑘1 , 𝑡𝑘2 , · · · , 𝑡𝑘𝑛−𝑟 为任意常数.


定义 2.1.1 线性方程组所有的解称为该线性方程组的通
通解 .
例2.1.1 求下列线性方程组的通解
2.1 横看线性方程组 35




 𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = 0



 𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 0




 4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 0


 2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 0

1 2 3 4 5

解 对系数矩阵进行初等行变换化为阶梯型, 即
   
1 0 1 −1 −3 1 0 1 −1 −3
   
 1 2 −1 0 −1   0 2 −2 1 2 
𝐴= →−
   

 4
 6 −2 −4 3 
  0
 0 0 1 −3 

2 −2 4 −7 4 0 0 0 0 0

知 rank(𝐴) = 3 < 𝑛 = 5, 故线性方程组 𝐴𝑥 = 0 有非零解. 对系数矩阵的阶梯型


进一步作初等行变换化为最简阶梯型:
 
1 0 1 0 −6
 
 5 
1 −1 0
 
 0 

 2 

 0
 0 0 1 −3 

0 0 0 0 0

可将 𝑥1 , 𝑥2 , 𝑥4 作为主元变量, 𝑥3 , 𝑥5 作为自由变量, 得方程组的通解:





 𝑥1 = −𝑡3 + 6𝑡5

5


𝑥2 = 𝑡3 − 𝑡5



2



 𝑥 3 = 𝑡3



𝑥4 = 3𝑡5







𝑥 = 𝑡
5 5

其中 𝑡3 , 𝑡5 为任意常数.

2.1.2 非齐次线性方程组的解

考虑非齐次线性方程组 𝐴𝑥 = 𝑏, 其中 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T ,


𝑏 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑚 ]T ̸= 0. 由于非齐次线性方程组的解取决于系数矩阵 𝐴 与向量
𝑏, 故将向量 𝑏 添加在系数矩阵 𝐴 的右边, 得 𝑚 × (𝑛 + 1) 矩阵 [𝐴, 𝑏], 该矩阵称为
非齐次线性方程组的增
增广矩 阵 . 非齐次线性方程组与其增广矩阵是一一对应的.
36 第2章 线性方程组

与前面类似, 可用 Gauss 消元法求解非齐次线性方程组, 求解过程通常包括以


下变换:
(1) 对调两个方程的位置;
(2) 用一个非零常数乘以某一方程;
(3) 某一方程 𝑘 倍加到另一方程上去.
以上三种变换不会改变非齐次线性方程组的解.
如果在化简后的非齐次线性方程组中发现了互不相容的矛盾方程, 则可断定
该线性方程组无解. 因此, 有时称有解的线性方程组为相
相容 线 性 方 程 组, 称无解的
线性方程组为不
不相容 线 性方 程组 或者超
超定 线 性 方 程 组 .
由于一个非齐次线性方程组与其增广矩阵是一一对应的, 对非齐次线性方程
组进行以上三种变换, 等价于对增广矩阵进行三种初等行变换, 得到与原方程组
同解的新方程组, 所以可利用对增广矩阵的初等行变换实现非齐次线性方程组的
Gauss 消元法.
定理 2.1.2 线性方程组有解的充要条件是系数矩阵的秩等于增广矩阵的秩.
证明 设线性方程组 𝐴𝑥 = 𝑏 的系数矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 的秩 rank(𝐴) = 𝑟 >
0, 对增广矩阵 [𝐴, 𝑏] 作初等行变换化为阶梯型矩阵:
 
0 · · · 𝑐1𝑗1 · · · 𝑐1𝑗2 · · · 𝑐1𝑗𝑟 · · · 𝑐1𝑛 𝑑1
 

 0 ··· 0 · · · 𝑐2𝑗2 · · · 𝑐2𝑗𝑟 · · · 𝑐2𝑛 𝑑2 


 .. .. .. .. .. .. 


 . . . . . . 

0 ··· 0 ··· 0 · · · 𝑐𝑟𝑗𝑟 · · · 𝑐𝑟𝑛 𝑑𝑟
 
 
→
[𝐴, 𝑏]− 
0 ··· 0 ··· 0 ··· 0 ··· 0 𝑑𝑟+1
 
 
 
0 ··· 0 ··· 0 ··· 0 ··· 0 0
 
 
.. .. .. .. .. ..
 
 

 . . . . . . 

0 ··· 0 ··· 0 ··· 0 ··· 0 0

其中, 𝑐1𝑗1 , 𝑐2𝑗2 , · · · , 𝑐𝑟𝑗𝑟 ̸= 0. 因为只进行了初等行变换, 增广矩阵 [𝐴, 𝑏] 对应的线


性方程组与其阶梯型矩阵对应的线性方程组同解. 上述阶梯型矩阵的第 𝑟 + 1 行
代表方程 0𝑥1 + · · · + 0𝑥𝑛 = 𝑑𝑟+1 . 易知, 线性方程组有解当且仅当 𝑑𝑟+1 = 0. 此时,
rank([𝐴, 𝑏]) = rank(𝐴) = 𝑟.
如果 rank(𝐴) = 0, 则 𝐴 是零矩阵, 显然要使 𝐴𝑥 = 𝑏 成立当且仅当 𝑏 为零向
量, 此时 rank([𝐴, 𝑏]) = rank(𝐴) = 0.
从上面的证明过程可以看出, 𝑑𝑟+1 ̸= 0 时线性方程组无解, 无解的原因是方程
组中不相容方程的存在, 最终表现为以下矛盾: 化简后的方程组中第 𝑟 + 1 个方程
0 = 𝑑𝑟+1 , 而 𝑑𝑟+1 为非零常数.
2.1 横看线性方程组 37

当系数矩阵的秩等于增广矩阵的秩时 𝑑𝑟+1 = 0, 线性方程组有解, 此时增广矩


阵可进一步化为如下最简阶梯型矩阵:
 
0 · · · 1 · · · 0 · · · 0 𝑐˜1(𝑗𝑟 +1) · · · 𝑐˜1𝑛 𝑑˜1
𝑑˜2
 

 0 · · · 0 · · · 1 · · · 0 𝑐˜2(𝑗𝑟 +1) · · · 𝑐˜2𝑛 

 .. .. .. .. .. .. .. 
. . . . . . .
 
 
 

 0 · · · 0 · · · 0 · · · 1 𝑐˜𝑟(𝑗𝑟 +1) · · · 𝑐˜𝑟𝑛 ˜
𝑑𝑟


 
0 ··· 0 ··· 0 ··· 0 0 ··· 0 0
 
 
.. .. .. .. .. .. ..
 
 

 . . . . . . . 

0 ··· 0 ··· 0 ··· 0 0 ··· 0 0

可 将 𝑥𝑗1 , 𝑥𝑗2 , · · · , 𝑥𝑗𝑟 看 作 主 元 变 量, 其 余 𝑛 − 𝑟 个 变 量 看 作 自 由 变 量, 记 作


𝑥𝑘1 , 𝑥𝑘2 , · · · , 𝑥𝑘𝑛−𝑟 , 自由变量可取任意值.

和 2.1.1 节讨论齐次线性方程组时一样, 为清晰起见, 可对上述最简阶梯型矩


阵进一步作第一种初等列变换(交换两列), 这相当于对未知变量重新编号, 使得最
简阶梯型矩阵的左上角为 𝑟 阶单位阵
 
1 · · · 0 · · · 0 𝑐˜1𝑘1 · · · 𝑐˜1𝑘𝑛−𝑟 𝑑˜1
𝑑˜2
 

 0 · · · 1 · · · 0 𝑐˜2𝑘1 · · · 𝑐˜2𝑘𝑛−𝑟 

 .. .. .. .. .. .. 
. . . . . .
 
 
 
0 · · · 0 · · · 1 𝑐˜𝑟𝑘1 · · · 𝑐˜𝑟𝑘𝑛−𝑟 𝑑˜𝑟
 
 
 
0 ··· 0 ··· 0 0 ··· 0 0
 
 
.. .. .. .. .. ..
 
 

 . . . . . . 

0 ··· 0 ··· 0 0 ··· 0 0

因此方程组的通解可以写成



 𝑥𝑗1 = 𝑑˜1 − 𝑐˜1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟


˜

 𝑥𝑗2 = 𝑑2 − 𝑐˜2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟





······






𝑥𝑗𝑟 = 𝑑˜ − 𝑐˜𝑟𝑘1 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
𝑟



𝑥𝑘1 = 𝑡𝑘1










 ······


𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟


38 第2章 线性方程组

其中 𝑡𝑘1 , 𝑡𝑘2 , · · · , 𝑡𝑘𝑛−𝑟 为任意常数. 若系数矩阵的秩, 即主元变量的个数等于未知


变量的总数, 即 𝑟 = 𝑛, 则没有自由变量, 此时线性方程组有唯一解. 因此, 我们有如
下结论:
(1) 当 rank([𝐴, 𝑏]) > rank(𝐴) 时, 线性方程组 𝐴𝑥 = 𝑏 无解;
(2) 当 rank([𝐴, 𝑏]) = rank(𝐴) = 𝑟 = 𝑛 时, 线性方程组 𝐴𝑥 = 𝑏 有唯一解;
(3) 当 rank([𝐴, 𝑏]) = rank(𝐴) = 𝑟 < 𝑛 时, 线性方程组 𝐴𝑥 = 𝑏 有无穷多解.
例2.1.2 解线性方程组



 𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = −2



 𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 1




 4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 7


 2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 1

1 2 3 4 5

解 对增广矩阵进行初等行变换化为阶梯型, 得

   
1 0 1 −1 −3 −2 1 0 1 −1 −3 −2
  
 1 2 −1 0 −1 1   0 2 −2 1 2 3 
[𝐴, 𝑏] =  →−
   

 4
 6 −2 −4 3 7  

 0 0 0 1 −3 −2 

2 −2 4 −7 4 1 0 0 0 0 0 0

知 rank([𝐴, 𝑏]) = rank(𝐴) = 𝑟 < 𝑛, 故线性方程组 𝐴𝑋 = 𝑏 有无穷多解. 对增广矩


阵的阶梯型进一步作初等行变换化为最简阶梯型:
 
1 0 0 −6 −4 1

5 5 
 0 1 −1 0
 


 2 2 

 0 0 0 1 −3 −2 
 
0 0 0 0 0 0

可将 𝑥1 , 𝑥2 , 𝑥4 作为主元变量, 𝑥3 , 𝑥5 作为自由变量, 得方程组的通解:





 𝑥1 = −4 − 𝑡3 + 6𝑡5

5 5


𝑥2 = + 𝑡3 − 𝑡5



2 2



 𝑥3 = 𝑡3



𝑥4 = −2 + 3𝑡5







𝑥 = 𝑡
5 5
2.1 横看线性方程组 39

其中 𝑡3 , 𝑡5 为任意常数. 
 𝑥1 + 𝑥2 = 1
例2.1.3 讨论线性方程组 , 当 𝑎, 𝑏 取什么值时方程组无解, 有
 𝑥 + 𝑎𝑥 = 𝑏
1 2
唯一解, 有无穷多解?

解 对增广矩阵进行初等行变换化为阶梯型
   
1 1 1   1 1 1 
[𝐴, 𝑏] =  →

1 𝑎 𝑏 0 𝑎−1 𝑏−1

当 𝑎 − 1 = 0, 𝑏 − 1 ̸= 0, 即 𝑎 = 1, 𝑏 ̸= 1 时, rank([𝐴, 𝑏]) = 2 > rank(𝐴) = 1, 线性方


程组 𝐴𝑥 = 𝑏 无解; 从几何上看, 此时方程组中的两个方程代表两条平行线, 所以
没有交点.

当 𝑎 − 1 = 0, 𝑏 − 1 = 0, 即 𝑎 = 1, 𝑏 = 1 时, rank([𝐴, 𝑏]) = rank(𝐴) = 1 < 2, 线


性方程组 𝐴𝑥 = 𝑏 有无穷多解; 从几何上看, 此时方程组中的两个方程代表同一条
直线, 直线上的所有点均为方程组的解.
当 𝑎 − 1 ̸= 0, 即 𝑎 ̸= 1 时, rank([𝐴, 𝑏]) = rank(𝐴) = 2, 线性方程组 𝐴𝑥 = 𝑏 有
唯一解; 从几何上看, 此时方程组中的两个方程代表两条相交直线, 交点即为方程
组的解.

注 从行的角度考察线性方程组 𝐴𝑥 = 𝑏, 对 𝑖 = 1, 2, · · · , 𝑚, 有 row(𝐴𝑥, 𝑖) =
P𝑛
row(𝐴, 𝑖)𝑥 = 𝑗=1 𝑎𝑖𝑗 𝑥𝑗 = 𝑏𝑖 , 每一行对应于一个线性方程, 从几何上看, 一个线
性方程是一个超平面(一个二元线性方程对应一条直线, 一个三元线性方程对应一
个平面, 三元以上线性方程对应一个超平面). 求解线性方程组等价于求所有这些
超平面的公共点.
例2.1.4 解下列线性方程组

 𝑥1 + 𝑥2 + 𝜆𝑥3 = 2



3𝑥1 + 4𝑥2 + 2𝑥3 = 𝜆



2𝑥1 + 3𝑥2 − 𝑥3 = 1

解 对增广矩阵进行初等行变换化为阶梯型
   
1 1 𝜆 2 1 1 𝜆 2
   
[𝐴, 𝑏] = 
 3 4 2 →
𝜆  −
 0 1 2 − 3𝜆 𝜆−6 

2 3 −1 1 0 0 −3 + 𝜆 3 − 𝜆
40 第2章 线性方程组

若 𝜆 = 3, 则
   
1 1 3 2 1 0 10 5
   
→
[𝐴, 𝑏]−  0 1 −7 −3  →
 −  0 1 −7 −3 
 
0 0 0 0 0 0 0 0

可将 𝑥1 , 𝑥2 作为主元变量, 𝑥3 作为自由变量, 得方程组的通解:





 𝑥1 = 5 − 10𝑡3

𝑥2 = −3 + 7𝑡3



𝑥3 = 𝑡3

其中 𝑡3 为任意常数.
若 𝜆 ̸= 3, 则

   
1 1 𝜆 2 1 0 0 6 + 3𝜆
   
→
[𝐴, 𝑏]−  0 1 2 − 3𝜆 𝜆 − 6  →
 −  0 1 0 −2𝜆 − 4 
 
0 0 1 −1 0 0 1 −1

得方程组的唯一解: 
 𝑥1 = 6 + 3𝜆



𝑥2 = −2𝜆 − 4



𝑥3 = −1

2.2 纵看线性方程组

在本节中, 我们从列向量线性组合的角度研究线性方程组解的结构. 由于
P𝑛
𝐴𝑥 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 所以 𝐴𝑥 = 𝑏 是否有解等价于向量 𝑏 是否可由系数矩阵
𝐴 的列向量 col(𝐴, 𝑗) (𝑗 = 1, 2, · · · , 𝑛) 线性表出, 表出系数 𝑥𝑗 即为方程组的解.

2.2.1 线性相关与向量组的秩

定 义 2.2.1 设 𝑛 维向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 (𝑠 > 1), 若存在不全为零的系数


𝑘1 , 𝑘2 , · · · , 𝑘𝑠 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 = 0 成立, 则称向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠
2.2 纵看线性方程组 41

线 性 相 关 (linearly dependent); 否则, 若上式当且仅当 𝑘1 = 𝑘2 = · · · = 𝑘𝑠 = 0 时才


成立, 则称向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线 性无 关(linearly independent).
注 当向量组只含有一个向量时, 如果该向量是零向量, 则称其线性相关; 如
果该向量是非零向量, 则称其线性无关.
定 理 2.2.1 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 (𝑠 > 2) 线性相关的充要条件是该向量组
中至少有一个向量可由其余向量线性表出.
证明 先证必要性. 因向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 (𝑠 > 2) 线性相关, 故存在不全为
零的系数 𝑘1 , 𝑘2 , · · · , 𝑘𝑠 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 = 0, 不妨设 𝑘1 ̸= 0, 则

1
𝛼1 = − (𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 )
𝑘1

即向量 𝛼1 可由其余向量线性表出.
再证充分性. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 (𝑠 > 2) 中有一个向量可由其余向量线
性表出, 即

𝛼𝑖 = 𝑘1 𝛼1 + · · · + 𝑘𝑖−1 𝛼𝑖−1 + 𝑘𝑖+1 𝛼𝑖+1 + · · · + 𝑘𝑠 𝛼𝑠


𝑘1 𝛼1 + · · · + 𝑘𝑖−1 𝛼𝑖−1 − 𝛼𝑖 + 𝑘𝑖+1 𝛼𝑖+1 + · · · + 𝑘𝑠 𝛼𝑠 = 0

故存在一组不全为零的系数 𝑘1 , · · · , 𝑘𝑖−1 , −1, 𝑘𝑖+1 , · · · , 𝑘𝑠 , 从而 𝛼1 , 𝛼2 , · · · , 𝛼𝑠


(𝑠 > 2) 线性相关.
请读者自行验证以下结论:
(1) 任一含有零向量的向量组线性相关;
(2) 若一个向量组线性无关, 则其任何一个部分向量组线性无关;
(3) 若一个向量组中有部分向量线性相关, 则整个向量组线性相关.
由线性相关和线性无关的定义知: 齐次线性方程组有非零解当且仅当系数矩
阵的列向量线性相关; 齐次线性方程组只有零解当且仅当系数矩阵的列向量线性
无关. 因此, 有下面定理.
定 理 2.2.2 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性相关当且仅当矩阵 𝐴 = [𝛼1 , 𝛼2 , · · · ,
𝛼𝑠 ] 的秩 rank(𝐴) < 𝑠 ; 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性无关当且仅当 rank(𝐴) = 𝑠.
因为 rank(𝐴𝑛×𝑠 ) 6 min{𝑛, 𝑠}, 故有如下推论.
推 论 2.2.1 𝑠(𝑠 > 𝑛) 个 𝑛 元向量线性相关.
定 义2.2.2 如果向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 中的部分向量组 𝛼𝑖1 , 𝛼𝑖2 , · · · , 𝛼𝑖𝑟 满
足条件:
42 第2章 线性方程组

(1) 线性无关;
(2) 加入原向量组中其他任一向量 (如果有) 所形成的新的部分向量组均线性
相关, 则称部分向量组 𝛼𝑖1 , 𝛼𝑖2 , · · · , 𝛼𝑖𝑟 为向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 的一个极
极大 线 性
无关组.
特别地, 线性无关向量组的极大线性无关组是其本身.
例 2.2.1 求向量组 𝛼1 = [1, 1, 4, 2]T , 𝛼2 = [0, 2, 6, −2]T , 𝛼3 = [1, −1, −2, 4]T ,
𝛼4 = [−1, 0, −4, 7]T 的极大线性无关组.
解 对 [𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 ] 构成的矩阵只作初等行变换

     
1 0 1 −1 1 0 1 −1 1 0 1 0
  
 
 1 2 −1 0   0 2 −2 1   0 1 −1 0 
→− →−
     
 
 4
 6 −2 −4  

 0 0 0 1  

 0 0 0 1 
2 −2 4 −7 0 0 0 0 0 0 0 0

由 此 我 们 可 以 看 出 向 量 组 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 有 3 个 极 大 线 性 无 关 组: 𝛼1 , 𝛼2 , 𝛼4 ;
𝛼1 , 𝛼3 , 𝛼4 ; 𝛼2 , 𝛼 3 , 𝛼4 .
引 理 2.2.1 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性无关, 而向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 , 𝛼
线性相关, 则 𝛼 可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性表出, 且线性表示式唯一.
证明 因向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 , 𝛼 线性相关, 故存在不全为零的数 𝑘1 , 𝑘2 , · · · ,
𝑘𝑠 , 𝑘𝑠+1 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 + 𝑘𝑠+1 𝛼 = 0. 这里 𝑘𝑠+1 ̸= 0, 否则, 存在不
全为零的数 𝑘1 , 𝑘2 , · · · , 𝑘𝑠 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 = 0, 这与 𝛼1 , 𝛼2 , · · · , 𝛼𝑠
1
线性无关矛盾. 所以, 𝛼 = (𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 ).
𝑘𝑠+1
设 𝛼 = 𝑐1 𝛼1 + 𝑐2 𝛼2 + · · · + 𝑐𝑠 𝛼𝑠 = 𝑑1 𝛼1 + 𝑑2 𝛼2 + · · · + 𝑑𝑠 𝛼𝑠 , 故 (𝑐1 −
𝑑1 )𝛼1 + (𝑐2 − 𝑑2 )𝛼2 + · · · + (𝑐𝑠 − 𝑑𝑠 )𝛼𝑠 = 0. 由于 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性无关, 故
𝑐1 − 𝑑1 = · · · = 𝑐𝑠 − 𝑑𝑠 = 0, 所以 𝛼 由 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 的线性表示式唯一.
由上述引理, 可以得到如下定理.
定理 2.2.3 向量组中任一向量都可由该向量组的极大线性无关组线性表出.
引 理2.2.2 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 可由向量组 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性表出, 若
向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关, 则 𝑟 6 𝑠.
证明 假定 𝑟 > 𝑠, 因向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 可由向量组 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性
表出, 故存在 𝑠 × 𝑟 矩阵 𝐴 使得 [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ] = [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝐴. 因此齐次线
性方程组 [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑋 = 0 与 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝐴𝑋 = 0 同解, 其中 𝑋 为 𝑟
元列向量.
2.2 纵看线性方程组 43

考察 𝐴𝑋 = 0, 由假定 𝑟 > 𝑠, rank(𝐴𝑠×𝑟 ) 6 min{𝑟, 𝑠} = 𝑠 < 𝑟, 因此 𝐴𝑋 = 0


有非零解, 从而 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝐴𝑋 = 0 有非零解, 即 [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑋 = 0 有
非零解, 这与向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关矛盾.
定 理 2.2.4 一个向量组的任意两个极大线性无关组可以相互线性表出, 且所
含向量的个数相等.
证明 由于向量组中任一向量都可由该向量组的极大线性无关组线性表出,
故向量组的任意两个极大线性无关组可以相互线性表出.
设 一 个 向 量 组 的 任 意 两 个 极 大 线 性 无 关 组 分 别 为 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 和 𝛽 1 ,
𝛽2 , · · · , 𝛽𝑠 . 因为 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 可由 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性表出, 且 𝛼1 , 𝛼2 , · · · , 𝛼𝑟
线性无关, 根据前面的引理, 得 𝑟 6 𝑠. 同理, 得 𝑠 6 𝑟. 因此 𝑠 = 𝑟.
注 上述定理表明, 向量组的极大无关组可能是不唯一的, 但不同极大无关组
所含向量个数是唯一确定的. 因此, 我们有下面的定义.
定义 2.2.3 向量组的极大线性无关组所含向量的个数称为该向量组的秩.
定 义 2.2.4 矩阵的列向量组的秩称为矩阵的列
列秩 ; 矩阵的行向量组的秩称为
矩阵的行
行秩 .
定理 2.2.5 矩阵的秩等于列(行)秩.
证明 设 𝑚 × 𝑛 矩阵 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ], 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 的秩为 𝑟.
若 𝑟 = 𝑛, 则 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线 性 无 关, 此 时 𝐴𝑋 = 0 只 有 零 解, 从 而
rank(𝐴) = 𝑛, 定理成立.
若 𝑟 < 𝑛, 由 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 的极大无关组包含 𝑟 个向量, 不妨设 𝛼1 , · · · , 𝛼𝑟
为 𝛼1 , · · · , 𝛼𝑛 的一个极大无关组, 则矩阵 𝐵 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ] 的秩为 𝑟. 由于矩
阵 𝐵 是 𝐴 的子矩阵, 故 rank(𝐵) = 𝑟 6 rank(𝐴). 假定 rank(𝐴), 将矩阵 𝐴 只经初
等行变换化为(最简)阶梯型矩阵, 其主元列的个数 > 𝑟, 由于主元列线性无关, 故 𝐴
的列向量中超过 𝑟 列线性无关, 矛盾. 因此 rank(𝐴) = 𝑟, 即矩阵 𝐴 的秩等于矩阵
𝐴 各列向量所构成向量组的秩. 同时得, 矩阵 𝐴T 的秩等于矩阵 𝐴T 各列向量所构
成向量组的秩. 由于 rank(𝐴) = rank(𝐴T ), 且矩阵 𝐴 的各行向量即为 𝐴T 的各列
向量, 故矩阵 𝐴 的秩等于矩阵 𝐴 各行向量所构成向量组的秩.
定 理 2.2.6 rank(𝐴𝐵) 6 min{rank(𝐴), rank(𝐵)}, 其中 𝐴, 𝐵 分别为 𝑚 × 𝑙,
𝑙 × 𝑛 矩阵.
证明 记

𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ], 𝐵 = [𝛽1 , 𝛽2 , · · · , 𝛽𝑛 ], 𝐴𝐵 = [𝛾1 , 𝛾2 , · · · , 𝛾𝑛 ]

设 rank(𝐴) = 𝑟, rank(𝐴𝐵) = 𝑠, 不妨设 𝛼1 , · · · , 𝛼𝑟 为 𝛼1 , · · · , 𝛼𝑙 的一个极大


44 第2章 线性方程组

线性无关组, 𝛾1 , 𝛾2 , · · · , 𝛾𝑠 为 𝛾1 , 𝛾2 , · · · , 𝛾𝑛 的一个极大无关组. 由 [𝛾1 , 𝛾2 , · · · ,


𝛾𝑛 ] = 𝐴𝐵, 即 [𝛾1 , 𝛾2 , · · · , 𝛾𝑛 ] = 𝐴[𝛽1 , 𝛽2 , · · · , 𝛽𝑛 ] 可知 [𝛾1 , 𝛾2 , · · · , 𝛾𝑠 ] = 𝐴[𝛽1 ,
𝛽2 , · · · , 𝛽𝑠 ]. 因为 𝛼1 , · · · , 𝛼𝑟 为 𝐴 的列向量组 𝛼1 , · · · , 𝛼𝑙 的一个极大无关组, 故
存在 𝑟 × 𝑙 矩阵 𝑀 使得 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑀 , 从而

[𝛾1 , 𝛾2 , · · · , 𝛾𝑠 ] = 𝐴[𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ] = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]

因此齐次线性方程组
[𝛾1 , 𝛾2 , · · · , 𝛾𝑠 ]𝑥 = 0 (2.1)

即为齐次线性方程组

[𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0 (2.2)

由 𝛾1 , 𝛾2 , · · · , 𝛾𝑠 线性无关, 得 (2.1) ⇐⇒ 𝑥 = 0.
由 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关, 得 (2.2) ⇐⇒ 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0.
又 (2.1) ⇐⇒ (2.2), 故 𝑥 = 0 ⇐⇒ 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0, 这说明齐次
线性方程组 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0 只有零解, 故 rank(𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]) = 𝑠.
又因 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ] 为 𝑟 行 𝑠 列矩阵, 故 rank(𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]) 6 𝑟. 因此
𝑠 6 𝑟, 即 rank(𝐴𝐵) 6 rank(𝐴). 同时, rank(𝐴𝐵) = rank((𝐴𝐵)T ) = rank(𝐵 T 𝐴T ) 6
rank(𝐵 T ) = rank(𝐵).
由上述定理可以得到下述推论.
推论 2.2.2 设 𝛼 为 𝑛 元非零行向量, 则 rank(𝛼𝛼T ) = 1.
例2.2.2 求证: rank(𝐴 + 𝐵) 6 rank(𝐴) + rank(𝐵), 其中 𝐴, 𝐵 均为 𝑚 × 𝑛
矩阵.
证明

rank(𝐴 + 𝐵)
„  Ž
𝐼 
=rank [𝐴 , 𝐵] 
𝐼

6rank ([𝐴, 𝐵])


„  Ž
𝐴 𝑂 
=rank [𝐼 , 𝐼] 
𝑂 𝐵
„ Ž
𝐴 𝑂 
6rank  = rank(𝐴) + rank(𝐵)
𝑂 𝐵
2.2 纵看线性方程组 45

例2.2.3 求证:

rank(𝐴) + rank(𝐵) 6 rank(𝐴𝐵) + 𝑛

其中 𝐴, 𝐵 分别为 𝑚 × 𝑛, 𝑛 × 𝑙 矩阵.
证明

rank(𝐴𝐵) + 𝑛
„ Ž
𝐴𝐵 𝑂 
=rank 
𝑂 𝐼𝑛
„ Ž
𝐴𝐵 𝐵 
=rank 
𝑂 𝐼𝑛
„ Ž
𝑂 𝐵 
=rank 
−𝐴 𝐼𝑛
„ Ž
𝐴 −𝐼𝑛 
=rank 
𝑂 𝐵

>rank(𝐴) + rank(𝐵)

2.2.2 齐次线性方程组的基础解系

定 理 2.2.7 设 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 均为齐次线性方程组 𝐴𝑥 = 0 的解, 则 𝑥1 ,


𝑥2 , · · · , 𝑥𝑡 的线性组合也是 𝐴𝑥 = 0 的解.
证明 因为 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 均为 𝐴𝑥 = 0 的解, 所以 𝐴𝑥1 = 0, 𝐴𝑥2 = 0, · · · ,
𝐴𝑥𝑡 = 0, 从而 𝐴(𝑘1 𝑥1 +𝑘2 𝑥2 +· · ·+𝑘𝑡 𝑥𝑡 ) = 𝑘1 (𝐴𝑥1 )+𝑘2 (𝐴𝑥2 )+· · ·+𝑘𝑡 (𝐴𝑥𝑡 ) =
0. 即 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 的线性组合也是 𝐴𝑥 = 0 的解.
定 义2.2.5 设 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 是齐次线性方程组 𝐴𝑥 = 0 的一组解向量, 若其
满足条件:
(1) 线性无关;
(2) 齐次线性方程组的任一解向量都能由 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 线性表出,
则称 𝑥1 , 𝑥2 , · · · , 𝑥𝑡 为齐次线性方程组 𝐴𝑥 = 0 的基础解系.
定 理 2.2.8 设 rank(𝐴𝑚×𝑛 ) = 𝑟, 若 𝐴𝑥 = 0 有非零解, 则该齐次线性方程组
有基础解系, 且基础解系含有 𝑛 − 𝑟 个解.
46 第2章 线性方程组

证明 将2.2.1节中所得齐次线性方程组的通解



 𝑥1 = −˜𝑐1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟






 𝑥𝑗2 = −˜𝑐2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟


······






𝑗𝑟𝑥 = −˜
𝑟𝑘1 𝑐 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟 (2.3)



𝑥𝑘1 = 𝑡𝑘1










 ······


𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟

改成向量形式:
     
  −˜
𝑐1𝑘1 −˜
𝑐1𝑘2 −˜
𝑐1𝑘𝑛−𝑟
𝑥1 
 −˜
 
 −˜
 
 −˜

 𝑐2𝑘1  𝑐2𝑘2  𝑐2𝑘𝑛−𝑟
    
 𝑥    
 𝑗2  
 .. 


 .. 


 .. 

 ..   .   .   . 
.
       
 
 −˜
𝑐𝑟𝑘1  −˜
𝑐𝑟𝑘2  −˜
𝑐𝑟𝑘𝑛−𝑟
       
  
 𝑥𝑗𝑟

 = 𝑡𝑘1 
  + 𝑡𝑘   + · · · + 𝑡𝑘  
2  𝑛−𝑟 
1 0 0
     
     
 𝑥𝑘1
       

0 1 0
     
..
       
 
. .. .. ..
       
     
. . .
       
𝑥𝑘𝑛−𝑟
     
0 0 1

其中 𝑡𝑘1 , 𝑡𝑘2 , · · · , 𝑡𝑘𝑛−𝑟 为任意常数. 得含有 𝑛 − 𝑟 个解的基础解系:

     
−˜
𝑐1𝑘1 −˜
𝑐1𝑘2 −˜
𝑐1𝑘𝑛−𝑟
     
 −˜   −˜  −˜
 𝑐2𝑘1   𝑐2𝑘2  𝑐2𝑘𝑛−𝑟
 
 

 ..  
  .. 


 .. 


 .  
  . 


 . 

 −˜
𝑐𝑟𝑘1   −˜
𝑐𝑟𝑘2  −˜
𝑐𝑟𝑘𝑛−𝑟
     
 
 , ,··· , 
1 0 0
     
     
     
0 1 0
     
     
.. .. ..
     
     

 .  
  . 


 . 

0 0 1
2.2 纵看线性方程组 47

例2.2.4 2.2.1节中齐次线性方程组



 𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = 0



 𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 0




 4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 0


 2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 0

1 2 3 4 5

可写成列向量的线性组合形式
         
1 0 1 −1 −3
         
 1   2   −1   0   −1 
𝑥1   + 𝑥2   + 𝑥3   + 𝑥4   + 𝑥5  =0
         
 4   6   −2   −4   3 
         
2 −2 4 −7 4

求得的线性方程组的解, 即列向量的线性组合系数可写成

     
𝑥1 −1 6
    
5 
 𝑥   1  −
 
 2   
 



  2 
 𝑥3  = 𝑡3  1  + 𝑡5  
    
 0 

   
 𝑥4   0   
    
 3 

𝑥5 0 1

其中 𝑡3 , 𝑡5 为任意常数.
定理 2.2.9 设 𝐴 为 𝑚 × 𝑛 矩阵, 𝑏 为 𝑚 元列向量, 则
(1) rank(𝐴𝐴T ) = rank(𝐴T 𝐴) = rank(𝐴) = rank(𝐴T );
(2) 线性方程组 𝐴T 𝐴𝑥 = 𝐴T 𝑏 一定有解.
证明 (1) 若 𝐴𝑥 = 0, 则 𝐴T 𝐴𝑥 = 0; 反之, 若 𝐴T 𝐴𝑥 = 0, 则 𝑥T 𝐴T 𝐴𝑥 = 0,
即 (𝐴𝑥)T (𝐴𝑥) = ‖𝐴𝑥‖2 = 0, 故 𝐴𝑥 = 0. 因此齐次线性方程组 𝐴𝑥 = 0 与
𝐴T 𝐴𝑥 = 0 同解.
𝐴𝑥 = 0 的基础解系含有 𝑛 − rank(𝐴) 个解, 而 𝐴T 𝐴𝑥 = 0 基础解系含有
𝑛 − rank(𝐴T 𝐴) 个解, 故 𝑛 − rank(𝐴) = 𝑛 − rank(𝐴T 𝐴), 即 rank(𝐴) = rank(𝐴T 𝐴),
从而 rank(𝐴T ) = rank((𝐴T )T 𝐴T ) = rank(𝐴𝐴T ). 又因为 rank(𝐴) = rank(𝐴T ), 所
以 rank(𝐴T 𝐴) = rank(𝐴) = rank(𝐴T ) = rank(𝐴𝐴T ).
(2) 由于 rank([𝐴T 𝐴, 𝐴T 𝑏]) = rank(𝐴T [𝐴, 𝑏]) 6 rank(𝐴T ) = rank(𝐴T 𝐴), 同
48 第2章 线性方程组

时 rank([𝐴T 𝐴, 𝐴T 𝑏]) > rank(𝐴T 𝐴), 因此 rank([𝐴T 𝐴, 𝐴T 𝑏]) = rank(𝐴T 𝐴), 从而


𝐴T 𝐴𝑥 = 𝐴T 𝑏 一定有解.

2.2.3 非齐次线性方程组解的结构

定理 2.2.10 设 𝑥0 是非齐次线性方程组 𝐴𝑥 = 𝑏 的某个特定解(简称为特解),


𝑦 是相应齐次线性方程组 𝐴𝑥 = 0 的通解, 则非齐次线性方程组 𝐴𝑥 = 𝑏 的通解为
𝑥 = 𝑥0 + 𝑦 (即, 如果 𝑥1 , 𝑥2 , · · · , 𝑥𝑛−𝑟 是 𝐴𝑥 = 0 的基础解系, 那么 𝐴𝑥 = 𝑏 的通
解为 𝑥 = 𝑥0 + 𝑡1 𝑥1 + · · · + 𝑡𝑛−𝑟 𝑥𝑛−𝑟 , 其中 𝑡1 , · · · , 𝑡𝑛−𝑟 为任意常数).
证明 由于 𝐴(𝑥0 + 𝑦) = 𝐴𝑥0 + 𝐴𝑦 = 0 + 𝑏 = 𝑏, 因此 𝑥0 + 𝑦 是 𝐴𝑥 = 𝑏 的
解. 另一方面, 设 𝑥是
¯ 𝐴𝑥 = 𝑏 的任一解. 𝑥 ¯ − 𝑥0 ). 由于 𝐴(𝑥
¯ = 𝑥0 + (𝑥 ¯ − 𝑥0 ) =
¯ − 𝐴𝑥0 = 𝑏 − 𝑏 = 𝑥0 , 故 𝑥
𝐴𝑥 ¯ − 𝑥0 是 𝐴𝑥 = 0 的解. 因此, 𝐴𝑥 = 𝑏 的任一解 𝑥
¯均
包含在式 𝑥0 + 𝑦 中.
例2.2.5 2.2.2节中非齐次线性方程组



 𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = −2



 𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 1




 4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 7


 2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 1

1 2 3 4 5

可写成列向量的线性组合形式
           
1 0 1 −1 −3 −2
           
 1   2   −1   0   −1   1 
𝑥1   + 𝑥2   + 𝑥3   + 𝑥4   + 𝑥5  =
           

 4   6   −2   −4   3   7 
           
2 −2 4 −7 4 1

求得的线性方程组的解, 即列向量的线性组合系数可写成

       
𝑥1 −4 −1 6
   5    
5 
 𝑥    1  −
  
 2     
   2  


  2 
 𝑥3  =   + 𝑡3 

1  + 𝑡5 
 
   0   0 
       
 𝑥4     0   
   −2 3
     
  
𝑥5 0 0 1
2.3 逆 矩 阵 49

其中 𝑡3 , 𝑡5 为任意常数.

2.3 逆 矩 阵

2.3.1 可逆矩阵的定义与性质

定义 2.3.1 设 𝐴 是 𝑛 阶方阵, 如果存在 𝑛 阶方阵 𝐵 使 𝐴𝐵 = 𝐵𝐴 = 𝐼, 则称


𝐴 是可
可逆 矩阵 (invertible matrix)或称非
非奇 异矩 阵 (nonsingular matrix), 称 𝐵 是 𝐴 的
𝐼 1
逆矩阵, 一般记作 𝐵 = 𝐴−1 , 注意不要写成 或 .
𝐴 𝐴
定理 2.3.1 设 𝐴 是 𝑛 阶方阵, 下述若干命题等价:
(1) rank(𝐴) = 𝑛;
(2) 存在 𝑛 阶方阵 𝐵 使 𝐴𝐵 = 𝐼;
(3) 存在 𝑛 阶方阵 𝐶 使 𝐶𝐴 = 𝐼;
(4) 𝐴 的列向量组线性无关;
(5) 𝐴 的行向量组线性无关;
(6) 𝐴𝑥 = 0 只有零解;
(7) 𝐴 可经过初等变换化为标准形 𝐼.
证明 先证 (1) =⇒ (2). 由 rank(𝐴) = 𝑛, 根据线性方程组理论, 对于任意 𝑛 维
向量 𝑏, 𝐴𝑥 = 𝑏 有唯一解.
考虑 𝑛 个线性方程组: 𝐴𝑥 = col(𝐼, 1), · · · , 𝐴𝑥 = col(𝐼, 𝑛). 上述每个线性方
程组均有唯一解. 将这 𝑛 个解作为列可以得唯一的 𝑛 阶矩阵 𝐵 使 𝐴𝐵 = 𝐼.
下证(2) =⇒ (1). 已知存在 𝑛 阶矩阵 𝐵 使 𝐴𝐵 = 𝐼, 故 rank(𝐴𝐵) = rank(𝐼) =
𝑛. 从而 𝑛 = rank(𝐴𝐵) 6 rank(𝐴𝑛×𝑛 ) 6 𝑛, 所以 rank(𝐴) = 𝑛.
再证 (3) ⇐⇒ (1).
存在 𝑛 阶矩阵 𝐶 使 𝐶𝐴 = 𝐼, 当且仅当存在 𝑛 阶矩阵 𝐶 T 使 𝐴T 𝐶 T = 𝐼.
再由(1) ⇐⇒ (2)知, 当且仅当 rank(𝐴T ) = 𝑛, 即 rank(𝐴) = 𝑛.
关于 (4) ⇐⇒ (1), (5) ⇐⇒ (1) , (6) ⇐⇒ (1) 的证明, 请读者根据本章所学内容
自行完成;关于 (7) ⇐⇒ (1), 可由第1章秩的定义直接得到. 这里不再赘述.
注 (1)上述若干命题等价的大前提是 𝐴 是 𝑛 阶方阵, 如果 𝐴 不是方阵, 则等
价性不成立. 请读者自行举反例.
(2) 从 上 面 证 明 过 程 可 以 发 现, 若 对 于 𝑛 阶 方 阵 𝐴 存 在 𝑛 阶 方 阵 𝐵 使
𝐴𝐵 = 𝐼, 则方阵 𝐵 唯一; 同样, 若对于 𝑛 阶方阵 𝐴 存在 𝑛 阶方阵 𝐶 使 𝐶𝐴 = 𝐼,
则方阵 𝐶 唯一, 且由于 𝐵 = 𝐼𝐵 = 𝐶𝐴𝐵 = 𝐶𝐼 = 𝐶, 故 𝐵 = 𝐶.
50 第2章 线性方程组

显然, 若 𝐴 是可逆矩阵, 则 𝐴 的逆矩阵是唯一的. 若 𝐵 是 𝐴 的逆矩阵, 则 𝐴


也是 𝐵 的逆矩阵.
性质 2.3.1 设 𝐴 是 𝑛 阶可逆矩阵, 则
(1) (𝐴−1 )−1 = 𝐴;
1
(2) (𝑘𝐴)−1 = 𝐴−1 ;
𝑘
(3) (𝐴T )−1 = (𝐴−1 )T ;
(4) (𝐴𝐵)−1 = 𝐵 −1 𝐴−1 , 其中 𝐵 也是 𝑛 阶可逆矩阵.
证明 (1)(𝐴−1 )𝐴 = 𝐼, 故 (𝐴−1 )−1 = 𝐴.
1 ‹  1‹ 1
−1
(2) (𝑘𝐴) 𝐴 =𝑘 𝐴𝐴−1 = 𝐼, 故 (𝑘𝐴)−1 = 𝐴−1 .
𝑘 𝑘 𝑘
−1 T
T
(3) 𝐴 (𝐴 ) = (𝐴−1 𝐴)T = 𝐼, 故 (𝐴T )−1 = (𝐴−1 )T .
(4) (𝐴𝐵)(𝐵 −1 𝐴−1 ) = 𝐴(𝐵𝐵 −1 )𝐴−1 = 𝐴𝐼𝐴−1 = 𝐴𝐴−1 = 𝐼, 故
(𝐴𝐵)−1 = 𝐵 −1 𝐴−1 .
性质(4)说明两个可逆矩阵的积是可逆矩阵.利用数学归纳法, 性质(4)可推广
为如下结论.
推 论 2.3.1 设 𝐴1 , 𝐴2 , · · · , 𝐴𝑘 是 𝑛 阶可逆矩阵, 则 𝐴1 𝐴2 · · · 𝐴𝑘 也可逆, 且
(𝐴1 𝐴2 · · · 𝐴𝑘 )−1 = 𝐴−1 −1 −1
𝑘 · · · 𝐴2 𝐴1 .

例2.3.1 设 𝑛 阶矩阵 𝐴 满足 𝐴2 + 2𝐴 − 3𝐼 = 𝑂, 证明:


(1) 𝐴 与 𝐴 + 2𝐼 均可逆;
(2) 若 𝐴 ̸= 𝐼, 则 𝐴 + 3𝐼 不可逆.
1
证明(1) 由 𝐴2 + 2𝐴 − 3𝐼 = 𝑂 得 𝐴(𝐴 + 2𝐼) = 3𝐼, 故 𝐴(𝐴 + 2𝐼) = 𝐼, 因
3
1 1
此 𝐴与𝐴 + 2𝐼 均可逆, 且 𝐴−1 = (𝐴 + 2𝐼), (𝐴 + 2𝐼)−1 = 𝐴.
3 3
(2) 由 𝐴2 + 2𝐴 − 3𝐼 = 𝑂 得 (𝐴 + 3𝐼)(𝐴 − 𝐼) = 𝑂, 因为 𝐴 ̸= 𝐼, 故 𝐴 − 𝐼 ̸= 𝑂,
即 𝐴 − 𝐼 ̸= 𝑂 至少有一列为非零向量, 这说明齐次线性方程组 (𝐴 + 3𝐼)𝑥 = 0 有
非零解, 所以 rank(𝐴 + 3𝐼) < 𝑛, 从而 𝐴 + 3𝐼 不可逆.
性质 2.3.2 (1)若对角阵可逆, 则其逆矩阵仍为对角阵;
(2)若对称阵可逆,则其逆矩阵仍为对称阵.
证明 (1) 设对角阵 𝐴 = diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ), 因为 𝐴 可逆, 故 rank(𝐴) = 𝑛,
从而 𝑎1 , 𝑎2 , · · · , 𝑎𝑛 均不为零. 由

diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 )diag(𝑎−1 −1 −1
1 , 𝑎2 , · · · , 𝑎𝑛 ) = 𝐼
2.3 逆 矩 阵 51

得 𝐴−1 = diag(𝑎−1 −1 −1
1 , 𝑎2 , · · · , 𝑎𝑛 ), 因此其逆矩阵仍为对角阵.

(2) 设对称阵 𝐴 可逆, (𝐴−1 )T = (𝐴T )−1 = 𝐴−1 , 因此 𝐴 的逆矩阵 𝐴−1 也是


对称阵.
定理 2.3.2 初等阵可逆, 且初等阵的逆矩阵仍为初等阵.

证明 考察 3 种初等变换及其逆变换. 由于初等变换的逆变换本身也是初等
变换, 故该逆变换相应的矩阵也为初等阵.

(1)第一类初等矩阵 𝐸𝑖𝑗 表示将单位阵 𝐼𝑛 的第 𝑖 行(列)与第 𝑗 行(列)对换后得


到的矩阵

 
1
 
 .. 

 . 

 

 0 ··· 1 i 行


𝐸𝑖𝑗 =  .. .. 
 . . 

j 行
 

 1 ··· 0 
..
 
.
 
 
 
1

为使其变回原来的矩阵, 只需再将 𝐸𝑖𝑗 的第 𝑖 行(列)与第 𝑗 行(列)对换, 该逆变换相


应的矩阵亦为

 
1
 
 .. 

 . 

 

 0 ··· 1 i 行


𝐸𝑖𝑗 =  .. .. 
 . . 

j 行
 

 1 ··· 0 
..
 
.
 
 
 
1

因为 𝐸𝑖𝑗 𝐸𝑖𝑗 = 𝐼, 故第一类初等阵可逆, 且该初等阵的逆矩阵仍为初等阵.

(2)第二类初等矩阵 𝐸𝑖 (𝑘) 表示将单位阵 𝐼𝑛 的第 𝑖 行(列)乘以非零常数 𝑘 后得


到的矩阵
52 第2章 线性方程组

 
1
..
 
.
 
 
 
i 行
𝐸𝑖 (𝑘) =  𝑘


 
 .. 

 . 

1

1
为使其变回原来的矩阵, 只需再将 𝐸𝑖 (𝑘) 的第 𝑖 行(列)乘以非零常数 , 该逆变换
𝑘
相应的矩阵为

 
1
..
 
.
 
1‹ 
 

1
 
 i行
𝐸𝑖 =


𝑘 
 𝑘


 .. 

 . 

1

 1‹
因为𝐸𝑖 𝐸𝑖 (𝑘) = 𝐼, 故第二类初等阵可逆, 且该初等阵的逆矩阵仍为初等阵.
𝑘
(3)第三类初等矩阵 𝐸𝑖𝑗 (𝑘) 表示将单位阵 𝐼𝑛 的第 𝑖 行(第 𝑗 列)乘以任意常数
𝑘 后加到第 𝑗 行(第 𝑖 列)上得到的矩阵

 
1
 
 .. 

 . 

 

 1 ··· 0 i 行

 .. .. 
𝐸𝑖𝑗 (𝑘) = 
 . . 

j 行
 

 𝑘 ··· 1 
..
 
.
 
 
 
1

为使其变回原来的矩阵, 只需再将 𝐸𝑖𝑗 (𝑘) 的第 𝑖 行(第 𝑗 列)乘以 −𝑘 后加到第 𝑗


行(第 𝑖 列), 该逆变换相应的矩阵为
2.3 逆 矩 阵 53

 
1
 
 .. 

 . 

 

 1 ··· 0 i行

 .. .. 
𝐸𝑖𝑗 (−𝑘) = 
 . . 

j行
 

 −𝑘 · · · 1 
..
 
.
 
 
 
1

因为 𝐸𝑖𝑗 (−𝑘)𝐸𝑖𝑗 (𝑘) = 𝐼, 所以第三类初等阵可逆, 且该初等阵的逆矩阵仍为


初等阵.

2.3.2 用初等变换求逆矩阵

由于任一秩为 𝑟 的非零矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 经有限次初等变换可化为标准形


 
𝐼
 𝑟
𝑂 
𝑂 𝑂

而对矩阵 𝐴𝑚×𝑛 作一次初等行变换, 相当于在 𝐴𝑚×𝑛 的左边乘上一个相应的 𝑚


阶初等矩阵, 记这些初等矩阵为 𝑃1 , 𝑃2 , · · · , 𝑃𝑠 ; 对矩阵 𝐴𝑚×𝑛 作一次初等列变
换, 相当于在 𝐴𝑚×𝑛 的右边乘上一个相应的 𝑛 阶初等矩阵, 记这些初等矩阵为
𝑄1 , 𝑄2 , · · · , 𝑄𝑡 . 故
 
𝐼𝑟 𝑂 
𝑃𝑠 · · · 𝑃2 𝑃1 𝐴𝑄1 𝑄2 · · · 𝑄𝑡 = 
𝑂 𝑂

由于初等矩阵可逆且可逆矩阵的积仍为可逆矩阵, 因此有下面的结论.
定 理 2.3.3 任一秩为 𝑟 的非零矩阵 𝐴𝑚×𝑛 , 必存在 𝑚 阶可逆矩阵 𝑃 及 𝑛 阶
可逆矩阵 𝑄, 使得  
𝐼𝑟 𝑂 
𝑃 𝐴𝑄 = 
𝑂 𝑂

由上述定理可得以下推论.
54 第2章 线性方程组

Ü及𝑛阶
推 论2.3.2 任一秩为 𝑟 的非零矩阵 𝐴𝑚×𝑛 , 必存在 𝑚 阶可逆矩阵 𝑃
Ü 使得
可逆矩阵 𝑄,  
Ü  𝐼𝑟
𝐴=𝑃
𝑂 Ü
𝑄
𝑂 𝑂

特别地,若方阵 𝐴𝑛×𝑛 可逆, 则存在初等矩阵为 𝑃1 , 𝑃2 , · · · , 𝑃𝑠 和 𝑄1 , 𝑄2 , · · · ,


𝑄𝑡 , 使得 𝑃𝑠 · · · 𝑃2 𝑃1 𝐴𝑄1 𝑄2 · · · 𝑄𝑡 = 𝐼𝑛 , 从而

𝐴 = 𝑃1−1 𝑃2−1 · · · 𝑃𝑠−1 𝐼𝑛 𝑄−1 −1 −1 −1 −1 −1 −1 −1 −1


𝑡 · · · 𝑄2 𝑄1 = 𝑃1 𝑃2 · · · 𝑃𝑠 𝑄𝑡 · · · 𝑄2 𝑄1

以及 𝑄1 𝑄2 · · · 𝑄𝑡 𝑃𝑠 · · · 𝑃2 𝑃1 𝐴 = 𝐼𝑛 , 𝐴𝑄1 𝑄2 · · · 𝑄𝑡 𝑃𝑠 · · · 𝑃2 𝑃1 = 𝐼𝑛 , 于是得到
下面的结论.
定理 2.3.4 方阵 𝐴 可逆当且仅当下列条件之一成立:

(1) 方阵 𝐴 的标准形为单位阵;

(2) 方阵 𝐴 可表示成若干初等阵的乘积;

(3) 方阵 𝐴 仅经初等行变换可化为单位阵;

(4) 方阵 𝐴 仅经初等列变换可化为单位阵.

设 𝐴 为 可 逆 矩 阵, 则 矩 阵 𝐴 仅 经 初 等 行 变 换 可 化 为 单 位 阵, 即 存 在 初
等 阵 𝑆1 , 𝑆2 , · · · , 𝑆𝑚 使 得 𝑆𝑚 · · · 𝑆2 𝑆1 𝐴 = 𝐼, 于 是 𝑆𝑚 · · · 𝑆2 𝑆1 = 𝐴−1 , 因 此
𝑆𝑚 · · · 𝑆2 𝑆1 [𝐴, 𝐼] = [𝐼, 𝐴−1 ], 这表明只经若干初等行变换, [𝐴, 𝐼] →
− [𝐼, 𝐴−1 ], 这
就得到了基于初等行变换求逆矩阵的算法: 对矩阵 [𝐴, 𝐼] 进行初等行变换, 当子块
𝐴 化为单位阵的同时, 子块 𝐼 恰好化为 𝐴 的逆矩阵 𝐴−1 .

同理, 只经若干初等列变换,
   
𝐴  𝐼 
 →
− 
𝐼 𝐴−1

因此, 可得到基于初等列变换求逆矩阵的算法: 对矩阵


 

𝐴 
𝐼

进行初等列变换, 当子块 𝐴 化为单位阵的同时, 子块 𝐼 恰好化为 𝐴 的逆矩阵 𝐴−1 .


2.3 逆 矩 阵 55

例2.3.2 设  
0 2 −1
 
𝐴=
 1 1 2 

−1 −1 −1

求 𝐴−1 .

   
0 2 −1 1 0 0 1 1 2 0 1 0
   
[𝐴, 𝐼] = 
 1 1 2 →
0 1 0  −
 0 2 −1 1 0 0 

−1 −1 −1 0 0 1 −1 −1 −1 0 0 1
 
  1 3 5
1 1 2 0 1 0  1 0 0 − − − 
 

 2 2 2


− 0 2 −1 1 0 0  →
− · · · →
−  1 1 1 
 0 1 0
  

0 0 1 0 1 1  2 2 2 
0 0 1 0 1 1

故  
1 3 5
 − − − 
 2 2 2
𝐴−1
 
=
 1 1 1 

 
 2 2 2 
0 1 1

设 𝐴 为 𝑛 阶可逆矩阵, 𝐵 为 𝑛 × 𝑚 矩阵, 如何计算 𝐴−1 𝐵?有以下两种方案.


方案(1): 先基于初等行变换计算矩阵的逆 𝐴−1 , 再计算矩阵乘积 𝐴−1 𝐵.
方案(2): 由于 𝐴−1 [𝐴, 𝐵] = [𝐼, 𝐴−1 𝐵], 而可逆矩阵 𝐴−1 可表示为若干初等
阵的乘积, 故 [𝐴, 𝐵] 可经若干初等行变换成为 [𝐼, 𝐴−1 𝐵], 当子块 𝐴 化为单位阵
的同时, 子块 𝐵 恰好化为 𝐴−1 𝐵.
显然, 方案(2)比方案(1)更有效率.
例2.3.3 设
   
1 0 −1 2 −3 1
   
𝐴=
 0 4 ,
2  𝐵=
 1 0 −1 

1 −1 0 1 4 1

求 𝐴−1 𝐵.
56 第2章 线性方程组


   
1 0 −1 2 −3 1 1 0 −1 2 −3 1
   
[𝐴, 𝐵] = 
 0 4 2 1 0 →
−1  −
 0 4 2 1 0 −1 

1 −1 0 1 4 1 0 −1 1 −1 7 0
 
3 5 5
   1 0 0 
1 0 −1 2 −3 1 
 3 2 6 

−
 

− · · · →

 71 1 
 0 −1 1 −1 7 0  − − 
  
 0 1 0
 2 3 6 
0 0 6 −3 28 −1  
 1 14 1 
0 0 1 − −
2 3 6

故  
3 5 5
 

 23 6 
𝐴−1 𝐵 = 
 1 7 1 
− − 



 2 3 6 

 1 14 1 
− −
2 3 6
注 设 𝐴 为 𝑛 阶可逆矩阵, 𝐶 为 𝑚 × 𝑛 矩阵, 请读者思考如何计算 𝐶𝐴−1 更
有效率?

2.3.3 正交阵

定 义 2.3.2 若方阵 𝐴 可逆且满足 𝐴−1 = 𝐴T , 则称 𝐴 为正


正 交 阵 (orthogonal
matrix).
根据正交阵的定义和矩阵的乘法法则, 可以得到以下结论.
定理 2.3.5 设矩阵 𝐴 为 𝑛 阶方阵, 则下列命题等价:
(1) 𝐴 为正交阵;
(2) 𝐴T 𝐴 = 𝐼;
(3) 𝐴𝐴T = 𝐼;
(4) 将 𝐴 按列分块 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ], 有 𝛼T
𝑖 𝛼𝑗 = 𝛿𝑖𝑗 (𝑖, 𝑗 = 1, 2, · · · , 𝑛),

其中 
 1, 𝑖=𝑗
𝛿𝑖𝑗 =
 0, 𝑖 ̸= 𝑗
2.3 逆 矩 阵 57

(5) 将 𝐴 按行分块  
𝛽1
 

 𝛽2 

𝐴=
 ..



 . 

𝛽𝑛

有 𝛽𝑖 𝛽𝑗T = 𝛿𝑖𝑗 (𝑖, 𝑗 = 1, 2, · · · , 𝑛).

注 上述定理给出了正交阵的若干等价定义. 正交阵的逆矩阵为其转置矩
阵;正交阵的每一列为单位向量(模为 1), 且不同列向量之间正交(内积为 0); 正交阵
的每一行为单位向量(模为 1), 且不同行向量之间正交(内积为 0).
例 2.3.4 矩阵  

cos 𝜃 − sin 𝜃 
sin 𝜃 cos 𝜃

是正交阵.
例 2.3.5 矩阵  1 1 
√ 0 √

 2 2 


 0 1 0 

1 1
 
−√ √
 
0
2 2

是正交阵.
例2.3.6 矩阵

1 1 1 1
 
√ √ √ ··· √
 𝑛 𝑛 𝑛 𝑛 
1 1
 
√ −√ ···
 
 0 0 

 2·1 2·1 

 1 1 2 
 √ √ −√ ··· 0 
3·2 3·2 3·2
 
 
 
 .. .. .. .. 

 . . . . 

1 1 1 𝑛−1
 
 
p p p · · · −p
𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1)

是正交阵.

可以发现, 如果方阵的每一列为单位向量且不同列向量之间正交, 则该方阵的


每一行亦为单位向量且不同行向量之间正交;反之亦然. 但是, 前提必须是方阵, 对
58 第2章 线性方程组

于一般矩阵, 该结论不一定成立.
例2.3.7 矩阵  1 
√ 0

 2 


 0 1 

1
 
−√
 
0
2

不是方阵, 其列向量相互正交, 但其行向量第一行与第三行不正交, 故不是正交阵.


性质 2.3.3 (1) 正交阵的积仍为正交阵,
(2) 正交阵的逆矩阵(即其转置矩阵)仍为正交阵.
证明 (1) 设 𝐴, 𝐵 均为 𝑛 阶正交阵, 𝐴T 𝐴 = 𝐼, 𝐵 T 𝐵 = 𝐼, 因此

(𝐴𝐵)T (𝐴𝐵) = 𝐵 T (𝐴T 𝐴)𝐵 = 𝐵 T 𝐵 = 𝐼

即 𝐴𝐵 为正交阵.
(2) 设 𝐴 为 𝑛 阶正交阵, (𝐴−1 )T 𝐴−1 = (𝐴T )−1 𝐴−1 = (𝐴𝐴T )−1 = 𝐼 −1 = 𝐼,
即 𝐴−1 为正交阵.
例2.3.8 设 𝑢 为 𝑛 元单位列向量, 𝐼𝑛 是 𝑛 阶单位阵, 则 𝐼𝑛 − 2𝑢𝑢T 是正交阵.
证明 𝐼𝑛 −2𝑢𝑢T 是方阵, 且由于 (𝐼𝑛 −2𝑢𝑢T )T = 𝐼𝑛 −2𝑢𝑢T , 因此 𝐼𝑛 −2𝑢𝑢T
是对称阵.

(𝐼𝑛 − 2𝑢𝑢T )(𝐼𝑛 − 2𝑢𝑢T )T = (𝐼𝑛 − 2𝑢𝑢T )(𝐼𝑛 − 2𝑢𝑢T )


= 𝐼𝑛 − 4𝑢𝑢T + 4𝑢𝑢T 𝑢𝑢T = 𝐼𝑛

故 𝐼𝑛 − 2𝑢𝑢T 是正交阵.

2.4 习 题

1. 设 𝐴 为 𝑚 × 𝑛 矩阵, 判断下列命题是否正确.
(1) 非齐次线性方程组 𝐴𝑥 = 𝑏, 当 𝑚<𝑛 时, 有无穷多解;当 𝑚 = 𝑛 时, 有唯一解; 当 𝑚 > 𝑛
时, 无解.
(2) 齐次线性方程组 𝐴𝑥 = 0, 当 𝑚 < 𝑛 时, 必有非零解.
(3) 非齐次线性方程组 𝐴𝑥 = 𝑏, 当 rank(𝐴) = 𝑚, 则一定有解.
2. 解下列线性方程组:
2.4 习 题 59

(1)


 𝑥1 − 2𝑥2 + 3𝑥3 − 4𝑥4 = 0

 𝑥 −𝑥 +𝑥 =0
2 3 4

𝑥
 1
 + 3𝑥 2 − 3𝑥4 = 0


𝑥1 − 4𝑥2 + 3𝑥3 − 2𝑥4 = 0

(2)


 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 0

 3𝑥 + 2𝑥 + 𝑥 + 𝑥 − 3𝑥 = 0
1 2 3 4 5


 𝑥2 + 2𝑥3 + 2𝑥4 + 6𝑥5 = 0


5𝑥1 + 4𝑥2 + 3𝑥3 + 3𝑥4 − 𝑥5 = 0

(3) 

 𝑥1 + 2𝑥2 + 𝑥3 − 𝑥4 = 6

 2𝑥1 − 𝑥2 + 𝑥3 + 3𝑥4 + 4𝑥5 = −7



2𝑥 − 𝑥 + 2𝑥 + 𝑥 − 2𝑥 = −4
1 2 3 4 5

2𝑥 − 3𝑥 + 𝑥 + 2𝑥 − 2𝑥 5 = −9

1 2 3 4




𝑥1 + 𝑥3 − 2𝑥4 − 6𝑥5 = 4

(4) 

 2𝑥1 − 𝑥2 − 2𝑥3 + 𝑥4 = 0


 𝑥1 + 2𝑥2 + 2𝑥3 + 𝑥4 = 6


3𝑥 + 𝑥 − 𝑥 − 2𝑥 = 1
1 2 3 4

𝑥1 + 2𝑥2 + 𝑥3 − 3𝑥4 = 2





2𝑥1 + 4𝑥2 + 3𝑥3 − 2𝑥4 = 7

3. 求线性方程组



 𝑥1 − 𝑥2 + 2𝑥3 + 𝑥4 = 1

 2𝑥 − 𝑥 + 𝑥 + 2𝑥 = 3
1 2 3 4


 𝑥1 − 𝑥3 + 𝑥4 = 2


3𝑥1 − 𝑥2 + 3𝑥4 = 5

的通解, 并求出满足 𝑥21 = 𝑥22 的全部解.

4. 讨论下列线性方程组, 当 𝜆 取什么值时方程组有唯一解?取什么值时有无穷多解?取什
么值时无解?

(1) 
 (𝜆 + 3)𝑥1 + 𝑥2 + 2𝑥3 = 𝜆

𝜆𝑥1 + (𝜆 − 1)𝑥2 + 𝑥3 = 𝜆

3(𝜆 + 1)𝑥1 + 𝜆𝑥2 + (𝜆 + 3)𝑥3 = 3

60 第2章 线性方程组

(2) ¨
𝑥1 + 2𝑥2 + 𝜆𝑥3 = 1
2𝑥1 + 𝜆𝑥2 + 8𝑥3 = 𝜆

(3) 
 𝑥1 + 𝑥2 + 𝜆𝑥3 = 2

3𝑥1 + 4𝑥2 + 2𝑥3 = 𝜆

2𝑥1 + 3𝑥2 − 𝑥3 = 3

5. 讨论 𝑎, 𝑏 为何值时, 线性方程组



 𝑥1 − 𝑥2 + 2𝑥3 = 1

 2𝑥 − 𝑥 + 3𝑥 − 𝑥 = 4
1 2 3 4


 𝑥2 + 𝑎𝑥3 + 𝑏𝑥4 = 𝑏


𝑥1 − 3𝑥2 + (3 − 𝑎)𝑥3 = −4

有解或无解. 若有解, 求出其解.

6. 设 𝑥1 − 𝑥2 = 𝑎1 , 𝑥2 − 𝑥3 = 𝑎2 , 𝑥3 − 𝑥4 = 𝑎3 , 𝑥4 − 𝑥5 = 𝑎4 , 𝑥5 − 𝑥1 = 𝑎5 . 证明: 这个方
程组有解的充分必要条件为
5
X
𝑎𝑖 = 0
𝑖=1

并在有解的情况下求出它的一般解.

7. 已知平面上三条不同直线的方程分别为

𝑙1 : 𝑎𝑥 + 2𝑏𝑦 + 3𝑐 = 0
𝑙2 : 𝑏𝑥 + 2𝑐𝑦 + 3𝑎 = 0
𝑙3 : 𝑐𝑥 + 2𝑎𝑦 + 3𝑏 = 0

试证这三条直线交于一点的充要条件是 𝑎 + 𝑏 + 𝑐 = 0.

8. 设有 𝑛 元齐次线性方程组 (𝑛 > 2)



 (1 + 𝑎)𝑥1 + 𝑥2 + · · · + 𝑥𝑛 = 0

 2𝑥 + (2 + 𝑎)𝑥 + · · · + 2𝑥 = 0
1 2 𝑛


 ······


𝑛𝑥1 + 𝑛𝑥2 + · · · + (𝑛 + 𝑎)𝑥𝑛 = 0

试问 𝑎 取何值时, 该方程组有非零解, 并求出其通解.


2.4 习 题 61

9.已知非齐次线性方程组


 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = −1

4𝑥1 + 3𝑥2 + 5𝑥3 − 𝑥4 = −1

𝑎𝑥1 + 𝑥2 + 3𝑥3 + 𝑏𝑥4 = 1

有 3 个线性无关的解,
(1) 证明方程组系数矩阵 𝐴 的秩 rank(𝐴) = 2;
(2) 求 𝑎, 𝑏 的值及方程组的通解.
10. 设线性方程组 
 𝑥1 + 𝑥2 + 𝑥3 = 0

𝑥1 + 2𝑥2 + 𝑎𝑥3 = 0

𝑥1 + 4𝑥2 + 𝑎2 𝑥3 = 0

与方程 𝑥1 + 2𝑥2 + 𝑥3 = 𝑎 − 1 有公共解, 求 𝑎 的值及所有公共解.


11. 设线性方程组 𝐴𝑥 = 𝑏 存在两个不同的解, 其中

   
𝜆 1 1 𝑎
𝐴= 0 𝜆−1 0 , 𝑏= 1 
   

1 1 𝜆 1

(1) 求 𝜆, 𝑎 的值;
(2) 求方程组𝐴𝑥 = 𝑏 的通解.
12. 设
   
1 𝑎 0 0 1
 0 1 𝑎 0   −1 
𝐴= , 𝑏=
   

 0 0 1 𝑎   0 
𝑎 0 0 1 0

当实数 𝑎 为何值时, 方程组 𝐴𝑥 = 𝑏 有无穷多解, 并求其通解.


13. 已知 4 阶矩阵 𝐴 = [𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 ], 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 均为 4 元列向量, 其中 𝛼2 , 𝛼3 , 𝛼4
线性无关, 𝛼1 = 2𝛼2 − 𝛼3 , 若 𝛽 = 𝛼1 + 𝛼2 + 𝛼3 + 𝛼4 , 求线性方程组 𝐴𝑥 = 𝛽 的通解.
14. 已知 3 阶矩阵 𝐴 的第一行是 [𝑎, 𝑏, 𝑐], 𝑎, 𝑏, 𝑐 不全为零,

 
1 2 3
𝐵= 2 4 6 
 

3 6 𝑘

𝑘 为常数, 且𝐴𝐵 = 𝑂, 求线性方程组 𝐴𝑥 = 0 的通解.


15. 设 𝛼, 𝛽 为三维列向量, 矩阵 𝐴 = 𝛼𝛼T + 𝛽𝛽 T , 证明:
62 第2章 线性方程组

(1) 秩 rank(𝐴) 6 2;
(2) 若 𝛼, 𝛽 线性相关, 则秩rank(𝐴) < 2.
16. 设    
1 −1 −1 −1
𝐴 =  −1 1 1 , 𝜉1 =  1 
   

0 −4 −2 −2

(1) 求满足 𝐴𝜉2 = 𝜉1 , 𝐴𝜉32 = 𝜉1 的所有向量 𝜉2 , 𝜉3 ;


(2) 对(1)中的任意向量 𝜉2 , 𝜉3 , 证明 𝜉1 , 𝜉2 , 𝜉3 线性无关.
17. 设向量组 𝛼1 = [1, 0, 1]T , 𝛼2 = [0, 1, 1]T , 𝛼3 = [1, 3, 5]T 不能由向量组 𝛽1 = [1, 1, 1]T ,
𝛽2 = [1, 2, 3]T , 𝛽3 = [3, 4, 𝑎]T 线性表出,
(1) 求 𝑎 的值;
(2) 将 𝛽1 , 𝛽2 , 𝛽3 由 𝛼1 , 𝛼2 , 𝛼3 线性表出.
18. 设矩阵  
1 −2 3 −4
𝐴= 0 1 −1 1 
 

1 2 0 −3

(1) 求方程组 𝐴𝑥 = 0 的一个基础解系;


(2) 求满足 𝐴𝐵 = 𝐼 的所有矩阵 𝐵, 其中 𝐼 是 3 阶单位矩阵.
19. (1) 设 𝐴 是 2 阶方阵, 求满足 𝐴2 = 𝑂 的所有矩阵 𝐴;
(2) 证明: 若 𝐴2 = 𝑂, 且 𝐴 = 𝐴T , 则 𝐴 = 𝑂.
20. 设  
𝜆−1 1 𝜆
𝐴= 1 𝜆−1 0
 

𝜆 1 𝜆−1

若存在非零 3 阶矩阵 𝐵, 使得 𝐴𝐵 = 𝑂, 求 𝜆 的值和齐次线性方程组 𝐴𝑥 = 0 的通解.


21. 设 𝐴 是 𝑠 × 𝑛 矩阵, 𝐵 是 𝑛 × 𝑚 矩阵, 𝑛 < 𝑚, 证明: 齐次线性方程组 (𝐴𝐵)𝑥 = 0 有非
零解.
22. 设 𝐴 是 𝑚 × 𝑠 矩阵, 𝐵 是 𝑠 × 𝑛 矩阵, 𝑥 是 𝑛 元列向量. 证明: 若 (𝐴𝐵)𝑥 = 0 与 𝐵𝑥 = 0
是同解方程组, 则 rank(𝐴𝐵) =rank(𝐵).
23. 试将向量 𝛽 表示成向量组 𝛼1 , 𝛼2 , 𝛼3 的线性组合:
(1) 𝛽 = [3, 4, 1]T , 𝛼1 = [1, −1, 1]T , 𝛼2 = [2, 2, 0]T , 𝛼3 = [1, 1, 1]T ;
(2) 𝛽 = [3, 5, 9]T , 𝛼1 = [0, 2, −1]T , 𝛼2 = [1, 0, 4]T , 𝛼3 = [1, 3, 1]T ;
(3) 𝛽 = [4, 1, 2, −1]T , 𝛼1 = [4, 4, 8, 1]T , 𝛼2 = [3, 4, 7, 2]T , 𝛼3 = [1, 3, −1, 7]T .
24. 问 𝑦 为 何 值 时, 向 量 𝛽 = [4, 6, 𝑦, −2]T 可 以 由 向 量 组 𝛼1 = [2, 3, 1, −2]T , 𝛼2 =
[3, −2, −5, 3]T , 𝛼3 = [−3, 2, 2, −1]T 线性表出.
25. 判断下列向量组的线性相关性:
(1) 𝛼1 = [2, 2, 7, −1]T , 𝛼2 = [3, −1, 2, 4]T , 𝛼3 = [1, 1, 3, 1]T ;
(2) 𝛼1 = [1, −2, 4, −1]T , 𝛼2 = [1, 3, 2, 1]T , 𝛼3 = [1, 4, 1, 0]T , 𝛼4 = [3, 5, 6, 1]T ;
2.4 习 题 63

(3) 𝛼1 = [1, 0, 2, 1]T , 𝛼2 = [1, 2, 0, 1]T , 𝛼3 = [1, 5, −3, 3]T , 𝛼4 = [2, 1, 3, 0]T .
26. 求下列向量组的秩和极大线性无关组:
(1) 𝛼1 = [2, 1, 0]T , 𝛼2 = [3, 1, 1]T , 𝛼3 = [2, 0, 2]T , 𝛼4 = [4, 2, 0]T ;
(2) 𝛼1 = [1, 1, 1, 1]T , 𝛼2 = [1, 1, −1, −1]T , 𝛼3 = [1, −1, −1, 1]T , 𝛼4 = [−1, −1, −1, 1]T ;
(3) 𝛼1 = [6, 4, 1, −1, 2]T , 𝛼2 = [1, 0, 2, 3, −4]T , 𝛼3 = [1, 4, −9, −16, 22]T , 𝛼4 = [7, 1,
0, −1, 3]T .
27. 已知向量组 𝛼1 = [1, −1, 2, 1, 0]T , 𝛼2 = [2, −2, 4, −2, 0]T , 𝛼3 = [3, 0, 6, −1, 1]T , 𝛼4 =
[0, 𝑥, 0, 0, 1]T 有4 个不同极大无关组, 求 𝑥 的值.
28. 求下列齐次线性方程组的一个基础解系:
(1) 
 𝑥1 − 2𝑥2 + 4𝑥3 − 7𝑥4 = 0

2𝑥1 + 𝑥2 − 2𝑥3 + 𝑥4 = 0

3𝑥1 − 𝑥2 + 2𝑥3 − 4𝑥4 = 0

(2)


 2𝑥1 + 𝑥2 − 𝑥3 − 𝑥4 + 𝑥5 = 0

 𝑥 − 𝑥 + 𝑥 + 𝑥 − 2𝑥 = 0
1 2 3 4 5

3𝑥
 1
 + 3𝑥2 − 3𝑥3 − 3𝑥4 + 4𝑥5 = 0


4𝑥1 + 5𝑥2 − 5𝑥3 − 5𝑥4 + 7𝑥5 = 0

29. 求下列线性方程组的通解, 并表示成列向量线性组合的形式:


(1)


 𝑥1 − 2𝑥2 − 𝑥3 − 𝑥4 + 𝑥5 = 0

 2𝑥 + 𝑥 − 𝑥 + 2𝑥 − 3𝑥 = 0
1 2 3 4 5


 3𝑥1 − 2𝑥2 − 𝑥3 + 𝑥4 − 2𝑥5 = 0


2𝑥1 − 5𝑥2 + 𝑥3 − 2𝑥4 + 2𝑥5 = 0

(2)


 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 1

 3𝑥 + 2𝑥 + 𝑥 + 𝑥 − 3𝑥 = 0
1 2 3 4 5


 𝑥2 + 2𝑥3 + 2𝑥4 + 6𝑥5 = 3


5𝑥1 + 4𝑥2 + 3𝑥3 + 3𝑥4 − 𝑥5 = 2

30. 已知: 向量组 I 可用向量组 II 线性表出, 向量组 II 可用向量组 III 线性表出. 求证: 向量
组 I 可用向量组 III 线性表出.
31. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性无关. 证明: 当且仅当 𝑛 为奇数时, 向量组 𝛼1 + 𝛼2 , 𝛼2 +
𝛼3 , · · · , 𝛼𝑛−1 + 𝛼𝑛 , 𝛼𝑛 + 𝛼1 也线性无关.
32. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性无关, 而向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛽, 𝛾 线性相关. 证明: 或
者 𝛽 与 𝛾 中至少有一个可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性表出, 或者向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛽 与向量
组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛾 可相互线性表出.
33. 设 𝛽1 = 𝛼2 + 𝛼3 + · · · + 𝛼𝑛 , 𝛽2 = 𝛼1 + 𝛼3 + · · · + 𝛼𝑛 , · · · , 𝛽𝑛 = 𝛼1 + 𝛼2 + · · · + 𝛼𝑛−1 ,
64 第2章 线性方程组

其中 𝑚 > 1. 证明: 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 与向量组 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 可相互线性表出.

34. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 与 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 满足:

 
𝑥1𝑖
 
   𝑥2𝑖 
𝑥1𝑖
 
 .. 
 . 
𝑥2𝑖
   
 
𝛼𝑖 =  , 𝛽𝑖 =  𝑥𝑟𝑖 , 𝑖 = 1, 2, · · · , 𝑛
 
 .. 
 .  
 𝑥(𝑟+1)𝑖


 
𝑥𝑟𝑖  .. 
.
 
 
𝑥𝑚𝑖

证明: 若 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 线性相关, 则 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性相关; 若 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性无关,


则 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 线性无关.

35. 给定 𝑛 个非零的数 𝑎1 , 𝑎2 , · · · , 𝑎𝑛 , 求下面向量组的秩:

𝜂1 = [1 + 𝑎1 , 1, · · · , 1], 𝜂2 = [1, 1 + 𝑎2 , · · · , 1], · · · , 𝜂𝑛 = [1, 1, · · · , 1 + 𝑎𝑛 ]

36. 设 𝐴, 𝐵 分别是 𝑚×𝑛 和 𝑛×𝑠 的矩阵, 且 𝐴𝐵 = 𝑂. 证明: rank(𝐴) + rank(𝐵)6𝑛.

37. 设 𝜂1 , 𝜂2 , · · · , 𝜂𝑡 是某一非齐次线性方程组的解. 证明: 𝜇1 𝜂1 + 𝜇2 𝜂2 + · · · + 𝜇𝑡 𝜂𝑡 也是


该非齐次线性方程组的解的充要条件是 𝜇1 + 𝜇2 + · · · + 𝜇𝑡 = 1.

38. 证明: 方程组 



 𝑎11 𝑥1 + 𝑎12 𝑥2 + · · · + 𝑎1𝑛 𝑥𝑛 = 0

 𝑎 𝑥 + 𝑎 𝑥 + ··· + 𝑎 𝑥 = 0
21 1 22 2 2𝑛 𝑛

 ······



𝑎𝑚1 𝑥1 + 𝑎𝑚2 𝑥2 + · · · + 𝑎𝑚𝑛 𝑥𝑛 = 0

的解全是方程 𝑏1 𝑥1 + 𝑏2 𝑥2 + · · · + 𝑏𝑛 𝑥𝑛 = 0 的解的充要条件是: 向量 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ] 可由


向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 线性表出, 其中

𝛼𝑖 = [𝑎𝑖1 , 𝑎𝑖2 , · · · , 𝑎𝑖𝑚 ], 𝑖 = 1, 2, · · · , 𝑛

39. 求下列矩阵的逆矩阵:

𝑎2 𝑎3
     
1 1 1 1 5 2 0 0 1 𝑎
 1 1 −1 −1   2 1 0 0   0 1 𝑎 𝑎2 
(1)  ; (2)  ; (3)  ;
     
 1 −1 1 −1   0 0 1 −2   0 0 1 𝑎 
1 −1 −1 1 0 0 1 1 0 0 0 1
2.4 习 题 65

 
0 𝑎1 0 ··· 0
···
 
 0 0 𝑎2 0 
 
.. .. .. ..
(4)   , 𝑎𝑖 ̸= 0, 𝑖 = 1, 2, · · · , 𝑛.
 
 . . . . 
0 0 0 ··· 𝑎𝑛−1
 
 
𝑎𝑛 0 0 ··· 0
40. 解下列矩阵方程:
   
1 1 1 5 6
(1)  0 1 1 𝑋 =  3 4 ;
   

0 0 1 1 2
   
1 2 −3 1 −3 0
(2)𝑋  3 2 −4  =  10 2 7 .
   

2 −1 0 10 7 8
41. 设 𝐴, 𝐵, 𝐶 均为 𝑛 阶方阵, 若 𝐴𝐵𝐶 = 𝐼, 则下列乘积: 𝐴𝐶𝐵, 𝐵𝐴𝐶, 𝐵𝐶𝐴, 𝐶𝐴𝐵,
𝐶𝐵𝐴 中哪些必等于单位阵 𝐼.
42. (1)设 𝐴 为方阵, 正整数 𝑘 > 1, 𝐴𝑘 = 𝑂, 证明:

(𝐼 − 𝐴)−1 = 𝐼 + 𝐴 + 𝐴2 + · · · + 𝐴𝑘−1

(2)设 𝐽𝑛 为所有元素全为 1 的 𝑛 阶矩阵, 证明:

1
(𝐼 − 𝐽𝑛 )−1 = 𝐼 − 𝐽𝑛
𝑛−1

– ™
0 𝐵
43. 设 𝐴 = , 其中 𝐵 是 𝑛 阶可逆矩阵, 𝐶 是 𝑚 阶可逆矩阵, 证明: 𝐴 可逆, 并求
𝐶 0
𝐴−1 .
44. 设 𝑛 阶可逆矩阵 𝐴 每行元素之和都等于常数 𝑐. 证明: 𝑐 ̸= 0, 且 𝐴−1 中每行元素之和
都等于 𝑐−1 .
45. 设 𝐴 为方阵, 又 𝐴 + 𝐼 可逆, 𝑓 (𝐴) = (𝐼 − 𝐴)(𝐼 + 𝐴)−1 , 证明:
(1) [𝐼 + 𝑓 (𝐴)](𝐼 + 𝐴) = 2𝐼; (2) 𝑓 (𝑓 (𝐴)) = 𝐴.
46. 设 𝐴, 𝐵 均为 𝑛 阶可逆矩阵. 证明: 如果 𝐴 + 𝐵 可逆, 则 𝐴−1 + 𝐵 −1 也可逆, 并求其逆
矩阵.
47. (1) 设 𝐴 为 𝑛 阶方阵, 满足 𝐴3 + 2𝐴2 − 2𝐴 − 𝐼𝑛 = 𝑂, 证明: 𝐴 + 𝐼𝑛 是可逆矩阵, 并求
其逆矩阵;
(2) 设 𝐴, 𝐵 为 𝑛 阶方阵, 且 𝐴 − 𝐼𝑛 和 𝐵 可逆. 证明: 若 (𝐴 − 𝐼𝑛 )−1 = (𝐵 − 𝐼𝑛 )T , 则有 𝐴
可逆;
(3) 设 𝑛 阶方阵 𝐴 满足 𝐴2 + 𝐴 − 6𝐼𝑛 = 𝑂, 证明: 𝐴𝐴 + 𝐼𝑛 和 𝐴 + 4𝐼𝑛 都可逆, 并求它们
的逆矩阵.
66 第2章 线性方程组

48. 已知 𝐴, 𝐵 为 3 阶方阵, 且满足 2𝐴−1 𝐵 = 𝐵 − 4𝐼.


(1) 证明: 矩阵 𝐴 − 2𝐼 可逆;
(2) 若  
1 −2 0
𝐵= 1 2 0 
 

0 0 2

求 𝐴.
49. 设 𝛼 是 𝑛 维非零列向量, 记 𝐴 = 𝐼𝑛 − 𝛼𝛼T . 证明:
(1) 𝐴2 = 𝐴 的充分必要条件是 𝛼𝛼T = 1;
(2) 当 𝛼T 𝛼 = 1 时, 𝐴 是不可逆矩阵.
50. 设 𝑃 是 𝑚 × 𝑛 矩阵, 且 𝑃 𝑃 T 可逆. 记 𝐴 = 𝐼𝑛 − 𝑃 T (𝑃 𝑃 T )−1 𝑃 , 证明: 𝐴 是对称矩阵,
且 𝐴2 = 𝐴.
证明下列矩阵是正交阵:
51. 
1 2
 √ 0 √ 
 3 6 
1 1 1 
 

(1)  − √
 √ √  ;
 3 2 6 

 
 1 1 1 
−√ −√ √
3 2 6
 
1 1 1 1
 − 
 2 2 2 2 
1 1 1 1 
 

 − 
 2 2 2 2 
(2)  .
 1 1 1 1 
− − −
 
2 2 2 2
 
 
 
 1 1 1 1 

2 2 2 2
52. 设 𝐴 为 𝑛 阶对角阵, 且为正交矩阵, 求 𝐴.
第3章 行 列 式

第 2 章介绍了矩阵、 向量以及线性方程组的基本理论, 包括矩阵 𝐴 的秩


rank(𝐴) 和迹 tr(𝐴) 等基本概念. 本章专门介绍关于矩阵的另一重要概念:行列式
det(𝐴). rank(𝐴), tr(𝐴) 和 det(𝐴) 均为单个数字, 但它们反映了矩阵的内在特性.
需要指出的是, 秩 rank(𝐴) 对一般矩阵均适用, 但迹 tr(𝐴) 和行列式 det(𝐴) 要求矩
阵 𝐴 为方阵.

3.1 行列式的定义

3.1.1 逆序数

为了引出行列式的一般定义, 先介绍逆序数的概念.
定 义 3.1.1 由数 1, 2, · · · , 𝑛 组成的一个有序数组, 称为一个 𝑛 级排
排 列, 其一
般形式为 𝑖1 𝑖2 · · · 𝑖𝑛 , 其中 𝑖𝑘 (𝑘 = 1, 2, · · · , 𝑛) 为数 1, 2, · · · , 𝑛 中的某一个数, 且
𝑖1 𝑖2 · · · 𝑖𝑛 中的 𝑛 个数互不相等.
显然, 数 1, 2, · · · , 𝑛 可以组成 𝑛! 个不同的 𝑛 级排列.
定 义3.1.2 在一个排列中, 对任意两个数 𝑖 和 𝑗, 如果 𝑗 位于 𝑖 的后面, 且 𝑗 < 𝑖,
则称 𝑖, 𝑗 构成一个逆
逆序 . 一个 𝑛 级排列 𝑖1 𝑖2 · · · 𝑖𝑛 中逆序的总数称为该排列的逆
逆序
数, 记作 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ).
例 3.1.1 排列 21345 的逆序数 𝜏 (21345) = 1, 如果将该排列 1 和 4 位置互换
而其余的数不变, 则得新的排列 24315, 且 𝜏 (24315) = 4.
定 理 3.1.1 任一排列经过一次对换(排列中某两个数的位置互换而其余的数
不变), 其逆序数的奇偶性改变.
证明 首先考虑排列 𝑖1 𝑖2 · · · 𝑖𝑘 𝑖𝑘+1 · · · 𝑖𝑛 中相邻两个数 𝑖𝑘 𝑖𝑘+1 对换的情形. 若
𝑖𝑘 > 𝑖𝑘+1 , 则对换后逆序数减少 1; 若 𝑖𝑘 < 𝑖𝑘+1 , 则对换后逆序数增加 1. 上述两种
情况下逆序数的奇偶性均发生改变.
下面考虑排列 𝑖1 · · · 𝑖𝑘 · · · 𝑖𝑙 · · · 𝑖𝑛 中非相邻两个数 𝑖𝑘 与 𝑖𝑙 对换的情形. 非相邻
𝑖𝑘 与 𝑖𝑙 的对换可通过相邻数的对换以类似“冒泡排序”方式分两个阶段实现:
(1) 𝑖𝑘 与 𝑖𝑘+1 对换, 再与 𝑖𝑘+2 对换, · · · , 最后与 𝑖𝑙 对换, 通过 𝑙 − 𝑘 次相邻对换
将 𝑖𝑘 向后挪至第 𝑙 个位置;
68 第3章 行 列 式

(2) 𝑖𝑙 与 𝑖𝑙−1 对换, 再与 𝑖𝑙−2 对换, · · · , 最后与 𝑖𝑘+1 对换, 通过 𝑙 − 𝑘 − 1 次相邻


对换将 𝑖𝑙 往前移至第 𝑘 个位置.
共进行了 2(𝑙 − 𝑘) − 1 次相邻对换, 故逆序数的奇偶性改变了奇数次, 从而最
终逆序数的奇偶性发生了改变.

3.1.2 行列式的定义

定义 3.1.3 设 𝑛 阶方阵
 
𝑎11 𝑎12 · · · 𝑎1𝑛
 
 𝑎
 21 𝑎22 · · · 𝑎2𝑛 

𝐴=
 .. .. ..


 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

则方阵 𝐴 的行
行列 式 (determinant) 可定义为

𝑎11

𝑎12 · · · 𝑎1𝑛

𝑎
21 𝑎22 · · · 𝑎2𝑛 X
(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛

=
.. .. ..


. . . 𝑖1 𝑖2 ···𝑖𝑛

𝑎𝑛2 · · · 𝑎𝑛𝑛

𝑎𝑛1

因 𝐴 是 𝑛 阶方阵, 故其行列式有时也称 𝑛 阶行列式. 方阵 𝐴 的行列式可简记


为 det(𝐴)或 |𝐴|. 上述行列式定义式中 𝑖1 𝑖2 · · · 𝑖𝑛 是一个 𝑛 级排列, 表示
P
𝑖1 𝑖2 ···𝑖𝑛

对所有 𝑛 级排列 𝑖1 𝑖2 · · · 𝑖𝑛 求和. 从定义 3.1.3 可以看出, 𝑛 阶方阵 𝐴 的行列式是 𝑛!


个乘积项的代数和, 每一乘积项是取自不同行不同列的 𝑛 个元素的乘积, 每一乘积
项的符号(取正或负)与排列 𝑖1 𝑖2 · · · 𝑖𝑛 的奇偶性有关.
定义 3.1.3 的每一乘积项中 𝑛 个元素的列指标固定为 12 · · · 𝑛, 行指标 𝑖1 𝑖2 · · · 𝑖𝑛
是一个 𝑛 级排列. 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) 为奇数时, 乘积项 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 前取负号; 当
𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) 为偶数时, 乘积项 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 前取正号.
例3.1.2 设 1 阶矩阵 𝐴 = [𝑎11 ], 则 1 阶行列式 det(𝐴) = 𝑎11 .
例3.1.3 设 2 阶矩阵  
𝑎11 𝑎12 
𝐴=
𝑎21 𝑎22

则 2 阶行列式 det(𝐴) = 𝑎11 𝑎22 − 𝑎21 𝑎12 .


3.1 行列式的定义 69

例3.1.4 设 3 阶矩阵
 
𝑎11 𝑎12 𝑎13
 
𝐴=
 𝑎21 𝑎22 𝑎23 

𝑎31 𝑎32 𝑎33

则 3 阶行列式

det(𝐴) =𝑎11 𝑎22 𝑎33 + 𝑎21 𝑎32 𝑎13 + 𝑎31 𝑎12 𝑎23 − 𝑎31 𝑎22 𝑎13
− 𝑎21 𝑎12 𝑎33 − 𝑎11 𝑎32 𝑎23

注 从上述三个例子可以看出:

(1) 一个数可以看成 1 阶矩阵, 其行列式是其本身.

(2) 2 阶矩阵的行列式是 2 项的代数和, 一项是矩阵主对角线上两元素的乘积,


符号取正; 另一项是矩阵次对角线上两元素的乘积, 符号取负.

(3) 3 阶矩阵的行列式是 6 项的代数和, 前 3 项符号取正, 其中 𝑎11 𝑎22 𝑎33 是矩


阵主对角线上 3 个元素的乘积, 𝑎12 𝑎23 𝑎31 和 𝑎13 𝑎21 𝑎32 均是位于主对角线的平行
线上两个元素与其对角上另一元素的乘积; 符号取负的后三项可由次对角线类似
得到.

上述现象可通俗地称为“对角线法则”. 需要指出的是, 2 阶、3 阶行列式均


满足所谓的对角线法则, 但 4 阶及 4 阶以上的行列式均不满足对角线法则.
例3.1.5 设 4 阶矩阵
 
𝑎11 𝑎12 𝑎13 𝑎14
 
 𝑎 𝑎22 𝑎23 𝑎24 
 21
𝐴=


 𝑎31 𝑎32 𝑎33 𝑎34 
 
𝑎41 𝑎42 𝑎43 𝑎44

则 4 阶行列式
X
det(𝐴) = (−1)𝜏 (𝑖1 𝑖2 𝑖3 𝑖4 ) 𝑎𝑖1 1 𝑎𝑖2 2 𝑎𝑖3 3 𝑎𝑖4 4
𝑖1 𝑖2 𝑖3 𝑖4

是 4! = 24 个乘积项的代数和. 需要注意的是, 如果对 4 阶行列式滥用对角线法则,


会得到错误的结果.
70 第3章 行 列 式

例3.1.6 设上三角阵
 
𝑎11 𝑎12 · · · 𝑎1𝑛
 
 0
 𝑎22 · · · 𝑎2𝑛 

𝐴=
 .. .. ..


 . . . 
 
0 0 · · · 𝑎𝑛𝑛

则根据行列式的定义, det(𝐴) 是 𝑛! 个乘积项的代数和, 但在其 𝑛! 个乘积项中只有


𝑎11 𝑎22 · · · 𝑎𝑛𝑛 可能不为 0, 其余 𝑛! − 1 项均为 0, 且由于 𝜏 (12 · · · 𝑛) = 0, 故

det(𝐴) = 𝑎11 𝑎22 · · · 𝑎𝑛𝑛

即上三角阵的行列式等于其主对角线元素的乘积.
同理, 可得下三角阵的行列式也等于其主对角线元素的乘积.
特别地, 单位阵 𝐼 是特殊的三角阵(既是上三角阵, 也是下三角阵),
 
1 0 ··· 0
 

 0 1 ··· 0 
𝐼=
 .. .. .. 


 . . . 

0 0 ··· 1

因此其行列式 det(𝐼) = 1.
注 在前面的行列式定义中,
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )
· · · 𝑎𝑖𝑛 𝑛 , 其表达式的每一乘积项
P
(1) det(𝐴) = 𝑖1 𝑖2 ···𝑖𝑛 (−1) 𝑎𝑖1 1 𝑎𝑖2 2
中 𝑛 个元素的列指标固定为 12 · · · 𝑛, 行指标 𝑖1 𝑖2 · · · 𝑖𝑛 是某个 𝑛 级排列. 事实上,
行列式还有下列等价的表达式.
𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
· · · 𝑎𝑛𝑗𝑛 .
P
(2) 𝑗1 𝑗2 ···𝑗𝑛 (−1) 𝑎1𝑗1 𝑎2𝑗2
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 .
P
(3) 𝑖1 𝑖2 ···𝑖𝑛 (−1)
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 .
P
(4) 𝑗1 𝑗2 ···𝑗𝑛 (−1)

表 达 式 (2) 的 每 一 乘 积 项 中 𝑛 个 元 素 的 行 指 标 固 定 为 12 · · · 𝑛, 列 指 标
𝑗1 𝑗2 · · · 𝑗𝑛 是一个 𝑛 级排列, 表示对所有 𝑛 级排列 𝑗1 𝑗2 · · · 𝑗𝑛 求和. 当
P
𝑗1 𝑗2 ···𝑗𝑛

𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为奇数时, 乘积项 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 前取负号; 当 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为偶数


时, 乘积项 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 前取正号.
表 达 式 (3) 的 每 一 乘 积 项 中 𝑛 个 元 素 的 列 指 标 固 定 为 𝑗1 𝑗2 · · · 𝑗𝑛 , 行 指
3.1 行列式的定义 71

标 𝑖1 𝑖2 · · · 𝑖𝑛 是 一 个 𝑛 级 排 列. 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 奇 数 时, 乘 积
项 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取负号; 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为偶数时, 乘积项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取正号.
表 达 式 (4) 的 每 一 乘 积 项 中 𝑛 个 元 素 的 行 指 标 固 定 为 𝑖1 𝑖2 · · · 𝑖𝑛 , 列 指 标
𝑗1 𝑗2 · · · 𝑗𝑛 是 一 个 𝑛 级 排 列. 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 奇 数 时, 乘 积 项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前 取 负 号; 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 偶 数 时, 乘 积 项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取正号.
显然, 表达式 (1) 是表达式 (3) 取 𝑗1 𝑗2 · · · 𝑗𝑛 = 12 · · · 𝑛 的特例, 表达式 (2) 是表
达式 (4) 取 𝑖1 𝑖2 · · · 𝑖𝑛 = 12 · · · 𝑛 的特例.
下证这四个表达式的等价性.
证明 先证明表达式 (1) 与表达式 (2) 的等价性.
令集合

𝐸 = {(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 |𝑖1 𝑖2 · · · 𝑖𝑛 }


𝐹 = {(−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 |𝑗1 𝑗2 · · · 𝑗𝑛 }

集 合 𝐸 与 集 合 𝐹 均 含 有 𝑛! 个 带 符 号 的 乘 积 项. 对 于 集 合 𝐸 中 的 任 意 乘
积 项 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 , 可 改 变 各 因 数 次 序, 使 得 行 指 标 𝑖1 𝑖2 · · · 𝑖𝑛
与 列 指 标 12 · · · 𝑛 经 相 同 的 𝑘 次 对 换 分 别 变 为 12 · · · 𝑛 与𝑗1 𝑗2 · · · 𝑗𝑛 , 即
𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 = 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 . 由于经过 𝑘 次对换, 排列逆序数的奇偶性改
变 𝑘 次: (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) (−1)𝑘 = (−1)𝜏 (12···𝑛) , (−1)𝜏 (12···𝑛) (−1)𝑘 = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) ,
得 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) , 从而

(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛

因 (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 ∈ 𝐹 , 故 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 ∈ 𝐹 , 即 𝐸 ⊆
𝐹 . 同理可得 𝐹 ⊆ 𝐸, 故 𝐸 = 𝐹 . 这说明表达式 (1) 与表达式 (2) 的 𝑛! 个乘积项中
每项对应相等而且符号相同, 因此这些乘积项的代数和也相等, 从而证明了表达式
(1) 与表达式 (2) 的等价性.
再证明表达式 (1) 与表达式 (3) 的等价性.
将 表 达 式 (3) 中 乘 积 项 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 的 行 指 标
𝑖1 𝑖2 · · · 𝑖𝑛 与列指标 𝑗1 𝑗2 · · · 𝑗𝑛 经相同的 𝑘 次对换分别变为 𝑠1 𝑠2 · · · 𝑠𝑛 与 12 · · · 𝑛, 即
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 = 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛 . 由于经过 𝑘 次对换, 排列逆序数的奇偶性改
变 𝑘 次: (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) (−1)𝑘 = (−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) , (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) (−1)𝑘 = (−1)𝜏 (12···𝑛) ,
72 第3章 行 列 式

得 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) = (−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) , 从而

(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 = (−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛

这说明表达式(1)与表达式(3)的 𝑛! 个乘积项中每项对应相等而且符号相同, 因此

X
(−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛
𝑠1 𝑠2 ···𝑠𝑛
X
= (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛
𝑖1 𝑖2 ···𝑖𝑛

从而证明了表达式 (1) 与表达式 (3) 的等价性.


同理, 可证明表达式 (2) 与表达式 (4) 的等价性. 这就证明了表达式 (1) ∼ (4)
的等价性.

3.2 行列式的性质

性质 3.2.1 设 𝐴 是 𝑛 阶方阵, det(𝐴T ) = det(𝐴).


证明 设
   
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑏11 𝑏12 · · · 𝑏1𝑛
   
 𝑎
 21 𝑎22 · · · 𝑎2𝑛 

 𝑏
 21
T
𝑏22 · · · 𝑏2𝑛 

𝐴=
 .. .. ..
,
 𝐴 =
 .. .. ..


 . . .   . . . 
   
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑏𝑛1 𝑏𝑛2 · · · 𝑏𝑛𝑛

其中 𝑏𝑖𝑗 = 𝑎𝑗𝑖 (𝑖 = 1, 2, · · · , 𝑛; 𝑗 = 1, 2, · · · , 𝑛), 则

X
det(𝐴T ) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑏1𝑗1 𝑏2𝑗2 · · · 𝑏𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑗1 1 𝑎𝑗2 2 · · · 𝑎𝑗𝑛 𝑛
𝑗1 𝑗2 ···𝑗𝑛

= det(𝐴)

注 性质3.2.1表明方阵转置后的行列式不变, 因此对于行成立的行列式命题,
对于列相应的命题也成立. 故以下在证明行列式性质时, 只证其对行成立即可.
3.2 行列式的性质 73

性质 3.2.2 设 𝑛 阶方阵
 
𝑎11 𝑎12 ··· 𝑎1𝑛
 .. .. .. 
. . .
 
 
 
𝐴 =  𝑏𝑡1 + 𝑐𝑡1 𝑏𝑡2 + 𝑐𝑡2 · · · 𝑏𝑡𝑛 + 𝑐𝑡𝑛
 

 
 .. .. .. 

 . . . 

𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛
   
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛
 .. .. ..   .. .. .. 
. . . . . .
   
   
   
𝐵 =  𝑏𝑡1 𝑏𝑡2 ··· 𝑏𝑡𝑛 , 𝐶 =  𝑐𝑡1 𝑐𝑡2 ··· 𝑐𝑡𝑛
   

   
 . .. ..  . .. ..
 ..  ..
 
 . . 
  . . 

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

则 det(𝐴) = det(𝐵) + det(𝐶), 即方阵的行列式具有分行(列)相加性.

证明
X
det(𝐴) = (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · (𝑏𝑡𝑗𝑡 + 𝑐𝑡𝑗𝑡 ) · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑏𝑡𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛
X
+ (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑐𝑡𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛

= det(𝐵) + det(𝐶)

注 𝐵 和 𝐶 是 𝑛 阶方阵, 一般情况下 det(𝐵 + 𝐶) ̸= det(𝐵) + det(𝐶).


性质 3.2.3 方阵的任意两行(列)互换, 其行列式的值只改变正负号.
证明 设 𝑛 阶方阵  
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
 
 

 . . . 

 
 𝑎𝑠1
 𝑎𝑠2 ··· 𝑎𝑠𝑛 

 . .. .. 
 ..
𝐴= . . 

 
 𝑎
 𝑡1 𝑎𝑡2 ··· 𝑎𝑡𝑛 

 .. .. ..
 

 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
74 第3章 行 列 式

互换方阵 𝐴 的第 𝑠 行和第 𝑡 行( 𝑠 < 𝑡), 得


   
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑏11 𝑏12 · · · 𝑏1𝑛
 .. .. .. .. .. ..
   
  
 . . .  
 . . . 

   
··· ···
 
 𝑎𝑡1 𝑎𝑡2 𝑎𝑡𝑛 𝑠 行  𝑏𝑠1
 𝑏𝑠2 𝑏𝑠𝑛 

 
 . .. ..  . .. .. 
 ..  ..

 . . 
 , 𝐵 =  . . 

   
𝑎
 𝑠1 𝑎𝑠2 ··· 𝑎𝑠𝑛 𝑡 行

 𝑏
 𝑡1 𝑏𝑡2 ··· 𝑏𝑡𝑛 

 . .. ..   ..

.. .. 
 . 
 . . .  . . .
 
  
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑏𝑛1 𝑏𝑛2 · · · 𝑏𝑛𝑛
 

其中 


 𝑏𝑡𝑗 = 𝑎𝑠𝑗 (𝑗 = 1, 2, · · · , 𝑛)

𝑏𝑠𝑗 = 𝑎𝑡𝑗 (𝑗 = 1, 2, · · · , 𝑛)



𝑏𝑖𝑗 = 𝑎𝑖𝑗 (𝑖 ̸= 𝑠, 𝑖 ̸= 𝑡, 𝑗 = 1, 2, · · · , 𝑛)

因此
det(𝐵)
X
= (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 ) 𝑏1𝑗1 · · · 𝑏𝑠𝑗𝑠 · · · 𝑏𝑡𝑗𝑡 · · · 𝑏𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑎𝑡𝑗𝑠 · · · 𝑎𝑠𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛
X
= − (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 )+𝜏 (1···𝑡···𝑠···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑎𝑡𝑗𝑠 · · · 𝑎𝑠𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛

= − det(𝐴)
推论 3.2.1 若方阵中有两行(列)对应元素相等, 则其行列式为 0.

证 明 设 方 阵 𝐴 互 换 对 应 元 素 相 等 的 两 行(列)后 得 到 的 方 阵 为 𝐵, 有
det(𝐴) = − det(𝐵). 又因为互换的两行(列)是相同的, 故 𝐴 = 𝐵, 从而 det(𝐴) =
− det(𝐵). 因此 det(𝐴) = 0.
性质 3.2.4 设 𝑛 阶方阵
   
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
 .. .. ..   .. .. .. 
. . . . . .
   
   
   
𝐴 =  𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 , 𝐵 =  𝑘𝑎𝑖1 𝑘𝑎𝑖2 · · · 𝑘𝑎𝑖𝑛
   

   
 . .. ..  . .. ..
 ..  ..
 
 . . 
  . . 

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛
3.2 行列式的性质 75

则 det(𝐵) = 𝑘 det(𝐴), 即将 𝐴 的第 𝑖 行(列)乘以常数 𝑘 所得新矩阵的行列式为


𝑘 det(𝐴).

证明
X
det(𝐵) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · (𝑘𝑎𝑖𝑗𝑖 ) · · · 𝑎𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛 ) 𝑘𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑖𝑗𝑖 · · · 𝑎𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛

= 𝑘 det(𝐴)

推论 3.2.2 设 𝐴 是 𝑛 阶方阵, det(𝑘𝐴) = 𝑘 𝑛 det(𝐴).


推论 3.2.3 若方阵某一行(列)的元素全为 0, 则其行列式为 0.

推论 3.2.2 和推论 3.2.3 可由性质 3.2.4 直接推出.


推论 3.2.4 若方阵中有两行(列)的元素对应成比例, 则其行列式为 0.

证明 设 𝑛 阶方阵
 
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
 
 

 . . . 

 
 𝑎𝑠1
 𝑎𝑠2 ··· 𝑎𝑠𝑛 

 . .. .. 
 ..
𝐴= . . 

 
 𝑎
 𝑡1 𝑎𝑡2 ··· 𝑎𝑡𝑛 

 .. .. ..
 

 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

其中 𝑎𝑠𝑗 = 𝑘𝑎𝑡𝑗 (𝑠 ̸= 𝑡, 𝑗 = 1, 2, · · · , 𝑛), 故



𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛


.. .. .. .. .. ..



. . .


. . .



𝑎𝑠1 𝑎𝑠2 ··· 𝑎𝑠𝑛


𝑎𝑠1 𝑎𝑠2 ··· 𝑎𝑠𝑛

.. .. .. .. .. ..
det(𝐴) = . . . = 𝑘
. . . =0



𝑘𝑎𝑠1 𝑘𝑎𝑠2 · · · 𝑘𝑎𝑠𝑛


𝑎𝑠1 𝑎𝑠2 ··· 𝑎𝑠𝑛


.. .. ..


.. .. ..


. . .


. . .

··· 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

𝑎𝑛1 𝑎𝑛2 𝑎𝑛𝑛
76 第3章 行 列 式

性质 3.2.5 设 𝑛 阶方阵
 
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
 
 

 . . . 

 
 𝑎𝑖1
 𝑎𝑖2 ··· 𝑎𝑖𝑛 

 . .. .. 
 ..
𝐴= . . 

 
 𝑎
 𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛 

 .. .. ..
 

 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

 
𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. ..
 
 

 . . . 

 
 𝑎𝑖1 + 𝑘𝑎𝑗1
 𝑎𝑖2 + 𝑘𝑎𝑗2 · · · 𝑎𝑖𝑛 + 𝑘𝑎𝑗𝑛 

 .. .. .. 
𝐵=
 . . . 

 

 𝑎𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛 


 .. .. .. 


 . . . 

𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛

则 det(𝐵) = det(𝐴), 即将 𝐴 的第 𝑗 行(列)乘以常数 𝑘 后加到第 𝑖 行(列)所得矩阵


的行列式不变.
证明 由行列式的分行(列)可加性, 得

𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛


.. .. .. .. .. ..



. . .
. . .



𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛
𝑘𝑎𝑗1 𝑘𝑎𝑗2 · · · 𝑘𝑎𝑗𝑛

.. .. .. .. .. ..
det(𝐵) = . . . +
. . . = det(𝐴)



𝑎𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛
𝑎𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛


.. .. ..
.. .. ..


. . .
. . .

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 ···

𝑎𝑛1 𝑎𝑛2 𝑎𝑛𝑛

注 上述性质 3.2.3 ∼ 性质 3.2.5表明, 对方阵 𝐴 作 3 种初等行(列)变换:


(1) 将 𝐴 的第 𝑖 行(列)与第 𝑗 行(列)对换;
(2) 将 𝐴 的第 𝑖 行(列)乘以非零常数 𝑘;
3.2 行列式的性质 77

(3) 将 𝐴 的第 𝑗 行(列)的 𝑘 倍加到第 𝑖 行(列),


则变换所得新矩阵的行列式分别为 − det(𝐴), 𝑘 det(𝐴), det(𝐴).
推 论 3.2.5 3 种初等变换对应初等矩阵 𝐸𝑖𝑗 , 𝐸𝑖 (𝑘), 𝐸𝑖𝑗 (𝑘) 的行列式分别为
det(𝐸𝑖𝑗 ) = −1, det(𝐸𝑖 (𝑘)) = 𝑘 ̸= 0, det(𝐸𝑖𝑗 (𝑘)) = 1.
证明 第一类初等矩阵 𝐸𝑖𝑗 表示将单位阵 𝐼 的第 𝑖 行(列)与第 𝑗 行(列)对换后
得到的矩阵, 故 det(𝐸𝑖𝑗 ) = − det(𝐼) = −1.
第二类初等矩阵 𝐸𝑖 (𝑘) 表示将单位阵 𝐼 的第 𝑖 行(列)乘以非零常数 𝑘 后得到
的矩阵, 故 det(𝐸𝑖 (𝑘)) = 𝑘 det(𝐼) = 𝑘 ̸= 0.
第三类初等矩阵 𝐸𝑖𝑗 (𝑘) 表示将单位阵 𝐼 的第 𝑗 行(第 𝑖 列) 乘以任意常数 𝑘 后
加到第 𝑖 行(第 𝑗 列)上得到的矩阵, 故 det(𝐸𝑖𝑗 (𝑘)) = det(𝐼) = 1.
推 论3.2.6 设 𝐸 是 某 种 𝑛 阶 初 等 矩 阵, 𝐴 是 𝑛 阶 方 阵, 则 det(𝐸𝐴) =
det(𝐴𝐸) = det(𝐴) det(𝐸).
证明 对矩阵 𝐴 作一次初等行(列)变换, 相当于在 𝐴 的左(右)边乘上一个相
应的初等矩阵.
若 𝐸 是第一类初等矩阵 𝐸𝑖𝑗 , det(𝐸𝐴) = − det(𝐴) = det(𝐸) det(𝐴);
若 𝐸 是第二类初等矩阵 𝐸𝑖 (𝑘), det(𝐸𝐴) = 𝑘 det(𝐴) = det(𝐸) det(𝐴);
若 𝐸 是第三类初等矩阵 𝐸𝑖𝑗 (𝑘), det(𝐸𝐴) = det(𝐴) = det(𝐸) det(𝐴).
定理 3.2.1 方阵 𝐴 可逆的充要条件是 det(𝐴) ̸= 0.
证明 先证必要性. 若方阵 𝐴 可逆, 则存在有限个初等阵 𝐸1 , 𝐸2 , · · · , 𝐸𝑘 ,
使得 𝐴 = 𝐸1 𝐸2 · · · 𝐸𝑘 , 因此

det(𝐴) = det(𝐸1 𝐸2 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 ) det(𝐸3 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 ) det(𝐸3 ) · · · det(𝐸𝑘 ) ̸= 0

再证充分性. 反证法, 假定 𝑛 阶方阵 𝐴 不可逆, 则 rank(𝐴) = 𝑟 < 𝑛, 故存在有


限个初等阵 𝐸1 , 𝐸2 , · · · , 𝐸𝑠 和 𝐹1 , 𝐹2 , · · · , 𝐹𝑡 使得
 
𝐼𝑟 𝑂 
𝐴 = 𝐸1 𝐸2 · · · 𝐸𝑠  𝐹1 𝐹2 · · · 𝐹𝑡
𝑂 𝑂

所以
78 第3章 行 列 式

det(𝐴)
„   Ž
𝐼𝑟 𝑂 
= det 𝐸1 𝐸2 · · · 𝐸𝑠  𝐹1 𝐹2 · · · 𝐹𝑡
𝑂 𝑂
„   Ž
𝐼𝑟 𝑂 
= det(𝐸1 ) det 𝐸2 · · · 𝐸𝑠  𝐹1 𝐹2 · · · det(𝐹𝑡 )
𝑂 𝑂
„ Ž
𝐼
 𝑟
𝑂 
= det(𝐸1 ) det(𝐸2 ) · · · det(𝐸𝑠 ) det det(𝐹1 ) det(𝐹2 ) · · · det(𝐹𝑡 )
𝑂 𝑂

=0

由方阵可逆的上述充要条件可直接得到下面的推论.
推论 3.2.7 方阵 𝐴 不可逆的充要条件是 det(𝐴) = 0.
性 质 3.2.6 设 𝐴 与 𝐵 都是 𝑛 阶方阵, 则 det(𝐴𝐵) = det(𝐴) det(𝐵), 即两个
𝑛 阶方阵乘积的行列式等于两个方阵行列式的乘积.
证明 先考虑方阵 𝐴 不可逆的情形, 此时 rank(𝐴) < 𝑛, det(𝐴) = 0.
由于 rank(𝐴𝐵) 6 rank(𝐴) < 𝑛, 故方阵 𝐴𝐵 不可逆, det(𝐴𝐵) = 0, 因此成立
det(𝐴𝐵) = det(𝐴) det(𝐵).
再考虑方阵 𝐴 可逆的情形, 此时存在有限个初等阵 𝐸1 , 𝐸2 , · · · , 𝐸𝑘 , 使得
𝐴 = 𝐸1 𝐸2 · · · 𝐸𝑘 , 从而

det(𝐴𝐵) = det(𝐸1 𝐸2 · · · 𝐸𝑘 𝐵)
= det(𝐸1 ) det(𝐸2 · · · 𝐸𝑘 𝐵)
= det(𝐸1 ) det(𝐸2 ) · · · det(𝐸𝑘 ) det(𝐵)
= det(𝐴) det(𝐵)

利用数学归纳法, 由性质 (3.2.6) 还可推广得到下述推论.


推论 3.2.8 设 𝐴1 , 𝐴2 , · · · , 𝐴𝑘 是 𝑛 阶方阵, 则

det(𝐴1 𝐴2 · · · 𝐴𝑘 ) = det(𝐴1 ) det(𝐴2 ) · · · det(𝐴𝑘 )

1
性质 3.2.7 设 𝑛 阶方阵 𝐴 可逆, 则 det(𝐴−1 ) = .
det(𝐴)
证明 因 𝐴𝐴−1 = 𝐼, 故 det(𝐴𝐴−1 ) = det(𝐼), 从而 det(𝐴) det(𝐴−1 ) = 1. 由
1
于方阵 𝐴 可逆, 故 det(𝐴) ̸= 0, 因此 det(𝐴−1 ) = .
det(𝐴)
特别地, 正交阵的行列式为 1 或 −1. 这是因为, 设正交阵 𝑄, 𝑄𝑄T = 𝐼, 得
3.3 伴随矩阵与行列式按行(列)展开 79

det(𝑄𝑄T ) = det(𝐼) = 1, 从而 det(𝑄) det(𝑄T ) = (det(𝑄))2 = 1 , 因此 det(𝑄) =


±1.

3.3 伴随矩阵与行列式按行(列)展开

3.3.1 伴随矩阵

定义 3.3.1 将 𝑛 阶方阵 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 的第 𝑖 行第 𝑗 列划去后, 所得的 𝑛 − 1 阶


子矩阵的行列式记作 𝑀𝑖𝑗 , 则称 (−1)𝑖+𝑗 𝑀𝑖𝑗 为元素 𝑎𝑖𝑗 的代
代数 余 子式 (cofactor), 记
作 𝐴𝑖𝑗 = (−1)𝑖+𝑗 𝑀𝑖𝑗 .
定义 3.3.2 设 𝐴𝑖𝑗 是矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 中元素 𝑎𝑖𝑗 的代数余子式, 则称矩阵
 
𝐴11 𝐴21 · · · 𝐴𝑛1
 
 𝐴
 12 𝐴22 · · · 𝐴𝑛2 

 .. .. ..
 

 . . . 
 
𝐴1𝑛 𝐴2𝑛 · · · 𝐴𝑛𝑛

伴随矩 阵(adjoint matrix), 记作 𝐴* 或 adj(𝐴).


为矩阵 𝐴 的伴
注 矩阵 𝐴 中元素 𝑎𝑖𝑗 的代数余子式 𝐴𝑖𝑗 位于其伴随矩阵 𝐴* 的第 𝑗 行第 𝑖
列, 而不是第 𝑖 行第 𝑗 列.
引理 3.3.1 设  
𝑎11 0 ··· 0
 
 𝑎
 21 𝑎22 · · · 𝑎2𝑛 

𝐴=
 .. .. ..


 . . . 
 
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

则 det(𝐴) = 𝑎11 𝑀11 , 其中 𝑀11 是将方阵 𝐴 的第一行第一列划去后所得的 𝑛 − 1


阶子矩阵的行列式:
𝑎22

· · · 𝑎2𝑛

. ..

𝑀11 = ..

.


𝑎𝑛2 · · · 𝑎𝑛𝑛

证明 根据行列式的定义, det(𝐴) 的展开式中每一项均含有第一行上的元素,


由于 𝐴 的第一行中除 𝑎11 外其余元素均为 0, 故
80 第3章 行 列 式

X
det(𝐴) = (−1)𝜏 (1𝑗2 ···𝑗𝑛 ) 𝑎11 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛
1𝑗2 ···𝑗𝑛
X
= 𝑎11 (−1)𝜏 (𝑗2 ···𝑗𝑛 ) 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 = 𝑎11 𝑀11
𝑗2 ···𝑗𝑛

定 理 3.3.1 设方阵 𝐴 的伴随矩阵为 𝐴* , 则 𝐴𝐴* = 𝐴* 𝐴 = det(𝐴)𝐼, 其中 𝐼


为单位阵.

证明 要证明 𝐴𝐴* = 𝐴* 𝐴 = det(𝐴)𝐼, 即证明

𝑛
X 𝑛
X
𝑎𝑖𝑘 𝐴𝑗𝑘 = 𝑎𝑘𝑖 𝐴𝑘𝑗 = 𝛿𝑖𝑗 det(𝐴), 其中 𝑖, 𝑗 = 1, 2, · · · , 𝑛
𝑘=1 𝑘=1

且 
 1, 𝑖=𝑗
𝛿𝑖𝑗 =
 0, 𝑖 ̸= 𝑗
P𝑛
下面先证明 𝑘=1 𝑎𝑖𝑘 𝐴𝑖𝑘 = det(𝐴).



𝑎11 𝑎12 · · · 𝑎1𝑛


.. .. ..

. . .



det(𝐴) = 𝑎𝑖1 𝑎𝑖2 · · · 𝑎𝑖𝑛


.. .. ..

. . .

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛


𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛

.. .. .. .. .. ..
. . . . . .



= 𝑎𝑖1 0 ··· 0 + 0 𝑎𝑖2 ··· 0 + ···


.. .. .. .. .. ..

. . . . . .


𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

11 𝑎12 · · · 𝑎1𝑛
𝑎
. . .
. .. ..
.

+ 0 0 · · · 𝑎𝑖𝑛


. .. ..
.. . .


𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

, det(𝐵1 ) + det(𝐵2 ) + · · · + det(𝐵𝑛 )


3.3 伴随矩阵与行列式按行(列)展开 81

其中

𝑎
11 ··· 𝑎1𝑗−1 𝑎1𝑗 𝑎1𝑗+1 ··· 𝑎1𝑛


.. .. .. .. ..


. . . . .

𝑎𝑖−1,1 · · · 𝑎𝑖−1,𝑗−1 𝑎𝑖−1,𝑗 𝑎𝑖−1,𝑗+1 · · · 𝑎𝑖−1,𝑛



det(𝐵𝑗 ) = 0 ··· 0 𝑎𝑖𝑗 0 ··· 0



𝑎𝑖+1,1 · · · 𝑎𝑖+1,𝑗−1 𝑎𝑖+1,𝑗 𝑎𝑖+1,𝑗+1 · · · 𝑎𝑖+1,𝑛


.. .. .. .. ..



. . . . .


𝑎𝑛1 ··· 𝑎𝑛,𝑗−1 𝑎𝑛𝑗 𝑎𝑛,𝑗+1 ··· 𝑎𝑛𝑛

将 𝐵𝑗 的第 𝑖 行依次与第 (𝑖 − 1), (𝑖 − 2), · · · , 2, 1 行对换, 再将第 𝑗 列依次


与第 (𝑗 − 1), (𝑗 − 2), · · · , 2, 1 列对换, 使得 𝑎𝑖𝑗 调至第 1 行第 1 列, 得


𝑎
𝑖𝑗 0 ··· 0 0 ··· 0


𝑎
1𝑗 𝑎11 ··· 𝑎1𝑗−1 𝑎1𝑗+1 ··· 𝑎1𝑛

.. .. .. .. ..
. . . . .



det(𝐶𝑗 ) = 𝑎𝑖−1,𝑗 𝑎𝑖−1,1 · · · 𝑎𝑖−1,𝑗−1 𝑎𝑖−1,𝑗+1 · · · 𝑎𝑖−1,𝑛



𝑎𝑖+1,𝑗 𝑎𝑖+1,1 · · · 𝑎𝑖+1,𝑗−1 𝑎𝑖+1,𝑗+1 · · · 𝑎𝑖+1,𝑛


.. .. .. .. ..



. . . . .


𝑎𝑛𝑗 𝑎𝑛1 ··· 𝑎𝑛,𝑗−1 𝑎𝑛,𝑗+1 ··· 𝑎𝑛𝑛

根据行列式的性质及前面的引理, 得

det(𝐵𝑗 ) = (−1)(𝑖−1)+(𝑗−1) det(𝐶𝑗 )


= (−1)(𝑖−1)+(𝑗−1) 𝑎𝑖𝑗 𝑀𝑖𝑗 = 𝑎𝑖𝑗 𝐴𝑖𝑗

从而
det(𝐴) = det(𝐵1 ) + det(𝐵2 ) + · · · + det(𝐵𝑛 )
= 𝑎𝑖1 𝐴𝑖1 + 𝑎𝑖2 𝐴𝑖2 + · · · + 𝑎𝑖𝑛 𝐴𝑖𝑛

同理可证 𝑛𝑘=1 𝑎𝑘𝑖 𝐴𝑘𝑖 = det(𝐴).


P

下面再证明 𝑛𝑘=1 𝑎𝑖𝑘 𝐴𝑗𝑘 = 0, 其中 𝑖 ̸= 𝑗.


P

设方阵
82 第3章 行 列 式

   
𝑑11 𝑑12 · · · 𝑑1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. .. .. .. ..
   
   

 . . .  
  . . . 

   
 𝑑𝑖1
 𝑑𝑖2 ··· 𝑑𝑖𝑛   𝑎𝑖1
  𝑎𝑖2 ··· 𝑎𝑖𝑛 

 . .. ..   . .. .. 
 ..
𝐷= . .  =  .. . . 
  
   
 𝑑
 𝑗1 𝑑𝑗2 ··· 𝑑𝑗𝑛   𝑎
  𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 

 .. .. ..   .. .. ..
   

 . . .   . . . 
   
𝑑𝑛1 𝑑𝑛2 · · · 𝑑𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛

方阵 𝐷 和 𝐴 的区别仅仅是第 𝑗 行不同, 其余行均一样. 方阵 𝐷 是由 𝐴 的第


𝑗 行改成第 𝑖 行所得, 其行列式

𝑛
X 𝑛
X
det(𝐷) = 𝑑𝑗𝑘 𝐴𝑗𝑘 = 𝑎𝑖𝑘 𝐴𝑗𝑘
𝑘=1 𝑘=1

P𝑛
因为 det(𝐷) = 0, 所以 𝑘=1 𝑎𝑖𝑘 𝐴𝑗𝑘 = 0(𝑖 ̸= 𝑗).
P𝑛
同理可证 𝑘=1 𝑎𝑘𝑖 𝐴𝑘𝑗 = 0, 其中 𝑖 ̸= 𝑗.

1
推论 3.3.1 设方阵 𝐴 可逆, 则 𝐴−1 = 𝐴* , 其中 𝐴* 是 𝐴 的伴随矩阵.
det(𝐴)
证明 因方阵 𝐴可逆, 故 det(𝐴) ̸= 0. 由 𝐴* 𝐴 = det(𝐴)𝐼, 得

1
𝐴* 𝐴 = 𝐼
det(𝐴)

从而

1
𝐴−1 = 𝐴*
det(𝐴)

3.3.2 行列式按行(列)展开

由定理 3.3.1 可知, 方阵的行列式等于其任一行(列)上所有元素与其对应的代


数余子式的乘积之和. 这是计算行列式的一个基本方法. 在实际计算方阵的行列式
问题中, 通常根据行列式的性质, 先进行初等变换将方阵化简, 使其某一行或某一
列中尽可能多的元素化为零, 然后对行列式按行或列展开, 化为计算低阶方阵的行
列式.
3.3 伴随矩阵与行列式按行(列)展开 83

例3.3.1 计算下列矩阵的行列式
 
7 3 1 −5
 
 2 6 −3 0 
𝐴=
 

 3
 11 −1 4 

−6 5 2 −9



7 3 1 −5

23 15 −15


23 15 0 −15

1+3

det(𝐴) = = (−1) 10 14 −1

10 14 0 −1

−20 −1 1
−20 −1 0 1

23 15 0
23 15

2+3

= 10 14 13 = (−1) 13

−20 −1


−20 −1 0
= −13(−23 + 300) = −3601

例3.3.2 设 𝑛 阶方阵
 
𝑎 0 0 ··· 0 𝑏
 

 𝑏 𝑎 0 ··· 0 0 

 

 0 𝑏 𝑎 ··· 0 0  
𝐴=
 .. .. .. .. .. 


 . . . . . 
0 0 0 ··· 𝑎 0 
 

 
0 0 0 ··· 𝑏 𝑎
计算行列式 det(𝐴).
解 行列式按第一行展开得

𝑎 0 ··· 0 0 𝑏 𝑎 ··· 0 0




𝑏 𝑎 ··· 0 0


0 𝑏 ··· 0 0

.. .. .. .. .. .. .. ..

𝑛+1
det(𝐴) = 𝑎 + 𝑏(−1)

. . . .

. . . .



0 0 ··· 𝑎 0


0 0 ··· 𝑏 𝑎

0 0 ··· 𝑏 𝑎 0 0 ··· 0 𝑏

= 𝑎(𝑎𝑛−1 ) + 𝑏(−1)𝑛+1 𝑏𝑛−1 = 𝑎𝑛 + (−1)𝑛+1 𝑏𝑛


84 第3章 行 列 式

例3.3.3 计算 𝑛 阶 Vandermonde 行列式



1 1 ··· 1



𝑎1

𝑎2 ··· 𝑎𝑛


det(𝐴𝑛 ) = 𝑎21 𝑎22 ··· 𝑎2𝑛


.. .. ..


. . .

𝑛−1
𝑎𝑛−1 · · · 𝑎𝑛𝑛−1

𝑎1 2

解 对 𝐴𝑛 依次进行如下初等行变换

𝑅𝑛 − 𝑎1 𝑅𝑛−1 , 𝑅𝑛−1 − 𝑎1 𝑅𝑛−2 , · · · , 𝑅2 − 𝑎1 𝑅1

使 𝐴𝑛 的第一列中除第一行元素外全化为零, 根据行列式的性质, 此时行列式值不


变, 即

1 1 ··· 1




0 𝑎2 − 𝑎1 ··· 𝑎𝑛 − 𝑎1


det(𝐴𝑛 ) =
0 𝑎22 − 𝑎1 𝑎2 ··· 𝑎2𝑛 − 𝑎1 𝑎𝑛

.. .. ..



. . .

0 𝑎𝑛−1 − 𝑎1 𝑎𝑛−2 · · · 𝑎𝑛−1 − 𝑎1 𝑎𝑛−2

2 2 𝑛 𝑛



𝑎2 − 𝑎1 ··· 𝑎𝑛 − 𝑎1



𝑎22 − 𝑎1 𝑎2 ··· 𝑎2𝑛 − 𝑎1 𝑎𝑛

= .. ..



. .

𝑎𝑛−1 − 𝑎1 𝑎𝑛−2 · · · 𝑎𝑛−1 − 𝑎1 𝑎𝑛−2

2 2 𝑛 𝑛


1 1 ··· 1



𝑎2

𝑎3 ··· 𝑎𝑛


= (𝑎2 − 𝑎1 )(𝑎3 − 𝑎1 ) · · · (𝑎𝑛 − 𝑎1 ) 𝑎22 𝑎23 ··· 𝑎2𝑛


.. .. ..


. . .

𝑛−2
𝑎𝑛−2 · · · 𝑎𝑛−2

𝑎2 3 𝑛

= (𝑎2 − 𝑎1 )(𝑎3 − 𝑎1 ) · · · (𝑎𝑛 − 𝑎1 ) det(𝐴𝑛−1 )

同理
det(𝐴𝑛−1 ) = (𝑎3 − 𝑎2 )(𝑎4 − 𝑎2 ) · · · (𝑎𝑛 − 𝑎2 ) det(𝐴𝑛−2 )

· · · , 以此下去,
3.3 伴随矩阵与行列式按行(列)展开 85

det(𝐴2 ) = (𝑎𝑛 − 𝑎𝑛−1 ) det(𝐴1 ) = (𝑎𝑛 − 𝑎𝑛−1 )

因此
Y
det(𝐴𝑛 ) = (𝑎𝑗 − 𝑎𝑖 )
16𝑖<𝑗6𝑛

其中记号 表示连乘积.
Q

3.3.3 Cramer法则

定 理 3.3.2 (Cramer法则) 设 𝑛 阶方阵 𝐴 可逆, 𝑏 是 𝑛 元列向量, 则线性方程


组 𝐴𝑥 = 𝑏 的唯一解是 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 其中

det(𝐴1 ) det(𝐴2 ) det(𝐴𝑛 )


𝑥1 = , 𝑥2 = , · · · , 𝑥𝑛 =
det(𝐴) det(𝐴) det(𝐴)

这里 𝐴𝑗 (𝑗 = 1, 2, · · · , 𝑛) 是将 𝐴 中第 𝑗 列的元素 𝑎1𝑗 , 𝑎2𝑗 , · · · , 𝑎𝑛𝑗 分别换成向量 𝑏


中的元素 𝑏1 , 𝑏2 , · · · , 𝑏𝑛 所得的矩阵.
证明 因为 𝑛 阶方阵 𝐴 可逆, 故 𝐴𝑥 = 𝑏 有唯一解

1
𝑥 = 𝐴−1 𝑏 = 𝐴* 𝑏
det(𝐴)

所以
1 1
𝑥𝑗 = row(𝐴* 𝑏, 𝑗) = row(𝐴* , 𝑗)𝑏
det(𝐴) det(𝐴)
1 𝑛
X det(𝐴𝑗 )
= 𝐴𝑘𝑗 𝑏𝑘 =
det(𝐴) 𝑘=1 det(𝐴)

例3.3.4 求下列线性方程组的解



 𝑥1 − 3𝑥3 − 6𝑥4 = 9



 2𝑥1 − 5𝑥2 + 𝑥3 + 𝑥4 = 8




 −𝑥2 + 2𝑥3 + 2𝑥4 = −5


 𝑥 − 7𝑥 + 4𝑥 + 6𝑥 = 0

1 2 3 4

解 上述线性方程组的系数矩阵为
86 第3章 行 列 式

 
1 0 −3 −6
 
 2 −5 1 1 
𝐴=
 

 0
 −1 2 2 

1 −7 4 6

该系数矩阵的行列式为 det(𝐴) = 27 ̸= 0.
将 𝐴 中第 𝑗 列 (𝑗 = 1, 2, 3, 4) 的元素 𝑎1𝑗 , 𝑎2𝑗 , 𝑎3𝑗 , 𝑎4𝑗 分别换成元素 9, 8, −5, 0,
所得的矩阵为
   
9 0 −3 −6 1 9 −3 −6
   
 8 −5 1 1   2 8 1 1 
𝐴1 =  , 𝐴2 = 
   

 −5 −1 2 2   0 −5 2 2 
   
0 −7 4 6 1 0 4 6

   
1 0 9 −6 1 0 −3 9
   
 2 −5 8 1   2 −5 1 8 
𝐴3 =  , 𝐴4 = 
   

 0
 −1 −5 2 

 0
 −1 2 −5 

1 −7 0 6 1 −7 4 0

上 述 矩 阵 的 行 列 式 分 别 为 det(𝐴1 ) = 81, det(𝐴2 ) = −27, det(𝐴3 ) =


−108, det(𝐴4 ) = 27. 由 Cramer 法则, 得方程组唯一解

det(𝐴1 ) det(𝐴2 ) det(𝐴3 ) det(𝐴4 )


𝑥1 = = 3, 𝑥2 = = −1, 𝑥3 = = −4, 𝑥4 = =1
det(𝐴) det(𝐴) det(𝐴) det(𝐴)

3.4 行列式与矩阵的秩

定 义 3.4.1 设 𝐴 为 𝑚 × 𝑛 矩阵, 任取 𝐴 的 𝑘 行 𝑙 列, 位于这些行与列交叉处


的元素按原来顺序构成的 𝑘 × 𝑙 矩阵, 称为 𝐴 的一个子
子 矩 阵 . 特别地, 当 𝑘 = 𝑙 时,
该子矩阵称为 𝐴 的一个 𝑘 阶子矩阵.
定 理 3.4.1 设 𝐴 为 𝑚 × 𝑛 矩阵, rank(𝐴) = 𝑟 的充要条件是矩阵 𝐴 有一个 𝑟
阶子矩阵的行列式不为零, 而 𝐴 的所有 𝑟 + 1 阶子矩阵(如果存在的话)的行列式均
为零.
3.4 行列式与矩阵的秩 87

证明 必要性. 设 rank(𝐴) = 𝑟, 则 𝐴 中任意 𝑟 + 1 行线性相关, 因此 𝐴 的任


意 𝑟 + 1 阶子矩阵的行向量也线性相关, 可知这些 𝑟 + 1 阶子矩阵的行列式均为零.
再证明 𝐴 至少有一个 𝑟 阶子矩阵的行列式不为零. 因为 rank(𝐴) = 𝑟, 𝐴 中有
𝑟 行线性无关, 将这 𝑟 行取出得到一个 𝑟 × 𝑛 子矩阵. 该 𝑟 × 𝑛 子矩阵的秩为 𝑟 , 因
此该子矩阵中有 𝑟 列线性无关, 将这 𝑟 列取出又得到一个 𝑟 × 𝑟 子矩阵, 这个新的
𝑟 阶子矩阵的行列式不为零.

充分性. 设 𝐴 有一个 𝑟 阶子矩阵的行列式不为零而 𝐴 的所有 𝑟 + 1 阶子矩阵


的行列式均为零. 因此 𝐴 的所有高于 𝑟 阶的子矩阵(如果存在的话)的行列式均为
零. 设 rank(𝐴) = 𝑡, 由必要性可知 𝑡 > 𝑟 , 否则 𝐴 的 𝑟 阶子矩阵的行列式全为零.
但 𝑡 也不能大于 𝑟, 否则 𝐴 就要有一个大于 𝑟 阶的子矩阵的行列式不等于零. 因此
𝑡 = 𝑟.
例3.4.1 求下列矩阵的秩
 
−1 −2 7 5 2
 
 3 −3 9 6 −12 
𝐴=
 

 −1 1 −3 −2 4 
 
0 0 0 0 0

解 由于矩阵 𝐴 的一个 2 阶子矩阵的行列式



−1 −2

= −3 ̸= 0

3 −3

而 𝐴 的所有 3 阶子矩阵, 或有两行成比例, 或有一行全为 0, 因此所有这些 3 阶子


矩阵的行列式均为 0, 故有 rank(𝐴) = 2.
例 3.4.2 求下列矩阵的秩
 
𝑎11 𝑎12 · · · 𝑎1𝑟 𝑎1𝑟+1 · · · 𝑎1𝑛
 
 0
 𝑎22 · · · 𝑎2𝑟 𝑎2𝑟+1 · · · 𝑎2𝑛 

 . .. .. .. .. 
 .
 . . . . .


 
𝐴= 0 0 · · · 𝑎𝑟𝑟 𝑎𝑟𝑟+1 · · · 𝑎𝑟𝑛 
 
 
 0 0 ··· 0 0 ··· 0 
 
 .. .. .. .. .. 
 
 . . . . . 
 
0 0 ··· 0 0 ··· 0
88 第3章 行 列 式

其中 𝑎𝑖𝑖 ̸= 0(𝑖 = 1, 2, · · · , 𝑟).


解 由于矩阵 𝐴 左上角的 𝑟 阶子矩阵的行列式

𝑎11

𝑎12 · · · 𝑎1𝑟

0
𝑎22 · · · 𝑎2𝑟

= 𝑎11 𝑎22 · · · 𝑎𝑟𝑟 ̸= 0
.. .. ..


. . .

· · · 𝑎𝑟𝑟

0 0

而 𝐴 的所有 𝑟 + 1 阶子矩阵的行列式均为0, 因此 rank(𝐴) = 𝑟 .


注 上例也可通过初等变换将 𝐴 化为标准形
 
𝐼
 𝑟
𝑂 
𝑂 𝑂

得矩阵 𝐴 的秩 rank(𝐴) = 𝑟.

3.5 习 题

1. 根据行列式定义, 计算



2𝑥 𝑥 1 2

1 𝑥 1 −1
𝑓 (𝑥) =
3 2 𝑥 1

1 1 1 𝑥

中 𝑥4 与 𝑥3 的系数.
2. 使用行列式的定义证明:



𝑎1 𝑎2 𝑎3 𝑎4 𝑎5
𝑏1 𝑏2 𝑏3 𝑏4 𝑏5



𝐷 = 𝑐1 𝑐2 0 0 0 = 0

𝑑1 𝑑2 0 0 0

𝑒1 𝑒2 0 0 0

3. 证明:一个 𝑛 阶行列式中等于零的元素的个数如果比 𝑛2 − 𝑛 多, 则此行列式必等于零.


3.5 习 题 89

4. 通过计算以下行列式证明:奇偶排列各半.


1 1 ··· 1



1 1 ··· 1
𝐷=

.. .. ..

. . .


1 1 ··· 1

5. 计算下列行列式的值

2 0 0 3 0 0

(1) 4 1 0 ; (2) 2 1 1 ;


7 3 −2 1 2 2


4 0 2 1
1 1 1 3

5 0 4 2 0 3 1 1
(3)
2 0 3 4 ; (4)
0 0 2 2
.


1 0 2 3 −1 −1 −1 2

6. 计算 2𝑛 阶行列式:

𝑥 0 ··· 0 𝑦
···

0 𝑥 𝑦 0

.. .. .. ..
𝐷2𝑛 =

. .
. .
0 𝑦 ··· 𝑥 0



𝑦 0 ··· 0 𝑥

7. 计算 𝑛( 𝑛 > 1) 阶行列式:



𝑥 𝑦 0 ··· 0 0
···

0 𝑥 𝑦 0 0

.. .. .. .. ..
𝐷𝑛 =

. . .
. .
0 0 0 ··· 𝑥 𝑦



𝑦 0 0 ··· 0 𝑥

8. 计算 𝑛 阶行列式:

2 1 0 ··· 0 0 0
···

1 2 1 0 0 0

.. .. .. .. .. ..
𝐷𝑛 =

. . . . . .

0 0 0 ··· 1 2 1



0 0 0 ··· 0 1 2
90 第3章 行 列 式

9. 计算 𝑛 阶行列式:


𝑥+𝑦
𝑥𝑦 0 ··· 0 0 0

···

1 𝑥+𝑦 𝑥𝑦 0 0 0

𝐷𝑛 = 0
1 𝑥+𝑦 ··· 0 0 0
. .. .. .. .. ..
.
. . . . . .



0 0 0 ··· 0 1 𝑥+𝑦

10. 计算 𝑛 阶行列式:


2 cos 𝜃
1 0 ··· 0 0 0

···

1 2 cos 𝜃 1 0 0 0

.. .. .. .. .. ..
𝐷𝑛 =

. . . . . .

0 0 0 ··· 1 2 cos 𝜃 1



0 0 0 ··· 0 1 2 cos 𝜃

11. 计算以下 𝑛 阶“带”形行列式:



𝑎 𝑏 0 ··· 0 0 0
···

𝑐 𝑎 𝑏 0 0 0

.. .. .. .. .. ..
𝐷𝑛 =

. . . . .
.
0 0 0 ··· 𝑐 𝑎 𝑏



0 0 0 ··· 0 𝑐 𝑎

12. 计算行列式:

𝑥 −1 0 ··· 0 0

−1 ···

0 𝑥 0 0

.. .. .. .. ..

. . . . .

0 0 0 ··· 𝑥 −1



𝑎𝑛 𝑎𝑛−1 𝑎𝑛−2 ··· 𝑎2 𝑎1 + 𝑥

13. 计算 𝑛 阶行列式:

1 2
3 ··· 𝑛
2 3 4 ···

1


3 4 5 ··· 2
.. .. .. ..
. . . .



𝑛 1 2 ··· 𝑛 − 1
3.5 习 题 91

14. 计算 𝑛 阶行列式:


𝑥1 + 𝑎
𝑎 ··· 𝑎 𝑎
···

𝑎 𝑥2 + 𝑎 𝑎
𝑎

.. .. ..
..

. .
. .
𝑎 𝑎 · · · 𝑥𝑛−1 + 𝑎 𝑎



𝑎 𝑎 ··· 𝑎 𝑎

15. 计算 𝑛 阶行列式:

𝑥1 𝑎 ··· 𝑎 𝑎
···

𝑏 𝑥2 𝑎 𝑎

.. .. .. ..

. . .
.
𝑏 𝑏 ··· 𝑥𝑛−1 𝑎



𝑏 𝑏 ··· 𝑏 𝑥𝑛

16. 计算行列式:

1 1 1 1


1 1 −1 −1

1 −1 1 −1

1 −1 −1 1

17. 计算行列式:
···
𝑎 +𝑏 𝑎1 + 𝑏2 𝑎1 + 𝑏 𝑛

1 1

𝑎2 + 𝑏1 𝑎2 + 𝑏2 ··· 𝑎2 + 𝑏 𝑛
𝐷𝑛 =

.. .. ..

. . .


𝑎𝑛 + 𝑏1 𝑎𝑛 + 𝑏2 ··· 𝑎 𝑛 + 𝑏𝑛

18. 计算行列式:
···
𝑎 +1 1
1
1

1 𝑎2 + 1 ··· 1
𝐷𝑛 =

.. .. ..

. . .


1 1 · · · 𝑎𝑛 + 1

19. 计算行列式:
𝑎1 𝑥 𝑥 𝑥 ··· 𝑥




𝑥 𝑎2 𝑥 𝑥 ··· 𝑥
𝑥 𝑥 𝑎3 𝑥 ··· 𝑥


𝐷𝑛 = .. .. .. ..

..
. . . . .


𝑥 𝑥 𝑥 𝑥 · · · 𝑥

𝑥 𝑥 𝑥 𝑥 · · · 𝑎𝑛
92 第3章 行 列 式

20. 计算 𝑛 阶行列式:


𝑥+𝑦
𝑥𝑦 0 0 0 ··· 0 0 0
···

1 𝑥+𝑦 𝑥𝑦 0 0 0 0 0

0
1 𝑥+𝑦 𝑥𝑦 0 ··· 0 0 0

. .. .. .. .. .. .. ..
.
. . . . . . . .



0 0 0 0 0 ··· 1 𝑥+𝑦 𝑥𝑦

– ™
𝐴 𝐶
21.设分块 𝑛 阶方阵 𝑀 = , 其中 𝐴 为 𝑘 阶方阵, 证明: det(𝑀 ) = det(𝐴)·
𝑂 𝐵
det(𝐵).
22. 计算 2𝑛 阶行列式:



𝑎1 𝑐1

𝑎2 𝑐2



.. ..
. .

𝑎𝑛 𝑐𝑛
𝐷2𝑛 =



𝑑𝑛 𝑏𝑛

.. ..


. .


𝑑2 𝑏2

𝑑1 𝑏1

23. 计算行列式(设 𝑛 > 2):


sin 2𝛼1 sin(𝛼1 + 𝛼2 ) · · · sin(𝛼1 + 𝛼𝑛 )



sin(𝛼2 + 𝛼1 )
sin 2𝛼2 · · · sin(𝛼2 + 𝛼𝑛 )

.
.. .
.. ..

.


sin(𝛼𝑛 + 𝛼1 ) sin(𝛼𝑛 + 𝛼2 ) · · · sin 2𝛼𝑛

24. 证明: 𝑛 阶行列式:


···
cos 𝛼 1 0 0 0



1
2 cos 𝛼 1 ··· 0 0

···
0 1 2 cos 𝛼 0 0


. .. .. .. ..
= cos𝑛𝛼
.
. . . . .

0
0 0 ··· 2 cos 𝛼 1


0 0 0 ··· 1 2 cos 𝛼
3.5 习 题 93

25. 计算以下 𝑛 阶行列式:


···
𝑎+𝑥 𝑎 + 𝑥2 𝑎 + 𝑥𝑛

1
2
𝑎 + 𝑥21 𝑎 + 𝑥22 ··· 𝑎2 + 𝑥2𝑛
𝐷𝑛 =

.. .. ..

. . .

𝑛
𝑎 + 𝑥𝑛1 𝑎 + 𝑥𝑛 𝑎𝑛 + 𝑥𝑛

2 ··· 𝑛

26. 计算以下 𝑛 阶行列式:



𝑎 𝑏 𝑏 ··· 𝑏
···

𝑐 𝑎 𝑏 𝑏

𝐷𝑛 =
𝑐 𝑐 𝑎 ··· 𝑏

.. .. .. ..
. . . .



𝑐 𝑐 𝑐 ··· 𝑎

27. 计算 𝑛 阶行列式:


···
1+𝑥 𝑦 1 + 𝑥1 𝑦2 1 + 𝑥1 𝑦𝑛

1 1

1 + 𝑥2 𝑦1 1 + 𝑥2 𝑦2 ··· 1 + 𝑥2 𝑦𝑛
𝐷𝑛 =

.. .. ..

. . .


1 + 𝑥𝑛 𝑦1 1 + 𝑥𝑛 𝑦2 ··· 1 + 𝑥𝑛 𝑦𝑛

28. 利用伴随矩阵求以下矩阵的逆矩阵:

(1)  
1 1 −1
𝐴= 2 1 0 
 

1 −1 0

(2)  
2 2 3
𝐵= 1 −1 0 
 

−1 2 1

(3)
 
1 0 −1 0
 0 1 0 0 
𝐶=
 

 0 0 −1 1 
0 0 0 −1
94 第3章 行 列 式

 ‹−1
1


29. 设 𝐴 为 𝑛 阶方阵, 𝐴* 为 𝐴 的伴随矩阵. 已知 |𝐴| = 3, 求 𝐴 − 2𝐴* .
4
30. 设矩阵 𝐴 的伴随矩阵

 
1 0 0 0
 0 1 0 0 
𝐴* = 
 

 1 0 1 0 
0 −3 0 8

且 𝐴𝐵𝐴−1 = 𝐵𝐴−1 + 3𝐼, 其中 𝐼 为 4 阶单位矩阵, 求矩阵 𝐵.


31. 设 𝐴 是 𝑛 阶可逆阵, 证明:
(1) det(𝐴* ) = (det 𝐴)𝑛−1 ;
(2) (𝐴* )−1 = (𝐴−1 )* ;
(3) (𝐴* )T = (𝐴T )* .
32. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 是线性无关向量组, 而

𝑠
X
𝛽𝑖 = 𝑎𝑖𝑗 𝛼𝑗 , 𝑖 = 1, 2, · · · , 𝑠
𝑗=1

证明 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性无关的充分必要条件是下面 𝑠 阶行列式


···
𝑎 𝑎12 𝑎1𝑠

11

𝑎21 𝑎22 ··· 𝑎2𝑠
̸= 0

. .. ..
.. . .


𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑠𝑠

33. 设 𝑎𝑖𝑗 (𝑡) 为自变量 𝑡 的实连续函数, 𝑖, 𝑗 = 1, 2, · · · , 𝑛. 证明:


d
𝑎11 (𝑡) · · · 𝑎1𝑛 (𝑡) 𝑎 (𝑡)
11 ··· 𝑎1𝑗 (𝑡) · · · 𝑎1𝑛 (𝑡)
d
X𝑛 d𝑡
.. ..
= .. .. ..
. . . . .

d𝑡

𝑗=1
𝑎𝑛1 (𝑡) · · · 𝑎𝑛𝑛 (𝑡) d


𝑎𝑛1 (𝑡) ··· 𝑎𝑛𝑗 (𝑡) · · · 𝑎𝑛𝑛 (𝑡)
d𝑡

34. 利用子矩阵的行列式计算下列矩阵的秩.
 
17 18 40 10  
 3 3 −5 4 2 7
7 17 1 
(1) ; (2)  2 0 3 1 4 .
   
 1 4 10 0 
1 5 2 0 1
7 8 18 4
第4章 线性空间与线性变换

4.1 线 性 空 间

定 义 4.1.1 设一个数集至少含有两个不同的数, 且该数集中任意两个数的


和、差、积、商(除数不为零)仍在该数集中, 即对和、差、积、商等四则运算是封

闭 的, 则称该数集为数
数域 (field).
例4.1.1 有理数集、实数集和复数集均为数域, 分别称为有
有理 数 域、实
实数 域
和复
复数域 ; 自然数集和整数集均不是数域.
我们知道, 两个 𝑛 维向量的和仍是 𝑛 维向量, 𝑛 维向量的数乘也是 𝑛 维向量,
即 𝑛 维向量对加法和数乘运算是封闭的, 而且加法和数乘运算满足以下八项规则.
设 𝛼, 𝛽, 𝛾 为 𝑛 维向量, 0 为 𝑛 维零向量, 𝑘, 𝑙 为数,
(1) 𝛼 + 𝛽 = 𝛽 + 𝛼;
(2) (𝛼 + 𝛽) + 𝛾 = 𝛼 + (𝛽 + 𝛾);
(3) ∃𝛽 = 0, ∀𝛼: 𝛼 + 𝛽 = 𝛼;
(4) ∀𝛼, ∃𝛽 = −𝛼: 𝛼 + 𝛽 = 0;
(5) 1 · 𝛼 = 𝛼;
(6) 𝑘(𝑙𝛼) = (𝑘𝑙)𝛼;
(7) (𝑘 + 𝑙)𝛼 = 𝑘𝛼 + 𝑙𝛼;
(8) 𝑘(𝛼 + 𝛽) = 𝑘𝛼 + 𝑘𝛽.
对于具有上述特性的数学对象, 我们可将其本质属性概括抽象起来, 进行统一
的研究, 这就引出了线性代数中的一个基本概念——线性空间.
定 义4.1.2 设 𝑉 是一个非空集合, F 是一个数域, 若下述条件均成立, 则称集
合 𝑉 为数域 F 上的线
线性 空 间 .
(I)在 𝑉 中的任意两个元素 𝛼, 𝛽 之间定义一个对应法则, 使得 𝛼, 𝛽 在 𝑉 中有
唯一确定的元素 𝛾 与它们对应, 称这个对应法则为加
加 法 , 称 𝛾 为 𝛼 和 𝛽 的和
和, 记
作 𝛾 = 𝛼 + 𝛽.
(II)在数域 F 中的任意元素 𝑘 与集合 𝑉 中的任意元素 𝛼 之间定义一个对应法
则, 使得 𝑘, 𝛼 在 𝑉 中有唯一确定的元素 𝛾 与它们对应, 称这个对应法则为数
数量 乘
法 , 简称数
数乘, 称 𝛾 为 𝑘, 𝛼 的数
数量乘 积, 记作 𝛾 = 𝑘𝛼.
(III)对于上述定义的加法与数乘满足八项规则:
(1) 𝛼 + 𝛽 = 𝛽 + 𝛼;
(2) (𝛼 + 𝛽) + 𝛿 = 𝛼 + (𝛽 + 𝛿);
96 第4章 线性空间与线性变换

(3)在 𝑉 中存在零元, 记作 0, 对于 𝑉 中任一元素 𝛼, 使得 𝛼 + 0 = 𝛼 成立;


(4)对于 𝑉 中任一元素 𝛼, 在 𝑉 中存在相应的负元, 记作 (−𝛼), 使得 𝛼 +
(−𝛼) = 0 成立;
(5) 1 · 𝛼 = 𝛼;
(6) 𝑘(𝑙𝛼) = (𝑘𝑙)𝛼;
(7) 𝑘(𝛼 + 𝛽) = 𝑘𝛼 + 𝑘𝛽;
(8) (𝑘 + 𝑙)𝛼 = 𝑘𝛼 + 𝑙𝛼,
其中 𝛼, 𝛽, 𝛿 为集合 𝑉 中任意元素, 𝑘, 𝑙 为数域 F 中的任意数.
根据上述线性空间的定义, 可以得出以下性质.
性质 4.1.1 (1) 线性空间 𝑉 的零元是唯一的;
(2) 线性空间 𝑉 中每个元素的负元是唯一的.
证明 (1) 假设 01 , 02 是线性空间 𝑉 中的两个零元, 则由前述规则 (1) 和 (2),

01 = 01 + 02 = 02 + 01 = 02

(2) 设 𝛼 是 𝑉 中的元素, 𝛽1 , 𝛽2 是 𝛼 的两个负元, 即

𝛼 + 𝛽1 = 0, 𝛼 + 𝛽2 = 0

因此

𝛽1 = 𝛽1 + 0 = 𝛽1 + (𝛼 + 𝛽2 ) = (𝛽1 + 𝛼) + 𝛽2 = 0 + 𝛽2 = 𝛽2

例4.1.2 实数域 R 按实数的加法和乘法构成其自身上的一个线性空间; 同


样, 复数域 C 按复数的加法和乘法也构成其自身上的一个线性空间.
例4.1.3 实数域 R 上的全部 𝑛 元向量所组成的集合, 按向量的加法和数乘构
成实数域 R 上的一个线性空间, 也称 𝑛 元向
向量空 间, 记为 R𝑛 .
例4.1.4 实数域 R 上 𝑚 × 𝑛 矩阵全体所组成的集合, 按矩阵的加法和数乘构
成实数域 R 上的一个线性空间, 记为 R𝑚×𝑛 .
例 4.1.5 闭区间 [𝑎, 𝑏] 上的连续实函数全体所组成的集合, 按函数的加法和实
数与函数的数乘构成实数域 R 上的一个线性空间, 记为 𝐶[𝑎, 𝑏].
例 4.1.6 实数域 R 上次数不大于 𝑛 的一元多项式全体(包括零多项式)所组成
的集合, 按多项式加法和实数与多项式的数乘, 构成实数域 R 上的线性空间, 记为
𝑃𝑛 [𝑥].
由于线性空间与 𝑛 元向量空间本质上有相同的性质, 通常也把线性空间 𝑉 称
为向
向 量 空 间, 𝑉 中的元素称为向
向 量. 因此线性空间 R𝑚×𝑛 , 𝐶[𝑎, 𝑏] 和 𝑃𝑛 [𝑥] 同样可
以被称为向量空间, 其中的元素 𝑚 × 𝑛 矩阵、[𝑎, 𝑏] 上的连续实函数和 𝑃𝑛 [𝑥] 上的
4.2 基 97

一元多项式可分别看成是相应空间中的向量. R𝑛 是这种抽象向量空间的具体模
型, 在本章中我们着重讨论 R𝑛 .
注 在本章中, 对于未指明特定数域的线性空间, 则默认是实数域 R 上的线
性空间.

4.2 基

4.2.1 基和坐标

定 义 4.2.1 设 𝑉 是 线 性 空 间, 如 果 在 𝑉 中 存 在 𝑛 个 线 性 无 关 向 量
𝜀1 , 𝜀2 , · · · , 𝜀𝑛 , 使得 𝑉 中任一向量 𝛼 均可由 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 线性表出, 则称向量
组 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 为线性空间 𝑉 的一组基
基, 𝑛 称为线性空间 𝑉 的维
维 数(dimension),
记 dim 𝑉 = 𝑛, 𝑉 称为 𝑛 维线性空间. 如果不存在有限个向量构成 𝑉 的一组基, 则
𝑉 称为无限维线性空间.
注 无限维线性空间也有基. 无限维线性空间基的存在性的证明超出本课程
范围, 本书只研究有限维线性空间. 有限维线性空间的基实际上是它的一个极大线
性无关组, 由第 2 章中关于极大线性无关组的讨论可知, 基不是唯一的, 但其维数
是唯一确定的.
例4.2.1 在线性空间 R𝑛 中, 向量组
     
1 0 0
0  1  0 
     
  
     

 0  
 0 


 0 

𝜀1 =   , 𝜀2 =   , · · · , 𝜀𝑛 = 
 ..   ..   ..


 . 


 . 


 .

0  0 0 
     
   
0 0 1

是线性无关的, 且 R𝑛 中任一个向量 𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T 均可由 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 线


性表出:
𝛼 = 𝑎1 𝜀1 + 𝑎2 𝜀2 + · · · + 𝑎𝑛 𝜀𝑛

因此 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 R𝑛 的一组基, 且 R𝑛 的维数为 𝑛.
例4.2.2 在线性空间 𝑃𝑛 [𝑥] 中, 向量组

𝜀1 = 1, 𝜀2 = 𝑥, 𝜀3 = 𝑥2 , · · · , 𝜀𝑛 = 𝑥𝑛−1 , 𝜀𝑛+1 = 𝑥𝑛

是 𝑃𝑛 [𝑥] 的一个基, 故 dim 𝑃𝑛 [𝑥] = 𝑛 + 1.


98 第4章 线性空间与线性变换

定 义 4.2.2 设向量组 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维线性空间 𝑉 的一组基, 𝛼 是 𝑉 中


任一向量, 若
𝛼 = 𝑥1 𝜀1 + 𝑥2 𝜀2 + · · · + 𝑥𝑛 𝜀𝑛

则称 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 为向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐
坐标 .
定理 4.2.1 任意向量在给定基下的坐标唯一.
证明 设向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下有两组坐标:

𝛼 = 𝑥1 𝜀1 + 𝑥2 𝜀2 + · · · + 𝑥𝑛 𝜀𝑛 (4.1)

𝛼 = 𝑥′1 𝜀1 + 𝑥′2 𝜀2 + · · · + 𝑥′𝑛 𝜀𝑛 (4.2)

式(4.1)减去式(4.2), 得

(𝑥1 − 𝑥′1 )𝜀1 + (𝑥2 − 𝑥′2 )𝜀2 + · · · + (𝑥𝑛 − 𝑥′𝑛 )𝜀𝑛 = 0

因为 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 线性无关, 所以

𝑥1 = 𝑥′1 , 𝑥2 = 𝑥′2 , · · · , 𝑥𝑛 = 𝑥′𝑛

从而坐标唯一.
例4.2.3 线性空间 R3 中, 向量 𝛼 = [1, 2, −1]T , 分别求 𝛼 在下列两组基下的
坐标:
(1) 𝜀1 = [1, 0, 0]T , 𝜀2 = [0, 1, 0]T , 𝜀3 = [0, 0, 1]T ;
(2) 𝜂1 = [1, 0, 0]T , 𝜂2 = [1, 1, 0]T , 𝜂3 = [1, 1, 1]T .
证明 (1) 由于
       
1 1 0 0
       
 2  =  0  + 2  1  + (−1)  0  = 𝜀1 + 2𝜀2 + (−1)𝜀3
𝛼=       
−1 0 0 1

所以 𝛼 在基 𝜀1 , 𝜀2 , 𝜀3 下的坐标为 [1, 2, −1]T .


(2)设 𝛼 在基 𝜂1 , 𝜂2 , 𝜂3 下的坐标为 [𝑥1 , 𝑥2 , 𝑥3 ]T , 故 𝛼 = 𝑥1 𝜂1 + 𝑥2 𝜂2 + 𝑥3 𝜂3 ,

         
1 1 1 1 𝑥1 + 𝑥2 + 𝑥3
         
𝛼=
 2  = 𝑥1  0  + 𝑥2  1  + 𝑥3  1  = 
        𝑥2 + 𝑥3 

−1 0 0 1 𝑥3
4.2 基 99

解得
𝑥1 = −1, 𝑥2 = 3, 𝑥3 = −1

所以 𝛼 在基 𝜂1 , 𝜂2 , 𝜂3 下的坐标为 [−1, 3, −1]T .


例4.2.4 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维线性空间 𝑉 的一组基, 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 是 𝑉
中的 𝑙 个向量, 𝛼𝑗 (𝑗 = 1, 2, · · · , 𝑙) 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 [𝑎1𝑗 , 𝑎2𝑗 , · · · ,
𝑎𝑛𝑗 ]T , 则向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关当且仅当矩阵
 
𝑎11 𝑎12 · · · 𝑎1𝑙
 
 𝑎21 𝑎22 · · · 𝑎2𝑙 
𝐴= .
 
 .. .. .. 
 . . 

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑙

的秩 rank(𝐴) = 𝑙.
证明 由于 𝛼𝑗 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 [𝑎1𝑗 , 𝑎2𝑗 , · · · , 𝑎𝑛𝑗 ]T , 因此

𝛼𝑗 = 𝑎1𝑗 𝜀1 + 𝑎2𝑗 𝜀2 + · · · + 𝑎𝑛𝑗 𝜀𝑛

即  
𝑎1𝑗
 
 𝑎2𝑗 
𝛼𝑗 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]  . (𝑗 = 1, 2, · · · , 𝑙)
 
 ..


 
𝑎𝑛𝑗

故有

[𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴 (4.3)

其中  
𝑎11 𝑎12 · · · 𝑎1𝑙
 
 𝑎21 𝑎22 · · · 𝑎2𝑙 
𝐴= .
 
 .. .. .. 
 . . 

𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑙

向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关当且仅当 𝑥1 𝛼1 + 𝑥2 𝛼2 + · · · + 𝑥𝑙 𝛼𝑙 = 0 只有
零解, 即
[𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ]𝑥 = 0 (4.4)

只有零解, 其中 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑙 ]T . 将式(4.3)代入式(4.4)得 [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴𝑥 =


100 第4章 线性空间与线性变换

0. 由于基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是线性无关的, 故 [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴𝑥 = 0 只有零解当


且仅当 𝐴𝑥 = 0 只有零解. 由线性方程组理论知 𝐴𝑥 = 0 只有零解当且仅当
rank(𝐴) = 𝑙. 所以向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关当且仅当 rank(𝐴) = 𝑙.

4.2.2 过渡矩阵

线性空间中的任意向量在给定基下的坐标是唯一确定的, 在不同基下的坐标
一般是不同的. 下面讨论同一向量在不同基下的坐标之间的关系.
定 义 4.2.3 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 和 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 是 𝑛 维线性空间 𝑉 的两组基,
若 [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 , 则称 𝑛 阶方阵 𝑀 为从基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 到
基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 的过
过渡 矩 阵 .
定理 4.2.2 过渡矩阵是可逆的.
证明 设 𝑀 为从基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 到基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 的过渡矩阵, 即

[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀

考察
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝑥 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 𝑥 = 0

由于 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 是基, 故线性无关, 从而

[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝑥 = 0 ⇐⇒ 𝑥 = 0

同样, 由于 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是基, 故线性无关, 从而

[𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 𝑥 = 0 ⇐⇒ 𝑀 𝑥 = 0

因此 𝑀 𝑥 = 0 ⇐⇒ 𝑥 = 0, 即线性方程组 𝑀 𝑥 = 0 只有零解, 故 rank(𝑀 ) = 𝑛, 从


而 𝑛 阶方阵 𝑀 可逆.
定 理 4.2.3 (坐标变换公式) 设 𝑉 是 𝑛 维线性空间, 𝑀 是由基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛
到 基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 的 过 渡 矩 阵, 𝑉 中 的 向 量 𝛼 在 基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 和 基
𝜂1 , 𝜂2 , · · · , 𝜂𝑛 下的坐标分别为 [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T 和 [𝑥′1 , 𝑥′2 , · · · , 𝑥′𝑛 ]T , 则
   
𝑥1 𝑥′1
𝑥′2
   
 𝑥2   
=𝑀
   
 .. .. 

 . 


 . 

𝑥𝑛 𝑥′𝑛
4.2 基 101

证明 由已知

[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀

和    
𝑥1 𝑥′1
𝑥′2
   
 𝑥2   
𝛼 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]   = [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] 
   
.. .. 

 . 


 . 

𝑥𝑛 𝑥′𝑛

得    
𝑥1 𝑥′1
𝑥′2
   
 𝑥2   
𝛼 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]   = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 
   
.. .. 

 . 


 . 

𝑥𝑛 𝑥′𝑛

由向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下坐标唯一, 得
   
𝑥1 𝑥′1
𝑥′2
   
 𝑥2   
=𝑀
   
 .. .. 

 . 


 . 

𝑥𝑛 𝑥′𝑛

例4.2.5 设线性空间 R3 中的两组基:


     
1 2 1
     
𝜀1 = 
 0 ,
 𝜀2 = 
 1 ,
 𝜀3 = 
 1 

−1 1 1

与      
0 −1 1
     
𝜂1 = 
 1 ,
 𝜂2 = 
 1 ,
 𝜂3 = 
 2 

1 0 1

求从基 𝜀1 , 𝜀2 , 𝜀3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵.
解 设从基 𝜀1 , 𝜀2 , 𝜀3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵为 𝑀 , 即

[𝜂1 , 𝜂2 , 𝜂3 ] = [𝜀1 , 𝜀2 , 𝜀3 ]𝑀
102 第4章 线性空间与线性变换

记 𝐴 = [𝜀1 , 𝜀2 , 𝜀3 ], 𝑏 = [𝜂1 , 𝜂2 , 𝜂3 ], 因为这里 𝐴 可逆, 故 𝑀 = 𝐴−1 𝐵.


可通过对矩阵 [𝐴, 𝐵] 初等行变换来计算 𝐴−1 𝐵, 即
 
1 2 1 0 −1 1
 
[𝐴, 𝐵] = 
 0 1 1 1 1 2 

−1 1 1 1 0 1
 
1 2 1 0 −1 1
𝑅 +𝑅  
−−3−−→
1 
 0 1 1 1 1 2 

0 3 2 1 −1 2
 
1 2 1 0 −1 1
𝑅 −3𝑅  
−−3−−−→
2 
 0 1 1 1 1 2 

0 0 −1 −2 −4 −4
 
1 2 1 0 −1 1
−1×𝑅
3 
 
−−−−→  0 1 1 1 1 2 

0 0 1 2 4 4
 
1 2 0 −2 −5 −3
𝑅 −𝑅  
−−2−−→
3 
 0 1 0 −1 −3 −2 

0 0 1 2 4 4
 
1 0 0 0 1 1
𝑅 −2𝑅  
−−1−−−→
2 
 0 1 0 −1 −3 −2 

0 0 1 2 4 4

所以, 过渡矩阵为  
0 1 1
 
 −1 −3 −2 
𝑀 = 
2 4 4

4.3 子 空 间

4.3.1 子空间的定义

定 义4.3.1 设 𝑉 是数域 F 上的线性空间, 𝑊 是 𝑉 的一个非空子集, 如果 𝑊


对于 𝑉 上的加法和数乘也构成一个线性空间, 则称 𝑊 为 𝑉 的一个线
线 性 子 空 间,
简称子
子空 间(subspace).
4.3 子 空 间 103

定 理 4.3.1 设 𝑉 是数域 F 上的线性空间, 𝑊 是 𝑉 的一个非空子集, 若满足


条件:
(1) 如果 𝛼, 𝛽 ∈ 𝑊 , 则 𝛼 + 𝛽 ∈ 𝑊 ;
(2) 如果 𝛼 ∈ 𝑊 , 𝜆 ∈ F, 则 𝜆𝛼 ∈ 𝑊 ,
则 𝑊 为 𝑉 的一个子空间.
证明 由已知, 𝑊 是 𝑉 的一个非空子集, 而且对于加法和数乘封闭. 因为 𝑊
是 𝑉 的子集, 故 𝑊 上的加法和数乘与 𝑉 上的加法和数乘定义一致. 由于 𝑉 是线
性空间, 所以 𝑉 上的加法和数乘满足八项规则, 从而 𝑊 上的加法和数乘也满足八
项规则, 故 𝑊 对于 𝑉 上的加法和数乘也构成一个线性空间, 因此 𝑊 为 𝑉 的一个
子空间.
注 在线性空间 𝑉 中, 仅由一个零元组成的子集, 是 𝑉 的一个线性子空间; 线
性空间 𝑉 本身也是 𝑉 的一个子空间, 这两种子空间称为 𝑉 的平
平凡 子 空 间 .
例4.3.1 立体空间 R3 中, 过原点的平面上所有向量构成 R3 的一个子空间.
定 义 4.3.2 设 𝑉 是实数域 R 上的线性空间, 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 是 𝑉 中的一组
P𝑛
向量, 这组向量所有可能的线性组合所组成的集合 { 𝑖=1 𝜆𝑖 𝛼𝑖 |𝜆𝑖 ∈ R} 是 𝑉 的一
个线性子空间, 称为由 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 张成 的 子空 间, 记作 span(𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ).
定 理 4.3.2 向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 张成的子空间 span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) 的维
数等于向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 的秩.
证 明 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 的 秩 为 𝑟, 不 失 一 般 性, 设 其 一 个 极 大 无 关 组 为
𝛼1 , 𝛼2 , · · · , 𝛼𝑟 .
因为向量组中的任一向量均可由该向量组的极大无关组线性表出, 故存在
𝑟 × 𝑙 矩阵 𝐴, 使得

[𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ] = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝐴 (4.5)

又因为线性子空间 span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) 中任一向量 𝛽 均可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑙


线性表出, 故存在 𝑙 元系数向量 𝑥, 使得

𝛽 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ]𝑥 (4.6)

将式(4.5)代入式(4.6), 得

𝛽 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝐴𝑥

即 𝛽 可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性表出, 表出系数向量为 𝐴𝑥. 因此 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 是


span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) 的一组基, 从而 span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) 的维数为 𝑟.
104 第4章 线性空间与线性变换

由于线性子空间本身也是一个线性空间, 4.2 节讨论的基、 维数、 坐标等概


念, 自然也可以应用到线性子空间上.
基扩 充定 理 任何一个子空间的基都可以扩充成为整个线性空间的基.
证明 设 𝑊 为 𝑛 维线性空间 𝑉 的一个 𝑑 维子空间, 𝑑 < 𝑛, 𝛼1 , 𝛼2 , · · · , 𝛼𝑛
是线性空间 𝑉 的一组基, 𝛽1 , 𝛽2 , · · · , 𝛽𝑑 是线性空间 𝑊 的一组基.
因 为 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 中 的 向 量 不 能 全 由 𝛽1 , 𝛽2 , · · · , 𝛽𝑑 线 性 表 出, 故 可
从 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 找 出 一 个 向 量, 记 作 𝛽𝑑+1 , 加 入 向 量 组 𝛽1 , 𝛽2 , · · · , 𝛽𝑑 使 得
𝛽1 , 𝛽2 , · · · , 𝛽𝑑 , 𝛽𝑑+1 依然线性无关.
如果 𝑑 + 1 < 𝑛, 则 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 中的向量不能全由 𝛽1 , · · · , 𝛽𝑑 , 𝛽𝑑+1 线性
表出, 重复前述操作, 得线性无关向量组 𝛽1 , · · · , 𝛽𝑑 , 𝛽𝑑+1 , 𝛽𝑑+2 . 依此下去, 最终得
到线性无关向量组 𝛽1 , · · · , 𝛽𝑑 , 𝛽𝑑+1 , · · · , 𝛽𝑛 , 该向量组线性无关, 𝛼1 , 𝛼2 , · · · , 𝛼𝑛
中的向量可由 𝛽1 , · · · , 𝛽𝑑 , 𝛽𝑑+1 , · · · , 𝛽𝑛 线性表出, 因此 𝛽1 , · · · , 𝛽𝑑 , 𝛽𝑑+1 , · · · , 𝛽𝑛
是线性空间 𝑉 的一组基. 于是我们将线性空间 𝑊 的一组基扩充成了线性空间 𝑉
的一组基.

4.3.2 零空间与列空间

定 理 4.3.3 齐次线性方程组的解集 {𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 构成线性空间 R𝑛 的


一个子空间; 非齐次线性方程组的解集 {𝑥 ∈ R𝑛 |𝐴𝑥 = 𝑏, 𝑏 ̸= 0} 不构成子空间.
证明 首先, R𝑛 是实数域 R 上的一个线性空间, 齐次线性方程组的解集
{𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 是 R𝑛 的一个子集.
对于 ∀𝛼, 𝛽 ∈ {𝑥 ∈ R𝑛 |𝐴𝑥 = 0}, 有 𝐴(𝛼 + 𝛽) = 𝐴𝛼 + 𝐴𝛽 = 0, 即 𝛼 + 𝛽 ∈
{𝑥 ∈ R𝑛 |𝐴𝑥 = 0}.
对于 ∀𝛼 ∈ {𝑥 ∈ R𝑛 |𝐴𝑥 = 0}, ∀𝜆 ∈ R, 有 𝐴(𝜆𝛼) = 𝜆𝐴𝛼 = 0, 即 𝜆𝛼 ∈ {𝑥 ∈
R𝑛 |𝐴𝑥 = 0}.
所以 {𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 是线性空间 R𝑛 的一个子空间.
然而, 非齐次线性方程组的解集 {𝑥 ∈ R𝑛 |𝐴𝑥 = 𝑏, 𝑏 ̸= 0} 不构成子空间, 这是
因为: 对于 ∀𝛼, 𝛽 ∈ {𝑥 ∈ R𝑛 |𝐴𝑥 = 𝑏, 𝑏 ̸= 0}, 有 𝐴(𝛼 + 𝛽) = 𝐴𝛼 + 𝐴𝛽 = 2𝑏 ̸= 𝑏,
即𝛼+𝛽 ∈
/ {𝑥 ∈ R𝑛 |𝐴𝑥 = 𝑏, 𝑏 ̸= 0}.
定 义 4.3.3 齐次线性方程组 𝐴𝑥 = 0 的解集称为该齐次线性方程组的解
解空
间, 或称为矩阵 𝐴 的零
零空间 (null space), 记作 N(𝐴).
定 义4.3.4 矩阵 𝐴 的列向量张成的子空间称为矩阵 𝐴 的列
列 空 间(column
space), 记作 C(𝐴).
定 理 4.3.4 线性方程组 𝐴𝑥 = 𝑏 有解的充要条件是 𝑏 ∈ C(𝐴).
证明 从列向量线性组合的角度考察线性方程组 𝐴𝑥 = 𝑏.
4.3 子 空 间 105

P𝑛
因为 𝐴𝑥 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 所以 𝐴𝑥 = 𝑏 有解当且仅当向量 𝑏 可由系数矩
P𝑛
阵 𝐴 的列向量线性表出 𝑏 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 即 𝑏 ∈ C(𝐴).
定理 4.3.5 设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 则
P𝑛
(1) 矩阵 𝐴 的列空间 C(𝐴) = { 𝑗=1 𝜆𝑗 col(𝐴, 𝑗)|𝜆𝑗 ∈ R} 的维数 dim C(𝐴) =
𝑟;
(2) 矩阵 𝐴 的零空间 N(𝐴) = {𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 的维数 dim N(𝐴) = 𝑛 − 𝑟.
证明 (1)矩阵 𝐴 的列空间 C(𝐴) 是由 𝐴 的列向量 col(𝐴, 1), · · · ,col(𝐴, 𝑛) 张
成的.
由 rank(𝐴) = 𝑟 知 𝐴 的 列 向 量 组 的 极 大 无 关 组 中 有 𝑟 个 向 量, 不 妨 设
col(𝐴, 1), · · · ,col(𝐴, 𝑟).
因为 col(𝐴, 1), · · · ,col(𝐴, 𝑛) 可由其极大无关组 col(𝐴, 1), · · · ,col(𝐴, 𝑟)线性
表出, 所以列空间 C(𝐴) 中的任何向量可由 col(𝐴, 1), · · · ,col(𝐴, 𝑟)线性表出, 所以
col(𝐴, 1), · · · ,col(𝐴, 𝑟)是列空间 C(𝐴) 的一组基, 故其维数 dimC(𝐴) = 𝑟.
(2)矩阵 𝐴 的零空间即为齐次线性方程组 𝐴𝑥 = 0 的解空间, 它由基础解系张
成. 因 rank(𝐴) = 𝑟, 根据线性方程组理论知 𝐴𝑥 = 0 有 𝑛 − 𝑟 个自由变量, 从而基
础解系中含有 𝑛 − 𝑟 个线性无关的解向量, 所以维数 dim N(𝐴) = 𝑛 − 𝑟.

4.3.3 子空间的交与和

定 义 4.3.5 设 𝑊1 与 𝑊2 是线性空间 𝑉 的两个子空间, 它们的交


交与和
和分别定
义如下
𝑊1 ∩ 𝑊2 = {𝛼|𝛼 ∈ 𝑊1 , 𝛼 ∈ 𝑊2 }

𝑊1 + 𝑊2 = {𝛼 + 𝛽|𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 }

定理 4.3.6 设 𝑊1 与 𝑊2 是线性空间 𝑉 的子空间, 则 𝑊1 ∩ 𝑊2 与𝑊1 + 𝑊2 均


为 𝑉 的子空间.
证明 (1)先证明 𝑊1 ∩ 𝑊2 是 𝑉 的子空间.
因为 𝑊1 与 𝑊2 是 𝑉 的两个子空间, 所以 0 ∈ 𝑊1 , 0 ∈ 𝑊2 , 从而 0 ∈ 𝑊1 ∩ 𝑊2 ,
即 𝑊1 ∩ 𝑊2 非空.
对任意 𝛼, 𝛽 ∈ 𝑊1 ∩ 𝑊2 , 有 𝛼, 𝛽 ∈ 𝑊1 , 且 𝛼, 𝛽 ∈ 𝑊2 , 故有 𝛼 + 𝛽 ∈ 𝑊1 ,
𝛼 + 𝛽 ∈ 𝑊2 , 从而 𝛼 + 𝛽 ∈ 𝑊1 ∩ 𝑊2 , 即 𝑊1 ∩ 𝑊2 对于加法具有封闭性.
对任意 𝛼 ∈ 𝑊1 ∩ 𝑊2 , 有 𝛼 ∈ 𝑊1 , 且 𝛼 ∈ 𝑊2 , 故有 𝑘𝛼 ∈ 𝑊1 , 𝑘𝛼 ∈ 𝑊2 , 从而
𝑘𝛼 ∈ 𝑊1 ∩ 𝑊2 , 即 𝑊1 ∩ 𝑊2 对于数乘具有封闭性.
(2)再证 𝑊1 + 𝑊2 是 𝑉 的子空间.
因为 𝑊1 与 𝑊2 是 𝑉 的两个子空间, 所以0 ∈ 𝑊1 , 0 ∈ 𝑊2 , 从而0 + 0 = 0 ∈
𝑊1 + 𝑊2 , 即𝑊1 + 𝑊2 非空.
106 第4章 线性空间与线性变换

对任意 𝛼, 𝛽 ∈ 𝑊1 + 𝑊2 , 有

𝛼 = 𝛼 1 + 𝛼2 , 𝛼1 ∈ 𝑊1 , 𝛼 2 ∈ 𝑊2

𝛽 = 𝛽1 + 𝛽2 , 𝛽1 ∈ 𝑊1 , 𝛽2 ∈ 𝑊2

由于 𝑊1 , 𝑊2 是 𝑉 的子空间, 故有

𝛼 1 + 𝛽 1 ∈ 𝑊1 , 𝛼2 + 𝛽2 ∈ 𝑊2

从而

𝛼 + 𝛽 = (𝛼1 + 𝛼2 ) + (𝛽1 + 𝛽2 ) = (𝛼1 + 𝛽1 ) + (𝛼2 + 𝛽2 ) ∈ 𝑊1 + 𝑊2

即 𝑊1 + 𝑊2 对于加法具有封闭性.
对任意 𝛼 ∈ 𝑊1 + 𝑊2 , 存在 𝛼1 ∈ 𝑊1 , 𝛼2 ∈ 𝑊2 , 使得 𝛼 = 𝛼1 + 𝛼2 . 由于
𝑊1 , 𝑊2 是 𝑉 的子空间, 故有 𝑘𝛼1 ∈ 𝑊1 , 𝑘𝛼2 ∈ 𝑊2 . 从而 𝑘𝛼 = 𝑘(𝛼1 + 𝛼2 ) =
𝑘𝛼1 + 𝑘𝛼2 ∈ 𝑊1 + 𝑊2 , 即 𝑊1 + 𝑊2 对于数乘具有封闭性.
例4.3.2 在线性空间 R3 中, 设 𝑊1 = {(𝑥, 0, 0)|𝑥 ∈ R}, 𝑊2 = {(0, 𝑦, 𝑧)|𝑦 ∈
R, 𝑧 ∈ R}, 可以验证 𝑊1 是 R3 的一维子空间, 𝑊2 是 R3 的二维子空间, 且有

𝑊1 ∩ 𝑊2 = {(0, 0, 0)}, 𝑊1 + 𝑊2 = R3

注 (1) 𝑊1 + 𝑊2 ̸= 𝑊1 𝑊2 不是线性空间(请读者自行思考为什
S S
𝑊2 , 𝑊 1
么).
(2)向量维数与空间维数是两个不同的概念, 前者指向量中所含元素的个数,
后者指张成子空间的基中所含向量个数. 如例 4.3.2 中空间 𝑊1 , 𝑊2 所包含的向量
维数均是 3, 因此它们分别是三维空间 R3 的一维子空间和二维子空间.
例4.3.3 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 与 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 是线性空间 𝑉 的两组向量, 则

span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) + span(𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
=span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 , 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )

证明 记
𝑊1 = span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 )
𝑊2 = span(𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
𝑊3 = span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 , 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )

对于任意 𝜂 ∈ 𝑊1 + 𝑊2 , 存在 𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 , 使得 𝜂 = 𝛼 + 𝛽.
4.3 子 空 间 107


𝛼 = 𝜆 1 𝛼 1 + 𝜆2 𝛼 2 + · · · + 𝜆𝑙 𝛼 𝑙
𝛽 = 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠


𝜂 = 𝜆1 𝛼1 + 𝜆2 𝛼2 + · · · + 𝜆𝑙 𝛼𝑙 + 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠 ∈ 𝑊3

所以 𝜂 = 𝛼 + 𝛽 ∈ 𝑊3 , 从而 𝑊1 + 𝑊2 ⊆ 𝑊3 .
另一方面, 对于任意 𝜂 ∈ 𝑊3 , 𝜂 可由 𝛼1 , · · · , 𝛼𝑙 , 𝛽1 , · · · , 𝛽𝑠 线性表出:

𝜂 = 𝜆1 𝛼1 + 𝜆2 𝛼2 + · · · + 𝜆𝑙 𝛼𝑙 + 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠


𝜆1 𝛼 1 + 𝜆2 𝛼 2 + · · · + 𝜆𝑙 𝛼 𝑙 = 𝛼
𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠 = 𝛽

则有
𝜂 =𝛼+𝛽

其中 𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 . 所以 𝜂 ∈ 𝑊1 + 𝑊2 , 从而 𝑊3 ⊆ 𝑊1 + 𝑊2 .
设 𝑊1 , 𝑊2 , 𝑊3 是 𝑉 的子空间, 由子空间交与和的定义我们可以验证下述运
算规律.
(1)交换律:
𝑊1 ∩ 𝑊2 = 𝑊2 ∩ 𝑊1
𝑊1 + 𝑊 2 = 𝑊2 + 𝑊1

(2)结合律:
(𝑊1 ∩ 𝑊2 ) ∩ 𝑊3 = 𝑊1 ∩ (𝑊2 ∩ 𝑊3 )
(𝑊1 + 𝑊2 ) + 𝑊3 = 𝑊1 + (𝑊2 + 𝑊3 )

定理 4.3.7 (维数公式) 设 𝑊1 , 𝑊2 是线性空间 𝑉 的子空间, 则

dim𝑊1 + dim𝑊2 = dim(𝑊1 + 𝑊2 ) + dim(𝑊1 ∩ 𝑊2 )

证明 设 dim𝑊1 = 𝑛1 , dim𝑊2 = 𝑛2 , dim(𝑊1 ∩ 𝑊2 ) = 𝑚.


设 𝑊1 ∩ 𝑊2 的一组基为 𝛾1 , 𝛾2 , · · · , 𝛾𝑚 , 一方面, 因为 𝑊1 ∩ 𝑊2 ⊆ 𝑊1 , 由基
扩充定理, 它可扩充成 𝑊1 的一组基: 𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 ; 另一方面, 因为
𝑊1 ∩ 𝑊2 ⊆ 𝑊1 , 所以它还可扩充成 𝑊2 的一组基:

𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚
108 第4章 线性空间与线性变换


𝑊1 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 )
𝑊2 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 )

从而
𝑊1 + 𝑊2 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 )

下面只要证明 𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 线性无关即可.

考察

𝑐1 𝛾1 + · · · + 𝑐𝑚 𝛾𝑚 + 𝑎1 𝛼1 + · · · + 𝑎𝑛1 −𝑚 𝛼𝑛1 −𝑚 + 𝑏1 𝛽1 + · · · + 𝑏𝑛2 −𝑚 𝛽𝑛2 −𝑚 = 0


𝜂 = 𝑐1 𝛾1 + · · · + 𝑐𝑚 𝛾𝑚 + 𝑎1 𝛼1 + · · · + 𝑎𝑛1 −𝑚 𝛼𝑛1 −𝑚 (4.7)

从而
−𝜂 = 𝑏1 𝛽1 + · · · + 𝑏𝑛2 −𝑚 𝛽𝑛2 −𝑚 (4.8)

由 式(4.7)知 𝜂 ∈ 𝑊1 , 由 式(4.8)知 𝜂 ∈ 𝑊2 , 所 以 𝜂 ∈ 𝑊1 ∩ 𝑊2 , 从 而 𝜂 可 由
𝛾1 , 𝛾2 , · · · , 𝛾𝑚 线性表出:

𝜂 = 𝑘1 𝛾1 + 𝑘2 𝛾2 + · · · + 𝑘𝑚 𝛾𝑚

因此
𝑘1 𝛾1 + · · · + 𝑘𝑚 𝛾𝑚 + 𝑏1 𝛽1 + · · · + 𝑏𝑛2 −𝑚 𝛽𝑛2 −𝑚 = 0

由于 𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 线性无关, 故

𝑘1 = · · · = 𝑘𝑚 = 𝑏1 = · · · = 𝑏𝑛2 −𝑚 = 0

所以
𝑐1 𝛾1 + · · · + 𝑐𝑚 𝛾𝑚 + 𝑎1 𝛼1 + · · · + 𝑎𝑛1 −𝑚 𝛼𝑛1 −𝑚 = 0

又由 𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 线性无关, 故

𝑐1 = · · · = 𝑐𝑚 = 𝑎1 = · · · = 𝑎𝑛1 −𝑚 = 0

因此
𝑐1 = · · · = 𝑐𝑚 = 𝑎1 = · · · = 𝑎𝑛1 −𝑚 = 𝑏1 = · · · = 𝑏𝑛2 −𝑚 = 0
4.3 子 空 间 109

所以向量组 𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 线性无关. 于是 𝑊1 + 𝑊2


的维数是
𝑚 + (𝑛1 − 𝑚) + (𝑛2 − 𝑚) = 𝑛1 + 𝑛2 − 𝑚

从而

dim𝑊1 + dim𝑊2 = dim(𝑊1 + 𝑊2 ) + dim(𝑊1 ∩ 𝑊2 )

例4.3.4 设
𝛼1 = [1, 2, 1, 0]T , 𝛼2 = [−1, , 1, 1, 1]T

𝛽1 = [2, −1, 0, 1]T , 𝛽2 = [1, −1, 3, 7]T

分别求 span(𝛼1 , 𝛼2 ) ∩ span(𝛽1 , 𝛽2 ), span(𝛼1 , 𝛼2 ) + span(𝛽1 , 𝛽2 ) 的基与维数.


解 记
𝑊1 = span(𝛼1 , 𝛼2 ) ∩ span(𝛽1 , 𝛽2 )
𝑊2 = span(𝛼1 , 𝛼2 ) + span(𝛽1 , 𝛽2 )


𝑊1 + 𝑊2 = span(𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 )

知 𝑊1 + 𝑊2 的基是向量组 𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 的极大无关组.
将向量组 𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 写成矩阵形式并作初等行变换
 
1 −1 2 1
 2 1 −1 1 
 
 
 1 1 0 3 


0 1 1 7
   
1 −1 2 1 1 0 3 8
𝑅2 −2𝑅1 1 4 𝑅 +𝑅
 0 3 −5 −3   0 0 −8 −24
   
𝑅 −𝑅 𝑅2 −3𝑅4  
−−3−−−1→  −
 𝑅3 −2𝑅→
−− −− 

 0 2 −2 2  4  0 0 −4 −12
 

0 1 1 7 0 1 1 7
   
1 0 0 −1 1 0 0 −1
𝑅2 −2𝑅3
 0 0 0 0   0 1 0 4 
   
𝑅4 + 14 𝑅3 𝑅24 
−−−−3−→  −−→ 
𝑅1 + 4 𝑅3  0 0 1 3   0 0 1 3 
  

− 14 𝑅3
0 1 0 4 0 0 0 0

可知向量组 𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 线性相关, 而 𝛼1 , 𝛼2 , 𝛽1 线性无关, 因此 𝛼1 , 𝛼2 , 𝛽1 是一


110 第4章 线性空间与线性变换

个极大无关组, 从而 𝑊1 + 𝑊2 的一组基是 𝛼1 , 𝛼2 , 𝛽1 , 且维数 dim(𝑊1 + 𝑊2 ) = 3.


从上面还可以看出 𝛼1 , 𝛼2 线性无关, 𝛽1 , 𝛽2 也线性无关, 故 𝑊1 和 𝑊2 的维数
均为 2, 由维数公式计算得 𝑊1 ∩ 𝑊2 的维数为

dim(𝑊1 ∩ 𝑊2 ) = dim𝑊1 + dim𝑊2 − dim(𝑊1 + 𝑊2 ) = 2 + 2 − 3 = 1

再由上面初等行变换的结果知

𝛽2 = −𝛼1 + 4𝛼2 + 3𝛽1

因此
3𝛽1 − 𝛽2 = 𝛼1 − 4𝛼2 = [5, −2, −3, −4]T

记 𝜂 = [5, −2, −3, −4]T , 因为 𝜂 ∈ 𝑊1 ∩ 𝑊2 , 而 𝑊1 ∩ 𝑊2 的维数为 1, 所以 𝜂 是


𝑊1 ∩ 𝑊2 的基.

定义 4.3.6 设 𝑊1 , 𝑊2 为线性空间 𝑉 的子空间, 如果

𝑊1 ∩ 𝑊2 = {0}, 𝑊1 + 𝑊2 = 𝑉

则称 𝑊2 是 𝑊1 关于线性空间 𝑉 的补
补空 间 .
同样, 也称 𝑊1 为 𝑊2 关于线性空间 𝑉 的补空间, 故 𝑊1 与 𝑊2 互为补空间.

定 理 4.3.8 (补空间存在性定理) 设 𝑊1 是 𝑛 维线性空间 𝑉 的子空间, 则存在


𝑊1 关于线性空间 𝑉 的补空间.
证明 设 dim𝑊1 = 𝑠, 可知 𝑠 6 𝑛.
若 𝑠 = 𝑛, 则 𝑊1 = 𝑉 , 取 𝑊2 = {0}, 则有 𝑊1 ∩ 𝑊2 = {0}, 𝑊1 + 𝑊2 = 𝑉 , 故此
时 𝑊1 的补空间为 𝑊2 = {0}.
若 𝑠 < 𝑛, 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 为 𝑊1 的一组基, 由基扩充定理, 可将其扩充成 𝑉
的一组基:
𝛼1 , · · · , 𝛼𝑠 , 𝛼𝑠+1 , · · · , 𝛼𝑛

取 𝑊2 = span(𝛼𝑠+1 , · · · , 𝛼𝑛 ), 则有 𝑊1 ∩ 𝑊2 = {0}, 𝑊1 + 𝑊2 = 𝑉 , 故 𝑊2 就是 𝑊1
的补空间.
例4.3.5 在线性空间 R3 中, 设 𝑊1 = {(𝑥, 0, 0)|𝑥 ∈ R}, 𝑊2 = {(0, 𝑦, 𝑧)|𝑦 ∈
R, 𝑧 ∈ R}, 因 𝑊1 ∩ 𝑊2 = {(0, 0, 0)}, 𝑊1 + 𝑊2 = R3 , 故 𝑊1 与 𝑊2 互为补空间.
4.4 内 积 空 间 111

4.4 内 积 空 间

4.4.1 内积

定 义 4.4.1 设 𝑉 是实数域 R 上一个线性空间, 如果二元运算 ⟨𝛼, 𝛽⟩ 满足以


下条件:

(1) ⟨𝛼, 𝛽⟩ = ⟨𝛽, 𝛼⟩;

(2) ⟨𝑘𝛼, 𝛽⟩ = 𝑘 ⟨𝛼, 𝛽⟩;

(3) ⟨𝛼 + 𝛽, 𝛾⟩ = ⟨𝛼, 𝛾⟩ + ⟨𝛽, 𝛾⟩;

(4) ⟨𝛼, 𝛼⟩ > 0, 且 ⟨𝛼, 𝛼⟩ = 0 当且仅当 𝛼 为零元.

其中 𝛼, 𝛽, 𝛾 ∈ 𝑉, 𝑘 ∈ R, 则称二元运算 ⟨𝛼, 𝛽⟩ 为 𝛼 与 𝛽 的内
内积 . 引入内积后
的线性空间称为内
内积 空 间 .
例4.4.1 在线性空间 R𝑛 中, 对于向量

𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 𝑦 = [𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ]T

常用如下的内积定义:

⟨𝑥, 𝑦⟩ = 𝑥1 𝑦1 + 𝑥2 𝑦2 + · · · + 𝑥𝑛 𝑦𝑛

容易验证其满足定义 4.4.1 中的四个条件, 因而是一个内积. 内积空间 R𝑛 通常也


称为 Euclid 空间 , 简称欧
欧氏 空 间 .
例4.4.2 在线性空间 𝐶[𝑎, 𝑏] 中, 对于任意的两个实函数 𝑓 (𝑥), 𝑔(𝑥) ∈ 𝐶[𝑎, 𝑏],
通常定义内积: Z 𝑏
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)d𝑥
𝑎

下面验证其满足定义中的四个条件:

(1) Z 𝑏 Z 𝑏
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝑔(𝑥)𝑓 (𝑥)d𝑥 = ⟨𝑔, 𝑓 ⟩
𝑎 𝑎

(2) Z 𝑏 Z 𝑏
⟨𝜆𝑓, 𝑔⟩ = 𝜆𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝜆 𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝜆 ⟨𝑓, 𝑔⟩
𝑎 𝑎
112 第4章 线性空间与线性变换

(3)
Z 𝑏
⟨𝑓 + 𝑔, ℎ⟩ = [𝑓 (𝑥) + 𝑔(𝑥)]ℎ(𝑥)d𝑥
𝑎
Z 𝑏 Z 𝑏
= 𝑓 (𝑥)ℎ(𝑥)d𝑥 + 𝑔(𝑥)ℎ(𝑥)d𝑥
𝑎 𝑎

= ⟨𝑓, ℎ⟩ + ⟨𝑔, ℎ⟩

(4) 当 𝑓 (𝑥) ̸≡ 0 时, 有
Z 𝑏
⟨𝑓, 𝑓 ⟩ = 𝑓 2 (𝑥)d𝑥 > 0
𝑎

当且仅当 𝑓 (𝑥) ≡ 0 时, ⟨𝑓, 𝑓 ⟩ = 0, 其中 𝑓 (𝑥), 𝑔(𝑥), ℎ(𝑥) ∈ 𝐶[𝑎, 𝑏].


® 𝑛 𝑚
¸ 𝑛 P
𝑚
性质 4.4.1 𝑘𝑖 𝑙𝑗 ⟨𝛼𝑖 , 𝛽𝑗 ⟩.
P P P
𝑘𝑖 𝛼𝑖 , 𝑙𝑗 𝛽𝑗 =
𝑖=1 𝑗=1 𝑖=1 𝑗=1

证明
* 𝑛 𝑚
+ 𝑛
* 𝑚
+
X X X X
𝑘 𝑖 𝛼𝑖 , 𝑙𝑗 𝛽𝑗 = 𝑘 𝑖 𝛼𝑖 , 𝑙𝑗 𝛽𝑗
𝑖=1 𝑗=1 𝑖=1 𝑗=1
𝑛
* 𝑚
+
X X
= 𝑘𝑖 𝑙𝑗 𝛽𝑗 , 𝛼𝑖
𝑖=1 𝑗=1
X𝑛 X 𝑚
= 𝑘𝑖 𝑙𝑗 ⟨𝛽𝑗 , 𝛼𝑖 ⟩
𝑖=1 𝑗=1
X𝑛 X 𝑚
= 𝑘𝑖 𝑙𝑗 ⟨𝛼𝑖 , 𝛽𝑗 ⟩
𝑖=1 𝑗=1

性质 4.4.2 (Cauchy-Schwarz不等式) 设 𝛼, 𝛽 是内积空间 V 上的向量, 则恒有


2
⟨𝛼, 𝛽⟩ 6 ⟨𝛼, 𝛼⟩ ⟨𝛽, 𝛽⟩
证明 构造关于 𝑡 的函数

𝑓 (𝑡) = ⟨𝛼, 𝛼⟩ + 2𝑡 ⟨𝛼, 𝛽⟩ + 𝑡2 ⟨𝛽, 𝛽⟩ = ⟨𝛼 + 𝑡𝛽, 𝛼 + 𝑡𝛽⟩

对任意实数 𝑡, 恒有 𝑓 (𝑡) > 0, 故

△ = (2 ⟨𝛼, 𝛽⟩)2 − 4 ⟨𝛼, 𝛼⟩ ⟨𝛽, 𝛽⟩ 6 0


4.4 内 积 空 间 113

从而
2
⟨𝛼, 𝛽⟩ 6 ⟨𝛼, 𝛼⟩ ⟨𝛽, 𝛽⟩

例4.4.3 因为 ⟨𝑥, 𝑦⟩ = 𝑥1 𝑦1 + 𝑥2 𝑦2 + · · · + 𝑥𝑛 𝑦𝑛 是线性空间 R𝑛 中的一种内


积, 故其满足 Cauchy-Schwarz 不等式:

(𝑥1 𝑦1 + 𝑥2 𝑦2 + · · · + 𝑥𝑛 𝑦𝑛 )2 6 (𝑥21 + 𝑥22 + · · · + 𝑥2𝑛 )(𝑦12 + 𝑦22 + · · · + 𝑦𝑛2 )

例4.4.4 因为 Z 𝑏
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)d𝑥
𝑎

是线性空间 𝐶[𝑎, 𝑏] 中的一种内积, 故其满足 Cauchy-Schwarz 不等式:

Z 𝑏 ‹2 Z 𝑏 Z 𝑏
𝑓 (𝑥)𝑔(𝑥)d𝑥 6 𝑓 2 (𝑥)d𝑥 𝑔 2 (𝑥)d𝑥
𝑎 𝑎 𝑎

定 义 4.4.2 设 𝛼 是内积空间 𝑉 中的一个向量, 则 ⟨𝛼, 𝛼⟩ 称为向量 𝛼 的模



p

或者范
范数 , 记为 ‖ 𝛼 ‖.
在此定义下, ‖ 𝛼 ‖= 0 当且仅当 𝛼 为零向量.
例4.4.5 设 𝑥 ∈ R𝑛 , 有
Ì
È 𝑛
X
‖ 𝑥 ‖= ⟨𝑥, 𝑥⟩ = 𝑥2𝑖
𝑖=1

例4.4.6 设 𝑓 (𝑥) ∈ 𝐶[𝑎, 𝑏], 有


È
s
Z 𝑏
‖ 𝑓 (𝑥) ‖= ⟨𝑓 (𝑥), 𝑓 (𝑥)⟩ = 𝑓 2 (𝑥)d𝑥
𝑎

定义 4.4.3 模为 1 的向量称为单 单位 向 量 .
𝛼
若 𝛼 ̸= 0, 则 为单位向量, 这是因为
‖𝛼‖
° º
𝛼 𝛼 ⟨𝛼, 𝛼⟩
, = =1
‖𝛼‖ ‖𝛼‖ ‖ 𝛼 ‖2

上述这种除以模的操作称为向量的单
单位 化(或标
标准 化 ).
定 义4.4.4 设 𝑉 是一个内积空间, 𝛼, 𝛽 ∈ 𝑉 , 如果 ⟨𝛼, 𝛽⟩ = 0, 则称 𝛼 与 𝛽 正
交 , 记为 𝛼 ⊥ 𝛽.
114 第4章 线性空间与线性变换

注 零向量与任何向量正交, 包括与其自身正交, 且只有零向量才与自身正交.


例4.4.7 在 内 积 空 间 R3 中, 设 向 量 𝛼 = [1, 0, 0]T , 𝛽 = [0, 1, 0]T , 因 为
⟨𝛼, 𝛽⟩ = 𝛼T 𝛽 = 0, 所以 𝛼 ⊥ 𝛽.
例4.4.8 在内积空间 𝐶[−π, π] 中, 设 𝑓 (𝑥) = sin 𝑥, 𝑔(𝑥) = cos 𝑥, 𝑥 ∈ [−π, π],
因为 Z π
⟨𝑓, 𝑔⟩ = sin 𝑥 cos 𝑥d𝑥 = 0
−π

所以 𝑓 (𝑥) ⊥ 𝑔(𝑥).
定 义 4.4.5 在内积空间 𝑉 中, 两两正交的一组非零向量称为正
正交 向 量 组, 两
两正交的一组单位向量称为标
标准 正 交 向 量 组 .
定 理 4.4.1 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 (𝑙 6 𝑛) 是 𝑛 维内积空间 𝑉 中的一个正交向量
组, 则 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关.
证明 考察
𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑙 𝛼𝑙 = 0

用 𝛼𝑗 对上式等号两边作内积, 得

𝑘1 ⟨𝛼1 , 𝛼𝑗 ⟩ + 𝑘2 ⟨𝛼2 , 𝛼𝑗 ⟩ + · · · + 𝑘𝑙 ⟨𝛼𝑙 , 𝛼𝑗 ⟩ = ⟨0, 𝛼𝑗 ⟩ = 0

因为 
0, 𝑖 ̸= 𝑗
⟨𝛼𝑖 , 𝛼𝑗 ⟩ = (𝑖, 𝑗 = 1, 2, · · · , 𝑙)
‖ 𝛼 ‖2 , 𝑖=𝑗
𝑖


𝑘 𝑗 ‖ 𝛼𝑗 ‖ 2 = 0 (𝑗 = 1, 2, · · · , 𝑙)

因 ‖ 𝛼𝑗 ‖̸= 0, 从而 𝑘𝑗 = 0 (𝑗 = 1, 2, · · · , 𝑙), 故向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关.


定义 4.4.6 在 𝑛 维内积空间 𝑉 中, 由 𝑛 个两两正交的非零向量所构成的一组
基称为正
正交 基, 由单位向量构成的正交基称为标
标准 正 交 基 .
若 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维内积空间 𝑉 的一个标准正交基, 由定义有

(
0, 𝑖 ̸= 𝑗
⟨𝜀𝑖 , 𝜀𝑗 ⟩ = (𝑖, 𝑗 = 1, 2, · · · , 𝑛)
1, 𝑖 = 𝑗

1 1 ˜T •
• − 1 1 ˜T
例4.4.9 证明向量组 𝛼1 = [1, 0, 0] , 𝛼2 = 0, √ , √ T
, 𝛼3 = 0, √ , √
2 2 2 2
是 Euclid 空间 R3 的一个标准正交基.
4.4 内 积 空 间 115

解 由于
⟨𝛼1 , 𝛼2 ⟩ = ⟨𝛼2 , 𝛼3 ⟩ = ⟨𝛼3 , 𝛼1 ⟩ = 0


‖ 𝛼1 ‖=‖ 𝛼2 ‖=‖ 𝛼3 ‖= 1

因此 𝛼1 , 𝛼2 , 𝛼3 是 R3 的一个标准正交基.
定 理 4.4.2 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维内积空间 𝑉 的一个标准正交基, 𝛼 ∈
𝑉, 𝛽 ∈ 𝑉 , 𝛼 与 𝛽 在该标准正交基下的坐标向量分别为 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T 和
𝑦 = [𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ]T , 则 𝛼 与 𝛽 的内积 ⟨𝛼, 𝛽⟩ = 𝑥T 𝑦.
证明 由题意
𝛼 = 𝑥1 𝜀1 + 𝑥2 𝜀2 + · · · + 𝑥𝑛 𝜀𝑛

𝛽 = 𝑦1 𝜀1 + 𝑦2 𝜀2 + · · · + 𝑦𝑛 𝜀𝑛

因此
* 𝑛 𝑛
+
X X
⟨𝛼, 𝛽⟩ = 𝑥𝑖 𝜀𝑖 , 𝑦 𝑗 𝜀𝑗
𝑖=1 𝑗=1
𝑛 X
X 𝑛
= 𝑥𝑖 𝑦𝑗 ⟨𝜀𝑖 , 𝜀𝑗 ⟩
𝑖=1 𝑗=1
X𝑛
= 𝑥 𝑖 𝑦𝑖 = 𝑥 T 𝑦
𝑖=1

4.4.2 正交投影与最小二乘解
本节讨论 𝑛 维 Euclid 空间 R𝑛 中的正交投影. 给定向量 𝛽 和 Rn 中子空间 𝑊 ,
存在属于 𝑊 的唯一向量 𝛽,
b 使得 𝛽 − 𝛽
b 与 𝑊 正交, 如图 4.1 所示, 称 𝛽
b 为 𝛽 在子
空间 𝑊 中的正
正交投 影. 𝛽b 是 𝑊 中最接近 𝛽 的向量.

图 4.1
116 第4章 线性空间与线性变换

例4.4.10 设 𝛼, 𝛽 ∈ R𝑛 , 求 𝛽 在 𝛼 上的正交投影.
𝛼 𝛼T
解 将向量 𝛼 单位化 , 从而 𝛽 在 𝛼 上的正交投影长度为 𝛽. 因此
‖𝛼‖ ‖𝛼‖
𝛽 在 𝛼 上的正交投影向量为

𝛼 𝛼T 𝛼𝛼T
𝛽= 𝛽 (4.9)
‖ 𝛼 ‖‖ 𝛼 ‖ 𝛼T 𝛼

例4.4.11 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关, 其中 𝛼𝑖 ∈ R𝑛 (𝑖 = 1, · · · , 𝑙), 现


有向量 𝛽 ∈ R𝑛 , 求 𝛽 在子空间 span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) 中的正交投影.
解 记 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ], 因此 C(𝐴) = span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ).
若 𝛽 ∈ C(𝐴), 则 𝛽 在子空间 C(𝐴) 中的正交投影是其本身. 若 𝛽 ∈
/ C(𝐴), 设
𝛽 在子空间 C(𝐴) 中的正交投影是 𝐴𝑥, 则 𝛽 − 𝐴𝑥 ⊥ C(𝐴), 所以

𝛼T
𝑖 (𝛽 − 𝐴𝑥) = 0 (𝑖 = 1, 2, · · · , 𝑙)

因此
𝐴T (𝛽 − 𝐴𝑥) = 0

𝐴T 𝐴𝑥 = 𝐴T 𝛽 (4.10)

因为 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关, 所以 rank(𝐴) = 𝑙, 从而 rank(𝐴T 𝐴) = 𝑙, 故 𝐴T 𝐴 可


逆, 于是

𝑥 = (𝐴T 𝐴)−1 𝐴T 𝛽 (4.11)

所以 𝛽 在子空间 C(𝐴) 中的正交投影:

𝐴𝑥 = 𝐴(𝐴T 𝐴)−1 𝐴T 𝛽 (4.12)

注 (1) 式(4.9)是式(4.12)当矩阵 𝐴 只有一列时的特殊情形.


(2) 如果向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 是标准正交向量组, 则 𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ] 的
列向量标准正交, 此时有 𝐴T 𝐴 = 𝐼, 所以式(4.12)化为

𝑙
X
𝐴𝑥 = 𝐴𝐴T 𝛽 = 𝛼 𝑖 𝛼T
𝑖 𝛽
𝑖=1
4.4 内 积 空 间 117

即 𝛽 在由标准正交基 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 张成的子空间 C(𝐴) 中的正交投影是其在各


基向量上的正交投影之和.
(3)当线性方程组 𝐴𝑥 = 𝛽 无解时, 式(4.10) 一定有解. 可以验证, 从式(4.10) 解
出的 𝑥 使得 ‖ 𝐴𝑥 − 𝛽 ‖ 最小, 我们称其为最
最小二 乘解 . 式(4.11)就是当线性方程组
𝐴𝑥 = 𝛽 系数矩阵 𝐴 列满秩时的唯一最小二乘解.
例 4.4.12 下列线性方程组是否有解?如果有解, 求其解; 如果无解, 求其最
小二乘解. 
 𝑥1 + 1.2𝑥2 = 1.6


1 𝑥 + 1.4𝑥 = 1.7
2


 𝑥 + 1.8𝑥 = 2
1 2

解 记线性方程组为 𝐴𝑥 = 𝑏, 其中
   
1 1.2 1.6
   
𝐴=
 1 1.4  ,
 𝑏=
 1.7 

1 1.8 2

易知 rank(𝐴) = 2, rank([𝐴, 𝑏]) = 3, 故线性方程组无解.下面求其最小二乘解. 由于


" # " #
T 1 1 1 T 3 4.4
𝐴 = , 𝐴 𝐴=
1.2 1.4 1.8 4.4 6.64

" #
T −1
1 6.64 −4.4
(𝐴 𝐴) =
0.56 −4.4 3

解得最小二乘解
" # " #
T −1 T
1 0.432 0.77
^ = (𝐴 𝐴)
𝑥 𝐴 𝑏= ≈
0.56 0.38 0.68

4.4.3 Schmidt 正交化


(Schmidt正交化)将 𝑛 维 Euclid 空间 R𝑛 的任意一组基化成标准正交基.
过程 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 为 𝑛 维 Euclid 空间 R𝑛 的一组基,
先取
𝛼1
𝑞1 =
‖ 𝛼1 ‖
显然 ‖ 𝑞1 ‖= 1. 𝛼2 在 𝑞1 上的正交投影为 𝑞1 𝑞1T 𝛼2 , 取
118 第4章 线性空间与线性变换

𝛼2 − 𝑞1 𝑞1T 𝛼2
𝑞2 =
‖ 𝛼2 − 𝑞1 𝑞1T 𝛼2 ‖

显然 ‖ 𝑞2 ‖= 1, 且 𝑞2 ⊥𝑞1 . 𝛼3 在 span(𝑞1 , 𝑞2 ) 上的正交投影为 𝑞1 𝑞1T 𝛼3 + 𝑞2 𝑞2T 𝛼3 ,



𝛼3 − 𝑞1 𝑞1T 𝛼3 − 𝑞2 𝑞2T 𝛼3
𝑞3 =
‖ 𝛼3 − 𝑞1 𝑞1T 𝛼3 − 𝑞2 𝑞2T 𝛼3 ‖
显然 ‖ 𝑞3 ‖= 1, 且 𝑞3 ⊥𝑞1 , 𝑞3 ⊥𝑞2 .

继续上面的做法, 设已求得两两正交的单位向量组 𝑞1 , 𝑞2 , · · · , 𝑞𝑛−1 , 再求第 𝑛


个标准正交向量:

𝛼𝑛 − 𝑞1 𝑞1T 𝛼𝑛 − 𝑞2 𝑞2T 𝛼𝑛 − · · · − 𝑞𝑛−1 𝑞𝑛−1


T
𝛼𝑛
𝑞𝑛 =
‖ 𝛼𝑛 − 𝑞1 𝑞1T 𝛼𝑛 − 𝑞2 𝑞2T 𝛼𝑛 − · · · − 𝑞𝑛−1 𝑞𝑛−1
T
𝛼𝑛 ‖

由此得到的向量组 𝑞1 , 𝑞2 , · · · , 𝑞𝑛 即为所求的标准正交基.
例4.4.13 设 Euclid 空间 R4 中的向量
     
1 0 −2
 0   1   1 
     
𝛼1 =  

, 𝛼2 =  

, 𝛼3 = 
 
 1   2   0 

0 1 1

试求: (1) 上述向量组张成的子空间 span(𝛼1 , 𝛼2 , 𝛼3 ) 的一组标准正交基;

(2) 将此标准正交基扩充成 R4 的一组标准正交基.

解 (1)由
     
1 0 −2 1 0 −2 1 0 −2
𝑅3 −2𝑅2
 0 1 1   0 1 1   0 1 1 
     
𝑅3 −𝑅1 𝑅4 −𝑅2
[𝛼1 , 𝛼2 , 𝛼3 ] =   −−−−→   −−−−−→ 
    
 1 2 0   0 2 2   0 0 0 


0 1 1 0 1 1 0 0 0

知 𝛼1 , 𝛼2 为向量组 [𝛼1 , 𝛼2 , 𝛼3 ] 的一个极大无关组, 将其作为子空间 span(𝛼1 , 𝛼2 ,


𝛼3 ) 的一组基.

下面将 𝛼1 , 𝛼2 Schmidt正交化,
4.4 内 积 空 间 119

 
1
𝛼1 1  0 
 
𝑞1 = =√  
‖ 𝛼1 ‖ 2
 1 

     
0 1 −1
𝛼2 − 𝑞1 𝑞1T 𝛼2 1  1   0 1
 =  1
     
 
𝑞2 = =   − 
T
‖ 𝛼2 − 𝑞 1 𝑞 1 𝛼2 ‖ 2 
 2   1
   
 2
 1


1 0 1

所得向量组 𝑞1 , 𝑞2 就是子空间 span(𝛼1 , 𝛼2 , 𝛼3 ) 的一组标准正交基.


(2) 设 𝛼 = [𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 ]T ∈ R4 , 且𝛼 ⊥ 𝑞1 , 𝛼 ⊥ 𝑞2 , 即
(
𝛼T 𝑞1 = 𝑥1 + 𝑥3 = 0
𝛼T 𝑞2 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = 0

求此齐次线性方程组的基础解系, 得
   
0 −1
 −1   −2 
   
𝛼4 = 
 , 𝛼5 = 
 
 0   1 
 

1 0

将 𝛼4 , 𝛼5 Schmidt 正交化, 即令
 
0
𝛼4
1  −1 
 
𝑞3 = =√  
‖ 𝛼4 ‖ 2
 0 

     
−1 0 −1
𝛼5 − 𝑞3 𝑞3T 𝛼5 1  −2   −1 1
 =  −1
     
 
𝑞4 = =  − 
‖ 𝛼5 − 𝑞3 𝑞3T 𝛼5 ‖ 2 1   0
   
 2
 1


0 1 −1

所得向量组 𝑞1 , 𝑞2 , 𝑞3 , 𝑞4 就是 R4 的一组标准正交基.
120 第4章 线性空间与线性变换

4.4.4 正交补空间

前面已经给出了向量与向量正交的定义, 这里给出向量与空间正交、空间与
空间正交的定义.
定 义4.4.7 设 𝛼 是内积空间 𝑉 中的向量, 𝑊 是 𝑉 的子空间, 如果对于 𝑊
中任一个向量 𝛽, 都有𝛼⊥𝛽, 即⟨𝛼, 𝛽⟩ = 0, 则称向量 𝛼 与子空间 𝑊 正交, 记作
𝛼 ⊥ 𝑊.
定 义 4.4.8 设 𝑊1 , 𝑊2 是内积空间 𝑉 的两个子空间, 如果对于任意的向量
𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 , 都有 𝛼⊥𝛽, 即 ⟨𝛼, 𝛽⟩ = 0, 则称 𝑊1 与 𝑊2 正交, 记作 𝑊1 ⊥ 𝑊2 .
定理 4.4.3 若 𝑊1 ⊥ 𝑊2 , 则 𝑊1 ∩ 𝑊2 = {0}.

证明 对于任意 𝛼 ∈ 𝑊1 ∩ 𝑊2 , 有 𝛼 ∈ 𝑊1 , 𝛼 ∈ 𝑊2 .

由 𝑊1 ⊥ 𝑊2 , 得 ⟨𝛼, 𝛼⟩ = 0, 从而 𝛼 = 0.
定 义 4.4.9 设 𝑊1 , 𝑊2 是 内 积 空 间 𝑉 的 两 个 子 空 间, 如 果 𝑊1 ⊥ 𝑊2 , 且
𝑊1 + 𝑊2 = 𝑉 , 则称 𝑊2 是 𝑊1 的正 正交 补 , 记作 𝑊2 = 𝑊1⊥ .
正交补 空 间, 简称正

显然, 如果 𝑊2 是 𝑊1 的正交补空间, 那么 𝑊1 也是 𝑊2 的正交补空间.


例4.4.14 求 𝑚 × 𝑛 矩阵 𝐴 的零空间 N(𝐴) = {𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 的正交补
空间.
解 由 N(𝐴) 中的向量满足


 row(𝐴, 1)𝑥 = 0


 row(𝐴, 2)𝑥 = 0
 ······



row(𝐴, 𝑚)𝑥 = 0

知 矩 阵 𝐴 的 每 个 行 向 量 与 其 零 空 间 N(𝐴) 中 的 每 个 向 量 正 交, 记 C(𝐴T ) =
span(row(𝐴, 1), · · · , row(𝐴, 𝑚)), 则 N(𝐴) ⊆ R𝑛 , C(𝐴T ) ⊆ R𝑛 , 且 C(𝐴T )⊥N(𝐴),
所以 N(𝐴) ∩ C(𝐴T ) = {0}, dim N(𝐴) ∩ C(𝐴T ) = 0.

设 rank(𝐴) = 𝑟, 则 rank(𝐴T ) = 𝑟, 从而 dim N(𝐴) = 𝑛 − 𝑟, dim C(𝐴T ) = 𝑟, 由


维数公式得 dim(N(𝐴)+C(𝐴T )) = dim N(𝐴)+dimC(𝐴T )−dim(N(𝐴)∩C(𝐴T )) =
𝑛. 又因为 N(𝐴) + C(𝐴T ) ⊆ R𝑛 , 故 N(𝐴) + C(𝐴T ) = R𝑛 , 即 C(𝐴T ) 是 N(𝐴) 的正
交补空间: N(𝐴)⊥ = C(𝐴T ).

由上面的结论可以直接得到下面的推论.
推论 4.4.1 C(𝐴) 是 N(𝐴T ) 的正交补空间, 即 C(𝐴)⊥ = N(𝐴T ).
例4.4.15 设 𝛼1 , 𝛼2 , 𝛼3 和 𝛼 是 Euclid 空间 R5 中的向量,
4.4 内 积 空 间 121

       
1 1 2 3
       
 1   0   1   −7 
       
𝛼1 =  1  , 𝛼2 =  0  , 𝛼3 =  −1  , 𝛼= 2 
       
       
 2   1   0   1 
       
1 −2 2 8

求 span(𝛼1 , 𝛼2 , 𝛼3 ) 的正交补空间以及向量 𝛼 在 span(𝛼1 , 𝛼2 , 𝛼3 ) 中的正交投影.

解 设 𝐴 = [𝛼1 , 𝛼2 , 𝛼3 ], 则 C(𝐴) = span(𝛼1 , 𝛼2 , 𝛼3 ), 故

C(𝐴)⊥ = N(𝐴T ) = {𝑥|𝐴T 𝑥 = 0}

由此得到齐次线性方程组

 𝑥1 + 𝑥2 + 𝑥3 + 2𝑥4 + 𝑥5 = 0


𝑥 + 𝑥 − 2𝑥 = 0
1 4 5

 2𝑥 + 𝑥 − 𝑥 + 2𝑥 = 0

1 2 3 5

求出该齐次线性方程组的一个基础解系为

𝛼4 = [2, −1, 3, −2, 0]T , 𝛼5 = [4, −9, 3, 0, 2]T

则 𝛼4 , 𝛼5 构成 N(𝐴T ) 的一个基, 从而

C(𝐴)⊥ = span(𝛼4 , 𝛼5 )

下面求 𝛼 在 C(𝐴) 中的正交投影. 将 𝛼 用 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 , 𝛼5 线性表出, 得到

1 1
𝛼 = 𝛼1 − 2𝛼2 + 𝛼3 − 𝛼4 + 𝛼5
2 2

其中
1 1
𝛼1 − 2𝛼2 + 𝛼3 ∈ C(𝐴), − 𝛼4 + 𝛼5 ∈ C(𝐴)⊥
2 2
故求得 𝛼 在 C(𝐴) 中的正交投影为

1 • 3 1 ˜T
𝛼1 − 2𝛼2 + 𝛼3 = 0, , , 0, 6
2 2 2
122 第4章 线性空间与线性变换

注 例 4.4.15 中 𝛼1 , 𝛼2 , 𝛼3 线性无关, 因此 𝛼 在 C(𝐴) = span(𝛼1 , 𝛼2 , 𝛼3 ) 中


的正交投影也可利用 4.4.2 节中的正交投影公式 𝐴(𝐴T 𝐴)−1 𝐴T 𝛼 直接计算得到.

4.5 线 性 变 换

4.5.1 线性映射与线性变换
定义 4.5.1 设 𝑇 是数域 F 上的线性空间 𝑉 到线性空间 𝑊 的映射, 对于 𝑉 中
任意两个向量 𝛼, 𝛽, 如果满足下列条件:
(1) 𝑇 ( 𝛼 + 𝛽 )= 𝑇 ( 𝛼 )+ 𝑇 ( 𝛽 );
(2) 𝑇 (𝑘𝛼) = 𝑘𝑇 (𝛼) (𝑘 ∈ F),
则称 𝑇 为线
线性 映射 , 称 𝑇 (𝛼) 为 𝛼 在线性映射 𝑇 下的像
像.
特别地, 从线性空间 𝑉 到其自身的线性映射 𝑇 称为线性空间 𝑉 的一个线
线性
变 换 , 即对于任意 𝛼 ∈ 𝑉 , 有 𝑇 (𝛼) ∈ 𝑉 .
设 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 是 𝑉 中的向量, 在映射 𝑇 下的像分别为 𝑇 (𝛼1 ), 𝑇 (𝛼2 ), · · · ,
𝑇 (𝛼𝑚 ), 为方便起见, 通常记 𝑇 (𝛼1 , 𝛼2 , · · · , 𝛼𝑚 ) , [𝑇 (𝛼1 ), 𝑇 (𝛼2 ), · · · , 𝑇 (𝛼𝑚 )] .
性质 4.5.1 设 𝑇 是线性空间 𝑉 中的线性变换, 则 𝑇 (0) = 0.
证明 因为 𝑇 (𝑘𝛼) = 𝑘𝑇 (𝛼), 取 𝑘 = 0 时, 即得

𝑇 (0) = 𝑇 (0 · 𝛼) = 0 · 𝑇 (𝛼) = 0

性 质4.5.2 设 𝑇 是线性空间 𝑉 中的线性变换, 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 是 𝑉 中的 𝑚


个向量, 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑚 ]T , 则

𝑇 ([𝛼1 , 𝛼2 , · · · , 𝛼𝑚 ]𝑥) = 𝑇 (𝛼1 , 𝛼2 , · · · , 𝛼𝑚 )𝑥

证明

𝑇 ([𝛼1 , 𝛼2 , · · · , 𝛼𝑚 ]𝑥) = 𝑇 (𝑥1 𝛼1 + 𝑥2 𝛼2 + · · · + 𝑥𝑚 𝛼𝑚 )


= 𝑥1 𝑇 (𝛼1 ) + 𝑥2 𝑇 (𝛼2 ) + · · · + 𝑥𝑚 𝑇 (𝛼𝑚 )
= 𝑇 (𝛼1 , 𝛼2 , · · · , 𝛼𝑚 )𝑥

定 理 4.5.1 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维线性空间 𝑉 的一组基, 对于 𝑉 中任意


𝑛 个向量 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 存在唯一的线性变换 𝑇 使得

𝑇 (𝜀𝑖 ) = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)
4.5 线 性 变 换 123

𝑛
X
证明 设 𝜉 是 𝑉 中任一向量, 则有 𝜉 = 𝑥𝑖 𝜀𝑖 . 在 𝑉 中定义一个变换 𝑇 , 使
𝑖=1

𝑛
X
𝑇 (𝜉) = 𝑥𝑖 𝛼𝑖
𝑖=1

显然
𝜀𝑖 = 0 · 𝜀1 + · · · + 0 · 𝜀𝑖−1 + 1 · 𝜀𝑖 + 0 · 𝜀𝑖+1 + · · · + 0 · 𝜀𝑛

因此
𝑇 (𝜀𝑖 ) = 1 · 𝛼𝑖 = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)

下面先证明此变换是线性变换.

在 𝑉 中任取两个向量

𝑛
X 𝑛
X
𝛼= 𝑎𝑖 𝜀𝑖 , 𝛽= 𝑏𝑖 𝜀𝑖
𝑖=1 𝑖=1


𝑛
X 𝑛
X
𝛼+𝛽 = (𝑎𝑖 + 𝑏𝑖 )𝜀𝑖 , 𝑘𝛼 = 𝑘𝑎𝑖 𝜀𝑖
𝑖=1 𝑖=1

由 𝑇 的定义有
𝑛
X 𝑛
X 𝑛
X
𝑇 (𝛼 + 𝛽) = (𝑎𝑖 + 𝑏𝑖 )𝛼𝑖 = 𝑎𝑖 𝛼𝑖 + 𝑏𝑖 𝛼𝑖 = 𝑇 (𝛼) + 𝑇 (𝛽)
𝑖=1 𝑖=1 𝑖=1

𝑛
X
𝑇 (𝑘𝛼) = 𝑘𝑎𝑖 𝛼𝑖 = 𝑘𝑇 (𝛼)
𝑖=1

于是可知 𝑇 是线性变换, 接下来证明它是唯一的. 假设还有线性变换 𝑇1 , 使


𝑇1 (𝜀𝑖 ) = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛), 则对任意向量 𝜉 有

𝑇1 (𝜉) = 𝑥1 𝑇1 (𝜀1 ) + 𝑥2 𝑇1 (𝜀2 ) + · · · + 𝑥𝑛 𝑇1 (𝜀𝑛 )


= 𝑥1 𝛼1 + 𝑥2 𝛼2 + · · · + 𝑥𝑛 𝛼𝑛
= 𝑥1 𝑇 (𝜀1 ) + 𝑥2 𝑇 (𝜀2 ) + · · · + 𝑥𝑛 𝑇 (𝜀𝑛 )
= 𝑇 (𝜉)

故必有𝑇 = 𝑇1 .
124 第4章 线性空间与线性变换

4.5.2 线性变换的表示矩阵

设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是线性空间 𝑉 的一组基, 𝑇 是 𝑉 的一个线性变换, 如果基


𝜀1 , 𝜀2 , · · · , 𝜀𝑛 在线性变换 𝑇 下的像为 𝑇 (𝜀1 ), 𝑇 (𝜀2 ), · · · , 𝑇 (𝜀𝑛 ), 则有


 𝑇 (𝜀1 ) = 𝑎11 𝜀1 + 𝑎21 𝜀2 + · · · + 𝑎𝑛1 𝜀𝑛

 𝑇 (𝜀 ) = 𝑎 𝜀 + 𝑎 𝜀 + · · · + 𝑎 𝜀

2 12 1 22 2 𝑛2 𝑛


 · · · · · ·

𝑇 (𝜀𝑛 ) = 𝑎1𝑛 𝜀1 + 𝑎2𝑛 𝜀2 + · · · + 𝑎𝑛𝑛 𝜀𝑛

下面我们引入线性变换表示矩阵的定义.
定 义4.5.2 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是线性空间 𝑉 的一组基, 𝑇 是线性空间 𝑉 的一
个线性变换, 基的像可以表示为

𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ) = [𝑇 (𝜀1 ), 𝑇 (𝜀2 ), · · · , 𝑇 (𝜀𝑛 )]


 
𝛼11 𝛼12 · · · 𝛼1𝑛
 
 𝛼21 𝛼22 · · · 𝛼2𝑛 
= [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]  .
 
 .. .. .. 
 . . 

𝛼𝑛1 𝛼𝑛2 · · · 𝛼𝑛𝑛

其中矩阵  
𝛼11 𝛼12 · · · 𝛼1𝑛
 
 𝛼21
 𝛼22 · · · 𝛼2𝑛 

 . .. ..
 ..

 . . 

𝛼𝑛1 𝛼𝑛2 · · · 𝛼𝑛𝑛

称为线性变换 𝑇 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的表
表示 矩 阵 .
定理 4.5.2 在给定基下, 线性变换与其表示矩阵是一一对应的.

证明 对于任一个 𝑛 阶矩阵 𝐴, 给定线性空间 𝑉 的一组基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 , 令

[𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ]

则 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 由 𝐴 唯一确定.由 4.5.1 节定理知, 存在唯一的线性变换 𝑇 使得

𝑇 (𝜀𝑖 ) = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)
4.5 线 性 变 换 125

即有唯一的线性变换 𝑇 , 使

𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ) = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴

反过来, 由于在给定的基下向量的坐标是唯一确定的, 因此在给定的基下, 线


性变换 𝑇 的表示矩阵也是唯一的.
综上, 在给定基下, 线性变换 𝑇 与表示矩阵 𝐴 是一一对应的.
例4.5.1 设旋转变换 𝑇𝜃 将平面绕原点按逆时针方向旋转 𝜃 角, 求 𝑇𝜃 在直角
坐标系下的表示矩阵.
解 向量 𝑖, 𝑗 分别为直角坐标系 𝑥 轴与 𝑦 轴上的单位向量, 如图 4.2 所示.

图 4.2

因为 𝑇𝜃 (𝑖) = cos 𝜃𝑖 + sin 𝜃𝑗, 𝑇𝜃 (𝑗) = − sin 𝜃𝑖 + cos 𝜃𝑗, 所以


" #
cos 𝜃 − sin 𝜃
𝑇 (𝑖, 𝑗) = [𝑇 (𝑖), 𝑇 (𝑗)] = [𝑖, 𝑗]
sin 𝜃 cos 𝜃

从而旋转变换的表示矩阵
" #
cos 𝜃 − sin 𝜃
𝐴=
sin 𝜃 cos 𝜃

例4.5.2 设 𝑇 是线性空间 R3 中的线性变换, 𝜀1 , 𝜀2 , 𝜀3 为 R3 的一组基


     
2 0 1
     
𝜀1 = 
 3 ,
 𝜀2 = 
 1 ,
 𝜀3 = 
 0 

5 2 0
126 第4章 线性空间与线性变换

如果
     
1 1 2
     
𝑇 (𝜀1 ) = 
 1 ,
 𝑇 (𝜀2 ) = 
 1 ,
 𝑇 (𝜀3 ) = 
 1 

1 −1 2

求线性变换 𝑇 在基 𝜀1 , 𝜀2 , 𝜀3 下的表示矩阵.
解 设所求变换矩阵为 𝐴,

[𝑇 (𝜀1 ), 𝑇 (𝜀2 ), 𝑇 (𝜀3 )] = [𝜀1 , 𝜀2 , 𝜀3 ]𝐴


   
1 1 2 2 0 1
   
 =  3 1 0 𝐴
 1 1
1   

1 −1 2 5 2 0

由此解得  
1 3 0
 
 −2 −8 1 
𝐴= 
−1 −5 2

定 理 4.5.3 设线性变换 𝑇 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的表示矩阵是 𝐴, 向量 𝜉 在


基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 则 𝑇 (𝜉) 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下
的坐标为 𝐴𝑥.
证明 由题设, 向量 𝜉 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 𝑥, 故

𝜉 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑥

因为 𝑇 是线性变换

𝑇 (𝜉) = 𝑇 ([𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑥)


= 𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 )𝑥
= [𝑇 (𝜀1 ), 𝑇 (𝜀2 ), · · · , 𝑇 (𝜀𝑛 )]𝑥
= [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴𝑥

所以 𝑇 (𝜉) 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 𝐴𝑥.


定 理 4.5.4 设 线 性 变 换 𝑇 在 线 性 空 间 𝑉 的 两 组 基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 和
𝜂1 ,𝜂2 , · · · , 𝜂𝑛 下的表示矩阵分别是 𝐴 和 𝐵, 从基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 到基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛
的过渡矩阵为 𝑀 , 则 𝐵 = 𝑀 −1 𝐴𝑀 .
4.5 线 性 变 换 127

证明 由题设

𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ) = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴

𝑇 (𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ) = [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝐵

[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀

因为 𝑇 是线性变换

𝑇 (𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ) = 𝑇 ([𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 ) = 𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 )𝑀


= [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴𝑀 = [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝑀 −1 𝐴𝑀

由此得到 𝐵 = 𝑀 −1 𝐴𝑀 .
定 义 4.5.3 对 于 𝑛 阶 矩 阵 𝐴 和 𝐵, 若 存 在 一 个 𝑛 阶 可 逆 矩 阵 𝑃 , 使 得
−1
𝑃 𝐴𝑃 = 𝐵, 则称矩阵 𝐴 与 𝐵 相似 , 记作 𝐴 ∼ 𝐵.
注 前面的定理表明, 同一线性变换在不同基下的表示矩阵相似; 两个相似
的方阵可以看作是同一线性变换在不同基下的表示矩阵.

4.5.3 正交变换
定 义4.5.4 设 𝑇 是 Euclid 空间 𝑉 中的一个线性变换, 如果 𝑇 在标准正交基
下的表示矩阵是正交矩阵, 则称 𝑇 是正
正交 变 换 .
定理 4.5.5 正交变换保持向量的内积不变.
证明 设线性变换 𝑇 在某标准正交基下的表示矩阵是 𝑄, 则 𝑄𝑄T = 𝐼.
向量 𝛼 与 𝛽 在该标准正交基下的坐标向量是 𝑥 与 𝑦, 内积是 𝑥T 𝑦. 向量
𝛼 与 𝛽 经正交变换后在该标准正交基下的坐标向量是 𝑄T 𝑥 与 𝑄T 𝑦, 内积是
(𝑄T 𝑥)T (𝑄T 𝑦).
因为 (𝑄T 𝑥)T (𝑄T 𝑦) = 𝑥T 𝑄𝑄T 𝑦 = 𝑥T 𝐼𝑦 = 𝑥T 𝑦, 故正交变换保持向量的内
积不变.
注 正 交 变 换 保 持 向 量 的 内 积 不 变, 因 而 它 保 持 向 量 的 模 长 不 变, 即
‖𝑇 (𝛼)‖ = ‖𝛼‖, 且若 𝛼 ⊥ 𝛽, 则 𝑇 (𝛼) ⊥ 𝑇 (𝛽).
例4.5.3 二维 Euclid 空间 R2 中的旋转变换 𝑇𝜃 将平面绕坐标原点按逆时针
方向旋转 𝜃 角, 它在标准正交基 𝑒1 = [1, 0]T , 𝑒2 = [0, 1]T 下的表示矩阵为正交矩阵
" #
cos 𝜃 − sin 𝜃
𝐴=
sin 𝜃 cos 𝜃

因此旋转变换 𝑇𝜃 是正交变换.
128 第4章 线性空间与线性变换

例4.5.4 在平面上取定一个直角坐标系, 把每个向量对 𝑥 轴作一次反射, 即


" #! " #
𝑥 𝑥
𝑇 =
𝑦 −𝑦

这是一个线性变换, 它在标准正交基 𝑒1 = [1, 0]T , 𝑒2 = [0, 1]T 下的表示矩阵为正


交矩阵
" #
1 0
𝐴=
0 −1

因此反射变换也是正交变换.
例4.5.5 5 设 𝑢 为 𝑛 元单位列向量, 𝐼𝑛 是 𝑛 阶单位阵, 则 𝑀 = 𝐼𝑛 − 2𝑢𝑢T 是
正交阵. 设 𝑥 是 𝑛 元列向量, 线性变换 𝑀 𝑥 称为镜像变换.

4.6 习 题

1. 在次数不大于 2 的多项式线性空间 𝑃2 [𝑥] 中, 试证: 𝑓1 = 1, 𝑓2 = 𝑥−1, 𝑓3 = (𝑥−2)(𝑥−1)


线性无关.

2. 证明: 以下三个多项式为 𝑃2 [𝑥] 的一组基;

𝑓1 = 1, 𝑓2 = 𝑥 − 1, 𝑓3 = (𝑥 − 1)2

再求 𝑔(𝑥) = 5𝑥2 + 𝑥 + 3 在此基下的坐标.

3. 在次数不大于 3 的多项式空间 𝑃3 [𝑥] 中,

(1) 求由基 1, 𝑥, 𝑥2 , 𝑥3 到基 1, 1+ 𝑥, (1 + 𝑥)2 , (1 + 𝑥)3 的过渡矩阵.

(2) 𝑓 (𝑥) = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥2 + 𝑎3 𝑥3 在基 1, 1+ 𝑥, (1 + 𝑥)2 , (1 + 𝑥)3 下的坐标.

4. 在 𝑃3 [𝑥] 的多项式空间中, 旧基为 1, 𝑥, 𝑥2 , 𝑥3 ; 新基为 1, 1 + 𝑥, 1 + 𝑥 + 𝑥2 , 1 + 𝑥 + 𝑥2 + 𝑥3 .

(1) 求旧基到新基的过渡矩阵;

(2) 求多项式 1 + 2𝑥 + 3𝑥2 + 4𝑥3 在新基下的坐标;

(3) 若多项式 𝑓 (𝑥) 在新基下的坐标为 [1,2,3,4]T , 求它在旧基下的坐标.

5. 已知 𝜉 在基 𝐵1 = {𝛼1 , 𝛼2 , 𝛼3 } 下的坐标为 𝜉𝐵1 = [1, −2, 2]T , 求 𝜉 在基 𝐵2 = {𝛽1 , 𝛽2 ,


𝛽3 } 下的坐标 𝜉𝐵2 , 其中 𝛽1 = 𝛼1 + 𝛼2 , 𝛽2 = 𝛼2 + 𝛼3 , 𝛽3 = 𝛼3 + 𝛼1 .
4.6 习 题 129

6. 设 𝜀1 , 𝜀2 , 𝜀3 是线性空间 𝑉 的一组基, 且


 𝜉1 = 𝜀1 + 𝜀3

𝜉2 = 𝜀2

𝜉3 = 𝜀1 + 2𝜀2 + 2𝜀3


 𝜂1 = 𝜀1

𝜂2 = 𝜀1 + 𝜀2

𝜂3 = 𝜀1 + 𝜀2 + 𝜀3

(1) 试证 𝜉1 , 𝜉2 , 𝜉3 及 𝜂1 , 𝜂2 , 𝜂3 都是 𝑉 的一组基.
(2) 求由基 𝜉1 , 𝜉2 , 𝜉3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵.
7. 在线性空间 R2×2 中, 已知

– ™ – ™ – ™ – ™
1 0 0 1 0 0 0 0
𝛼1 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 0 1

为其一组基. 若 R2×2 的另一组基为 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 , 由 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 到 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 的过渡


矩阵为
 
0 1 1 1
 1 0 1 1 
𝐴 =
 

 1 1 0 1 
1 1 1 0

求: (1) 基 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 ;
(2) 矩阵 – ™
0 1
2 −3

在基 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 下的坐标.
8.已知实数域 R 上的所有 2 阶矩阵, 对于矩阵的加法与数乘, 构成 R 上的四维线性空间, 记
作 𝑉 = R2×2 .
(1) 分别证明

– ™ – ™ – ™ – ™
1 0 1 1 1 1 1 1
𝛼2 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 1 1

– ™ – ™ – ™ – ™
−1 1 1 −1 1 1 1 1
𝛽1 = , 𝛽2 = , 𝛽3 = , 𝛽4 =
1 1 1 1 −1 1 1 −1
130 第4章 线性空间与线性变换

均为 R2×2 的基;
(2) 对于 R2×2 中的任意元素 𝛼, 求 𝛼 在基 𝛼1 ,𝛼2 , 𝛼3 ,𝛼4 下的坐标;
(3) 求由基 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 到 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 的过渡矩阵.
9. 求下列两个齐次线性方程组的解空间的基和维数:
(1) 𝑥1 + 𝑥2 + · · · + 𝑥𝑛 = 0;
(2) 
 2𝑥1 − 4𝑥2 + 5𝑥3 + 3𝑥4 = 0

3𝑥1 − 6𝑥2 + 4𝑥3 + 2𝑥4 = 0

4𝑥1 − 8𝑥2 + 17𝑥3 + 11𝑥4 = 0

10. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 是 𝑛 维线性空间 𝑉 的一组基, 又 𝑉 中向量 𝛼𝑛+1 在这组基下坐标


(𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ) 全不为零.证明 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛼𝑛+1 中任意 𝑛 个向量必构成 𝑉 的一组基, 并求
𝛼1 在基 𝛼2 ,· · · , 𝛼𝑛 , 𝛼𝑛+1 下的坐标.
11.设 Kn×n 为数域 K 上全体 n 阶方阵构成的 n2 维线性空间, 又 𝐴 ∈ Kn×n .
(1)证明: Kn×n 中与 𝐴 可交换(即 𝐴𝐵 = 𝐵𝐴, 称 𝐴 与 𝐵 可交换)的全体方阵构成子空间(这
个子空间记为 W(𝐴)).
(2)问: 当 𝐴 是主对角线上元素为 a1 , · · · , an ( ai ∈K 且互异) 的对角阵时, W(𝐴) 是几维的?
并给出其一基.
12. 设 𝑉1 , 𝑉2 是 R𝑛 的两个非平凡子空间, 证明: 在 R𝑛 中存在向量 𝛼, 使 𝛼 ∈
/ 𝑉1 , 且 𝛼 ∈
/
𝑉2 , 并在 R3 中举例说明此结论.
13. 设 𝛼, 𝛽, 𝛾 ∈ R𝑛 , 𝑐1 , 𝑐2 , 𝑐3 ∈ R, 且 𝑐1 𝑐3 ̸= 0, 证明: 若 𝑐1 𝛼 + 𝑐2 𝛽 + 𝑐3 𝛾 = 0, 则 span(𝛼,
𝛽 )=span(𝛽, 𝛾 ).
14. 若 – ™
1 1 1 0
𝐴=
2 1 0 1

求 𝐴 的零空间 N(𝐴)的一组基.
15. 令 𝐴 和 𝐵 为 𝑛 × 𝑛 矩阵.
(1) 证明: 当且仅当 𝐵 的列空间是 𝐴 的零空间的子空间时, 有 𝐴𝐵 = 𝑂;
(2) 证明: 若 𝐴𝐵 = 𝑂, 则 𝐴 和 𝐵 的秩的和不会超过 𝑛.
16. 已知向量组 𝛼1 = [2, 0, 1, 3, −1]T , 𝛼2 = [0, −2, 1, 5, −3]T , 𝛽1 = [1, 1, 0, −1, 1]T , 𝛽2 =
[1, −3, 2, 0, 5]T , 且 𝑊1 = span(𝛼1 , 𝛼2 ), 𝑊2 = span(𝛽1 , 𝛽2 ), 试求 𝑊1 ∩ 𝑊2 与 𝑊1 + 𝑊2 的维数
及各自的一组基.
17. 设 𝑉 是内积空间. 试证明:
(1) 对 ∀𝛼 ∈ 𝑉 , 都有 ⟨0, 𝛼⟩ = 0;
(2) 若对 ∀𝛼 ∈ 𝑉 , 恒有 ⟨𝛼, 𝛽⟩ = 0, 则 𝛽 = 0;
(3) 已知 𝛼, 𝛽 ∈ 𝑉 , 如对 ∀ 𝛾 ∈ 𝑉 , 都有 ⟨𝛼, 𝛾⟩ = ⟨𝛽, 𝛾⟩. 试证明 𝛼 = 𝛽.
18. 设 𝛼 = [𝑎1 , 𝑎2 , 𝑎3 ]T ∈ R3 , 𝛽 = [𝑏1 , 𝑏2 , 𝑏3 ]T ∈ R3 , 定义内积 ⟨𝛼, 𝛽⟩ = 𝛼T 𝐴𝛽. 当 𝐴 取以
4.6 习 题 131

下哪个矩阵时, 使 R3 成为 Euclid 空间.

 
1 0 0
𝐴1 =  0 2 0 
 

0 0 1

 
1 −1 1
𝐴2 =  −1 1 0 
 

1 0 0
 
1 −1 3
𝐴3 =  −1 2 0 
 

1 0 3

19. 在 R2 中,设 𝛼 = [𝑎1 , 𝑎2 ]T , 𝛽 = [𝑏1 , 𝑏2 ]T , 令

⟨𝛼, 𝛽⟩ = 𝑎1 𝑏1 − 𝑎2 𝑏1 − 𝑎1 𝑏2 + 3𝑎2 𝑏2

试验证这是 R2 的一个内积.
20. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 是内积空间的 𝑛 个向量, 行列式


⟨𝛼 , 𝛼 ⟩ ⟨𝛼 , 𝛼 ⟩ · · · ⟨𝛼 , 𝛼 ⟩
1 1 1 2 1 𝑛

⟨𝛼2 , 𝛼1 ⟩ ⟨𝛼2 , 𝛼2 ⟩ · · · ⟨𝛼2 , 𝛼𝑛 ⟩
𝐺(𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ) =

.. .. ..

. . .


⟨𝛼𝑛 , 𝛼1 ⟩ ⟨𝛼𝑛 , 𝛼2 ⟩ · · · ⟨𝛼𝑛 , 𝛼𝑛 ⟩

称 为 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 的 Gram 行 列 式.证 明 𝐺(𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ) = 0 的 充 分 必 要 条 件 是 𝛼1 ,


𝛼2 , · · · , 𝛼𝑛 线性相关.
21. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关, 𝛽1 , 𝛽2 也线性无关, 且后者与前者中的每个向量都正交, 证
明: 𝛽1 , 𝛽2 , 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 也线性无关.
22. 试把 [1, 0, 1, 0]T , [0, 1, 0, 2]T 扩充成为 R4 的一组标准正交基.
23. 已知 𝑓1 = 1, 𝑓2 = 𝑥 − 1, 𝑓3 = (𝑥 − 1)2 为三维内积空间 𝐶[0, 1] 的一组基, 内积定义为

Z 1
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)dx
0

利用 Schmidt 正交化方法, 求与 𝑓1 , 𝑓2 , 𝑓3 等价的一组标准正交基(两个向量组可相互线性表出称


为等价).
24. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 与 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 为 𝑛 维欧氏空间的两组基, 其中 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 为
132 第4章 线性空间与线性变换

标准正交基, 又若由 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 到 𝛽1 , 𝛽2 , · · · , 𝛽𝑛 的过渡矩阵为 𝑀 , 证明: 𝛽1 , 𝛽2 , · · · , 𝛽𝑛


为 𝑉 的标准正交基的充分必要条件是 𝑀 为正交矩阵.
25. 求下列线性方程组的最小二乘解.


 𝑥1 + 𝑥2 = 1

2𝑥1 − 𝑥2 = 2

−2𝑥1 + 4𝑥2 = 7

26. 设
   
1 2 −1 −1
 2 0 1   1 
𝐴= , 𝑏=
   

 2 −4 2   1 
4 0 0 −2

问线性方程组 𝐴𝑥 = 𝑏 是否有解?如果无解, 求其最小二乘解.


27. 求向量 𝑏 在矩阵 𝐴 的列空间中的正交投影.

   
1 −2 −4
 1 0   −3 
𝐴= , 𝑏=
   

 1 1   3 
1 3 0

28. 设齐次线性方程组

¨
2𝑥1 + 𝑥2 − 𝑥3 + 𝑥4 − 3𝑥5 = 0
𝑥1 + 𝑥2 − 𝑥3 + 𝑥5 = 0

(1) 求解空间的标准正交基;
(2) 求解空间的正交补空间的标准正交基.
29. 设 𝛼1 , 𝛼2 和 𝛼 是 Euclid 空间 R3 中的向量,

     
1 1 3
𝛼1 =  1  , 𝛼2 =  0  , 𝛼= 2 
     

2 1 1

求 span(𝛼1 , 𝛼2 ) 的正交补空间以及向量 𝛼 分别在 span(𝛼1 , 𝛼2 ) 及其正交补空间中的正交投影.


30. 设 𝑇 是线性空间 K𝑛×𝑛 的如下变换;

𝑇 (𝐴) = 𝐶𝐴 − 𝐴𝐶 (𝐶 ∈ K𝑛×𝑛 , ∀𝐴 ∈ K𝑛×𝑛 )


4.6 习 题 133

证明: 𝑇 是 K𝑛×𝑛 的线性变换且

𝑇 (𝐴𝐵) = 𝑇 (𝐴)𝐵 + 𝐴𝑇 (𝐵)

31.已知在 R3 中, 线性变换 𝑇 在基
     
8 −16 9
𝜀1 =  −6  , 𝜀2 =  7 , 𝜀3 =  −3 
     

7 −13 7

下的表示矩阵
 
1 −18 15
𝐴 =  −1 −22 20 
 

1 −25 22

求 𝑇 在基
     
1 3 2
𝜂1 =  −2  , 𝜂2 =  −1  , 𝜂3 =  1 
     

1 2 2

下的表示矩阵.
(𝑥 − 𝑎)2 (𝑥 − 𝑎)𝑛
32. 在 𝑃𝑛 [𝑥] 中, 取基为 𝜀0 = 1, 𝜀1 = (𝑥 − 𝑎), 𝜀2 =
, · · · , 𝜀𝑛 = (其中 𝑎 为
2! 𝑛!

实数), 求线性变换𝐷(𝑓 (𝑥)) = 𝑓 (𝑥) 在此基下的表示矩阵.
33. 给定 R3 的两组基 𝜀1 = [1, 0, 1]T , 𝜀2 = [2, 1, 0]T , 𝜀3 = [1, 1, 1]T 和 𝜂1 = [1, 2, −1]T ,
𝜂2 = [2, 2, −1]T , 𝜂3 = [2, −1, −1]T , 定义线性变换: 𝑇 (𝜀𝑖 ) = 𝜂𝑖 , 𝑖 =1,2,3, 分别求 𝑇 在基 𝜀1 , 𝜀2 ,
𝜀3 与 𝜂1 , 𝜂2 , 𝜂3 下的表示矩阵.
34. 在实数域上所有 2 阶矩阵所构成的线性空间 R2×2 中, 定义变换 𝑇 (𝛼) = 𝛾𝛼 − 𝛼𝛾, 其
中 𝛼 为 R2×2 中任意一个元素(矩阵), 𝛾 为 R2×2 中一个固定的元素(矩阵).
(1) 证明: 𝑇 是 R2×2 上的一个线性变换;
(2) 对于 R2×2 的一组基

– ™ – ™ – ™ – ™
1 0 0 1 0 0 0 0
𝛼1 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 0 1

求 𝑇 在这组基下的表示矩阵.
第5章 特征值与二次型

5.1 特征值与特征向量

5.1.1 特征值与特征向量的概念

定 义5.1.1 设 𝐴 是 𝑛 阶方阵, 𝑥 是 𝑛 元非零向量, 如果满足𝐴𝑥 = 𝜆𝑥, 则数 𝜆


称为方阵 𝐴 的特
特征 值(eigen value), 非零向量 𝑥 称为方阵 𝐴 的属于特征值 𝜆 的特

征 向 量(eigen vector).
我们知道, 在线性空间中取定基后, 线性变换 𝑇 与它的表示矩阵 𝐴 是一一对
应的, 向量与它的坐标是一一对应的. 因此, 定义 5.1.1 中方阵 𝐴 可看作某个线性
变换在特定基下的表示矩阵, 𝑥 可看作某个向量在同一基下的坐标, 𝐴𝑥 可看作线
性变换后的坐标.
从几何上看, 特征向量的方向经过线性变换后保持在同一直线上, 或者方向不
变 (𝜆 > 0), 或者方向相反 (𝜆 < 0), 或者变换成零向量 (𝜆 = 0).
定理 5.1.1 一个特征向量只能属于一个特征值.
证明 假定有一个非零向量 𝑥 属于两个特征值 𝜆1 , 𝜆2 , 则有 𝐴𝑥 = 𝜆1 𝑥, 𝐴𝑥 =
𝜆2 𝑥, 从而 𝜆1 𝑥 = 𝜆2 𝑥, 即 (𝜆1 − 𝜆2 )𝑥 = 0. 又因为 𝑥 ̸= 0, 所以 𝜆1 = 𝜆2 .
注 (1) 如果 𝑥1 , 𝑥2 是方阵 𝐴 的属于特征值 𝜆 的两个特征向量, 则当 𝑥1 +𝑥2 ̸=
0 时, 𝑥1 + 𝑥2 也是属于 𝜆 的特征向量, 这是因为 𝐴(𝑥1 + 𝑥2 ) = 𝐴𝑥1 + 𝐴𝑥2 =
𝜆𝑥1 + 𝜆𝑥2 = 𝜆(𝑥1 + 𝑥2 ).
(2) 如果 𝑥 是方阵 𝐴 的属于特征值 𝜆 的特征向量, 则 𝑘𝑥 (𝑘是非零常数)也是
属于 𝜆 的特征向量, 这是因为 𝐴(𝑘𝑥) = 𝑘𝐴𝑥 = 𝑘𝜆𝑥 = 𝜆(𝑘𝑥). 如果把方阵 𝐴 的属
于 𝜆 的全部特征向量和零向量组成一个集合, 那么它对加法、数乘封闭, 构成一个
子空间. 因此, 有下面的定义.
定 义5.1.2 方阵 𝐴 的属于 𝜆 的全部特征向量和零向量组成的子空间称为方
阵 𝐴 的属于特征值 𝜆 的特
特征 子 空 间 .
当 𝜆 是方阵 𝐴 的一个特征值时, 𝐴 的属于特征值 𝜆 的特征向量有无穷多个,
我们只要求出属于 𝜆 的特征子空间的一组基也就相当于求出它们的全体了.
5.1 特征值与特征向量 135

5.1.2 特征值与特征向量的求法

设 𝑛 阶方阵 𝐴 的特征值是 𝜆, 相应的特征向量是非零向量 𝑥, 𝐴𝑥 = 𝜆𝑥, 即


(𝜆𝐼 − 𝐴)𝑥 = 0, 且 𝑥 ̸= 0. 由齐次方程组 (𝜆𝐼 − 𝐴)𝑥 = 0 有非零解的充要条件得

𝜆 − 𝑎11 −𝑎12 ··· −𝑎1𝑛



−𝑎 𝜆 − 𝑎22 · · · −𝑎2𝑛
21
|𝜆𝐼 − 𝐴| = .. .. ..
=0


. . .

−𝑎𝑛1 −𝑎𝑛2 · · · 𝜆 − 𝑎𝑛𝑛

显然, |𝜆𝐼 − 𝐴| 是关于 𝜆 的 𝑛次多项式, 称为 𝐴 的特


特征 多 项 式. 方程 |𝜆𝐼 − 𝐴| = 0
的根即为 𝐴 的特征值, 将求得的特征值 𝜆 代入线性方程组(𝜆𝐼 − 𝐴)𝑥 = 0, 其非零
解即为 𝐴 的特征向量.
对于 𝑛 阶实矩阵 𝐴, 其特征多项式是关于 𝜆 的 𝑛 次实系数多项式, 但方程
|𝜆𝐼 − 𝐴| = 0 可能出现虚根, 即 𝐴 的特征值可能不是实数而是虚数. 我们知道, 一
个 𝑛 次多项式在复数域内恰有 𝑛 个根(重根按重数计算), 因此 𝑛 阶实矩阵 𝐴 的特
征值有 𝑛 个(重复的算多个).
定 理 5.1.2 方阵 𝐴 的全体特征根(重根在内)之和等于它的迹 tr(𝐴), 而全体
特征根的乘积等于它的行列式 det(𝐴).
证明 设 𝑛 阶方阵 𝐴 的全体特征根(重根在内)为 𝜆1 , 𝜆2 , · · · , 𝜆𝑛 , 考察方阵 𝐴
的特征多项式 |𝜆𝐼 − 𝐴|, 一方面

𝜆 − 𝑎11 −𝑎12 ··· −𝑎1𝑛



−𝑎 𝜆 − 𝑎22 · · · −𝑎2𝑛
21
|𝜆𝐼 − 𝐴| = .. .. ..



. . .

−𝑎𝑛1 −𝑎𝑛2 · · · 𝜆 − 𝑎𝑛𝑛

= 𝜆𝑛 − (𝑎11 + 𝑎22 + · · · + 𝑎𝑛𝑛 )𝜆𝑛−1 + · · · + (−1)𝑛 det(𝐴)


= 𝜆𝑛 − (tr(A))𝜆n−1 + · · · + (−1)n det(A)

另一方面

|𝜆𝐼 − 𝐴| = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) · · · (𝜆 − 𝜆𝑛 )
= 𝜆𝑛 − (𝜆1 + 𝜆2 + · · · + 𝜆𝑛 )𝜆𝑛−1 + · · · + (−1)𝑛 𝜆1 𝜆2 · · · 𝜆𝑛

因此 𝜆1 + 𝜆2 + · · · + 𝜆𝑛 = tr(A), 𝜆1 𝜆2 · · · 𝜆n = det(A).
136 第5章 特征值与二次型

例5.1.1 求矩阵  
−1 1 0
 
𝐴=
 −4 3 0 

1 0 2

的特征值和特征向量.

解 由特征多项式

𝜆+1
−1 0


|𝜆𝐼 − 𝐴| = 4 𝜆−3 0

−1 0 𝜆−2
= (𝜆 − 2)(𝜆 − 1)2

得 𝐴 的特征值是 𝜆1 = 𝜆2 = 1, 𝜆3 = 2.

将 𝜆1 = 𝜆2 = 1 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得

  
2 −1 0 𝑥1
  
−2   𝑥2  = 0
 4 0   

−1 0 −1 𝑥3

其基础解系是  
1
 
 2 
 
−1

因此属于特征值 1 的全部特征向量为

 
1
 
𝑘1 
 2 ,
 𝑘1 ̸= 0
−1

将 𝜆3 = 2 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
  
3 −1 0 𝑥1
  
  𝑥2  = 0
−1 0 
 4  

−1 0 0 𝑥3
5.1 特征值与特征向量 137

其基础解系是  
0
 
 0 
 
1

因此属于特征值 2 的全部特征向量为
 
0
 
 0 ,
𝑘2   𝑘2 ̸= 0
1

例5.1.2 求矩阵  
1 2 2
 
𝐴=
 2 1 2 

2 2 1

的特征值和相应特征子空间的基.

解 由特征多项式

𝜆−1 −2 −2

−2 = (𝜆 + 1)2 (𝜆 − 5)

|𝜆𝐼 − 𝐴| = −2 𝜆−1

−2 −2 𝜆−1

得 𝐴 的特征值是 𝜆1 = 𝜆2 = −1, 𝜆3 = 5.

将𝜆1 = 𝜆2 = −1 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得 𝐴 的属于特征值 −1 的两个线性无


关的特征向量为    
1 0
   
𝑥1 = 
 0 ,
 𝑥2 = 
 1 

−1 −1

𝑥1 , 𝑥2 即为特征值 −1 对应的特征子空间的基.

将 𝜆3 = 5 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得 𝐴 的属于特征值 5 的线性无关特征向量

 
1
 
𝑥3 = 
 1 

1
138 第5章 特征值与二次型

𝑥3 即为特征值 5 对应的特征子空间的基.
定理 5.1.3 相似矩阵有相同的特征多项式.

证明 设 𝑛 阶矩阵 𝐴 与 𝐵 相似, 即存在 𝑛 阶可逆矩阵 𝑃 , 使 𝑃 −1 𝐴𝑃 = 𝐵,


于是

|𝜆𝐼 − 𝐵| = |𝜆𝐼 − 𝑃 −1 𝐴𝑃 | = |𝑃 −1 (𝜆𝐼)𝑃 − 𝑃 −1 𝐴𝑃 |


= |𝑃 −1 (𝜆𝐼 − 𝐴)𝑃 | = |𝑃 −1 ||𝜆𝐼 − 𝐴||𝑃 | = |𝜆𝐼 − 𝐴|

定 义 5.1.3 设 𝜆0 是方阵 𝐴 的一个特征值, 𝑉0 是属于 𝜆0 的特征子空间, 则 𝜆0


作为方阵 𝐴 的特征多项式根的重数称为 𝜆0 的代
代数 重 数 , 特征子空间 𝑉0 的维数称
为 𝜆0 的几
几何 重 数 .
定理 5.1.4 每个特征值的代数重数大于等于其几何重数.
证明 设 𝜆0 是 𝑛 阶方阵 𝐴 的一个特征值, 记 𝜆0 的代数重数为 𝑚, 即 𝜆0 作
为特征多项式 |𝜆𝐼 − 𝐴| = 0 根的重数为 𝑚: 记 𝜆0 的几何重数为 𝑡, 即特征子空间
𝑉0 = {𝑥|𝐴𝑥 = 𝜆0 𝑥} 维数 dim 𝑉0 = 𝑡. 设 𝜉1 , · · · , 𝜉𝑡 是特征子空间 𝑉0 的一组基, 因
为 𝐴𝜉𝑖 = 𝜆0 𝜉𝑖 (𝑖 = 1, · · · , 𝑡), 故有
 
𝜆0
..
 
𝐴[𝜉1 , · · · , 𝜉𝑡 ] = [𝜉1 , · · · , 𝜉𝑡 ] 
 
 . 

𝜆0

将 𝜉1 , · · · , 𝜉𝑡 扩充为 R𝑛 的一组基 𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 , 有
 
𝜆0 𝐼 𝑡 * 
𝐴[𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 ] = [𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 ] 
𝑂 𝐵

其中 𝐵 是 𝑛 − 𝑡 阶矩阵. 记 𝑃 = [𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 ], 易知 𝑃 是 𝑛 阶可逆矩阵, 故



 
𝜆0 𝐼𝑡 *  −1
𝐴=𝑃 𝑃
𝑂 𝐵

可知方阵 𝐴 与
5.1 特征值与特征向量 139

 
𝜆 𝐼 * 
 0 𝑡
𝑂 𝐵

相似, 故它们有相同的特征多项式 (𝜆 − 𝜆0 )𝑡 𝑔(𝜆), 所以 𝜆0 的代数重数 𝑚 至少为 𝑡,


即 𝑚 > 𝑡.
例5.1.3 矩阵  
−1 1 0
 
𝐴=
 −4 3 0 

1 0 2

有特征值 1 和 2, 其中特征值 1 的代数重数和几何重数分别为 2 和 1, 特征值 2 的


代数重数和几何重数均为 1.
例5.1.4 矩阵  
1 2 2
 
𝐴=
 2 1 2 

2 2 1

有特征值 −1 和 5, 其中特征值 −1 的代数重数和几何重数均为 2, 特征值 5 的代数


重数和几何重数均为 1.

5.1.3 特征向量的线性无关性

定理 5.1.5 属于不同特征值的特征向量是线性无关的.
证明 设 𝜆1 , 𝜆2 , · · · , 𝜆𝑘 是矩阵 𝐴 的 𝑘 个互不相同的特征值, 𝑥1 , 𝑥2 , · · · , 𝑥𝑘
是分别属于它们的特征向量.
现对特征值的个数作数学归纳法.
先证当 𝑘 = 2 时命题成立, 即证属于不同特征值的两个特征向量线性无关.

𝐴𝑥1 = 𝜆1 𝑥1 , 𝑥1 ̸= 0; 𝐴𝑥2 = 𝜆2 𝑥2 , 𝑥2 ̸= 0

考察等式
𝑐1 𝑥1 + 𝑐2 𝑥2 = 0 (5.1)

等式(5.1)两端乘以 𝜆2 , 得

𝑐1 𝜆2 𝑥1 + 𝑐2 𝜆2 𝑥2 = 0 (5.2)
140 第5章 特征值与二次型

等式(5.1)两端左乘矩阵 𝐴, 得

𝑐1 𝐴𝑥1 + 𝑐2 𝐴𝑥2 = 𝑐1 𝜆1 𝑥1 + 𝑐2 𝜆2 𝑥2 = 0 (5.3)

等 式(5.2)减 去 等 式(5.3), 得 𝑐1 𝜆2 𝑥1 − 𝑐1 𝜆1 𝑥1 = 𝑐1 (𝜆2 − 𝜆1 )𝑥1 = 0. 因 为 𝑥1 ̸=


0, 𝜆1 ̸= 𝜆2 , 故 𝑐1 = 0. 同理可得 𝑐2 = 0. 故特征向量 𝑥1 , 𝑥2 线性无关.

下面假定属于 𝑘 − 1 个不同特征值的特征向量线性无关, 在此基础上证明属


于 𝑘 个不同特征值的特征向量线性无关.

考察等式
𝑐1 𝑥1 + 𝑐2 𝑥2 + · · · + 𝑐𝑘−1 𝑥𝑘−1 + 𝑐𝑘 𝑥𝑘 = 0 (5.4)

等式(5.4)两端乘以 𝜆𝑘 , 得

𝑐1 𝜆𝑘 𝑥1 + 𝑐2 𝜆𝑘 𝑥2 + · · · + 𝑐𝑘−1 𝜆𝑘 𝑥𝑘−1 + 𝑐𝑘 𝜆𝑘 𝑥𝑘 = 0 (5.5)

用 𝐴 左乘(5.4)两端, 并且以 𝐴𝑥𝑖 = 𝜆𝑖 𝑥𝑖 (𝑖 = 1, 2, · · · , 𝑘) 代入得

𝑐1 𝜆1 𝑥1 + 𝑐2 𝜆2 𝑥2 + · · · + 𝑐𝑘−1 𝜆𝑘−1 𝑥𝑘−1 + 𝑐𝑘 𝜆𝑘 𝑥𝑘 = 0 (5.6)

等 式(5.5)减 去 等 式(5.6), 得 𝑐1 (𝜆𝑘 − 𝜆1 )𝑥1 + 𝑐2 (𝜆𝑘 − 𝜆2 )𝑥2 + · · · + 𝑐𝑘−1 (𝜆𝑘 −


𝜆𝑘−1 )𝑥𝑘−1 = 0.

由 归 纳 假 设 𝑥1 , 𝑥2 , · · · , 𝑥𝑘−1 是 线 性 无 关 的, 故 𝑐𝑖 (𝜆𝑘 − 𝜆𝑖 ) = 0 (𝑖 =
1, 2, · · · , 𝑘 − 1), 但由于 𝜆𝑘 − 𝜆𝑖 ̸= 0, 因此 𝑐𝑖 = 0 (𝑖 = 1, 2, · · · , 𝑘 − 1), 从而
等式(5.4)变成 𝑐𝑘 𝑥𝑘 = 0, 又 𝑥𝑘 ̸= 0, 故只能 𝑐𝑘 = 0, 这就证明了 𝑥1 , 𝑥2 , · · · , 𝑥𝑘 是
线性无关的.

定理 5.1.5 还可以进一步推广为如下定理.
定 理 5.1.6 如果 𝜆1 , 𝜆2 , · · · , 𝜆𝑘 是矩阵 𝐴 的不同特征值, 𝑥𝑖1 , 𝑥𝑖2 , · · · , 𝑥𝑖𝑟𝑖
(𝑖 = 1, 2, · · · , 𝑘) 是属于特征值 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑘) 的线性无关的特征向量, 那么向
量组 𝑥11 , 𝑥12 , · · · , 𝑥1𝑟1 , 𝑥21 , · · · , 𝑥2𝑟2 , · · · , 𝑥𝑘1 , · · · , 𝑥𝑘𝑟𝑘 线性无关.

该定理的证明与定理 5.1.5 的证明过程类似, 请读者自行完成证明.


5.2 矩阵的对角化 141

5.2 矩阵的对角化

5.2.1 矩阵可对角化的条件

定 义5.2.1 如 果 矩 阵 𝐴 与 对 角 阵 Λ 相 似, 即 存 在 一 个 可 逆 矩 阵 𝑃 , 使
−1
𝑃 𝐴𝑃 = Λ, 则称矩阵 𝐴 可对 角化 .
定 理 5.2.1 𝑛 阶矩阵 𝐴 可对角化的充分必要条件是 𝐴 有 𝑛 个线性无关的特
征向量.

证明 充分性. 设 𝑛 阶矩阵 𝐴 有 𝑛 个线性无关的特征向量 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 , 则

𝐴𝑥𝑖 = 𝜆𝑖 𝑥𝑖 , 𝑥𝑖 ̸= 0 (𝑖 = 1, 2, · · · , 𝑛)

即  
𝜆1
 

 𝜆2 

𝐴[𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ] = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]  ..

.
 
 
 
𝜆𝑛


 
𝜆1
 

 𝜆2 

𝑃 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ], Λ= ..

.
 
 
 
𝜆𝑛

则 𝐴𝑃 = 𝑃 Λ. 因为方阵 𝑃 是列满秩, 因此可逆, 故 𝑃 −1 𝐴𝑃 = Λ, 即矩阵 𝐴 可对


角化.
必要性. 设矩阵 𝐴 可对角化, 即存在一个 𝑛 阶可逆矩阵 𝑃 , 使
 
𝜆1
 
−1

 𝜆2 

𝑃 𝐴𝑃 =  ..

.
 
 
 
𝜆𝑛
142 第5章 特征值与二次型

于是有  
𝜆1
 

 𝜆2 

𝐴𝑃 = 𝑃  ..

.
 
 
 
𝜆𝑛

从而 𝐴col(𝑃 , 𝑖) = 𝜆𝑖 col(𝑃 , 𝑖) (𝑖 = 1, 2, · · · , 𝑛), 其中 col(𝑃 , 𝑖) 表示矩阵 𝑃 的第


𝑖列, 且 col(𝑃 , 𝑖) ̸= 0.
可见, col(𝑃 , 𝑖) 是矩阵 𝐴 的属于特征值 𝜆𝑖 的特征向量, 又因为 𝑃 是可逆矩阵,
所以特征向量 col(𝑃 , 1), col(𝑃 , 2), · · · , col(𝑃 , 𝑛) 线性无关.
定 理 5.2.2 𝑛 阶矩阵 𝐴 可对角化的充分必要条件是 𝐴 的任一特征值的几何
重数与代数重数相等.
证明 由于 𝑛 阶矩阵任一特征值的几何重数小于等于其代数重数, 而所有特
征值的代数重数之和为 𝑛, 因此所有特征值的几何重数之和小于等于 𝑛.
𝑛 阶矩阵 𝐴 有 𝑛 个线性无关的特征向量当且仅当所有特征值的几何重数之
和等于 𝑛 , 当且仅当任一特征值的几何重数与代数重数相等.
由于不同特征值对应的特征向量线性无关, 因此具有 𝑛 个不同特征值的 𝑛 阶
方阵必有 𝑛 个线性无关的特征向量; 从另一角度, 代数重数为1的特征值的几何重
数也为 1, 因此具有 𝑛 个不同特征值的 𝑛 阶方阵的任一特征值的几何重数与代数
重数均为 1. 故有下面的结论.
推论 5.2.1 具有 𝑛 个不同特征值的 𝑛 阶方阵一定可以对角化.
例5.2.1 设  
−1 0 0
 
𝐴=
 −2 1 0 

2 0 1

问 𝐴 能否对角化?
解 由于

𝜆+1 0 0


|𝜆𝐼 − 𝐴| = 2 𝜆−1 0

−2 0 𝜆−1
= (𝜆 + 1)(𝜆 − 1)2

所以 𝐴 的特征值为 𝜆1 = −1, 𝜆2 = 𝜆3 = 1.
5.2 矩阵的对角化 143

将 𝜆1 = −1 代入特征方程组, 有
  
0 0 0 𝑥1
  
−2   𝑥2  = 0
 2 0   

−2 0 −2 𝑥3

得属于特征值 −1 的线性无关的特征向量为
 
1
 
𝑥1 = 
 1 

−1

将 𝜆2 = 𝜆3 = 1 代入特征方程组, 有
  
2 0 0 𝑥1
  
  𝑥2  = 0
 2 0 0   

−1 0 0 𝑥3

解得属于特征值 1 的线性无关的特征向量为
   
0 0
   
𝑥2 = 
 1 ,
 𝑥3 = 
 0 

0 1

因为特征值 −1 的几何重数与代数重数均为 1, 特征值 1 的几何重数与代数重数均


为 2, 从而导致 3 阶矩阵 𝐴 有 3 个线性无关的特征向量, 所以可对角化, 取
 
1 0 0
 
𝑃 = [𝑥1 , 𝑥2 , 𝑥3 ] = 
 1 1 0 

−1 0 1

则有  
−1 0 0
𝑃 −1 𝐴𝑃 = 
 
 0 1 0 

0 0 1
144 第5章 特征值与二次型

例5.2.2 设  
−1 1 0
 
𝐴=
 −4 3 0 

1 0 2

问 𝐴 能否对角化?
解 由前面例子知矩阵 𝐴 的特征值有 1和 2, 其中特征值 1 的代数重数为 2,
几何重数为1, 因此 3 阶矩阵 𝐴 不可能有 3 个线性无关特征向量, 故其不可对角化.

5.2.2 实对称矩阵的对角化

定义 5.2.2 矩阵的元素都是实数的对称矩阵称为实
实对 称 矩 阵 .
定理 5.2.3 实对称矩阵的所有特征值是实数, 所有特征向量是实向量.
证明 设 𝐴 是 𝑛 阶实对称矩阵, 𝜆 是 𝐴 的特征值, 𝑥 是属于 𝜆 的特征向量,
即 𝐴𝑥 = 𝜆𝑥, 𝑥 ̸= 0. 记 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T 相应的共轭矩阵和共
轭向量分别为 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 其中 𝑎𝑖𝑗 , 𝑥𝑖 分别是 𝑎𝑖𝑗 , 𝑥𝑖 的共
T
轭复数, 则 𝐴𝑥 = 𝜆𝑥, 即 𝐴𝑥 = 𝜆𝑥, 等式两边转置,
T 得 𝑥T 𝐴 = 𝜆𝑥T .
由 于 𝐴 是 实 对 称 矩 阵, 有 𝐴 = 𝐴, 所 以 𝑥T 𝐴 = 𝜆𝑥T . 两 边 右 乘 𝑥, 得
𝑥T 𝐴𝑥 = 𝜆𝑥T 𝑥. 另外 𝑥T 𝐴𝑥 = 𝑥T 𝜆𝑥 = 𝜆 𝑥T 𝑥. 因此 (𝜆 − 𝜆)𝑥T 𝑥 = 0. 由于 𝑥 ̸= 0,
𝑥T 𝑥 ̸= 0, 故 𝜆 = 𝜆, 从而 𝜆 是一个实数.
所以当线性方程组的系数均为实数时, 其解也都是实数, 故实对称矩阵的特征向量
的分量也都是实数.
定理 5.2.4 实对称矩阵的属于不同特征值的特征向量正交.
证明 设 𝑥1 , 𝑥2 分别是实对称矩阵 𝐴 不同特征值 𝜆1 , 𝜆2 对应的特征向量,

𝐴𝑥1 = 𝜆1 𝑥1 , 𝐴𝑥2 = 𝜆2 𝑥2

一方面 (𝐴𝑥1 )T 𝑥2 = (𝜆1 𝑥1 )T 𝑥2 = 𝜆1 𝑥T


1 𝑥2 , 另一方面

(𝐴𝑥1 )T 𝑥2 = 𝑥T T T T T
1 𝐴 𝑥2 = 𝑥1 𝐴𝑥2 = 𝑥1 𝜆2 𝑥2 = 𝜆2 𝑥1 𝑥2

所以 𝜆1 𝑥T
1 𝑥2 = 𝜆2 𝑥1 𝑥2 , 即 (𝜆1 − 𝜆2 )𝑥1 𝑥2 = 0. 由假设知 𝜆1 ̸= 𝜆2 , 故有 𝑥1 𝑥2 = 0,
T T T

即 𝑥1 与 𝑥2 正交.
定 理 5.2.5 设 𝐴 是 𝑛 阶实对称矩阵, 则存在 𝑛 阶正交阵 𝑃 , 使 𝑃 T 𝐴𝑃 为对
角阵.
5.2 矩阵的对角化 145

证明 设 𝑥1 是 𝐴 的单位特征向量, 𝐴𝑥1 = 𝜆1 𝑥1 , ‖𝑥1 ‖ = 1, 以 𝑥1 为第一列


构造一个正交阵 𝑃1 ,
𝑃1 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]

由于
𝑃1T 𝑃1 = [𝑃1T 𝑥1 , 𝑃1T 𝑥2 , · · · , 𝑃1T 𝑥𝑛 ] = 𝐼

所以  
1
 
 0 
𝑃1T 𝑥1
 
=
 ..
 , 𝑒1


 . 

0

从而有

𝑃1T 𝐴𝑃1 = 𝑃1T 𝐴[𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]


= 𝑃1T [𝜆1 𝑥1 , 𝐴𝑥2 , · · · , 𝐴𝑥𝑛 ]
= [𝜆1 𝑒1 , 𝑃1T 𝐴𝑥2 , · · · , 𝑃1T 𝐴𝑥𝑛 ]
 
𝜆1 𝛼 
=
0 𝐴1

其中 𝛼 是 𝑛 − 1 维行向量, 𝐴1 是 𝑛 − 1 阶方阵, 因为 𝑃1 是正交阵, 于是

(𝑃1T 𝐴𝑃1 )T = 𝑃1T 𝐴T (𝑃1T )T = 𝑃1T 𝐴𝑃1

所以 𝑃1T 𝐴𝑃1 也是对称阵, 从而知 𝛼 = 0T , 而且 𝐴1 是 𝑛 − 1 阶实对称矩阵, 故


 
𝜆1 0 T 
𝑃1T 𝐴𝑃1 = 
0 𝐴1


 
𝜆1 0T  T
𝐴 = 𝑃1  𝑃1 (5.7)
0 𝐴1
146 第5章 特征值与二次型

由于 𝐴1 是 𝑛 − 1 阶实对称矩阵, 同理, 可以构造一个 𝑛 − 1 阶正交阵 𝑃2 , 使得


 
𝜆2 0T  T
𝐴 1 = 𝑃2  𝑃2 (5.8)
0 𝐴2

其中 𝐴2 是 𝑛 − 2 阶实对称矩阵. 将式(5.8)代入式(5.7), 得

 
  𝜆1  T
1   1
 𝑃T
𝐴 = 𝑃1   𝜆2 
1 (5.9)
𝑃2 𝑃2
 
𝐴2

因为   T  

1 
1  =
1 =𝐼
𝑃2 𝑃2 𝑃2 𝑃2T
 
1  也是一个正交阵, 记作 𝑃˜2 , 因此
故
𝑃2

 
𝜆1
𝐴 = 𝑃1 𝑃˜2   (𝑃1 𝑃˜2 )T
 
 𝜆2 
𝐴2

依此继续下去, 可得
 
𝜆1
 
 𝜆2 
𝐴 = 𝑃1 𝑃˜2 · · · 𝑃˜𝑛   (𝑃1 𝑃˜2 · · · 𝑃˜𝑛 )T
 
..
.
 
 
 
𝜆𝑛

其中 𝑃1 , 𝑃˜2 , · · · , 𝑃˜𝑛 均是正交阵, 故它们的积 𝑃1 𝑃˜2 · · · 𝑃˜𝑛 也是正交阵, 这样, 我们


5.2 矩阵的对角化 147

就得到一个正交阵 𝑃 = 𝑃1 𝑃˜2 · · · 𝑃˜𝑛 , 使 𝐴 = 𝑃 Λ𝑃 T , 即 𝑃 T 𝐴𝑃 = Λ, 其中


 
𝜆1
 

 𝜆2 

Λ= ..

.
 
 
 
𝜆𝑛

注 对于实对称矩阵 𝐴, 找正交阵 𝑃 , 使 𝑃 T 𝐴𝑃 为对角阵的过程称为正


正交 对
角 化 , 通常可按照以下步骤进行:
(1) 求出实对称矩阵 𝐴 的所有不同的特征值 𝜆1 , 𝜆2 , · · · , 𝜆𝑠 (𝜆𝑖 ̸= 𝜆𝑗 );
(2) 对每个 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑠), 解方程组 (𝜆𝑖 𝐼 − 𝐴)𝑥 = 0, 找出一个基础解系
𝑥𝑖1 , 𝑥𝑖2 , · · · , 𝑥𝑖𝑟𝑖 , 这就是矩阵 𝐴 的特征值 𝜆𝑖 对应特征子空间的基;
(3) 将 𝑥𝑖1 , 𝑥𝑖2 , · · · , 𝑥𝑖𝑟𝑖 Schmidt 正交化, 得到一组相互正交的单位向量组
𝜀𝑖1 , 𝜀𝑖2 , · · · , 𝜀𝑖𝑟𝑖 , 它们是矩阵 𝐴 的特征值 𝜆𝑖 对应特征子空间的标准正交基;
(4) 𝑃 = [𝜀11 , · · · , 𝜀1𝑟1 · · · , 𝜀𝑠1 , · · · , 𝜀𝑠𝑟𝑠 ] 即为所求的正交阵.
例5.2.3 求正交阵 𝑃 将下列实对称矩阵对角化
 
0 −1 1
 
𝐴=
 −1 0 1 

1 1 0

解 由

𝜆
1 −1
−1 = (𝜆 − 1)2 (𝜆 + 2) = 0

|𝜆𝐼 − 𝐴| = 1 𝜆

−1 −1 𝜆

得矩阵 𝐴 的特征值为 𝜆1 = −2, 𝜆2 = 𝜆3 = 1.


将 𝜆1 = −2 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
  
−2 1 −1 𝑥1
  
  𝑥2  = 0
−2 −1 
 1  

−1 −1 −2 𝑥3

其基础解系为
148 第5章 特征值与二次型

 
−1
 
𝑥1 = 
 −1 

将 𝑥1 单位化, 得  
−1
1  
𝜀= √  −1 

3
1

将 𝜆2 = 𝜆3 = 1 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
  
1 1 −1 𝑥1
  
  𝑥2  = 0
−1 
 1 1
 

−1 −1 1 𝑥3

其基础解系为    
1 0
   
𝑥2 = 
 0 ,
 𝑥3 = 
 1 

1 1

将 𝑥2 , 𝑥3 正交化、单位化, 得
   
1 −1
1   1  
𝜀2 = √  0 , 𝜀3 = √   2 

2  6
1 1

−1 1 −1
 
√ √ √
 3 2 6   
  −2 0 0
 −1 2 
于是得正交阵 𝑃 =  √ 0 √ , 使得 𝑃 T 𝐴𝑃 =  0
   
 3 6   .
1 0 
 
 1 1 1  0 0 1
 √ √ √ 
3 2 6
5.3 二 次 型 149

5.3 二 次 型

5.3.1 二次型的基本概念

定 义 5.3.1 设 𝐴 是 𝑛 阶实对称矩阵, 𝑥 是 𝑛 元列向量, 则称 𝑥T 𝐴𝑥 为二


二次
型 (quadratic form).
将    
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑥1
   
 𝑎
 21 𝑎22 · · · 𝑎2𝑛 


 𝑥2 

𝐴=
 .. .. ..
,
 𝑥=
 ..


 . . .   . 
   
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑥𝑛

代入 𝑥T 𝐴𝑥 计算得

𝑥T 𝐴𝑥 =𝑎11 𝑥21 + 𝑎12 𝑥1 𝑥2 + · · · + 𝑎1𝑛 𝑥1 𝑥𝑛


+ 𝑎21 𝑥2 𝑥1 + 𝑎22 𝑥22 + · · · + 𝑎2𝑛 𝑥2 𝑥𝑛
+ ···
+ 𝑎𝑛1 𝑥𝑛 𝑥1 + 𝑎𝑛2 𝑥𝑛 𝑥2 + · · · + 𝑎𝑛𝑛 𝑥2𝑛
𝑛 X
X 𝑛 𝑛
X X
= 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 = 𝑎𝑖𝑖 𝑥2𝑖 + 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 (5.10)
𝑖=1 𝑗=1 𝑖=1 𝑖̸=𝑗

可见 𝑥T 𝐴𝑥 是 𝑛 个变量 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 的二次齐次多项式 𝑓 (𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ), 这也


正是其二次型名称的由来. 又因为 𝐴 是 𝑛 阶实对称矩阵, 𝑎𝑖𝑗 = 𝑎𝑗𝑖 , 故式(5.10)还可
以写成

𝑥T 𝐴𝑥 =𝑎11 𝑥21 + 2𝑎12 𝑥1 𝑥2 + · · · + 2𝑎1𝑛 𝑥1 𝑥𝑛


+ 𝑎22 𝑥22 + · · · + 2𝑎2𝑛 𝑥2 𝑥𝑛 + · · · + 𝑎𝑛𝑛 𝑥2𝑛
𝑛
X X
= 𝑎𝑖𝑖 𝑥2𝑖 + 2 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 (5.11)
𝑖=1 𝑖<𝑗

实对称矩阵 𝐴 称为二次型 𝑥T 𝐴𝑥 的矩阵, 两者是一一对应的.


例5.3.1 把二次型

𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥21 − 𝑥22 + 3𝑥23 + 𝑥1 𝑥2 + 3𝑥1 𝑥3 − 4𝑥2 𝑥3


150 第5章 特征值与二次型

写成矩阵表示 𝑥T 𝐴𝑥.

1 3
 
 1 2 2 
 
  𝑥1
 1 
−1 −2 

𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = [𝑥1 , 𝑥2 , 𝑥3 ]   𝑥2

 
 2  
 3 𝑥3
 
−2 3

2

5.3.2 二次型的标准形

定义 5.3.2 如果二次型只含有变量的平方项, 即

𝑓 (𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ) = 𝑏1 𝑦12 + 𝑏2 𝑦22 + · · · + 𝑏𝑛 𝑦𝑛2


  
𝑏1 𝑂 𝑦1
  

 𝑏2 
 𝑦2 

= [𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ]  ..

..

.
  



 . 

𝑂 𝑏𝑛 𝑦𝑛

这种形式称为二次型的标
标准 形 .
定 理 5.3.1 对于二次型 𝑥T 𝐴𝑥, 存在正交阵 𝑃 , 使得经过正交变换 𝑦 = 𝑃 T 𝑥
P𝑛 P𝑛
二次型 𝑥T 𝐴𝑥 = 𝑖=1 𝑗=1 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 可化为标准形 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2 , 其中
𝜆1 , 𝜆2 , · · · , 𝜆𝑛 是实对称矩阵 𝐴 的全部特征值.
证明 因为 𝐴 是实对称矩阵, 故存在正交阵 𝑃 , 使得 𝑃 T 𝐴𝑃 = Λ, 即

𝐴 = 𝑃 Λ𝑃 T (5.12)

其中 Λ = diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝜆1 , 𝜆2 , · · · , 𝜆𝑛 是 𝐴 的全部特征值.
将式(5.12)代入二次型 𝑥T 𝐴𝑥, 并作正交变换 𝑦 = 𝑃 T 𝑥, 得

𝑥T 𝐴𝑥 = 𝑥T 𝑃 Λ𝑃 T 𝑥 = (𝑃 T 𝑥)T Λ𝑃 T 𝑥 = 𝑦 T Λ𝑦
= 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2

例5.3.2 用正交变换化实二次型 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 2𝑥21 + 𝑥22 − 4𝑥1 𝑥2 − 4𝑥2 𝑥3 为


5.3 二 次 型 151

标准形, 并写出其正交变换.

解 此二次型的矩阵表示式为
  
2 −2 0 𝑥1
𝑥T 𝐴𝑥 = [𝑥1 , 𝑥2 , 𝑥3 ] 
  
 −2 1 −2 
  𝑥2 
 

0 −2 0 𝑥3

先求 𝐴 的特征值和特征向量

𝜆−2 2 0


|𝜆𝐼 − 𝐴| = 2 𝜆 − 1 2 = (𝜆 − 1)(𝜆 − 4)(𝜆 + 2).

0 2 𝜆

所以 𝐴 的特征值为 𝜆1 = 1, 𝜆2 = 4, 𝜆3 = −2.

将 𝜆1 = 1 代入特征方程 (𝐼 − 𝐴)𝛼 = 0 中, 即有

 
−1 2 0
 
𝛼 = 0
 2 0 2 

0 2 1

解得它的一个基础解系为 𝛼1 = [−2, −1, 2]T , 同样, 将 𝜆2 = 4, 𝜆3 = −2 分别代入


特征方程中, 求得它们的基础解系分别为

𝛼2 = [2, −2, 1]T , 𝛼3 = [1, 2, 2]T

由于它们已是正交向量, 再将它们单位化, 即得

1 1 1
𝜀1 = [−2, −1, 2]T , 𝜀2 = [2, −2, 1]T , 𝜀3 = [1, 2, 2]T
3 3 3

以 𝜀1 , 𝜀2 , 𝜀3 组成正交矩阵
 
−2 2 1
1 
𝑃 =  −1 −2 2 
3  
2 1 2
152 第5章 特征值与二次型

作正交变换 𝑦 = 𝑃 T 𝑥, 得在此变换下, 二次型化为标准形, 即

𝐴=𝑃 Λ𝑃 T 𝑦=𝑃 T 𝑥
𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥T 𝐴𝑥 ======== 𝑥T 𝑃 Λ𝑃 T 𝑥 ====== 𝑦 T Λ𝑦
  
1 0 0 𝑦1
  
= [𝑦1 , 𝑦2 , 𝑦3 ] 
 0 4
0   𝑦2 
 

0 0 −2 𝑦3
= 𝑦12 + 4𝑦22 − 2𝑦32

5.3.3 Rayleigh商

定理 5.3.2 设 𝐴 为 𝑛 阶实对称矩阵, 𝑥 为 𝑛 元单位列向量, 则二次型 𝑥T 𝐴𝑥


的最大值为 𝐴 的最大特征值, 二次型 𝑥T 𝐴𝑥 的最小值为 𝐴 的最小特征值.
证明 因为 𝐴 为 𝑛 阶实对称矩阵, 故存在正交阵 𝑃 使 𝐴 = 𝑃 Λ𝑃 T , 其中
Λ = diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝜆1 6 𝜆2 6 · · · 6 𝜆𝑛 是 𝐴 的从小到大排列的所有特征
值(包括重根), 正交阵 𝑃 的列向量是相应特征值对应的特征向量. 所以对于二次型
𝑥T 𝐴𝑥 存在一个正交变换 𝑦 = 𝑃 T 𝑥 将其化为标准形
𝐴=𝑃 Λ𝑃 T 𝑦=𝑃 T 𝑥
𝑥T 𝐴𝑥 ======== 𝑥T 𝑃 Λ𝑃 T 𝑥 ====== 𝑦 T Λ𝑦

由于 𝜆1 6 𝜆2 6 · · · 6 𝜆𝑛 , 且 𝑦 T 𝑦 = 1, 故有

𝑥T 𝐴𝑥 = 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2


6 𝜆𝑛 𝑦12 + 𝜆𝑛 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2
= 𝜆𝑛 ‖𝑦‖2 = 𝜆𝑛

当 𝑥 为 𝐴 的最大特征值对应的单位特征向量时, 𝑥T 𝐴𝑥 = 𝑥T 𝜆𝑛 𝑥 = 𝜆𝑛 , 上述不等
式中的等号成立, 从而 𝑥T 𝐴𝑥 取得最大值为 𝐴 的最大特征值.
同理可证, 𝑥T 𝐴𝑥 的最小值为 𝐴 的最小特征值.
𝑥T 𝐴𝑥
定 义 5.3.3 设 𝐴 为 𝑛 阶实对称矩阵, 𝑥 为 𝑛 元非零列向量, 称 为𝐴
𝑥T 𝑥
的 Rayleigh 商 .
由前面的定理可得, 实对称矩阵 𝐴 的 Rayleigh 商的最大值为 𝐴 的最大特征
值, Rayleigh 商的最小值为 𝐴 的最小特征值.
5.4 正 定 矩 阵 153

5.4 正 定 矩 阵

5.4.1 正定矩阵与半正定矩阵

定 义5.4.1 设 𝐴 为 𝑛 阶实对称矩阵, 如果对于任意 𝑛 元非零向量 𝑥, 均有


𝑥 𝐴𝑥 > 0, 则称实对称矩阵 𝐴 为正
T
正定 矩 阵(positive definite matrix), 称相应的二次
型 𝑥T 𝐴𝑥 为正
正定 二 次 型 ; 如果对于任意 𝑛 元非零向量 𝑥, 均有 𝑥T 𝐴𝑥 > 0, 则称实
对称矩阵 𝐴 为半
半 正 定 矩 阵 (positive semi-definite matrix), 称相应的二次型 𝑥T 𝐴𝑥
为半
半正 定 二 次 型 .
定 理 5.4.1 实对称矩阵正定的充分必要条件是它的所有特征值为正; 实对称
矩阵半正定的充分必要条件是它的所有特征值非负.
证明 设 𝐴 为 𝑛 阶实对称矩阵, 由于存在正交阵 𝑃 使 𝐴 = 𝑃 Λ𝑃 T , 其中
Λ = diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑛) 是 𝐴 的所有特征值. 故对于二次型
𝑥T 𝐴𝑥 存在一个正交变换 𝑦 = 𝑃 T 𝑥, 将其化为标准形

𝑥T 𝐴𝑥 = 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2

充分性. 设矩阵 𝐴 的全部特征值为正, 𝜆𝑖 > 0(𝑖 = 1, 2, · · · , 𝑛).


任意给定 𝑥 ̸= 0, 则 𝑦 = 𝑃 T 𝑥 ̸= 0, 故 𝑥T 𝐴𝑥 = 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2 > 0,
所以矩阵 𝐴 是正定的.
必要性. 设矩阵 𝐴 是正定的. 用反证法, 假定矩阵 𝐴 的特征值 𝜆1 , 𝜆2 , · · · , 𝜆𝑛
不全大于零, 不妨设 𝜆𝑛 6 0, 取 𝑦1 = 𝑦2 = · · · = 𝑦𝑛−1 = 0, 𝑦𝑛 = 1, 此时 𝑥 = 𝑃 𝑦 ̸=
0, 而
𝑥T 𝐴𝑥 = 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2 = 𝜆𝑛 6 0

这与矩阵 𝐴 正定矛盾.
对于半正定矩阵, 证明过程类似.
性质 5.4.1 正定矩阵的行列式为正; 半正定矩阵的行列式非负.
证明 若 𝐴 是一个 𝑛 阶正定矩阵, 则其所有特征值均为正, 由于方阵所有特
征值(包括重根)的乘积等于方阵的行列式, 从而有 det(𝐴) = 𝜆1 · 𝜆2 · · · 𝜆𝑛 > 0.
若 𝐴 是一个 𝑛 阶半正定矩阵, 则其所有特征值均非负, 从而有 det(𝐴) =
𝜆1 · 𝜆2 · · · 𝜆𝑛 > 0.
性质 5.4.2 正定矩阵的主对角线上的元素都大于零.
证明 假设正定矩阵 𝐴 的主对角线上有一个元素 𝑎𝑘𝑘 6 0, 取 𝑥 为第 𝑘 个元
154 第5章 特征值与二次型

素为 1, 且其余元素均为 0 的列向量 𝑥 = 𝑒𝑘 ̸= 0, 则有 𝑥T 𝐴𝑥 = 𝑒T 𝐴𝑒 = 𝑎𝑘𝑘 6 0,


这与 𝐴 是正定矩阵相矛盾.
性质 5.4.3 正定矩阵可逆, 且其逆矩阵也是正定矩阵.
证明 设实对称矩阵 𝐴 是正定矩阵, 其行列式 det(𝐴) > 0, 所以 𝐴 是可逆的.
对于任意非零列向量 𝑥 ̸= 0, 由 𝐴 的可逆性知 𝐴−1 𝑥 ̸= 0, 且 𝐴−1 也是对称矩
阵, 从而
𝑥T 𝐴−1 𝑥 = 𝑥T (𝐴−1 𝐴𝐴−1 )𝑥 = (𝐴−1 𝑥)T 𝐴(𝐴−1 𝑥) > 0

这就证明了 𝐴−1 也是正定矩阵.


例5.4.1 设 𝐴 是一个 𝑚 × 𝑛 矩阵, 证明
(1) 𝐴𝐴T 和 𝐴T 𝐴 分别是 𝑚 阶和 𝑛 阶对称矩阵, 且均是半正定的;
(2) 如果 𝐴 行满秩 rank(𝐴) = 𝑚, 则 𝐴𝐴T 是正定的;
(3) 如果 𝐴 列满秩 rank(𝐴) = 𝑛, 则 𝐴T 𝐴 是正定的.
证明 由于 (𝐴𝐴T )T = 𝐴𝐴T 和 (𝐴T 𝐴)T = 𝐴T 𝐴, 故它们分别是 𝑚 阶和 𝑛
阶对称矩阵.
对于任意 𝑚 元非零列向量 𝑥 和 𝑛 元非零列向量 𝑦, 因为

𝑥T (𝐴𝐴T )𝑥 = (𝐴T 𝑥)T (𝐴T 𝑥) > 0


𝑦 T (𝐴T 𝐴)𝑦 = (𝐴𝑦)T (𝐴𝑦) > 0

所以 𝐴𝐴T 和 𝐴T 𝐴 均是半正定的.
如果 𝐴 行满秩 rank(𝐴) = 𝑚, 那么, 对于 𝑥 ̸= 0, 可知 𝐴T 𝑥 ̸= 0, 因此

𝑥T (𝐴𝐴T )𝑥 = (𝐴T 𝑥)T (𝐴T 𝑥) > 0

即 𝐴𝐴T 是正定矩阵.
同理, 如果 𝐴 列满秩 rank(𝐴) = 𝑛, 那么, 对于 𝑦 ̸= 0, 可知 𝐴𝑦 ̸= 0, 因此

𝑦 T (𝐴T 𝐴)𝑦 = (𝐴𝑦)T (𝐴𝑦) > 0

即 𝐴T 𝐴 是正定的.
定义 5.4.2 在 𝑛 阶矩阵 𝐴 中, 取第 1, 2, · · · , 𝑘 行及第 1, 2, · · · , 𝑘 列得到 𝐴 的
5.4 正 定 矩 阵 155

𝑘 阶子矩阵的行列式(𝑘 6 𝑛), 称为 𝐴 的 𝑘 阶顺
顺序主 子 式, 通常记为 Δ𝑘 :

𝑎11 𝑎12

Δ1 = 𝑎11 , Δ2 = ,···
𝑎21 𝑎22

𝑎11

𝑎12 · · · 𝑎1𝑛

𝑎
21 𝑎22 · · · 𝑎2𝑛

Δ𝑛 = . .. ..
= det(𝐴)
..

. .

𝑎𝑛2 · · · 𝑎𝑛𝑛

𝑎𝑛1

例5.4.2 矩阵  
1 −1 2 3
 
 0 3 2 4 
𝐴=
 

 2
 −1 0 1 

−1 3 2 4

的顺序主子式为

1 −1

Δ1 = 1, Δ2 =

0 3


1 −1 2


Δ3 = 0 3 2 , Δ4 = det(𝐴)


2 −1 0
定理 5.4.2 实对称矩阵正定的充分必要条件是其所有顺序主子式均为正.

证明 必要性. 记

𝑘 X
X 𝑘
𝑓𝑘 (𝑥1 , 𝑥2 , · · · , 𝑥𝑘 ) = 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 (𝑘 = 1, 2, · · · , 𝑛).
𝑖=1 𝑗=1

设 𝐴 是一个 𝑛 阶正定矩阵, 则对于任意 𝑛 元列向量 𝑥 ̸= 0, 均有


𝑛 X
X 𝑛
𝑓𝑛 (𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ) = 𝑥T 𝐴𝑥 = 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 > 0
𝑖=1 𝑗=1
156 第5章 特征值与二次型

对于任意一组不全为零的实数 𝐶1 , 𝐶2 , · · · , 𝐶𝑘 有

𝑘 X
X 𝑘
𝑓𝑘 (𝐶1 , 𝐶2 , · · · , 𝐶𝑘 ) = 𝑎𝑖𝑗 𝐶𝑖 𝐶𝑗 = 𝑓𝑛 (𝐶1 , 𝐶2 , · · · , 𝐶𝑘 , 0, · · · , 0) > 0
𝑖=1 𝑗=1

从而子矩阵  
𝑎11 𝑎21 · · · 𝑎1𝑘
 
 𝑎
 21 𝑎22 · · · 𝑎2𝑘 

𝐴𝑘 = 
 .. .. ..


 . . . 
 
𝑎𝑘1 𝑎𝑘2 · · · 𝑎𝑘𝑘

是正定的, 故Δ𝑘 = det(𝐴𝑘 ) > 0, 从而 𝐴 的顺序主子式都大于零.


充分性. 对于矩阵 𝐴 的阶数 𝑛 作数学归纳法.
当 𝑛 = 1 时, 由条件 𝑎11 > 0 知二次型 𝑥T 𝐴𝑥 = 𝑎11 𝑥21 > 0(𝑥1 ̸= 0), 所以 𝐴 为
正定的.
假设对于 𝑛 − 1 阶矩阵论断成立, 下面证明对 𝑛 阶矩阵 𝐴 论断也成立.
把二次型写成
𝑛 X
X 𝑛
𝑥T 𝐴𝑥 = 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗
𝑖=1 𝑗=1
𝑛 𝑛
1 XX
= (𝑎11 𝑥1 + · · · + 𝑎1𝑛 𝑥𝑛 )2 + 𝑏𝑖𝑗 𝑥𝑖 𝑥𝑗
𝑎11 𝑖=2 𝑗=2

𝑎1𝑖 𝑎1𝑗
其中 𝑏𝑖𝑗 = 𝑎𝑖𝑗 − , 因为 𝑎𝑖𝑗 = 𝑎𝑗𝑖 , 所以 𝑏𝑖𝑗 = 𝑏𝑗𝑖 .
𝑎11
由行列式的性质知

𝑎11 𝑎21 · · · 𝑎1𝑘 𝑎11 𝑎21 · · · 𝑎1𝑘



21 𝑎22 · · · 𝑎2𝑘 · · · 𝑏2𝑘
𝑎
𝑅𝑖 − 𝑎11 𝑅1 0
𝑎𝑖1
𝑏22


Δ𝑘 = . .. ..
========
𝑖=2,3,··· ,𝑛 .. .. ..

..

. .

.
. .

𝑎𝑘1 𝑎𝑘2 · · · 𝑎𝑘𝑘 · · · 𝑏𝑘𝑘

0 𝑏𝑘2

𝑏22 · · · 𝑏2𝑘

. ..

= 𝑎11 .. . (𝑘 = 2, 3, · · · , 𝑛)


𝑏𝑘2 · · · 𝑏𝑘𝑘

根据已知条件 Δ𝑘 > 0 得
5.4 正 定 矩 阵 157


𝑏22

· · · 𝑏2𝑘

.. ..

>0 (𝑘 = 2, 3, · · · , 𝑛)

. .


𝑏𝑘2 · · · 𝑏𝑘𝑘

P𝑛 P𝑛
由归纳假设, 𝑛 − 1 个变量的二次型 𝑖=2 𝑗=2 𝑏𝑖𝑗 𝑥𝑖 𝑥𝑗 是正定的, 从而

𝑛 𝑛
1 XX
𝑥T 𝐴𝑥 = (𝑎11 𝑥1 + · · · + 𝑎1𝑛 𝑥𝑛 )2 + 𝑏𝑖𝑗 𝑥𝑖 𝑥𝑗 (𝑎11 > 0)
𝑎11 𝑖=2 𝑗=2

也是正定的.
注 实对称矩阵所有顺序主子式非负是该矩阵半正定的必要非充分条件. 请
读者自行思考为什么.
例 5.4.3 矩阵
 
1 1 1
 
𝐴=
 1 2 3 

1 3 6

是否正定?
解 由于矩阵 𝐴 的顺序主子式:

1 1 1
1 1


Δ1 = 1 > 0; Δ2 = > 0; Δ3 = 1 2 3 > 0
1 2
1 3 6

所以矩阵 𝐴 是正定的.

5.4.2 负定矩阵与半负定矩阵

定 义5.4.3 设 𝐴 为 𝑛 阶实对称矩阵, 如果对于任意 𝑛 元非零向量 𝑥, 均有


𝑥 𝐴𝑥 < 0, 则称实对称矩阵 𝐴 为 负 定 矩 阵(negative definite matrix); 如果对于任
T

意 𝑛 元非零向量 𝑥, 均有 𝑥T 𝐴𝑥 6 0, 则称实对称矩阵 𝐴 为半
半 负 定 矩 阵 (negative
semi-definite matrix).
由(半)正定矩阵与(半)负定矩阵的定义, 可直接得到下面的结论.
定 理 5.4.3 实对称矩阵 𝐴 负定当且仅当 −𝐴 正定; 实对称矩阵 𝐴 半负定当
且仅当 −𝐴 半正定.
158 第5章 特征值与二次型

定 理 5.4.4 实对称矩阵负定的充分必要条件是它的所有特征值为负; 实对称


矩阵半负定的充分必要条件是它的所有特征值小于等于零.
证明 设 𝐴 为 𝑛 阶实对称矩阵, 𝐴 负定当且仅当 −𝐴 正定, 当且仅当 −𝐴 所
有特征值为正, 当且仅当 𝐴 所有特征值为负.
类似可证, 实对称矩阵半负定的充要条件是它的所有特征值小于等于零.
定理 5.4.5 实对称矩阵负定的充要条件是其顺序主子式的值负、正相间.
证明 设 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 为 𝑛 阶实对称矩阵, 𝐴 负定当且仅当 −𝐴 正定, 当且
仅当 −𝐴 = [−𝑎𝑖𝑗 ]𝑛×𝑛 的所有顺序主子式为正, 即

−𝑎 −𝑎12 −𝑎13
11
−𝑎11 −𝑎12


−𝑎11 > 0, > 0, −𝑎21 −𝑎22 −𝑎23 > 0, · · · ,
−𝑎21 −𝑎22


−𝑎31 −𝑎32 −𝑎33

𝑎11

𝑎12 · · · 𝑎1𝑛

𝑎
21 𝑎22 · · · 𝑎2𝑛

𝑛
(−1) . .. ..
>0
..

. .

𝑎𝑛2 · · · 𝑎𝑛𝑛

𝑎𝑛1

从而

𝑎 𝑎12 𝑎13
11
𝑎11 𝑎12


Δ1 < 0, Δ2 = > 0, Δ3 = 𝑎21 𝑎22 𝑎23 < 0, · · ·
𝑎21 𝑎22


𝑎31 𝑎32 𝑎33


𝑎11

𝑎12 · · · 𝑎1𝑛

𝑛
𝑎
21
𝑛
𝑎22 · · · 𝑎2𝑛

(−1) Δ𝑛 = (−1) . .. ..
>0
..

. .

𝑎𝑛2 · · · 𝑎𝑛𝑛

𝑎𝑛1

即其顺序主子式的值负、正相间.

5.5 习 题
1. 求下列矩阵的特征值和特征向量.
5.5 习 题 159

   
2 −1 −1 −1 2 2
(1) 0 2 0 ; (2)  3 −1 1 ;
   

−4 1 3 2 2 −1
   
1 −1 1 3 −2 0
(3) 2 4 −2 ; (4) −1 3 −1 ;
   

−3 −3 5 −5 7 −1
   
1 1 1 1 1 3 1 2
 1 1 −1 −1   0 −1 1 3 
(5) ; (6) .
   
 1 −1 1 −1   0 0 2 5 
1 −1 −1 1 0 0 0 2
 
𝑎 0 𝑏
2. 设矩阵 𝐴 =  0 2 0  的一个特征值为 𝜆1 = −3, 且三个特征值的积为 −12, 则求
 

𝑏 0 −2

𝑎, 𝑏, 以及 𝐴 的其他特征值.

3. 已知 𝛼 = [1, 1, −1]T 是矩阵

 
2 −1 2
𝐴= 5 𝑎 3 
 

−1 𝑏 −2

的一个特征向量, 试确定 𝑎, 𝑏 的值以及特征向量 𝛼 所对应的特征值.


4. 设 3 阶矩阵 𝐴 的三个特征值为 𝜆1 = 1, 𝜆2 = 2, 𝜆3 = 3, 与之对应的特征向量分别为
𝛼1 = [2, 1, −1]T , 𝛼2 = [2, −1, 2]T , 𝛼3 = [3, 0, 1]T , 求矩阵 𝐴.
5. 设 𝐴2 = 𝐴, 证明 𝐴 的特征值只能是 0 或者 1.
6. 设 𝑛 阶可逆矩阵 𝐴 的特征值为 𝑛 个非零数 𝜆1 , · · · , 𝜆𝑛 , 试证 𝐴 的伴随矩阵的特征值为
𝜆1 det(𝐴), · · · , 𝜆𝑛 det(𝐴).
7. 已知 3 阶矩阵的特征值为 1, 2, −1, 设矩阵 𝐵 = 𝐴3 − 5𝐴2 , 试计算行列式 det(𝐵),
det(𝐴 − 5𝐼).
8. 设 𝐴 = 𝐼 − 2𝑥𝑥T , 其中 𝑥 = (𝑥1 , 𝑥2 , · · · , 𝑥𝑛 )T , 𝐼 为 𝑛 阶单位矩阵, 若 𝑥T 𝑥 = 1, 求证:
𝑥 为 𝐴 的属于特征值 −1 的特征向量.
9. 已知 𝑛 阶矩阵 𝐴 的特征值为 𝜆0 ,
(1) 求 𝑘𝐴 的特征值( 𝑘 为任意实数);
(2) 若 𝐴 可逆, 求 𝐴−1 的特征值;
(3) 求 𝐼 + 𝐴 的特征值.
10. 设 𝐴2 − 3𝐴 + 𝐼 = 0, 证明 𝐴 的特征值只能是 1 或 2.
11. 已知矩阵 𝐴 满足 𝐴2 = 𝐴, 求证: 𝐴 的特征值只能是 0 或 1.
160 第5章 特征值与二次型

12. 设非零向量 𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T , 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ]T , 且 𝛼T 𝛽 = 0, 𝐴 = 𝛼𝛽 T , 求 𝐴


的特征值和特征向量.
13. 已知 𝜆1 = 2 是 3 阶矩阵 𝐴 的一个特征值, 𝛼1 = [1, 2, 0], 𝛼2 = [1, 0, 1] 是 𝐴 属于特征
值 2 的两个特征向量, 𝛽 = [−1, 2, −1]T , 计算 𝐴𝛽.
 
𝑎 −1 𝑐
14. 设矩阵 𝐴 =  5 𝑏 3 , 且 det(𝐴) = −1, 伴随矩阵 𝐴* 有特征值 𝜆0 , 属于
 

1−𝑐 0 −𝑎

𝜆0 的特征向量为 𝛼 = [−1, −1, 1]T , 求 𝑎, 𝑏, 𝑐, 以及 𝜆0 .


15. 若 𝑛 阶方阵 𝐴 的每行元素之和为常数 𝑐, 证明:𝑐 是 𝐴 的一个特征值;∀𝑚 ∈ N, 𝐴𝑚
的每行元素之和为 𝑐𝑚 .
16. 设 𝐴, 𝐵 均为 𝑛 阶可逆矩阵, 且满足 𝐴2 + 𝐴 = 𝑂, 𝐵 2 + 𝐵 = 𝑂.
证明:(1) −1 是 𝐴, 𝐵 的特征值;
(2) 若 𝐴𝐵 = 𝐵𝐴 = 𝑂, 𝜂1 , 𝜂2 分别是 𝐴, 𝐵 的对应于特征值 𝜆 = −1 的特征向量, 则 𝜂1 ,
𝜂2 线性无关.
17. 设向量 𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T , 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ]T 都是非零向量, 且满足 𝛼T 𝛽 = 0, 记
𝑛 阶矩阵 𝐴 = 𝛼𝛽 T , 求 𝐴 的特征值和特征向量.
18. 设 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 是 𝐴 的属于 𝜆0 的特征向量, 试证 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 的任一非零线性组
合也是 𝐴 的属于 𝜆0 的特征向量.
19. 设 𝑥1 , 𝑥2 分别是属于 𝜆1 , 𝜆2 的特征向量, 而且 𝜆1 ̸= 𝜆2 , 试证 𝑥1 + 𝑥2 不可能是 𝐴 的特
征向量.
20. 设 𝐴 为 𝑛 阶可逆矩阵, 证明其特征值 𝜆0 ̸= 0, 而且 𝜆−1
0 是𝐴
−1
的特征值.
21. 证明 𝑛 阶方阵 𝐴 的特征值 𝜆0 的平方是 𝐴2 的特征值.
22. 设 𝐴 为 𝑛 阶矩阵, 证明 𝐴T 与 𝐴 有相同的特征值.
23. 设 3 阶矩阵 𝐴 的特征值为 −1, 1, 2, 求矩阵 𝐴2 + 𝐴 − 2𝐼 的特征值.
24. 设 𝐴 = 𝑢𝑣 T , 其中 𝑢, 𝑣 都是 𝑛 元非零列向量, 求证: 𝑢 是 𝐴 的特征向量, 并求出其对应
的特征值.
   
2 0 0 2
25. 设 𝐴 =  0 0 1 , 𝐵 =  𝑦 , 已知 𝐴 与 𝐵 相似, 求 𝑥, 𝑦.
   

0 1 𝑥 −1
– ™
−3 2
26. 设 𝐴 = .
−2 2
(1) 求可逆矩阵 𝑃 使得 𝑃 −1 𝐴𝑃 为对角矩阵;
(2) 计算 𝐴10 − 𝐴6 − 𝐼.
 
1 −1 1
27. 已知方阵 𝐴 =  𝑥 4 𝑦  与对角矩阵相似, 且 𝜆 = 2 是 𝐴 的二重特征值.
 

−3 −3 5
(1) 求 𝑥 与 𝑦 的值;
5.5 习 题 161

(2) 求可逆矩阵 𝑃 使得 𝑃 −1 𝐴𝑃 为对角阵.


28. 已知矩阵 𝐴, 求使 𝑄−1 𝐴𝑄 为对角阵的正交矩阵 𝑄.
   
1 1 1 3 2 4
(1) 𝐴 =  1 1 1 ; (2) 𝐴 =  2 0 2 .
   

1 1 1 4 2 3
   
−2 0 0 −1 0 0
29. 设 𝐴 与 𝐵 相似, 其中 𝐴 =  2 𝑥 2 , 𝐵 =  0 2 0 .
   

3 1 1 0 0 𝑦
(1) 求 𝑥 与 𝑦;
(2) 求可逆矩阵 𝑃 , 使得 𝑃 −1 𝐴𝑃 = 𝐵.
 
0 0 1
30. 设矩阵 𝐴 =  𝑎 1 𝑏  有三个线性无关的特征向量, 求 𝑎, 𝑏 满足的条件, 并求可逆
 

1 0 0
−1
矩阵 𝑃 , 使得 𝑃 𝐴𝑃 为对角阵.
 
1 −1 1
31. 设矩阵 𝐴 =  𝑥 4 𝑦  , 已知 𝐴 有三个线性无关的特征向量, 𝜆 = 2 是 𝐴 的二
 

−3 −3 5
−1
重特征值, 求可逆矩阵 𝑃 , 使得 𝑃 𝐴𝑃 为对角矩阵.
 100
1 2 2
32. 计算  2 1 2  .
 

2 2 1
33. 设上三角阵
 
𝑎11 𝑎12 ··· 𝑎1𝑛
···
 0 𝑎22 𝑎2𝑛

 
𝐴=
 .. .. ..


 . . . 
0 0 ··· 𝑎𝑛𝑛

它的对角线元素各不相同, 证明 𝐴 可以化为对角阵.

34. 求二次型 𝑓 的矩阵:


(1) 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 2𝑥21 − 𝑥22 + 3𝑥23 − 4𝑥1 𝑥2 + 6𝑥1 𝑥3 ;
(2) 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = (𝑥1 + 𝑥2 )2 + (𝑥2 − 𝑥3 )2 + (𝑥3 + 𝑥1 )2 .
35. 用正交变换法将二次型 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥21 + 4𝑥22 + 4𝑥23 − 4𝑥1 𝑥2 + 4𝑥1 𝑥3 − 8𝑥2 𝑥3 化为
标准形, 写出所作的正交变换.
36. 二次型 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥T 𝐴𝑥 = 𝑎𝑥21 + 2𝑥22 − 2𝑥23 + 2𝑏𝑥1 𝑥3 (𝑏 > 0), 其中二次型 𝑓 的矩
阵 𝐴 的特征值之和为 1, 特征值之积为 12, 求
(1) 𝑎, 𝑏 的值;
(2) 用正交变换将 𝑓 化为标准形, 写出所作的正交变换及对应的正交矩阵.
162 第5章 特征值与二次型

37. 二次型 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥22 + 𝑥23 + 2𝑎𝑥1 𝑥2 + 2𝑥1 𝑥3 + 2𝑏𝑥2 𝑥3 经正交变换 𝑥 = 𝑄𝑦 化为


标准形 𝑓 (𝑦1 , 𝑦2 , 𝑦3 ) = 𝑦22 + 2𝑦32 , 求 𝑎, 𝑏.
38. 已知二次型 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 4𝑥22 + 4𝑥23 + 4𝑥1 𝑥2 + 𝑎𝑥1 𝑥3 − 4𝑥2 𝑥3 的秩为 2,
(1) 求 𝑎 的值;
(2) 求正交变换 𝑥 = 𝑃 𝑦 把 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) 化为标准形;
(3) 求 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 0 的解.
39. 判断二次型的正定性:
(1) 𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 5𝑥21 + 𝑥22 + 5𝑥23 + 4𝑥1 𝑥2 − 8𝑥1 𝑥3 − 4𝑥2 𝑥3 ;
(2) 𝑓 (𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 ) = 𝑥21 + 𝑥22 + 14𝑥3 + 7𝑥24 + 6𝑥1 𝑥3 + 8𝑥1 𝑥4 − 4𝑥2 𝑥3 + 2𝑥2 𝑥4 + 4𝑥3 𝑥4 .
P𝑛
40. 判断二次型 𝑓 = 𝑥2𝑖 + 𝑥𝑖 𝑥𝑗 的正定性.
P
𝑖=0 16𝑖<𝑗6𝑛
41. 设为 3 阶实对称矩阵, 且满足 𝐴2 + 2𝐴 = 𝑂, rank(𝐴) = 2,
(1) 求 𝐴 的特征值;
(2) 当 𝑘 为何值时, 矩阵 𝐴 + 𝑘𝐼 为正定矩阵?
42. 设 𝐴 是 𝑛 阶实对称矩阵, 证明 rank(𝐴) = 𝑛 的充要条件是存在一个 𝑛 阶实矩阵 𝐵, 使
得 𝐴𝐵 + 𝐵 T 𝐴 正定?
43. 若 𝐴 是 𝑛 阶实矩阵, 则 tr(𝐴𝐴T ) > 0, 等号成立的充要条件是 𝐴 = 𝑂.

44. 设 𝐴 是 𝑛 阶正定矩阵, 证明: 对任意 𝑛 阶矩阵 𝐵, rank(𝐵 T 𝐴𝐵) =rank(𝐵).


第6章 矩 阵 分 解

6.1 LU 分 解

定 理 6.1.1 设 𝑚 × 𝑛 矩阵 𝐴 可以只经行初等变换化为阶梯型 (这里的行初


等变换不包括行对换), 则 矩阵 𝐴 可分解成 𝐴 = 𝐿𝑈 , 其中 𝐿 是主对角线元素全
是 1 的 𝑚 阶下三角矩阵, 𝑈 是一个 𝑚 × 𝑛 阶梯型矩阵, 这样一个分解称为矩阵 𝐴
的 LU分
分解 (LU factorization).
证明 设 𝑚 × 𝑛 矩阵 𝐴 可以化为 𝑚 × 𝑛 阶梯型矩阵 𝑈 , 化简过程中仅用行倍
加变换, 即把一行的倍数加于它下面的另一行. 于是, 存在主对角线元素全是 1 的
下三角初等矩阵 𝐸1 , · · · , 𝐸𝑝 使

𝐸𝑝 · · · 𝐸1 𝐴 = 𝑈 (6.1)

从而
𝐴 = (𝐸𝑝 · · · 𝐸1 )−1 𝑈 = 𝐿𝑈

其中
𝐿 = (𝐸𝑝 · · · 𝐸1 )−1 (6.2)

我们称主对角线元素全是 1 的下三角矩阵为 单 位 下 三 角 矩 阵 , 可以证明, 两个单


位下三角矩阵的积是单位下三角矩阵, 单位下三角矩阵的逆矩阵也是单位下三角
矩阵, 因此 𝐿 是单位下三角矩阵.
由式(6.2) 可得

𝐸𝑝 · · · 𝐸1 𝐿 = (𝐸𝑝 · · · 𝐸1 )(𝐸𝑝 · · · 𝐸1 )−1 = 𝐼 (6.3)

比较式(6.1) 与式(6.3) 可知, 式(6.1) 中的行变换把 𝐴 化为 𝑈 , 同时也可把 式(6.3)


中的 𝐿 化为单位阵 𝐼.
注 矩阵 𝐴 的 LU 分解算法总结如下:
(1) 如果可能的话, 用一系列的行倍加变换把 𝐴 化为阶梯型;
(2) 填充 𝐿 的元素可经相同的行变换把 𝐿 变为单位阵 𝐼.
164 第6章 矩 阵 分 解

例6.1.1 求下列矩阵的 LU 分解:


 
2 4 −1 5 −2
 
 −4 −5 3 −8 1 
𝐴=
 

 2
 −5 −4 1 8 

−6 0 7 −3 1

解 因矩阵 𝐴 有 4 行, 故矩阵 𝐿 应为 4 阶单位下三角矩阵, 𝐿 的第一列应该


是 𝐴 的第一列除以它的第一行主元元素:
 
1 0 0 0
 
 −2 1 0 0 
𝐿=
 

 1
 * 1 0 

−3 * * 1

比较 𝐴 和 𝐿 的第一列. 把 𝐴 第一列的后 3 个元素变成 0 的行变换同时也将 𝐿 的


第一列的后 3 个元素变成 0, 同理对 𝐿 的其他各列也成立. 以下是 𝐴 化成阶梯型
𝑈 的过程:
   
2 4 −1 5 −2 2 4 −1 5 −2
  
 −4 −5 3 −8 1   0 3 1 2 −3 
𝐴= →
   

 2
 −5 −4 1 8 

 0
 −9 −3 −4 10 

−6 0 7 −3 1 0 12 4 12 −5
   
2 4 −1 5 −2 2 4 −1 5 −2
   
 0 3 1 2 −3  0 3 1 2 −3
→ → =𝑈
   
 0 0 0 2 1  0 0 0 2 1
   
0 0 0 4 7 0 0 0 0 5

上式中标出的元素确定了将 𝐴 化为 𝑈 的行变换. 在每个主元列, 把标出的元素除


以主元后将结果放入 𝐿 的左下方:
 
1 0 0 0
 
 −2 1 0 0 
𝐿=
 

 1
 −3 1 0 

−3 4 2 1
6.2 QR 分 解 165

这样, 与 𝐴 化为 𝑈 一样, 𝐿 经相同的行初等变换可化为单位阵 𝐼. 不难验证, 所求


出的 𝐿 和 𝑈 满足 𝐴 = 𝐿𝑈 .
下面讨论矩阵 LU分解的应用.
设 𝐴 = 𝐿𝑈 , 方程组 𝐴𝑥 = 𝑏 可写成 𝐿(𝑈 𝑥) = 𝑏, 故 𝐴𝑥 = 𝑏 可以由两个方
程组: 𝐿𝑦 = 𝑏, 𝑈 𝑥 = 𝑦 来求解. 首先解 𝐿𝑦 = 𝑏 求得 𝑦, 然后解 𝑈 𝑥 = 𝑦 求得 𝑥, 由
于 𝐿 和 𝑈 都是三角矩阵, 所以每个方程组都更易求解. LU 分解的计算效率依赖
于如何求 𝐿 和 𝑈 , LU 分解算法表明, 𝐴 经行初等变换化为阶梯型矩阵 𝑈 的运算
同时也求出了 𝐿 而不需要额外的运算, 因而也实现了 LU 分解.

6.2 QR 分 解

首先, 回顾向量组的 Schmidt 正交化过程. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 为 𝑛维 Euclid 空


𝑛
间 R 的一组基, 先取
𝛼1
q1 =
‖ 𝛼1 ‖
𝛼2 在 q1 上的正交投影为 q1 qT
1 𝛼2 , 取

𝛼2 − q1 qT
1 𝛼2
q2 =
‖ 𝛼2 − q1 qT
1 𝛼2 ‖

𝛼3 在 span (q1 , q2 )上的正交投影为 q1 qT


1 𝛼3 + q2 q2 𝛼3 , 取
T

𝛼3 − q1 qT T
1 𝛼3 − q2 q2 𝛼3
q3 =
‖ 𝛼3 − q1 q1 𝛼3 − q2 qT
T
2 𝛼3 ‖

继续上面的做法, 设已求得两两正交的单位向量组 q1 , q2 , · · · , q𝑛−1 , 再求第 𝑛 个标


准正交向量:

𝛼𝑛 − q1 qT T T
1 𝛼𝑛 − q2 q2 𝛼𝑛 − · · · − q𝑛−1 q𝑛−1 𝛼𝑛
q𝑛 =
‖ 𝛼𝑛 − q1 qT T T
1 𝛼𝑛 − q2 q2 𝛼𝑛 − · · · − q𝑛−1 q𝑛−1 𝛼𝑛 ‖

由此得到的向量组 q1 , q2 , · · · , q𝑛 即为所求的标准正交基. 在上述 Schmidt 正交化


过程中, 因为 span(𝛼1 ) = span(q1 ), 𝛼1 ∈ span(𝛼1 ), 故 𝛼1 ∈ span(q1 ), 从而 𝛼1 在
span(q1 )中的正交投影是其自身

𝛼1 = q1 qT
1 𝛼1
166 第6章 矩 阵 分 解

因为
span(𝛼1 , 𝛼2 ) = span(q1 , q2 ), 𝛼2 ∈ span(𝛼1 , 𝛼2 )

故 𝛼2 ∈ span( q1 , q2 ), 从 而 𝛼2 在 span(q1 , q2 )中 的 正 交 投 影 是 其 自 身 𝛼2 =
1 𝛼2 + q2 q2 𝛼2 , 依此下去, 因为 span (𝛼1 , · · · , 𝛼𝑛 ) = span(q1 , · · · , qn ), 𝛼n ∈
q1 qT T

span(𝛼1 , · · · , 𝛼n ), 故 𝛼𝑛 ∈ span(q1 , · · · , qn ), 从而 𝛼n 在 span(q1 , · · · , qn ) 中的正交


投影是其自身
𝛼𝑛 = q1 qT T
1 𝛼𝑛 + · · · + q𝑛 q𝑛 𝛼𝑛

因此得

[𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ] = [q1 qT T T T T
1 𝛼1 , q1 q1 𝛼2 + q2 q2 𝛼2 , · · · , q1 q1 𝛼𝑛 + · · · + q𝑛 q𝑛 𝛼𝑛 ]
 
qT T T
1 𝛼1 q1 𝛼2 · · · q1 𝛼𝑛
 

 0 qT T
2 𝛼2 · · · q2 𝛼𝑛


= [q1 , q2 , · · · , q𝑛 ] 
 .. .. ..



 . . . 

0 0 · · · qT
𝑛 𝛼𝑛


𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ], Q = [q1 , q2 , · · · , q𝑛 ]
 
qT T T
1 𝛼1 q1 𝛼2 . . . q1 𝛼𝑛
 

 0 qT T
2 𝛼2 · · · q2 𝛼𝑛


𝑅=
 .. .. ..



 . . . 

0 0 · · · qT
𝑛 𝛼𝑛

则 𝐴 = Q𝑅, 其中 𝐴 是列满秩矩阵, Q 是列向量标准正交的矩阵, 𝑅 是上三角矩


阵, 上式称为QR分
分 解 (QR factorization). 特别地, 当 𝐴 是可逆矩阵时, 其可分解为
正交阵与上三角阵之积.
注 因 Q 是列向量标准正交阵, 故有 QT Q = 𝐼, 从而 QT 𝐴 = QT Q𝑅 = 𝑅.
例6.2.1 设矩阵  
1 0 0
 
 1 1 0 
𝐴=
 

 1 1 1 
 
1 1 1

试对 𝐴 进行 QR 分解.

解 矩阵 𝐴 的列向量
6.2 QR 分 解 167

     
1 0 0
     
 1   1   0 
𝛼1 =   , 𝛼2 =   , 𝛼3 =  
     
 1   1   1 
     
1 1 1

线性无关, 将其 Schmidt 正交化, 得


3
 
1
 
−√
 
0
 2  
 12 
  
  
1
  2 
1 −√
 

     
6
     
q1 = 
 2 ,
 
q2 =  12 
,

q3 = 

1 1 
 1    


  
 √ 


 6



2   12   
1
     
 1   1  √
√ 6
2 12

因此 
1 3

−√ 0

 2 12 

1 1 2 
 
√ −√ 



Q= 2 12 6 

 1 1 1 
 √ √ 
2
 

 12 6 
 1 1 1 
√ √
2 12 6
从而
1 1 1 1
 
 
 2 2 2 2  1 0 0
  
 3 1 1 1  1 1 0 
𝑅 = QT 𝐴 =  −√ √ √ √
  
 

 12 12 12 12  1
 1 1 

 2 1 1 
0 −√ √ √ 1 1 1
6 6 6
3
 
 2 2
1
 
 3 2 
= 0
 √ √ 


 12 12 

 2 
0 0 √
6


168 第6章 矩 阵 分 解

1 3
 
−√ 0
2  3

 12  2
 1
1 1 2  2
  
√ √

 − 
3 2 

2


𝐴= 12 6 
 0 √ √  = Q𝑅

 1 1 1   12 12 
 √ √   2 

2


 12 6  
 0 0 √
 1 1 1  6
√ √
2 12 6

6.3 Cholesky 分 解

定 理 6.3.1 设 𝐴是正定矩阵, 则存在对角线元素均大于零的上三角矩阵 𝑅,


使得 𝐴 = 𝑅T 𝑅.
上式称为矩阵的 Cholesky分
分解 (Cholesky decomposition).
证明 设 𝐴 为 𝑛 阶正定矩阵, 存在正交阵 𝑃 使 𝐴 = 𝑃 Λ𝑃 T , 其中对角阵
 
𝜆1
 

 𝜆2 

Λ= ..

.
 
 
 
𝜆𝑛

的对角线元素均大于零.
记  √ 
𝜆1
 √ 
1

 𝜆2 

Λ2 =  ..

.
 
 
 √ 
𝜆𝑛

1 1 1 1
则𝐴 = 𝑃 Λ 2 𝑃 T 𝑃 Λ 2 𝑃 T = (𝑃 Λ 2 𝑃 T )T (𝑃 Λ 2 𝑃 T ).
1
令 𝐵 = 𝑃 Λ 2 𝑃 T , 易知 𝐵 正定, 故 𝐵 可逆, 因此存在正交阵 Q 和上三角阵 𝑅,
使得 𝐵 = 𝑄𝑅, 从而 𝐴 = 𝐵 T 𝐵 = (𝑄𝑅)T 𝑄𝑅 = 𝑅T QT 𝑄𝑅 = 𝑅T 𝑅.
首先, 可以断定 𝑅 的对角线元素均不等于零, 否则 det(𝐵) = det(Q) det(𝑅) =
0, 与 𝐵 正定矛盾.
其次, 假定存在 𝑅 的某个对角线元素小于零, 设 𝑟𝑖𝑖 < 0, 将 𝑅 的第 𝑖 行乘以
−1, 得 𝐸𝑖 (−1)𝑅. 由于(𝐸𝑖 (−1)𝑅)T 𝐸𝑖 (−1)𝑅 = 𝑅T 𝐸𝑖 (−1)𝐸𝑖 (−1)𝑅 = 𝑅T 𝑅 = 𝐴,
6.3 Cholesky 分 解 169

故可将 𝑅 的对角线元素小于零的那些行变号即可, 从而将 𝑅 化为对角线元素均


大于零的上三角矩阵.
注 矩阵的 Cholesky 分解是一种特殊的 LU 分解, 因此也可以通过 LU 分解
实现.  
4 2 −2
例6.3.1 设 𝐴 =  , 试问 𝐴 是否可以 Cholesky 分解?如果
 
 2 10 2 
−2 2 5
可以, 对 𝐴 进行 Cholesky 分解.

解 因为矩阵 𝐴 的 3 个顺序主子式均大于零

4 2 −2
4 2


Δ1 = 4 > 0, Δ2 = = 36 > 0, Δ3 = 2 10 2 = 108 > 0
2 10
−2 2 5

所以矩阵 𝐴 正定, 故 𝐴 可以 Cholesky 分解.

首先对 𝐴 进行 LU 分解, 在此基础上进行 Cholesky 分解


 
4 2 −2
 
𝐴=
 2 10 2 

−2 2 5
 
1 0 0  
  4 2 −2
1
 
  
= 1 0 
 0
 9  = 𝐿𝑈
3 
 2
1 1
 
  0 0 3
− 1
2 3

1 0 0
  1 1 
  1 −
  4 0 0  2 2 
 1   
=
 1 0  0 9 0  1 
 0 1
2   

3
 
 1 1 
0 0 3
 
− 1 0 0 1
2 3
 
1 0 0
 1 1 
 2
   1 −
 0 0 2 0 0 2 2 
1
 
 
1
  
= 1 0 
 0 3 0 
 0 3 0  0
 
1
  
2

√ √

3
 
1 1
 
  0 0 3 0 0 3
 
− 1 0 0 1
2 3
170 第6章 矩 阵 分 解

  
2 0 0 2 1 −1
T
  
=
 1 0   0 3 1  = 𝑅 𝑅
 3 
√ √
−1 1 3 0 0 3

6.4 谱 分 解

设 𝐴 为 𝑛 阶 实 对 称 矩 阵, 存 在 正 交 阵 𝑃 使𝐴 = 𝑃 Λ𝑃 T , 其 中 Λ =
diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝑃 = [𝑝1 , 𝑝2 , · · · , 𝑝𝑛 ]. 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑛) 是 𝐴 的所有特征
值, 正交阵 𝑃 的第 𝑖 列向量 𝑃𝑖 是 𝜆𝑖 对应的单位特征向量. 将上式展开, 得
  
𝜆1 0 𝑝T
1
  

 𝜆2 
 𝑝T 2


𝐴 = [𝑝1 , 𝑝2 , · · · , 𝑝𝑛 ]  ..

..

.
  



 . 

0 𝜆𝑛 𝑝T
𝑛

= 𝜆𝑝1 𝑝T T T
1 + 𝜆2 𝑝 2 𝑝 2 + · · · + 𝜆𝑛 𝑝 𝑛 𝑝 𝑛

上式中的每一项都是一个秩为 1 的 𝑛 阶方阵, 它将矩阵 𝐴 分解为 𝑛 个秩 1 矩


阵的线性组合, 每个秩 1 矩阵为特征向量的外积. 我们称上式为矩阵 𝐴 的谱
谱分
解(spectral decomposition) 或特
特征 值 分 解 .
 
7 2 
例6.4.1 设 𝐴 =  , 试对 𝐴 谱分解.
2 4
解 矩 阵 𝐴 的 特 征 值 为 8 和 3, 相 应 的 单 位 特 征 向 量 分 别 为 𝑝1 =
• 2 1 T
˜ • 1 2 ˜T
√ ,√ , 𝑝2 = − √ , √ , 故有
5 5 5 5

2 1  
2 1 
  √ −√   √ √
7 2   5 5  8 0  5 5 
𝐴= =
   
1 2 1 2
  
2 4 
√ √
 0 3  −√ √

5 5 5 5
= 8𝑝1 𝑝T T
1 + 3𝑝2 𝑝2
 4 2  1  2 

 5 5   5 5 
= 8
 2
 + 3 
1   2 4 

5 5 5 5
6.5 奇异值分解 171

6.5 奇异值分解

设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 则 𝐴T 𝐴 和 𝐴𝐴T 分别是 𝑛 阶和 𝑚 阶对


称矩阵, 且 rank(𝐴T 𝐴) =rank(𝐴𝐴T ) = 𝑟.
我们已经知道, 𝐴T 𝐴 和 𝐴𝐴T 都是半正定矩阵, 故其所有特征值均非负, 而且
𝐴T 𝐴 和 𝐴𝐴T 正特征值的个数均为 𝑟.
设 𝜆 是 𝐴T 𝐴 的正特征值, 相应的单位特征向量是 𝑣, 即 𝐴T 𝐴𝑣 = 𝜆𝑣, 𝜆 >
0, ‖𝑣‖ = 1, 等式两边左乘 𝐴, 得

𝐴(𝐴T 𝐴𝑣) = 𝐴(𝜆𝑣)

(𝐴𝐴T )(𝐴𝑣) = 𝜆(𝐴𝑣) (6.4)

由于

‖𝐴𝑣‖2 = (𝐴𝑣)T 𝐴𝑣 = 𝑣 T 𝐴T 𝐴𝑣
= 𝑣 T (𝜆𝑣) = 𝜆𝑣 T 𝑣 = 𝜆 > 0 (6.5)

故 𝐴𝑣 ̸= 0. 将式(6.4)改写为
1
 1
‹  ‹
T
(𝐴𝐴 ) √ 𝐴𝑣 = 𝜆 √ 𝐴𝑣 (6.6)
𝜆 𝜆

1
这表明 𝜆 也是 𝐴𝐴T 的特征值, 相应的单位特征向量是 √ 𝐴𝑣. 设 𝜆1 , · · · , 𝜆𝑟 是
𝜆
𝐴T 𝐴 的 𝑟 个正特征值(包括重根), 且满足 𝜆1 > 𝜆2 > · · · > 𝜆𝑟 > 0, 𝑣1 , · · · , 𝑣𝑟 是
𝐴T 𝐴 对应于 𝜆1 , · · · , 𝜆𝑟 的相互正交的单位特征向量, 则

1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟

是 𝐴𝐴T 对应于 𝜆1 , · · · , 𝜆𝑟 的单位特征向量.

由于当 𝑖 ̸= 𝑗 时
172 第6章 矩 阵 分 解

(𝐴𝑣𝑖 )T 𝐴𝑣𝑗 = 𝑣𝑖T 𝐴T 𝐴𝑣𝑗 = 𝑣𝑖T 𝜆𝑗 𝑣𝑗 = 𝜆𝑗 𝑣𝑖T 𝑣𝑗 = 0

因此
1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟
是相互正交的单位特征向量.
注 事实上, 𝐴T 𝐴 与 𝐴𝐴T 具有相同的非零特征值, 且它们的每个非零特征
值的代数重数与几何重数均相等. 请读者自行思考为什么?
定 义6.5.1 设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 𝐴T 𝐴 (或者𝐴𝐴T ) 非零特征
值 𝜆1 , · · · , 𝜆𝑟 的算术平方根称为 𝐴 的奇
奇 异 值 (singular value), 记作 𝜎1 , · · · , 𝜎𝑟 , 即

𝜎𝑖 = 𝜆𝑖 (1 6 𝑖 6 𝑟 ).
注 由式 (6.5) 可知, 𝐴 的奇异值 𝜎1 , · · · , 𝜎𝑟 分别等于向量 𝐴𝑣1 , · · · , 𝐴𝑣𝑟 的
模长.
定 理 6.5.1 (奇异值分解(singular value decomposition)) 设 𝑚 × 𝑛 矩阵 𝐴 的秩
rank(𝐴) = 𝑟, 则存在 𝑚 阶正交矩阵 𝑈 和 𝑛 阶正交矩阵 𝑉 使得 𝐴 = 𝑈 Σ𝑉 T , 其中
Σ 为 𝑚 × 𝑛 分块对角阵  
𝐷 0 
Σ=
0 0

此处 𝐷 是一个 𝑟 × 𝑟 对角阵, 𝐷 的对角线元素是 𝐴 的奇异值 𝜎1 > 𝜎2 > · · · >


𝜎𝑟 > 0.
证明 设 𝜆1 , · · · , 𝜆𝑟 , · · · , 𝜆𝑛 是 𝐴T 𝐴 的全部特征值(包括重根), 且满足

𝜆1 > · · · > 𝜆𝑟 > 0 = 𝜆𝑟+1 = · · · = 𝜆𝑛

𝑣1 , · · · , 𝑣𝑟 · · · , 𝑣𝑛 是 𝐴T 𝐴 对应于 𝜆1 , · · · , 𝜆𝑟 , · · · , 𝜆𝑛 的相互正交的单位特征向
量. 记 𝑉 = [𝑣1 , · · · , 𝑣𝑟 , · · · , 𝑣𝑛 ], 则 𝑉 是 𝑛 阶正交矩阵.
由前面的讨论知
1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟
是 𝐴𝐴T 对应于 𝜆1 , · · · , 𝜆𝑟 的相互正交的单位特征向量. 令

1
𝑢𝑖 = √ 𝐴𝑣𝑖 (𝑖 = 1, · · · , 𝑟)
𝜆𝑖

因为 𝑢𝑖 ∈ R𝑚 , 所以 𝑢1 , · · · , 𝑢𝑟 是 R𝑚 的一个 𝑟 维子空间的标准正交基. 根据
基 扩 充 定 理, 将 𝑢1 , · · · , 𝑢𝑟 扩 充 为 R𝑚 的 标 准 正 交 基 𝑢1 , · · · , 𝑢𝑟 , · · · , 𝑢𝑚 . 记
6.5 奇异值分解 173

𝑈 = [𝑢1 , · · · , 𝑢𝑟 , · · · , 𝑢𝑛 ], 则 𝑈 是 𝑚 阶正交矩阵.
1 √
当 𝑖 = 1, · · · , 𝑟 时, 由于 𝑢𝑖 = √ 𝐴𝑣𝑖 , 所以 𝐴𝑣𝑖 = 𝜆𝑖 𝑢𝑖 (𝑖 = 1, · · · , 𝑟).
𝜆𝑖
当 𝑖 = 𝑟 + 1, · · · , 𝑛 时, 由于 𝜆𝑖 = 0,

‖𝐴𝑣𝑖 ‖2 = (𝐴𝑣𝑖 )T 𝐴𝑣𝑖 = 𝑣𝑖T 𝐴T 𝐴𝑣𝑖 = 𝑣𝑖T 𝜆𝑖 𝑣𝑖 = 0

所以 𝐴𝑣𝑖 = 0 (𝑖 = 𝑟 + 1, · · · , 𝑛). 故有

𝐴𝑉 = 𝐴[𝑣1 , · · · , 𝑣𝑟 , 𝑣𝑟+1 , · · · , 𝑣𝑛 ]
= [𝐴𝑣1 , · · · , 𝐴𝑣𝑟 , 𝐴𝑣𝑟+1 , · · · , 𝐴𝑣𝑛 ]
p p
= [ 𝜆 1 𝑢1 , · · · , 𝜆𝑟 𝑢𝑟 , 0, · · · , 0]
 √ 
𝜆1
..
 
.
 
 
 √ 
𝜆𝑟
 
 
= [𝑢1 , · · · , 𝑢𝑟 , 𝑢𝑟+1 , · · · , 𝑢𝑛 ]  
0
 
 
 
 .. 

 . 

0
 
𝜎1
..
 
.
 
 
 
𝜎𝑟
 
 
= [𝑢1 , · · · , 𝑢𝑟 , 𝑢𝑟+1 , · · · , 𝑢𝑛 ]  
0
 
 
 
 .. 

 . 

0

记 𝐷 = diag(𝜎1 , · · · , 𝜎r ), 并且
 
𝐷 0 
Σ=
0 0


 
𝐷 0 
𝐴𝑉 = 𝑈  = 𝑈Σ
0 0
174 第6章 矩 阵 分 解

由于 𝑉 是一个正交阵, 故 𝐴 = 𝑈 Σ𝑉 T .
 
1 −1
例6.5.1 设𝐴 =  , 试对 𝐴 奇异值分解.
 
 −2 2 
2 −2

 
9 −9 
解 首先, 计算 𝐴T 𝐴 =  , 𝐴T 𝐴 的特征值是 18 和 0, 相应的单
−9 9
位特征向量是 1   1 
√ √
 2   2 
𝑣1 =  , 𝑣2 =  
 1   1 
−√ √
2 2
因此
1 1  
√ √
 2 2 
𝑉 = 
 1 1 
−√ √
2 2

由于矩阵 𝐴 只有一个非零的奇异值 3 2 , 故其分解式 𝐴 = 𝑈 ΣVT 中的 Σ 为
   √ 
𝐷 0 3 2 0
   
Σ=
 0 =
0   0 0 

0 0 0 0

为构造 𝑈 , 首先计算  
1
 √
3 


 
1  
𝑢1 = √ 𝐴𝑣1 =  − √2
 

3 2 
 3 

 
 2 

3
接下来将 𝑢1 扩充为 R3 的标准正交基. 此时, 我们需要两个向量且都与 𝑢1 正交,
这等价于求方程 𝑥1 − 2𝑥2 + 𝑥3 = 0 的解, 该方程的解构成的基是

   
2 −2
   
𝑤1 = 
 1 ,
 𝑤2 = 
 0 

0 1
6.5 奇异值分解 175

将 𝑤1 , 𝑤2 Schmidt 正交化得

−2
 

2  √
√  5 
 5   
4
   
  


𝑢2 =  1 , 𝑢3 =  
 √ 5
   
 5
  
  5 
0
 √ 
5

从而得 𝑈 = [𝑢1 , 𝑢2 , 𝑢3 ], 因此
 
1 −1
 
𝐴=
 −2 2 

2 −2
 1 2 −2 
√ √
3 5 5  √  1 1 
 3 2 0 √ −√



−2 1 4   2 2 
= √ √  0 0
  
 

 3 5 5  
1 1 

2 5

0 0 √ √
2 2
 
0 √
3 5

在奇异值分解定理的证明过程中, 若将 𝑈 和 𝑉 进行分块, 使其第一块为包含


𝑟 列的子矩阵:

h i h i
𝑈= 𝑈𝑟 𝑈𝑚−𝑟 其中 𝑈𝑟 = 𝑢1 · · · 𝑢𝑟

h i h i
𝑉 = 𝑉𝑟 𝑉𝑛−𝑟 其中 𝑉𝑟 = 𝑣1 · · · 𝑣𝑟

则   
h i 𝐷 0   𝑉𝑟T 
𝐴= 𝑈𝑟 𝑈𝑚−𝑟  = 𝑈𝑟 𝐷𝑉𝑟T (6.7)
T
0 0 𝑉𝑛−𝑟

由于对角阵 𝐷 的对角元素非零, 可以定义下列形式的矩阵, 称为 𝐴 的伪


伪逆(pseudo-
inverse), 也称 moore-penrose 逆:

𝐴+ = 𝑉𝑟 𝐷 −1 𝑈𝑟T (6.8)
176 第6章 矩 阵 分 解

^ = 𝐴+ 𝑏 = 𝑉𝑟 𝐷 −1 𝑈𝑟T 𝑏, 由于
给定线性方程组 𝐴𝑥 = 𝑏, 基于 𝐴 的伪逆, 定义 𝑥
𝑉𝑟 的列向量是相互正交的单位向量, 即 𝑉𝑟T 𝑉𝑟 = 𝐼, 故

^ = (𝑈𝑟 𝐷𝑉𝑟T )(𝑉𝑟 𝐷 −1 𝑈𝑟T 𝑏)


𝐴𝑥
= 𝑈𝑟 𝐷𝐷 −1 𝑈𝑟T 𝑏
= 𝑈𝑟 𝑈𝑟T 𝑏

因 1
𝑢𝑖 = √ 𝐴𝑣𝑖 ∈ C(𝐴) (𝑖 = 1, · · · , 𝑟)
𝜆𝑖
可以验证 𝑢1 , · · · , 𝑢𝑟 是 𝐴 的列空间 C(𝐴) 的标准正交基, 从而 𝑈𝑟 𝑈𝑟T 𝑏 是 𝑏 在
C(𝐴) 上的正交投影, 因此 𝑥
^ 是 𝐴𝑥 = 𝑏 的最小二乘解. 当 𝐴 的列向量线性相关
时, 𝐴𝑥 = 𝑏 的最小二乘解并不唯一, 此时这个 𝑥
^ 在 𝐴𝑥 = 𝑏 的所有最小二乘解中
具有最小模长.

特别地, 如果矩阵 𝐴 是 𝑛 阶实对称矩阵, rank(𝐴) = 𝑟, 𝜆1 , 𝜆2 , · · · , 𝜆𝑟 是 𝐴 的


所有非零特征值(包括重根), 𝑣1 , 𝑣2 , · · · , 𝑣𝑟 是 𝐴 的对应于 𝜆1 , 𝜆2 , · · · , 𝜆𝑟 的单位特
征向量

𝐴𝑣𝑖 = 𝜆𝑖 𝑣𝑖 (𝑖 = 1, 2, · · · , 𝑟)

由于 𝐴T = 𝐴, 故

𝐴T 𝐴𝑣𝑖 = 𝐴T 𝜆𝑖 𝑣𝑖 = 𝜆𝑖 𝐴𝑣𝑖 = 𝜆2𝑖 𝑣𝑖

因此秩为 𝑟 的实对称矩阵 𝐴 的 𝑟 个非零奇异值等于其非零特征值的绝对值


|𝜆1 |, |𝜆2 |, · · · , |𝜆𝑟 |.

6.6 习 题

1. 对下列矩阵进行 LU 分解:
– ™ – ™
3 1 2 4
(1) ; (2) ;
9 5 −2 1
6.6 习 题 177

   
2 4 2 2 3 1
(3)  1 5 2 ; (4)  4 1 4 ;
   

4 −1 9 3 4 6
   
1 1 1 −2 1 2
(5)  3 5 6 ; (6)  4 1 −2 .
   

−2 2 7 −6 −3 4
2. 对下列矩阵进行 QR 分解:
   
1 2 3 1 2 4
(1)  −1 0 3 ; (2)  0 0 5 ;
   

0 −2 3 0 3 6
   
1 2 −1 1 −1 4
 2 0 1   1 4 −2 
(3)  ; (4)  .
   
 2 −4 2   1 4 2 
4 0 0 1 −1 0
3. 对下列矩阵进行 Cholesky 分解:
– ™ – ™
4 2 9 −3
(1) ; (2) ;
2 10 −3 2
   
16 8 4 9 3 −6
(3)  8 6 0 ; (4)  3 4 1 ;
   

4 0 7 −6 1 9
 
2 −1 0 0
 −1 2 −1 0 
(5)  .
 
 0 −1 2 −1 
0 0 −1 2
4. 对下列矩阵进行谱分解:
– ™
 
0 2 −1
5 4
(1) ; (2)  2 3 −2 .
 
4 5
−1 −2 0
5. 设 𝐴 是 𝑚 × 𝑛 矩阵,证明 𝐴 𝐴 与 𝐴𝐴T 具有相同的非零特征值, 且它们的每个非零特征 T

值的代数重数与几何重数均相等.
6. 对下列矩阵进行奇异值分解:
– ™ – ™
2 2 2 2
(1) ; (2) ;
1 1 −1 1

– ™
 
1 1
1 1 0
(3) ; (4)  1 1 .
 
0 1 1
0 0
178 第6章 矩 阵 分 解

7. 设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 试证明矩阵 𝐴 可以表示为 𝑟 个秩为 1 的 𝑚 × 𝑛 矩


阵之和.
8. 设实对称矩阵 𝐴 正定, 证明 𝐴 的奇异值分解即为 𝐴 的谱分解.
9. 求下列矩阵的伪逆:
– ™
 
7 1
3 2 2
(1)  0 0  ; (2) .
 
2 3 −2
5 5
^ = 𝐴+ 𝑏 是 𝐴𝑥 = 𝑏
10. 设线性方程组 𝐴𝑥 = 𝑏 无解, 系数矩阵 𝐴 的列向量线性相关, 证明 𝑥
的具有最小模长的最小二乘解, 其中 𝐴+ 是矩阵 𝐴 的伪逆.
第7章 矩阵的 Jordan 标准形

矩阵的标准形理论源于矩阵的相似性, 因为在相似矩阵的某些量具有相似不
变性, 例如, 矩阵的特征多项式、特征值(包括代数重数和几何重数)、行列式、矩
阵的迹以及矩阵的秩等, 而且相似矩阵的特征向量也可利用相似性相互求出. 对于
所有 𝑛 阶方阵构成的集合 ℳ𝑛 , 按相似性质可将这个集合划分成一系列等价类,
每个等价类可用一个“代表矩阵”表示, 即该等价类中所有矩阵都与该“代表矩
阵”相似, 作为“代表矩阵”, 希望它越简单越好. 例如, 对于可对角化矩阵, 它的
等价类就可以选择特征值构成的对角矩阵作为“代表矩阵”. 但遗憾的是, 不是
所有的方阵都可对角化, 那么, 对于这些矩阵它们的“代表矩阵”会是怎样的? 本
章将先从多项式矩阵开始, 导出矩阵的 Jordan 标准形概念, 再介绍如何求方阵的
Jordan 标准形.

7.1 多项式矩阵

7.1.1 多项式矩阵

设 𝜆 为一文字(不定元), 系数取自数域 𝐾 关于 𝜆 的所有多项式构成集合记


为 𝒦[𝜆], 它关于多项式加法和乘法构成多项式环.
定 义7.1.1 多项式环 𝒦[𝜆] 中 𝑚 × 𝑛 个元素构成的矩阵, 称为多项式矩阵, 或
𝜆-矩阵.
一般用 A(𝜆), B(𝜆), · · · 表示 𝜆-矩阵. 其中元素(多项式) 𝑎𝑖𝑗 (𝜆) 的次为其 𝜆 的
最高次, 记为 deg 𝑎𝑖𝑗 (𝜆), 矩阵 A(𝜆) 的次定义为 deg (A(𝜆)) = max deg 𝑎𝑖𝑗 (𝜆). 一个
𝑖,𝑗
𝑁 次 𝑚 × 𝑛 多项式矩阵 A(𝜆) 还可按 𝜆 的降幂写成如下形式 A(𝜆) = A𝑁 𝜆𝑁 +
A𝑁 −1 𝜆𝑁 −1 + · · · + A1 𝜆 + A0 , 其中 A𝑁 , A𝑁 −1 , · · · , A1 , A0 为 𝑚 × 𝑛 常数矩阵.
类似地, 可定义 𝜆-矩阵的加法、数乘、乘法运算, 方阵的行列式以及一般 𝜆-矩
阵的各阶子式等概念.
例 7.1.1 矩阵
 
𝜆+1 𝜆+3
A(𝜆) =  
𝜆2 + 3𝜆 + 2 𝜆2 + 5𝜆 + 4
180 第7章 矩阵的 Jordan 标准形

的行列式为 −2𝜆 − 2.

注意, 𝜆-矩阵的行列式是否为零, 要看它是否恒为零与 𝜆 无关, 虽然例子中


A(𝜆) 的行列式当 𝜆 = −1 时的值为零, 但它不是恒为零, 因此还称 A(𝜆) 的行列式
非零.
定 义 7.1.2 若非零的 𝜆-矩阵 A(𝜆) 存在非恒为零的 𝑟 阶子式 (𝑟 > 1), 而其所
有 (𝑟 + 1) 阶子式(若存在)恒为零, 则称 A(𝜆) 的秩为 𝑟, 表示为 rank (A(𝜆)), 或简记
为: 𝑟 (A(𝜆)). 约定全零矩阵的秩为 0.
例7.1.2 实数域 R 上的 3 阶矩阵 A(𝜆) 为

 
𝜆 0 1
 
A(𝜆) =  2
 𝜆 +1 𝜆 0 

−2𝜆 𝜆 −𝜆 − 1

共有 19 个子式, 存在非零的 1, 2 阶子式, 3 阶子式 det (A(𝜆)) = 0, 因此 A(𝜆) 矩阵


的秩为 𝑟 (A(𝜆)) = 2.
𝜆-矩阵的子式为 𝜆-多项式, 𝜆-方阵的伴随矩阵的元素是代数余子式, 因此伴随
矩阵还是 𝜆-矩阵. 对于一般的常数矩阵, 当矩阵行列式非零时可逆, 如 A 为常数矩
阵, 即
det A ̸= 0

则其逆矩阵可表示为
1
A−1 = A*
det A
这个概念推广到 𝜆-矩阵时需要注意, 若 A(𝜆) 的行列式非零, 用逆矩阵表达式有
1
A−1 (𝜆) = A* (𝜆), 其中 A* (𝜆) 为 A(𝜆) 的伴随矩阵, 当 det A(𝜆) 为非零常
det A(𝜆)
数时, 可知 A−1 (𝜆) 为 𝜆-矩阵, 而 det A(𝜆) 为多项式时, A−1 (𝜆) 的元素为有理分式.
为此定义如下.
定义 7.1.3 𝜆-矩阵的行列式为非零常数时, 称为单模矩阵.

显然, 单模矩阵的乘积仍是单模矩阵.
定理 7.1.1 对 𝑛 阶 𝜆-矩阵 A 存在一个多项式矩阵为它的逆矩阵, 当且仅当 A
是一个单模矩阵.

证明 充分性. 设 A 为单模矩阵, det A = 𝑑 ̸= 0, A* (𝜆) 为 A 的伴随矩阵, 有

1 *
A* (𝜆)A = |A|E, A* (𝜆)A = 𝑑E, A (𝜆)A = E
𝑑
7.1 多项式矩阵 181

1
A* (𝜆) 为 𝜆-矩阵, 所以逆矩阵 A* (𝜆) 还是 𝜆-矩阵.
𝑑
必要性. 设 det A = 𝑝(𝜆), 其逆矩阵的行列式 det A−1 (𝜆) = 𝑞(𝜆) 为 𝜆 的多项
式. 对 A(𝜆)A−1 (𝜆) = E 两边取行列式, 得 𝑝(𝜆)𝑞(𝜆) = 1 仅当 𝑝(𝜆), 𝑞(𝜆) 为非零常
数, 即 A(𝜆) 为单模矩阵时等式成立.
推论 7.1.1 单模矩阵的乘积是单模矩阵.
推论 7.1.2 单模矩阵的逆矩阵也是单模矩阵.

7.1.2 多项式矩阵的初等变换

𝜆-矩阵的初等变换有下列三类:
(1) 交换两行(列), 如交换矩阵的第 𝑖, 𝑗 行(列), 对应的初等矩阵记为 𝑃𝑖𝑗 , 即
𝑖 𝑗
 
1
 .. 

 . 

 
1
 
 
 

 0 ··· ··· ··· 1  𝑖

.. ..
 
 

 . 1 . 

𝑃𝑖𝑗 = 
 .. .. .. 
 . . . 

.. ..
 
 

 . 1 . 

··· ··· ···
 

 1 0  𝑗

 

 1 

 .. 

 . 

1

(2) 某行(列)数乘非零常数, 如第 𝑖 行(列)数非零常数 𝑐 ̸= 0, 对应初等矩阵记为


𝑃𝑖 (𝑐), 即
𝑖
1
 
 .. 

 . 0 

𝑃𝑖 (𝑐) = 
 
 𝑐  𝑖


.. 

 0 . 

1
182 第7章 矩阵的 Jordan 标准形

(3) 某行(列)数乘一个多项式加到另一行(列), 如将矩阵的第 𝑗 行(列)数乘多项


式 𝑝(𝜆) 加到第 𝑖 行(列), 对应初等矩阵记为 𝑃𝑖𝑗 (𝑝(𝜆)),

𝑖 𝑗
 
1
 .. 

 . 

 

 1 ··· 𝑝(𝜆)  𝑖

.. ..
 
𝑃𝑖𝑗 (𝑝(𝜆)) =  .


 . 

 

 1  𝑗

 .. 

 . 

1

易 证 这 三 类 初 等 变 换 矩 阵 是 单 模 矩 阵, 且 𝑃𝑖𝑗−1 = 𝑃𝑖𝑗 , 𝑃𝑖𝑗−1 (𝑝(𝜆)) =


𝑃𝑖𝑗 (−𝑝(𝜆)). 多项式矩阵的核心问题之一是: 如何通过初等变换将它化成标准
形式, 1.4 节证明了数字矩阵可以通过初等变换化成对角阵, 而且对角线元素只包
含“0”和“1”, 下面我们将证明 𝜆-矩阵也能通过上述初等变换化成 (多项式) 对
角矩阵.
定 义 7.1.4 设 A(𝜆), B(𝜆) 为 𝑚 × 𝑛 多项式矩阵, 若 A(𝜆) 通过一系列初等变
换变到 B(𝜆), 则称 A(𝜆) 和 B(𝜆) 等价.
等价是同阶多项式矩阵之间的一种关系, 它具有自反性、对称性和传递性.
定 理 7.1.2 设 A(𝜆) 和 B(𝜆) 是两个 𝑚 × 𝑛 多项式矩阵, 若A(𝜆) 与 B(𝜆) 等价,
则存在 𝑚 阶和 𝑛 阶单模矩阵 𝑃 (𝜆) 和 Q(𝜆) 使得 A(𝜆) = 𝑃 (𝜆)B(𝜆)Q(𝜆).
证明 因 A(𝜆) 和 Q(𝜆) 等价, 由 Q(𝜆) 经有限次的初等变换, 得到 A(𝜆), 即存
在一系列 𝑚 阶初等矩阵 𝑃1 (𝜆), 𝑃2 (𝜆), · · · , 𝑃𝑠 (𝜆) 及一系列 𝑛 阶初等矩阵 Q1 (𝜆),
Q2 (𝜆), · · · , Q𝑡 (𝜆), 使得

𝑃𝑠 (𝜆)𝑃𝑠−1 (𝜆) · · · Q1 (𝜆)B(𝜆)Q1 (𝜆)Q2 (𝜆) · · · Q𝑡 (𝜆) = A(𝜆)


𝑃 (𝜆) = 𝑃𝑠 (𝜆)𝑃𝑠−1 (𝜆) · · · Q1 (𝜆), Q(𝜆) = Q1 (𝜆)Q2 (𝜆) · · · Q𝑡

都是初等矩阵的乘积, 而且初等矩阵均为单模矩阵, 因此 𝑃 (𝜆) 和 Q(𝜆) 都是单模


矩阵.
7.1 多项式矩阵 183

定理 7.1.3 任一 𝑚 × 𝑛 多项式矩阵 A(𝜆) 都可等价于下列形式的矩阵


 
𝑑1 (𝜆) 0 ··· 0 0 ··· 0
 

 0 𝑑2 (𝜆) · · · 0 0 ··· 0 
 .. .. .. .. .. 
. . . . . 
 

 
0 0 · · · 𝑑𝑟 (𝜆) 0 · · · 0  (7.1)
 

 
0 0 ··· 0 0 ··· 0
 
 
.. .. .. .. ..
 
 

 . . . . . 

0 0 ··· 0 0 ··· 0

其中 𝑑𝑗 (𝜆)(𝑗 = 1, 2, · · · , 𝑟) 是首一多项式, 且满足: 𝑑𝑖 (𝜆) 𝑑𝑖+1 (𝜆), 𝑖 = 1, 2, · · · , 𝑟 − 1


表示多项式 𝑑𝑖 (𝜆) 整除 𝑑𝑖+1 (𝜆).


称形如 (7.1) 的矩阵为多项式矩阵的 Smith 标准形. 为了证明这个定理, 先引
入并证明下面引理.
引 理 7.1.1 任一 𝑚 × 𝑛 非零多项式矩阵 A(𝜆) 可通过一系列初等变换, 将它
变换成下列形式:  
𝑑 (𝜆)
 1
0 
(7.2)
0 A1 (𝜆)

其中 A1 (𝜆) 为 (𝑚 − 1) × (𝑛 − 1) 多项式矩阵, 且 𝑑1 (𝜆) 能整除 A1 (𝜆) 中所有元素.


证明 设
 
𝑎11 (𝜆) 𝑎12 (𝜆) ··· 𝑎1𝑛 (𝜆)
 
 𝑎 (𝜆)
 21 𝑎22 (𝜆) ··· 𝑎2𝑛 (𝜆) 

A(𝜆) = 
 .. .. ..



 . . . 

𝑎𝑚1 (𝜆) 𝑎𝑚2 (𝜆) · · · 𝑎𝑚𝑛 (𝜆)

假设 𝑎11 ̸= 0, 否则因 A(𝜆) 非零, 一定存在某个 𝑎𝑖𝑗 (𝜆) ̸= 0, 通过交换行(列)初等变


换可将它换至第一行第一列.
考察第一行和第一列元素: 𝑎1𝑗 , 𝑎𝑖1 (𝑗 = 2, 3, · · · , 𝑛, 𝑖 = 2, 3, · · · , 𝑚).
(1) 检 查 𝑎11 (𝜆) 是 否 能 整 除 元 素 𝑎1𝑗 (𝜆) 和 𝑎𝑖1 , 如 果 可 以, 假 设 𝑎1𝑗 (𝜆) =
𝑎11 (𝜆)𝑝𝑗 (𝜆) 及 𝑎𝑖1 = 𝑎11 (𝜆)𝑞𝑖 (𝜆), 实施第三类初等变换, 将第一列数乘 −𝑝𝑗 (𝜆)
加到第 𝑗 列 (右乘初等矩阵), 再将第一行元素数乘 −𝑝𝑖 (𝜆) 加到第 𝑖 行, 变换后矩阵
元素 (1, 𝑗) 和 (𝑖, 1)(𝑗 = 2, 3, · · · , 𝑛;𝑖 = 2, 3, · · · , 𝑚) 变换成零. 否则, 转(2).
184 第7章 矩阵的 Jordan 标准形

(2) 𝑎11 (𝜆) 不能整除 𝑎1𝑗 (𝜆) 和 𝑎𝑖1 (𝜆), 利用多项式的分解, 将它们表示成

𝑎1𝑗 (𝜆) = 𝑎11 (𝜆)𝑝𝑗 (𝜆) + 𝑟𝑗 (𝜆), 且 deg 𝑟𝑗 (𝜆) < deg 𝑎11 (𝜆)


𝑎𝑖1 (𝜆) = 𝑎11 (𝜆)𝑞𝑖 (𝜆) + 𝑠𝑖 (𝜆), 且 deg 𝑠𝑖 (𝜆) < deg 𝑎11 (𝜆)

再实施初等变换: 第一列数乘 −𝑝𝑗 (𝜆) 加到第 𝑗 列或第一行数乘 −𝑞𝑖 (𝜆), 再将


第一行和第一列中次数最低的非零多项式通过交换变换到矩阵的 (1, 1) 位置. 重复
步骤(1).

经过有限步的初等变换后, 得到形如下式的矩阵:
 
𝑏11 (𝜆) 0 ··· 0
 

 0 𝑏22 (𝜆) ··· 𝑏2𝑛 (𝜆) 


 .. .. ..

 (7.3)

 . . . 

0 𝑏𝑚2 (𝜆) · · · 𝑏𝑚𝑛 (𝜆)

此时, 若 𝑏11 (𝜆) 能整除所有的𝑏𝑖𝑗 (𝜆)(𝑖 = 2, 3, · · · , 𝑚; 𝑗 = 2, 3, · · · , 𝑛), 则引理得


证. 否则, 若存在𝑏𝑖𝑗 (𝜆) 不能被𝑏11 (𝜆) 整除, 设 𝑏𝑖𝑗 (𝜆) = 𝑏11 (𝜆)𝑞𝑖𝑗 (𝜆) + 𝑟𝑖𝑗 (𝜆), 且
deg 𝑟𝑖𝑗 (𝜆) < deg 𝑏11 (𝜆) 将第 𝑗 行加到第一列, 再将第一行数乘 −𝑞𝑖𝑗 (𝜆) 加到第 𝑖 列,
此时矩阵 (𝑖, 1) 元素为 𝑟𝑖𝑗 (𝜆), 交换 1, 𝑖 两行, 再重复步骤(1), (2). 这样经过有限次
的迭代后形成形如 (7.1) 的矩阵, 而且 𝑑1 (𝜆) 整除 A1 (𝜆) 的所有元素.

下面再利用引理7.1.1证明定理7.1.3.

证明 当 A(𝜆) = 0 时, 结论自然成立. 否则根据引理 7.1.1 可将 A(𝜆) 化成


 
𝑑 (𝜆)
 1
0 
0 A1 (𝜆)

且 𝑑1 (𝜆) 能整除 A1 (𝜆) 中所有元素. 此时若 A1 (𝜆) ̸= 0, 继续引用引理7.1.1将 A1 (𝜆)


化成  
𝑑
 2
(𝜆) 0 
0 A2 (𝜆)

因 A1 (𝜆) 中所有元素包含因子 𝑑1 (𝜆), 故 𝑑2 (𝜆) 包含因子 𝑑1 (𝜆), 且能整除 A2 (𝜆) 中


7.1 多项式矩阵 185

所有元素, 有限次地利用引理7.1.1可将矩阵 A(𝜆) 化成

 
𝑑1 (𝜆)
..
 
.
 
 
 
𝑑𝑟 (𝜆)
 
 
 
0
 
 
 
 .. 

 . 

0

且 𝑑𝑖 (𝜆) | 𝑑𝑖+1 (𝜆)(𝑖 = 1, 2, · · · , 𝑟 − 1). 若 𝑑𝑖 (𝜆) 不是首一多项式, 用第二类初等变


换对第 𝑖 行(列)乘上一非零常数, 将它变成首一多项式.
例7.1.3 求多项式矩阵
 
−2𝜆3 + 2𝜆2 −2𝜆4 −2𝜆 − 2
 
A(𝜆) = 
 𝜆2 − 𝜆 𝜆3 1 

𝜆2 − 𝜆 𝜆3 − 𝜆 −𝜆 + 1

的 Smith 标准形.

 
1 𝜆3 𝜆2 − 𝜆
swap(𝑅1 , 𝑅2 )  
A(𝜆) −−−−−−−−→ 
 −2𝜆 − 2 −2𝜆4 −2𝜆3 + 2𝜆2 
swap(𝐶1 , 𝐶3 )

−𝜆 + 1 𝜆3 − 𝜆 𝜆2 − 𝜆
 
1 𝜆3 𝜆2 − 𝜆
𝑅2 +(2𝜆+2)×𝑅1  
−−−−−−−−−−→ 
 0 2𝜆3 2𝜆2 − 2𝜆 
𝑅3 +(𝜆−1)×𝑅1

0 𝜆4 − 𝜆 𝜆 3 − 𝜆2
 
1 0 0
𝐶2 +(−𝜆3 )×𝐶1  
−−−−−−−
2
−−−−→ 
 0 2𝜆3 2𝜆2 − 2𝜆 
𝐶3 +(−𝜆 +𝜆)×𝐶1

0 𝜆4 − 𝜆 𝜆 3 − 𝜆2
 
1 0 0
𝑅3 +(−𝜆/2)×𝑅2  
−−−−−−−−−−→ 
 0 −𝜆 0 
swap(𝑅2 , 𝑅3 )

0 2𝜆3 2𝜆2 − 2𝜆
186 第7章 矩阵的 Jordan 标准形

 
1 0 0
𝑅3 +(2𝜆2 )×𝑅2  
−−−−−−−−−→ 
 0 −𝜆 0 

0 0 2𝜆2 − 2𝜆
 
1 0 0
(−1)×𝑅2  
−−−−−−→ 
 0 𝜆 0 
(1/2)×𝑅3

0 0 𝜆2 − 𝜆

例7.1.4 求矩阵
 
𝜆(𝜆 + 1)

 0 

 𝜆2 
A(𝜆) = 
 


 (𝜆 + 1)2 

 0 
𝜆(𝜆 − 1)

的 Smith 标准形.

A(𝜆)
 
𝜆
 
𝑅2 −𝑅1 ;𝐶2 +𝐶1 ;swap(𝑅1 ,𝑅2 )
 𝜆2 (𝜆 + 1) 
−−−−−−−−−−−−−−−−−−−−−−−−−−−→ 
 

swap(𝐶1 , 𝐶2 );𝑅2 +(𝜆+1)×𝑅1 ;𝐶2 −(𝜆+1)×𝐶1 
 (𝜆 + 1)2 

𝜆(𝜆 − 1)
 
1
 
𝑅3 −(𝜆+2)×𝑅1 ;𝐶3 +𝐶1 ;swap(𝑅1 , 𝑅3 )
 𝜆2 (𝜆 + 1) 
−−−−−−−−−−−−−2−−−−−−−−−−−−→ 
 

swap(𝐶1 ,𝐶3 );𝐶3 +(𝜆 +2𝜆)×𝐶1 ;𝑅3 −𝜆×𝑅1 
 𝜆(𝜆 + 1)2 

𝜆(𝜆 − 1)
 
1
 
𝑅3 −𝑅2 ;𝐶3 +𝐶2 ;swap(𝑅2 , 𝑅3 )
 𝜆(𝜆 + 1) 
−−−−−−−−−−−−−−−−−−−−−→ 
 

swap(𝐶2 ,𝐶3 );𝐶3 +𝜆×𝐶2 ;𝑅3 −𝜆×𝑅2 
 𝜆2 (𝜆 + 1)2 

𝜆(𝜆 − 1)
7.1 多项式矩阵 187

 
1
 
𝑅4 −𝑅2 ;𝐶4 +𝐶2 ;swap(𝑅2 ,𝑅4 );swap(𝐶2 ,𝐶4 )
 𝜆 
−−−−−−−−−−−−−−−−−−−−−−−−−−−→ 
 

(−1/2)×𝑅2 ;𝑅4 −(𝜆+1)×𝑅2 ;𝐶4 −(𝜆+1)/2×𝐶2 
 𝜆2 (𝜆 + 1)2 

𝜆(𝜆 + 1)(𝜆 − 1)
 
1
 
swap(𝑅3 ,𝑅4 );swap(𝐶3 ,𝐶4 );𝑅4 −(𝜆+2)×𝑅3
 𝜆 
−−−−−−−−−−−−−−−−−−−−−−−−→ 
 

𝐶4 +𝐶3 ;swap(𝑅3 ,𝑅4 );swap(𝐶3 ,𝐶4 ) 
 2𝜆(𝜆 + 1) −𝜆(𝜆2 − 1)(𝜆 + 2) 

𝜆(𝜆 + 1)(𝜆 − 1) 𝜆(𝜆 + 1)(𝜆 − 1)
 
1
 
𝑅4 −(1/2)(𝜆−1)×𝑅2 ;𝐶4 +(1/2)(𝜆2 +𝜆−2)×𝐶3
 𝜆 
−−−−−−−−−−−−−−−−−−−−−−−−−−−→ 
 

(1/2)×𝑅3 ;(1/2)×𝑅4 
 𝜆(𝜆 + 1) 

𝜆2 (𝜆 + 1)2 (𝜆 − 1)

其中符号 𝑅𝑖 , 𝐶𝑗 表示第 𝑖 行和第 𝑗列, swap(𝑅𝑖 , 𝑅𝑗 ) 表示第一类初等变换, 𝑅𝑖 +


𝑝(𝜆) × 𝑅𝑗 为第三类初等变换.

7.1.3 不变因子和初等因子

7.1.2 节我们证明了多项式矩阵可通过初等变换化成 (Smith) 标准形, 那么这


种标准形是否唯一? 答案是肯定的, 为了证明它的唯一性, 先引入 𝑘 阶行列式因子
的概念.
定 义 7.1.5 设 A(𝜆) 是 𝑚 × 𝑛 多项式矩阵, 其每一个子式都是关于 𝜆 的多
项式, 称其所有 𝑘 阶子式的最大公因式为 A(𝜆) 的 𝑘 阶行列式因子(determinant
divisor), 记为 𝐷𝑘 (𝜆).
这里的最大公因式指首一多项式(唯一的). 根据定义求 𝑘 阶行列式因子时,
需要先求出所有 𝑘 阶子式, 而 𝑘(> 1) 阶子式又可表示成 (𝑘 − 1) 阶子式的组
合(行列式展开定理), 因此, (𝑘 − 1) 阶行列式因子必能整除 𝑘 阶行列式因子, 即
𝐷𝑘−1 (𝜆)|𝐷𝑘 (𝜆).
例7.1.5 求多项式矩阵
 
1−𝜆 2𝜆 − 1 𝜆
 
A(𝜆) = 
 𝜆 𝜆2 −𝜆 

1 + 𝜆2 𝜆2 + 𝜆 − 1 −𝜆2

的各阶行列式因子.
188 第7章 矩阵的 Jordan 标准形

解 1 阶子式共有 9 个 1 阶子式(矩阵的元素), 其中子式 1 − 𝜆 和 𝜆 的最大公


因子为 1. 因此, 1 阶行列式因子 𝐷1 (𝜆) = 1, 2 阶子式也有9个, 它们是

1−𝜆 2𝜆 − 1

2 3
=𝜆−𝜆 −𝜆

𝜆 𝜆2


1−𝜆 2𝜆 − 1

= 𝜆2 − 3𝜆3


1 + 𝜆2 2
𝜆 +𝜆−1


𝜆 𝜆2

= −𝜆4 + 𝜆3 − 𝜆


1 + 𝜆2 2
𝜆 +𝜆−1


1−𝜆 𝜆 1−𝜆 𝜆

= −𝜆2 − 𝜆

= −𝜆,

𝜆 −𝜆 1 + 𝜆2 −𝜆2


𝜆 −𝜆 2𝜆 − 1 𝜆

3 2

= 𝜆, = −𝜆 − 2𝜆 + 𝜆

1 + 𝜆2 2
−𝜆 𝜆2 −𝜆



2𝜆 − 1 𝜆


= −3𝜆 + 𝜆
2
𝜆 +𝜆−1 −𝜆2


𝜆2 −𝜆

= −𝜆4 + 𝜆3 + 𝜆2 − 𝜆


2 2
𝜆 +𝜆−1 −𝜆

这 9 个 2 阶子式的最大公因式为 𝜆, 因此, 2 阶行列式因子为 𝐷2 (𝜆) = 𝜆. 3 阶子式


只有 1 个, 因此, 3 阶行列式因子 𝐷3 (𝜆) = |A(𝜆)| = −𝜆4 − 𝜆2 .

设 𝑚 × 𝑛 多项式矩阵 A(𝜆) 的 Smith 标准形为

 
𝑑1 (𝜆)
 

 𝑑2 (𝜆) 

..
 
.
 
 
 
𝑑𝑟 (𝜆)
 
 
 
0
 
 
 
 .. 

 . 

0
7.1 多项式矩阵 189

它的 𝑘 阶行列式因子

 𝑘
Y
𝑑𝑖 (𝜆), 𝑘 6 𝑟


𝐷𝑘 (𝜆) = 𝑖=1


 0, 𝑘>𝑟

反之, 有

𝑑1 (𝜆) = 𝐷1 (𝜆)
𝐷𝑖 (𝜆)
𝑑𝑖 (𝜆) = , 𝑖 = 2, 3, · · · , 𝑟 (7.4)
𝐷𝑖−1 (𝜆)

那么 A(𝜆) 的各阶行列式因子与它的 Smith 标准形的各阶行列式因子之间有什么


联系?
下面先分析三类初等变换对各阶行列式因子的影响.
设 矩 阵 A(𝜆) 经 初 等 变 换 后 成 为 B(𝜆), 由 矩 阵 A(𝜆) 或 B(𝜆) 中 的 第
𝑖1 , 𝑖2 , · · · ,𝑖𝑘 行 𝑗1 , 𝑗2 , · · · , 𝑗𝑘 列 构 成 的 𝑘 阶 子 式, 将 𝑘 个 行 和 列 的 编 号 分 别 用
集合 ℛ𝑘 = {𝑖1 , 𝑖2 , · · · , 𝑖𝑘 } 和 𝒞𝑘 = {𝑗1 , 𝑗2 , · · · , 𝑗𝑘 } 表示. 并设 𝐷𝑘 (𝜆) 和 Δ𝑘 (𝜆) 分
别表示 A(𝜆), B(𝜆) 的 𝑘 阶行列式因子, 下面针对初等行变换讨论它们之间的关系,
对初等列变换的分析方法类似.
(1) 交换矩阵 A(𝜆) 的第 𝑖, 𝑗 行(第一类初等行变换), 分三种情况考察两个矩阵
的 𝑘 阶子式 𝑀𝑘 和 𝑁𝑘 之间的关系:
(i) 行 𝑖, 𝑗 ∈
/ ℛ𝑘 , 则 𝑀𝑘 = 𝑁𝑘 ;
(ii) ℛ𝑘 仅包含 𝑖, 𝑗 中的一行, 不妨设 𝑖 ∈ ℛ𝑘 而 𝑗 ∈
/ ℛ𝑘 , 则 A(𝜆) 基于集合 ℛ𝑘
和 𝒞𝑘 的子式 𝑀𝑘 , 与 B(𝜆) 基于 ℛ𝑘 − {𝑖} ∪ {𝑗}, 𝒞𝑘 的 𝑘 阶子式 𝑁𝑘′ 相等或相差一
个负号;
(iii) 𝑖, 𝑗 ∈ ℛ𝑘 , 则 𝑀𝑘 = −𝑁𝑘 .
综上所述, 两个矩阵各自 𝑘 阶子式的最大公因子 𝐷𝑘 (𝜆) = Δ𝑘 (𝜆) (它们都规范
为首一多项式), 即对矩阵实施第一类初等变换对 𝑘 阶行列式因子没有影响.
(2) 对矩阵 A(𝜆) 的第 𝑖 行数乘非零常数 𝑐 (第二类初等变换), 则:
(i) 𝑖 ∈
/ ℛ𝑘 , 𝑀𝑘 = 𝑁𝑘 ;
(ii) 𝑖 ∈ ℛ𝑘 , 𝑐𝑀𝑘 = 𝑁𝑘 (𝑐 ̸= 0为常数),
则所有 𝑘 阶子式的最大公因子 𝐷𝑘 (𝜆) = Δ𝑘 (𝜆).
(3) 将矩阵 A(𝜆) 的第 𝑗 行数乘非零多项式 𝑝(𝜆) 加到第 𝑖 行(第三类初等变
190 第7章 矩阵的 Jordan 标准形

换), 则:
/ ℛ𝑘 , 则 𝑀𝑘 = 𝑁𝑘 ;
(i) 𝑖 ∈
/ ℛ𝑘 , 记 𝑀𝑘′ 为矩阵A(𝜆) 基于 ℛ𝑘 − {𝑖} ∪ {𝑗}, 𝒞𝑘 的各阶子
(ii) 仅𝑖 ∈ ℛ𝑘 而𝑗 ∈
式, 则 𝑁𝑘 = 𝑀𝑘 + 𝑝(𝜆)𝑀𝑘′ , 由 Δ𝑘 (𝜆) 𝑁𝑘 可知Δ𝑘 𝑀𝑘 且 Δ𝑘 𝑝(𝜆)𝑀𝑘′ ;

(iii) 𝑖, 𝑗 ∈ ℛ𝑘 , 则 𝑀𝑘 = 𝑁𝑘 .
因此, 同样可得 𝐷𝑘 (𝜆) = Δ(𝑘), 即第三类初等变换也不改变矩阵的 𝑘 阶行列
式因子. 可将这一结论表述成定理.
定理 7.1.4 初等变换不改变多项式矩阵的行列式因子.
并且它也给出了求多项式矩阵 A(𝜆) 各阶行列式因子的一种方法, 即通过初
等变换将 A(𝜆) 化成标准形 𝐵(𝜆), 再求 𝐵(𝜆) 的 𝑘 阶行列式因子.
推 论 7.1.3 初等变换下等价的两个多项式矩阵有相同的行列式因子.
同样地, 若已知 A(𝜆) 的 𝑘 阶行列式因子, 利用式(7.4)可求得它的标准形.
推 论7.1.4 多项式矩阵的 Smith 标准形是唯一的.
推 论7.1.5 单模矩阵的 𝑘 行列式因子为 1.
定 义 7.1.6 多项式矩阵 A(𝜆) 的标准形中的非零多项式 𝑑𝑖 (𝜆)(𝑖 = 1, 2, · · · ,
rank (A(𝜆))) 称为 A(𝜆) 的不变因子(invariant divisor).
上述讨论说明, 凡等价的多项式矩阵具有相同的行列式因子, 也有相同的不变
因子. 反之两个 𝑚 × 𝑛 多项式矩阵有完全相同的不变因子或行列式因子, 则它们有
相同的 Smith 标准形.
定 义7.1.7 设 A(𝜆) 是多项式环 𝒦[𝜆](数域 𝐾 上的多项式环) 上的 𝑛 阶矩阵,
𝑑1 (𝜆), 𝑑2 (𝜆), · · · , 𝑑𝑟 (𝜆) 是它所有的不变因子, 若它们的标准分解式为

𝑑𝑗 (𝜆) = 𝑝1 (𝜆)𝑛1𝑗 𝑝2 (𝜆)𝑛2𝑗 · · · 𝑝𝑠 (𝜆)𝑛𝑠𝑗


𝑛𝑖𝑗 > 0, 𝑖 = 1, 2, · · · , 𝑠; 𝑗 = 1, 2, · · · , 𝑟

其中 𝑝1 (𝜆), 𝑝2 (𝜆), · · · , 𝑝𝑠 (𝜆) 是数域 𝐾 上的首一不可约多项式, 则称不变因子的分


解式中不可约多项式的方幂 𝑝𝑖 (𝜆)𝑛𝑖𝑗 (𝑛𝑖𝑗 > 0) 为矩阵 A(𝜆) 在数域 𝐾 上的初等因
子(elementary divisor). A(𝜆) 的所有初等因子(允许重复)称为 A(𝜆) 在数域 𝐾 上的
初等因子组. 若 A(𝜆) 为常数矩阵, 则定义它的初等因子和初等因子组为它的特征
矩阵 𝜆𝐸𝑛 − A 的初等因子和初等因子组.
根据定义需要注意两点: 初等因子与数域有关; 初等因子组必须是不可约因式
的全体.
7.2 Jordan 标准形 191

例7.1.6 设多项式环 𝒦[𝜆] 上矩阵 A(𝜆) 的 Smith 标准形为

 
1
 

 1 

 

 𝜆−1 

 

 𝜆2 − 1 

 

 (𝜆2 − 1)(𝜆2 − 2)(𝜆2 + 1) 

 

 0 

0

则它的不变因子为: 1, 1, 𝜆 − 1, 𝜆2 − 1, (𝜆2 − 1)(𝜆2 − 2)(𝜆2 + 1).


若 𝐾 为有理数域, 它的初等因子组为

𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆2 − 2, 𝜆2 + 1

若 𝐾 为实数域, 它的初等因子组为

√ √
𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆− 2, 𝜆+ 2, 𝜆2 + 1

若 𝐾 为复数域, 它的初等因子组为

√ √
𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆− 2, 𝜆+ 2, 𝜆 − i, 𝜆+i


上式中 i = −1.
定 理 7.1.5 两个 𝑛 阶多项式矩阵(初等变换下)等价的充要条件是: 它们有相
同的秩和初等因子组.
证明留作练习.

7.2 Jordan 标准形

第 5 章中曾讨论了数域 𝐾 上的 𝑛 阶方阵 A, 当它的几何重数等于其代数重数


时, A 相似于对角矩阵(可对角化), 其对角元为矩阵 A 的特征值, 因此对角阵可作
为可对角化矩阵的标准形, 同时它亦是一类矩阵的代表元, 即凡与该对角阵相似的
矩阵在同一类中. 但遗憾的是, 并非所有的常数矩阵都可对角化, 那么, 是否存在略
192 第7章 矩阵的 Jordan 标准形

低于对角形要求的其他形式的标准形? 回答是肯定的, 这一节将讨论一般常数矩


阵的标准形.

7.2.1 多项式方阵的相似判定

先讨论常数方阵相似与其特征矩阵之间的关系.
对于多项式矩阵还可以表示成系数为常数矩阵的多项式, 称为矩阵多项式. 如
       
3𝜆2 + 𝜆 + 2 6𝜆 + 2 =
3 0  2  1 6  2 2 
 𝜆 + 𝜆+
𝜆2 𝜆2 − 2𝜆 + 1 1 1 0 −2 0 1

引 理 7.2.1 设 U(𝜆) 和 V(𝜆) 为 𝑛 阶已知多项式方阵, A 为任一非零 𝑛 阶常数


方阵, 则存在多项式矩阵 𝑃 (𝜆), Q(𝜆) 和常数方阵 R, S 使

U(𝜆) = (𝜆E − A)𝑃 (𝜆) + R, V(𝜆) = Q(𝜆)(𝜆E − A) + S (7.5)

证明 设 U(𝜆) 可写成如下矩阵多项式:

U(𝜆) = U0 𝜆𝑚 + U1 𝜆𝑚−1 + · · · + U𝑚−1 𝜆 + U𝑚 (7.6)

其中 U0 , U1 , · · · , U𝑚 为 𝑛 阶常数方阵, 且 U0 ̸= O.
若 𝑚 = 0, 则令 𝑃 (𝜆) = O, R = U0 , 等式成立.
设 𝑚 > 0, 且令

𝑃 (𝜆) = X0 𝜆𝑚−1 + X1 𝜆𝑚−2 + · · · + X𝑚−2 𝜆 + X𝑚−1

其中 X0 , X1 , · · · , X𝑚−1 为 𝑛 阶待定方阵, 则

(𝜆E − A)𝑃 (𝜆) + R


=X0 𝜆𝑚 + (X1 − AX0 )𝜆𝑚−1 + · · · + (X𝑚−1 − AX𝑚−2 )𝜆 − AX𝑚−1 + R (7.7)

由式(7.6)和(7.14)及等式(7.5), 可得待定 𝑛 阶矩阵 X𝑖 (𝑖 = 0, 1, · · · , 𝑚 − 1) 和 R:

X0 = U0 , X1 = U1 + AX0 , X2 = U2 + AX1 , · · · , X𝑚−1 = U𝑚−1 + AX𝑚−2


7.2 Jordan 标准形 193

R = U𝑚 + AX𝑚−1

由此, 可求得满足等式的 𝑃 (𝜆) 和 R. 类似地, 可证第二个等式.


引 理 7.2.2 特征矩阵 𝜆E − A 和 𝜆E − B 等价的充要条件是, 存在可逆方阵
R, S 使得 𝜆E − A = R (𝜆E − B) S.
证明 充分性显然.
必要性. 即已知 𝜆E − A 与 𝜆E − B 等价. 则存在单模矩阵 U(𝜆) 和 V(𝜆) (它们
可表示成一系列初等矩阵乘积), 使得

𝜆E − A = U(𝜆)(𝜆E − B)V(𝜆) (7.8)


U−1 (𝜆)(𝜆E − A) = (𝜆E − B)V(𝜆) (7.9)

根据引理7.2.1, 令

U(𝜆) = (𝜆E − A)𝑃 (𝜆) + R (7.10)


V(𝜆) = Q(𝜆)(𝜆E − A) + S (7.11)

将上述式(7.11)代入(7.9)得 U−1 (𝜆) − (𝜆E − 𝐵)Q(𝜆) (𝜆E − A) = (𝜆E − B)S. 比较


 

等式两端可知左端方括号中的矩阵必为常数矩阵, 设

U−1 (𝜆) − (𝜆E − 𝐵)𝑄(𝜆) = 𝐶 (7.12)


𝐶(𝜆E − A) = (𝜆E − 𝐵)𝑆 (7.13)

进一步可证明 𝐶 是可逆矩阵, 对式(7.12) 两端左乘 U(𝜆), 并根据式(7.8), (7.10)可得

E = U(𝜆)𝐶 + U(𝜆)(𝜆E − 𝐵)𝑄(𝜆)


= 𝑅𝐶 + (𝜆E − A) 𝑃 (𝜆)𝐶 + 𝑉 −1 (𝜆)𝑄(𝜆)
 
(7.14)

比较两端有: 𝑅𝐶 = E, 因此𝐶 −1 = 𝑅, 根据式(7.13) 最后有 𝜆E−A = 𝑅(𝜆E−𝐵)𝑆.


因 𝑅 是可逆矩阵, 由上式可知 𝑆 也是可逆矩阵.
利用引理7.2.2 可得下列结论.
194 第7章 矩阵的 Jordan 标准形

定理 7.2.1 设 A, 𝐵 为数域 𝐾 上的 𝑛 阶方阵, 则当且仅当多项式矩阵 𝜆𝐸 − 𝐴


和 𝜆𝐸 − 𝐵 等价时, 矩阵 𝐴, 𝐵 相似.
证明 必要性. 设 𝐴, 𝐵 相似, 即存在可逆矩阵 𝑃 使 𝐴 = 𝑃 𝐵𝑃 −1 , 因此

𝜆𝐸 − 𝐴 = 𝜆E − 𝑃 𝐵𝑃 −1 = 𝑃 (𝜆𝐸 − 𝐵)𝑃 −1

由引理7.2.2可知 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 等价.
充分性. 设 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 等价, 即存在可逆方阵 𝑅, 𝑆 使

𝜆𝐸 − 𝐴 = 𝑅(𝜆𝐸 − 𝐵)𝑆


𝜆𝐸 − 𝐴 = 𝜆𝑅𝑆 − 𝑅𝐵𝑆

比较系数可得: 𝑅𝑆 = 𝐸, 𝐴 = 𝑅𝐵𝑆, 即 𝐴 = 𝑅𝐵𝑅−1 , 因此 𝐴, 𝐵 相似.


由于特征方阵永远满秩, 因而有如下推论.
推 论 7.2.1 𝑛 阶方阵 𝐴, 𝐵 相似的充要条件是 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 有相同的
不变因子(或初等因子).
例 7.2.1 判别矩阵:  
−1 1 0
 
𝐴=
 −4 3 0 

1 0 2
 
3 0 8
 
𝐵=
 3 −1 6 

−2 0 −5

是否相似?
解 矩阵 𝜆𝐸 − 𝐴 的初等因子为: 𝜆 − 2, (𝜆 − 1)2 , 而 𝜆𝐸 − 𝐵 的初等因子为:
𝜆 + 1, (𝜆 + 1)2 , 它们的初等因子不同, 因而 𝐴, 𝐵 不相似.
定 义7.2.1 设矩阵𝐴 为数域𝐾 上的 𝑛 阶方阵, 𝑓 (𝜆) 为属于 𝐾 上的多项式, 若
𝑓 (𝐴) = 0, 则称 𝑓 (𝜆) 为矩阵 𝐴 的化零多项式.
矩阵 𝐴 的化零多项式有无穷多, 根据 Hamilton-Cayley 定理知 𝐴 的特征多
项式 𝑓 (𝜆) = det (𝜆𝐸 − 𝐴) 就是 𝐴 的化零多项式, 而且它是首一多项式. 在所有
𝐴 的化零多项式中次数最低的首一多项式 𝑔(𝜆) 称为 𝐴 的极小多项式(minimal
7.2 Jordan 标准形 195

polynomial).
定 理 7.2.2 设 𝑔(𝜆) 为 𝐴 的极小多项式, 𝑓 (𝜆) 为任一多项式, 𝑓 (𝜆) 为 𝐴 的化
零多项式, 当且仅当它能被 𝑔(𝜆) 整除.
证 明 必 要 性. 设 𝑓 (𝐴) = 0, 将 𝑓 (𝜆) 分 解 为 𝑓 (𝜆) = 𝑔(𝜆)𝑞(𝜆) + 𝑟(𝜆), 且
deg 𝑟(𝜆) < deg 𝑔(𝜆), 则
0 = 𝑓 (𝐴) = 𝑔(𝐴)𝑞(𝐴) + 𝑟(𝐴)

因 𝑔(𝜆) 是 𝐴 的极小多项式, 故 𝑔(𝐴) = 0, 便有 𝑟(𝐴) = 0, 若 𝑟(𝜆) ̸= 0 与 𝑔(𝜆) 为


极小多项式矛盾, 则 𝑟(𝜆) = 0. 因此, 𝑔(𝜆)|𝑓 (𝜆).
充分性. 因为 𝑔(𝜆)|𝑓 (𝜆), 𝑓 (𝜆) 可表示为 𝑓 (𝜆) = 𝑔(𝜆)𝑞(𝜆), 所以得

𝑓 (𝐴) = 𝑔(𝐴)𝑞(𝐴) = 0

推论 7.2.2 矩阵 𝐴 的极小多项式是唯一的.
推论 7.2.3 矩阵𝐴 的极小多项式是其特征多项式的因子.
定理 7.2.3 设 𝐴 为数域 𝐾 上的 𝑛 阶方阵, 𝑑1 (𝜆), 𝑑2 (𝜆), · · · , 𝑑𝑛 (𝜆) 是 𝜆𝐸 − 𝐴
的不变因子, 则 𝑑𝑛 (𝜆) 是 𝐴 的极小多项式.
证明 设 𝐷𝑘 (𝜆) 为 𝜆𝐸 − 𝐴 的 𝑘 阶行列式因子, 则 𝐷𝑛 (𝜆) = det(𝜆𝐸 − 𝐴), 且

𝐷𝑘 (𝜆)𝐸 = (𝜆𝐸 − 𝐴)(𝜆𝐸 − 𝐴)* (7.15)

因伴随矩阵 (𝜆𝐸−𝐴)* 的元素是 (𝜆𝐸−𝐴) 中相应元素的代数余子式, 故 (𝜆𝐸−𝐴)*


的 1 阶行列式因子就是矩阵 (𝜆𝐸 − 𝐴) 的 𝐷𝑛−1 (𝜆), 即伴随矩阵中每个元素均包含
因子 𝐷𝑛−1 (𝜆), 则 (𝜆𝐸 − 𝐴)* 表示为

(𝜆𝐸 − 𝐴)* = 𝐷𝑛−1 (𝜆)𝐵(𝜆)

且 𝐵(𝜆) 的 1 阶行列式因子为 1, 式(7.15)可写成

𝐷𝑛 (𝜆)
(𝜆𝐸 − 𝐴)𝐵(𝜆) = 𝐸 = 𝑑𝑛 (𝜆)𝐸 (7.16)
𝐷𝑛−1 (𝜆)

令 𝜆 = 𝐴 代入式(7.16), 则有 𝑑𝑛 (𝐴) = 0, 即 𝑑𝑛 (𝜆) 也是 𝐴 的化零多项式.


设 𝐴 的极小多项式为 𝑔(𝜆), 由定理 7.2.2可知 𝑔(𝜆)|𝑑𝑛 (𝜆), 不妨设

𝑑𝑛 (𝜆) = 𝑔(𝜆)𝑞(𝜆) (7.17)


196 第7章 矩阵的 Jordan 标准形

由引理7.2.1得
𝑔(𝜆)𝐸 = (𝜆𝐸 − 𝐴)𝑃 (𝜆) + 𝑅

由 𝑔(𝐴) = 0 可知 𝑅 = 0, 即

𝑔(𝜆)𝐸 = (𝜆𝐸 − 𝐴)𝑃 (𝜆)

由式(7.17)得
𝑑𝑛 (𝜆)𝐸 = (𝜆𝐸 − 𝐴)𝑃 (𝜆)𝑞(𝜆)

将上式与式(7.16)比较后可得: 𝐵(𝜆) = 𝑃 (𝜆)𝑞(𝜆), 此式说明 𝐵(𝜆) 的元素存在公因


子 𝑞(𝜆), 而 𝐵(𝜆) 的 1 阶行列式因子为 1, 从而只能是 𝑞(𝜆) = 1, 于是

𝑔(𝜆) = 𝑑𝑛 (𝜆)

即 𝑑𝑛 (𝜆) 是 𝐴 的极小多项式.

7.2.2 Jordan 矩阵

定义 7.2.2 将形如
 
𝜆0 1
 

 𝜆0 1 

.. ..
 
𝐽0 = 
 
 . . 

 

 𝜆0 1 

𝜆0

的 𝑚 阶方阵称为特征值 𝜆0 的 Jordan 块.
这种矩阵相应的特征矩阵的初等因子最简单.
定 理 7.2.4 设 𝐽0 为特征根 𝜆0 的 𝑚 阶 Jordan 块, 则 𝜆𝐸 − 𝐽0 的初等因子为
(𝜆 − 𝜆0 )𝑚 .
证明 先求 𝜆𝐸 − 𝐽0 的不变因子, 目前有两种方法可用: À 求矩阵的 𝑘 阶行列
式因子, 通过式 (7.4)求不变因子; Á 对矩阵实施初等变换化为Smith 标准形, 标准
形的对角元即为不变因子. 再由不变因子求出初等因子. 这里用方法 Á, 方法 À作
为练习.
对矩阵 𝜆𝐸 − 𝐽0 实施初等变换, 求出它的 Smith 标准形,得
7.2 Jordan 标准形 197

𝜆𝐸 − 𝐽0
 
𝜆 − 𝜆0 −1
 

 𝜆 − 𝜆0 −1 

.. ..
 
=
 
 . . 

 

 𝜆 − 𝜆0 −1 

𝜆 − 𝜆0
 
1 0
 

 (𝜆 − 𝜆0 )2 −1 

.. ..

swap(𝐶1 ,𝐶2 );𝑅2 +(𝜆−𝜆0 )×𝑅1 

−−−−−−−−−−−−−−−−−−→ 

. . 
𝐶2 +(𝜆−𝜆0 )×𝐶1 ;(−1)×𝑅1  
 

 𝜆 − 𝜆0 −1 

𝜆 − 𝜆0
 
1 0
 

 1 0 

 

swap(𝐶2 ,𝐶3 );𝑅3 +(𝜆−𝜆0 )×𝑅2  (𝜆 − 𝜆0 )3 −1 

−−−−−−−−−2−−−−−−−−−→  .. ..

𝐶3 +(𝜆−𝜆0 ) ×𝐶2 ;(−1)×𝑅2 . .
 
 
 
𝜆 − 𝜆0 −1
 
 
 
𝜆 − 𝜆0

···
 
1 0
 

 1 0 

.. ..

swap(𝐶𝑚−2 ,𝐶𝑚−1 );𝑅𝑚−1 +(𝜆−𝜆0 )×𝑅𝑚−2 

−−−−−−−−−−− − − −−− −− −−− − −−−→

 . . 
𝐶𝑚−1 +(𝜆−𝜆0 )𝑚−2 ×𝐶𝑚−2 ;(−1)×𝑅𝑚−2  
(𝜆 − 𝜆0 )𝑚−1
 

 −1 

(𝜆 − 𝜆0 )
 
1 0
 

 1 0 

 

swap(𝐶𝑚−1 ,𝐶𝑚 );𝑅𝑚 +(𝜆−𝜆0 )×𝑅𝑚−1  1 0 

−−−−−−−−−𝑚−1 −−−−−−−−−−−−−−→  .. ..

𝐶𝑚 +(𝜆−𝜆0 ) ×𝐶𝑚−1 ;(−1)×𝑅𝑚−1  . .
 

 
 

 1 0 

(𝜆 − 𝜆0 )𝑚

𝜆𝐸 − 𝐽0 的不变因子为 𝑑1 (𝜆) = 𝑑2 (𝜆) = · · · = 𝑑𝑚−1 (𝜆) = 1, 𝑑𝑚 (𝜆) = (𝜆 − 𝜆0 )𝑚 ,


198 第7章 矩阵的 Jordan 标准形

因此其初等因子为(𝜆 − 𝜆0 )𝑚 .
例7.2.2 求矩阵  
4 1
 
𝐽1 = 
 4 1 

4

的初等因子.
解 𝜆𝐸 − 𝐽1 的初等因子为 (𝜆 − 4)3 .
例7.2.3 求 Jordan 块, 其初等因子分别为 (𝜆 − 3)2 和 𝜆3 .
 
  0 1 0
2 1 
解 Jordan 块 𝐽1 =  和 𝐽2 = 
 0 0 1  的初等因子分别为
 

0 2
0 0 0
(𝜆 − 3)2 和 𝜆3 .
实际上每个常数也可看成是一个 1 阶的 Jordan 块, 如 1 阶矩阵 (𝑎)(𝑎 为常数),
它也是一个 1 阶 Jordan 块, 其初等因子为 𝜆 − 𝑎.
定义 7.2.3 形如  
𝐽1
 

 𝐽2 

𝐽 = ..

.
 
 
 
𝐽𝑘

的分块矩阵中 𝐽𝑖 (𝑖 = 1, 2, · · · , 𝑘) 均为 Jordan 块, 则称 𝐽 为 Jordan 矩阵, 或 Jordan


标准形.
例7.2.4 求下列 Jordan 矩阵的初等因子
 
5
 

 2 1 

 
 2 
𝐽 =
 


 −3 1 

 

 −3 1 

−3

解 先求出矩阵 𝜆𝐸 − 𝐽 的 𝑘 阶行列式因子, 𝑘 分别为 1, 2, · · · , 6 时,


(1) 𝐷1 (𝜆) = gcd(−1, 𝜆 − 5, 𝜆 − 2, 𝜆 + 3) = 1.
(2) 𝐷2 (𝜆) = gcd (−(𝜆 − 5), (𝜆 − 5)(𝜆 − 2), (𝜆 + 3)2 , · · · ) = 1.
(3) 𝐷3 (𝜆) = gcd ((𝜆 − 5), (𝜆 + 3)3 , · · · ) = 1.
7.2 Jordan 标准形 199

(4) 𝐷4 (𝜆) = gcd (−(𝜆 − 5), (𝜆 − 2)(𝜆 + 3)3 , · · · ) = 1.


(5)𝐷5 (𝜆) = gcd (−(𝜆 − 5)(𝜆 + 3)3 , (𝜆 − 2)2 (𝜆 + 3)3 , (𝜆 − 5)(𝜆 − 2)2 , · · · ) = 1.
(6) 𝐷6 = (𝜆 − 5)(𝜆 − 2)2 (𝜆 + 3)3 .
不变因子 𝑑1 (𝜆) = 𝑑2 (𝜆) = · · · = 𝑑5 (𝜆) = 1, 𝑑6 (𝜆) = 𝐷6 (𝜆), 因此, 初等因子为
𝜆 − 5, (𝜆 − 2)2 和 (𝜆 + 3)3 .
反之, 若已知特征矩阵的初等因子, 则除了 Jordan 矩阵中的 Jordan 块的排列
顺序不同之外, 该 Jordan 矩阵是唯一确定的.
例 7.2.5 已知特征矩阵的初等因子为𝜆, 𝜆3 , (𝜆 − 2)2 , 则相应的 Jordan 矩阵为

 
0
 

 0 1 

 

 0 1 

 

 0 

 

 2 1 

2

显然 Jordan 矩阵是一种比较简单的矩阵.
定 理 7.2.5 复数域上任一个 𝑛 阶方阵 𝐴 都与一个 Jordan 矩阵相似, 并且除
了 Jordan 矩阵中 Jordan 块的排列次序外, 与 𝐴 相似的 Jordan 矩阵由 𝐴 唯一确定.
证 明 设 矩 阵 𝜆𝐸 − 𝐴 在 复 数 域 上 的 初 等 因 子 为 (𝜆 − 𝜆1 )𝑚1 , (𝜆 −
𝜆2 )𝑚2 , · · · , (𝜆 − 𝜆𝑠 )𝑚𝑠 , 且 𝑚1 + 𝑚2 + · · · + 𝑚𝑠 = 𝑛, 𝜆1 , 𝜆2 , · · · , 𝜆𝑠 为 𝐴 的特
征根, 其中可能有相等的, 则对应每个初等因子 (𝜆 − 𝜆𝑖 )𝑚𝑖 唯一确定一个 Jordan 块
 
𝜆𝑖 1
 

 𝜆𝑖 1 

.. ..
 
𝐽𝑖 = 
 
 . . 

 

 𝜆𝑖 1 

𝜆𝑖
𝑚𝑖 ×𝑚𝑖

则 Jordan 矩阵  
𝐽1
 

 𝐽2 

𝐽 = ..

.
 
 
 
𝐽𝑠
200 第7章 矩阵的 Jordan 标准形

的特征矩阵的初等因子恰好与 𝜆𝐸 − 𝐴 的初等因子完全相同, 因此, 𝐴 与 Jordan 阵


𝐽 相似.
例7.2.6 求矩阵  
3 −1 1 3
 
 −1 3 1 2 
𝐴=
 

 0 0 4 1 
 
0 0 0 4

的 Jordan 标准形.

解 用初等变换求 𝜆𝐸 − 𝐴 的不变因子,
 
𝜆−3 1 −1 −3
 

 1 𝜆−3 −1 −2 

 

 0 0 𝜆−4 −1 

0 0 0 𝜆−4
 
1 0 0 0
 
swap(𝐶1 ,𝐶2 );𝑅2 −(𝜆−3)×𝑅1
 0 −(𝜆 − 2)(𝜆 − 4) 𝜆 − 4 3𝜆 − 11 
−−−−−−−−−−−−−−−−−−−−→ 
 

𝐶2 −(𝜆−3)×𝐶1 ;𝐶3 +𝐶1 ;𝐶4 +3×𝐶1  0
 0 𝜆−4 −1 

0 0 0 𝜆−4
 
1 0 0 0
 
 0
swap(𝐶2 ,𝐶4 );swap(𝑅2 ,𝑅3 ) −1 𝜆−4 0 
−−−−−−−−−−−−−−−→ 
 

 0
 3𝜆 − 11 𝜆 − 4 −(𝜆 − 2)(𝜆 − 4) 

0 𝜆−4 0 0
 
1 0 0 0
 
0
𝐶3 +(𝜆−4)×𝐶2 ;𝑅3 +(3𝜆−11)×𝑅2 ;(−1)×𝑅2 1 0 0 
−−−−−−−−−−−−−−−−−−−−−−−−−−→ 
 

𝑅4 +(𝜆−4)×𝑅2 0
 0 (𝜆 − 4)(3𝜆 − 10) −(𝜆 − 2)(𝜆 − 4) 

0 0 (𝜆 − 4)2 0
 
1 0 0 0
 
swap(𝑅3 ,𝑅4 );𝑅4 −3×𝑅2  0 1 0 0
 

−−−−−−−−−−−−−−→  1 
swap(𝑅3 ,𝑅4 );(1/2)×𝑅4  0 0 (𝜆 − 4) − (𝜆 − 2)(𝜆 − 4) 
 
 2 
0 0 (𝜆 − 4)2 0
7.3 Jordan 标准形的几何意义 201

 
1 0 0 0
 
𝑅4 −(𝜆−4)×𝑅2 ;2×𝑅4
 0 1 0 0 
−−−−−−−−−−−−−→ 
 

𝐶4 +(1/2)(𝜆−2)×𝐶3  0
 0 (𝜆 − 4) 0 

0 0 0 (𝜆 − 2)(𝜆 − 4)2

求得初等因子为: 𝜆 − 4, 𝜆 − 2, (𝜆 − 4)2 . 矩阵𝐴 相似于 Jordan 标准形

 
2
 

 4 

 

 4 1 

4

Jordan 标准形是每个相似类中比较简单的一种矩阵. 但一般来说, Jordan 标准形必


须在复数域内才能实现, 而且必须先求出给定矩阵的全部特征值.

7.3 Jordan 标准形的几何意义

7.2 节是从矩阵相似的角度去理解 Jordan 标准形, 本节从线性变换的角度, 把


矩阵视作线性变换在某组基下的矩阵, 根据第 5 章的内容可知, 相似的矩阵可以看
成同一线性变换在不同基下的矩阵表示. 另外, 线性空间可以分解成线性变换的不
变子空间的直和, 若线性变换矩阵相似于分块 Jordan 矩阵, 它的空间如何分解, 或
子空间的基是什么样的?
设 𝑇 是复数域上 𝑛 维线性空间 𝑉 上的线性变换, 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑉 的一组
基, 𝑇 在这组基下的矩阵为 𝐴. 𝜆1 , 𝜆2 , · · · , 𝜆𝑠 为 𝐴 的不同特征值, 则
定 理 7.3.1 设 𝑔(𝜆) 是 𝐴 的极小多项式:

𝑔(𝜆) = (𝜆 − 𝜆1 )𝑚1 (𝜆 − 𝜆2 )𝑚2 · · · (𝜆 − 𝜆𝑠 )𝑚𝑠

则存在 𝑉 的直和分解
𝑉 = 𝑊𝜆1 ⊕ 𝑊𝜆2 ⊕ · · · ⊕ 𝑊𝜆𝑠

其中
 𝑚𝑖
𝑊𝜆𝑖 = 𝑥 ∈ 𝑉 (𝜆𝑖 𝐸 − 𝐴) 𝑥=0

是线性变换 𝐴 的不变子空间, 称它为属于特征值 𝜆𝑖 的根子空间(root subspace).


202 第7章 矩阵的 Jordan 标准形

证明 不难证明 𝑊𝜆𝑖 是线性子空间. 设 𝑥 ∈ 𝑊𝜆𝑖 , 则

𝑚𝑖 𝑚𝑖
(𝜆𝑖 𝐸 − 𝐴) (𝐴𝑥) = 𝐴 (𝜆𝑖 𝐸 − 𝐴) 𝑥=0

说明 𝐴𝑥 ∈ 𝑊𝜆𝑖 , 因此 𝑊𝜆𝑖 是 𝐴 的不变子空间.


∀𝑦 ∈ 𝑉 , 因

𝑠
𝑔(𝜆) Y
= (𝜆 − 𝜆𝑗 )𝑚𝑗 , 𝑖 = 1, 2, · · · , 𝑠
(𝜆 − 𝜆𝑖 ) 𝑖
𝑚
𝑗=1, 𝑗̸=𝑖

它们的公因子为 1, 即这一组多项式互素, 故存在多项式 𝑢1 (𝜆), 𝑢2 (𝜆), · · · , 𝑢𝑠 (𝜆)


(互素多项式充要条件) 使得

𝑠
X 𝑔(𝜆)
𝑢𝑖 (𝜆) =1 (7.18)
𝑖=1
(𝜆 − 𝜆𝑖 )𝑚𝑖

将 𝜆 = 𝐴 代入式 (7.18), 右端项为恒等变换 𝐸, 作用到向量 𝑦 上, 得到


„ Ž
𝑠 • ˜  
𝑠 𝑠
X 𝑔(𝐴) X Y
𝑢𝑖 (𝐴) 𝑦 = 𝑢𝑖 (𝐴) (𝐴 − 𝜆𝑗 𝐸)𝑚𝑗 𝑦 = 𝑦
𝑖=1
(𝐴 − 𝜆𝑖 𝐸)𝑚 𝑖
𝑖=1 𝑗=1, 𝑗̸=𝑖

令  
𝑠
𝑚𝑗 
Y
𝑦𝑖 = 𝑢𝑖 (𝐴)  (𝐴 − 𝜆𝑗 𝐸) 𝑦
𝑗=1, 𝑗̸=𝑖


(𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 𝑦𝑖 = 𝑢𝑖 (𝐴)𝑔(𝐴)𝑦 = 0, 𝑖 = 1, 2, · · · , 𝑠

故 𝑦𝑖 ∈ 𝑊𝜆𝑖 , 因此 𝑉 = 𝑊𝜆1 + 𝑊𝜆2 + · · · + 𝑊𝜆𝑠 .


下一步证明这些子空间的和是直和, 设 𝑥 ∈ 𝑊𝜆1 ∩ (𝑊𝜆2 + · · · + 𝑊𝜆𝑠 ), 因
𝑠
Y
(𝜆 − 𝜆1 )𝑚1 与 (𝜆 − 𝜆𝑖 )𝑚𝑖 互素, 故存在 𝑢(𝜆), 𝑣(𝜆) 使得
𝑖=2

𝑠
!
Y
𝑢1 (𝜆)(𝜆 − 𝜆1 )𝑚1 + 𝑣(𝜆) (𝜆 − 𝜆𝑗 )𝑚𝑗 =1
𝑗=2

将 𝜆 = 𝐴 代入上式, 后作用到 𝑥 上, 有
7.3 Jordan 标准形的几何意义 203

" 𝑠
#
𝑚1 𝑚𝑗
Y
𝑢(𝐴) (𝐴 − 𝜆𝑖 𝐸) 𝑥 + 𝑣(𝐴) (𝐴 − 𝜆𝑗 𝐸) 𝑥 = 𝐸𝑥 = 𝑥
𝑗=2

根据假设 𝑥 ∈ 𝑊𝜆1 , 所以
𝑚1
(𝐴 − 𝜆𝑖 𝐸) 𝑥=0

同时,
𝑥 ∈ 𝑊𝜆2 + 𝑊𝜆3 + · · · + 𝑊𝜆𝑠


𝑠
𝑚𝑗
Y
(𝐴 − 𝜆𝑗 𝐸) 𝑥=0
𝑗=2

可得 𝑥 = 0. 类似地可证明


𝑊𝜆𝑖 ∩ 𝑊𝜆1 + · · · + 𝑊𝜆𝑖−1 + 𝑊𝜆𝑖+1 + · · · + 𝑊𝜆𝑠 = {0}

因此 𝑉 = 𝑊𝜆1 ⊕ 𝑊𝜆2 ⊕ · · · ⊕ 𝑊𝜆𝑠 .

下面讨论在知道矩阵 𝐴 的 Jordan 标准形后, 如何求它的相似变换矩阵?

设矩阵 𝐴 的初等因子为

(𝜆 − 𝜆1 )𝑚1 , (𝜆 − 𝜆2 )𝑚2 , · · · , (𝜆 − 𝜆𝑡 )𝑚𝑡

𝑡
!
X
其中特征值 𝜆𝑖 可以重复 𝑚𝑖 = 𝑛 . 选择 Jordan 标准形矩阵为
𝑖=1

𝐽 = diag(𝐽1 , 𝐽2 , · · · , 𝐽𝑡 )

Jordan 块 𝐽𝑖 与特征值 𝜆𝑖 对应, 则 𝐴 相似于 𝐽 , 即存在可逆矩阵 𝑃 使得

𝑃 −1 𝐴𝑃 = 𝐽 ⇐⇒ 𝐴𝑃 = 𝑃 𝐽

对矩阵 𝑃 作相应的分块 𝑃 = [𝑃1 , 𝑃2 , · · · , 𝑃𝑡 ], 其中 𝑃𝑘 为 𝑛 × 𝑚𝑘 矩阵 (𝑘 =


1, 2, · · · , 𝑡), 则

𝐴𝑃 = [𝐴𝑃1 , 𝐴𝑃2 , · · · , 𝐴𝑃𝑡 ] = 𝑃 𝐽 = [𝑃1 𝐽1 , 𝑃2 𝐽2 , · · · , 𝑃𝑡 𝐽𝑡 ]


204 第7章 矩阵的 Jordan 标准形

设每个分块 𝑃𝑖 = [𝑝𝑖1 , 𝑝𝑖2 , · · · , 𝑝𝑖𝑚𝑖 ]𝑛×𝑚𝑖 , 则有

𝐴𝑝𝑖1 = 𝜆𝑖 𝑝𝑖1 , 𝐴𝑝𝑖2 = 𝑝𝑖1 + 𝜆𝑖 𝑝𝑖2 , · · · , 𝐴𝑝𝑖𝑚𝑖 = 𝑝𝑖(𝑚𝑖 −1) + 𝜆𝑖 𝑝𝑖𝑚𝑖 (7.19)

将方程 (7.19)改写成

𝑝𝑖(𝑚𝑖 −1) = (𝐴 − 𝜆𝑖 𝐸)𝑝𝑖𝑚𝑖


𝑝𝑖(𝑚𝑖 −2) = (𝐴 − 𝜆𝑖 𝐸)𝑝𝑖𝑚𝑖 −1 = (𝐴 − 𝜆𝑖 𝐸)2 𝑝𝑖𝑚𝑖
······
𝑝𝑖𝑗 = (𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 −𝑗 𝑝𝑖𝑚𝑖
······
𝑝𝑖1 = (𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 −1 𝑝𝑖𝑚𝑖
0 = (𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 𝑝𝑖𝑚𝑖 (7.20)

根据(7.20)先求 𝑝𝑖𝑚𝑖 再依此计算 𝑝𝑖(𝑚𝑖 −1) , 𝑝𝑖(𝑚𝑖 −2) , · · · , 𝑝𝑖1 , 在计算 𝑝𝑖𝑚𝑖 时, 应满
足下列条件:

(𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 𝑝𝑖𝑚𝑖 = 0 (7.21)


(𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 −1 𝑝𝑖𝑚𝑖 ̸= 0 (7.22)

例7.3.1 求例 7.2.4中矩阵 𝐴 的相似变换 𝑃 , 使得 𝑃 −1 𝐴𝑃 = 𝐽 , 其中 𝐽 为矩


阵 𝐴 Jordan 标准形.
解 由 𝐴 的 Jordan 标准形知, 它包含 3 个 Jordan 块, 其中一个对应特征值
2, 另外两个都对应特征值 4, 分别表示成 𝐽4(1) 和𝐽4(2) , 则线性空间 R4 可分解为:
𝑊2 ⊕ 𝑊4(1) ⊕ 𝑊4(2) .
(1) 先求 Jordan 块 𝐽2 对应的相似向量, 由 (𝐴 − 2𝐸)𝑝11 = 0, 求得 𝑝11 =
[1, 1, 0, 0]T ;
(2) 计算 𝐽4(1) 的相似向量, 由 (𝐴 − 4𝐸)𝑝21 = 0, 求得 𝑝21 = [1, −1, 0, 0]T ;
(3) 最后求 Jordan 块 𝐽4(2) 对应的相似向量, 根据条件式 (7.22) 有
 
2 2 −2 −4
 
 2 2 −2 −4 
 𝑝32 = 0
 

 0 0 0 0 
 
0 0 0 0
7.4 习 题 205

设 𝑝32 的分量为 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 应满足

𝑥1 + 𝑥2 − 𝑥3 − 2𝑥4 = 0

𝑝32 还应满足条件 (7.22), 取


T
𝑝32 = [1, −1, 2, −1]

随后求得 T
𝑝31 = (𝐴 − 4𝐸)𝑝32 = [−1, 0, −1, 0]

最后求得相似矩阵:
 
1 1 −1 1
 
 1 −1 0 −1 
𝑃 = [𝑝11 , 𝑝21 , 𝑝31 , 𝑝32 ] = 
 

 0
 0 −1 2 

0 0 0 −1

 
1 1 −1 −2
 
 1 −1 −1 0 
1 
−1
𝑃 =  
2
 0 0 −2 −4 

0 0 0 −2

可以验证  
2
 
−1
 4 
𝑃 𝐴𝑃 = 
 


 4 1 

4

7.4 习 题

1. 分别求下列多项式矩阵 (𝜆-矩阵)的秩和各阶子式的最大公因式:

   
1 0 0 1 𝜆 2𝜆 − 1
𝐴(𝜆) =  0 𝜆−1 0 , 𝐵(𝜆) =  0 −𝜆 𝜆2
   

0 1 𝜆2 − 1 2 𝜆 𝜆2 + 4𝜆 − 2
206 第7章 矩阵的 Jordan 标准形

2. 判别下列矩阵是否为单模矩阵, 若是求它的逆矩阵:

 
1 0 1  
1 𝜆 0
 0 𝜆−1 𝜆 
𝐴(𝜆) =  , 𝐵(𝜆) =  2 𝜆 1
   

 0 𝜆−1 𝜆 
𝜆2 + 1 2 𝜆2 + 1
𝜆 1 𝜆2

 
𝜆 2𝜆 + 1 1
𝐶(𝜆) =  1 𝜆+1 𝜆2 + 1 
 

𝜆−1 𝜆 −𝜆2

3. 求下列多项式矩阵的秩, 证明: 𝐴(𝜆) 与 𝐵(𝜆) 不等价:

– ™ – ™
𝜆 1 1 −𝜆
𝐴(𝜆) = , 𝐵(𝜆) =
0 𝜆 1 𝜆

4. 求下列矩阵的 Smith 标准形:

   
𝜆−1 0 0 𝜆2 − 1 0 0
1 𝜆−1 0 ,  0 𝜆 0
   
 
0 1 𝜆−1 0 0 𝜆(𝜆 + 1)2

 
1 + 𝜆2 𝜆2 −𝜆2
1 𝜆2 + 𝜆 0
 
 
𝜆 𝜆 −𝜆

5. 设    
2 1 0 1 1 1
𝐴= 0 1 2 , 𝐵= 2 0 1 
   

1 −1 1 −1 −1 2

分别求 𝜆-矩阵 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 的 Smith 标准形.


6. 设
 
𝑑1 (𝜆)
 𝑑2 (𝜆) 
𝐴(𝜆) = 
 

 𝑑3 (𝜆) 
0

为 Smith 标 准 形, 若 用 𝐷𝑘 (𝜆) (𝑘 = 1, 2, 3, 4) 表 示 其 所 有 𝑘 阶 行 列 式 因 子, 求 𝐷𝑘 (𝜆) (𝑘 =


1, 2, 3, 4).
7. 求下列多项式矩阵的不变因子, 并分别在有理数域、实数域、复数域上求它们的初等因
7.4 习 题 207

子:

 
  1 −𝜆 0 2
0 𝜆+1 −𝜆 − 1
 3
 0 2 −1 − 𝜆 −2

 𝜆 + 𝜆2 + 𝜆 + 1 (𝜆 + 1)2 𝜆3 − 𝜆  ,
  
−1 − 𝜆2
 
 𝜆 1 2+𝜆 
𝜆3 + 𝜆2 + 𝜆 + 1 𝜆+1 𝜆3 + 𝜆2 2
1 −𝜆 0 1+𝜆

8. 先求下列多项式矩阵在实数域上的初等因子, 再求其不变因子和标准形:

𝜆2 − 2
 
 2

(𝜆 + 1)  0 
𝜆(𝜆 + 1) ,
   
𝜆2
  
 
𝜆 √
𝜆(𝜆 + 2)

9. 设 𝐴(𝜆) 为 𝑛 阶多项式方阵, 秩为 𝑟, 初等因子为

𝑝𝑚 𝑚2 𝑚𝑠
1 (𝜆), 𝑝2 (𝜆), · · · , 𝑝𝑠 (𝜆)
1

其中 𝑝1 (𝜆), 𝑝2 (𝜆), · · · , 𝑝𝑠 (𝜆) 互异, 问: 𝐴(𝜆) 的 Smith 标准形是什么?


10. 指出下列矩阵中, 哪些是相似的?

     
3 1 3 2 1 −1 2 0 0
 −4 −2 6 ,  7 4 −22  ,  1 1 1 
     

−1 −1 5 2 1 5 1 −1 3

11. 证明下列方阵中没有相似的矩阵:

     
𝑎 0 0 𝑎 0 0 𝑎 1 0
 0 𝑎 0 ,  0 𝑎 1 ,  0 𝑎 1 
     

0 0 𝑎 0 0 𝑎 0 0 𝑎

12. 证明: 方阵 𝐴 与其转置矩阵 𝐴T 相似.


13. 设 𝐴 为 𝑛 阶方阵, 𝜆0 为 𝐴 的一个特征值, 证明: 𝜆0 的代数重数 > 𝑛−rank (𝜆𝐸 − 𝐴)(特
征值的代数重数和几何重数概念见第 5 章).
14. 设 𝑓 (𝜆) 为 𝑛 阶方阵 𝐴 的特征多项式, 𝑔(𝜆) 为 𝐴 的极小多项式, 证明 𝑔(𝜆) 能整除 𝑓 (𝜆).
15. 设 𝑔(𝜆) 为方阵 𝐴 的极小多项式, 𝑓 (𝜆) 为任一次数大于零的多项式, 证明: 方阵 𝑓 (𝐴)
为满秩的充要条件是 𝑓 (𝜆) 与 𝑔(𝜆) 互素 (它们的最大公因式为 1).
16. 证明: 复数域上方阵 𝐴 可对角化的充要条件是, 𝐴 的极小多项式没有重根.
17. 证明: 相似矩阵有相同的极小多项式.
208 第7章 矩阵的 Jordan 标准形

18. 求下列矩阵的 Jordan 标准形:

     
1 2 0 1 −1 2 3 0 8
0 2 0 ,  3 −3 6  , 3 −1 6 
     
 
−2 −2 −1 2 −2 4 −2 0 −5

19. 设 𝜆1 , 𝜆2 , · · · , 𝜆𝑛 为 𝑛 阶方阵 𝐴 的特征根, 𝑚 为正整数, 利用 𝐴 的 Jordan 标准形证明:


𝑚
𝐴 的特征根是 𝜆𝑚 𝑚 𝑚
1 , 𝜆2 , · · · , 𝜆𝑛 .

20. 利用 Jordan 标准形证明: 方阵 𝐴 的特征根全是零当且仅当存在非负整数 𝑚 使得


𝐴𝑚 = 𝑂.
21. 设 𝐴 为 𝑛 阶方阵, 若 𝐴𝑚 = 𝑂 (𝑚 为非负整数), 证明 det(𝐴 + 𝐸) = 1.
22. 利用 Jordan 标准形证明: 若有非负整数 𝑚 使得 𝐴𝑚 = 𝐸, 则 𝐴 与对角矩阵相似, 且对
角线上元素皆为 𝑚 次单位根.
23. 对下列矩阵 𝐴, 求变换矩阵 𝑇 使得 𝑇 −1 𝐴𝑇 为 Jordan 标准形:

 
  1 −3 0 3
3 −2 1  −2 −6 0 13 
 2 −2 2 ,
   
 
 0 −3 1 3 
3 −6 5
−1 −4 0 8

24. 证明: 每个复方阵 𝐴 可分解为 𝐴 = 𝐷 + 𝐻, 其中 𝐷 为可对角化矩阵, 𝐻 为零幂阵(即


存在正整数 𝑚, 使得 𝐻 𝑚 = 𝑂), 且 𝐷𝐻 = 𝐻𝐷.
25. 特征值全为 1 的方阵称为幂幺矩阵(unipotent matrix). 证明: 每个可逆复方阵 𝐴 可分解
为 𝐴 = 𝐷𝑈 , 其中 𝐷 为可对角化矩阵, 𝑈 为幂幺阵, 且 𝐷𝑈 = 𝑈 𝐷.
参 考 文 献
胡显佑. 2004. 线性代数习题集. 北京: 中国人民大学出版社.
金路. 2014. 线性代数同步辅导与复习提高. 上海: 复旦大学出版社.
居余马, 林翠琴. 2003. 线性代数学习指南. 北京: 清华大学出版社.
蓝以中. 2008. 高等代数学习指南. 北京: 北京大学出版社.
李志慧. 2008. 高等代数中的典型问题与方法. 北京: 科学出版社.
刘丁酉. 2006. 线性代数同步辅导与习题精解. 合肥: 中国科学技术大学出版社.
卢刚. 2009. 线性代数中的典型例题分析与习题. 北京: 高等教育出版社.
孙兰芬, 陈一巾. 2004. 线性代数. 杭州: 浙江大学出版社.
同济大学数学系. 2007. 工程数学线性代数. 5版. 北京: 高等教育出版社.
杨子胥. 2001. 高等代数习题解―修订版. 济南: 山东科学技术出版社.
杨子胥. 2008. 高等代数精选例题. 北京: 高等教育出版社.
姚暮生等. 2014. 高等代数学. 上海: 复旦大学出版社.
俞正光, 何坚勇, 王飞燕. 2003. 线性代数与空间解析几何学习指导. 北京: 科学出版社.
郑广平. 2006. 线性代数与解析几何习题集解析. 上海: 复旦大学出版社.
David C L. 2004. Linear Algebra and Its Applications. 北京: 电子工业出版社(影印版).
Gilbert S. 2009. Introduction to Linear Algebra. Cambridge: MIT Press.
Roger A H, Charles R J. 2005. Matrix Analysis. 北京: 人民邮电出版社(影印版).
Steven J L. 2007. Linear Algebra with Applications. 北京: 机械工业出版社(影印版).

You might also like