Professional Documents
Culture Documents
线性代数 复旦版
线性代数 复旦版
张 巍 阚海斌 倪卫明 编著
科 学 出 版 社
北 京
内 容 简 介
本书按照高等院校理工科各专业线性代数教学要求而编写,全书共七章, 包括矩
阵、线性方程组、行列式、线性空间与线性变换、特征值与二次型、矩阵分解、矩阵
的 Jordan 标准形. 本书力求深入浅出, 在介绍抽象的数学概念时会交代其来龙去脉,
突出其实际应用背景. 书中有大量精选例题和习题, 较难的印有*, 可以根据情况
选用.
本书是高等学校理工科各专业线性代数教材, 也可供工程技术类人员、研究生和
教师参考.
图书在版编目(CIP)数据
线性代数 / 张巍, 阚海斌, 倪卫明编著. -- 北京 : 科学出版社, 2016.7
ISBN 978-7-03-049409-2
责任编辑:王艳丽/责任校对:
责任印制:/封面设计:
科 学 出 版 社 出版
北京东黄城根北街 16 号
邮政编码:100717
http://www.sciencep.com
文林印务有限公司印刷
科学出版社发行 各地新华书店经销
*
2016 年 1 月第 一 版 开本:B5(720×1000)
2016 年 1 月第一次印刷 印张:00
字数:000 000
定价:00.00 元
(如有印装质量问题,我社负责调换)
前 言
线性代数对于自然科学、技术科学及社会科学等各专业学生均是一门非常重
要的基础课程, 其核心内容包括矩阵理论、线性方程组理论、向量空间理论等, 这
些概念与理论为许多专业领域中的实际问题提供了表述精确的数学语言, 并为分
析问题与解决问题提供了强有力的数学工具.
本书几乎涵盖国内外已有线性代数课程的全部内容, 比国内大多数教材的内
容更加丰富, 在很多重要知识点的阐述方面, 讲解角度更加新颖、更加体系化. 特
别针对技术科学类学生, 对工程技术专业中常用的线性代数的基本概念、基本理
论和基本方法作了较深入的讨论和阐述, 力求条理清楚、重点突出, 定理证明简洁
清晰, 例题分析典型直观, 使读者在较短时间内系统地掌握线性代数的基本内容.
第 1 章介绍矩阵. 主要介绍了矩阵乘法、 初等变换, 以及秩的概念. 从元素、
行、列等不同角度讲解矩阵乘法, 使读者充分理解为什么这样定义矩阵乘法. 特别
强调矩阵乘积 𝐴𝐵 的第 𝑗 列是矩阵 𝐴 的所有列的线性组合, 组合系数为 𝐵 的第
𝑗 列各元素. 从向量线性组合的角度讲解矩阵乘法, 将矩阵与向量乘积 𝐴𝑥 作为关
于 𝐴 的列的线性组合, 使读者一开始就建立向量的线性组合这一重要概念.
第 2 章介绍线性方程组. 首先从行的角度考察线性方程组, 求解线性方程组等
价于求所有超平面的公共点;其次从列的角度考察线性方程组, 求解线性方程组
等价于求向量的线性组合系数. 从横纵两个角度讲解线性方程组有解的条件, 而不
是抽象地叙述理论, 使读者更直观、更深刻掌握线性方程组理论, 也加深了对第 1
章矩阵理论的理解, 为后续向量空间的学习打下基础, 并将线性方程组理论和向量
空间思想联系在一起. 在本章最后,基于线性方程组的理论系统地讲解了逆矩阵.
第 3 章介绍行列式. 结合矩阵的初等变换讲解行列式的性质使读者温故而知
新. 在讲解伴随矩阵的基础上, 引入行列式按行(列)展开的计算方法以及 Cramer
法则.
第 4 章介绍线性空间与线性变换. 主要介绍了基、子空间、内积空间、线性
变换等基本概念. 从向量投影角度讲解 Schmidt 正交化, 使读者深刻理解 Schmidt
正交化过程每一步的含义, 避免了硬记公式、学过就忘. 结合线性方程组理论, 以
向量正交投影为基础, 引入线性方程组无解情况下求其最小二乘解的意义和方法.
第 5 章介绍特征值与二次型. 介绍了特征值、特征向量、二次型、正定矩阵
等概念, 讨论了矩阵可对角化的条件, 揭示矩阵可对角化的内在原因是每个特征值
的几何重数与代数重数相等. 结合二次型引入了 Rayleigh 商, 这个概念对于技术
ii 前 言
科学类学生后续专业课程的学习是很有用的.
第 6 章介绍矩阵分解. 矩阵分解在解决实际工程问题中起着很大的作用. 将矩
阵表示为多个特殊矩阵的乘积, 实际上是对该矩阵中数据的预处理, 将其分解成多
个部分. 本章着重介绍了最常用的矩阵 LU 分解、QR 分解、 Cholesky 分解、谱分
解和奇异值分解.
第 7 章介绍矩阵的 Jordan 标准形. Jordan 标准形是初等矩阵理论一个核心内
容, 我们采用比较简单的 𝜆-矩阵的方法, 介绍了 𝜆-矩阵的标准形、 不变因子与初
等因子、两个矩阵相似当且仅当它们的特征矩阵等价, 从而证明任何一个矩阵都
相似于一个 Jordan 形矩阵. 然后, 把矩阵看成一个线性变换, 证明存在一组基, 使
得这个线性变换在这组基下的矩阵是 Jordan 形矩阵.
全书编写由阚海斌老师负责统筹安排, 其中第 1, 2, 5, 6 章由张巍老师编写、
第 3 章由张巍与阚海斌老师编写、第 4 章由张巍与倪卫明老师编写、第 7 章由阚
海斌与倪卫明老师编写. 最后, 阚海斌老师对全书作了修改和审定. 复旦大学 2015
级技术科学试验班的同学们为每章习题的编写提供了不少帮助, 对此表示衷心的
感谢.
限于编者的水平与经验, 不妥之处在所难免, 恳请各位专家、学者和读者提出
宝贵意见.
编 者
2016年2月29日
目 录
第1章 矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 矩阵与向量的概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 矩阵的基本概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.2 向量的内积与矩阵的乘法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 方阵的幂 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 分块矩阵及其运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1 分块矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.2 分块矩阵的基本运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 矩阵的初等变换与秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.1 矩阵的初等变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2 矩阵的标准形与秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
第2章 线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1 横看线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.1 齐次线性方程组的解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.2 非齐次线性方程组的解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2 纵看线性方程组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.1 线性相关与向量组的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.2 齐次线性方程组的基础解系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.3 非齐次线性方程组解的结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.3 逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.1 可逆矩阵的定义与性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
iv 目 录
2.3.2 用初等变换求逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.3.3 正交阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.4 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
第3章 行列式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1 行列式的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1.1 逆序数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1.2 行列式的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2 行列式的性质 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.3 伴随矩阵与行列式按行(列)展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3.1 伴随矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3.2 行列式按行(列)展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.3.3 Cramer 法则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.4 行列式与矩阵的秩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
第4章 线性空间与线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.1 线性空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2 基 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.1 基和坐标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.2 过渡矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.3 子空间 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3.1 子空间的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.5 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
第6章 矩阵分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.1 LU 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.2 QR 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.3 Cholesky 分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.4 谱分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.5 奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.6 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
第7章 矩阵的Jordan 标准形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.1 多项式矩阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
vi 目 录
1.1 矩阵与向量的概念
1.1.1 矩阵的基本概念
称为矩阵 𝐴 的转
转置矩 阵 (transpose matrix), 记作𝐴T . 显然, (𝐴T )T = 𝐴.
根据定义, 矩阵 𝐴 的第 𝑖 行第 𝑗 列元素与其转置矩阵 𝐴T 的第 𝑗 行第 𝑖 列元素
相同, 即 entry(𝐴, 𝑖, 𝑗) = entry(𝐴T , 𝑗, 𝑖).
例1.1.1 矩阵
−1 0 1
𝐴=
0 1 −1
2 0 1
2 1 0
𝐵=
2 3 1
的转置矩阵分别为
−1 0 2
𝐴T =
0 1 0
1 −1 1
2 2
𝐵T =
1 3
0 1
若 矩 阵 的 所 有 元 素 均 为 0, 则 该 矩 阵 称 为 零 矩 阵 (zero matrix), 记 作 𝑂 或
者 𝑂𝑚×𝑛 .
当 𝑚 = 𝑛 时, 称 𝐴𝑚×𝑛 为 𝑛 阶方
方 阵 (square matrix); 该方阵从左上角至右下角
P𝑛
的元素 𝑎11 , 𝑎22 , · · · , 𝑎𝑛𝑛 称为对角线元素; 方阵 𝐴 的对角线元素之和 𝑖=1 𝑎𝑖𝑖 称
为该方阵的迹
迹(trace), 记作 tr(𝐴).
定义 1.1.3 若 𝑛 阶方阵 𝐴 满足 𝐴T = 𝐴, 则称 𝐴 为 对 称阵 (symmetric matrix).
若 𝑛 阶方阵 𝐴 的非对角线元素均为零, 即
𝑎1 0 ··· 0
0
𝑎2 · · · 0
𝐴=
.. .. ..
. . .
0 0 · · · 𝑎𝑛
则称该方阵为对
对角 阵(diagonal matrix), 记为 diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ). 显然, 对角阵是特
殊的对称阵. 特别地, 如果对角阵的对角线元素相等, 则该对角阵又称为纯
纯量 阵 .
1.1 矩阵与向量的概念 3
若方阵的所有对角线元素均为 1, 所有非对角线元素均为 0, 即
1 0 ··· 0
0 1 ··· 0
.. .. ..
. . .
0 0 ··· 1
则称该方阵为单
单位 阵 (identity matrix), 记作 𝐼 或 𝐼𝑛 (其中 𝑛 表示阶数). 显然, 单位阵
是特殊的对称阵、对角阵、纯量阵.
定 义 1.1.4 设 𝑛 阶方阵 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 当 1 6 𝑗 < 𝑖 6 𝑛 时, 𝑎𝑖𝑗 = 0, 称 𝐴 为上
三角阵, 如下列第 1 个矩阵所示; 当 1 6 𝑖 < 𝑗 6 𝑛 时, 𝑎𝑖𝑗 = 0, 称 𝐴 为下三角阵, 如
下列第 2 个矩阵所示.
𝑎11 𝑎12 · · · 𝑎1𝑛
0
𝑎22 · · · 𝑎2𝑛
.. .. ..
. . .
0 0 · · · 𝑎𝑛𝑛
𝑎11 0 ··· 0
𝑎
21 𝑎22 ··· 0
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
上三角阵和下三角阵统称为三
三角 阵 (triangular matrix). 如果上(下)三角阵的主
对角线元素均为 0, 则称为严格上(下)三角阵.
1.1.2 向量的基本概念
量(row vector),
𝑎1
𝑎2
𝛼=
..
.
𝑎𝑛
1.2 矩阵与向量的运算
1.2.1 矩阵(向量)的线性运算
定 义 1.2.1 设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 𝐶 = [𝑐𝑖𝑗 ]𝑚×𝑛 , 若满足 𝑐𝑖𝑗 =
𝑎𝑖𝑗 + 𝑏𝑖𝑗 (𝑖 = 1, · · · , 𝑚; 𝑗 = 1, · · · , 𝑛), 则 称 矩 阵 𝐶 为 𝐴 与 𝐵 的 和, 记 作 𝐶 =
𝐴 + 𝐵.
上述计算矩阵和的运算称为矩阵的加法.
两个矩阵只有在行数相等且列数相等时才可相加.
可以验证矩阵的加法满足:
(1) 𝐴 + 𝐵 = 𝐵 + 𝐴(交换律);
(2) (𝐴 + 𝐵) + 𝐶 = 𝐴 + (𝐵 + 𝐶)(结合律);
(3) (𝐴 + 𝐵)T = 𝐴T + 𝐵 T .
其中 𝐴, 𝐵 为行数相等且列数相等的矩阵.
定 义1.2.2 设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 𝑘 为某个数, 若满足 𝑏𝑖𝑗 =
𝑘𝑎𝑖𝑗 (𝑖 = 1, · · · , 𝑚; 𝑗 = 1, · · · , 𝑛), 则称 𝐵 为数 𝑘 与矩阵 𝐴 的数量乘积, 记作 𝐵 =
𝑘𝐴. 上述计算数与矩阵乘积的运算称为矩阵的数乘. 特别地, 若 𝑘 = −1, 则 𝐵 =
−𝐴, 称矩阵 𝐵 为 𝐴 的负矩阵.
数与任意一个矩阵相乘总是可行的.
设矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 , 𝐵 = [𝑏𝑖𝑗 ]𝑚×𝑛 , 矩阵的减法可定义为: 𝐴 − 𝐵 = 𝐴 +
(−𝐵).
可以验证矩阵的数乘满足:
1.2 矩阵与向量的运算 5
1.2.2 向量的内积与矩阵的乘法
𝑙
X
𝑐𝑖𝑗 = 𝑎𝑖𝑘 𝑏𝑘𝑗 (𝑖 = 1, 2, · · · , 𝑚; 𝑗 = 1, 2, · · · , 𝑛)
𝑘=1
由 于 𝑙 元 行 向 量 row(𝐴, 𝑖) 和 𝑙 元 列 向 量 col(𝐵, 𝑗) 分 别 可 以 看 作 是 1 × 𝑙 矩 阵
和 𝑙 × 1 矩阵, 根据 矩阵乘法的 定义, row(𝐴, 𝑖) 与 col(𝐵, 𝑗) 的乘积等于它们的
内积 row(𝐴, 𝑖)col(𝐵, 𝑗) = ⟨row(𝐴, 𝑖), col(𝐵, 𝑗)⟩, 因此上式还可写为:
(1) entry(𝐴𝐵, 𝑖, 𝑗) = row(𝐴, 𝑖)col(𝐵, 𝑗).
进一步, 不难验证以下有用的等式:
P𝑙
(2) row(𝐴𝐵, 𝑖) = row(𝐴, 𝑖)𝐵 = 𝑘=1 𝑎𝑖𝑘 row(𝐵, 𝑘).
P𝑙
(3) col(𝐴𝐵, 𝑗) = 𝐴col(𝐵, 𝑗) = 𝑘=1 𝑏𝑘𝑗 col(𝐴, 𝑘).
1 −1 1 0 1
求 𝐴𝐵 的第 2 行以及第 1 列.
解 𝐴𝐵 的第 2 行
𝐴𝐵 的第 1 列
1.2 矩阵与向量的运算 7
col(𝐴𝐵, 1) = 𝐴col(𝐵, 1)
−1 0 2 −2
=2×
0 +1× 1 +0× 0 = 1
1 −1 1 1
例1.2.2 设
1 −1 2 0 1 1
𝐴= , 𝐵= , 𝐶=
−1 1 0 −2 −1 −1
从例1.2.2可以看出:
(1) 矩阵乘法的交换律不成立. 首先, 矩阵 𝐴 可以左乘矩阵 𝐶 并不意味着可以
右乘 𝐶, 可能 𝐴𝐶 与 𝐶𝐴 并非同时有意义; 其次, 即使同时有意义, 也不一定相等.
在矩阵相乘时, 必须考虑是否有意义, 而且说明是左乘还是右乘.
(2) 已知 𝐴𝐶 = 𝑂, 无法推出 𝐴 = 𝑂 或 𝐶 = 𝑂; 已知 𝐴𝐶 = 𝑂, 𝐴 ̸= 𝑂, 无法
推出 𝐶 = 𝑂.
(3) 已 知 𝐴𝐵 = 𝐴𝐶, 𝐴 ̸= 𝑂, 无 法 推 出 𝐵 = 𝐶. 这 是 因 为 𝐴𝐵 = 𝐴𝐶,
即 𝐴(𝐵−𝐶) = 𝑂, 尽管 𝐴 ̸= 𝑂, 但由 (2) 知, 不能推出 𝐵 − 𝐶 = 𝑂.
可以验证矩阵的乘法满足:
(1) (𝐴𝐵)𝐶 = 𝐴(𝐵𝐶) (结合律);
(2) 𝐶(𝐴 + 𝐵) = 𝐶𝐴 + 𝐶𝐵 (分配律);
(3) (𝐴 + 𝐵)𝐶 = 𝐴𝐶 + 𝐵𝐶 (分配律);
(4) 𝑘(𝐴𝐵) = (𝑘𝐴)𝐵 = 𝐴(𝑘𝐵).
8 第1章 矩 阵
其中 𝑘为数, 矩阵 𝐴, 𝐵, 𝐶 的阶数使上述各式有意义.
性质 1.2.1 设矩阵 𝐴𝑚×𝑙 , 𝐵𝑙×𝑛 , 则 (𝐴𝐵)T = 𝐵 T 𝐴T .
证明
𝑙
X
entry((𝐴𝐵)T , 𝑖, 𝑗) = entry(𝐴𝐵, 𝑗, 𝑖) = row(𝐴, 𝑗)col(𝐵, 𝑖) = 𝑎𝑗𝑘 𝑏𝑘𝑖
𝑘=1
证明
𝑚
X 𝑚
X 𝑚 X
X 𝑛
tr(𝐴𝐵) = entry(𝐴𝐵, 𝑖, 𝑖) = row(𝐴, 𝑖)col(𝐵, 𝑖) = 𝑎𝑖𝑘 𝑏𝑘𝑖
𝑖=1 𝑖=1 𝑖=1 𝑘=1
X𝑛 X𝑛 X𝑛 X 𝑚
tr(𝐴𝐵) = entry(𝐴𝐵, 𝑘, 𝑘) = row(𝐵, 𝑘)col(𝐴, 𝑘) = 𝑏𝑘𝑖 𝑎𝑖𝑘
𝑘=1 𝑘=1 𝑘=1 𝑖=1
故 tr(𝐴𝐵) = tr(𝐵𝐴).
例1.2.3 设
𝛼 = [𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ]T , 𝛽 = [𝑏1 , 𝑏2 , · · · , 𝑏𝑛 ]
则
𝑎1 𝑏1 𝑎1 𝑏2 · · · 𝑎1 𝑏𝑛
𝑎 𝑏
2 1 𝑎2 𝑏2 · · · 𝑎2 𝑏𝑛
𝛼𝛽 =
.. .. ..
. . .
𝑎𝑛 𝑏1 𝑎𝑛 𝑏2 · · · 𝑎𝑛 𝑏𝑛
𝑛
X
𝛽𝛼 = 𝑎𝑖 𝑏𝑖
𝑖=1
1.2 矩阵与向量的运算 9
例1.2.4 设
𝑎11 𝑎12 · · · 𝑎1𝑛
𝑎
21 𝑎22 · · · 𝑎2𝑛
𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T
𝐴=
.. .. ..
,
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
则 P𝑛
𝑎 𝑥
𝑗=1 1𝑗 𝑗
P𝑛
𝑎2𝑗 𝑥𝑗 𝑛
X
𝑥T 𝐴𝑥 =
𝐴𝑥 = 𝑗=1 , 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗
..
𝑖,𝑗=1
.
P𝑛
𝑎𝑛𝑗 𝑥𝑗
𝑗=1
当 𝑖 > 𝑗 时,
𝑛
X
entry(𝐴𝐵, 𝑖, 𝑗) = row(𝐴, 𝑖)col(𝐵, 𝑗) = 𝑎𝑖𝑘 𝑏𝑘𝑗 = 0
𝑘=1
𝑛
X 𝑛
X
1T col(𝐴, 𝑗) = 𝑎𝑖𝑗 = 1, 1T col(𝐵, 𝑗) = 𝑏𝑖𝑗 = 1 (𝑗 = 1, 2, · · · , 𝑛)
𝑖=1 𝑖=1
1.2.3 方阵的幂
(𝐴 + 𝐼)(𝐴 − 𝐼) = (𝐴 − 𝐼)(𝐴 + 𝐼) = 𝐴2 − 𝐼
这是因为 𝐴𝐼 = 𝐼𝐴 = 𝐴.
不难验证, 如果 𝐴 = diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 ), 则 𝐴𝑘 = diag(𝑎𝑘1 , 𝑎𝑘2 , · · · , 𝑎𝑘𝑛 ).
1.3 分块矩阵及其运算
1.3.1 分块矩阵
矩阵分块是通过在矩阵的行或列之间划几条水平或竖直分割线, 将给定的矩
阵分成若干较低阶的子矩阵(submatrix). 对于同一矩阵, 可以有不同的分块方式. 分
块是为了使问题简化. 在实际问题中, 要结合给定矩阵的特点采用分块策略. 一般
1.3 分块矩阵及其运算 11
地, 设 𝑚 × 𝑛 矩阵 𝐴, 将矩阵 𝐴 分块, 得
𝐴11 𝐴12 · · · 𝐴1𝑞
𝐴
21 𝐴22 · · · 𝐴2𝑞
𝐴=
.. .. ..
. . .
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞
根据其特点, 可分块为
5 0 0 0 0 0
0 2 0 0 0 0
0 1 2 0 0 0
𝐴=
0 0 1 2 0 0
0 0 0 0 7 0
0 0 0 0 0 7
记
2 0 0
7 0
𝐴11 = [5], 𝐴22 =
1 2 ,
0 𝐴33 =
0 7
0 1 2
则
𝐴11 𝑂 𝑂
𝐴=
𝑂 𝐴22 𝑂
𝑂 𝑂 𝐴33
12 第1章 矩 阵
例1.3.2 设 𝑚 × 𝑛 矩阵 𝐴, 如果按行分块将矩阵的每一行作为一个子矩阵, 得
row(𝐴, 1)
row(𝐴, 2)
𝐴=
..
.
row(𝐴, 𝑚)
如果按列分块将矩阵的每一列作为一个子矩阵, 我们可以得到
1.3.2 分块矩阵的基本运算
1.转置
设分块矩阵
𝐴11 𝐴12 · · · 𝐴1𝑞
𝐴
21 𝐴22 · · · 𝐴2𝑞
𝐴=
.. .. ..
. . .
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞
则其转置矩阵为
𝐴T
11 𝐴T
21 · · · 𝐴T
𝑝1
𝐴T 𝐴T · · · 𝐴T
12 22 𝑝2
𝐴T =
.. .. ..
. . .
𝐴T
1𝑞 𝐴T
2𝑞 · · · 𝐴T
𝑝𝑞
2.加法
设 𝐴与 𝐵 均为 𝑚 × 𝑛 矩阵, 对 𝐴 与 𝐵 以相同的方式进行分块,
𝐴11 𝐴12 · · · 𝐴1𝑞 𝐵11 𝐵12 · · · 𝐵1𝑞
𝐴
21 𝐴22 · · · 𝐴2𝑞
𝐵
21 𝐵22 · · · 𝐵2𝑞
𝐴=
.. .. ..
,
𝐵=
.. .. ..
. . . . . .
𝐴𝑝1 𝐴𝑝2 · · · 𝐴𝑝𝑞 𝐵𝑝1 𝐵𝑝2 · · · 𝐵𝑝𝑞
1.3 分块矩阵及其运算 13
3.数乘
4.乘法
𝐶11 · · · 𝐶1𝑗 · · · 𝐶1𝑞
.. .. ..
. . .
𝐴𝐵 = 𝐶𝑖1 ··· 𝐶𝑖𝑗 ··· 𝐶𝑖𝑞
. .. ..
..
. .
𝐶𝑝1 · · · 𝐶𝑝𝑗 · · · 𝐶𝑝𝑞
14 第1章 矩 阵
其中
𝑡
X
𝐶𝑖𝑗 = 𝐴𝑖𝑘 𝐵𝑘𝑗
𝑘=1
上述分块矩阵的转置、加法、数乘、乘法, 均可由矩阵的转置、加法、数乘、
乘法等运算规则导出, 留给读者自行验证.
例1.3.3 设
1 5 1 0 0 0 0 0 0
2
−1 0 1 0
0
0 0 4
𝐴=
3 ,
0 0 0 1 𝐵=
2 4 8 0
3 0 0 0 0 1 21 0
0 3 0 0 0 3 −1 0 0
利用分块矩阵计算 𝐴𝐵.
解 将矩阵 𝐴, 𝐵 分块如下
1 5 1 0 0
2 −1 0 1 0
𝐴 𝐼3
11
𝐴=
3 0 0 0 =
1
3𝐼2 𝑂2×3
3 0 0 0 0
0 3 0 0 0
0 0 0 0
0 0 0 4
𝑂 𝐵
2×3 12
𝐵=
2 4 =
8 0
𝐵21 𝑂3×1
1 2 1 0
3 −1 0 0
则
𝐴
11
𝐼3 𝑂2×3 𝐵12
𝐴𝐵 =
3𝐼2 𝑂2×3 𝐵21 𝑂3×1
𝐵
21
𝐴11 𝐵12
=
𝑂2×3 3𝐵21
1.3 分块矩阵及其运算 15
由于
1 5 20
0 0
𝐴11 𝐵12 =
2 −1 = −4 , 3𝐵12 =
4 12
3 0 0
于是得
2 4 8 20
1
2 1 −4
𝐴𝐵 =
3 −1 0 0
0 0 0 0
0 0 0 12
这就利用分块矩阵的方法验证了1.2 节的等式
16 第1章 矩 阵
𝐴𝐴T = 𝛼1 𝛼T + 𝛼2 𝛼T T
2 + · · · + 𝛼 𝑛 𝛼𝑛
𝛼T T T
1 𝛼1 𝛼1 𝛼2 · · · 𝛼1 𝛼𝑛
𝛼T 𝛼 𝛼T T
2 𝛼2 · · · 𝛼2 𝛼𝑛
T
2 1
𝐴 𝐴=
.. .. ..
. . .
𝛼T T T
𝑛 𝛼1 𝛼𝑛 𝛼2 · · · 𝛼 𝑛 𝛼𝑛
1.4 矩阵的初等变换与秩
1.4.1 矩阵的初等变换
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
. . .
. . .
𝑎𝑖1
𝑎𝑖2 ··· 𝑎𝑖𝑛
𝑎𝑗1
𝑎𝑗2 ··· 𝑎𝑗𝑛
. .. .. 𝑅𝑖𝑗 . .. ..
.. . . −−→ .. . .
𝑎
𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛
𝑎
𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛
.. .. .. .. .. ..
. . . . . .
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
. . . . . .
𝑘𝑅𝑖
𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 −−→ 𝑘𝑎𝑖1 𝑘𝑎𝑖2 · · · 𝑘𝑎𝑖𝑛
. .. .. . .. ..
.. ..
. .
. .
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 ··· 𝑎𝑚𝑛
𝑎11 𝑎12 ··· 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
. . .
. . .
𝑎𝑖1
𝑎𝑖2 ··· 𝑎𝑖𝑛
𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛
. .. .. 𝑅𝑗 +𝑘𝑅𝑖 .. .. ..
.. . . −−−−−→ . . .
𝑎
𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛
𝑎 + 𝑘𝑎
𝑗1 𝑖1 𝑎𝑗2 + 𝑘𝑎𝑖2 · · · 𝑎𝑗𝑛 + 𝑘𝑎𝑖3
.. .. .. .. .. ..
. . . . . .
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛 𝑎𝑚1 𝑎𝑚2 ··· 𝑎𝑚𝑛
现对其作如下初等行变换
18 第1章 矩 阵
2 3 2 5
2 3 2 5
𝑅12 𝑅3 − 32 𝑅1
𝐴 −−→ 2 −−−−−→ 0 1 1 2
0 1 1
7 17
0 − −4 −
3 1 −1 −1 2 2
2 3 2 5
𝑅3 + 27 𝑅2
−−−−−→ 0 11 2
1 3
0 0 − −
2 2
2 3 2 5
𝑅3 ×(−2)
−−−−−→ 0 1 1 2
0 0 1 3
定 义1.4.2 由 单 位 矩 阵 𝐼𝑛 经 过 一 次 初 等 变 换 得 到 的 矩 阵, 称 为 初 等 矩
阵(elementary matrix). 初等矩阵通常记作大写英文字母 𝐸.
对于 3 种初等变换, 相应的初等矩阵分别为:
1
..
.
1 ··· 0 i 行
.. ..
𝐸𝑖𝑗 (𝑘) =
. .
j 行
𝑘 ··· 1
..
.
1
则
1 row(𝐴, 1) row(𝐴, 1)
.. ..
..
.
.
.
0 ··· 1 row(𝐴, 𝑖)
row(𝐴, 𝑗)
.. .. .
.
..
𝐸𝑖𝑗 𝐴 =
. .
. =
.
1 ··· 0 row(𝐴, 𝑗)
row(𝐴, 𝑖)
..
..
..
.
.
.
1 row(𝐴, 𝑚) row(𝐴, 𝑚)
1 row(𝐴, 1) row(𝐴, 1)
..
.. ..
. . .
𝐸𝑖 (𝑘)𝐴 = 𝑘 row(𝐴, 𝑖) = 𝑘row(𝐴, 𝑖)
.. .. ..
.
.
.
1 row(𝐴, 𝑚) row(𝐴, 𝑚)
这相当于将 𝐴 的第 𝑖 行乘以非零常数 𝑘;
1 row(𝐴, 1)
..
..
.
.
1 ··· 0 row(𝐴, 𝑖)
.. .. ..
𝐸𝑖𝑗 (𝑘)𝐴 =
. .
.
𝑘 ··· 1 row(𝐴, 𝑗)
..
..
.
.
1 row(𝐴, 𝑚)
row(𝐴, 1)
..
.
row(𝐴, 𝑖)
..
=
.
𝑘row(𝐴, 𝑖) + row(𝐴, 𝑗)
..
.
row(𝐴, 𝑚)
这相当于将 𝐴 的第 𝑖 行的 𝑘 倍加到第 𝑗 行.
1.4.2 矩阵的标准形与秩
则称该矩阵为 𝑚 × 𝑛 矩阵的标
标准 形 .
由矩阵初等变换的定义, 可以得到下面的引理.
引理 1.4.1 设两个 𝑚 × 𝑛 矩阵的标准形如下所示
𝐼𝑟 𝑂 𝐼𝑟 𝑂
𝑃1 = 1 , 𝑃2 = 2
𝑂 𝑂 𝑂 𝑂
如果 𝑟1 ̸= 𝑟2 , 则 𝑃2 不能由 𝑃1 经过初等变换得到.
定理 1.4.2 任一非零矩阵经有限次初等变换可化为标准形
𝐼
𝑟
𝑂
𝑂 𝑂
且对于给定的矩阵,其标准形中 𝑟 的值是唯一确定的.
证明 设 𝑚 × 𝑛 矩阵
𝑎11 𝑎12 ··· 𝑎1𝑛
𝑎
21 𝑎22 ··· 𝑎2𝑛
𝐴=
.. .. ..
. . .
𝑎𝑚1 𝑎𝑚2 · · · 𝑎𝑚𝑛
令
𝑏22 ··· 𝑏2𝑛
.. ..
𝐴1 =
. .
𝑏𝑚2 · · · 𝑏𝑚𝑛
1 0 0 ··· 0 1 0 0 ··· 0
0 1 𝑐23 ··· 𝑐2𝑛
0 1 0 ··· 0
→
𝐵−
0 𝑏32 𝑏33 ··· 𝑏3𝑛 →
−
0 0 𝑐33 ··· 𝑐3𝑛 ,𝐶
.. .. .. .. .. .. .. ..
. . . .
. . . .
0 𝑏𝑚2 𝑏𝑚3 · · · 𝑏𝑚𝑛 0 𝑐 𝑐𝑚3 · · · 𝑐𝑚𝑛
令
𝑐33 ··· 𝑐3𝑛
.. ..
𝐴2 =
. .
𝑐𝑚3 · · · 𝑐𝑚𝑛
现对其作如下初等行变换
−1 −4 5 −1 −4 5
0 2 −4 0 2 −4
𝑅 3 +3𝑅1
𝑅12 𝑅 5 +2𝑅
1
𝐴 −−→ 3 1 7 −−−−−→ 0 −11 22
0
5 −10
0
5 −10
2 3 0 0 −5 10
−1 0 0 1 0 0
𝐶2 −4𝐶1
0
2 −4
0
𝐶1 ×(−1) 2 0
𝐶3 +5𝐶1 𝐶3 +2𝐶2
−−−−−→
0 −11 22 −−−−−→ 0
−11 0
0
5 −10
0
5 0
0 −5 10 0 −5 0
1 0 0 1 0 0
0 2 0 0 1 0
𝐶2 ×(− 12 )
→
−
0 0 0
−
− −− −− → 0
0 0
0 0 0
0 0 0
0 0 0 0 0 0
24 第1章 矩 阵
从上述矩阵的标准形可知矩阵的秩为 2.
例1.4.3 求证: 分块矩阵
𝐴 𝑂
𝑂 𝐵
因此
𝑃1 𝑂 𝐴 𝑂 𝑄1 𝑂
𝑂 𝑃2 𝑂 𝐵 𝑂 𝑄2
𝐼 𝑟1
𝑃1 𝐴𝑄1 𝑂 𝑂
= =
𝑂 𝑃2 𝐵𝑄2
𝐼𝑟 2
𝑂
即经过若干次初等变换
𝐼𝑟 1
𝐴 𝑂 𝑂
→
−
𝑂 𝐵
𝐼 𝑟2
𝑂
因此分块矩阵
𝐴 𝑂
𝑂 𝐵
的秩为 𝑟1 + 𝑟2 .
𝐴 𝐶
例1.4.4 求证: 分块矩阵 的秩大于等于 rank(𝐴) + rank(𝐵).
𝑂 𝐵
逆阵 𝑃1 , 𝑄1 和 𝑃2 , 𝑄2 , 使得
𝐼𝑟 𝑂 𝐼𝑟 𝑂
𝑃1 𝐴𝑄1 = 1 , 𝑃2 𝐵𝑄2 = 2
𝑂 𝑂 𝑂 𝑂
因此
𝑃
1
𝑂 𝐴 𝐶 𝑄1 𝑂 𝑃1 𝐴𝑄1 𝑃1 𝐶𝑄2
=
𝑂 𝑃2 𝑂 𝐵 𝑂 𝑄2 𝑂 𝑃2 𝐵𝑄2
𝐼 𝑟1 𝑂 𝐶11 𝐶12
𝑂 𝑂 𝐶21 𝐶22
=
𝑂 𝑂 𝐼 𝑟2 𝑂
𝑂 𝑂 𝑂 𝑂
即经过若干次初等变换
𝐼 𝑟1
𝐴 𝐶 𝐶22
→
−
𝑂 𝐵
𝐼 𝑟2
𝑂
因此分块矩阵
𝐴 𝐶
𝑂 𝐵
由前面关于矩阵秩的定义、定理和推论, 可得如下结论.
26 第1章 矩 阵
定理 1.4.3 设 𝑚 × 𝑛 矩阵 𝐴 与 𝐵, 下列三个命题等价:
(1) 矩阵 𝐴 与 𝐵 的秩相等;
(2) 矩阵 𝐴 与 𝐵 具有相同的标准形;
(3) 矩阵 𝐴 经有限次初等变换可化为 𝐵.
定理 1.4.4 rank(𝐴T ) = rank(𝐴).
故 rank(𝐴T ) = 𝑟.
定 义 1.4.5 若矩阵的每个非零行的上方没有零行, 且各个非零行自左向
右的第一个非零元素 𝑎1𝑗1 , 𝑎2𝑗2 , · · · , 𝑎𝑟𝑗𝑟 所在列的编号满足 𝑗1 < 𝑗2 < · · · < 𝑗𝑟 ,
则 称 该 矩 阵 为 阶 梯 型 矩 阵. 阶 梯 型 矩 阵 中 各 非 零 行 自 左 向 右 第 一 个 非 零 元
素 𝑎1𝑗1 , 𝑎2𝑗2 , · · · , 𝑎𝑟𝑗𝑟 所在的列第 𝑗1 列, 第 𝑗2 列, · · · , 第 𝑗𝑟 列可作为矩阵的主
主元 列 .
通常我们求矩阵秩的方法是对矩阵进行初等变换, 将其化为一个容易求秩的
矩阵, 如化为阶梯型的矩阵, 直接看出阶梯型矩阵主元列的个数, 从而快速求得原
矩阵的秩.
例1.4.5 下列矩阵 𝐴 只经过初等行变换化为阶梯型, 进一步作初等行变换化
为最简阶梯型:
1.5 习 题 27
1 0 1 −1 −3 1 0 1 −1 −3
1 2 −1 0 −1 0 2 −2 1 2
𝐴= →−
4
6 −2 −4 3
0
0 0 1 −3
2 −2 4 −7 4 0 0 0 0 0
1 0 1 0 −6
0 1 −1 0 2.5
→
−
0
0 0 1 −3
0 0 0 0 0
1.5 习 题
1. 计算下列矩阵的乘积:
4 3 1 7
(1) 1 −2 3 2 ;
5 7 0 1
3
(2)[ 1 2 3 ] 2 ;
1
2
(3) 1 [ −1 2 ];
3
1 3 1
2 1 4 0 0 −1 2
(4) ;
1 −1 3 4 1 −3 1
4 0 −2
𝑎11 𝑎12 𝑎13 𝑥1
(5)[ 𝑥1 𝑥2 𝑥3 ] 𝑎12 𝑎22 𝑎23 𝑥2 .
1 −1 1 0 5 1
1 3
3. 设 𝐴 = , 求 𝐴50 和 𝐴51 .
1 −3
4. (1) 设 𝐴, 𝐵 为 𝑛 阶矩阵, 且 𝐴 为对称矩阵, 证明 𝐵 T 𝐴𝐵 也是对称矩阵;
28 第1章 矩 阵
𝑎 0 0 0 1 0
cos 𝜃 sin 𝜃
𝐴= 0 𝑏 0 , 𝐵= 0 0 1 , 𝐶=
− sin 𝜃 cos 𝜃
0 0 𝑐 0 0 0
求 𝐴5 , 𝐵 3 , 𝐶 𝑛 .
𝑎 1 1 3 𝑏
7. 已知 3 0 1 𝑎 = 6 , 求 𝑎 和 𝑏.
0 2 −1 −3 𝑏
8. 若 𝐴 是 𝑛 阶方阵且 𝐴𝑛 = 𝑂, 试证:
9. 计算下列矩阵的 𝑛 次方幂:
1 1
h i
(1)设 𝐴 = 𝛼T 𝛽, 其中 𝛼 = [1, 2, 3], 𝛽 = 1, , , 求 𝐴𝑛 ;
2 3
1 2 3
(2)设 𝐵 = 2 4 6, 求 𝐵 𝑛 ;
3 6 9
1 −1 −1 −1
−1 1 −1 −1
(3)设 𝐶 = , 求 𝐶 𝑛 ;
−1 −1 1 −1
−1 −1 −1 1
1 1 0
(4)设 𝐷 = 0 1 1, 求 𝐷 𝑛 .
0 0 1
10. 试证:
(1) 与所有 𝑛 阶对角阵乘法可交换的矩阵也必是 𝑛 阶对角阵;
(2) 与所有 𝑛 阶矩阵乘法可交换的矩阵是纯量阵.
11. 证明: 两个对角元为 1 的上三角阵乘积仍是对角元为 1 的上三角阵.
𝑥1 𝑦1
𝑥2 𝑦2
12. 设 𝑛 元向量 𝑥 = ..
, 𝑦 = ..
. 若 𝐴 = 𝑦𝑥T , 求 𝐴𝑘 (𝑘 ∈ N+ ).
. .
𝑥𝑛 𝑦𝑛
1.5 习 题 29
1
2
0
.
13. 设 𝑛(𝑛 > 2) 元向量 𝑥 = , 𝐴 = 𝐼𝑛 − 𝑥𝑥T , 𝐵 = 𝐼𝑛 + 2𝑥𝑥T , 求 𝐴𝐵.
..
0
1
2
14. 设 𝐴 是 𝑚 × 𝑛 矩阵. 证明: 若对于任何 𝑛 元列向量 𝑥 成立 𝐴𝑥 = 0, 则 𝐴 = 𝑂𝑚×𝑛 .
15. 设 𝑛 阶方阵 𝐴, 𝐵 满足 𝐴2 = 𝐴, 𝐵 2 = 𝐵, 且 (𝐴 + 𝐵)2 = 𝐴 + 𝐵, 证明: 𝐴𝐵 = 𝑂.
1 0 1
16. 设 𝐴 = 0 2 0 , 求 𝐴𝑛 − 2𝐴𝑛−1 (𝑛 > 2).
1 0 1
17. 设 𝑛 阶方阵 𝐴, 𝐵 满足 𝐴2 = −𝐴, 𝐵 2 = −𝐵, 且 (𝐴 + 𝐵)2 = −𝐴 − 𝐵, 证明: 𝐴𝐵 = 𝑂.
1 0 1
18. 设 𝐴 = 0 2 0 , 𝑛 为正整数, 求 𝐴𝑛 − 2𝐴𝑛−1 .
1 0 1
1
𝐴 = 𝐼 − 𝛼𝛼T , 𝐵=𝐼+ 𝛼𝛼T
𝑎
其中 𝐴𝐵 = 𝐼, 𝐼 为 𝑛 阶单位矩阵, 求 𝛼.
1 0 1
21. 设矩阵𝐴 = 0 2 0 , 矩阵 𝑋 满足 𝐴𝑋 + 𝐼 = 𝐴2 + 𝑋, 其中 𝐼 为 3 阶单位矩阵,
1 0 1
试求出矩阵 𝑋.
22. 计算下列矩阵的 𝑘 次幂, 其中 𝑘 为正整数:
1 𝑎 0 1 2 4
(1)𝐴 = 0 1 𝑎 ; (2)𝐴 = 2 4 8 .
0 0 1 3 6 12
23. 设 𝐴, 𝐵 是两个 𝑛 阶矩阵, 若 tr(𝐴𝐵𝐶) =tr(𝐶𝐵𝐴) 对任意 𝑛 阶矩阵 𝐶 成立, 求证
𝐴𝐵 = 𝐵𝐴.
24. 设
1 0 0 0 1 0 1 0
0 1 0 0 −1 2 0 1
𝐴= , 𝐵=
−1 2 1 0 1 0 4 1
1 1 0 1 −1 −1 2 0
利用分块矩阵求 𝐴𝐵.
30 第1章 矩 阵
1 2 3
𝐴= 2 3 −5
4 7 1
3 2 0 5 0
3 −2 3 6 −1
𝐵=
2 0 1 5 −3
1 6 −4 −1 4
26. 设
1 2 −1 1
𝐴= 3 2 𝜆 −1
5 6 3 𝜇
已知 rank(𝐴) = 2, 求 𝜆 和 𝜇 的值.
若矩阵 𝐴 的秩为 𝑛 − 1, 求 𝑎.
32. 用初等行变换将下列矩阵化为阶梯型矩阵:
1 2 3 4 1 0 −1 5 12
0 −1 0 −2 6 7 8 0 −9
(1) ; (2) .
1 1 3 2 26 21 26 −10 −51
2 2 6 4 15 14 13 −15 −54
33. 判断下列矩阵是否有相同的最简阶梯型:
1.5 习 题 31
1 2 3 1 −1 5
(1) 2 4 6 , 0 3 3 ;
0 1 2 0 2 2
−1 0 4 1 −1 5
(2) 3 0 −1 , −1 4 −2 .
0 1 −1 0 3 3
第2章 线性方程组
2.1 横看线性方程组
线性方程组的一般形式为
𝑎11 𝑥1 + 𝑎12 𝑥2 + · · · + 𝑎1𝑛 𝑥𝑛 = 𝑏1
𝑎21 𝑥1 + 𝑎22 𝑥2 + · · · + 𝑎2𝑛 𝑥𝑛 = 𝑏2
······
𝑎 𝑥 + 𝑎 𝑥 + ··· + 𝑎 𝑥 = 𝑏
𝑚1 1 𝑚2 2 𝑚𝑛 𝑛 𝑚
若引入矩阵和向量
则该线性方程组可写成矩阵形式 𝐴𝑥 = 𝑏, 其中 𝐴 称为线性方程组的系
系数 矩 阵 . 显
然, 线性方程组等号左边与系数矩阵是一一对应的. 由于线性方程组的解 𝑥 为 𝑛
元列向量, 故可称其为解向量.
若 𝑏 = 0, 则称 𝐴𝑥 = 𝑏 为齐
齐次 线 性 方 程 组 ; 若 𝑏 ̸= 0, 则称 𝐴𝑥 = 𝑏 为非
非齐 次
线性方程组.
2.1.1 齐次线性方程组的解
程组的过程中, 一般包括以下变换:
(1) 对调两个方程的位置;
(2) 用一个非零常数乘以某一方程;
(3) 某一方程的 𝑘 倍加到另一方程上去.
显然, 以上三种变换不会改变方程组的解. 通过 Gauss 消元法将线性方程组化
为尽可能简洁的同解线性方程组.
由于一个齐次线性方程组与其系数矩阵是一一对应的, 对齐次线性方程组进
行以上三种变换, 等价于对系数矩阵进行三种相应的初等行变换, 得到与原方程组
同解的新方程组的系数矩阵, 所以可利用对系数矩阵的初等行变换实现 Gauss 消
元法.
定 理 2.1.1 齐次线性方程组只有零解当且仅当系数矩阵的秩等于未知量的
个数; 齐次线性方程组有非零解当且仅当系数矩阵的秩小于未知量的个数.
证明 设齐次线性方程组 𝐴𝑥 = 0 的系数矩阵 𝐴 = [𝑎𝑖𝑗 ]𝑚×𝑛 的秩 rank(𝐴) =
𝑟 > 0, 对系数矩阵作初等行变换化为阶梯型矩阵和最简阶梯型矩阵:
0 · · · 𝑐1𝑗1 · · · 𝑐1𝑗2 . . . 𝑐1𝑗𝑟 𝑐1(𝑗𝑟 +1) · · · 𝑐1𝑛
0 ··· 0 · · · 𝑐2𝑗2 · · · 𝑐2𝑗𝑟 𝑐2(𝑗𝑟 +1) · · · 𝑐2𝑛
.. .. .. .. .. ..
. . . . . .
𝐴→
− 0 ··· 0 ··· 0 · · · 𝑐𝑟𝑗𝑟 𝑐𝑟(𝑗𝑟 +1) · · · 𝑐𝑟𝑛
0 ··· 0 ··· 0 ··· 0 0 ··· 0
.. .. .. .. .. ..
. . . . . .
0 ··· 0 ··· 0 ··· 0 0 ··· 0
0 · · · 1 · · · 0 · · · 0 𝑐˜1(𝑗𝑟 +1) · · · 𝑐˜1𝑛
0 · · · 0 · · · 1 · · · 0 𝑐˜2(𝑗𝑟 +1) · · · 𝑐˜2𝑛
.. .. .. .. .. ..
. . . . . .
→
− 0 · · · 0 · · · 0 · · · 1 𝑐˜𝑟(𝑗𝑟 +1) · · · 𝑐˜𝑟𝑛
0 ··· 0 ··· 0 ··· 0 0 ··· 0
.. .. .. .. .. ..
. . . . . .
0 ··· 0 ··· 0 ··· 0 0 ··· 0
因此该齐次线性方程组所有的解可以写成
𝑥𝑗1 = −˜
𝑐1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
𝑥𝑗2 = −˜
𝑐2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
······
𝑥𝑗𝑟 = −˜
𝑐 𝑟𝑘1 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
𝑥𝑘1 = 𝑡𝑘1
······
𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟
𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = 0
𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 0
4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 0
2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 0
1 2 3 4 5
解 对系数矩阵进行初等行变换化为阶梯型, 即
1 0 1 −1 −3 1 0 1 −1 −3
1 2 −1 0 −1 0 2 −2 1 2
𝐴= →−
4
6 −2 −4 3
0
0 0 1 −3
2 −2 4 −7 4 0 0 0 0 0
其中 𝑡3 , 𝑡5 为任意常数.
2.1.2 非齐次线性方程组的解
因此方程组的通解可以写成
𝑥𝑗1 = 𝑑˜1 − 𝑐˜1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
˜
𝑥𝑗2 = 𝑑2 − 𝑐˜2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
······
𝑥𝑗𝑟 = 𝑑˜ − 𝑐˜𝑟𝑘1 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
𝑟
𝑥𝑘1 = 𝑡𝑘1
······
𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟
38 第2章 线性方程组
4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 7
2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 1
1 2 3 4 5
解 对增广矩阵进行初等行变换化为阶梯型, 得
1 0 1 −1 −3 −2 1 0 1 −1 −3 −2
1 2 −1 0 −1 1 0 2 −2 1 2 3
[𝐴, 𝑏] = →−
4
6 −2 −4 3 7
0 0 0 1 −3 −2
2 −2 4 −7 4 1 0 0 0 0 0 0
其中 𝑡3 , 𝑡5 为任意常数.
𝑥1 + 𝑥2 = 1
例2.1.3 讨论线性方程组 , 当 𝑎, 𝑏 取什么值时方程组无解, 有
𝑥 + 𝑎𝑥 = 𝑏
1 2
唯一解, 有无穷多解?
解 对增广矩阵进行初等行变换化为阶梯型
1 1 1 1 1 1
[𝐴, 𝑏] = →
−
1 𝑎 𝑏 0 𝑎−1 𝑏−1
注 从行的角度考察线性方程组 𝐴𝑥 = 𝑏, 对 𝑖 = 1, 2, · · · , 𝑚, 有 row(𝐴𝑥, 𝑖) =
P𝑛
row(𝐴, 𝑖)𝑥 = 𝑗=1 𝑎𝑖𝑗 𝑥𝑗 = 𝑏𝑖 , 每一行对应于一个线性方程, 从几何上看, 一个线
性方程是一个超平面(一个二元线性方程对应一条直线, 一个三元线性方程对应一
个平面, 三元以上线性方程对应一个超平面). 求解线性方程组等价于求所有这些
超平面的公共点.
例2.1.4 解下列线性方程组
𝑥1 + 𝑥2 + 𝜆𝑥3 = 2
3𝑥1 + 4𝑥2 + 2𝑥3 = 𝜆
2𝑥1 + 3𝑥2 − 𝑥3 = 1
解 对增广矩阵进行初等行变换化为阶梯型
1 1 𝜆 2 1 1 𝜆 2
[𝐴, 𝑏] =
3 4 2 →
𝜆 −
0 1 2 − 3𝜆 𝜆−6
2 3 −1 1 0 0 −3 + 𝜆 3 − 𝜆
40 第2章 线性方程组
若 𝜆 = 3, 则
1 1 3 2 1 0 10 5
→
[𝐴, 𝑏]− 0 1 −7 −3 →
− 0 1 −7 −3
0 0 0 0 0 0 0 0
其中 𝑡3 为任意常数.
若 𝜆 ̸= 3, 则
1 1 𝜆 2 1 0 0 6 + 3𝜆
→
[𝐴, 𝑏]− 0 1 2 − 3𝜆 𝜆 − 6 →
− 0 1 0 −2𝜆 − 4
0 0 1 −1 0 0 1 −1
得方程组的唯一解:
𝑥1 = 6 + 3𝜆
𝑥2 = −2𝜆 − 4
𝑥3 = −1
2.2 纵看线性方程组
在本节中, 我们从列向量线性组合的角度研究线性方程组解的结构. 由于
P𝑛
𝐴𝑥 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 所以 𝐴𝑥 = 𝑏 是否有解等价于向量 𝑏 是否可由系数矩阵
𝐴 的列向量 col(𝐴, 𝑗) (𝑗 = 1, 2, · · · , 𝑛) 线性表出, 表出系数 𝑥𝑗 即为方程组的解.
2.2.1 线性相关与向量组的秩
1
𝛼1 = − (𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 )
𝑘1
即向量 𝛼1 可由其余向量线性表出.
再证充分性. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 (𝑠 > 2) 中有一个向量可由其余向量线
性表出, 即
则
𝑘1 𝛼1 + · · · + 𝑘𝑖−1 𝛼𝑖−1 − 𝛼𝑖 + 𝑘𝑖+1 𝛼𝑖+1 + · · · + 𝑘𝑠 𝛼𝑠 = 0
(1) 线性无关;
(2) 加入原向量组中其他任一向量 (如果有) 所形成的新的部分向量组均线性
相关, 则称部分向量组 𝛼𝑖1 , 𝛼𝑖2 , · · · , 𝛼𝑖𝑟 为向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 的一个极
极大 线 性
无关组.
特别地, 线性无关向量组的极大线性无关组是其本身.
例 2.2.1 求向量组 𝛼1 = [1, 1, 4, 2]T , 𝛼2 = [0, 2, 6, −2]T , 𝛼3 = [1, −1, −2, 4]T ,
𝛼4 = [−1, 0, −4, 7]T 的极大线性无关组.
解 对 [𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 ] 构成的矩阵只作初等行变换
1 0 1 −1 1 0 1 −1 1 0 1 0
1 2 −1 0 0 2 −2 1 0 1 −1 0
→− →−
4
6 −2 −4
0 0 0 1
0 0 0 1
2 −2 4 −7 0 0 0 0 0 0 0 0
由 此 我 们 可 以 看 出 向 量 组 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 有 3 个 极 大 线 性 无 关 组: 𝛼1 , 𝛼2 , 𝛼4 ;
𝛼1 , 𝛼3 , 𝛼4 ; 𝛼2 , 𝛼 3 , 𝛼4 .
引 理 2.2.1 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性无关, 而向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 , 𝛼
线性相关, 则 𝛼 可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性表出, 且线性表示式唯一.
证明 因向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 , 𝛼 线性相关, 故存在不全为零的数 𝑘1 , 𝑘2 , · · · ,
𝑘𝑠 , 𝑘𝑠+1 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 + 𝑘𝑠+1 𝛼 = 0. 这里 𝑘𝑠+1 ̸= 0, 否则, 存在不
全为零的数 𝑘1 , 𝑘2 , · · · , 𝑘𝑠 使得 𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 = 0, 这与 𝛼1 , 𝛼2 , · · · , 𝛼𝑠
1
线性无关矛盾. 所以, 𝛼 = (𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑠 𝛼𝑠 ).
𝑘𝑠+1
设 𝛼 = 𝑐1 𝛼1 + 𝑐2 𝛼2 + · · · + 𝑐𝑠 𝛼𝑠 = 𝑑1 𝛼1 + 𝑑2 𝛼2 + · · · + 𝑑𝑠 𝛼𝑠 , 故 (𝑐1 −
𝑑1 )𝛼1 + (𝑐2 − 𝑑2 )𝛼2 + · · · + (𝑐𝑠 − 𝑑𝑠 )𝛼𝑠 = 0. 由于 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 线性无关, 故
𝑐1 − 𝑑1 = · · · = 𝑐𝑠 − 𝑑𝑠 = 0, 所以 𝛼 由 𝛼1 , 𝛼2 , · · · , 𝛼𝑠 的线性表示式唯一.
由上述引理, 可以得到如下定理.
定理 2.2.3 向量组中任一向量都可由该向量组的极大线性无关组线性表出.
引 理2.2.2 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 可由向量组 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性表出, 若
向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关, 则 𝑟 6 𝑠.
证明 假定 𝑟 > 𝑠, 因向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 可由向量组 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性
表出, 故存在 𝑠 × 𝑟 矩阵 𝐴 使得 [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ] = [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝐴. 因此齐次线
性方程组 [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝑋 = 0 与 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝐴𝑋 = 0 同解, 其中 𝑋 为 𝑟
元列向量.
2.2 纵看线性方程组 43
因此齐次线性方程组
[𝛾1 , 𝛾2 , · · · , 𝛾𝑠 ]𝑥 = 0 (2.1)
即为齐次线性方程组
由 𝛾1 , 𝛾2 , · · · , 𝛾𝑠 线性无关, 得 (2.1) ⇐⇒ 𝑥 = 0.
由 𝛼1 , 𝛼2 , · · · , 𝛼𝑟 线性无关, 得 (2.2) ⇐⇒ 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0.
又 (2.1) ⇐⇒ (2.2), 故 𝑥 = 0 ⇐⇒ 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0, 这说明齐次
线性方程组 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]𝑥 = 0 只有零解, 故 rank(𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]) = 𝑠.
又因 𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ] 为 𝑟 行 𝑠 列矩阵, 故 rank(𝑀 [𝛽1 , 𝛽2 , · · · , 𝛽𝑠 ]) 6 𝑟. 因此
𝑠 6 𝑟, 即 rank(𝐴𝐵) 6 rank(𝐴). 同时, rank(𝐴𝐵) = rank((𝐴𝐵)T ) = rank(𝐵 T 𝐴T ) 6
rank(𝐵 T ) = rank(𝐵).
由上述定理可以得到下述推论.
推论 2.2.2 设 𝛼 为 𝑛 元非零行向量, 则 rank(𝛼𝛼T ) = 1.
例2.2.2 求证: rank(𝐴 + 𝐵) 6 rank(𝐴) + rank(𝐵), 其中 𝐴, 𝐵 均为 𝑚 × 𝑛
矩阵.
证明
rank(𝐴 + 𝐵)
𝐼
=rank [𝐴 , 𝐵]
𝐼
例2.2.3 求证:
其中 𝐴, 𝐵 分别为 𝑚 × 𝑛, 𝑛 × 𝑙 矩阵.
证明
rank(𝐴𝐵) + 𝑛
𝐴𝐵 𝑂
=rank
𝑂 𝐼𝑛
𝐴𝐵 𝐵
=rank
𝑂 𝐼𝑛
𝑂 𝐵
=rank
−𝐴 𝐼𝑛
𝐴 −𝐼𝑛
=rank
𝑂 𝐵
>rank(𝐴) + rank(𝐵)
2.2.2 齐次线性方程组的基础解系
证明 将2.2.1节中所得齐次线性方程组的通解
𝑥1 = −˜𝑐1𝑘1 𝑡𝑘1 − · · · − 𝑐˜1𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
𝑥𝑗2 = −˜𝑐2𝑘1 𝑡𝑘1 − · · · − 𝑐˜2𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟
······
𝑗𝑟𝑥 = −˜
𝑟𝑘1 𝑐 𝑡𝑘1 − · · · − 𝑐˜𝑟𝑘𝑛−𝑟 𝑡𝑘𝑛−𝑟 (2.3)
𝑥𝑘1 = 𝑡𝑘1
······
𝑥𝑘𝑛−𝑟 = 𝑡𝑘𝑛−𝑟
改成向量形式:
−˜
𝑐1𝑘1 −˜
𝑐1𝑘2 −˜
𝑐1𝑘𝑛−𝑟
𝑥1
−˜
−˜
−˜
𝑐2𝑘1 𝑐2𝑘2 𝑐2𝑘𝑛−𝑟
𝑥
𝑗2
..
..
..
.. . . .
.
−˜
𝑐𝑟𝑘1 −˜
𝑐𝑟𝑘2 −˜
𝑐𝑟𝑘𝑛−𝑟
𝑥𝑗𝑟
= 𝑡𝑘1
+ 𝑡𝑘 + · · · + 𝑡𝑘
2 𝑛−𝑟
1 0 0
𝑥𝑘1
0 1 0
..
. .. .. ..
. . .
𝑥𝑘𝑛−𝑟
0 0 1
−˜
𝑐1𝑘1 −˜
𝑐1𝑘2 −˜
𝑐1𝑘𝑛−𝑟
−˜ −˜ −˜
𝑐2𝑘1 𝑐2𝑘2 𝑐2𝑘𝑛−𝑟
..
..
..
.
.
.
−˜
𝑐𝑟𝑘1 −˜
𝑐𝑟𝑘2 −˜
𝑐𝑟𝑘𝑛−𝑟
, ,··· ,
1 0 0
0 1 0
.. .. ..
.
.
.
0 0 1
2.2 纵看线性方程组 47
例2.2.4 2.2.1节中齐次线性方程组
𝑥1 + 𝑥3 − 𝑥4 − 3𝑥5 = 0
𝑥1 + 2𝑥2 − 𝑥3 − 𝑥5 = 0
4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 0
2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 0
1 2 3 4 5
可写成列向量的线性组合形式
1 0 1 −1 −3
1 2 −1 0 −1
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 =0
4 6 −2 −4 3
2 −2 4 −7 4
求得的线性方程组的解, 即列向量的线性组合系数可写成
𝑥1 −1 6
5
𝑥 1 −
2
2
𝑥3 = 𝑡3 1 + 𝑡5
0
𝑥4 0
3
𝑥5 0 1
其中 𝑡3 , 𝑡5 为任意常数.
定理 2.2.9 设 𝐴 为 𝑚 × 𝑛 矩阵, 𝑏 为 𝑚 元列向量, 则
(1) rank(𝐴𝐴T ) = rank(𝐴T 𝐴) = rank(𝐴) = rank(𝐴T );
(2) 线性方程组 𝐴T 𝐴𝑥 = 𝐴T 𝑏 一定有解.
证明 (1) 若 𝐴𝑥 = 0, 则 𝐴T 𝐴𝑥 = 0; 反之, 若 𝐴T 𝐴𝑥 = 0, 则 𝑥T 𝐴T 𝐴𝑥 = 0,
即 (𝐴𝑥)T (𝐴𝑥) = ‖𝐴𝑥‖2 = 0, 故 𝐴𝑥 = 0. 因此齐次线性方程组 𝐴𝑥 = 0 与
𝐴T 𝐴𝑥 = 0 同解.
𝐴𝑥 = 0 的基础解系含有 𝑛 − rank(𝐴) 个解, 而 𝐴T 𝐴𝑥 = 0 基础解系含有
𝑛 − rank(𝐴T 𝐴) 个解, 故 𝑛 − rank(𝐴) = 𝑛 − rank(𝐴T 𝐴), 即 rank(𝐴) = rank(𝐴T 𝐴),
从而 rank(𝐴T ) = rank((𝐴T )T 𝐴T ) = rank(𝐴𝐴T ). 又因为 rank(𝐴) = rank(𝐴T ), 所
以 rank(𝐴T 𝐴) = rank(𝐴) = rank(𝐴T ) = rank(𝐴𝐴T ).
(2) 由于 rank([𝐴T 𝐴, 𝐴T 𝑏]) = rank(𝐴T [𝐴, 𝑏]) 6 rank(𝐴T ) = rank(𝐴T 𝐴), 同
48 第2章 线性方程组
2.2.3 非齐次线性方程组解的结构
4𝑥1 + 6𝑥2 − 2𝑥3 − 4𝑥4 + 3𝑥5 = 7
2𝑥 − 2𝑥 + 4𝑥 − 7𝑥 + 4𝑥 = 1
1 2 3 4 5
可写成列向量的线性组合形式
1 0 1 −1 −3 −2
1 2 −1 0 −1 1
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 =
4 6 −2 −4 3 7
2 −2 4 −7 4 1
求得的线性方程组的解, 即列向量的线性组合系数可写成
𝑥1 −4 −1 6
5
5
𝑥 1 −
2
2
2
𝑥3 = + 𝑡3
1 + 𝑡5
0 0
𝑥4 0
−2 3
𝑥5 0 0 1
2.3 逆 矩 阵 49
其中 𝑡3 , 𝑡5 为任意常数.
2.3 逆 矩 阵
2.3.1 可逆矩阵的定义与性质
diag(𝑎1 , 𝑎2 , · · · , 𝑎𝑛 )diag(𝑎−1 −1 −1
1 , 𝑎2 , · · · , 𝑎𝑛 ) = 𝐼
2.3 逆 矩 阵 51
得 𝐴−1 = diag(𝑎−1 −1 −1
1 , 𝑎2 , · · · , 𝑎𝑛 ), 因此其逆矩阵仍为对角阵.
证明 考察 3 种初等变换及其逆变换. 由于初等变换的逆变换本身也是初等
变换, 故该逆变换相应的矩阵也为初等阵.
1
..
.
0 ··· 1 i 行
𝐸𝑖𝑗 = .. ..
. .
j 行
1 ··· 0
..
.
1
1
..
.
0 ··· 1 i 行
𝐸𝑖𝑗 = .. ..
. .
j 行
1 ··· 0
..
.
1
1
..
.
i 行
𝐸𝑖 (𝑘) = 𝑘
..
.
1
1
为使其变回原来的矩阵, 只需再将 𝐸𝑖 (𝑘) 的第 𝑖 行(列)乘以非零常数 , 该逆变换
𝑘
相应的矩阵为
1
..
.
1
1
i行
𝐸𝑖 =
𝑘
𝑘
..
.
1
1
因为𝐸𝑖 𝐸𝑖 (𝑘) = 𝐼, 故第二类初等阵可逆, 且该初等阵的逆矩阵仍为初等阵.
𝑘
(3)第三类初等矩阵 𝐸𝑖𝑗 (𝑘) 表示将单位阵 𝐼𝑛 的第 𝑖 行(第 𝑗 列)乘以任意常数
𝑘 后加到第 𝑗 行(第 𝑖 列)上得到的矩阵
1
..
.
1 ··· 0 i 行
.. ..
𝐸𝑖𝑗 (𝑘) =
. .
j 行
𝑘 ··· 1
..
.
1
1
..
.
1 ··· 0 i行
.. ..
𝐸𝑖𝑗 (−𝑘) =
. .
j行
−𝑘 · · · 1
..
.
1
2.3.2 用初等变换求逆矩阵
由于初等矩阵可逆且可逆矩阵的积仍为可逆矩阵, 因此有下面的结论.
定 理 2.3.3 任一秩为 𝑟 的非零矩阵 𝐴𝑚×𝑛 , 必存在 𝑚 阶可逆矩阵 𝑃 及 𝑛 阶
可逆矩阵 𝑄, 使得
𝐼𝑟 𝑂
𝑃 𝐴𝑄 =
𝑂 𝑂
由上述定理可得以下推论.
54 第2章 线性方程组
Ü及𝑛阶
推 论2.3.2 任一秩为 𝑟 的非零矩阵 𝐴𝑚×𝑛 , 必存在 𝑚 阶可逆矩阵 𝑃
Ü 使得
可逆矩阵 𝑄,
Ü 𝐼𝑟
𝐴=𝑃
𝑂 Ü
𝑄
𝑂 𝑂
以及 𝑄1 𝑄2 · · · 𝑄𝑡 𝑃𝑠 · · · 𝑃2 𝑃1 𝐴 = 𝐼𝑛 , 𝐴𝑄1 𝑄2 · · · 𝑄𝑡 𝑃𝑠 · · · 𝑃2 𝑃1 = 𝐼𝑛 , 于是得到
下面的结论.
定理 2.3.4 方阵 𝐴 可逆当且仅当下列条件之一成立:
(1) 方阵 𝐴 的标准形为单位阵;
(2) 方阵 𝐴 可表示成若干初等阵的乘积;
(3) 方阵 𝐴 仅经初等行变换可化为单位阵;
(4) 方阵 𝐴 仅经初等列变换可化为单位阵.
设 𝐴 为 可 逆 矩 阵, 则 矩 阵 𝐴 仅 经 初 等 行 变 换 可 化 为 单 位 阵, 即 存 在 初
等 阵 𝑆1 , 𝑆2 , · · · , 𝑆𝑚 使 得 𝑆𝑚 · · · 𝑆2 𝑆1 𝐴 = 𝐼, 于 是 𝑆𝑚 · · · 𝑆2 𝑆1 = 𝐴−1 , 因 此
𝑆𝑚 · · · 𝑆2 𝑆1 [𝐴, 𝐼] = [𝐼, 𝐴−1 ], 这表明只经若干初等行变换, [𝐴, 𝐼] →
− [𝐼, 𝐴−1 ], 这
就得到了基于初等行变换求逆矩阵的算法: 对矩阵 [𝐴, 𝐼] 进行初等行变换, 当子块
𝐴 化为单位阵的同时, 子块 𝐼 恰好化为 𝐴 的逆矩阵 𝐴−1 .
同理, 只经若干初等列变换,
𝐴 𝐼
→
−
𝐼 𝐴−1
例2.3.2 设
0 2 −1
𝐴=
1 1 2
−1 −1 −1
求 𝐴−1 .
解
0 2 −1 1 0 0 1 1 2 0 1 0
[𝐴, 𝐼] =
1 1 2 →
0 1 0 −
0 2 −1 1 0 0
−1 −1 −1 0 0 1 −1 −1 −1 0 0 1
1 3 5
1 1 2 0 1 0 1 0 0 − − −
2 2 2
→
− 0 2 −1 1 0 0 →
− · · · →
− 1 1 1
0 1 0
0 0 1 0 1 1 2 2 2
0 0 1 0 1 1
故
1 3 5
− − −
2 2 2
𝐴−1
=
1 1 1
2 2 2
0 1 1
求 𝐴−1 𝐵.
56 第2章 线性方程组
解
1 0 −1 2 −3 1 1 0 −1 2 −3 1
[𝐴, 𝐵] =
0 4 2 1 0 →
−1 −
0 4 2 1 0 −1
1 −1 0 1 4 1 0 −1 1 −1 7 0
3 5 5
1 0 0
1 0 −1 2 −3 1
3 2 6
→
−
→
− · · · →
−
71 1
0 −1 1 −1 7 0 − −
0 1 0
2 3 6
0 0 6 −3 28 −1
1 14 1
0 0 1 − −
2 3 6
故
3 5 5
23 6
𝐴−1 𝐵 =
1 7 1
− −
2 3 6
1 14 1
− −
2 3 6
注 设 𝐴 为 𝑛 阶可逆矩阵, 𝐶 为 𝑚 × 𝑛 矩阵, 请读者思考如何计算 𝐶𝐴−1 更
有效率?
2.3.3 正交阵
其中
1, 𝑖=𝑗
𝛿𝑖𝑗 =
0, 𝑖 ̸= 𝑗
2.3 逆 矩 阵 57
(5) 将 𝐴 按行分块
𝛽1
𝛽2
𝐴=
..
.
𝛽𝑛
注 上述定理给出了正交阵的若干等价定义. 正交阵的逆矩阵为其转置矩
阵;正交阵的每一列为单位向量(模为 1), 且不同列向量之间正交(内积为 0); 正交阵
的每一行为单位向量(模为 1), 且不同行向量之间正交(内积为 0).
例 2.3.4 矩阵
cos 𝜃 − sin 𝜃
sin 𝜃 cos 𝜃
是正交阵.
例 2.3.5 矩阵 1 1
√ 0 √
2 2
0 1 0
1 1
−√ √
0
2 2
是正交阵.
例2.3.6 矩阵
1 1 1 1
√ √ √ ··· √
𝑛 𝑛 𝑛 𝑛
1 1
√ −√ ···
0 0
2·1 2·1
1 1 2
√ √ −√ ··· 0
3·2 3·2 3·2
.. .. .. ..
. . . .
1 1 1 𝑛−1
p p p · · · −p
𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1) 𝑛 · (𝑛 − 1)
是正交阵.
于一般矩阵, 该结论不一定成立.
例2.3.7 矩阵 1
√ 0
2
0 1
1
−√
0
2
即 𝐴𝐵 为正交阵.
(2) 设 𝐴 为 𝑛 阶正交阵, (𝐴−1 )T 𝐴−1 = (𝐴T )−1 𝐴−1 = (𝐴𝐴T )−1 = 𝐼 −1 = 𝐼,
即 𝐴−1 为正交阵.
例2.3.8 设 𝑢 为 𝑛 元单位列向量, 𝐼𝑛 是 𝑛 阶单位阵, 则 𝐼𝑛 − 2𝑢𝑢T 是正交阵.
证明 𝐼𝑛 −2𝑢𝑢T 是方阵, 且由于 (𝐼𝑛 −2𝑢𝑢T )T = 𝐼𝑛 −2𝑢𝑢T , 因此 𝐼𝑛 −2𝑢𝑢T
是对称阵.
又
故 𝐼𝑛 − 2𝑢𝑢T 是正交阵.
2.4 习 题
1. 设 𝐴 为 𝑚 × 𝑛 矩阵, 判断下列命题是否正确.
(1) 非齐次线性方程组 𝐴𝑥 = 𝑏, 当 𝑚<𝑛 时, 有无穷多解;当 𝑚 = 𝑛 时, 有唯一解; 当 𝑚 > 𝑛
时, 无解.
(2) 齐次线性方程组 𝐴𝑥 = 0, 当 𝑚 < 𝑛 时, 必有非零解.
(3) 非齐次线性方程组 𝐴𝑥 = 𝑏, 当 rank(𝐴) = 𝑚, 则一定有解.
2. 解下列线性方程组:
2.4 习 题 59
(1)
𝑥1 − 2𝑥2 + 3𝑥3 − 4𝑥4 = 0
𝑥 −𝑥 +𝑥 =0
2 3 4
𝑥
1
+ 3𝑥 2 − 3𝑥4 = 0
𝑥1 − 4𝑥2 + 3𝑥3 − 2𝑥4 = 0
(2)
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 0
3𝑥 + 2𝑥 + 𝑥 + 𝑥 − 3𝑥 = 0
1 2 3 4 5
𝑥2 + 2𝑥3 + 2𝑥4 + 6𝑥5 = 0
5𝑥1 + 4𝑥2 + 3𝑥3 + 3𝑥4 − 𝑥5 = 0
(3)
𝑥1 + 2𝑥2 + 𝑥3 − 𝑥4 = 6
2𝑥1 − 𝑥2 + 𝑥3 + 3𝑥4 + 4𝑥5 = −7
2𝑥 − 𝑥 + 2𝑥 + 𝑥 − 2𝑥 = −4
1 2 3 4 5
2𝑥 − 3𝑥 + 𝑥 + 2𝑥 − 2𝑥 5 = −9
1 2 3 4
𝑥1 + 𝑥3 − 2𝑥4 − 6𝑥5 = 4
(4)
2𝑥1 − 𝑥2 − 2𝑥3 + 𝑥4 = 0
𝑥1 + 2𝑥2 + 2𝑥3 + 𝑥4 = 6
3𝑥 + 𝑥 − 𝑥 − 2𝑥 = 1
1 2 3 4
𝑥1 + 2𝑥2 + 𝑥3 − 3𝑥4 = 2
2𝑥1 + 4𝑥2 + 3𝑥3 − 2𝑥4 = 7
3. 求线性方程组
𝑥1 − 𝑥2 + 2𝑥3 + 𝑥4 = 1
2𝑥 − 𝑥 + 𝑥 + 2𝑥 = 3
1 2 3 4
𝑥1 − 𝑥3 + 𝑥4 = 2
3𝑥1 − 𝑥2 + 3𝑥4 = 5
4. 讨论下列线性方程组, 当 𝜆 取什么值时方程组有唯一解?取什么值时有无穷多解?取什
么值时无解?
(1)
(𝜆 + 3)𝑥1 + 𝑥2 + 2𝑥3 = 𝜆
𝜆𝑥1 + (𝜆 − 1)𝑥2 + 𝑥3 = 𝜆
3(𝜆 + 1)𝑥1 + 𝜆𝑥2 + (𝜆 + 3)𝑥3 = 3
60 第2章 线性方程组
(2) ¨
𝑥1 + 2𝑥2 + 𝜆𝑥3 = 1
2𝑥1 + 𝜆𝑥2 + 8𝑥3 = 𝜆
(3)
𝑥1 + 𝑥2 + 𝜆𝑥3 = 2
3𝑥1 + 4𝑥2 + 2𝑥3 = 𝜆
2𝑥1 + 3𝑥2 − 𝑥3 = 3
5. 讨论 𝑎, 𝑏 为何值时, 线性方程组
𝑥1 − 𝑥2 + 2𝑥3 = 1
2𝑥 − 𝑥 + 3𝑥 − 𝑥 = 4
1 2 3 4
𝑥2 + 𝑎𝑥3 + 𝑏𝑥4 = 𝑏
𝑥1 − 3𝑥2 + (3 − 𝑎)𝑥3 = −4
6. 设 𝑥1 − 𝑥2 = 𝑎1 , 𝑥2 − 𝑥3 = 𝑎2 , 𝑥3 − 𝑥4 = 𝑎3 , 𝑥4 − 𝑥5 = 𝑎4 , 𝑥5 − 𝑥1 = 𝑎5 . 证明: 这个方
程组有解的充分必要条件为
5
X
𝑎𝑖 = 0
𝑖=1
并在有解的情况下求出它的一般解.
7. 已知平面上三条不同直线的方程分别为
𝑙1 : 𝑎𝑥 + 2𝑏𝑦 + 3𝑐 = 0
𝑙2 : 𝑏𝑥 + 2𝑐𝑦 + 3𝑎 = 0
𝑙3 : 𝑐𝑥 + 2𝑎𝑦 + 3𝑏 = 0
试证这三条直线交于一点的充要条件是 𝑎 + 𝑏 + 𝑐 = 0.
8. 设有 𝑛 元齐次线性方程组 (𝑛 > 2)
(1 + 𝑎)𝑥1 + 𝑥2 + · · · + 𝑥𝑛 = 0
2𝑥 + (2 + 𝑎)𝑥 + · · · + 2𝑥 = 0
1 2 𝑛
······
𝑛𝑥1 + 𝑛𝑥2 + · · · + (𝑛 + 𝑎)𝑥𝑛 = 0
9.已知非齐次线性方程组
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = −1
4𝑥1 + 3𝑥2 + 5𝑥3 − 𝑥4 = −1
𝑎𝑥1 + 𝑥2 + 3𝑥3 + 𝑏𝑥4 = 1
有 3 个线性无关的解,
(1) 证明方程组系数矩阵 𝐴 的秩 rank(𝐴) = 2;
(2) 求 𝑎, 𝑏 的值及方程组的通解.
10. 设线性方程组
𝑥1 + 𝑥2 + 𝑥3 = 0
𝑥1 + 2𝑥2 + 𝑎𝑥3 = 0
𝑥1 + 4𝑥2 + 𝑎2 𝑥3 = 0
𝜆 1 1 𝑎
𝐴= 0 𝜆−1 0 , 𝑏= 1
1 1 𝜆 1
(1) 求 𝜆, 𝑎 的值;
(2) 求方程组𝐴𝑥 = 𝑏 的通解.
12. 设
1 𝑎 0 0 1
0 1 𝑎 0 −1
𝐴= , 𝑏=
0 0 1 𝑎 0
𝑎 0 0 1 0
1 2 3
𝐵= 2 4 6
3 6 𝑘
(1) 秩 rank(𝐴) 6 2;
(2) 若 𝛼, 𝛽 线性相关, 则秩rank(𝐴) < 2.
16. 设
1 −1 −1 −1
𝐴 = −1 1 1 , 𝜉1 = 1
0 −4 −2 −2
1 2 0 −3
(3) 𝛼1 = [1, 0, 2, 1]T , 𝛼2 = [1, 2, 0, 1]T , 𝛼3 = [1, 5, −3, 3]T , 𝛼4 = [2, 1, 3, 0]T .
26. 求下列向量组的秩和极大线性无关组:
(1) 𝛼1 = [2, 1, 0]T , 𝛼2 = [3, 1, 1]T , 𝛼3 = [2, 0, 2]T , 𝛼4 = [4, 2, 0]T ;
(2) 𝛼1 = [1, 1, 1, 1]T , 𝛼2 = [1, 1, −1, −1]T , 𝛼3 = [1, −1, −1, 1]T , 𝛼4 = [−1, −1, −1, 1]T ;
(3) 𝛼1 = [6, 4, 1, −1, 2]T , 𝛼2 = [1, 0, 2, 3, −4]T , 𝛼3 = [1, 4, −9, −16, 22]T , 𝛼4 = [7, 1,
0, −1, 3]T .
27. 已知向量组 𝛼1 = [1, −1, 2, 1, 0]T , 𝛼2 = [2, −2, 4, −2, 0]T , 𝛼3 = [3, 0, 6, −1, 1]T , 𝛼4 =
[0, 𝑥, 0, 0, 1]T 有4 个不同极大无关组, 求 𝑥 的值.
28. 求下列齐次线性方程组的一个基础解系:
(1)
𝑥1 − 2𝑥2 + 4𝑥3 − 7𝑥4 = 0
2𝑥1 + 𝑥2 − 2𝑥3 + 𝑥4 = 0
3𝑥1 − 𝑥2 + 2𝑥3 − 4𝑥4 = 0
(2)
2𝑥1 + 𝑥2 − 𝑥3 − 𝑥4 + 𝑥5 = 0
𝑥 − 𝑥 + 𝑥 + 𝑥 − 2𝑥 = 0
1 2 3 4 5
3𝑥
1
+ 3𝑥2 − 3𝑥3 − 3𝑥4 + 4𝑥5 = 0
4𝑥1 + 5𝑥2 − 5𝑥3 − 5𝑥4 + 7𝑥5 = 0
3𝑥1 − 2𝑥2 − 𝑥3 + 𝑥4 − 2𝑥5 = 0
2𝑥1 − 5𝑥2 + 𝑥3 − 2𝑥4 + 2𝑥5 = 0
(2)
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 1
3𝑥 + 2𝑥 + 𝑥 + 𝑥 − 3𝑥 = 0
1 2 3 4 5
𝑥2 + 2𝑥3 + 2𝑥4 + 6𝑥5 = 3
5𝑥1 + 4𝑥2 + 3𝑥3 + 3𝑥4 − 𝑥5 = 2
30. 已知: 向量组 I 可用向量组 II 线性表出, 向量组 II 可用向量组 III 线性表出. 求证: 向量
组 I 可用向量组 III 线性表出.
31. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性无关. 证明: 当且仅当 𝑛 为奇数时, 向量组 𝛼1 + 𝛼2 , 𝛼2 +
𝛼3 , · · · , 𝛼𝑛−1 + 𝛼𝑛 , 𝛼𝑛 + 𝛼1 也线性无关.
32. 设向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性无关, 而向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛽, 𝛾 线性相关. 证明: 或
者 𝛽 与 𝛾 中至少有一个可由 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 线性表出, 或者向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛽 与向量
组 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 , 𝛾 可相互线性表出.
33. 设 𝛽1 = 𝛼2 + 𝛼3 + · · · + 𝛼𝑛 , 𝛽2 = 𝛼1 + 𝛼3 + · · · + 𝛼𝑛 , · · · , 𝛽𝑛 = 𝛼1 + 𝛼2 + · · · + 𝛼𝑛−1 ,
64 第2章 线性方程组
𝑥1𝑖
𝑥2𝑖
𝑥1𝑖
..
.
𝑥2𝑖
𝛼𝑖 = , 𝛽𝑖 = 𝑥𝑟𝑖 , 𝑖 = 1, 2, · · · , 𝑛
..
.
𝑥(𝑟+1)𝑖
𝑥𝑟𝑖 ..
.
𝑥𝑚𝑖
······
𝑎𝑚1 𝑥1 + 𝑎𝑚2 𝑥2 + · · · + 𝑎𝑚𝑛 𝑥𝑛 = 0
39. 求下列矩阵的逆矩阵:
𝑎2 𝑎3
1 1 1 1 5 2 0 0 1 𝑎
1 1 −1 −1 2 1 0 0 0 1 𝑎 𝑎2
(1) ; (2) ; (3) ;
1 −1 1 −1 0 0 1 −2 0 0 1 𝑎
1 −1 −1 1 0 0 1 1 0 0 0 1
2.4 习 题 65
0 𝑎1 0 ··· 0
···
0 0 𝑎2 0
.. .. .. ..
(4) , 𝑎𝑖 ̸= 0, 𝑖 = 1, 2, · · · , 𝑛.
. . . .
0 0 0 ··· 𝑎𝑛−1
𝑎𝑛 0 0 ··· 0
40. 解下列矩阵方程:
1 1 1 5 6
(1) 0 1 1 𝑋 = 3 4 ;
0 0 1 1 2
1 2 −3 1 −3 0
(2)𝑋 3 2 −4 = 10 2 7 .
2 −1 0 10 7 8
41. 设 𝐴, 𝐵, 𝐶 均为 𝑛 阶方阵, 若 𝐴𝐵𝐶 = 𝐼, 则下列乘积: 𝐴𝐶𝐵, 𝐵𝐴𝐶, 𝐵𝐶𝐴, 𝐶𝐴𝐵,
𝐶𝐵𝐴 中哪些必等于单位阵 𝐼.
42. (1)设 𝐴 为方阵, 正整数 𝑘 > 1, 𝐴𝑘 = 𝑂, 证明:
(𝐼 − 𝐴)−1 = 𝐼 + 𝐴 + 𝐴2 + · · · + 𝐴𝑘−1
1
(𝐼 − 𝐽𝑛 )−1 = 𝐼 − 𝐽𝑛
𝑛−1
0 𝐵
43. 设 𝐴 = , 其中 𝐵 是 𝑛 阶可逆矩阵, 𝐶 是 𝑚 阶可逆矩阵, 证明: 𝐴 可逆, 并求
𝐶 0
𝐴−1 .
44. 设 𝑛 阶可逆矩阵 𝐴 每行元素之和都等于常数 𝑐. 证明: 𝑐 ̸= 0, 且 𝐴−1 中每行元素之和
都等于 𝑐−1 .
45. 设 𝐴 为方阵, 又 𝐴 + 𝐼 可逆, 𝑓 (𝐴) = (𝐼 − 𝐴)(𝐼 + 𝐴)−1 , 证明:
(1) [𝐼 + 𝑓 (𝐴)](𝐼 + 𝐴) = 2𝐼; (2) 𝑓 (𝑓 (𝐴)) = 𝐴.
46. 设 𝐴, 𝐵 均为 𝑛 阶可逆矩阵. 证明: 如果 𝐴 + 𝐵 可逆, 则 𝐴−1 + 𝐵 −1 也可逆, 并求其逆
矩阵.
47. (1) 设 𝐴 为 𝑛 阶方阵, 满足 𝐴3 + 2𝐴2 − 2𝐴 − 𝐼𝑛 = 𝑂, 证明: 𝐴 + 𝐼𝑛 是可逆矩阵, 并求
其逆矩阵;
(2) 设 𝐴, 𝐵 为 𝑛 阶方阵, 且 𝐴 − 𝐼𝑛 和 𝐵 可逆. 证明: 若 (𝐴 − 𝐼𝑛 )−1 = (𝐵 − 𝐼𝑛 )T , 则有 𝐴
可逆;
(3) 设 𝑛 阶方阵 𝐴 满足 𝐴2 + 𝐴 − 6𝐼𝑛 = 𝑂, 证明: 𝐴𝐴 + 𝐼𝑛 和 𝐴 + 4𝐼𝑛 都可逆, 并求它们
的逆矩阵.
66 第2章 线性方程组
0 0 2
求 𝐴.
49. 设 𝛼 是 𝑛 维非零列向量, 记 𝐴 = 𝐼𝑛 − 𝛼𝛼T . 证明:
(1) 𝐴2 = 𝐴 的充分必要条件是 𝛼𝛼T = 1;
(2) 当 𝛼T 𝛼 = 1 时, 𝐴 是不可逆矩阵.
50. 设 𝑃 是 𝑚 × 𝑛 矩阵, 且 𝑃 𝑃 T 可逆. 记 𝐴 = 𝐼𝑛 − 𝑃 T (𝑃 𝑃 T )−1 𝑃 , 证明: 𝐴 是对称矩阵,
且 𝐴2 = 𝐴.
证明下列矩阵是正交阵:
51.
1 2
√ 0 √
3 6
1 1 1
(1) − √
√ √ ;
3 2 6
1 1 1
−√ −√ √
3 2 6
1 1 1 1
−
2 2 2 2
1 1 1 1
−
2 2 2 2
(2) .
1 1 1 1
− − −
2 2 2 2
1 1 1 1
−
2 2 2 2
52. 设 𝐴 为 𝑛 阶对角阵, 且为正交矩阵, 求 𝐴.
第3章 行 列 式
3.1 行列式的定义
3.1.1 逆序数
为了引出行列式的一般定义, 先介绍逆序数的概念.
定 义 3.1.1 由数 1, 2, · · · , 𝑛 组成的一个有序数组, 称为一个 𝑛 级排
排 列, 其一
般形式为 𝑖1 𝑖2 · · · 𝑖𝑛 , 其中 𝑖𝑘 (𝑘 = 1, 2, · · · , 𝑛) 为数 1, 2, · · · , 𝑛 中的某一个数, 且
𝑖1 𝑖2 · · · 𝑖𝑛 中的 𝑛 个数互不相等.
显然, 数 1, 2, · · · , 𝑛 可以组成 𝑛! 个不同的 𝑛 级排列.
定 义3.1.2 在一个排列中, 对任意两个数 𝑖 和 𝑗, 如果 𝑗 位于 𝑖 的后面, 且 𝑗 < 𝑖,
则称 𝑖, 𝑗 构成一个逆
逆序 . 一个 𝑛 级排列 𝑖1 𝑖2 · · · 𝑖𝑛 中逆序的总数称为该排列的逆
逆序
数, 记作 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ).
例 3.1.1 排列 21345 的逆序数 𝜏 (21345) = 1, 如果将该排列 1 和 4 位置互换
而其余的数不变, 则得新的排列 24315, 且 𝜏 (24315) = 4.
定 理 3.1.1 任一排列经过一次对换(排列中某两个数的位置互换而其余的数
不变), 其逆序数的奇偶性改变.
证明 首先考虑排列 𝑖1 𝑖2 · · · 𝑖𝑘 𝑖𝑘+1 · · · 𝑖𝑛 中相邻两个数 𝑖𝑘 𝑖𝑘+1 对换的情形. 若
𝑖𝑘 > 𝑖𝑘+1 , 则对换后逆序数减少 1; 若 𝑖𝑘 < 𝑖𝑘+1 , 则对换后逆序数增加 1. 上述两种
情况下逆序数的奇偶性均发生改变.
下面考虑排列 𝑖1 · · · 𝑖𝑘 · · · 𝑖𝑙 · · · 𝑖𝑛 中非相邻两个数 𝑖𝑘 与 𝑖𝑙 对换的情形. 非相邻
𝑖𝑘 与 𝑖𝑙 的对换可通过相邻数的对换以类似“冒泡排序”方式分两个阶段实现:
(1) 𝑖𝑘 与 𝑖𝑘+1 对换, 再与 𝑖𝑘+2 对换, · · · , 最后与 𝑖𝑙 对换, 通过 𝑙 − 𝑘 次相邻对换
将 𝑖𝑘 向后挪至第 𝑙 个位置;
68 第3章 行 列 式
3.1.2 行列式的定义
定义 3.1.3 设 𝑛 阶方阵
𝑎11 𝑎12 · · · 𝑎1𝑛
𝑎
21 𝑎22 · · · 𝑎2𝑛
𝐴=
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
则方阵 𝐴 的行
行列 式 (determinant) 可定义为
𝑎11
𝑎12 · · · 𝑎1𝑛
𝑎
21 𝑎22 · · · 𝑎2𝑛 X
(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛
=
.. .. ..
. . . 𝑖1 𝑖2 ···𝑖𝑛
𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑎𝑛1
例3.1.4 设 3 阶矩阵
𝑎11 𝑎12 𝑎13
𝐴=
𝑎21 𝑎22 𝑎23
则 3 阶行列式
det(𝐴) =𝑎11 𝑎22 𝑎33 + 𝑎21 𝑎32 𝑎13 + 𝑎31 𝑎12 𝑎23 − 𝑎31 𝑎22 𝑎13
− 𝑎21 𝑎12 𝑎33 − 𝑎11 𝑎32 𝑎23
注 从上述三个例子可以看出:
则 4 阶行列式
X
det(𝐴) = (−1)𝜏 (𝑖1 𝑖2 𝑖3 𝑖4 ) 𝑎𝑖1 1 𝑎𝑖2 2 𝑎𝑖3 3 𝑎𝑖4 4
𝑖1 𝑖2 𝑖3 𝑖4
例3.1.6 设上三角阵
𝑎11 𝑎12 · · · 𝑎1𝑛
0
𝑎22 · · · 𝑎2𝑛
𝐴=
.. .. ..
. . .
0 0 · · · 𝑎𝑛𝑛
即上三角阵的行列式等于其主对角线元素的乘积.
同理, 可得下三角阵的行列式也等于其主对角线元素的乘积.
特别地, 单位阵 𝐼 是特殊的三角阵(既是上三角阵, 也是下三角阵),
1 0 ··· 0
0 1 ··· 0
𝐼=
.. .. ..
. . .
0 0 ··· 1
因此其行列式 det(𝐼) = 1.
注 在前面的行列式定义中,
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )
· · · 𝑎𝑖𝑛 𝑛 , 其表达式的每一乘积项
P
(1) det(𝐴) = 𝑖1 𝑖2 ···𝑖𝑛 (−1) 𝑎𝑖1 1 𝑎𝑖2 2
中 𝑛 个元素的列指标固定为 12 · · · 𝑛, 行指标 𝑖1 𝑖2 · · · 𝑖𝑛 是某个 𝑛 级排列. 事实上,
行列式还有下列等价的表达式.
𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
· · · 𝑎𝑛𝑗𝑛 .
P
(2) 𝑗1 𝑗2 ···𝑗𝑛 (−1) 𝑎1𝑗1 𝑎2𝑗2
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 .
P
(3) 𝑖1 𝑖2 ···𝑖𝑛 (−1)
𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 )
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 .
P
(4) 𝑗1 𝑗2 ···𝑗𝑛 (−1)
表 达 式 (2) 的 每 一 乘 积 项 中 𝑛 个 元 素 的 行 指 标 固 定 为 12 · · · 𝑛, 列 指 标
𝑗1 𝑗2 · · · 𝑗𝑛 是一个 𝑛 级排列, 表示对所有 𝑛 级排列 𝑗1 𝑗2 · · · 𝑗𝑛 求和. 当
P
𝑗1 𝑗2 ···𝑗𝑛
标 𝑖1 𝑖2 · · · 𝑖𝑛 是 一 个 𝑛 级 排 列. 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 奇 数 时, 乘 积
项 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取负号; 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为偶数时, 乘积项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取正号.
表 达 式 (4) 的 每 一 乘 积 项 中 𝑛 个 元 素 的 行 指 标 固 定 为 𝑖1 𝑖2 · · · 𝑖𝑛 , 列 指 标
𝑗1 𝑗2 · · · 𝑗𝑛 是 一 个 𝑛 级 排 列. 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 奇 数 时, 乘 积 项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前 取 负 号; 当 𝜏 (𝑖1 𝑖2 · · · 𝑖𝑛 ) + 𝜏 (𝑗1 𝑗2 · · · 𝑗𝑛 ) 为 偶 数 时, 乘 积 项
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 前取正号.
显然, 表达式 (1) 是表达式 (3) 取 𝑗1 𝑗2 · · · 𝑗𝑛 = 12 · · · 𝑛 的特例, 表达式 (2) 是表
达式 (4) 取 𝑖1 𝑖2 · · · 𝑖𝑛 = 12 · · · 𝑛 的特例.
下证这四个表达式的等价性.
证明 先证明表达式 (1) 与表达式 (2) 的等价性.
令集合
集 合 𝐸 与 集 合 𝐹 均 含 有 𝑛! 个 带 符 号 的 乘 积 项. 对 于 集 合 𝐸 中 的 任 意 乘
积 项 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 , 可 改 变 各 因 数 次 序, 使 得 行 指 标 𝑖1 𝑖2 · · · 𝑖𝑛
与 列 指 标 12 · · · 𝑛 经 相 同 的 𝑘 次 对 换 分 别 变 为 12 · · · 𝑛 与𝑗1 𝑗2 · · · 𝑗𝑛 , 即
𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 = 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 . 由于经过 𝑘 次对换, 排列逆序数的奇偶性改
变 𝑘 次: (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) (−1)𝑘 = (−1)𝜏 (12···𝑛) , (−1)𝜏 (12···𝑛) (−1)𝑘 = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) ,
得 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) , 从而
(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛
因 (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 ∈ 𝐹 , 故 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) 𝑎𝑖1 1 𝑎𝑖2 2 · · · 𝑎𝑖𝑛 𝑛 ∈ 𝐹 , 即 𝐸 ⊆
𝐹 . 同理可得 𝐹 ⊆ 𝐸, 故 𝐸 = 𝐹 . 这说明表达式 (1) 与表达式 (2) 的 𝑛! 个乘积项中
每项对应相等而且符号相同, 因此这些乘积项的代数和也相等, 从而证明了表达式
(1) 与表达式 (2) 的等价性.
再证明表达式 (1) 与表达式 (3) 的等价性.
将 表 达 式 (3) 中 乘 积 项 (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 的 行 指 标
𝑖1 𝑖2 · · · 𝑖𝑛 与列指标 𝑗1 𝑗2 · · · 𝑗𝑛 经相同的 𝑘 次对换分别变为 𝑠1 𝑠2 · · · 𝑠𝑛 与 12 · · · 𝑛, 即
𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 = 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛 . 由于经过 𝑘 次对换, 排列逆序数的奇偶性改
变 𝑘 次: (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 ) (−1)𝑘 = (−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) , (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) (−1)𝑘 = (−1)𝜏 (12···𝑛) ,
72 第3章 行 列 式
(−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛 = (−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛
这说明表达式(1)与表达式(3)的 𝑛! 个乘积项中每项对应相等而且符号相同, 因此
X
(−1)𝜏 (𝑠1 𝑠2 ···𝑠𝑛 ) 𝑎𝑠1 1 𝑎𝑠2 2 · · · 𝑎𝑠𝑛 𝑛
𝑠1 𝑠2 ···𝑠𝑛
X
= (−1)𝜏 (𝑖1 𝑖2 ···𝑖𝑛 )+𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑖1 𝑗1 𝑎𝑖2 𝑗2 · · · 𝑎𝑖𝑛 𝑗𝑛
𝑖1 𝑖2 ···𝑖𝑛
3.2 行列式的性质
X
det(𝐴T ) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑏1𝑗1 𝑏2𝑗2 · · · 𝑏𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑛 ) 𝑎𝑗1 1 𝑎𝑗2 2 · · · 𝑎𝑗𝑛 𝑛
𝑗1 𝑗2 ···𝑗𝑛
= det(𝐴)
注 性质3.2.1表明方阵转置后的行列式不变, 因此对于行成立的行列式命题,
对于列相应的命题也成立. 故以下在证明行列式性质时, 只证其对行成立即可.
3.2 行列式的性质 73
性质 3.2.2 设 𝑛 阶方阵
𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. ..
. . .
𝐴 = 𝑏𝑡1 + 𝑐𝑡1 𝑏𝑡2 + 𝑐𝑡2 · · · 𝑏𝑡𝑛 + 𝑐𝑡𝑛
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. .. .. .. ..
. . . . . .
𝐵 = 𝑏𝑡1 𝑏𝑡2 ··· 𝑏𝑡𝑛 , 𝐶 = 𝑐𝑡1 𝑐𝑡2 ··· 𝑐𝑡𝑛
. .. .. . .. ..
.. ..
. .
. .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
证明
X
det(𝐴) = (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · (𝑏𝑡𝑗𝑡 + 𝑐𝑡𝑗𝑡 ) · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑏𝑡𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛
X
+ (−1)𝜏 (𝑗1 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑐𝑡𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑡 ···𝑗𝑛
= det(𝐵) + det(𝐶)
其中
𝑏𝑡𝑗 = 𝑎𝑠𝑗 (𝑗 = 1, 2, · · · , 𝑛)
𝑏𝑠𝑗 = 𝑎𝑡𝑗 (𝑗 = 1, 2, · · · , 𝑛)
𝑏𝑖𝑗 = 𝑎𝑖𝑗 (𝑖 ̸= 𝑠, 𝑖 ̸= 𝑡, 𝑗 = 1, 2, · · · , 𝑛)
因此
det(𝐵)
X
= (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 ) 𝑏1𝑗1 · · · 𝑏𝑠𝑗𝑠 · · · 𝑏𝑡𝑗𝑡 · · · 𝑏𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑎𝑡𝑗𝑠 · · · 𝑎𝑠𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛
X
= − (−1)𝜏 (𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛 )+𝜏 (1···𝑡···𝑠···𝑗𝑛 ) 𝑎1𝑗1 · · · 𝑎𝑡𝑗𝑠 · · · 𝑎𝑠𝑗𝑡 · · · 𝑎𝑛𝑗𝑛
𝑗1 ···𝑗𝑠 ···𝑗𝑡 ···𝑗𝑛
= − det(𝐴)
推论 3.2.1 若方阵中有两行(列)对应元素相等, 则其行列式为 0.
证 明 设 方 阵 𝐴 互 换 对 应 元 素 相 等 的 两 行(列)后 得 到 的 方 阵 为 𝐵, 有
det(𝐴) = − det(𝐵). 又因为互换的两行(列)是相同的, 故 𝐴 = 𝐵, 从而 det(𝐴) =
− det(𝐵). 因此 det(𝐴) = 0.
性质 3.2.4 设 𝑛 阶方阵
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. .. .. .. ..
. . . . . .
𝐴 = 𝑎𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛 , 𝐵 = 𝑘𝑎𝑖1 𝑘𝑎𝑖2 · · · 𝑘𝑎𝑖𝑛
. .. .. . .. ..
.. ..
. .
. .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛
3.2 行列式的性质 75
证明
X
det(𝐵) = (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛 ) 𝑎1𝑗1 𝑎2𝑗2 · · · (𝑘𝑎𝑖𝑗𝑖 ) · · · 𝑎𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛
X
= (−1)𝜏 (𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛 ) 𝑘𝑎1𝑗1 𝑎2𝑗2 · · · 𝑎𝑖𝑗𝑖 · · · 𝑎𝑛𝑗𝑛
𝑗1 𝑗2 ···𝑗𝑖 ···𝑗𝑛
= 𝑘 det(𝐴)
证明 设 𝑛 阶方阵
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
. . .
𝑎𝑠1
𝑎𝑠2 ··· 𝑎𝑠𝑛
. .. ..
..
𝐴= . .
𝑎
𝑡1 𝑎𝑡2 ··· 𝑎𝑡𝑛
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
性质 3.2.5 设 𝑛 阶方阵
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
. . .
𝑎𝑖1
𝑎𝑖2 ··· 𝑎𝑖𝑛
. .. ..
..
𝐴= . .
𝑎
𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑎11 𝑎12 ··· 𝑎1𝑛
.. .. ..
. . .
𝑎𝑖1 + 𝑘𝑎𝑗1
𝑎𝑖2 + 𝑘𝑎𝑗2 · · · 𝑎𝑖𝑛 + 𝑘𝑎𝑗𝑛
.. .. ..
𝐵=
. . .
𝑎𝑗1 𝑎𝑗2 ··· 𝑎𝑗𝑛
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑛𝑛
det(𝐴) = det(𝐸1 𝐸2 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 ) det(𝐸3 · · · 𝐸𝑘 )
= det(𝐸1 ) det(𝐸2 ) det(𝐸3 ) · · · det(𝐸𝑘 ) ̸= 0
所以
78 第3章 行 列 式
det(𝐴)
𝐼𝑟 𝑂
= det 𝐸1 𝐸2 · · · 𝐸𝑠 𝐹1 𝐹2 · · · 𝐹𝑡
𝑂 𝑂
𝐼𝑟 𝑂
= det(𝐸1 ) det 𝐸2 · · · 𝐸𝑠 𝐹1 𝐹2 · · · det(𝐹𝑡 )
𝑂 𝑂
𝐼
𝑟
𝑂
= det(𝐸1 ) det(𝐸2 ) · · · det(𝐸𝑠 ) det det(𝐹1 ) det(𝐹2 ) · · · det(𝐹𝑡 )
𝑂 𝑂
=0
由方阵可逆的上述充要条件可直接得到下面的推论.
推论 3.2.7 方阵 𝐴 不可逆的充要条件是 det(𝐴) = 0.
性 质 3.2.6 设 𝐴 与 𝐵 都是 𝑛 阶方阵, 则 det(𝐴𝐵) = det(𝐴) det(𝐵), 即两个
𝑛 阶方阵乘积的行列式等于两个方阵行列式的乘积.
证明 先考虑方阵 𝐴 不可逆的情形, 此时 rank(𝐴) < 𝑛, det(𝐴) = 0.
由于 rank(𝐴𝐵) 6 rank(𝐴) < 𝑛, 故方阵 𝐴𝐵 不可逆, det(𝐴𝐵) = 0, 因此成立
det(𝐴𝐵) = det(𝐴) det(𝐵).
再考虑方阵 𝐴 可逆的情形, 此时存在有限个初等阵 𝐸1 , 𝐸2 , · · · , 𝐸𝑘 , 使得
𝐴 = 𝐸1 𝐸2 · · · 𝐸𝑘 , 从而
det(𝐴𝐵) = det(𝐸1 𝐸2 · · · 𝐸𝑘 𝐵)
= det(𝐸1 ) det(𝐸2 · · · 𝐸𝑘 𝐵)
= det(𝐸1 ) det(𝐸2 ) · · · det(𝐸𝑘 ) det(𝐵)
= det(𝐴) det(𝐵)
1
性质 3.2.7 设 𝑛 阶方阵 𝐴 可逆, 则 det(𝐴−1 ) = .
det(𝐴)
证明 因 𝐴𝐴−1 = 𝐼, 故 det(𝐴𝐴−1 ) = det(𝐼), 从而 det(𝐴) det(𝐴−1 ) = 1. 由
1
于方阵 𝐴 可逆, 故 det(𝐴) ̸= 0, 因此 det(𝐴−1 ) = .
det(𝐴)
特别地, 正交阵的行列式为 1 或 −1. 这是因为, 设正交阵 𝑄, 𝑄𝑄T = 𝐼, 得
3.3 伴随矩阵与行列式按行(列)展开 79
3.3 伴随矩阵与行列式按行(列)展开
3.3.1 伴随矩阵
X
det(𝐴) = (−1)𝜏 (1𝑗2 ···𝑗𝑛 ) 𝑎11 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛
1𝑗2 ···𝑗𝑛
X
= 𝑎11 (−1)𝜏 (𝑗2 ···𝑗𝑛 ) 𝑎2𝑗2 · · · 𝑎𝑛𝑗𝑛 = 𝑎11 𝑀11
𝑗2 ···𝑗𝑛
𝑛
X 𝑛
X
𝑎𝑖𝑘 𝐴𝑗𝑘 = 𝑎𝑘𝑖 𝐴𝑘𝑗 = 𝛿𝑖𝑗 det(𝐴), 其中 𝑖, 𝑗 = 1, 2, · · · , 𝑛
𝑘=1 𝑘=1
且
1, 𝑖=𝑗
𝛿𝑖𝑗 =
0, 𝑖 ̸= 𝑗
P𝑛
下面先证明 𝑘=1 𝑎𝑖𝑘 𝐴𝑖𝑘 = det(𝐴).
𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. ..
. . .
det(𝐴) = 𝑎𝑖1 𝑎𝑖2 · · · 𝑎𝑖𝑛
.. .. ..
. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑎11 𝑎12 · · · 𝑎1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. .. .. .. ..
. . . . . .
= 𝑎𝑖1 0 ··· 0 + 0 𝑎𝑖2 ··· 0 + ···
.. .. .. .. .. ..
. . . . . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
11 𝑎12 · · · 𝑎1𝑛
𝑎
. . .
. .. ..
.
+ 0 0 · · · 𝑎𝑖𝑛
. .. ..
.. . .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
其中
𝑎
11 ··· 𝑎1𝑗−1 𝑎1𝑗 𝑎1𝑗+1 ··· 𝑎1𝑛
.. .. .. .. ..
. . . . .
𝑎𝑖−1,1 · · · 𝑎𝑖−1,𝑗−1 𝑎𝑖−1,𝑗 𝑎𝑖−1,𝑗+1 · · · 𝑎𝑖−1,𝑛
det(𝐵𝑗 ) = 0 ··· 0 𝑎𝑖𝑗 0 ··· 0
𝑎𝑖+1,1 · · · 𝑎𝑖+1,𝑗−1 𝑎𝑖+1,𝑗 𝑎𝑖+1,𝑗+1 · · · 𝑎𝑖+1,𝑛
.. .. .. .. ..
. . . . .
𝑎𝑛1 ··· 𝑎𝑛,𝑗−1 𝑎𝑛𝑗 𝑎𝑛,𝑗+1 ··· 𝑎𝑛𝑛
𝑎
𝑖𝑗 0 ··· 0 0 ··· 0
𝑎
1𝑗 𝑎11 ··· 𝑎1𝑗−1 𝑎1𝑗+1 ··· 𝑎1𝑛
.. .. .. .. ..
. . . . .
det(𝐶𝑗 ) = 𝑎𝑖−1,𝑗 𝑎𝑖−1,1 · · · 𝑎𝑖−1,𝑗−1 𝑎𝑖−1,𝑗+1 · · · 𝑎𝑖−1,𝑛
𝑎𝑖+1,𝑗 𝑎𝑖+1,1 · · · 𝑎𝑖+1,𝑗−1 𝑎𝑖+1,𝑗+1 · · · 𝑎𝑖+1,𝑛
.. .. .. .. ..
. . . . .
𝑎𝑛𝑗 𝑎𝑛1 ··· 𝑎𝑛,𝑗−1 𝑎𝑛,𝑗+1 ··· 𝑎𝑛𝑛
根据行列式的性质及前面的引理, 得
从而
det(𝐴) = det(𝐵1 ) + det(𝐵2 ) + · · · + det(𝐵𝑛 )
= 𝑎𝑖1 𝐴𝑖1 + 𝑎𝑖2 𝐴𝑖2 + · · · + 𝑎𝑖𝑛 𝐴𝑖𝑛
设方阵
82 第3章 行 列 式
𝑑11 𝑑12 · · · 𝑑1𝑛 𝑎11 𝑎12 · · · 𝑎1𝑛
.. .. .. .. .. ..
. . .
. . .
𝑑𝑖1
𝑑𝑖2 ··· 𝑑𝑖𝑛 𝑎𝑖1
𝑎𝑖2 ··· 𝑎𝑖𝑛
. .. .. . .. ..
..
𝐷= . . = .. . .
𝑑
𝑗1 𝑑𝑗2 ··· 𝑑𝑗𝑛 𝑎
𝑖1 𝑎𝑖2 ··· 𝑎𝑖𝑛
.. .. .. .. .. ..
. . . . . .
𝑑𝑛1 𝑑𝑛2 · · · 𝑑𝑛𝑛 𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑛
X 𝑛
X
det(𝐷) = 𝑑𝑗𝑘 𝐴𝑗𝑘 = 𝑎𝑖𝑘 𝐴𝑗𝑘
𝑘=1 𝑘=1
P𝑛
因为 det(𝐷) = 0, 所以 𝑘=1 𝑎𝑖𝑘 𝐴𝑗𝑘 = 0(𝑖 ̸= 𝑗).
P𝑛
同理可证 𝑘=1 𝑎𝑘𝑖 𝐴𝑘𝑗 = 0, 其中 𝑖 ̸= 𝑗.
1
推论 3.3.1 设方阵 𝐴 可逆, 则 𝐴−1 = 𝐴* , 其中 𝐴* 是 𝐴 的伴随矩阵.
det(𝐴)
证明 因方阵 𝐴可逆, 故 det(𝐴) ̸= 0. 由 𝐴* 𝐴 = det(𝐴)𝐼, 得
1
𝐴* 𝐴 = 𝐼
det(𝐴)
从而
1
𝐴−1 = 𝐴*
det(𝐴)
3.3.2 行列式按行(列)展开
例3.3.1 计算下列矩阵的行列式
7 3 1 −5
2 6 −3 0
𝐴=
3
11 −1 4
−6 5 2 −9
解
7 3 1 −5
23 15 −15
23 15 0 −15
1+3
det(𝐴) = = (−1) 10 14 −1
10 14 0 −1
−20 −1 1
−20 −1 0 1
23 15 0
23 15
2+3
= 10 14 13 = (−1) 13
−20 −1
−20 −1 0
= −13(−23 + 300) = −3601
例3.3.2 设 𝑛 阶方阵
𝑎 0 0 ··· 0 𝑏
𝑏 𝑎 0 ··· 0 0
0 𝑏 𝑎 ··· 0 0
𝐴=
.. .. .. .. ..
. . . . .
0 0 0 ··· 𝑎 0
0 0 0 ··· 𝑏 𝑎
计算行列式 det(𝐴).
解 行列式按第一行展开得
𝑎 0 ··· 0 0 𝑏 𝑎 ··· 0 0
𝑏 𝑎 ··· 0 0
0 𝑏 ··· 0 0
.. .. .. .. .. .. .. ..
𝑛+1
det(𝐴) = 𝑎 + 𝑏(−1)
. . . .
. . . .
0 0 ··· 𝑎 0
0 0 ··· 𝑏 𝑎
0 0 ··· 𝑏 𝑎 0 0 ··· 0 𝑏
解 对 𝐴𝑛 依次进行如下初等行变换
同理
det(𝐴𝑛−1 ) = (𝑎3 − 𝑎2 )(𝑎4 − 𝑎2 ) · · · (𝑎𝑛 − 𝑎2 ) det(𝐴𝑛−2 )
· · · , 以此下去,
3.3 伴随矩阵与行列式按行(列)展开 85
因此
Y
det(𝐴𝑛 ) = (𝑎𝑗 − 𝑎𝑖 )
16𝑖<𝑗6𝑛
其中记号 表示连乘积.
Q
3.3.3 Cramer法则
1
𝑥 = 𝐴−1 𝑏 = 𝐴* 𝑏
det(𝐴)
所以
1 1
𝑥𝑗 = row(𝐴* 𝑏, 𝑗) = row(𝐴* , 𝑗)𝑏
det(𝐴) det(𝐴)
1 𝑛
X det(𝐴𝑗 )
= 𝐴𝑘𝑗 𝑏𝑘 =
det(𝐴) 𝑘=1 det(𝐴)
例3.3.4 求下列线性方程组的解
𝑥1 − 3𝑥3 − 6𝑥4 = 9
2𝑥1 − 5𝑥2 + 𝑥3 + 𝑥4 = 8
−𝑥2 + 2𝑥3 + 2𝑥4 = −5
𝑥 − 7𝑥 + 4𝑥 + 6𝑥 = 0
1 2 3 4
解 上述线性方程组的系数矩阵为
86 第3章 行 列 式
1 0 −3 −6
2 −5 1 1
𝐴=
0
−1 2 2
1 −7 4 6
该系数矩阵的行列式为 det(𝐴) = 27 ̸= 0.
将 𝐴 中第 𝑗 列 (𝑗 = 1, 2, 3, 4) 的元素 𝑎1𝑗 , 𝑎2𝑗 , 𝑎3𝑗 , 𝑎4𝑗 分别换成元素 9, 8, −5, 0,
所得的矩阵为
9 0 −3 −6 1 9 −3 −6
8 −5 1 1 2 8 1 1
𝐴1 = , 𝐴2 =
−5 −1 2 2 0 −5 2 2
0 −7 4 6 1 0 4 6
1 0 9 −6 1 0 −3 9
2 −5 8 1 2 −5 1 8
𝐴3 = , 𝐴4 =
0
−1 −5 2
0
−1 2 −5
1 −7 0 6 1 −7 4 0
3.4 行列式与矩阵的秩
得矩阵 𝐴 的秩 rank(𝐴) = 𝑟.
3.5 习 题
1. 根据行列式定义, 计算
2𝑥 𝑥 1 2
1 𝑥 1 −1
𝑓 (𝑥) =
3 2 𝑥 1
1 1 1 𝑥
中 𝑥4 与 𝑥3 的系数.
2. 使用行列式的定义证明:
𝑎1 𝑎2 𝑎3 𝑎4 𝑎5
𝑏1 𝑏2 𝑏3 𝑏4 𝑏5
𝐷 = 𝑐1 𝑐2 0 0 0 = 0
𝑑1 𝑑2 0 0 0
𝑒1 𝑒2 0 0 0
4. 通过计算以下行列式证明:奇偶排列各半.
1 1 ··· 1
1 1 ··· 1
𝐷=
.. .. ..
. . .
1 1 ··· 1
5. 计算下列行列式的值
2 0 0 3 0 0
(1) 4 1 0 ; (2) 2 1 1 ;
7 3 −2 1 2 2
4 0 2 1
1 1 1 3
5 0 4 2 0 3 1 1
(3)
2 0 3 4 ; (4)
0 0 2 2
.
1 0 2 3 −1 −1 −1 2
6. 计算 2𝑛 阶行列式:
𝑥 0 ··· 0 𝑦
···
0 𝑥 𝑦 0
.. .. .. ..
𝐷2𝑛 =
. .
. .
0 𝑦 ··· 𝑥 0
𝑦 0 ··· 0 𝑥
7. 计算 𝑛( 𝑛 > 1) 阶行列式:
𝑥 𝑦 0 ··· 0 0
···
0 𝑥 𝑦 0 0
.. .. .. .. ..
𝐷𝑛 =
. . .
. .
0 0 0 ··· 𝑥 𝑦
𝑦 0 0 ··· 0 𝑥
8. 计算 𝑛 阶行列式:
2 1 0 ··· 0 0 0
···
1 2 1 0 0 0
.. .. .. .. .. ..
𝐷𝑛 =
. . . . . .
0 0 0 ··· 1 2 1
0 0 0 ··· 0 1 2
90 第3章 行 列 式
9. 计算 𝑛 阶行列式:
𝑥+𝑦
𝑥𝑦 0 ··· 0 0 0
···
1 𝑥+𝑦 𝑥𝑦 0 0 0
𝐷𝑛 = 0
1 𝑥+𝑦 ··· 0 0 0
. .. .. .. .. ..
.
. . . . . .
0 0 0 ··· 0 1 𝑥+𝑦
10. 计算 𝑛 阶行列式:
2 cos 𝜃
1 0 ··· 0 0 0
···
1 2 cos 𝜃 1 0 0 0
.. .. .. .. .. ..
𝐷𝑛 =
. . . . . .
0 0 0 ··· 1 2 cos 𝜃 1
0 0 0 ··· 0 1 2 cos 𝜃
𝑎 𝑏 0 ··· 0 0 0
···
𝑐 𝑎 𝑏 0 0 0
.. .. .. .. .. ..
𝐷𝑛 =
. . . . .
.
0 0 0 ··· 𝑐 𝑎 𝑏
0 0 0 ··· 0 𝑐 𝑎
12. 计算行列式:
𝑥 −1 0 ··· 0 0
−1 ···
0 𝑥 0 0
.. .. .. .. ..
. . . . .
0 0 0 ··· 𝑥 −1
𝑎𝑛 𝑎𝑛−1 𝑎𝑛−2 ··· 𝑎2 𝑎1 + 𝑥
13. 计算 𝑛 阶行列式:
1 2
3 ··· 𝑛
2 3 4 ···
1
3 4 5 ··· 2
.. .. .. ..
. . . .
𝑛 1 2 ··· 𝑛 − 1
3.5 习 题 91
14. 计算 𝑛 阶行列式:
𝑥1 + 𝑎
𝑎 ··· 𝑎 𝑎
···
𝑎 𝑥2 + 𝑎 𝑎
𝑎
.. .. ..
..
. .
. .
𝑎 𝑎 · · · 𝑥𝑛−1 + 𝑎 𝑎
𝑎 𝑎 ··· 𝑎 𝑎
15. 计算 𝑛 阶行列式:
𝑥1 𝑎 ··· 𝑎 𝑎
···
𝑏 𝑥2 𝑎 𝑎
.. .. .. ..
. . .
.
𝑏 𝑏 ··· 𝑥𝑛−1 𝑎
𝑏 𝑏 ··· 𝑏 𝑥𝑛
16. 计算行列式:
1 1 1 1
1 1 −1 −1
1 −1 1 −1
1 −1 −1 1
17. 计算行列式:
···
𝑎 +𝑏 𝑎1 + 𝑏2 𝑎1 + 𝑏 𝑛
1 1
𝑎2 + 𝑏1 𝑎2 + 𝑏2 ··· 𝑎2 + 𝑏 𝑛
𝐷𝑛 =
.. .. ..
. . .
𝑎𝑛 + 𝑏1 𝑎𝑛 + 𝑏2 ··· 𝑎 𝑛 + 𝑏𝑛
18. 计算行列式:
···
𝑎 +1 1
1
1
1 𝑎2 + 1 ··· 1
𝐷𝑛 =
.. .. ..
. . .
1 1 · · · 𝑎𝑛 + 1
19. 计算行列式:
𝑎1 𝑥 𝑥 𝑥 ··· 𝑥
𝑥 𝑎2 𝑥 𝑥 ··· 𝑥
𝑥 𝑥 𝑎3 𝑥 ··· 𝑥
𝐷𝑛 = .. .. .. ..
..
. . . . .
𝑥 𝑥 𝑥 𝑥 · · · 𝑥
𝑥 𝑥 𝑥 𝑥 · · · 𝑎𝑛
92 第3章 行 列 式
20. 计算 𝑛 阶行列式:
𝑥+𝑦
𝑥𝑦 0 0 0 ··· 0 0 0
···
1 𝑥+𝑦 𝑥𝑦 0 0 0 0 0
0
1 𝑥+𝑦 𝑥𝑦 0 ··· 0 0 0
. .. .. .. .. .. .. ..
.
. . . . . . . .
0 0 0 0 0 ··· 1 𝑥+𝑦 𝑥𝑦
𝐴 𝐶
21.设分块 𝑛 阶方阵 𝑀 = , 其中 𝐴 为 𝑘 阶方阵, 证明: det(𝑀 ) = det(𝐴)·
𝑂 𝐵
det(𝐵).
22. 计算 2𝑛 阶行列式:
𝑎1 𝑐1
𝑎2 𝑐2
.. ..
. .
𝑎𝑛 𝑐𝑛
𝐷2𝑛 =
𝑑𝑛 𝑏𝑛
.. ..
. .
𝑑2 𝑏2
𝑑1 𝑏1
sin 2𝛼1 sin(𝛼1 + 𝛼2 ) · · · sin(𝛼1 + 𝛼𝑛 )
sin(𝛼2 + 𝛼1 )
sin 2𝛼2 · · · sin(𝛼2 + 𝛼𝑛 )
.
.. .
.. ..
.
sin(𝛼𝑛 + 𝛼1 ) sin(𝛼𝑛 + 𝛼2 ) · · · sin 2𝛼𝑛
···
cos 𝛼 1 0 0 0
1
2 cos 𝛼 1 ··· 0 0
···
0 1 2 cos 𝛼 0 0
. .. .. .. ..
= cos𝑛𝛼
.
. . . . .
0
0 0 ··· 2 cos 𝛼 1
0 0 0 ··· 1 2 cos 𝛼
3.5 习 题 93
···
𝑎+𝑥 𝑎 + 𝑥2 𝑎 + 𝑥𝑛
1
2
𝑎 + 𝑥21 𝑎 + 𝑥22 ··· 𝑎2 + 𝑥2𝑛
𝐷𝑛 =
.. .. ..
. . .
𝑛
𝑎 + 𝑥𝑛1 𝑎 + 𝑥𝑛 𝑎𝑛 + 𝑥𝑛
2 ··· 𝑛
𝑎 𝑏 𝑏 ··· 𝑏
···
𝑐 𝑎 𝑏 𝑏
𝐷𝑛 =
𝑐 𝑐 𝑎 ··· 𝑏
.. .. .. ..
. . . .
𝑐 𝑐 𝑐 ··· 𝑎
27. 计算 𝑛 阶行列式:
···
1+𝑥 𝑦 1 + 𝑥1 𝑦2 1 + 𝑥1 𝑦𝑛
1 1
1 + 𝑥2 𝑦1 1 + 𝑥2 𝑦2 ··· 1 + 𝑥2 𝑦𝑛
𝐷𝑛 =
.. .. ..
. . .
1 + 𝑥𝑛 𝑦1 1 + 𝑥𝑛 𝑦2 ··· 1 + 𝑥𝑛 𝑦𝑛
28. 利用伴随矩阵求以下矩阵的逆矩阵:
(1)
1 1 −1
𝐴= 2 1 0
1 −1 0
(2)
2 2 3
𝐵= 1 −1 0
−1 2 1
(3)
1 0 −1 0
0 1 0 0
𝐶=
0 0 −1 1
0 0 0 −1
94 第3章 行 列 式
−1
1
29. 设 𝐴 为 𝑛 阶方阵, 𝐴* 为 𝐴 的伴随矩阵. 已知 |𝐴| = 3, 求 𝐴 − 2𝐴* .
4
30. 设矩阵 𝐴 的伴随矩阵
1 0 0 0
0 1 0 0
𝐴* =
1 0 1 0
0 −3 0 8
𝑠
X
𝛽𝑖 = 𝑎𝑖𝑗 𝛼𝑗 , 𝑖 = 1, 2, · · · , 𝑠
𝑗=1
证明 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 线性无关的充分必要条件是下面 𝑠 阶行列式
···
𝑎 𝑎12 𝑎1𝑠
11
𝑎21 𝑎22 ··· 𝑎2𝑠
̸= 0
. .. ..
.. . .
𝑎𝑛1 𝑎𝑛2 ··· 𝑎𝑠𝑠
d
𝑎11 (𝑡) · · · 𝑎1𝑛 (𝑡) 𝑎 (𝑡)
11 ··· 𝑎1𝑗 (𝑡) · · · 𝑎1𝑛 (𝑡)
d
X𝑛 d𝑡
.. ..
= .. .. ..
. . . . .
d𝑡
𝑗=1
𝑎𝑛1 (𝑡) · · · 𝑎𝑛𝑛 (𝑡) d
𝑎𝑛1 (𝑡) ··· 𝑎𝑛𝑗 (𝑡) · · · 𝑎𝑛𝑛 (𝑡)
d𝑡
34. 利用子矩阵的行列式计算下列矩阵的秩.
17 18 40 10
3 3 −5 4 2 7
7 17 1
(1) ; (2) 2 0 3 1 4 .
1 4 10 0
1 5 2 0 1
7 8 18 4
第4章 线性空间与线性变换
4.1 线 性 空 间
𝛼 + 𝛽1 = 0, 𝛼 + 𝛽2 = 0
因此
𝛽1 = 𝛽1 + 0 = 𝛽1 + (𝛼 + 𝛽2 ) = (𝛽1 + 𝛼) + 𝛽2 = 0 + 𝛽2 = 𝛽2
一元多项式可分别看成是相应空间中的向量. R𝑛 是这种抽象向量空间的具体模
型, 在本章中我们着重讨论 R𝑛 .
注 在本章中, 对于未指明特定数域的线性空间, 则默认是实数域 R 上的线
性空间.
4.2 基
4.2.1 基和坐标
定 义 4.2.1 设 𝑉 是 线 性 空 间, 如 果 在 𝑉 中 存 在 𝑛 个 线 性 无 关 向 量
𝜀1 , 𝜀2 , · · · , 𝜀𝑛 , 使得 𝑉 中任一向量 𝛼 均可由 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 线性表出, 则称向量
组 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 为线性空间 𝑉 的一组基
基, 𝑛 称为线性空间 𝑉 的维
维 数(dimension),
记 dim 𝑉 = 𝑛, 𝑉 称为 𝑛 维线性空间. 如果不存在有限个向量构成 𝑉 的一组基, 则
𝑉 称为无限维线性空间.
注 无限维线性空间也有基. 无限维线性空间基的存在性的证明超出本课程
范围, 本书只研究有限维线性空间. 有限维线性空间的基实际上是它的一个极大线
性无关组, 由第 2 章中关于极大线性无关组的讨论可知, 基不是唯一的, 但其维数
是唯一确定的.
例4.2.1 在线性空间 R𝑛 中, 向量组
1 0 0
0 1 0
0
0
0
𝜀1 = , 𝜀2 = , · · · , 𝜀𝑛 =
.. .. ..
.
.
.
0 0 0
0 0 1
因此 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 R𝑛 的一组基, 且 R𝑛 的维数为 𝑛.
例4.2.2 在线性空间 𝑃𝑛 [𝑥] 中, 向量组
𝜀1 = 1, 𝜀2 = 𝑥, 𝜀3 = 𝑥2 , · · · , 𝜀𝑛 = 𝑥𝑛−1 , 𝜀𝑛+1 = 𝑥𝑛
则称 𝑥1 , 𝑥2 , · · · , 𝑥𝑛 为向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐
坐标 .
定理 4.2.1 任意向量在给定基下的坐标唯一.
证明 设向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下有两组坐标:
𝛼 = 𝑥1 𝜀1 + 𝑥2 𝜀2 + · · · + 𝑥𝑛 𝜀𝑛 (4.1)
式(4.1)减去式(4.2), 得
因为 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 线性无关, 所以
从而坐标唯一.
例4.2.3 线性空间 R3 中, 向量 𝛼 = [1, 2, −1]T , 分别求 𝛼 在下列两组基下的
坐标:
(1) 𝜀1 = [1, 0, 0]T , 𝜀2 = [0, 1, 0]T , 𝜀3 = [0, 0, 1]T ;
(2) 𝜂1 = [1, 0, 0]T , 𝜂2 = [1, 1, 0]T , 𝜂3 = [1, 1, 1]T .
证明 (1) 由于
1 1 0 0
2 = 0 + 2 1 + (−1) 0 = 𝜀1 + 2𝜀2 + (−1)𝜀3
𝛼=
−1 0 0 1
解得
𝑥1 = −1, 𝑥2 = 3, 𝑥3 = −1
的秩 rank(𝐴) = 𝑙.
证明 由于 𝛼𝑗 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的坐标为 [𝑎1𝑗 , 𝑎2𝑗 , · · · , 𝑎𝑛𝑗 ]T , 因此
即
𝑎1𝑗
𝑎2𝑗
𝛼𝑗 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ] . (𝑗 = 1, 2, · · · , 𝑙)
..
𝑎𝑛𝑗
故有
其中
𝑎11 𝑎12 · · · 𝑎1𝑙
𝑎21 𝑎22 · · · 𝑎2𝑙
𝐴= .
.. .. ..
. .
𝑎𝑛1 𝑎𝑛2 · · · 𝑎𝑛𝑙
向量组 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关当且仅当 𝑥1 𝛼1 + 𝑥2 𝛼2 + · · · + 𝑥𝑙 𝛼𝑙 = 0 只有
零解, 即
[𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ]𝑥 = 0 (4.4)
4.2.2 过渡矩阵
线性空间中的任意向量在给定基下的坐标是唯一确定的, 在不同基下的坐标
一般是不同的. 下面讨论同一向量在不同基下的坐标之间的关系.
定 义 4.2.3 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 和 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 是 𝑛 维线性空间 𝑉 的两组基,
若 [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 , 则称 𝑛 阶方阵 𝑀 为从基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 到
基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 的过
过渡 矩 阵 .
定理 4.2.2 过渡矩阵是可逆的.
证明 设 𝑀 为从基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 到基 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 的过渡矩阵, 即
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀
考察
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝑥 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 𝑥 = 0
由于 𝜂1 , 𝜂2 , · · · , 𝜂𝑛 是基, 故线性无关, 从而
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝑥 = 0 ⇐⇒ 𝑥 = 0
[𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀 𝑥 = 0 ⇐⇒ 𝑀 𝑥 = 0
证明 由已知
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀
和
𝑥1 𝑥′1
𝑥′2
𝑥2
𝛼 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ] = [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]
.. ..
.
.
𝑥𝑛 𝑥′𝑛
得
𝑥1 𝑥′1
𝑥′2
𝑥2
𝛼 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀
.. ..
.
.
𝑥𝑛 𝑥′𝑛
由向量 𝛼 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下坐标唯一, 得
𝑥1 𝑥′1
𝑥′2
𝑥2
=𝑀
.. ..
.
.
𝑥𝑛 𝑥′𝑛
与
0 −1 1
𝜂1 =
1 ,
𝜂2 =
1 ,
𝜂3 =
2
1 0 1
求从基 𝜀1 , 𝜀2 , 𝜀3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵.
解 设从基 𝜀1 , 𝜀2 , 𝜀3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵为 𝑀 , 即
[𝜂1 , 𝜂2 , 𝜂3 ] = [𝜀1 , 𝜀2 , 𝜀3 ]𝑀
102 第4章 线性空间与线性变换
所以, 过渡矩阵为
0 1 1
−1 −3 −2
𝑀 =
2 4 4
4.3 子 空 间
4.3.1 子空间的定义
𝛽 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ]𝑥 (4.6)
将式(4.5)代入式(4.6), 得
𝛽 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑟 ]𝐴𝑥
4.3.2 零空间与列空间
P𝑛
因为 𝐴𝑥 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 所以 𝐴𝑥 = 𝑏 有解当且仅当向量 𝑏 可由系数矩
P𝑛
阵 𝐴 的列向量线性表出 𝑏 = 𝑗=1 𝑥𝑗 col(𝐴, 𝑗), 即 𝑏 ∈ C(𝐴).
定理 4.3.5 设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 则
P𝑛
(1) 矩阵 𝐴 的列空间 C(𝐴) = { 𝑗=1 𝜆𝑗 col(𝐴, 𝑗)|𝜆𝑗 ∈ R} 的维数 dim C(𝐴) =
𝑟;
(2) 矩阵 𝐴 的零空间 N(𝐴) = {𝑥 ∈ R𝑛 |𝐴𝑥 = 0} 的维数 dim N(𝐴) = 𝑛 − 𝑟.
证明 (1)矩阵 𝐴 的列空间 C(𝐴) 是由 𝐴 的列向量 col(𝐴, 1), · · · ,col(𝐴, 𝑛) 张
成的.
由 rank(𝐴) = 𝑟 知 𝐴 的 列 向 量 组 的 极 大 无 关 组 中 有 𝑟 个 向 量, 不 妨 设
col(𝐴, 1), · · · ,col(𝐴, 𝑟).
因为 col(𝐴, 1), · · · ,col(𝐴, 𝑛) 可由其极大无关组 col(𝐴, 1), · · · ,col(𝐴, 𝑟)线性
表出, 所以列空间 C(𝐴) 中的任何向量可由 col(𝐴, 1), · · · ,col(𝐴, 𝑟)线性表出, 所以
col(𝐴, 1), · · · ,col(𝐴, 𝑟)是列空间 C(𝐴) 的一组基, 故其维数 dimC(𝐴) = 𝑟.
(2)矩阵 𝐴 的零空间即为齐次线性方程组 𝐴𝑥 = 0 的解空间, 它由基础解系张
成. 因 rank(𝐴) = 𝑟, 根据线性方程组理论知 𝐴𝑥 = 0 有 𝑛 − 𝑟 个自由变量, 从而基
础解系中含有 𝑛 − 𝑟 个线性无关的解向量, 所以维数 dim N(𝐴) = 𝑛 − 𝑟.
4.3.3 子空间的交与和
𝑊1 + 𝑊2 = {𝛼 + 𝛽|𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 }
对任意 𝛼, 𝛽 ∈ 𝑊1 + 𝑊2 , 有
𝛼 = 𝛼 1 + 𝛼2 , 𝛼1 ∈ 𝑊1 , 𝛼 2 ∈ 𝑊2
𝛽 = 𝛽1 + 𝛽2 , 𝛽1 ∈ 𝑊1 , 𝛽2 ∈ 𝑊2
由于 𝑊1 , 𝑊2 是 𝑉 的子空间, 故有
𝛼 1 + 𝛽 1 ∈ 𝑊1 , 𝛼2 + 𝛽2 ∈ 𝑊2
从而
即 𝑊1 + 𝑊2 对于加法具有封闭性.
对任意 𝛼 ∈ 𝑊1 + 𝑊2 , 存在 𝛼1 ∈ 𝑊1 , 𝛼2 ∈ 𝑊2 , 使得 𝛼 = 𝛼1 + 𝛼2 . 由于
𝑊1 , 𝑊2 是 𝑉 的子空间, 故有 𝑘𝛼1 ∈ 𝑊1 , 𝑘𝛼2 ∈ 𝑊2 . 从而 𝑘𝛼 = 𝑘(𝛼1 + 𝛼2 ) =
𝑘𝛼1 + 𝑘𝛼2 ∈ 𝑊1 + 𝑊2 , 即 𝑊1 + 𝑊2 对于数乘具有封闭性.
例4.3.2 在线性空间 R3 中, 设 𝑊1 = {(𝑥, 0, 0)|𝑥 ∈ R}, 𝑊2 = {(0, 𝑦, 𝑧)|𝑦 ∈
R, 𝑧 ∈ R}, 可以验证 𝑊1 是 R3 的一维子空间, 𝑊2 是 R3 的二维子空间, 且有
𝑊1 ∩ 𝑊2 = {(0, 0, 0)}, 𝑊1 + 𝑊2 = R3
注 (1) 𝑊1 + 𝑊2 ̸= 𝑊1 𝑊2 不是线性空间(请读者自行思考为什
S S
𝑊2 , 𝑊 1
么).
(2)向量维数与空间维数是两个不同的概念, 前者指向量中所含元素的个数,
后者指张成子空间的基中所含向量个数. 如例 4.3.2 中空间 𝑊1 , 𝑊2 所包含的向量
维数均是 3, 因此它们分别是三维空间 R3 的一维子空间和二维子空间.
例4.3.3 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 与 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 是线性空间 𝑉 的两组向量, 则
span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ) + span(𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
=span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 , 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
证明 记
𝑊1 = span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 )
𝑊2 = span(𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
𝑊3 = span(𝛼1 , 𝛼2 , · · · , 𝛼𝑙 , 𝛽1 , 𝛽2 , · · · , 𝛽𝑠 )
对于任意 𝜂 ∈ 𝑊1 + 𝑊2 , 存在 𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 , 使得 𝜂 = 𝛼 + 𝛽.
4.3 子 空 间 107
设
𝛼 = 𝜆 1 𝛼 1 + 𝜆2 𝛼 2 + · · · + 𝜆𝑙 𝛼 𝑙
𝛽 = 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠
则
𝜂 = 𝜆1 𝛼1 + 𝜆2 𝛼2 + · · · + 𝜆𝑙 𝛼𝑙 + 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠 ∈ 𝑊3
所以 𝜂 = 𝛼 + 𝛽 ∈ 𝑊3 , 从而 𝑊1 + 𝑊2 ⊆ 𝑊3 .
另一方面, 对于任意 𝜂 ∈ 𝑊3 , 𝜂 可由 𝛼1 , · · · , 𝛼𝑙 , 𝛽1 , · · · , 𝛽𝑠 线性表出:
𝜂 = 𝜆1 𝛼1 + 𝜆2 𝛼2 + · · · + 𝜆𝑙 𝛼𝑙 + 𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠
记
𝜆1 𝛼 1 + 𝜆2 𝛼 2 + · · · + 𝜆𝑙 𝛼 𝑙 = 𝛼
𝜇1 𝛽1 + 𝜇2 𝛽2 + · · · + 𝜇𝑠 𝛽𝑠 = 𝛽
则有
𝜂 =𝛼+𝛽
其中 𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 . 所以 𝜂 ∈ 𝑊1 + 𝑊2 , 从而 𝑊3 ⊆ 𝑊1 + 𝑊2 .
设 𝑊1 , 𝑊2 , 𝑊3 是 𝑉 的子空间, 由子空间交与和的定义我们可以验证下述运
算规律.
(1)交换律:
𝑊1 ∩ 𝑊2 = 𝑊2 ∩ 𝑊1
𝑊1 + 𝑊 2 = 𝑊2 + 𝑊1
(2)结合律:
(𝑊1 ∩ 𝑊2 ) ∩ 𝑊3 = 𝑊1 ∩ (𝑊2 ∩ 𝑊3 )
(𝑊1 + 𝑊2 ) + 𝑊3 = 𝑊1 + (𝑊2 + 𝑊3 )
𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚
108 第4章 线性空间与线性变换
故
𝑊1 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 )
𝑊2 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 )
从而
𝑊1 + 𝑊2 = span(𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 )
考察
令
𝜂 = 𝑐1 𝛾1 + · · · + 𝑐𝑚 𝛾𝑚 + 𝑎1 𝛼1 + · · · + 𝑎𝑛1 −𝑚 𝛼𝑛1 −𝑚 (4.7)
从而
−𝜂 = 𝑏1 𝛽1 + · · · + 𝑏𝑛2 −𝑚 𝛽𝑛2 −𝑚 (4.8)
由 式(4.7)知 𝜂 ∈ 𝑊1 , 由 式(4.8)知 𝜂 ∈ 𝑊2 , 所 以 𝜂 ∈ 𝑊1 ∩ 𝑊2 , 从 而 𝜂 可 由
𝛾1 , 𝛾2 , · · · , 𝛾𝑚 线性表出:
𝜂 = 𝑘1 𝛾1 + 𝑘2 𝛾2 + · · · + 𝑘𝑚 𝛾𝑚
因此
𝑘1 𝛾1 + · · · + 𝑘𝑚 𝛾𝑚 + 𝑏1 𝛽1 + · · · + 𝑏𝑛2 −𝑚 𝛽𝑛2 −𝑚 = 0
由于 𝛾1 , · · · , 𝛾𝑚 , 𝛽1 , · · · , 𝛽𝑛2 −𝑚 线性无关, 故
𝑘1 = · · · = 𝑘𝑚 = 𝑏1 = · · · = 𝑏𝑛2 −𝑚 = 0
所以
𝑐1 𝛾1 + · · · + 𝑐𝑚 𝛾𝑚 + 𝑎1 𝛼1 + · · · + 𝑎𝑛1 −𝑚 𝛼𝑛1 −𝑚 = 0
又由 𝛾1 , · · · , 𝛾𝑚 , 𝛼1 , · · · , 𝛼𝑛1 −𝑚 线性无关, 故
𝑐1 = · · · = 𝑐𝑚 = 𝑎1 = · · · = 𝑎𝑛1 −𝑚 = 0
因此
𝑐1 = · · · = 𝑐𝑚 = 𝑎1 = · · · = 𝑎𝑛1 −𝑚 = 𝑏1 = · · · = 𝑏𝑛2 −𝑚 = 0
4.3 子 空 间 109
从而
例4.3.4 设
𝛼1 = [1, 2, 1, 0]T , 𝛼2 = [−1, , 1, 1, 1]T
由
𝑊1 + 𝑊2 = span(𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 )
知 𝑊1 + 𝑊2 的基是向量组 𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 的极大无关组.
将向量组 𝛼1 , 𝛼2 , 𝛽1 , 𝛽2 写成矩阵形式并作初等行变换
1 −1 2 1
2 1 −1 1
1 1 0 3
0 1 1 7
1 −1 2 1 1 0 3 8
𝑅2 −2𝑅1 1 4 𝑅 +𝑅
0 3 −5 −3 0 0 −8 −24
𝑅 −𝑅 𝑅2 −3𝑅4
−−3−−−1→ −
𝑅3 −2𝑅→
−− −−
0 2 −2 2 4 0 0 −4 −12
0 1 1 7 0 1 1 7
1 0 0 −1 1 0 0 −1
𝑅2 −2𝑅3
0 0 0 0 0 1 0 4
𝑅4 + 14 𝑅3 𝑅24
−−−−3−→ −−→
𝑅1 + 4 𝑅3 0 0 1 3 0 0 1 3
− 14 𝑅3
0 1 0 4 0 0 0 0
再由上面初等行变换的结果知
因此
3𝛽1 − 𝛽2 = 𝛼1 − 4𝛼2 = [5, −2, −3, −4]T
𝑊1 ∩ 𝑊2 = {0}, 𝑊1 + 𝑊2 = 𝑉
则称 𝑊2 是 𝑊1 关于线性空间 𝑉 的补
补空 间 .
同样, 也称 𝑊1 为 𝑊2 关于线性空间 𝑉 的补空间, 故 𝑊1 与 𝑊2 互为补空间.
取 𝑊2 = span(𝛼𝑠+1 , · · · , 𝛼𝑛 ), 则有 𝑊1 ∩ 𝑊2 = {0}, 𝑊1 + 𝑊2 = 𝑉 , 故 𝑊2 就是 𝑊1
的补空间.
例4.3.5 在线性空间 R3 中, 设 𝑊1 = {(𝑥, 0, 0)|𝑥 ∈ R}, 𝑊2 = {(0, 𝑦, 𝑧)|𝑦 ∈
R, 𝑧 ∈ R}, 因 𝑊1 ∩ 𝑊2 = {(0, 0, 0)}, 𝑊1 + 𝑊2 = R3 , 故 𝑊1 与 𝑊2 互为补空间.
4.4 内 积 空 间 111
4.4 内 积 空 间
4.4.1 内积
其中 𝛼, 𝛽, 𝛾 ∈ 𝑉, 𝑘 ∈ R, 则称二元运算 ⟨𝛼, 𝛽⟩ 为 𝛼 与 𝛽 的内
内积 . 引入内积后
的线性空间称为内
内积 空 间 .
例4.4.1 在线性空间 R𝑛 中, 对于向量
𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 𝑦 = [𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ]T
常用如下的内积定义:
⟨𝑥, 𝑦⟩ = 𝑥1 𝑦1 + 𝑥2 𝑦2 + · · · + 𝑥𝑛 𝑦𝑛
下面验证其满足定义中的四个条件:
(1) Z 𝑏 Z 𝑏
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝑔(𝑥)𝑓 (𝑥)d𝑥 = ⟨𝑔, 𝑓 ⟩
𝑎 𝑎
(2) Z 𝑏 Z 𝑏
⟨𝜆𝑓, 𝑔⟩ = 𝜆𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝜆 𝑓 (𝑥)𝑔(𝑥)d𝑥 = 𝜆 ⟨𝑓, 𝑔⟩
𝑎 𝑎
112 第4章 线性空间与线性变换
(3)
Z 𝑏
⟨𝑓 + 𝑔, ℎ⟩ = [𝑓 (𝑥) + 𝑔(𝑥)]ℎ(𝑥)d𝑥
𝑎
Z 𝑏 Z 𝑏
= 𝑓 (𝑥)ℎ(𝑥)d𝑥 + 𝑔(𝑥)ℎ(𝑥)d𝑥
𝑎 𝑎
= ⟨𝑓, ℎ⟩ + ⟨𝑔, ℎ⟩
(4) 当 𝑓 (𝑥) ̸≡ 0 时, 有
Z 𝑏
⟨𝑓, 𝑓 ⟩ = 𝑓 2 (𝑥)d𝑥 > 0
𝑎
证明
* 𝑛 𝑚
+ 𝑛
* 𝑚
+
X X X X
𝑘 𝑖 𝛼𝑖 , 𝑙𝑗 𝛽𝑗 = 𝑘 𝑖 𝛼𝑖 , 𝑙𝑗 𝛽𝑗
𝑖=1 𝑗=1 𝑖=1 𝑗=1
𝑛
* 𝑚
+
X X
= 𝑘𝑖 𝑙𝑗 𝛽𝑗 , 𝛼𝑖
𝑖=1 𝑗=1
X𝑛 X 𝑚
= 𝑘𝑖 𝑙𝑗 ⟨𝛽𝑗 , 𝛼𝑖 ⟩
𝑖=1 𝑗=1
X𝑛 X 𝑚
= 𝑘𝑖 𝑙𝑗 ⟨𝛼𝑖 , 𝛽𝑗 ⟩
𝑖=1 𝑗=1
从而
2
⟨𝛼, 𝛽⟩ 6 ⟨𝛼, 𝛼⟩ ⟨𝛽, 𝛽⟩
例4.4.4 因为 Z 𝑏
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)d𝑥
𝑎
Z 𝑏 2 Z 𝑏 Z 𝑏
𝑓 (𝑥)𝑔(𝑥)d𝑥 6 𝑓 2 (𝑥)d𝑥 𝑔 2 (𝑥)d𝑥
𝑎 𝑎 𝑎
或者范
范数 , 记为 ‖ 𝛼 ‖.
在此定义下, ‖ 𝛼 ‖= 0 当且仅当 𝛼 为零向量.
例4.4.5 设 𝑥 ∈ R𝑛 , 有
Ì
È 𝑛
X
‖ 𝑥 ‖= ⟨𝑥, 𝑥⟩ = 𝑥2𝑖
𝑖=1
定义 4.4.3 模为 1 的向量称为单 单位 向 量 .
𝛼
若 𝛼 ̸= 0, 则 为单位向量, 这是因为
‖𝛼‖
° º
𝛼 𝛼 ⟨𝛼, 𝛼⟩
, = =1
‖𝛼‖ ‖𝛼‖ ‖ 𝛼 ‖2
上述这种除以模的操作称为向量的单
单位 化(或标
标准 化 ).
定 义4.4.4 设 𝑉 是一个内积空间, 𝛼, 𝛽 ∈ 𝑉 , 如果 ⟨𝛼, 𝛽⟩ = 0, 则称 𝛼 与 𝛽 正
交 , 记为 𝛼 ⊥ 𝛽.
114 第4章 线性空间与线性变换
所以 𝑓 (𝑥) ⊥ 𝑔(𝑥).
定 义 4.4.5 在内积空间 𝑉 中, 两两正交的一组非零向量称为正
正交 向 量 组, 两
两正交的一组单位向量称为标
标准 正 交 向 量 组 .
定 理 4.4.1 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 (𝑙 6 𝑛) 是 𝑛 维内积空间 𝑉 中的一个正交向量
组, 则 𝛼1 , 𝛼2 , · · · , 𝛼𝑙 线性无关.
证明 考察
𝑘1 𝛼1 + 𝑘2 𝛼2 + · · · + 𝑘𝑙 𝛼𝑙 = 0
用 𝛼𝑗 对上式等号两边作内积, 得
因为
0, 𝑖 ̸= 𝑗
⟨𝛼𝑖 , 𝛼𝑗 ⟩ = (𝑖, 𝑗 = 1, 2, · · · , 𝑙)
‖ 𝛼 ‖2 , 𝑖=𝑗
𝑖
故
𝑘 𝑗 ‖ 𝛼𝑗 ‖ 2 = 0 (𝑗 = 1, 2, · · · , 𝑙)
(
0, 𝑖 ̸= 𝑗
⟨𝜀𝑖 , 𝜀𝑗 ⟩ = (𝑖, 𝑗 = 1, 2, · · · , 𝑛)
1, 𝑖 = 𝑗
1 1 T
− 1 1 T
例4.4.9 证明向量组 𝛼1 = [1, 0, 0] , 𝛼2 = 0, √ , √ T
, 𝛼3 = 0, √ , √
2 2 2 2
是 Euclid 空间 R3 的一个标准正交基.
4.4 内 积 空 间 115
解 由于
⟨𝛼1 , 𝛼2 ⟩ = ⟨𝛼2 , 𝛼3 ⟩ = ⟨𝛼3 , 𝛼1 ⟩ = 0
且
‖ 𝛼1 ‖=‖ 𝛼2 ‖=‖ 𝛼3 ‖= 1
因此 𝛼1 , 𝛼2 , 𝛼3 是 R3 的一个标准正交基.
定 理 4.4.2 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是 𝑛 维内积空间 𝑉 的一个标准正交基, 𝛼 ∈
𝑉, 𝛽 ∈ 𝑉 , 𝛼 与 𝛽 在该标准正交基下的坐标向量分别为 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T 和
𝑦 = [𝑦1 , 𝑦2 , · · · , 𝑦𝑛 ]T , 则 𝛼 与 𝛽 的内积 ⟨𝛼, 𝛽⟩ = 𝑥T 𝑦.
证明 由题意
𝛼 = 𝑥1 𝜀1 + 𝑥2 𝜀2 + · · · + 𝑥𝑛 𝜀𝑛
𝛽 = 𝑦1 𝜀1 + 𝑦2 𝜀2 + · · · + 𝑦𝑛 𝜀𝑛
因此
* 𝑛 𝑛
+
X X
⟨𝛼, 𝛽⟩ = 𝑥𝑖 𝜀𝑖 , 𝑦 𝑗 𝜀𝑗
𝑖=1 𝑗=1
𝑛 X
X 𝑛
= 𝑥𝑖 𝑦𝑗 ⟨𝜀𝑖 , 𝜀𝑗 ⟩
𝑖=1 𝑗=1
X𝑛
= 𝑥 𝑖 𝑦𝑖 = 𝑥 T 𝑦
𝑖=1
4.4.2 正交投影与最小二乘解
本节讨论 𝑛 维 Euclid 空间 R𝑛 中的正交投影. 给定向量 𝛽 和 Rn 中子空间 𝑊 ,
存在属于 𝑊 的唯一向量 𝛽,
b 使得 𝛽 − 𝛽
b 与 𝑊 正交, 如图 4.1 所示, 称 𝛽
b 为 𝛽 在子
空间 𝑊 中的正
正交投 影. 𝛽b 是 𝑊 中最接近 𝛽 的向量.
图 4.1
116 第4章 线性空间与线性变换
例4.4.10 设 𝛼, 𝛽 ∈ R𝑛 , 求 𝛽 在 𝛼 上的正交投影.
𝛼 𝛼T
解 将向量 𝛼 单位化 , 从而 𝛽 在 𝛼 上的正交投影长度为 𝛽. 因此
‖𝛼‖ ‖𝛼‖
𝛽 在 𝛼 上的正交投影向量为
𝛼 𝛼T 𝛼𝛼T
𝛽= 𝛽 (4.9)
‖ 𝛼 ‖‖ 𝛼 ‖ 𝛼T 𝛼
𝛼T
𝑖 (𝛽 − 𝐴𝑥) = 0 (𝑖 = 1, 2, · · · , 𝑙)
因此
𝐴T (𝛽 − 𝐴𝑥) = 0
𝐴T 𝐴𝑥 = 𝐴T 𝛽 (4.10)
𝑙
X
𝐴𝑥 = 𝐴𝐴T 𝛽 = 𝛼 𝑖 𝛼T
𝑖 𝛽
𝑖=1
4.4 内 积 空 间 117
解 记线性方程组为 𝐴𝑥 = 𝑏, 其中
1 1.2 1.6
𝐴=
1 1.4 ,
𝑏=
1.7
1 1.8 2
" #
T −1
1 6.64 −4.4
(𝐴 𝐴) =
0.56 −4.4 3
解得最小二乘解
" # " #
T −1 T
1 0.432 0.77
^ = (𝐴 𝐴)
𝑥 𝐴 𝑏= ≈
0.56 0.38 0.68
𝛼2 − 𝑞1 𝑞1T 𝛼2
𝑞2 =
‖ 𝛼2 − 𝑞1 𝑞1T 𝛼2 ‖
由此得到的向量组 𝑞1 , 𝑞2 , · · · , 𝑞𝑛 即为所求的标准正交基.
例4.4.13 设 Euclid 空间 R4 中的向量
1 0 −2
0 1 1
𝛼1 =
, 𝛼2 =
, 𝛼3 =
1 2 0
0 1 1
解 (1)由
1 0 −2 1 0 −2 1 0 −2
𝑅3 −2𝑅2
0 1 1 0 1 1 0 1 1
𝑅3 −𝑅1 𝑅4 −𝑅2
[𝛼1 , 𝛼2 , 𝛼3 ] = −−−−→ −−−−−→
1 2 0 0 2 2 0 0 0
0 1 1 0 1 1 0 0 0
下面将 𝛼1 , 𝛼2 Schmidt正交化,
4.4 内 积 空 间 119
1
𝛼1 1 0
𝑞1 = =√
‖ 𝛼1 ‖ 2
1
0 1 −1
𝛼2 − 𝑞1 𝑞1T 𝛼2 1 1 0 1
= 1
𝑞2 = = −
T
‖ 𝛼2 − 𝑞 1 𝑞 1 𝛼2 ‖ 2
2 1
2
1
1 0 1
求此齐次线性方程组的基础解系, 得
0 −1
−1 −2
𝛼4 =
, 𝛼5 =
0 1
1 0
将 𝛼4 , 𝛼5 Schmidt 正交化, 即令
0
𝛼4
1 −1
𝑞3 = =√
‖ 𝛼4 ‖ 2
0
−1 0 −1
𝛼5 − 𝑞3 𝑞3T 𝛼5 1 −2 −1 1
= −1
𝑞4 = = −
‖ 𝛼5 − 𝑞3 𝑞3T 𝛼5 ‖ 2 1 0
2
1
0 1 −1
所得向量组 𝑞1 , 𝑞2 , 𝑞3 , 𝑞4 就是 R4 的一组标准正交基.
120 第4章 线性空间与线性变换
4.4.4 正交补空间
前面已经给出了向量与向量正交的定义, 这里给出向量与空间正交、空间与
空间正交的定义.
定 义4.4.7 设 𝛼 是内积空间 𝑉 中的向量, 𝑊 是 𝑉 的子空间, 如果对于 𝑊
中任一个向量 𝛽, 都有𝛼⊥𝛽, 即⟨𝛼, 𝛽⟩ = 0, 则称向量 𝛼 与子空间 𝑊 正交, 记作
𝛼 ⊥ 𝑊.
定 义 4.4.8 设 𝑊1 , 𝑊2 是内积空间 𝑉 的两个子空间, 如果对于任意的向量
𝛼 ∈ 𝑊1 , 𝛽 ∈ 𝑊2 , 都有 𝛼⊥𝛽, 即 ⟨𝛼, 𝛽⟩ = 0, 则称 𝑊1 与 𝑊2 正交, 记作 𝑊1 ⊥ 𝑊2 .
定理 4.4.3 若 𝑊1 ⊥ 𝑊2 , 则 𝑊1 ∩ 𝑊2 = {0}.
证明 对于任意 𝛼 ∈ 𝑊1 ∩ 𝑊2 , 有 𝛼 ∈ 𝑊1 , 𝛼 ∈ 𝑊2 .
由 𝑊1 ⊥ 𝑊2 , 得 ⟨𝛼, 𝛼⟩ = 0, 从而 𝛼 = 0.
定 义 4.4.9 设 𝑊1 , 𝑊2 是 内 积 空 间 𝑉 的 两 个 子 空 间, 如 果 𝑊1 ⊥ 𝑊2 , 且
𝑊1 + 𝑊2 = 𝑉 , 则称 𝑊2 是 𝑊1 的正 正交 补 , 记作 𝑊2 = 𝑊1⊥ .
正交补 空 间, 简称正
知 矩 阵 𝐴 的 每 个 行 向 量 与 其 零 空 间 N(𝐴) 中 的 每 个 向 量 正 交, 记 C(𝐴T ) =
span(row(𝐴, 1), · · · , row(𝐴, 𝑚)), 则 N(𝐴) ⊆ R𝑛 , C(𝐴T ) ⊆ R𝑛 , 且 C(𝐴T )⊥N(𝐴),
所以 N(𝐴) ∩ C(𝐴T ) = {0}, dim N(𝐴) ∩ C(𝐴T ) = 0.
由上面的结论可以直接得到下面的推论.
推论 4.4.1 C(𝐴) 是 N(𝐴T ) 的正交补空间, 即 C(𝐴)⊥ = N(𝐴T ).
例4.4.15 设 𝛼1 , 𝛼2 , 𝛼3 和 𝛼 是 Euclid 空间 R5 中的向量,
4.4 内 积 空 间 121
1 1 2 3
1 0 1 −7
𝛼1 = 1 , 𝛼2 = 0 , 𝛼3 = −1 , 𝛼= 2
2 1 0 1
1 −2 2 8
由此得到齐次线性方程组
𝑥1 + 𝑥2 + 𝑥3 + 2𝑥4 + 𝑥5 = 0
𝑥 + 𝑥 − 2𝑥 = 0
1 4 5
2𝑥 + 𝑥 − 𝑥 + 2𝑥 = 0
1 2 3 5
求出该齐次线性方程组的一个基础解系为
则 𝛼4 , 𝛼5 构成 N(𝐴T ) 的一个基, 从而
C(𝐴)⊥ = span(𝛼4 , 𝛼5 )
1 1
𝛼 = 𝛼1 − 2𝛼2 + 𝛼3 − 𝛼4 + 𝛼5
2 2
其中
1 1
𝛼1 − 2𝛼2 + 𝛼3 ∈ C(𝐴), − 𝛼4 + 𝛼5 ∈ C(𝐴)⊥
2 2
故求得 𝛼 在 C(𝐴) 中的正交投影为
1 3 1 T
𝛼1 − 2𝛼2 + 𝛼3 = 0, , , 0, 6
2 2 2
122 第4章 线性空间与线性变换
4.5 线 性 变 换
4.5.1 线性映射与线性变换
定义 4.5.1 设 𝑇 是数域 F 上的线性空间 𝑉 到线性空间 𝑊 的映射, 对于 𝑉 中
任意两个向量 𝛼, 𝛽, 如果满足下列条件:
(1) 𝑇 ( 𝛼 + 𝛽 )= 𝑇 ( 𝛼 )+ 𝑇 ( 𝛽 );
(2) 𝑇 (𝑘𝛼) = 𝑘𝑇 (𝛼) (𝑘 ∈ F),
则称 𝑇 为线
线性 映射 , 称 𝑇 (𝛼) 为 𝛼 在线性映射 𝑇 下的像
像.
特别地, 从线性空间 𝑉 到其自身的线性映射 𝑇 称为线性空间 𝑉 的一个线
线性
变 换 , 即对于任意 𝛼 ∈ 𝑉 , 有 𝑇 (𝛼) ∈ 𝑉 .
设 𝛼1 , 𝛼2 , · · · , 𝛼𝑚 是 𝑉 中的向量, 在映射 𝑇 下的像分别为 𝑇 (𝛼1 ), 𝑇 (𝛼2 ), · · · ,
𝑇 (𝛼𝑚 ), 为方便起见, 通常记 𝑇 (𝛼1 , 𝛼2 , · · · , 𝛼𝑚 ) , [𝑇 (𝛼1 ), 𝑇 (𝛼2 ), · · · , 𝑇 (𝛼𝑚 )] .
性质 4.5.1 设 𝑇 是线性空间 𝑉 中的线性变换, 则 𝑇 (0) = 0.
证明 因为 𝑇 (𝑘𝛼) = 𝑘𝑇 (𝛼), 取 𝑘 = 0 时, 即得
𝑇 (0) = 𝑇 (0 · 𝛼) = 0 · 𝑇 (𝛼) = 0
证明
𝑇 (𝜀𝑖 ) = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)
4.5 线 性 变 换 123
𝑛
X
证明 设 𝜉 是 𝑉 中任一向量, 则有 𝜉 = 𝑥𝑖 𝜀𝑖 . 在 𝑉 中定义一个变换 𝑇 , 使
𝑖=1
得
𝑛
X
𝑇 (𝜉) = 𝑥𝑖 𝛼𝑖
𝑖=1
显然
𝜀𝑖 = 0 · 𝜀1 + · · · + 0 · 𝜀𝑖−1 + 1 · 𝜀𝑖 + 0 · 𝜀𝑖+1 + · · · + 0 · 𝜀𝑛
因此
𝑇 (𝜀𝑖 ) = 1 · 𝛼𝑖 = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)
下面先证明此变换是线性变换.
在 𝑉 中任取两个向量
𝑛
X 𝑛
X
𝛼= 𝑎𝑖 𝜀𝑖 , 𝛽= 𝑏𝑖 𝜀𝑖
𝑖=1 𝑖=1
故
𝑛
X 𝑛
X
𝛼+𝛽 = (𝑎𝑖 + 𝑏𝑖 )𝜀𝑖 , 𝑘𝛼 = 𝑘𝑎𝑖 𝜀𝑖
𝑖=1 𝑖=1
由 𝑇 的定义有
𝑛
X 𝑛
X 𝑛
X
𝑇 (𝛼 + 𝛽) = (𝑎𝑖 + 𝑏𝑖 )𝛼𝑖 = 𝑎𝑖 𝛼𝑖 + 𝑏𝑖 𝛼𝑖 = 𝑇 (𝛼) + 𝑇 (𝛽)
𝑖=1 𝑖=1 𝑖=1
𝑛
X
𝑇 (𝑘𝛼) = 𝑘𝑎𝑖 𝛼𝑖 = 𝑘𝑇 (𝛼)
𝑖=1
故必有𝑇 = 𝑇1 .
124 第4章 线性空间与线性变换
4.5.2 线性变换的表示矩阵
下面我们引入线性变换表示矩阵的定义.
定 义4.5.2 设 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 是线性空间 𝑉 的一组基, 𝑇 是线性空间 𝑉 的一
个线性变换, 基的像可以表示为
其中矩阵
𝛼11 𝛼12 · · · 𝛼1𝑛
𝛼21
𝛼22 · · · 𝛼2𝑛
. .. ..
..
. .
𝛼𝑛1 𝛼𝑛2 · · · 𝛼𝑛𝑛
称为线性变换 𝑇 在基 𝜀1 , 𝜀2 , · · · , 𝜀𝑛 下的表
表示 矩 阵 .
定理 4.5.2 在给定基下, 线性变换与其表示矩阵是一一对应的.
[𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ]
𝑇 (𝜀𝑖 ) = 𝛼𝑖 (𝑖 = 1, 2, · · · , 𝑛)
4.5 线 性 变 换 125
即有唯一的线性变换 𝑇 , 使
图 4.2
从而旋转变换的表示矩阵
" #
cos 𝜃 − sin 𝜃
𝐴=
sin 𝜃 cos 𝜃
如果
1 1 2
𝑇 (𝜀1 ) =
1 ,
𝑇 (𝜀2 ) =
1 ,
𝑇 (𝜀3 ) =
1
1 −1 2
求线性变换 𝑇 在基 𝜀1 , 𝜀2 , 𝜀3 下的表示矩阵.
解 设所求变换矩阵为 𝐴,
即
1 1 2 2 0 1
= 3 1 0 𝐴
1 1
1
1 −1 2 5 2 0
由此解得
1 3 0
−2 −8 1
𝐴=
−1 −5 2
𝜉 = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑥
因为 𝑇 是线性变换
证明 由题设
𝑇 (𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ) = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝐴
𝑇 (𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ) = [𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ]𝐵
[𝜂1 , 𝜂2 , · · · , 𝜂𝑛 ] = [𝜀1 , 𝜀2 , · · · , 𝜀𝑛 ]𝑀
因为 𝑇 是线性变换
由此得到 𝐵 = 𝑀 −1 𝐴𝑀 .
定 义 4.5.3 对 于 𝑛 阶 矩 阵 𝐴 和 𝐵, 若 存 在 一 个 𝑛 阶 可 逆 矩 阵 𝑃 , 使 得
−1
𝑃 𝐴𝑃 = 𝐵, 则称矩阵 𝐴 与 𝐵 相似 , 记作 𝐴 ∼ 𝐵.
注 前面的定理表明, 同一线性变换在不同基下的表示矩阵相似; 两个相似
的方阵可以看作是同一线性变换在不同基下的表示矩阵.
4.5.3 正交变换
定 义4.5.4 设 𝑇 是 Euclid 空间 𝑉 中的一个线性变换, 如果 𝑇 在标准正交基
下的表示矩阵是正交矩阵, 则称 𝑇 是正
正交 变 换 .
定理 4.5.5 正交变换保持向量的内积不变.
证明 设线性变换 𝑇 在某标准正交基下的表示矩阵是 𝑄, 则 𝑄𝑄T = 𝐼.
向量 𝛼 与 𝛽 在该标准正交基下的坐标向量是 𝑥 与 𝑦, 内积是 𝑥T 𝑦. 向量
𝛼 与 𝛽 经正交变换后在该标准正交基下的坐标向量是 𝑄T 𝑥 与 𝑄T 𝑦, 内积是
(𝑄T 𝑥)T (𝑄T 𝑦).
因为 (𝑄T 𝑥)T (𝑄T 𝑦) = 𝑥T 𝑄𝑄T 𝑦 = 𝑥T 𝐼𝑦 = 𝑥T 𝑦, 故正交变换保持向量的内
积不变.
注 正 交 变 换 保 持 向 量 的 内 积 不 变, 因 而 它 保 持 向 量 的 模 长 不 变, 即
‖𝑇 (𝛼)‖ = ‖𝛼‖, 且若 𝛼 ⊥ 𝛽, 则 𝑇 (𝛼) ⊥ 𝑇 (𝛽).
例4.5.3 二维 Euclid 空间 R2 中的旋转变换 𝑇𝜃 将平面绕坐标原点按逆时针
方向旋转 𝜃 角, 它在标准正交基 𝑒1 = [1, 0]T , 𝑒2 = [0, 1]T 下的表示矩阵为正交矩阵
" #
cos 𝜃 − sin 𝜃
𝐴=
sin 𝜃 cos 𝜃
因此旋转变换 𝑇𝜃 是正交变换.
128 第4章 线性空间与线性变换
因此反射变换也是正交变换.
例4.5.5 5 设 𝑢 为 𝑛 元单位列向量, 𝐼𝑛 是 𝑛 阶单位阵, 则 𝑀 = 𝐼𝑛 − 2𝑢𝑢T 是
正交阵. 设 𝑥 是 𝑛 元列向量, 线性变换 𝑀 𝑥 称为镜像变换.
4.6 习 题
𝑓1 = 1, 𝑓2 = 𝑥 − 1, 𝑓3 = (𝑥 − 1)2
(1) 求旧基到新基的过渡矩阵;
6. 设 𝜀1 , 𝜀2 , 𝜀3 是线性空间 𝑉 的一组基, 且
𝜉1 = 𝜀1 + 𝜀3
𝜉2 = 𝜀2
𝜉3 = 𝜀1 + 2𝜀2 + 2𝜀3
𝜂1 = 𝜀1
𝜂2 = 𝜀1 + 𝜀2
𝜂3 = 𝜀1 + 𝜀2 + 𝜀3
(1) 试证 𝜉1 , 𝜉2 , 𝜉3 及 𝜂1 , 𝜂2 , 𝜂3 都是 𝑉 的一组基.
(2) 求由基 𝜉1 , 𝜉2 , 𝜉3 到基 𝜂1 , 𝜂2 , 𝜂3 的过渡矩阵.
7. 在线性空间 R2×2 中, 已知
1 0 0 1 0 0 0 0
𝛼1 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 0 1
求: (1) 基 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 ;
(2) 矩阵
0 1
2 −3
在基 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 下的坐标.
8.已知实数域 R 上的所有 2 阶矩阵, 对于矩阵的加法与数乘, 构成 R 上的四维线性空间, 记
作 𝑉 = R2×2 .
(1) 分别证明
1 0 1 1 1 1 1 1
𝛼2 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 1 1
−1 1 1 −1 1 1 1 1
𝛽1 = , 𝛽2 = , 𝛽3 = , 𝛽4 =
1 1 1 1 −1 1 1 −1
130 第4章 线性空间与线性变换
均为 R2×2 的基;
(2) 对于 R2×2 中的任意元素 𝛼, 求 𝛼 在基 𝛼1 ,𝛼2 , 𝛼3 ,𝛼4 下的坐标;
(3) 求由基 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 到 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 的过渡矩阵.
9. 求下列两个齐次线性方程组的解空间的基和维数:
(1) 𝑥1 + 𝑥2 + · · · + 𝑥𝑛 = 0;
(2)
2𝑥1 − 4𝑥2 + 5𝑥3 + 3𝑥4 = 0
3𝑥1 − 6𝑥2 + 4𝑥3 + 2𝑥4 = 0
4𝑥1 − 8𝑥2 + 17𝑥3 + 11𝑥4 = 0
求 𝐴 的零空间 N(𝐴)的一组基.
15. 令 𝐴 和 𝐵 为 𝑛 × 𝑛 矩阵.
(1) 证明: 当且仅当 𝐵 的列空间是 𝐴 的零空间的子空间时, 有 𝐴𝐵 = 𝑂;
(2) 证明: 若 𝐴𝐵 = 𝑂, 则 𝐴 和 𝐵 的秩的和不会超过 𝑛.
16. 已知向量组 𝛼1 = [2, 0, 1, 3, −1]T , 𝛼2 = [0, −2, 1, 5, −3]T , 𝛽1 = [1, 1, 0, −1, 1]T , 𝛽2 =
[1, −3, 2, 0, 5]T , 且 𝑊1 = span(𝛼1 , 𝛼2 ), 𝑊2 = span(𝛽1 , 𝛽2 ), 试求 𝑊1 ∩ 𝑊2 与 𝑊1 + 𝑊2 的维数
及各自的一组基.
17. 设 𝑉 是内积空间. 试证明:
(1) 对 ∀𝛼 ∈ 𝑉 , 都有 ⟨0, 𝛼⟩ = 0;
(2) 若对 ∀𝛼 ∈ 𝑉 , 恒有 ⟨𝛼, 𝛽⟩ = 0, 则 𝛽 = 0;
(3) 已知 𝛼, 𝛽 ∈ 𝑉 , 如对 ∀ 𝛾 ∈ 𝑉 , 都有 ⟨𝛼, 𝛾⟩ = ⟨𝛽, 𝛾⟩. 试证明 𝛼 = 𝛽.
18. 设 𝛼 = [𝑎1 , 𝑎2 , 𝑎3 ]T ∈ R3 , 𝛽 = [𝑏1 , 𝑏2 , 𝑏3 ]T ∈ R3 , 定义内积 ⟨𝛼, 𝛽⟩ = 𝛼T 𝐴𝛽. 当 𝐴 取以
4.6 习 题 131
1 0 0
𝐴1 = 0 2 0
0 0 1
1 −1 1
𝐴2 = −1 1 0
1 0 0
1 −1 3
𝐴3 = −1 2 0
1 0 3
⟨𝛼, 𝛽⟩ = 𝑎1 𝑏1 − 𝑎2 𝑏1 − 𝑎1 𝑏2 + 3𝑎2 𝑏2
试验证这是 R2 的一个内积.
20. 设 𝛼1 , 𝛼2 , · · · , 𝛼𝑛 是内积空间的 𝑛 个向量, 行列式
⟨𝛼 , 𝛼 ⟩ ⟨𝛼 , 𝛼 ⟩ · · · ⟨𝛼 , 𝛼 ⟩
1 1 1 2 1 𝑛
⟨𝛼2 , 𝛼1 ⟩ ⟨𝛼2 , 𝛼2 ⟩ · · · ⟨𝛼2 , 𝛼𝑛 ⟩
𝐺(𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ) =
.. .. ..
. . .
⟨𝛼𝑛 , 𝛼1 ⟩ ⟨𝛼𝑛 , 𝛼2 ⟩ · · · ⟨𝛼𝑛 , 𝛼𝑛 ⟩
Z 1
⟨𝑓, 𝑔⟩ = 𝑓 (𝑥)𝑔(𝑥)dx
0
𝑥1 + 𝑥2 = 1
2𝑥1 − 𝑥2 = 2
−2𝑥1 + 4𝑥2 = 7
26. 设
1 2 −1 −1
2 0 1 1
𝐴= , 𝑏=
2 −4 2 1
4 0 0 −2
1 −2 −4
1 0 −3
𝐴= , 𝑏=
1 1 3
1 3 0
28. 设齐次线性方程组
¨
2𝑥1 + 𝑥2 − 𝑥3 + 𝑥4 − 3𝑥5 = 0
𝑥1 + 𝑥2 − 𝑥3 + 𝑥5 = 0
(1) 求解空间的标准正交基;
(2) 求解空间的正交补空间的标准正交基.
29. 设 𝛼1 , 𝛼2 和 𝛼 是 Euclid 空间 R3 中的向量,
1 1 3
𝛼1 = 1 , 𝛼2 = 0 , 𝛼= 2
2 1 1
31.已知在 R3 中, 线性变换 𝑇 在基
8 −16 9
𝜀1 = −6 , 𝜀2 = 7 , 𝜀3 = −3
7 −13 7
下的表示矩阵
1 −18 15
𝐴 = −1 −22 20
1 −25 22
求 𝑇 在基
1 3 2
𝜂1 = −2 , 𝜂2 = −1 , 𝜂3 = 1
1 2 2
下的表示矩阵.
(𝑥 − 𝑎)2 (𝑥 − 𝑎)𝑛
32. 在 𝑃𝑛 [𝑥] 中, 取基为 𝜀0 = 1, 𝜀1 = (𝑥 − 𝑎), 𝜀2 =
, · · · , 𝜀𝑛 = (其中 𝑎 为
2! 𝑛!
′
实数), 求线性变换𝐷(𝑓 (𝑥)) = 𝑓 (𝑥) 在此基下的表示矩阵.
33. 给定 R3 的两组基 𝜀1 = [1, 0, 1]T , 𝜀2 = [2, 1, 0]T , 𝜀3 = [1, 1, 1]T 和 𝜂1 = [1, 2, −1]T ,
𝜂2 = [2, 2, −1]T , 𝜂3 = [2, −1, −1]T , 定义线性变换: 𝑇 (𝜀𝑖 ) = 𝜂𝑖 , 𝑖 =1,2,3, 分别求 𝑇 在基 𝜀1 , 𝜀2 ,
𝜀3 与 𝜂1 , 𝜂2 , 𝜂3 下的表示矩阵.
34. 在实数域上所有 2 阶矩阵所构成的线性空间 R2×2 中, 定义变换 𝑇 (𝛼) = 𝛾𝛼 − 𝛼𝛾, 其
中 𝛼 为 R2×2 中任意一个元素(矩阵), 𝛾 为 R2×2 中一个固定的元素(矩阵).
(1) 证明: 𝑇 是 R2×2 上的一个线性变换;
(2) 对于 R2×2 的一组基
1 0 0 1 0 0 0 0
𝛼1 = , 𝛼2 = , 𝛼3 = , 𝛼4 =
0 0 0 0 1 0 0 1
求 𝑇 在这组基下的表示矩阵.
第5章 特征值与二次型
5.1 特征值与特征向量
5.1.1 特征值与特征向量的概念
5.1.2 特征值与特征向量的求法
另一方面
|𝜆𝐼 − 𝐴| = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) · · · (𝜆 − 𝜆𝑛 )
= 𝜆𝑛 − (𝜆1 + 𝜆2 + · · · + 𝜆𝑛 )𝜆𝑛−1 + · · · + (−1)𝑛 𝜆1 𝜆2 · · · 𝜆𝑛
因此 𝜆1 + 𝜆2 + · · · + 𝜆𝑛 = tr(A), 𝜆1 𝜆2 · · · 𝜆n = det(A).
136 第5章 特征值与二次型
例5.1.1 求矩阵
−1 1 0
𝐴=
−4 3 0
1 0 2
的特征值和特征向量.
解 由特征多项式
𝜆+1
−1 0
|𝜆𝐼 − 𝐴| = 4 𝜆−3 0
−1 0 𝜆−2
= (𝜆 − 2)(𝜆 − 1)2
得 𝐴 的特征值是 𝜆1 = 𝜆2 = 1, 𝜆3 = 2.
将 𝜆1 = 𝜆2 = 1 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
2 −1 0 𝑥1
−2 𝑥2 = 0
4 0
−1 0 −1 𝑥3
其基础解系是
1
2
−1
因此属于特征值 1 的全部特征向量为
1
𝑘1
2 ,
𝑘1 ̸= 0
−1
将 𝜆3 = 2 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
3 −1 0 𝑥1
𝑥2 = 0
−1 0
4
−1 0 0 𝑥3
5.1 特征值与特征向量 137
其基础解系是
0
0
1
因此属于特征值 2 的全部特征向量为
0
0 ,
𝑘2 𝑘2 ̸= 0
1
例5.1.2 求矩阵
1 2 2
𝐴=
2 1 2
2 2 1
的特征值和相应特征子空间的基.
解 由特征多项式
𝜆−1 −2 −2
−2 = (𝜆 + 1)2 (𝜆 − 5)
|𝜆𝐼 − 𝐴| = −2 𝜆−1
−2 −2 𝜆−1
得 𝐴 的特征值是 𝜆1 = 𝜆2 = −1, 𝜆3 = 5.
−1 −1
𝑥1 , 𝑥2 即为特征值 −1 对应的特征子空间的基.
1
𝑥3 =
1
1
138 第5章 特征值与二次型
𝑥3 即为特征值 5 对应的特征子空间的基.
定理 5.1.3 相似矩阵有相同的特征多项式.
将 𝜉1 , · · · , 𝜉𝑡 扩充为 R𝑛 的一组基 𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 , 有
𝜆0 𝐼 𝑡 *
𝐴[𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 ] = [𝜉1 , · · · , 𝜉𝑡 , · · · , 𝜉𝑛 ]
𝑂 𝐵
可知方阵 𝐴 与
5.1 特征值与特征向量 139
𝜆 𝐼 *
0 𝑡
𝑂 𝐵
1 0 2
2 2 1
5.1.3 特征向量的线性无关性
定理 5.1.5 属于不同特征值的特征向量是线性无关的.
证明 设 𝜆1 , 𝜆2 , · · · , 𝜆𝑘 是矩阵 𝐴 的 𝑘 个互不相同的特征值, 𝑥1 , 𝑥2 , · · · , 𝑥𝑘
是分别属于它们的特征向量.
现对特征值的个数作数学归纳法.
先证当 𝑘 = 2 时命题成立, 即证属于不同特征值的两个特征向量线性无关.
𝐴𝑥1 = 𝜆1 𝑥1 , 𝑥1 ̸= 0; 𝐴𝑥2 = 𝜆2 𝑥2 , 𝑥2 ̸= 0
考察等式
𝑐1 𝑥1 + 𝑐2 𝑥2 = 0 (5.1)
等式(5.1)两端乘以 𝜆2 , 得
𝑐1 𝜆2 𝑥1 + 𝑐2 𝜆2 𝑥2 = 0 (5.2)
140 第5章 特征值与二次型
等式(5.1)两端左乘矩阵 𝐴, 得
考察等式
𝑐1 𝑥1 + 𝑐2 𝑥2 + · · · + 𝑐𝑘−1 𝑥𝑘−1 + 𝑐𝑘 𝑥𝑘 = 0 (5.4)
等式(5.4)两端乘以 𝜆𝑘 , 得
由 归 纳 假 设 𝑥1 , 𝑥2 , · · · , 𝑥𝑘−1 是 线 性 无 关 的, 故 𝑐𝑖 (𝜆𝑘 − 𝜆𝑖 ) = 0 (𝑖 =
1, 2, · · · , 𝑘 − 1), 但由于 𝜆𝑘 − 𝜆𝑖 ̸= 0, 因此 𝑐𝑖 = 0 (𝑖 = 1, 2, · · · , 𝑘 − 1), 从而
等式(5.4)变成 𝑐𝑘 𝑥𝑘 = 0, 又 𝑥𝑘 ̸= 0, 故只能 𝑐𝑘 = 0, 这就证明了 𝑥1 , 𝑥2 , · · · , 𝑥𝑘 是
线性无关的.
定理 5.1.5 还可以进一步推广为如下定理.
定 理 5.1.6 如果 𝜆1 , 𝜆2 , · · · , 𝜆𝑘 是矩阵 𝐴 的不同特征值, 𝑥𝑖1 , 𝑥𝑖2 , · · · , 𝑥𝑖𝑟𝑖
(𝑖 = 1, 2, · · · , 𝑘) 是属于特征值 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑘) 的线性无关的特征向量, 那么向
量组 𝑥11 , 𝑥12 , · · · , 𝑥1𝑟1 , 𝑥21 , · · · , 𝑥2𝑟2 , · · · , 𝑥𝑘1 , · · · , 𝑥𝑘𝑟𝑘 线性无关.
5.2 矩阵的对角化
5.2.1 矩阵可对角化的条件
定 义5.2.1 如 果 矩 阵 𝐴 与 对 角 阵 Λ 相 似, 即 存 在 一 个 可 逆 矩 阵 𝑃 , 使
−1
𝑃 𝐴𝑃 = Λ, 则称矩阵 𝐴 可对 角化 .
定 理 5.2.1 𝑛 阶矩阵 𝐴 可对角化的充分必要条件是 𝐴 有 𝑛 个线性无关的特
征向量.
𝐴𝑥𝑖 = 𝜆𝑖 𝑥𝑖 , 𝑥𝑖 ̸= 0 (𝑖 = 1, 2, · · · , 𝑛)
即
𝜆1
𝜆2
𝐴[𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ] = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ] ..
.
𝜆𝑛
令
𝜆1
𝜆2
𝑃 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ], Λ= ..
.
𝜆𝑛
于是有
𝜆1
𝜆2
𝐴𝑃 = 𝑃 ..
.
𝜆𝑛
2 0 1
问 𝐴 能否对角化?
解 由于
𝜆+1 0 0
|𝜆𝐼 − 𝐴| = 2 𝜆−1 0
−2 0 𝜆−1
= (𝜆 + 1)(𝜆 − 1)2
所以 𝐴 的特征值为 𝜆1 = −1, 𝜆2 = 𝜆3 = 1.
5.2 矩阵的对角化 143
将 𝜆1 = −1 代入特征方程组, 有
0 0 0 𝑥1
−2 𝑥2 = 0
2 0
−2 0 −2 𝑥3
得属于特征值 −1 的线性无关的特征向量为
1
𝑥1 =
1
−1
将 𝜆2 = 𝜆3 = 1 代入特征方程组, 有
2 0 0 𝑥1
𝑥2 = 0
2 0 0
−1 0 0 𝑥3
解得属于特征值 1 的线性无关的特征向量为
0 0
𝑥2 =
1 ,
𝑥3 =
0
0 1
则有
−1 0 0
𝑃 −1 𝐴𝑃 =
0 1 0
0 0 1
144 第5章 特征值与二次型
例5.2.2 设
−1 1 0
𝐴=
−4 3 0
1 0 2
问 𝐴 能否对角化?
解 由前面例子知矩阵 𝐴 的特征值有 1和 2, 其中特征值 1 的代数重数为 2,
几何重数为1, 因此 3 阶矩阵 𝐴 不可能有 3 个线性无关特征向量, 故其不可对角化.
5.2.2 实对称矩阵的对角化
定义 5.2.2 矩阵的元素都是实数的对称矩阵称为实
实对 称 矩 阵 .
定理 5.2.3 实对称矩阵的所有特征值是实数, 所有特征向量是实向量.
证明 设 𝐴 是 𝑛 阶实对称矩阵, 𝜆 是 𝐴 的特征值, 𝑥 是属于 𝜆 的特征向量,
即 𝐴𝑥 = 𝜆𝑥, 𝑥 ̸= 0. 记 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T 相应的共轭矩阵和共
轭向量分别为 𝐴 = [𝑎𝑖𝑗 ]𝑛×𝑛 , 𝑥 = [𝑥1 , 𝑥2 , · · · , 𝑥𝑛 ]T , 其中 𝑎𝑖𝑗 , 𝑥𝑖 分别是 𝑎𝑖𝑗 , 𝑥𝑖 的共
T
轭复数, 则 𝐴𝑥 = 𝜆𝑥, 即 𝐴𝑥 = 𝜆𝑥, 等式两边转置,
T 得 𝑥T 𝐴 = 𝜆𝑥T .
由 于 𝐴 是 实 对 称 矩 阵, 有 𝐴 = 𝐴, 所 以 𝑥T 𝐴 = 𝜆𝑥T . 两 边 右 乘 𝑥, 得
𝑥T 𝐴𝑥 = 𝜆𝑥T 𝑥. 另外 𝑥T 𝐴𝑥 = 𝑥T 𝜆𝑥 = 𝜆 𝑥T 𝑥. 因此 (𝜆 − 𝜆)𝑥T 𝑥 = 0. 由于 𝑥 ̸= 0,
𝑥T 𝑥 ̸= 0, 故 𝜆 = 𝜆, 从而 𝜆 是一个实数.
所以当线性方程组的系数均为实数时, 其解也都是实数, 故实对称矩阵的特征向量
的分量也都是实数.
定理 5.2.4 实对称矩阵的属于不同特征值的特征向量正交.
证明 设 𝑥1 , 𝑥2 分别是实对称矩阵 𝐴 不同特征值 𝜆1 , 𝜆2 对应的特征向量,
𝐴𝑥1 = 𝜆1 𝑥1 , 𝐴𝑥2 = 𝜆2 𝑥2
(𝐴𝑥1 )T 𝑥2 = 𝑥T T T T T
1 𝐴 𝑥2 = 𝑥1 𝐴𝑥2 = 𝑥1 𝜆2 𝑥2 = 𝜆2 𝑥1 𝑥2
所以 𝜆1 𝑥T
1 𝑥2 = 𝜆2 𝑥1 𝑥2 , 即 (𝜆1 − 𝜆2 )𝑥1 𝑥2 = 0. 由假设知 𝜆1 ̸= 𝜆2 , 故有 𝑥1 𝑥2 = 0,
T T T
即 𝑥1 与 𝑥2 正交.
定 理 5.2.5 设 𝐴 是 𝑛 阶实对称矩阵, 则存在 𝑛 阶正交阵 𝑃 , 使 𝑃 T 𝐴𝑃 为对
角阵.
5.2 矩阵的对角化 145
由于
𝑃1T 𝑃1 = [𝑃1T 𝑥1 , 𝑃1T 𝑥2 , · · · , 𝑃1T 𝑥𝑛 ] = 𝐼
所以
1
0
𝑃1T 𝑥1
=
..
, 𝑒1
.
0
从而有
即
𝜆1 0T T
𝐴 = 𝑃1 𝑃1 (5.7)
0 𝐴1
146 第5章 特征值与二次型
其中 𝐴2 是 𝑛 − 2 阶实对称矩阵. 将式(5.8)代入式(5.7), 得
𝜆1 T
1 1
𝑃T
𝐴 = 𝑃1 𝜆2
1 (5.9)
𝑃2 𝑃2
𝐴2
因为 T
1
1 =
1 =𝐼
𝑃2 𝑃2 𝑃2 𝑃2T
1 也是一个正交阵, 记作 𝑃˜2 , 因此
故
𝑃2
𝜆1
𝐴 = 𝑃1 𝑃˜2 (𝑃1 𝑃˜2 )T
𝜆2
𝐴2
依此继续下去, 可得
𝜆1
𝜆2
𝐴 = 𝑃1 𝑃˜2 · · · 𝑃˜𝑛 (𝑃1 𝑃˜2 · · · 𝑃˜𝑛 )T
..
.
𝜆𝑛
解 由
𝜆
1 −1
−1 = (𝜆 − 1)2 (𝜆 + 2) = 0
|𝜆𝐼 − 𝐴| = 1 𝜆
−1 −1 𝜆
其基础解系为
148 第5章 特征值与二次型
−1
𝑥1 =
−1
将 𝑥1 单位化, 得
−1
1
𝜀= √ −1
3
1
将 𝜆2 = 𝜆3 = 1 代入 (𝜆𝐼 − 𝐴)𝑥 = 0, 得
1 1 −1 𝑥1
𝑥2 = 0
−1
1 1
−1 −1 1 𝑥3
其基础解系为
1 0
𝑥2 =
0 ,
𝑥3 =
1
1 1
将 𝑥2 , 𝑥3 正交化、单位化, 得
1 −1
1 1
𝜀2 = √ 0 , 𝜀3 = √ 2
2 6
1 1
−1 1 −1
√ √ √
3 2 6
−2 0 0
−1 2
于是得正交阵 𝑃 = √ 0 √ , 使得 𝑃 T 𝐴𝑃 = 0
3 6 .
1 0
1 1 1 0 0 1
√ √ √
3 2 6
5.3 二 次 型 149
5.3 二 次 型
5.3.1 二次型的基本概念
代入 𝑥T 𝐴𝑥 计算得
写成矩阵表示 𝑥T 𝐴𝑥.
解
1 3
1 2 2
𝑥1
1
−1 −2
𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = [𝑥1 , 𝑥2 , 𝑥3 ] 𝑥2
2
3 𝑥3
−2 3
2
5.3.2 二次型的标准形
定义 5.3.2 如果二次型只含有变量的平方项, 即
这种形式称为二次型的标
标准 形 .
定 理 5.3.1 对于二次型 𝑥T 𝐴𝑥, 存在正交阵 𝑃 , 使得经过正交变换 𝑦 = 𝑃 T 𝑥
P𝑛 P𝑛
二次型 𝑥T 𝐴𝑥 = 𝑖=1 𝑗=1 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 可化为标准形 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2 , 其中
𝜆1 , 𝜆2 , · · · , 𝜆𝑛 是实对称矩阵 𝐴 的全部特征值.
证明 因为 𝐴 是实对称矩阵, 故存在正交阵 𝑃 , 使得 𝑃 T 𝐴𝑃 = Λ, 即
𝐴 = 𝑃 Λ𝑃 T (5.12)
其中 Λ = diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝜆1 , 𝜆2 , · · · , 𝜆𝑛 是 𝐴 的全部特征值.
将式(5.12)代入二次型 𝑥T 𝐴𝑥, 并作正交变换 𝑦 = 𝑃 T 𝑥, 得
𝑥T 𝐴𝑥 = 𝑥T 𝑃 Λ𝑃 T 𝑥 = (𝑃 T 𝑥)T Λ𝑃 T 𝑥 = 𝑦 T Λ𝑦
= 𝜆1 𝑦12 + 𝜆2 𝑦22 + · · · + 𝜆𝑛 𝑦𝑛2
标准形, 并写出其正交变换.
解 此二次型的矩阵表示式为
2 −2 0 𝑥1
𝑥T 𝐴𝑥 = [𝑥1 , 𝑥2 , 𝑥3 ]
−2 1 −2
𝑥2
0 −2 0 𝑥3
先求 𝐴 的特征值和特征向量
𝜆−2 2 0
|𝜆𝐼 − 𝐴| = 2 𝜆 − 1 2 = (𝜆 − 1)(𝜆 − 4)(𝜆 + 2).
0 2 𝜆
所以 𝐴 的特征值为 𝜆1 = 1, 𝜆2 = 4, 𝜆3 = −2.
将 𝜆1 = 1 代入特征方程 (𝐼 − 𝐴)𝛼 = 0 中, 即有
−1 2 0
𝛼 = 0
2 0 2
0 2 1
由于它们已是正交向量, 再将它们单位化, 即得
1 1 1
𝜀1 = [−2, −1, 2]T , 𝜀2 = [2, −2, 1]T , 𝜀3 = [1, 2, 2]T
3 3 3
以 𝜀1 , 𝜀2 , 𝜀3 组成正交矩阵
−2 2 1
1
𝑃 = −1 −2 2
3
2 1 2
152 第5章 特征值与二次型
𝐴=𝑃 Λ𝑃 T 𝑦=𝑃 T 𝑥
𝑓 (𝑥1 , 𝑥2 , 𝑥3 ) = 𝑥T 𝐴𝑥 ======== 𝑥T 𝑃 Λ𝑃 T 𝑥 ====== 𝑦 T Λ𝑦
1 0 0 𝑦1
= [𝑦1 , 𝑦2 , 𝑦3 ]
0 4
0 𝑦2
0 0 −2 𝑦3
= 𝑦12 + 4𝑦22 − 2𝑦32
5.3.3 Rayleigh商
由于 𝜆1 6 𝜆2 6 · · · 6 𝜆𝑛 , 且 𝑦 T 𝑦 = 1, 故有
当 𝑥 为 𝐴 的最大特征值对应的单位特征向量时, 𝑥T 𝐴𝑥 = 𝑥T 𝜆𝑛 𝑥 = 𝜆𝑛 , 上述不等
式中的等号成立, 从而 𝑥T 𝐴𝑥 取得最大值为 𝐴 的最大特征值.
同理可证, 𝑥T 𝐴𝑥 的最小值为 𝐴 的最小特征值.
𝑥T 𝐴𝑥
定 义 5.3.3 设 𝐴 为 𝑛 阶实对称矩阵, 𝑥 为 𝑛 元非零列向量, 称 为𝐴
𝑥T 𝑥
的 Rayleigh 商 .
由前面的定理可得, 实对称矩阵 𝐴 的 Rayleigh 商的最大值为 𝐴 的最大特征
值, Rayleigh 商的最小值为 𝐴 的最小特征值.
5.4 正 定 矩 阵 153
5.4 正 定 矩 阵
5.4.1 正定矩阵与半正定矩阵
这与矩阵 𝐴 正定矛盾.
对于半正定矩阵, 证明过程类似.
性质 5.4.1 正定矩阵的行列式为正; 半正定矩阵的行列式非负.
证明 若 𝐴 是一个 𝑛 阶正定矩阵, 则其所有特征值均为正, 由于方阵所有特
征值(包括重根)的乘积等于方阵的行列式, 从而有 det(𝐴) = 𝜆1 · 𝜆2 · · · 𝜆𝑛 > 0.
若 𝐴 是一个 𝑛 阶半正定矩阵, 则其所有特征值均非负, 从而有 det(𝐴) =
𝜆1 · 𝜆2 · · · 𝜆𝑛 > 0.
性质 5.4.2 正定矩阵的主对角线上的元素都大于零.
证明 假设正定矩阵 𝐴 的主对角线上有一个元素 𝑎𝑘𝑘 6 0, 取 𝑥 为第 𝑘 个元
154 第5章 特征值与二次型
所以 𝐴𝐴T 和 𝐴T 𝐴 均是半正定的.
如果 𝐴 行满秩 rank(𝐴) = 𝑚, 那么, 对于 𝑥 ̸= 0, 可知 𝐴T 𝑥 ̸= 0, 因此
即 𝐴𝐴T 是正定矩阵.
同理, 如果 𝐴 列满秩 rank(𝐴) = 𝑛, 那么, 对于 𝑦 ̸= 0, 可知 𝐴𝑦 ̸= 0, 因此
即 𝐴T 𝐴 是正定的.
定义 5.4.2 在 𝑛 阶矩阵 𝐴 中, 取第 1, 2, · · · , 𝑘 行及第 1, 2, · · · , 𝑘 列得到 𝐴 的
5.4 正 定 矩 阵 155
𝑘 阶子矩阵的行列式(𝑘 6 𝑛), 称为 𝐴 的 𝑘 阶顺
顺序主 子 式, 通常记为 Δ𝑘 :
𝑎11 𝑎12
Δ1 = 𝑎11 , Δ2 = ,···
𝑎21 𝑎22
𝑎11
𝑎12 · · · 𝑎1𝑛
𝑎
21 𝑎22 · · · 𝑎2𝑛
Δ𝑛 = . .. ..
= det(𝐴)
..
. .
𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑎𝑛1
例5.4.2 矩阵
1 −1 2 3
0 3 2 4
𝐴=
2
−1 0 1
−1 3 2 4
的顺序主子式为
1 −1
Δ1 = 1, Δ2 =
0 3
1 −1 2
Δ3 = 0 3 2 , Δ4 = det(𝐴)
2 −1 0
定理 5.4.2 实对称矩阵正定的充分必要条件是其所有顺序主子式均为正.
证明 必要性. 记
𝑘 X
X 𝑘
𝑓𝑘 (𝑥1 , 𝑥2 , · · · , 𝑥𝑘 ) = 𝑎𝑖𝑗 𝑥𝑖 𝑥𝑗 (𝑘 = 1, 2, · · · , 𝑛).
𝑖=1 𝑗=1
对于任意一组不全为零的实数 𝐶1 , 𝐶2 , · · · , 𝐶𝑘 有
𝑘 X
X 𝑘
𝑓𝑘 (𝐶1 , 𝐶2 , · · · , 𝐶𝑘 ) = 𝑎𝑖𝑗 𝐶𝑖 𝐶𝑗 = 𝑓𝑛 (𝐶1 , 𝐶2 , · · · , 𝐶𝑘 , 0, · · · , 0) > 0
𝑖=1 𝑗=1
从而子矩阵
𝑎11 𝑎21 · · · 𝑎1𝑘
𝑎
21 𝑎22 · · · 𝑎2𝑘
𝐴𝑘 =
.. .. ..
. . .
𝑎𝑘1 𝑎𝑘2 · · · 𝑎𝑘𝑘
𝑎1𝑖 𝑎1𝑗
其中 𝑏𝑖𝑗 = 𝑎𝑖𝑗 − , 因为 𝑎𝑖𝑗 = 𝑎𝑗𝑖 , 所以 𝑏𝑖𝑗 = 𝑏𝑗𝑖 .
𝑎11
由行列式的性质知
𝑎11 𝑎21 · · · 𝑎1𝑘 𝑎11 𝑎21 · · · 𝑎1𝑘
21 𝑎22 · · · 𝑎2𝑘 · · · 𝑏2𝑘
𝑎
𝑅𝑖 − 𝑎11 𝑅1 0
𝑎𝑖1
𝑏22
Δ𝑘 = . .. ..
========
𝑖=2,3,··· ,𝑛 .. .. ..
..
. .
.
. .
𝑎𝑘1 𝑎𝑘2 · · · 𝑎𝑘𝑘 · · · 𝑏𝑘𝑘
0 𝑏𝑘2
𝑏22 · · · 𝑏2𝑘
. ..
= 𝑎11 .. . (𝑘 = 2, 3, · · · , 𝑛)
𝑏𝑘2 · · · 𝑏𝑘𝑘
根据已知条件 Δ𝑘 > 0 得
5.4 正 定 矩 阵 157
𝑏22
· · · 𝑏2𝑘
.. ..
>0 (𝑘 = 2, 3, · · · , 𝑛)
. .
𝑏𝑘2 · · · 𝑏𝑘𝑘
P𝑛 P𝑛
由归纳假设, 𝑛 − 1 个变量的二次型 𝑖=2 𝑗=2 𝑏𝑖𝑗 𝑥𝑖 𝑥𝑗 是正定的, 从而
𝑛 𝑛
1 XX
𝑥T 𝐴𝑥 = (𝑎11 𝑥1 + · · · + 𝑎1𝑛 𝑥𝑛 )2 + 𝑏𝑖𝑗 𝑥𝑖 𝑥𝑗 (𝑎11 > 0)
𝑎11 𝑖=2 𝑗=2
也是正定的.
注 实对称矩阵所有顺序主子式非负是该矩阵半正定的必要非充分条件. 请
读者自行思考为什么.
例 5.4.3 矩阵
1 1 1
𝐴=
1 2 3
1 3 6
是否正定?
解 由于矩阵 𝐴 的顺序主子式:
1 1 1
1 1
Δ1 = 1 > 0; Δ2 = > 0; Δ3 = 1 2 3 > 0
1 2
1 3 6
所以矩阵 𝐴 是正定的.
5.4.2 负定矩阵与半负定矩阵
意 𝑛 元非零向量 𝑥, 均有 𝑥T 𝐴𝑥 6 0, 则称实对称矩阵 𝐴 为半
半 负 定 矩 阵 (negative
semi-definite matrix).
由(半)正定矩阵与(半)负定矩阵的定义, 可直接得到下面的结论.
定 理 5.4.3 实对称矩阵 𝐴 负定当且仅当 −𝐴 正定; 实对称矩阵 𝐴 半负定当
且仅当 −𝐴 半正定.
158 第5章 特征值与二次型
从而
𝑎 𝑎12 𝑎13
11
𝑎11 𝑎12
Δ1 < 0, Δ2 = > 0, Δ3 = 𝑎21 𝑎22 𝑎23 < 0, · · ·
𝑎21 𝑎22
𝑎31 𝑎32 𝑎33
𝑎11
𝑎12 · · · 𝑎1𝑛
𝑛
𝑎
21
𝑛
𝑎22 · · · 𝑎2𝑛
(−1) Δ𝑛 = (−1) . .. ..
>0
..
. .
𝑎𝑛2 · · · 𝑎𝑛𝑛
𝑎𝑛1
即其顺序主子式的值负、正相间.
5.5 习 题
1. 求下列矩阵的特征值和特征向量.
5.5 习 题 159
2 −1 −1 −1 2 2
(1) 0 2 0 ; (2) 3 −1 1 ;
−4 1 3 2 2 −1
1 −1 1 3 −2 0
(3) 2 4 −2 ; (4) −1 3 −1 ;
−3 −3 5 −5 7 −1
1 1 1 1 1 3 1 2
1 1 −1 −1 0 −1 1 3
(5) ; (6) .
1 −1 1 −1 0 0 2 5
1 −1 −1 1 0 0 0 2
𝑎 0 𝑏
2. 设矩阵 𝐴 = 0 2 0 的一个特征值为 𝜆1 = −3, 且三个特征值的积为 −12, 则求
𝑏 0 −2
𝑎, 𝑏, 以及 𝐴 的其他特征值.
2 −1 2
𝐴= 5 𝑎 3
−1 𝑏 −2
1−𝑐 0 −𝑎
0 1 𝑥 −1
−3 2
26. 设 𝐴 = .
−2 2
(1) 求可逆矩阵 𝑃 使得 𝑃 −1 𝐴𝑃 为对角矩阵;
(2) 计算 𝐴10 − 𝐴6 − 𝐼.
1 −1 1
27. 已知方阵 𝐴 = 𝑥 4 𝑦 与对角矩阵相似, 且 𝜆 = 2 是 𝐴 的二重特征值.
−3 −3 5
(1) 求 𝑥 与 𝑦 的值;
5.5 习 题 161
1 1 1 4 2 3
−2 0 0 −1 0 0
29. 设 𝐴 与 𝐵 相似, 其中 𝐴 = 2 𝑥 2 , 𝐵 = 0 2 0 .
3 1 1 0 0 𝑦
(1) 求 𝑥 与 𝑦;
(2) 求可逆矩阵 𝑃 , 使得 𝑃 −1 𝐴𝑃 = 𝐵.
0 0 1
30. 设矩阵 𝐴 = 𝑎 1 𝑏 有三个线性无关的特征向量, 求 𝑎, 𝑏 满足的条件, 并求可逆
1 0 0
−1
矩阵 𝑃 , 使得 𝑃 𝐴𝑃 为对角阵.
1 −1 1
31. 设矩阵 𝐴 = 𝑥 4 𝑦 , 已知 𝐴 有三个线性无关的特征向量, 𝜆 = 2 是 𝐴 的二
−3 −3 5
−1
重特征值, 求可逆矩阵 𝑃 , 使得 𝑃 𝐴𝑃 为对角矩阵.
100
1 2 2
32. 计算 2 1 2 .
2 2 1
33. 设上三角阵
𝑎11 𝑎12 ··· 𝑎1𝑛
···
0 𝑎22 𝑎2𝑛
𝐴=
.. .. ..
. . .
0 0 ··· 𝑎𝑛𝑛
它的对角线元素各不相同, 证明 𝐴 可以化为对角阵.
6.1 LU 分 解
𝐸𝑝 · · · 𝐸1 𝐴 = 𝑈 (6.1)
从而
𝐴 = (𝐸𝑝 · · · 𝐸1 )−1 𝑈 = 𝐿𝑈
其中
𝐿 = (𝐸𝑝 · · · 𝐸1 )−1 (6.2)
6.2 QR 分 解
𝛼2 − q1 qT
1 𝛼2
q2 =
‖ 𝛼2 − q1 qT
1 𝛼2 ‖
𝛼3 − q1 qT T
1 𝛼3 − q2 q2 𝛼3
q3 =
‖ 𝛼3 − q1 q1 𝛼3 − q2 qT
T
2 𝛼3 ‖
𝛼𝑛 − q1 qT T T
1 𝛼𝑛 − q2 q2 𝛼𝑛 − · · · − q𝑛−1 q𝑛−1 𝛼𝑛
q𝑛 =
‖ 𝛼𝑛 − q1 qT T T
1 𝛼𝑛 − q2 q2 𝛼𝑛 − · · · − q𝑛−1 q𝑛−1 𝛼𝑛 ‖
𝛼1 = q1 qT
1 𝛼1
166 第6章 矩 阵 分 解
因为
span(𝛼1 , 𝛼2 ) = span(q1 , q2 ), 𝛼2 ∈ span(𝛼1 , 𝛼2 )
故 𝛼2 ∈ span( q1 , q2 ), 从 而 𝛼2 在 span(q1 , q2 )中 的 正 交 投 影 是 其 自 身 𝛼2 =
1 𝛼2 + q2 q2 𝛼2 , 依此下去, 因为 span (𝛼1 , · · · , 𝛼𝑛 ) = span(q1 , · · · , qn ), 𝛼n ∈
q1 qT T
因此得
[𝛼1 , 𝛼2 , · · · , 𝛼𝑛 ] = [q1 qT T T T T
1 𝛼1 , q1 q1 𝛼2 + q2 q2 𝛼2 , · · · , q1 q1 𝛼𝑛 + · · · + q𝑛 q𝑛 𝛼𝑛 ]
qT T T
1 𝛼1 q1 𝛼2 · · · q1 𝛼𝑛
0 qT T
2 𝛼2 · · · q2 𝛼𝑛
= [q1 , q2 , · · · , q𝑛 ]
.. .. ..
. . .
0 0 · · · qT
𝑛 𝛼𝑛
记
𝐴 = [𝛼1 , 𝛼2 , · · · , 𝛼𝑙 ], Q = [q1 , q2 , · · · , q𝑛 ]
qT T T
1 𝛼1 q1 𝛼2 . . . q1 𝛼𝑛
0 qT T
2 𝛼2 · · · q2 𝛼𝑛
𝑅=
.. .. ..
. . .
0 0 · · · qT
𝑛 𝛼𝑛
试对 𝐴 进行 QR 分解.
解 矩阵 𝐴 的列向量
6.2 QR 分 解 167
1 0 0
1 1 0
𝛼1 = , 𝛼2 = , 𝛼3 =
1 1 1
1 1 1
因此
1 3
−√ 0
2 12
1 1 2
√ −√
Q= 2 12 6
1 1 1
√ √
2
12 6
1 1 1
√ √
2 12 6
从而
1 1 1 1
2 2 2 2 1 0 0
3 1 1 1 1 1 0
𝑅 = QT 𝐴 = −√ √ √ √
12 12 12 12 1
1 1
2 1 1
0 −√ √ √ 1 1 1
6 6 6
3
2 2
1
3 2
= 0
√ √
12 12
2
0 0 √
6
故
168 第6章 矩 阵 分 解
1 3
−√ 0
2 3
12 2
1
1 1 2 2
√ √
−
3 2
2
𝐴= 12 6
0 √ √ = Q𝑅
1 1 1 12 12
√ √ 2
2
12 6
0 0 √
1 1 1 6
√ √
2 12 6
6.3 Cholesky 分 解
的对角线元素均大于零.
记 √
𝜆1
√
1
𝜆2
Λ2 = ..
.
√
𝜆𝑛
1 1 1 1
则𝐴 = 𝑃 Λ 2 𝑃 T 𝑃 Λ 2 𝑃 T = (𝑃 Λ 2 𝑃 T )T (𝑃 Λ 2 𝑃 T ).
1
令 𝐵 = 𝑃 Λ 2 𝑃 T , 易知 𝐵 正定, 故 𝐵 可逆, 因此存在正交阵 Q 和上三角阵 𝑅,
使得 𝐵 = 𝑄𝑅, 从而 𝐴 = 𝐵 T 𝐵 = (𝑄𝑅)T 𝑄𝑅 = 𝑅T QT 𝑄𝑅 = 𝑅T 𝑅.
首先, 可以断定 𝑅 的对角线元素均不等于零, 否则 det(𝐵) = det(Q) det(𝑅) =
0, 与 𝐵 正定矛盾.
其次, 假定存在 𝑅 的某个对角线元素小于零, 设 𝑟𝑖𝑖 < 0, 将 𝑅 的第 𝑖 行乘以
−1, 得 𝐸𝑖 (−1)𝑅. 由于(𝐸𝑖 (−1)𝑅)T 𝐸𝑖 (−1)𝑅 = 𝑅T 𝐸𝑖 (−1)𝐸𝑖 (−1)𝑅 = 𝑅T 𝑅 = 𝐴,
6.3 Cholesky 分 解 169
解 因为矩阵 𝐴 的 3 个顺序主子式均大于零
4 2 −2
4 2
Δ1 = 4 > 0, Δ2 = = 36 > 0, Δ3 = 2 10 2 = 108 > 0
2 10
−2 2 5
2 0 0 2 1 −1
T
=
1 0 0 3 1 = 𝑅 𝑅
3
√ √
−1 1 3 0 0 3
6.4 谱 分 解
设 𝐴 为 𝑛 阶 实 对 称 矩 阵, 存 在 正 交 阵 𝑃 使𝐴 = 𝑃 Λ𝑃 T , 其 中 Λ =
diag(𝜆1 , 𝜆2 , · · · , 𝜆n ), 𝑃 = [𝑝1 , 𝑝2 , · · · , 𝑝𝑛 ]. 𝜆𝑖 (𝑖 = 1, 2, · · · , 𝑛) 是 𝐴 的所有特征
值, 正交阵 𝑃 的第 𝑖 列向量 𝑃𝑖 是 𝜆𝑖 对应的单位特征向量. 将上式展开, 得
𝜆1 0 𝑝T
1
𝜆2
𝑝T 2
𝐴 = [𝑝1 , 𝑝2 , · · · , 𝑝𝑛 ] ..
..
.
.
0 𝜆𝑛 𝑝T
𝑛
= 𝜆𝑝1 𝑝T T T
1 + 𝜆2 𝑝 2 𝑝 2 + · · · + 𝜆𝑛 𝑝 𝑛 𝑝 𝑛
6.5 奇异值分解
由于
‖𝐴𝑣‖2 = (𝐴𝑣)T 𝐴𝑣 = 𝑣 T 𝐴T 𝐴𝑣
= 𝑣 T (𝜆𝑣) = 𝜆𝑣 T 𝑣 = 𝜆 > 0 (6.5)
故 𝐴𝑣 ̸= 0. 将式(6.4)改写为
1
1
T
(𝐴𝐴 ) √ 𝐴𝑣 = 𝜆 √ 𝐴𝑣 (6.6)
𝜆 𝜆
1
这表明 𝜆 也是 𝐴𝐴T 的特征值, 相应的单位特征向量是 √ 𝐴𝑣. 设 𝜆1 , · · · , 𝜆𝑟 是
𝜆
𝐴T 𝐴 的 𝑟 个正特征值(包括重根), 且满足 𝜆1 > 𝜆2 > · · · > 𝜆𝑟 > 0, 𝑣1 , · · · , 𝑣𝑟 是
𝐴T 𝐴 对应于 𝜆1 , · · · , 𝜆𝑟 的相互正交的单位特征向量, 则
1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟
由于当 𝑖 ̸= 𝑗 时
172 第6章 矩 阵 分 解
因此
1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟
是相互正交的单位特征向量.
注 事实上, 𝐴T 𝐴 与 𝐴𝐴T 具有相同的非零特征值, 且它们的每个非零特征
值的代数重数与几何重数均相等. 请读者自行思考为什么?
定 义6.5.1 设 𝑚 × 𝑛 矩阵 𝐴 的秩 rank(𝐴) = 𝑟, 𝐴T 𝐴 (或者𝐴𝐴T ) 非零特征
值 𝜆1 , · · · , 𝜆𝑟 的算术平方根称为 𝐴 的奇
奇 异 值 (singular value), 记作 𝜎1 , · · · , 𝜎𝑟 , 即
√
𝜎𝑖 = 𝜆𝑖 (1 6 𝑖 6 𝑟 ).
注 由式 (6.5) 可知, 𝐴 的奇异值 𝜎1 , · · · , 𝜎𝑟 分别等于向量 𝐴𝑣1 , · · · , 𝐴𝑣𝑟 的
模长.
定 理 6.5.1 (奇异值分解(singular value decomposition)) 设 𝑚 × 𝑛 矩阵 𝐴 的秩
rank(𝐴) = 𝑟, 则存在 𝑚 阶正交矩阵 𝑈 和 𝑛 阶正交矩阵 𝑉 使得 𝐴 = 𝑈 Σ𝑉 T , 其中
Σ 为 𝑚 × 𝑛 分块对角阵
𝐷 0
Σ=
0 0
𝑣1 , · · · , 𝑣𝑟 · · · , 𝑣𝑛 是 𝐴T 𝐴 对应于 𝜆1 , · · · , 𝜆𝑟 , · · · , 𝜆𝑛 的相互正交的单位特征向
量. 记 𝑉 = [𝑣1 , · · · , 𝑣𝑟 , · · · , 𝑣𝑛 ], 则 𝑉 是 𝑛 阶正交矩阵.
由前面的讨论知
1 1
√ 𝐴𝑣1 , · · · , √ 𝐴𝑣𝑟
𝜆1 𝜆𝑟
是 𝐴𝐴T 对应于 𝜆1 , · · · , 𝜆𝑟 的相互正交的单位特征向量. 令
1
𝑢𝑖 = √ 𝐴𝑣𝑖 (𝑖 = 1, · · · , 𝑟)
𝜆𝑖
因为 𝑢𝑖 ∈ R𝑚 , 所以 𝑢1 , · · · , 𝑢𝑟 是 R𝑚 的一个 𝑟 维子空间的标准正交基. 根据
基 扩 充 定 理, 将 𝑢1 , · · · , 𝑢𝑟 扩 充 为 R𝑚 的 标 准 正 交 基 𝑢1 , · · · , 𝑢𝑟 , · · · , 𝑢𝑚 . 记
6.5 奇异值分解 173
𝑈 = [𝑢1 , · · · , 𝑢𝑟 , · · · , 𝑢𝑛 ], 则 𝑈 是 𝑚 阶正交矩阵.
1 √
当 𝑖 = 1, · · · , 𝑟 时, 由于 𝑢𝑖 = √ 𝐴𝑣𝑖 , 所以 𝐴𝑣𝑖 = 𝜆𝑖 𝑢𝑖 (𝑖 = 1, · · · , 𝑟).
𝜆𝑖
当 𝑖 = 𝑟 + 1, · · · , 𝑛 时, 由于 𝜆𝑖 = 0,
所以 𝐴𝑣𝑖 = 0 (𝑖 = 𝑟 + 1, · · · , 𝑛). 故有
𝐴𝑉 = 𝐴[𝑣1 , · · · , 𝑣𝑟 , 𝑣𝑟+1 , · · · , 𝑣𝑛 ]
= [𝐴𝑣1 , · · · , 𝐴𝑣𝑟 , 𝐴𝑣𝑟+1 , · · · , 𝐴𝑣𝑛 ]
p p
= [ 𝜆 1 𝑢1 , · · · , 𝜆𝑟 𝑢𝑟 , 0, · · · , 0]
√
𝜆1
..
.
√
𝜆𝑟
= [𝑢1 , · · · , 𝑢𝑟 , 𝑢𝑟+1 , · · · , 𝑢𝑛 ]
0
..
.
0
𝜎1
..
.
𝜎𝑟
= [𝑢1 , · · · , 𝑢𝑟 , 𝑢𝑟+1 , · · · , 𝑢𝑛 ]
0
..
.
0
记 𝐷 = diag(𝜎1 , · · · , 𝜎r ), 并且
𝐷 0
Σ=
0 0
则
𝐷 0
𝐴𝑉 = 𝑈 = 𝑈Σ
0 0
174 第6章 矩 阵 分 解
由于 𝑉 是一个正交阵, 故 𝐴 = 𝑈 Σ𝑉 T .
1 −1
例6.5.1 设𝐴 = , 试对 𝐴 奇异值分解.
−2 2
2 −2
9 −9
解 首先, 计算 𝐴T 𝐴 = , 𝐴T 𝐴 的特征值是 18 和 0, 相应的单
−9 9
位特征向量是 1 1
√ √
2 2
𝑣1 = , 𝑣2 =
1 1
−√ √
2 2
因此
1 1
√ √
2 2
𝑉 =
1 1
−√ √
2 2
√
由于矩阵 𝐴 只有一个非零的奇异值 3 2 , 故其分解式 𝐴 = 𝑈 ΣVT 中的 Σ 为
√
𝐷 0 3 2 0
Σ=
0 =
0 0 0
0 0 0 0
为构造 𝑈 , 首先计算
1
√
3
1
𝑢1 = √ 𝐴𝑣1 = − √2
3 2
3
2
√
3
接下来将 𝑢1 扩充为 R3 的标准正交基. 此时, 我们需要两个向量且都与 𝑢1 正交,
这等价于求方程 𝑥1 − 2𝑥2 + 𝑥3 = 0 的解, 该方程的解构成的基是
2 −2
𝑤1 =
1 ,
𝑤2 =
0
0 1
6.5 奇异值分解 175
将 𝑤1 , 𝑤2 Schmidt 正交化得
−2
2 √
√ 5
5
4
√
𝑢2 = 1 , 𝑢3 =
√ 5
5
5
0
√
5
从而得 𝑈 = [𝑢1 , 𝑢2 , 𝑢3 ], 因此
1 −1
𝐴=
−2 2
2 −2
1 2 −2
√ √
3 5 5 √ 1 1
3 2 0 √ −√
−2 1 4 2 2
= √ √ 0 0
3 5 5
1 1
2 5
0 0 √ √
2 2
0 √
3 5
h i h i
𝑈= 𝑈𝑟 𝑈𝑚−𝑟 其中 𝑈𝑟 = 𝑢1 · · · 𝑢𝑟
h i h i
𝑉 = 𝑉𝑟 𝑉𝑛−𝑟 其中 𝑉𝑟 = 𝑣1 · · · 𝑣𝑟
则
h i 𝐷 0 𝑉𝑟T
𝐴= 𝑈𝑟 𝑈𝑚−𝑟 = 𝑈𝑟 𝐷𝑉𝑟T (6.7)
T
0 0 𝑉𝑛−𝑟
𝐴+ = 𝑉𝑟 𝐷 −1 𝑈𝑟T (6.8)
176 第6章 矩 阵 分 解
^ = 𝐴+ 𝑏 = 𝑉𝑟 𝐷 −1 𝑈𝑟T 𝑏, 由于
给定线性方程组 𝐴𝑥 = 𝑏, 基于 𝐴 的伪逆, 定义 𝑥
𝑉𝑟 的列向量是相互正交的单位向量, 即 𝑉𝑟T 𝑉𝑟 = 𝐼, 故
因 1
𝑢𝑖 = √ 𝐴𝑣𝑖 ∈ C(𝐴) (𝑖 = 1, · · · , 𝑟)
𝜆𝑖
可以验证 𝑢1 , · · · , 𝑢𝑟 是 𝐴 的列空间 C(𝐴) 的标准正交基, 从而 𝑈𝑟 𝑈𝑟T 𝑏 是 𝑏 在
C(𝐴) 上的正交投影, 因此 𝑥
^ 是 𝐴𝑥 = 𝑏 的最小二乘解. 当 𝐴 的列向量线性相关
时, 𝐴𝑥 = 𝑏 的最小二乘解并不唯一, 此时这个 𝑥
^ 在 𝐴𝑥 = 𝑏 的所有最小二乘解中
具有最小模长.
𝐴𝑣𝑖 = 𝜆𝑖 𝑣𝑖 (𝑖 = 1, 2, · · · , 𝑟)
由于 𝐴T = 𝐴, 故
6.6 习 题
1. 对下列矩阵进行 LU 分解:
3 1 2 4
(1) ; (2) ;
9 5 −2 1
6.6 习 题 177
2 4 2 2 3 1
(3) 1 5 2 ; (4) 4 1 4 ;
4 −1 9 3 4 6
1 1 1 −2 1 2
(5) 3 5 6 ; (6) 4 1 −2 .
−2 2 7 −6 −3 4
2. 对下列矩阵进行 QR 分解:
1 2 3 1 2 4
(1) −1 0 3 ; (2) 0 0 5 ;
0 −2 3 0 3 6
1 2 −1 1 −1 4
2 0 1 1 4 −2
(3) ; (4) .
2 −4 2 1 4 2
4 0 0 1 −1 0
3. 对下列矩阵进行 Cholesky 分解:
4 2 9 −3
(1) ; (2) ;
2 10 −3 2
16 8 4 9 3 −6
(3) 8 6 0 ; (4) 3 4 1 ;
4 0 7 −6 1 9
2 −1 0 0
−1 2 −1 0
(5) .
0 −1 2 −1
0 0 −1 2
4. 对下列矩阵进行谱分解:
0 2 −1
5 4
(1) ; (2) 2 3 −2 .
4 5
−1 −2 0
5. 设 𝐴 是 𝑚 × 𝑛 矩阵,证明 𝐴 𝐴 与 𝐴𝐴T 具有相同的非零特征值, 且它们的每个非零特征 T
值的代数重数与几何重数均相等.
6. 对下列矩阵进行奇异值分解:
2 2 2 2
(1) ; (2) ;
1 1 −1 1
1 1
1 1 0
(3) ; (4) 1 1 .
0 1 1
0 0
178 第6章 矩 阵 分 解
矩阵的标准形理论源于矩阵的相似性, 因为在相似矩阵的某些量具有相似不
变性, 例如, 矩阵的特征多项式、特征值(包括代数重数和几何重数)、行列式、矩
阵的迹以及矩阵的秩等, 而且相似矩阵的特征向量也可利用相似性相互求出. 对于
所有 𝑛 阶方阵构成的集合 ℳ𝑛 , 按相似性质可将这个集合划分成一系列等价类,
每个等价类可用一个“代表矩阵”表示, 即该等价类中所有矩阵都与该“代表矩
阵”相似, 作为“代表矩阵”, 希望它越简单越好. 例如, 对于可对角化矩阵, 它的
等价类就可以选择特征值构成的对角矩阵作为“代表矩阵”. 但遗憾的是, 不是
所有的方阵都可对角化, 那么, 对于这些矩阵它们的“代表矩阵”会是怎样的? 本
章将先从多项式矩阵开始, 导出矩阵的 Jordan 标准形概念, 再介绍如何求方阵的
Jordan 标准形.
7.1 多项式矩阵
7.1.1 多项式矩阵
的行列式为 −2𝜆 − 2.
𝜆 0 1
A(𝜆) = 2
𝜆 +1 𝜆 0
−2𝜆 𝜆 −𝜆 − 1
则其逆矩阵可表示为
1
A−1 = A*
det A
这个概念推广到 𝜆-矩阵时需要注意, 若 A(𝜆) 的行列式非零, 用逆矩阵表达式有
1
A−1 (𝜆) = A* (𝜆), 其中 A* (𝜆) 为 A(𝜆) 的伴随矩阵, 当 det A(𝜆) 为非零常
det A(𝜆)
数时, 可知 A−1 (𝜆) 为 𝜆-矩阵, 而 det A(𝜆) 为多项式时, A−1 (𝜆) 的元素为有理分式.
为此定义如下.
定义 7.1.3 𝜆-矩阵的行列式为非零常数时, 称为单模矩阵.
显然, 单模矩阵的乘积仍是单模矩阵.
定理 7.1.1 对 𝑛 阶 𝜆-矩阵 A 存在一个多项式矩阵为它的逆矩阵, 当且仅当 A
是一个单模矩阵.
1 *
A* (𝜆)A = |A|E, A* (𝜆)A = 𝑑E, A (𝜆)A = E
𝑑
7.1 多项式矩阵 181
1
A* (𝜆) 为 𝜆-矩阵, 所以逆矩阵 A* (𝜆) 还是 𝜆-矩阵.
𝑑
必要性. 设 det A = 𝑝(𝜆), 其逆矩阵的行列式 det A−1 (𝜆) = 𝑞(𝜆) 为 𝜆 的多项
式. 对 A(𝜆)A−1 (𝜆) = E 两边取行列式, 得 𝑝(𝜆)𝑞(𝜆) = 1 仅当 𝑝(𝜆), 𝑞(𝜆) 为非零常
数, 即 A(𝜆) 为单模矩阵时等式成立.
推论 7.1.1 单模矩阵的乘积是单模矩阵.
推论 7.1.2 单模矩阵的逆矩阵也是单模矩阵.
7.1.2 多项式矩阵的初等变换
𝜆-矩阵的初等变换有下列三类:
(1) 交换两行(列), 如交换矩阵的第 𝑖, 𝑗 行(列), 对应的初等矩阵记为 𝑃𝑖𝑗 , 即
𝑖 𝑗
1
..
.
1
0 ··· ··· ··· 1 𝑖
.. ..
. 1 .
𝑃𝑖𝑗 =
.. .. ..
. . .
.. ..
. 1 .
··· ··· ···
1 0 𝑗
1
..
.
1
𝑖 𝑗
1
..
.
1 ··· 𝑝(𝜆) 𝑖
.. ..
𝑃𝑖𝑗 (𝑝(𝜆)) = .
.
1 𝑗
..
.
1
则
𝑃 (𝜆) = 𝑃𝑠 (𝜆)𝑃𝑠−1 (𝜆) · · · Q1 (𝜆), Q(𝜆) = Q1 (𝜆)Q2 (𝜆) · · · Q𝑡
(2) 𝑎11 (𝜆) 不能整除 𝑎1𝑗 (𝜆) 和 𝑎𝑖1 (𝜆), 利用多项式的分解, 将它们表示成
𝑎1𝑗 (𝜆) = 𝑎11 (𝜆)𝑝𝑗 (𝜆) + 𝑟𝑗 (𝜆), 且 deg 𝑟𝑗 (𝜆) < deg 𝑎11 (𝜆)
或
𝑎𝑖1 (𝜆) = 𝑎11 (𝜆)𝑞𝑖 (𝜆) + 𝑠𝑖 (𝜆), 且 deg 𝑠𝑖 (𝜆) < deg 𝑎11 (𝜆)
经过有限步的初等变换后, 得到形如下式的矩阵:
𝑏11 (𝜆) 0 ··· 0
0 𝑏22 (𝜆) ··· 𝑏2𝑛 (𝜆)
.. .. ..
(7.3)
. . .
0 𝑏𝑚2 (𝜆) · · · 𝑏𝑚𝑛 (𝜆)
下面再利用引理7.1.1证明定理7.1.3.
𝑑1 (𝜆)
..
.
𝑑𝑟 (𝜆)
0
..
.
0
的 Smith 标准形.
解
1 𝜆3 𝜆2 − 𝜆
swap(𝑅1 , 𝑅2 )
A(𝜆) −−−−−−−−→
−2𝜆 − 2 −2𝜆4 −2𝜆3 + 2𝜆2
swap(𝐶1 , 𝐶3 )
−𝜆 + 1 𝜆3 − 𝜆 𝜆2 − 𝜆
1 𝜆3 𝜆2 − 𝜆
𝑅2 +(2𝜆+2)×𝑅1
−−−−−−−−−−→
0 2𝜆3 2𝜆2 − 2𝜆
𝑅3 +(𝜆−1)×𝑅1
0 𝜆4 − 𝜆 𝜆 3 − 𝜆2
1 0 0
𝐶2 +(−𝜆3 )×𝐶1
−−−−−−−
2
−−−−→
0 2𝜆3 2𝜆2 − 2𝜆
𝐶3 +(−𝜆 +𝜆)×𝐶1
0 𝜆4 − 𝜆 𝜆 3 − 𝜆2
1 0 0
𝑅3 +(−𝜆/2)×𝑅2
−−−−−−−−−−→
0 −𝜆 0
swap(𝑅2 , 𝑅3 )
0 2𝜆3 2𝜆2 − 2𝜆
186 第7章 矩阵的 Jordan 标准形
1 0 0
𝑅3 +(2𝜆2 )×𝑅2
−−−−−−−−−→
0 −𝜆 0
0 0 2𝜆2 − 2𝜆
1 0 0
(−1)×𝑅2
−−−−−−→
0 𝜆 0
(1/2)×𝑅3
0 0 𝜆2 − 𝜆
例7.1.4 求矩阵
𝜆(𝜆 + 1)
0
𝜆2
A(𝜆) =
(𝜆 + 1)2
0
𝜆(𝜆 − 1)
的 Smith 标准形.
A(𝜆)
𝜆
𝑅2 −𝑅1 ;𝐶2 +𝐶1 ;swap(𝑅1 ,𝑅2 )
𝜆2 (𝜆 + 1)
−−−−−−−−−−−−−−−−−−−−−−−−−−−→
swap(𝐶1 , 𝐶2 );𝑅2 +(𝜆+1)×𝑅1 ;𝐶2 −(𝜆+1)×𝐶1
(𝜆 + 1)2
𝜆(𝜆 − 1)
1
𝑅3 −(𝜆+2)×𝑅1 ;𝐶3 +𝐶1 ;swap(𝑅1 , 𝑅3 )
𝜆2 (𝜆 + 1)
−−−−−−−−−−−−−2−−−−−−−−−−−−→
swap(𝐶1 ,𝐶3 );𝐶3 +(𝜆 +2𝜆)×𝐶1 ;𝑅3 −𝜆×𝑅1
𝜆(𝜆 + 1)2
𝜆(𝜆 − 1)
1
𝑅3 −𝑅2 ;𝐶3 +𝐶2 ;swap(𝑅2 , 𝑅3 )
𝜆(𝜆 + 1)
−−−−−−−−−−−−−−−−−−−−−→
swap(𝐶2 ,𝐶3 );𝐶3 +𝜆×𝐶2 ;𝑅3 −𝜆×𝑅2
𝜆2 (𝜆 + 1)2
𝜆(𝜆 − 1)
7.1 多项式矩阵 187
1
𝑅4 −𝑅2 ;𝐶4 +𝐶2 ;swap(𝑅2 ,𝑅4 );swap(𝐶2 ,𝐶4 )
𝜆
−−−−−−−−−−−−−−−−−−−−−−−−−−−→
(−1/2)×𝑅2 ;𝑅4 −(𝜆+1)×𝑅2 ;𝐶4 −(𝜆+1)/2×𝐶2
𝜆2 (𝜆 + 1)2
𝜆(𝜆 + 1)(𝜆 − 1)
1
swap(𝑅3 ,𝑅4 );swap(𝐶3 ,𝐶4 );𝑅4 −(𝜆+2)×𝑅3
𝜆
−−−−−−−−−−−−−−−−−−−−−−−−→
𝐶4 +𝐶3 ;swap(𝑅3 ,𝑅4 );swap(𝐶3 ,𝐶4 )
2𝜆(𝜆 + 1) −𝜆(𝜆2 − 1)(𝜆 + 2)
𝜆(𝜆 + 1)(𝜆 − 1) 𝜆(𝜆 + 1)(𝜆 − 1)
1
𝑅4 −(1/2)(𝜆−1)×𝑅2 ;𝐶4 +(1/2)(𝜆2 +𝜆−2)×𝐶3
𝜆
−−−−−−−−−−−−−−−−−−−−−−−−−−−→
(1/2)×𝑅3 ;(1/2)×𝑅4
𝜆(𝜆 + 1)
𝜆2 (𝜆 + 1)2 (𝜆 − 1)
7.1.3 不变因子和初等因子
的各阶行列式因子.
188 第7章 矩阵的 Jordan 标准形
1−𝜆 2𝜆 − 1
= 𝜆2 − 3𝜆3
1 + 𝜆2 2
𝜆 +𝜆−1
𝜆 𝜆2
= −𝜆4 + 𝜆3 − 𝜆
1 + 𝜆2 2
𝜆 +𝜆−1
1−𝜆 𝜆 1−𝜆 𝜆
= −𝜆2 − 𝜆
= −𝜆,
𝜆 −𝜆 1 + 𝜆2 −𝜆2
𝜆 −𝜆 2𝜆 − 1 𝜆
3 2
= 𝜆, = −𝜆 − 2𝜆 + 𝜆
1 + 𝜆2 2
−𝜆 𝜆2 −𝜆
2𝜆 − 1 𝜆
= −3𝜆 + 𝜆
2
𝜆 +𝜆−1 −𝜆2
𝜆2 −𝜆
= −𝜆4 + 𝜆3 + 𝜆2 − 𝜆
2 2
𝜆 +𝜆−1 −𝜆
𝑑1 (𝜆)
𝑑2 (𝜆)
..
.
𝑑𝑟 (𝜆)
0
..
.
0
7.1 多项式矩阵 189
它的 𝑘 阶行列式因子
𝑘
Y
𝑑𝑖 (𝜆), 𝑘 6 𝑟
𝐷𝑘 (𝜆) = 𝑖=1
0, 𝑘>𝑟
反之, 有
𝑑1 (𝜆) = 𝐷1 (𝜆)
𝐷𝑖 (𝜆)
𝑑𝑖 (𝜆) = , 𝑖 = 2, 3, · · · , 𝑟 (7.4)
𝐷𝑖−1 (𝜆)
换), 则:
/ ℛ𝑘 , 则 𝑀𝑘 = 𝑁𝑘 ;
(i) 𝑖 ∈
/ ℛ𝑘 , 记 𝑀𝑘′ 为矩阵A(𝜆) 基于 ℛ𝑘 − {𝑖} ∪ {𝑗}, 𝒞𝑘 的各阶子
(ii) 仅𝑖 ∈ ℛ𝑘 而𝑗 ∈
式, 则 𝑁𝑘 = 𝑀𝑘 + 𝑝(𝜆)𝑀𝑘′ , 由 Δ𝑘 (𝜆)𝑁𝑘 可知Δ𝑘 𝑀𝑘 且 Δ𝑘 𝑝(𝜆)𝑀𝑘′ ;
(iii) 𝑖, 𝑗 ∈ ℛ𝑘 , 则 𝑀𝑘 = 𝑁𝑘 .
因此, 同样可得 𝐷𝑘 (𝜆) = Δ(𝑘), 即第三类初等变换也不改变矩阵的 𝑘 阶行列
式因子. 可将这一结论表述成定理.
定理 7.1.4 初等变换不改变多项式矩阵的行列式因子.
并且它也给出了求多项式矩阵 A(𝜆) 各阶行列式因子的一种方法, 即通过初
等变换将 A(𝜆) 化成标准形 𝐵(𝜆), 再求 𝐵(𝜆) 的 𝑘 阶行列式因子.
推 论 7.1.3 初等变换下等价的两个多项式矩阵有相同的行列式因子.
同样地, 若已知 A(𝜆) 的 𝑘 阶行列式因子, 利用式(7.4)可求得它的标准形.
推 论7.1.4 多项式矩阵的 Smith 标准形是唯一的.
推 论7.1.5 单模矩阵的 𝑘 行列式因子为 1.
定 义 7.1.6 多项式矩阵 A(𝜆) 的标准形中的非零多项式 𝑑𝑖 (𝜆)(𝑖 = 1, 2, · · · ,
rank (A(𝜆))) 称为 A(𝜆) 的不变因子(invariant divisor).
上述讨论说明, 凡等价的多项式矩阵具有相同的行列式因子, 也有相同的不变
因子. 反之两个 𝑚 × 𝑛 多项式矩阵有完全相同的不变因子或行列式因子, 则它们有
相同的 Smith 标准形.
定 义7.1.7 设 A(𝜆) 是多项式环 𝒦[𝜆](数域 𝐾 上的多项式环) 上的 𝑛 阶矩阵,
𝑑1 (𝜆), 𝑑2 (𝜆), · · · , 𝑑𝑟 (𝜆) 是它所有的不变因子, 若它们的标准分解式为
1
1
𝜆−1
𝜆2 − 1
(𝜆2 − 1)(𝜆2 − 2)(𝜆2 + 1)
0
0
𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆2 − 2, 𝜆2 + 1
若 𝐾 为实数域, 它的初等因子组为
√ √
𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆− 2, 𝜆+ 2, 𝜆2 + 1
若 𝐾 为复数域, 它的初等因子组为
√ √
𝜆 − 1; 𝜆 − 1, 𝜆 + 1; (𝜆 − 1)2 , (𝜆 + 1)2 , 𝜆− 2, 𝜆+ 2, 𝜆 − i, 𝜆+i
√
上式中 i = −1.
定 理 7.1.5 两个 𝑛 阶多项式矩阵(初等变换下)等价的充要条件是: 它们有相
同的秩和初等因子组.
证明留作练习.
7.2.1 多项式方阵的相似判定
先讨论常数方阵相似与其特征矩阵之间的关系.
对于多项式矩阵还可以表示成系数为常数矩阵的多项式, 称为矩阵多项式. 如
3𝜆2 + 𝜆 + 2 6𝜆 + 2 =
3 0 2 1 6 2 2
𝜆 + 𝜆+
𝜆2 𝜆2 − 2𝜆 + 1 1 1 0 −2 0 1
证明 设 U(𝜆) 可写成如下矩阵多项式:
其中 U0 , U1 , · · · , U𝑚 为 𝑛 阶常数方阵, 且 U0 ̸= O.
若 𝑚 = 0, 则令 𝑃 (𝜆) = O, R = U0 , 等式成立.
设 𝑚 > 0, 且令
其中 X0 , X1 , · · · , X𝑚−1 为 𝑛 阶待定方阵, 则
R = U𝑚 + AX𝑚−1
或
U−1 (𝜆)(𝜆E − A) = (𝜆E − B)V(𝜆) (7.9)
根据引理7.2.1, 令
等式两端可知左端方括号中的矩阵必为常数矩阵, 设
则
𝐶(𝜆E − A) = (𝜆E − 𝐵)𝑆 (7.13)
𝜆𝐸 − 𝐴 = 𝜆E − 𝑃 𝐵𝑃 −1 = 𝑃 (𝜆𝐸 − 𝐵)𝑃 −1
由引理7.2.2可知 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 等价.
充分性. 设 𝜆𝐸 − 𝐴 和 𝜆𝐸 − 𝐵 等价, 即存在可逆方阵 𝑅, 𝑆 使
𝜆𝐸 − 𝐴 = 𝑅(𝜆𝐸 − 𝐵)𝑆
或
𝜆𝐸 − 𝐴 = 𝜆𝑅𝑆 − 𝑅𝐵𝑆
1 0 2
3 0 8
𝐵=
3 −1 6
−2 0 −5
是否相似?
解 矩阵 𝜆𝐸 − 𝐴 的初等因子为: 𝜆 − 2, (𝜆 − 1)2 , 而 𝜆𝐸 − 𝐵 的初等因子为:
𝜆 + 1, (𝜆 + 1)2 , 它们的初等因子不同, 因而 𝐴, 𝐵 不相似.
定 义7.2.1 设矩阵𝐴 为数域𝐾 上的 𝑛 阶方阵, 𝑓 (𝜆) 为属于 𝐾 上的多项式, 若
𝑓 (𝐴) = 0, 则称 𝑓 (𝜆) 为矩阵 𝐴 的化零多项式.
矩阵 𝐴 的化零多项式有无穷多, 根据 Hamilton-Cayley 定理知 𝐴 的特征多
项式 𝑓 (𝜆) = det (𝜆𝐸 − 𝐴) 就是 𝐴 的化零多项式, 而且它是首一多项式. 在所有
𝐴 的化零多项式中次数最低的首一多项式 𝑔(𝜆) 称为 𝐴 的极小多项式(minimal
7.2 Jordan 标准形 195
polynomial).
定 理 7.2.2 设 𝑔(𝜆) 为 𝐴 的极小多项式, 𝑓 (𝜆) 为任一多项式, 𝑓 (𝜆) 为 𝐴 的化
零多项式, 当且仅当它能被 𝑔(𝜆) 整除.
证 明 必 要 性. 设 𝑓 (𝐴) = 0, 将 𝑓 (𝜆) 分 解 为 𝑓 (𝜆) = 𝑔(𝜆)𝑞(𝜆) + 𝑟(𝜆), 且
deg 𝑟(𝜆) < deg 𝑔(𝜆), 则
0 = 𝑓 (𝐴) = 𝑔(𝐴)𝑞(𝐴) + 𝑟(𝐴)
𝑓 (𝐴) = 𝑔(𝐴)𝑞(𝐴) = 0
推论 7.2.2 矩阵 𝐴 的极小多项式是唯一的.
推论 7.2.3 矩阵𝐴 的极小多项式是其特征多项式的因子.
定理 7.2.3 设 𝐴 为数域 𝐾 上的 𝑛 阶方阵, 𝑑1 (𝜆), 𝑑2 (𝜆), · · · , 𝑑𝑛 (𝜆) 是 𝜆𝐸 − 𝐴
的不变因子, 则 𝑑𝑛 (𝜆) 是 𝐴 的极小多项式.
证明 设 𝐷𝑘 (𝜆) 为 𝜆𝐸 − 𝐴 的 𝑘 阶行列式因子, 则 𝐷𝑛 (𝜆) = det(𝜆𝐸 − 𝐴), 且
𝐷𝑛 (𝜆)
(𝜆𝐸 − 𝐴)𝐵(𝜆) = 𝐸 = 𝑑𝑛 (𝜆)𝐸 (7.16)
𝐷𝑛−1 (𝜆)
由引理7.2.1得
𝑔(𝜆)𝐸 = (𝜆𝐸 − 𝐴)𝑃 (𝜆) + 𝑅
由 𝑔(𝐴) = 0 可知 𝑅 = 0, 即
由式(7.17)得
𝑑𝑛 (𝜆)𝐸 = (𝜆𝐸 − 𝐴)𝑃 (𝜆)𝑞(𝜆)
𝑔(𝜆) = 𝑑𝑛 (𝜆)
即 𝑑𝑛 (𝜆) 是 𝐴 的极小多项式.
7.2.2 Jordan 矩阵
定义 7.2.2 将形如
𝜆0 1
𝜆0 1
.. ..
𝐽0 =
. .
𝜆0 1
𝜆0
的 𝑚 阶方阵称为特征值 𝜆0 的 Jordan 块.
这种矩阵相应的特征矩阵的初等因子最简单.
定 理 7.2.4 设 𝐽0 为特征根 𝜆0 的 𝑚 阶 Jordan 块, 则 𝜆𝐸 − 𝐽0 的初等因子为
(𝜆 − 𝜆0 )𝑚 .
证明 先求 𝜆𝐸 − 𝐽0 的不变因子, 目前有两种方法可用: À 求矩阵的 𝑘 阶行列
式因子, 通过式 (7.4)求不变因子; Á 对矩阵实施初等变换化为Smith 标准形, 标准
形的对角元即为不变因子. 再由不变因子求出初等因子. 这里用方法 Á, 方法 À作
为练习.
对矩阵 𝜆𝐸 − 𝐽0 实施初等变换, 求出它的 Smith 标准形,得
7.2 Jordan 标准形 197
𝜆𝐸 − 𝐽0
𝜆 − 𝜆0 −1
𝜆 − 𝜆0 −1
.. ..
=
. .
𝜆 − 𝜆0 −1
𝜆 − 𝜆0
1 0
(𝜆 − 𝜆0 )2 −1
.. ..
swap(𝐶1 ,𝐶2 );𝑅2 +(𝜆−𝜆0 )×𝑅1
−−−−−−−−−−−−−−−−−−→
. .
𝐶2 +(𝜆−𝜆0 )×𝐶1 ;(−1)×𝑅1
𝜆 − 𝜆0 −1
𝜆 − 𝜆0
1 0
1 0
swap(𝐶2 ,𝐶3 );𝑅3 +(𝜆−𝜆0 )×𝑅2 (𝜆 − 𝜆0 )3 −1
−−−−−−−−−2−−−−−−−−−→ .. ..
𝐶3 +(𝜆−𝜆0 ) ×𝐶2 ;(−1)×𝑅2 . .
𝜆 − 𝜆0 −1
𝜆 − 𝜆0
···
1 0
1 0
.. ..
swap(𝐶𝑚−2 ,𝐶𝑚−1 );𝑅𝑚−1 +(𝜆−𝜆0 )×𝑅𝑚−2
−−−−−−−−−−− − − −−− −− −−− − −−−→
. .
𝐶𝑚−1 +(𝜆−𝜆0 )𝑚−2 ×𝐶𝑚−2 ;(−1)×𝑅𝑚−2
(𝜆 − 𝜆0 )𝑚−1
−1
(𝜆 − 𝜆0 )
1 0
1 0
swap(𝐶𝑚−1 ,𝐶𝑚 );𝑅𝑚 +(𝜆−𝜆0 )×𝑅𝑚−1 1 0
−−−−−−−−−𝑚−1 −−−−−−−−−−−−−−→ .. ..
𝐶𝑚 +(𝜆−𝜆0 ) ×𝐶𝑚−1 ;(−1)×𝑅𝑚−1 . .
1 0
(𝜆 − 𝜆0 )𝑚
因此其初等因子为(𝜆 − 𝜆0 )𝑚 .
例7.2.2 求矩阵
4 1
𝐽1 =
4 1
4
的初等因子.
解 𝜆𝐸 − 𝐽1 的初等因子为 (𝜆 − 4)3 .
例7.2.3 求 Jordan 块, 其初等因子分别为 (𝜆 − 3)2 和 𝜆3 .
0 1 0
2 1
解 Jordan 块 𝐽1 = 和 𝐽2 =
0 0 1 的初等因子分别为
0 2
0 0 0
(𝜆 − 3)2 和 𝜆3 .
实际上每个常数也可看成是一个 1 阶的 Jordan 块, 如 1 阶矩阵 (𝑎)(𝑎 为常数),
它也是一个 1 阶 Jordan 块, 其初等因子为 𝜆 − 𝑎.
定义 7.2.3 形如
𝐽1
𝐽2
𝐽 = ..
.
𝐽𝑘
0
0 1
0 1
0
2 1
2
显然 Jordan 矩阵是一种比较简单的矩阵.
定 理 7.2.5 复数域上任一个 𝑛 阶方阵 𝐴 都与一个 Jordan 矩阵相似, 并且除
了 Jordan 矩阵中 Jordan 块的排列次序外, 与 𝐴 相似的 Jordan 矩阵由 𝐴 唯一确定.
证 明 设 矩 阵 𝜆𝐸 − 𝐴 在 复 数 域 上 的 初 等 因 子 为 (𝜆 − 𝜆1 )𝑚1 , (𝜆 −
𝜆2 )𝑚2 , · · · , (𝜆 − 𝜆𝑠 )𝑚𝑠 , 且 𝑚1 + 𝑚2 + · · · + 𝑚𝑠 = 𝑛, 𝜆1 , 𝜆2 , · · · , 𝜆𝑠 为 𝐴 的特
征根, 其中可能有相等的, 则对应每个初等因子 (𝜆 − 𝜆𝑖 )𝑚𝑖 唯一确定一个 Jordan 块
𝜆𝑖 1
𝜆𝑖 1
.. ..
𝐽𝑖 =
. .
𝜆𝑖 1
𝜆𝑖
𝑚𝑖 ×𝑚𝑖
则 Jordan 矩阵
𝐽1
𝐽2
𝐽 = ..
.
𝐽𝑠
200 第7章 矩阵的 Jordan 标准形
的 Jordan 标准形.
解 用初等变换求 𝜆𝐸 − 𝐴 的不变因子,
𝜆−3 1 −1 −3
1 𝜆−3 −1 −2
0 0 𝜆−4 −1
0 0 0 𝜆−4
1 0 0 0
swap(𝐶1 ,𝐶2 );𝑅2 −(𝜆−3)×𝑅1
0 −(𝜆 − 2)(𝜆 − 4) 𝜆 − 4 3𝜆 − 11
−−−−−−−−−−−−−−−−−−−−→
𝐶2 −(𝜆−3)×𝐶1 ;𝐶3 +𝐶1 ;𝐶4 +3×𝐶1 0
0 𝜆−4 −1
0 0 0 𝜆−4
1 0 0 0
0
swap(𝐶2 ,𝐶4 );swap(𝑅2 ,𝑅3 ) −1 𝜆−4 0
−−−−−−−−−−−−−−−→
0
3𝜆 − 11 𝜆 − 4 −(𝜆 − 2)(𝜆 − 4)
0 𝜆−4 0 0
1 0 0 0
0
𝐶3 +(𝜆−4)×𝐶2 ;𝑅3 +(3𝜆−11)×𝑅2 ;(−1)×𝑅2 1 0 0
−−−−−−−−−−−−−−−−−−−−−−−−−−→
𝑅4 +(𝜆−4)×𝑅2 0
0 (𝜆 − 4)(3𝜆 − 10) −(𝜆 − 2)(𝜆 − 4)
0 0 (𝜆 − 4)2 0
1 0 0 0
swap(𝑅3 ,𝑅4 );𝑅4 −3×𝑅2 0 1 0 0
−−−−−−−−−−−−−−→ 1
swap(𝑅3 ,𝑅4 );(1/2)×𝑅4 0 0 (𝜆 − 4) − (𝜆 − 2)(𝜆 − 4)
2
0 0 (𝜆 − 4)2 0
7.3 Jordan 标准形的几何意义 201
1 0 0 0
𝑅4 −(𝜆−4)×𝑅2 ;2×𝑅4
0 1 0 0
−−−−−−−−−−−−−→
𝐶4 +(1/2)(𝜆−2)×𝐶3 0
0 (𝜆 − 4) 0
0 0 0 (𝜆 − 2)(𝜆 − 4)2
2
4
4 1
4
则存在 𝑉 的直和分解
𝑉 = 𝑊𝜆1 ⊕ 𝑊𝜆2 ⊕ · · · ⊕ 𝑊𝜆𝑠
其中
𝑚𝑖
𝑊𝜆𝑖 = 𝑥 ∈ 𝑉 (𝜆𝑖 𝐸 − 𝐴) 𝑥=0
𝑚𝑖 𝑚𝑖
(𝜆𝑖 𝐸 − 𝐴) (𝐴𝑥) = 𝐴 (𝜆𝑖 𝐸 − 𝐴) 𝑥=0
𝑠
𝑔(𝜆) Y
= (𝜆 − 𝜆𝑗 )𝑚𝑗 , 𝑖 = 1, 2, · · · , 𝑠
(𝜆 − 𝜆𝑖 ) 𝑖
𝑚
𝑗=1, 𝑗̸=𝑖
𝑠
X 𝑔(𝜆)
𝑢𝑖 (𝜆) =1 (7.18)
𝑖=1
(𝜆 − 𝜆𝑖 )𝑚𝑖
令
𝑠
𝑚𝑗
Y
𝑦𝑖 = 𝑢𝑖 (𝐴) (𝐴 − 𝜆𝑗 𝐸) 𝑦
𝑗=1, 𝑗̸=𝑖
因
(𝐴 − 𝜆𝑖 𝐸)𝑚𝑖 𝑦𝑖 = 𝑢𝑖 (𝐴)𝑔(𝐴)𝑦 = 0, 𝑖 = 1, 2, · · · , 𝑠
𝑠
!
Y
𝑢1 (𝜆)(𝜆 − 𝜆1 )𝑚1 + 𝑣(𝜆) (𝜆 − 𝜆𝑗 )𝑚𝑗 =1
𝑗=2
将 𝜆 = 𝐴 代入上式, 后作用到 𝑥 上, 有
7.3 Jordan 标准形的几何意义 203
" 𝑠
#
𝑚1 𝑚𝑗
Y
𝑢(𝐴) (𝐴 − 𝜆𝑖 𝐸) 𝑥 + 𝑣(𝐴) (𝐴 − 𝜆𝑗 𝐸) 𝑥 = 𝐸𝑥 = 𝑥
𝑗=2
根据假设 𝑥 ∈ 𝑊𝜆1 , 所以
𝑚1
(𝐴 − 𝜆𝑖 𝐸) 𝑥=0
同时,
𝑥 ∈ 𝑊𝜆2 + 𝑊𝜆3 + · · · + 𝑊𝜆𝑠
得
𝑠
𝑚𝑗
Y
(𝐴 − 𝜆𝑗 𝐸) 𝑥=0
𝑗=2
可得 𝑥 = 0. 类似地可证明
𝑊𝜆𝑖 ∩ 𝑊𝜆1 + · · · + 𝑊𝜆𝑖−1 + 𝑊𝜆𝑖+1 + · · · + 𝑊𝜆𝑠 = {0}
设矩阵 𝐴 的初等因子为
𝑡
!
X
其中特征值 𝜆𝑖 可以重复 𝑚𝑖 = 𝑛 . 选择 Jordan 标准形矩阵为
𝑖=1
𝐽 = diag(𝐽1 , 𝐽2 , · · · , 𝐽𝑡 )
𝑃 −1 𝐴𝑃 = 𝐽 ⇐⇒ 𝐴𝑃 = 𝑃 𝐽
𝐴𝑝𝑖1 = 𝜆𝑖 𝑝𝑖1 , 𝐴𝑝𝑖2 = 𝑝𝑖1 + 𝜆𝑖 𝑝𝑖2 , · · · , 𝐴𝑝𝑖𝑚𝑖 = 𝑝𝑖(𝑚𝑖 −1) + 𝜆𝑖 𝑝𝑖𝑚𝑖 (7.19)
将方程 (7.19)改写成
根据(7.20)先求 𝑝𝑖𝑚𝑖 再依此计算 𝑝𝑖(𝑚𝑖 −1) , 𝑝𝑖(𝑚𝑖 −2) , · · · , 𝑝𝑖1 , 在计算 𝑝𝑖𝑚𝑖 时, 应满
足下列条件:
𝑥1 + 𝑥2 − 𝑥3 − 2𝑥4 = 0
随后求得 T
𝑝31 = (𝐴 − 4𝐸)𝑝32 = [−1, 0, −1, 0]
最后求得相似矩阵:
1 1 −1 1
1 −1 0 −1
𝑃 = [𝑝11 , 𝑝21 , 𝑝31 , 𝑝32 ] =
0
0 −1 2
0 0 0 −1
1 1 −1 −2
1 −1 −1 0
1
−1
𝑃 =
2
0 0 −2 −4
0 0 0 −2
可以验证
2
−1
4
𝑃 𝐴𝑃 =
4 1
4
7.4 习 题
1. 分别求下列多项式矩阵 (𝜆-矩阵)的秩和各阶子式的最大公因式:
1 0 0 1 𝜆 2𝜆 − 1
𝐴(𝜆) = 0 𝜆−1 0 , 𝐵(𝜆) = 0 −𝜆 𝜆2
0 1 𝜆2 − 1 2 𝜆 𝜆2 + 4𝜆 − 2
206 第7章 矩阵的 Jordan 标准形
2. 判别下列矩阵是否为单模矩阵, 若是求它的逆矩阵:
1 0 1
1 𝜆 0
0 𝜆−1 𝜆
𝐴(𝜆) = , 𝐵(𝜆) = 2 𝜆 1
0 𝜆−1 𝜆
𝜆2 + 1 2 𝜆2 + 1
𝜆 1 𝜆2
𝜆 2𝜆 + 1 1
𝐶(𝜆) = 1 𝜆+1 𝜆2 + 1
𝜆−1 𝜆 −𝜆2
𝜆 1 1 −𝜆
𝐴(𝜆) = , 𝐵(𝜆) =
0 𝜆 1 𝜆
𝜆−1 0 0 𝜆2 − 1 0 0
1 𝜆−1 0 , 0 𝜆 0
0 1 𝜆−1 0 0 𝜆(𝜆 + 1)2
1 + 𝜆2 𝜆2 −𝜆2
1 𝜆2 + 𝜆 0
𝜆 𝜆 −𝜆
5. 设
2 1 0 1 1 1
𝐴= 0 1 2 , 𝐵= 2 0 1
1 −1 1 −1 −1 2
子:
1 −𝜆 0 2
0 𝜆+1 −𝜆 − 1
3
0 2 −1 − 𝜆 −2
𝜆 + 𝜆2 + 𝜆 + 1 (𝜆 + 1)2 𝜆3 − 𝜆 ,
−1 − 𝜆2
𝜆 1 2+𝜆
𝜆3 + 𝜆2 + 𝜆 + 1 𝜆+1 𝜆3 + 𝜆2 2
1 −𝜆 0 1+𝜆
8. 先求下列多项式矩阵在实数域上的初等因子, 再求其不变因子和标准形:
𝜆2 − 2
2
(𝜆 + 1) 0
𝜆(𝜆 + 1) ,
𝜆2
𝜆 √
𝜆(𝜆 + 2)
𝑝𝑚 𝑚2 𝑚𝑠
1 (𝜆), 𝑝2 (𝜆), · · · , 𝑝𝑠 (𝜆)
1
3 1 3 2 1 −1 2 0 0
−4 −2 6 , 7 4 −22 , 1 1 1
−1 −1 5 2 1 5 1 −1 3
11. 证明下列方阵中没有相似的矩阵:
𝑎 0 0 𝑎 0 0 𝑎 1 0
0 𝑎 0 , 0 𝑎 1 , 0 𝑎 1
0 0 𝑎 0 0 𝑎 0 0 𝑎
1 2 0 1 −1 2 3 0 8
0 2 0 , 3 −3 6 , 3 −1 6
−2 −2 −1 2 −2 4 −2 0 −5
1 −3 0 3
3 −2 1 −2 −6 0 13
2 −2 2 ,
0 −3 1 3
3 −6 5
−1 −4 0 8