Professional Documents
Culture Documents
1 本书概率统计全景
公式连篇,可能是“鸢尾花书”最枯燥无味的一章
概率论作为数学学科,可以且应该从公理开始建设,和几何、代数的思路一样。
The theory of probability as mathematical discipline can and should be developed from axioms in
exactly the same way as Geometry and Algebra.
—— 安德雷·柯尔莫哥洛夫 (Andrey Kolmogorov) | 概率论公理化之父 | 1903 ~ 1987
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 2 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
1.1 必备数学工具:一个线性代数小测验
本书前文提到,《统计至简》一册的核心特点是——多元。《矩阵力量》中介绍的线性代数
工具是本书核心数学工具。因此,在开始本书阅读之前,请大家完成本节这个小测验。
如果大家能够轻松完成这个测验,欢迎大家开始本书后续内容学习;否则,建议大家重温
《矩阵力量》中相关数学工具。
数据矩阵
给定数据矩阵 X,如何求其质心、中心化数据、标准化数据、格拉姆矩阵、协方差矩阵、相
关系数矩阵?
协方差矩阵
给定 2 × 2 协方差矩阵 Σ:
12 1,2 1 2
Σ = (test.1)
1,2 1 2 22
什么条件下 Σ 是正定矩阵?
定义如下二元函数:
x 1 1,2 1 2 x1
T 2
f ( x1 , x2 ) = x T Σx = 1
22 x2
(test.2)
x2 1,2 1 2
Cholesky 分解
Σ = RT R (test.3)
上三角矩阵 R 的特点是什么?如何从几何角度理解 R?
特征值分解
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 3 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
对 Σ 特征值分解:
Σ = VΛV T (test.4)
等式右侧第二个矩阵 V 对应转置运算,为什么?
矩阵 V 有什么特殊性质?如何从向量空间角度理解 V?
矩阵 Λ 有什么特殊性质?什么条件下,Σ 特征值中有 0?
将 (test.4) 写成:
V T ΣV = Λ (test.5)
把 V 写成 [v1, v2],上式如何展开?
几何角度来看,上式代表什么?
奇异值分解
奇异值分解有哪四种类型?每种类型之间存在怎样的关系?
奇异值分解和向量四个空间有怎样联系?
多元高斯分布
多元正态分布的概率密度函数 PDF 为:
1
exp − ( x − μ ) Σ −1 ( x − μ )
T
fχ ( x) = 2 (test.6)
D 1
( 2π ) 2 Σ 2
( x − μ) Σ −1 ( x − μ ) 的含义是什么?
T
D 1
( 2π ) 2 的作用是什么? Σ 2 的含义是什么?
什么情况下,上式不成立?
马氏距离的定义是什么?马氏距离和欧氏距离差别是什么?
测验题目到此结束。
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 4 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
本书不就上述题目给出具体答案,所有答案都在《矩阵力量》一册,请大家自行查阅。
1.2 统计描述
给定随机变量 X 的 n 个样本 {x(1), x(2), …, x(n)},X 的样本均值为:
x( ) + x( ) + x( ) + + x(
n)
1
n 1 2 3
X = x(i ) = (1)
n i =1 n
X 的样本方差为:
( )
n 2
x( ) − X
1
var ( X ) = X2 =
i
(2)
n − 1 i =1
X 的样本标准差为:
( x( ) − )
n 2
1
X = std ( X ) = var ( X ) = i
(3)
n −1
X
i =1
对于样本数据,随机变量 X 和 Y 的协方差为:
cov ( X , Y ) =
1 n (i )
x − X
n − 1 i=1
( ) ( y( ) − )
i
Y
(4)
对于样本数据,随机变量 X 和 Y 的相关性系数为:
cov ( X , Y )
X ,Y = (5)
X Y
注意,除非特殊说明,本书一般不从符号上区分总体、样本的均值、方差、标准差等。
1.3 概率
古典概率模型
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 5 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
nA
Pr ( A ) = (6)
n
Pr ( A, B )
Pr ( A B ) = (7)
Pr ( B )
Pr ( A, B )
Pr ( B A ) = (8)
Pr ( A )
贝叶斯定理为:
Pr ( A B ) Pr ( B ) = Pr ( B A ) Pr ( A ) = Pr ( A, B ) (9)
Pr ( B ) = Pr ( Ai , B ) (10)
i =1
Pr ( A B ) = Pr ( A )
Pr ( B A ) = Pr ( B ) (11)
Pr ( A, B ) = Pr ( A ) Pr ( B )
Pr ( A, B C ) = Pr ( A C ) Pr ( B C ) (12)
离散随机变量
离散随机变量 X 的概率质量函数满足:
px
X ( x ) = 1, 0 pX ( x ) 1 (13)
离散随机变量 X 的期望值为:
E ( X ) = x pX ( x ) (14)
x
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 6 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
离散随机变量 X 的方差为:
var ( X ) = ( x − E ( X ) ) p X ( x )
2
(15)
x
p
x y
X ,Y ( x, y ) = 1, 0 p X ,Y ( x, y ) 1 (16)
(X, Y) 的协方差定义为:
(
cov ( X , Y ) = E ( X − E ( X ) ) (Y − E (Y ) ) )
= p X ,Y ( x, y ) ( x − E ( X ) ) ( y − E (Y ) )
(17)
x y
边缘概率 pX(x) 为:
pX ( x ) = p
y
X ,Y ( x, y ) (18)
边缘概率 pY(y) 为:
pY ( y ) = p
x
X ,Y ( x, y ) (19)
p X ,Y ( x, y )
pX Y ( x y ) = (20)
pY ( y )
pX|Y(x|y) 对 x 求和等于 1:
p ( x y) =1
x
XY (21)
p X ,Y ( x, y )
pY X ( y x ) = (22)
pX ( x )
pY|X(y|x) 对 y 求和等于 1:
p ( y x) = 1
y
YX (23)
如果离散随机变量 X 和 Y 独立,则:
pX Y ( x y ) = pX ( x )
pY X ( y x ) = pY ( y ) (24)
p X ,Y ( x, y ) = pY ( y ) p X ( x )
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 7 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
离散分布
[a, b] 上离散均匀分布的概率质量函数为:
1
pX ( x ) = , x = a, a + 1, b − 1, b (25)
b − a +1
伯努利分布的概率质量函数为:
p X ( x ) = p x (1 − p ) x 0,1
1− x
(26)
二项分布的概率质量函数为:
p X ( x ) = Cnx p x (1 − p )
n− x
, x = 0,1,..., n (27)
多项分布的概率质量函数为:
n! K
p X1 ,..., X K ( x1 ,, xK ; n, p1 ,, pK ) ( x1 !) ( x2 !) ( xK !)
p1x1 pKxK when x
i =1
i =n
(28)
0 otherwise
k
其中 xi (i = 1, 2, …, K) 为非负整数;pi 取值范围为 (0, 1),且 pi = 1 。
i =1
泊松分布的概率质量函数为:
exp ( − ) x
pX ( x ) = , x = 0,1, 2,... (29)
x!
连续随机变量
连续随机变量 X 的概率密度函数满足:
+
−
f X ( x ) d x = 1, f X ( x ) 0 (30)
连续随机变量 X 期望为:
E ( X ) = x fX ( x) d x
x
(31)
连续随机变量 X 方差为:
var ( X ) = E ( X − E ( X ) ) = ( x − E ( X )) f X ( x)d x
2 2
(32)
x
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 8 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
fX ( x) = f
y
X ,Y ( x, y ) d y (33)
fY ( y ) = f
x
X ,Y ( x, y ) d x (34)
f X ,Y ( x, y )
fX Y ( x y) = (35)
fY ( y )
f X ,Y ( x, y )
fY X ( y x ) = (36)
f X ( x)
利用贝叶斯定理,联合概率 fX,Y(x,y) 为:
f X ,Y ( x, y ) = f X Y ( x y ) fY ( y ) = fY X ( y x ) f X ( x ) (37)
如果连续随机变量 X 和 Y 独立,则:
fX Y ( x y) = fX ( x)
fY X ( y x ) = f Y ( y ) (38)
f X ,Y ( x, y ) = f X ( x ) fY ( y )
连续分布
区间 [a, b] 的连续均匀分布概率密度函数为:
1
for a x b,
f X ( x) = b − a (39)
0 for x a or x b
一元学生 t-分布的概率密度函数为:
+ 1 − ( +1)
2 x2 2
fX ( x) = 1 + (40)
2
其中, 大于 0。
指数分布的概率密度函数为:
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 9 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
exp ( − x ) x 0
fX ( x) = (41)
0 x0
其中,λ 大于 0。
Beta(α, β) 分布的概率密度函数为:
( + )
f X ( x; , ) = x −1 (1 − x )
−1
(42)
( ) ( )
x −1 (1 − x )
−1
f X ( x; , ) = (43)
B ( , )
其中,Beta 函数 B ( , ) 为:
( ) ( )
B ( , ) = (44)
( + )
Dirichlet 分布概率密度函数为:
K K
1
f X1 ,, X K ( x1 ,, xK ; 1 , , K ) = xii −1 ,
B (1 ,, K ) i =1
x
i =1
i =1 (45)
其中,αi 大于 0。
( ) i
B (1 ,, K ) = i =1
(46)
K
i
i =1
条件概率
E (Y X = x ) = y pY X ( y x ) (47)
y
E(Y) 的全期望定理为:
E ( Y ) = E ( E (Y | X ) ) = E (Y | X = x ) p X ( x ) (48)
x
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 10 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
E ( X Y = y ) = x pX Y ( x y ) (49)
x
E(X) 的全期望定理为:
E ( X ) = E ( E ( X | Y ) ) = E ( X | Y = y ) pY ( y ) (50)
y
(
var (Y X = x ) = y − E (Y X = x ) pY X ( y x ) )
2
(51)
y
( )
var ( X Y = y ) = x − E ( X Y = y ) p X Y ( x | y )
2
(52)
x
对于 var(Y),全方差定理为:
对于 var(X),全方差定理为:
E ( Y X = x ) = y fY X ( y x ) d y (55)
y
条件方差 var(Y|X = x) 为:
( )
var (Y X = x ) = y − E (Y X = x ) fY X ( y x ) d y
2
(56)
y
E( X Y = y) = x fX Y ( x y)d x (57)
x
( )
var ( X Y = y ) = X − E ( X Y = y ) f X Y ( x y ) d x
2
(58)
x
1.4 高斯
一元高斯分布
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 11 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
一元高斯分布的概率密度函数为:
1 −1 x − 2
fX ( x) = exp
2
(59)
2π
标准正态分布的概率密度函数为:
1 −z2
fZ ( z ) = exp (60)
2π 2
二元高斯分布
1 −1 1 x − 2 x − X y − Y y − Y
2
f X ,Y ( x, y ) = exp
X
− 2 + (61)
2 (1 − X2 ,Y ) X X Y Y
X ,Y
2π X Y 1 − X2 ,Y
X 的边缘概率密度函数为:
1 −1 x − 2
fX ( x) = exp
2 X
X
(62)
X 2π
Y 的边缘概率密度函数为:
1 −1 x − 2
fY ( y ) = exp
2 Y
Y
(63)
Y 2π
多元高斯分布
多元高斯分布的概率密度函数为:
1
exp − ( x − μ ) Σ −1 ( x − μ )
T
fχ ( x) = 2 (64)
D 1
( 2π ) 2 Σ 2
其中,协方差矩阵 Σ 为正定矩阵。
条件高斯分布
如果 (X, Y) 服从二元高斯分布,且相关性系数不为±1,fY|X(y|x) 为:
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 12 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
Y
2
y − Y + X ,Y ( x − X )
1 X
fY X ( y x ) =
1
exp −
(65)
Y 1 − X2 ,Y 2π 2 Y 1 − X ,Y
2
条件期望 E(Y|X = x) 为:
Y
E (Y X = x ) = Y + X ,Y ( x − X ) (66)
X
条件方差 var(Y|X = x) 为:
(
var (Y X = x ) = 1 − X2 ,Y Y2) (67)
如果随机变量向量 χ 和 γ 服从多元高斯分布:
χ μ χ Σ χχ Σ χγ
γ N , (68)
μγ Σ γχ Σ γγ
其中,
X1 Y1
X Y
χ = 2 , γ = 2 (69)
XD YM
给定 χ = x 的条件下,γ 服从如下多元高斯分布:
γ χ = x −1
N Σ γχ Σ χχ ( )
x − μ χ + μγ , −1
Σ γγ − Σ γχ Σ χχ Σ χγ (70)
Expectation Variance
给定 χ = x 的条件下 γ 的条件期望为:
E ( γ χ = x ) = μγ χ = x = Σ γχ Σ χχ
−1
( x − μ χ ) + μγ (71)
协方差矩阵
随机变量向量 χ 的协方差矩阵为:
var ( χ ) = cov ( χ , χ ) = E ( χ − E ( χ ) ) ( χ − E ( χ ) )
T
(72)
= E ( χχ T ) − E ( χ ) E ( χ )
T
样本数据矩阵 X 的协方差矩阵 Σ 为:
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 13 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
( X − E ( X )) ( X − E ( X ))
T
Σ= (73)
n −1
合并协方差矩阵为:
K
1 1 K
Σ pooled = K (n k − 1) Σ k = ( nk − 1) Σ k
n − K k =1
(74)
(n
k =1
k − 1) k =1
K
其中, nk = n 。
k =1
1.5 随机
随机变量的函数
X
Y = aX 1 + bX 2 = a b 1 (75)
X2
Y 的期望、方差为:
E ( X1 ) var ( X 1 ) cov ( X 1 , X 2 ) a
E (Y ) = a b , var (Y ) = a b
var ( X 2 ) b
(76)
E ( X 2 ) cov ( X 1 , X 2 )
Σ
Y = vT χ (77)
Y 的期望、方差为:
E (Y ) = v T μ χ
(78)
var (Y ) = v T Σ χ v
χ 在规范正交系 V 投影得到 γ:
γ =V T χ (79)
γ 的期望、协方差矩阵为:
E ( γ ) = V T μχ
(80)
var ( γ ) = V T Σ χV
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 14 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
1.6 频率派
频率派统计推断
E ( X k ) = , var ( X k ) = 2 (81)
这 n 个随机变量的平均值 X 近似服从如下正态分布:
n
2
X
1
X= ~ N , (82)
n
k
n k =1
最大似然估计的优化问题为:
n n
ˆMLE = arg max f X ( xi ; ) = arg max ln f X ( xi ; )
i i
(83)
i =1 i =1
概率密度估计
概率密度估计函数为:
1 1 n x − x( )
( )
i
1 n
fˆX ( x ) = K h x − x ( ) = − x +
i
K , (84)
n i =1 n h i =1 h
K ( x) = K (−x)
+ 1 + x (85)
K ( x)d x =
h − h
K d x =1
−
1.7 贝叶斯派
贝叶斯分类
利用贝叶斯定理分类:
f X |Y ( x Ck ) pY ( Ck )
f Y | X ( Ck x ) = (86)
fX ( x)
fY|X(Ck | x) 叫后验概率,又叫成员值。
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 15 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
fX(x) 为证据因子,也叫证据。
fX|Y(x|Ck) 为似然概率。
贝叶斯分类优化问题:
其中,k = 1,2,…K。
贝叶斯统计推断
模型参数的后验分布为:
f X | ( x | ) f ( )
f | X ( | x ) = (88)
f ( x | ) f ( ) d
X |
后验 ∝ 似然 × 先验,最大化后验估计的优化问题等价于:
1.8 椭圆三部曲
马氏距离
马氏距离的定义为:
d= ( x − μ) Σ −1 ( x − μ )
T
(90)
D 维马氏距离的平方则服从自由度为 D 的卡方分布:
d 2 = ( x − μ ) Σ −1 ( x − μ ) (2df = D )
T
(91)
线性回归
多元线性回归可以写成超定方程组:
y = Xb (92)
如果 XTX 可逆,则 b 为:
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 16 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
b = (XTX ) XTy
−1
(93)
主成分分析
注意,这部分公式实际上来自《矩阵力量》;此外,我们将会在《数据有道》也会用到这
些公式。
X = U X S X VX T (94)
其中,SX 为对角方阵。
利用 (94),X 的格拉姆矩阵可以展开为:
G = VX S X 2VX T (95)
上式便是格拉姆 G 的特征值分解。
X c = U c ScVc T (96)
而协方差矩阵 Σ 则可以写成:
Sc2 T
Σ = Vc Vc (97)
n −1
sc2_ j
c _ j = (98)
n −1
Z X = U Z S ZVZ T (99)
相关性系数矩阵 P 则可以写成:
S Z2
P = VZ VZ T (100)
n −1
上式相当于对 P 特征值分解。
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com
Page 17 | Chapter 1 本书概率统计全景 | Book 5《统计至简》 | 鸢尾花书:从加减乘除到机器学习
学完本册《统计至简》后,再回过头来看本章罗列的这些公式时,希望大家看到的不再是冷
冰冰的符号,而是一幅幅彩色的图像。
本 PDF 文件为作者草稿,发布目的为方便读者在移动终端学习,终稿内容以清华大学出版社纸质出版物为准。
版权归清华大学出版社所有,请勿商用,引用请注明出处。
代码及 PDF 文件下载:https://github.com/Visualize-ML
本书配套微课视频均发布在 B 站——生姜 DrGinger:https://space.bilibili.com/513194466
欢迎大家批评指教,本书专属邮箱:jiang.visualize.ml@gmail.com