作业聚类分析

Uploaded by

Amy

0% found this document useful (0 votes)

2 views1 page

Original Title

作业_聚类分析

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views1 page

作业聚类分析

Uploaded by

Amy

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

清华大学《模式识别与机器学习》

（30250293）2021 年春季课程作业

第十二章（聚类分析）作业

12.1 假设我们的样本集 D = {x1 , x 2 ,..., x n } 来自于 𝑘 个高斯分布，即 𝑝𝑀 (𝒙) =

∑𝑘𝑗=1 𝛼𝑗 𝒩(𝒙|𝝁𝒋 , 𝚺𝒋 )，其中𝛼𝑗 , 𝝁𝒋 , 𝚺𝒋 是混合高斯分布第j个成分的比例、均值以及
协方差矩阵，试推导采用 EM 算法求解混合高斯模型参数的过程。
（1）根据贝叶斯公式，求后验期望，写出需要最大化的函数形式。
（2）最大化（1）中的函数，写出模型参数𝛼𝑗 、𝝁𝒋 、𝚺𝒋 的更新公式。

12.2 现有 8 个一维样本点如下：
{−5.1, −4.4, −2.9, −2.6, 10.1, 11.9, 12.3, 13.6}
请尝试采用分级聚类的方法对上述样本进行聚类，其中类别之间的距离定义
为 d min (Di , D j ) ， d min (Di , D j ) = min x − x ' 。画出聚类树，注明横纵坐标值，
i xD
x' D j

并说明你倾向于将这些数据聚为几类，为什么。

12.3 计算机小实验：MNSIT 数据集聚类

在本问题中，我们将利用聚类算法对 MNIST 训练集的“0”，“3”，“7”
三类样本集进行聚类分析，并观察各聚类算法的性能差异。
（1）请利用 K-means 算法，在 1 到 10 的类别数下对样本集进行聚类，分别使
用误差平方和𝐽𝑒 和轮廓系数 SC 确定聚类数目，并结合真实的类别数进行
分析。
（2）请利用 K-means 算法对样本集进行聚类（类别数为 3），选用任意一种初
始化方法，并采用 NMI 评估你的聚类结果（多次运行取平均值）。
（3）【选做】结合（2）中的聚类结果，编写一致聚类算法对样本重新聚类，采
用 NMI 评估你的聚类结果，观察在此问题中，一致聚类算法是否对聚类
效果有所提升。
提示：
若原始 MNIST 数据集过大，可从中随机抽取一部分作为该题的样本集。

C07 抽樣與抽樣分配 (2012習題解答)
Document14 pages
C07 抽樣與抽樣分配 (2012習題解答)
褚佩昕
0% (2)
Ch6 9homework 2021
Document8 pages
Ch6 9homework 2021
Amy
No ratings yet
硬聚类算法
Document23 pages
硬聚类算法
3291782300
No ratings yet
Lecture 03
Document13 pages
Lecture 03
dongguge1997
No ratings yet
面试题答案 40万年薪岗位面试到底问些什么？
Document41 pages
面试题答案 40万年薪岗位面试到底问些什么？
Lewis Hsia
No ratings yet
专题06 统计与概率-2023年高考数学复习（二三轮）专题新构想 - 副本
Document11 pages
专题06 统计与概率-2023年高考数学复习（二三轮）专题新构想 - 副本
447707844
No ratings yet
1.3 并集与交集 (第1课时）（教学课件）-【上好课】2022-2023学年高一数学同步备课系列（人教A版2019必修第一册）
Document34 pages
1.3 并集与交集 (第1课时）（教学课件）-【上好课】2022-2023学年高一数学同步备课系列（人教A版2019必修第一册）
caoxi163
No ratings yet
數值分析作業 Secant-Method
Document5 pages
數值分析作業 Secant-Method
ChiChiChen
100% (3)
Book5 Ch25 主成分分析统计至简鸢尾花书从加减乘除到机器学习
Document34 pages
Book5 Ch25 主成分分析统计至简鸢尾花书从加减乘除到机器学习
James Jiang
No ratings yet
(5) 规则化和模型选择
Document5 pages
(5) 规则化和模型选择
骨木
No ratings yet
2020「决策树及其集成」教案
Document19 pages
2020「决策树及其集成」教案
Ron Tan
No ratings yet
深度聚类算法综述邓祥
Document8 pages
深度聚类算法综述邓祥
苍菌菌
No ratings yet
R講義
Document27 pages
R講義
黃子軒
No ratings yet
第三次作业
Document11 pages
第三次作业
hfuttianxt
No ratings yet
基于卷积神经网络模型数值求解双曲型偏微分方程的研究
Document16 pages
基于卷积神经网络模型数值求解双曲型偏微分方程的研究
zhichaoy126
No ratings yet
量化论文
Document9 pages
量化论文
ubcaaufng
No ratings yet
基于聚类分析和人工智能的个性化推荐算法研究
Document3 pages
基于聚类分析和人工智能的个性化推荐算法研究
Lynn Polyxena
No ratings yet
结合分层和ADMM的高光谱图像解混方法房森
Document7 pages
结合分层和ADMM的高光谱图像解混方法房森
zhoujianjun
No ratings yet
响应曲面
Document5 pages
响应曲面
Zhixu Li
No ratings yet
08级数值计算方法A卷
Document4 pages
08级数值计算方法A卷
adbean
No ratings yet
数值分析2011
Document662 pages
数值分析2011
曹倬玮
No ratings yet
总结复习
Document49 pages
总结复习
w2285192081
No ratings yet
求解0 1整数规划的混合粒子群优化算法薛峰
Document4 pages
求解0 1整数规划的混合粒子群优化算法薛峰
有何不可
No ratings yet
2 线性代数
Document9 pages
2 线性代数
Gu est
No ratings yet
改进的NSGA II算法及其在星座优化设计中的应用
Document7 pages
改进的NSGA II算法及其在星座优化设计中的应用
chenbeiliuhuo
No ratings yet
Book5 Ch13 协方差矩阵统计至简鸢尾花书从加减乘除到机器学习
Document39 pages
Book5 Ch13 协方差矩阵统计至简鸢尾花书从加减乘除到机器学习
James Jiang
No ratings yet
计算方法 2022 实验二
Document1 page
计算方法 2022 实验二
1298992631
No ratings yet
计算方法 2022 实验二
Document1 page
计算方法 2022 实验二
1298992631
No ratings yet
02 MATLAB数组
Document11 pages
02 MATLAB数组
Chengcheng Liang
No ratings yet
第二十五章机器学习
Document7 pages
第二十五章机器学习
kai hong6927
No ratings yet
(Muchong.com) MATLAB 数据分析和统计
Document26 pages
(Muchong.com) MATLAB 数据分析和统计
zl
No ratings yet
2021多元统计期末A卷试题答案 SUSTech
Document10 pages
2021多元统计期末A卷试题答案 SUSTech
蔡于飛
No ratings yet
林胜 Et Al 2020 基于对抗式生成网络的农作物病虫害图像扩充
Document3 pages
林胜 Et Al 2020 基于对抗式生成网络的农作物病虫害图像扩充
bigliang98
No ratings yet
NOIP2014普级组复赛试题
Document6 pages
NOIP2014普级组复赛试题
snow lee
No ratings yet
黄英来艾昕 2021 改进残差网络在玉米叶片病害图像的分类研究
Document7 pages
黄英来艾昕 2021 改进残差网络在玉米叶片病害图像的分类研究
bigliang98
No ratings yet
2017217XXX 王二《算法设计与分析》上机作业报告（模板）
Document8 pages
2017217XXX 王二《算法设计与分析》上机作业报告（模板）
徐赟博
No ratings yet
題目卷1102下1
Document2 pages
題目卷1102下1
zzzzzoe0327
No ratings yet
5 机器学习基础
Document30 pages
5 机器学习基础
Gu est
No ratings yet
20160410
Document7 pages
20160410
hjxy
No ratings yet
統計計算與模擬
Document64 pages
統計計算與模擬
zoe
No ratings yet
2021 DSgraduate
Document8 pages
2021 DSgraduate
Chen Yanhui
No ratings yet
02 ArrayStruct
Document36 pages
02 ArrayStruct
Yau Long Cheung
No ratings yet
苗金利 26.【一轮利器·核心板块1】不等式、函数篇 Removed 第5讲集合与简易逻辑
Document6 pages
苗金利 26.【一轮利器·核心板块1】不等式、函数篇 Removed 第5讲集合与简易逻辑
20231102faxuejia
No ratings yet
数据库系统理论期末复习整理@2023
Document42 pages
数据库系统理论期末复习整理@2023
zhenglianghan
No ratings yet
第七章参数估计
Document107 pages
第七章参数估计
Jam Samzi
No ratings yet
Msem
Document30 pages
Msem
李奕男
No ratings yet
用python做科学计算 (Dragged) 3
Document28 pages
用python做科学计算 (Dragged) 3
zengwu961224
No ratings yet
matlab作业1
Document4 pages
matlab作业1
justin2foo
No ratings yet
0.2 DeepLearning Foundations 讲稿泛化误差分析
Document3 pages
0.2 DeepLearning Foundations 讲稿泛化误差分析
964520978sbj
No ratings yet
Matlab数学实验
Document156 pages
Matlab数学实验
操瑞嘉
No ratings yet
第3章单元测试1
Document6 pages
第3章单元测试1
jqk20031215
No ratings yet
Population and Sample Chinese Version
Document6 pages
Population and Sample Chinese Version
WONG JEN WEI Moe
No ratings yet
第8章聚类
Document86 pages
第8章聚类
mjmarco
No ratings yet
4 数理统计的基本概念
Document66 pages
4 数理统计的基本概念
henribecquerela
No ratings yet
02 陈剑管综数学基础3-6章讲义
Document23 pages
02 陈剑管综数学基础3-6章讲义
albertjiang830
No ratings yet
Ch12345Homework 20210219xg
Document5 pages
Ch12345Homework 20210219xg
Amy
No ratings yet
管導單元六
Document4 pages
管導單元六
王楷晴
No ratings yet
(2) 描述性統計學 Fin
Document40 pages
(2) 描述性統計學 Fin
ellachu0602
No ratings yet
Econometrics Projects (1) 11
Document19 pages
Econometrics Projects (1) 11
Trd Cat
No ratings yet