Professional Documents
Culture Documents
一、熟悉
SPSS 的判别分析的基本操作
二、掌握
1. 组统计量表格:是各组和总体的每个变量的描述统计分析。注意均值一栏,
是后面计算的基础。
组统计量
有效的 N(列表状态)
从上表可以看出,畅销款具有最高的平均收录机质量评分,滞销款的平均质量评分最低。但
是就销售价格而言,滞销款具有最低的平均销售价格。
2. 判别分析的前提,是要求各组均值应该具有显著差异,判别分析的结果才会
显著,所以,请用合适的图形表示出“组统计量表”中每个分量的均值在
各个组中的情况。
10
0
畅销 平销 滞销
收录机质量评分
8
7
6
5
4
3
2
1
0
畅销 平销 滞销
功能评分
800
700
600
500
400
300
200
100
0
畅销 平销 滞销
销售价格
从直方图中我们可以更直观的看到畅销款在收录机质量上具有优势,滞销款在质
量及功能上均具有不足。
3. 判别分析,一般我们会假设各组的协方差阵是相同的,请用合适的图形表示
出“组统计量表”中每个分量的标准差在各个组中的情况。
通过图形可以看出每个分量的方差在各个组中有一定的区别。
4. “组均值的均等性的检验”是对各组均值是否相等进行的假设检验。
请①给出检验的原假设
② 在该表中 Wilks lambda 是组内平方和与总体平方和的比,比值范围在 0 到
1 之间。值越小表示组间有很大的差异。值接近于 1 表示组间没有差异。
③ F 统计量是组间均方与组内均方的比。有两个自由度。如果显著水平 Sig 小
于给定的显著水平α,则拒绝原假设,认为组间差异比较大。否则,表示组间
差异不显著。请针对本表,分析检验的结果。
组均值的均等性的检验
Wilks 的
5. “汇聚的组内矩阵”显示了一个协方差阵和一个相关矩阵。
①其中,协方差矩阵是各个组内协方差矩阵相加构成的联合组内协方差阵,即
1 r
S (ni 1)S k ,请利用本组数据,验证 S 的正确性。这里 S k 是各组的协方差阵。
n r k 1
1/2
②相关矩阵是由上述 S 变换: R D SD1/2 得到,其中 D1/2 是 S 对角元素的平方根的倒
数组成的对角矩阵。请验证本表格中的 R 矩阵。
6. “协方差矩阵”给出了各组的组内协方差矩阵和总体协方差矩阵。
协方差矩阵a
a. 总的协方差矩阵的自由度为 12。
7. “协方差矩阵的均等性的箱式检验”,其中会给出“对数行列式”的结果:
各组内协方差矩阵及其行列式的自然对数。在多组模型中,行列式自然对
数值提供各组间协方差矩阵差别的度量。其中秩是行或列中线性独立的最
大数。
对数行列式
销售状态 秩 对数行列式
畅销 3 4.893
平销 3 6.187
滞销 3 .288
汇聚的组内 3 6.214
打印的行列式的秩和自然对数是组协方差
矩阵的秩和自然对数。
8. “Box’s M 检验”中,请①给出该检验的原假设②针对本组案例,给出检验的结果。
检验结果
箱的 M 21.855
F 近似。 .964
df1 12
df2 421.029
Sig. .483
对相等总体协方差矩阵的零假
设进行检验。
① H0:畅销款、平销款和滞销款的协方差相等
② 上述检验显示sig. = 0.483 >0.05, 在5%显著性水平下结果不显著,应接
受H0,畅销款、平销款和滞销款的协方差没有显著差异。
9. “典型判别式函数摘要”给出的是Fisher判别法的一些判别结果
10. “特征值”包含了特征根,方差百分比,累计百分比和典型判别函数。其
中特征根是 E -1 B I u 0 所比得。给出典型相关系数的含义。
特征值
a. 分析中使用了前 2 个典型判别式函数。
判别函数1的典型相关系数为0.874,判别函数2的典型相关系数为0.698,所以,函数1的判别能力要强于
判别函数2.
Wilks 的 Lambda
Wilks 的
标准化的典型判别式函数系数
函数
1 2
函数
1 2
通过分析“标准典型判别函数系数”表格,可以看出预测变量在各判别
函数中的贡献度情况。经观察发现在第一判别函数下“功能评分”的系数为
6.341,说明其对第一判别函数的正向影响较大,“销售价格”的系数为
-6.897,说明其对第一判别函数的负向影响较大;在第二判别函数下,“销
售价格”的系数为 1.193,远大于其他两个系数,说明其对第二判别函数的
影响较大。(也说明了判别函数在哪些变量上具有比较大的区别度)
据此可以写出,第一判别函数表达式:Y=1.513*标准化的收录机质量评
分+6.341*标准化的功能评分-6.879*标准化的销售价格
13. “结构矩阵”中,结构系数即预测变量与典型判别函数的联合组内相关系
数。请给出该系数矩阵的含义。
结构矩阵
函数
1 2
聚组间相关性
按函数内相关性的绝对大小排序的变量。
通过观察“结构矩阵”,发现“收录机质量评分”与第一判别函数的绝对相
关性为 0.627,远大于其与第二判别函数的相关性,说明此变量与第一判别
函数的相关性程度更高;而“功能评分”和“销售价格”则与第二判别函数
的有着更大的绝对相关系数,分别为 0.948,0.920,远大于它们与第一判别
函数的相关性,说明这两个变量与第二判别函数的相关性程度更高。
典型判别式函数系数
函数
1 2
非标准化系数
函数 1:y1= -12.031+1.698*收录机质量评分+4.010*功能评分-0.043*销售价格
函数 2:y2=0.193 – 0.541*收录机质量评分+0.006*功能评分+0.007*销售价格
矩阵, xi x 中分别为各组平均值和总平均值。
组质心处的函数
函数
销售状态 1 2
畅销 1.896 -.767
平销 .171 1.078
滞销 -2.109 -.581
在组均值处评估的非标准化典型判别
式函数
16. “分类函数系数”给出的是贝叶斯判别分析法产生的分类函数系数,其中计算公式为:
18. 解读并分析“按照案例顺序的统计量”的结果。
按照案例顺序的统计量
判别式得
最高组 第二最高组 分
解读:
“按照案例顺序的统计量”表格共包含五大列:第一列为“案例数目”,
按数据录入的顺序将案例从 1 开始排,直至最后一个;第二列为“实际组”,
及各个观测样品实际属于的组别,如案例 1 到 4 的组别均为 1,特别地,案
例 14 为“未分组的”,表明其在实际中没有被分组,是一个需要通过判别函
数判别确定其分组的案例;第三列为“最高组”,即判别出的最高后验概率
组,其中包含的“预测组”表明根据判别函数给出的预测各样本点应该属于
的组别的情况,P(G=g | D=d)为判别为对应预测组的后验概率;第四列“第
二最高组”给出了第二可能的判别结果的情况,其 P(G=g | D=d)值要小于最
高组下的值;第五列“判别式得分”给出了在 Fisher 判别函数下的得分情况。
分析:
首先值得注意的是 14 号未被分组的样本点的判别预测情况,根据“最高
组”下的“预测组”知,该样本点最有可能被归为第二组,相应的概率为 0.967,
从概率上看归为第二组的可能性很大。这与 17 题的结论是一样的。
另外,注意到案例 12 的实际组是 3 但被判别为了 2 组(表中**标明),
说明在判别函数下判别错误。实际上,被判别为第 2 组的概率为 0.535,被
判别为第 3 组(实际组)的概率为 0.446,从概率上看是较为接近的。