Professional Documents
Culture Documents
ANOVA 和 GLM 过程
• SAS 系统中, ANOVA 过程可以处理每
个分类因子的组合观察数相等的方差
分析,即数据是均衡的。若不均衡,
就要求用 GLM (General Linear
Model) 过程进行处理。
均衡数据的方差分析
(ANOVA 过程 )
• 1 .过程格式
PROC ANOVA [ 选择项 ] :
CLASS 变量表;
MODEL 因变量表 = 效应;
MEANS 效应 [ /选择项 ] ;
TEST H= 效果名称 E= 效果名称;
By 变量表;
2 .语句说明:
Proc Anova 语句选择项
Data= 数据集 指定用来分析的数据集名
Manova 要求 Proc anova 语句将含一个或
一个以上依变量缺失值的观察值剔除,当使
用交互式进行方差分析时,最好指定此选择
项。
Outstat= 数据集 输出结果中包括离差平方
和、 F 值以及各试验效果的显著程度。
•
(1) 程序中, CLASS 语句和 MODEL 语
句是必需的。而且, CLASS 语句必
须出现在 MODEL 语句之前。
(2)CLASS 语句中的变量是分类变量
或因素,用来区分分类水平,可以是
数值型,也可以是字符型 ( 不超过
16 个字符)。
( 3 ) Model 语句不能重复, ANOVA
过程只允许使用一个 Model 语句。
(3)MODEL 语句指明因变量和自变量 ( 因子变量 ) 效
应。效应是分类变量的各种组合,效应可以是主效
应、交互效应、嵌套效应和混合效应。对应的效应
模型如下:
- 主效应模型:分类变量本身来表示。
Proc anova;
class a b c;
model y=a b c ;
Run;
模型中, a , b , c 是主效应, y 是因变量(响应
变量),必须是连续的数值型变量。
- 交互模型:通过分类变量之间用“ *” 号连接来规定。
Proc anova ;
Class a b c;
MODEL y=a b c a*b a*c a*c a*b*c ;
Run;
模型中, a*b , a*c , b*c , a*b*c 是交互
效应。
- 嵌套效应模型 : 通过在主效应或交叉效应之后跟随
着用括号括起来的一个分类变量或分类变量的列
表来表示。
Proc anova ;
Class a b c;
MODEL y=a b c(a b) ;
Run ;
模型中, c(a b) 是嵌套效应。
- 混合效应模型:包含嵌套、交互和主效应的模型。
MODEL y=a b(a) c(a ) b*c(a) ;
- 竖条( | )记号
可以简化因子模型
Proc anova;
class a b c;
model y=a|b|c;
Run;
相当于: y=a b a*b a*c b*c a*b*c
Searle(1971)Criteria
A | B | C { A | B} | C
{A B A * B} | C
A B A* B C A*C B *C A * B *C
(4)MEANS 语句是选择语句,计算并输出所列的效应对
应的因变量均值。可以使用任意多个 Means 语句。
- 若指明了选择项,则将进行主效应均值间的检验。
常用的选择项如下:
BON 、 DUNCAN 、 LSD 、 REGWF 、 REGWO 、 SNK 、
SCHEFFE 、 SIDAK 、 SMM(GT2) 、 TUKEY 、 WALL
ER 。以上选择项在实际砬用中,一般选择一种或两种
方法即可。
-ALPHA=p 确定检验的显著性水平。缺省值是 0.05 。
-E= 效应名称 规定 F 测验的分母。
(5)Test 语句
H= 分子 E= 分母
若缺省,仍然使用误差均方( MSe )作
为误差项对所有平方和( SS )计算 F
值,可以使用多个 test 语句。
( 6 ) By 语句
要求按其指定变量分别进行方差分析。
非平衡数据的方差分析 (GLM 过程 )
1 .过程格式
PROC GLM [ 选择项 ] ;
CLASS 变量表;
MODEL 因变量 = 效应;
MEANS 效应/ [ 选择项 ] ;
TEST H= 效果名称 E= 效果名
称;
By 变量表;
RUN ;
单向分组资料的方差分析
测定 3 种密度下某物种的产量各 10 次,
得结果如下,试做方差分析,并做出
差异显著性结论( F=15.77 )。
• 试验甲、乙、丙三种催化剂在不同温度下对某
化合物的转化作用。由于各催化剂要求的温度
范围不同,将催化剂作为一级试验因素,温度
作为二级试验因素,采用嵌套设计,每个处理
重复 2 次,结果如下,试做方差分析(分别
用 anova 和 nested 过程):
催化剂 甲 乙 丙
温度 70 80 90 55 65 75 90 95 100
转化率 82 91 85 65 62 56 71 75 85
84 88 83 61 59 60 67 78 89
4 羊草 山区 F 2 2.2 2.23
厂名 方案 1 方案 2 方案 3 方案 4
工厂 1 146 200 148 151
工厂 2 158 303 282 290
工厂 3 415 461 431 413
工厂 4 454 452 453 415
问:(1)各种方案之间的收入是否有显著差异?
(2)不同规模的工厂之间,收入是否有显著差异?