You are on page 1of 19

第四次实习

ANOVA 和 GLM 过程
• SAS 系统中, ANOVA 过程可以处理每
个分类因子的组合观察数相等的方差
分析,即数据是均衡的。若不均衡,
就要求用 GLM (General Linear
Model) 过程进行处理。
均衡数据的方差分析
(ANOVA 过程 )
• 1 .过程格式
PROC ANOVA [ 选择项 ] :
CLASS 变量表;
MODEL 因变量表 = 效应;
MEANS 效应 [ /选择项 ] ;
TEST H= 效果名称 E= 效果名称;
By 变量表;
2 .语句说明:
Proc Anova 语句选择项
Data= 数据集 指定用来分析的数据集名
Manova 要求 Proc anova 语句将含一个或
一个以上依变量缺失值的观察值剔除,当使
用交互式进行方差分析时,最好指定此选择
项。
Outstat= 数据集 输出结果中包括离差平方
和、 F 值以及各试验效果的显著程度。

(1) 程序中, CLASS 语句和 MODEL 语
句是必需的。而且, CLASS 语句必
须出现在 MODEL 语句之前。
(2)CLASS 语句中的变量是分类变量
或因素,用来区分分类水平,可以是
数值型,也可以是字符型 ( 不超过
16 个字符)。
( 3 ) Model 语句不能重复, ANOVA
过程只允许使用一个 Model 语句。
(3)MODEL 语句指明因变量和自变量 ( 因子变量 ) 效
应。效应是分类变量的各种组合,效应可以是主效
应、交互效应、嵌套效应和混合效应。对应的效应
模型如下:
- 主效应模型:分类变量本身来表示。
Proc anova;
class a b c;
model y=a b c ;
Run;
模型中, a , b , c 是主效应, y 是因变量(响应
变量),必须是连续的数值型变量。
- 交互模型:通过分类变量之间用“ *” 号连接来规定。
Proc anova ;
Class a b c;
MODEL y=a b c a*b a*c a*c a*b*c ;
Run;
模型中, a*b , a*c , b*c , a*b*c 是交互
效应。
- 嵌套效应模型 : 通过在主效应或交叉效应之后跟随
着用括号括起来的一个分类变量或分类变量的列
表来表示。
Proc anova ;
Class a b c;
MODEL y=a b c(a b) ;
Run ;
模型中, c(a b) 是嵌套效应。
- 混合效应模型:包含嵌套、交互和主效应的模型。
MODEL y=a b(a) c(a ) b*c(a) ;
- 竖条( | )记号
可以简化因子模型
Proc anova;
class a b c;
model y=a|b|c;
Run;
相当于: y=a b a*b a*c b*c a*b*c

Searle(1971)Criteria
A | B | C  { A | B} | C
 {A B A * B} | C
A B A* B C A*C B *C A * B *C
(4)MEANS 语句是选择语句,计算并输出所列的效应对
应的因变量均值。可以使用任意多个 Means 语句。
- 若指明了选择项,则将进行主效应均值间的检验。
常用的选择项如下:
BON 、 DUNCAN 、 LSD 、 REGWF 、 REGWO 、 SNK 、
SCHEFFE 、 SIDAK 、 SMM(GT2) 、 TUKEY 、 WALL
ER 。以上选择项在实际砬用中,一般选择一种或两种
方法即可。
-ALPHA=p 确定检验的显著性水平。缺省值是 0.05 。
-E= 效应名称 规定 F 测验的分母。
(5)Test 语句
H= 分子 E= 分母
若缺省,仍然使用误差均方( MSe )作
为误差项对所有平方和( SS )计算 F
值,可以使用多个 test 语句。
( 6 ) By 语句
要求按其指定变量分别进行方差分析。
非平衡数据的方差分析 (GLM 过程 )

1 .过程格式
PROC GLM [ 选择项 ] ;
CLASS 变量表;
MODEL 因变量 = 效应;
MEANS 效应/ [ 选择项 ] ;
TEST H= 效果名称 E= 效果名
称;
By 变量表;
RUN ;
单向分组资料的方差分析

测定 3 种密度下某物种的产量各 10 次,
得结果如下,试做方差分析,并做出
差异显著性结论( F=15.77 )。
• 试验甲、乙、丙三种催化剂在不同温度下对某
化合物的转化作用。由于各催化剂要求的温度
范围不同,将催化剂作为一级试验因素,温度
作为二级试验因素,采用嵌套设计,每个处理
重复 2 次,结果如下,试做方差分析(分别
用 anova 和 nested 过程):
催化剂 甲 乙 丙
温度 70 80 90 55 65 75 90 95 100
转化率 82 91 85 65 62 56 71 75 85
84 88 83 61 59 60 67 78 89

答案:催化剂 F=14.63 ,温度 F=12.15


• 对湿地生态系统 5 个某品种的干物质积累过程
进行系统测定,每次测定随机取 2 个样点,每
样点取 5 株,其中有一次测定的结果如下,试
做方差分析,并以 LSR 法对个个品种间差异进
行多重比较。并计算出样点间和样点内方差。
品种 样点 干物质质量(g)
甲 1 7.8 8.9 9.2 11.4 10.5
2 12.1 10.6 8.7 9.9 10.1
乙 3 7.4 8.8 8.9 7.8 9.8
4 6.2 6.6 5.3 7.5 8.1
丙 5 12.6 10.2 11.4 11.8 12.1
6 15.2 15.1 12.3 12.5 12.9
丁 7 5.8 4.7 6.6 7.4 7.9
8 6.4 6.8 8.1 7.2 7.9
戊 9 13.8 15.1 13.4 12.6 16.6
10 11.7 17.2 15.6 15.1 15.8

样点间方差 =3.0754 , 样点内株间方差 =1.7279


• 研究某牧草对不同地区不同性别的
绵羊的增重效果,一个月后测量其
体重增加量并进行方差分析。
组号 牧草种类 地区 性别 每组 3 只羊的增重量( kg )

1 羊草 城郊 M 1.98 2.02 2.08

2 羊草 城郊 F 1.88 2.12 2.13

3 羊草 山区 M 1.95 2.18 2.18

4 羊草 山区 F 2 2.2 2.23

5 冰草 城郊 M 2.11 2.18 2.3

6 冰草 城郊 F 2.22 2.17 2.35

7 冰草 山区 M 2.23 2.22 2.4

8 冰草 山区 F 2.21 2.24 2.72


• 设一水稻移栽期和适用绿肥的两因素试验
,移栽期( A )具有三水平, A1=7 月
16 日, A2=8 月 16 日, A3=9 月 16 日
;施用绿肥 B 具有三个水平: B1= 黄花
苜蓿, B2= 苕子, B3= 不施绿
肥, A , B 均为随机排列,六个重复的
III
野外排列与试验结果如下:
I II
A1 A3 A2 A2 A1 A3 A2 A1 A3
B2 376 455 480 B1 549 396 492 B2 500 347 468
B3 386 476 496 B3 533 388 482 B3 482 337 435
B1 355 433 446 B2 540 406 512 B1 513 387 476
IV V VI
A2 A3 A1 A3 A1 A2 A2 A3 A1
B3 413 334 201 B1 458 366 474 B3 490 447 348
B1 469 436 298 B3 413 333 425 B2 509 473 356
B2 436 398 280 B2 434 356 465 B1 520 487 397
• 有交互作用的两因素不平衡方差分析:
为了确定在某一试验中有 2 个因素 A 和
B , A 有 5 个水平, B 有 2 个水平。数
据如下
B
B1 B1 B1 B2 B2 B2
A A1 23 26 0 41 19
A2 42 42 24 14
A3 30 21 38
A4 50 51 62
A5 56

A : F=4.91 ; B : F=0.59 ; A*B : F=1.89


作业题
• 假定有一个随机抽样调查,得到四个工厂在四种
改革方案中,工人收入的状况如下表。

厂名 方案 1 方案 2 方案 3 方案 4
工厂 1 146 200 148 151
工厂 2 158 303 282 290
工厂 3 415 461 431 413
工厂 4 454 452 453 415
问:(1)各种方案之间的收入是否有显著差异?
(2)不同规模的工厂之间,收入是否有显著差异?

You might also like