You are on page 1of 6

ANOVA THÍ NGHIỆM LÔ PHỤ (SPLIT PLOT) VỚI SAS

PGS. TS. Lê Quang Hƣng


Email: lhung789@gmail.com
Phone: 0918039117
06/01/2019
MỞ ĐẦU
Phân tích phƣơng sai lô phụ với bảng ANOVA cần có CV, SEM và LSD để xếp hạng các
nghiệm thức với ký tự abc. Mục tiêu của bài này là sử dụng công thức tính và phần mềm SAS
(Statistical Analysis Systems) để tính các thông số trên và xếp hạng ký tự abc các nghiệm thức,
là cách dùng phổ biến để sử dụng kết quả phân tích dữ liệu đăng bài báo khoa học, làm đồ án,
luận văn, đề tài, dự án nghiên cứu khoa học.
NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Số liệu đƣợc trích từ thí nghiệm lô phụ (Gomez K. A. & Gomez A. A., 1984) gồm 3 khối (lặp
lại), lô chính là 6 lƣợng đạm (A, kg/ha) và lô phụ là 4 giống (B) ảnh hƣởng năng suất lúa Y
(kg/ha). Thí nghiệm này chƣa tính SEM, LSD chi tiết và xếp hạng ký tự abc. Vì vậy, các công
thức tính CV, SEM, LSD đƣợc sử dụng kết hợp với lập trình phần mềm SAS, để xử lý và cho
kết quả hoàn chỉnh một lƣợt từ phân tích phƣơng sai đến xếp hạng các nghiệm thức theo ký tự
abc.
KẾT QUẢ VÀ THẢO LUẬN
Số liệu thí nghiệm lô phụ đƣợc thiết kế theo bảng excel nhƣ sau:

KHOI A B Y
1 0 IR8 4430
2 0 IR8 4478
3 0 IR8 3850
1 0 IR5 3944
2 0 IR5 5314
3 0 IR5 3660
1 0 C4-63 3464
2 0 C4-63 2944
3 0 C4-63 3142
1 0 Peta 4126
2 0 Peta 4482
3 0 Peta 4836
1 60 IR8 5418
2 60 IR8 5166
3 60 IR8 6432
1 60 IR5 6502
2 60 IR5 5858
3 60 IR5 5586
1 60 C4-63 4768
2 60 C4-63 6004
3 60 C4-63 5556
1 60 Peta 5192
2 60 Peta 4604
3 60 Peta 4652
1 90 IR8 6076
2 90 IR8 6420
3 90 IR8 6704
1 90 IR5 6008
2 90 IR5 6127

1
3 90 IR5 6642
1 90 C4-63 6244
2 90 C4-63 5724
3 90 C4-63 6014
1 90 Peta 4546
2 90 Peta 5744
3 90 Peta 4146
1 120 IR8 6462
2 120 IR8 7056
3 120 IR8 6680
1 120 IR5 7139
2 120 IR5 6982
3 120 IR5 6564
1 120 C4-63 5792
2 120 C4-63 5880
3 120 C4-63 6370
1 120 Peta 2774
2 120 Peta 5036
3 120 Peta 3638
1 150 IR8 7290
2 150 IR8 7848
3 150 IR8 7552
1 150 IR5 7682
2 150 IR5 6594
3 150 IR5 6576
1 150 C4-63 7080
2 150 C4-63 6662
3 150 C4-63 6320
1 150 Peta 1414
2 150 Peta 1960
3 150 Peta 2766
1 180 IR8 8452
2 180 IR8 8832
3 180 IR8 8818
1 180 IR5 6228
2 180 IR5 7387
3 180 IR5 6006
1 180 C4-63 5594
2 180 C4-63 7122
3 180 C4-63 5480
1 180 Peta 2248
2 180 Peta 1380
3 180 Peta 2014

1. Tính hệ số biến thiên (Coefficent of Variation, CV)


Kết quả phân tích phƣơng sai với SAS nhƣ sau:

The GLM Procedure


Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 35 192163043.2 5490372.7 15.71 <.0001
Error 36 12584873.2 349579.8
Corrected Total 71 204747916.3
R-Square Coeff Var Root MSE Y Mean
0.938535 10.79144 591.2527 5478.903

2
Tests of Hypotheses for Mixed Model Analysis of Variance
Dependent Variable: Y
Source DF Type III SS Mean Square F Value Pr > F
KHOI 2 1082577 541288 3.81 0.0588
A 5 30429200 6085840 42.87 <.0001
Error: MS(KHOI*A) 10 1419679 141968
KHOI*A 10 1419679 141968 0.41 0.9348
B 3 89888101 29962700 85.71 <.0001
A*B 15 69343487 4622899 13.22 <.0001
Error: MS(Error) 36 12584873 349580


Công thức tính CV% = x 100, trong đó EMS: sai số trung bình bình phƣơng, Mean:
trung bình.

CV% = x 100 = 10,79144379 ~ 10,79144

2. Tính SEM (Standard Error of the Mean, sai số của trung bình)
Sai số của các yếu tố đƣợc thể hiện trong bảng sau:
Type 3 Analysis of Variance
Sum of
Source DF Squares Mean Square Expected Mean Square Error Term
A 5 30429200 6085840 Var(Residual) + 4 Var(KHOI*A) MS(KHOI*A)
+ Q(A,A*B)
B 3 89888101 29962700 Var(Residual) + Q(B,A*B) MS(Residual)
A*B 15 69343487 4622899 Var(Residual) + Q(A*B) MS(Residual)
KHOI 2 1082577 541288 Var(Residual) + 4 Var(KHOI*A) MS(KHOI*A)
+ 24 Var(KHOI)
KHOI*A 10 1419679 141968 Var(Residual) + 4 Var(KHOI*A) MS(Residual)
Residual 36 12584873 349580 Var(Residual) .
Covariance Parameter
Estimates
Cov Parm Estimate
KHOI 16638
KHOI*A -51903
Residual 349580

Thí nghiệm này với r = 3 khối (lặp lại), a = 6 (số nghiệm thức của yếu tố A, lô chính); b = 4 là số
nghiệm thức của yếu tố B, lô phụ.
Với Error Term của yếu tố A là MS(KHOI*A) và
Expected Mean Square là Var(Residual) + 4 Var(KHOI*A) + Q(A,A*B), tính sai số của trung
bình (SEM) của yếu tố A theo công thức dựa vào trị số của Covariance Parameter Estimates nhƣ
trên.

SEMa = √ = 131,8206
Tƣơng tự với phần mềm SAS, ta có:
SEMa = 131,82
SEMb = 148,61
SEMab = 323,68
3
3. Tính LSD
LSD (Least Significant Difference, khác biệt có nghĩa nhỏ nhất)
Công thức tính LSD = t(Edf, 0.05) x SED
t(Edf, 0.05): tra bảng Critical Value of t (giá trị cực trọng t) ở Error Degree of Freedom (sai số
độ tự do) ở 5% (0,05), hoặc ở P 0,01 hay P 0,001 tùy kết quả xử lý số liệu.
Máy tính: xem Critical Value of t
SED = Standard Error Difference of Mean (khác biệt sai số chuẩn của trung bình)

Bài này với bảng ANOVA gồm các yếu tố A, B, tƣơng tác A*B đều có Pr > F là < 0,0001, do đó
chọn xếp hạng ở mức P < 0,01 là thích hợp.

YẾU TỐ A
LSDa = t x SEDa
t (0,01; Edf = 10) = 3,16927
SEDa = √ = √ = 153,82
LSDa = 3,16927 x 153,82 = 487,497

YẾU TỐ B
LSDb = t x SEDb
t (0,01; Edf = 36) = 2,71948
SEDb = √ =√ = 197,08
LSDb = 2,71948 x 197,08 = 535,956

YẾU TỐ TƢƠNG TÁC A*B


LSDab = t x SEDab
So sánh cùng mức yếu tố A
t (0,01; Edf = 36) = 2,71948

SEDab = √ =√ = 482,76
LSDab = t x SEDab = 2,71948 x 482,76 = 1312,86

So sánh khác mức yếu tố A


Tính độ tự do phù hợp

= 43,53438 ~ 43,53

t (0,01; Edf = 43,53) = 2,69359

SEDab = √
=√ = 445,48

LSDab = t x SEDab = 2,69359 x 445,48 = 1199,94

4
Kết quả xử lý với SAS
Type 3 Tests of Fixed Effects
Num Den
Effect DF DF F Value Pr > F
A 5 10 42.87 <.0001
B 3 36 85.71 <.0001
A*B 15 36 13.22 <.0001
R-Square Coeff Var Root MSE Y Mean
0.938535 10.79144 591.2527 5478.903
Least Significant Difference 487.498
T Grouping for A Least Squares Means (Alpha=0.01)
LS-means with the same letter are not significantly different.
A Estimate
90 5866.25 A
A
120 5864.42 A
A
150 5812.00 A
A
180 5796.75 A
A
60 5478.17 A

0 4055.83 B
Least Significant Difference 535.956
T Grouping for B Least Squares Means (Alpha=0.01)
LS-means with the same letter are not significantly different.
B Estimate
IR8 6553.56 A
A
IR5 6155.50 A

C4-63 5564.44 B

Peta 3642.11 C
Least Significant Difference
Different between two B means, same level of A, LSD = 1312.86
Different between two A means, same or different level of B, LSD = 1199.94
T Grouping for A*B Least Squares Means (Alpha=0.01)
LS-means with the same letter are not significantly different.
A B Estimate
180 IR8 8700.67 A
A
150 IR8 7563.33 B A
B
150 IR5 6950.67 B C
B C
120 IR5 6895.00 B C
B C
120 IR8 6732.67 B C D
B C D
150 C4-63 6687.33 B C D
B C D
180 IR5 6540.33 B E C D

5
B E C D
90 IR8 6400.00 B E C D
E C D
90 IR5 6259.00 E C D
E C D
180 C4-63 6065.33 E C D
E C D
120 C4-63 6014.00 F E C D
F E C D
90 C4-63 5994.00 F E C D
F E C D
60 IR5 5982.00 F E C D
F E D
60 IR8 5672.00 F E G D
F E G
60 C4-63 5442.67 F E G H
F G H
60 Peta 4816.00 F I G H
F I G H
90 Peta 4812.00 F I G H
I G H
0 Peta 4481.33 J I G H
J I H
0 IR5 4306.00 J I H
J I H
0 IR8 4252.67 J I H
J I
120 Peta 3816.00 J I
J
0 C4-63 3183.33 J K
K
150 Peta 2046.67 L K
L
180 Peta 1880.67 L

Để xếp hạng các nghiệm thức, sử dụng bảng hiệu số tam giác các giá trị của nghiệm thức từ
lớn đến nhỏ, so sánh từng cặp nghiệm thức, nếu hiệu số hai nghiệm thức lớn hơn LSD là hai
giá trị khác nhau, xếp hạng tƣơng ứng với ký tự A và B. SAS sử dụng ký tự hoa ABC từ A đến
Z với giá trị độ lớn giảm dần để so sánh tuần tự từ trên xuống dƣới các cặp nghiệm thức.
KẾT LUẬN
Sử dụng các công thức tính CV, SEM, LSD đều phù hợp với kết quả xử lý của SAS, cho thấy
mức chính xác và đầy đủ cho các giá trị CV, SEM, LSD để xếp hạng theo ký tự abc, với thời
gian xử lý nhanh và thuận tiện cho phân tích dữ liệu nghiên cứu khoa học.

Tài liệu tham khảo


Gomez K. A. & Gomez A. A., 1984. Statistical Procedure for Agricultural Research. John
Wiley & Sons Inc, pp 97-201.
Web: https://pdf.usaid.gov/pdf_docs/PNAAR208.pdf
Lê Quang Hƣng, 2018. Phân tích thống kê, thí nghiệm với SAS, tr. 58-61.
Web: http://hunglequang.blogspot.com/2019/03/

You might also like