You are on page 1of 82

PGS. TS.

LÊ QUANG HƯNG

ỨNG DỤNG SAS


PHÂN TÍCH SỐ LIỆU THÍ NGHIỆM

2009

Lời mở đầu
SAS (Statistical Analysis Systems) áp dụng ngôn ngữ lập trình để phân tích số liệu.
Riêng SAS/STAT bao gồm trên 60 phương thức phân tích số liệu áp dụng cho phân tích
phương sai, hồi qui, phân tích tổng hợp, và phân tích đa biến.
Dữ liệu lập trình trên word để xử lý thống kê của SAS ngắn gọn, khoảng 9 hàng với 24
từ, được thiết kế trước và số liệu được chuyển trực tiếp từ file word, excel, là dạng lưu trữ số
liệu thống kê phổ biến nhất. Ngoài ra có thể sử dụng số liệu lưu trữ từ file text, file của SAS để
phân tích thống kê. Cách sắp xếp bảng số liệu excel theo cột hay hàng, mã hóa bằng số hay tên
giống cây trồng, tên phương pháp, xử lý nhiều chỉ tiêu rất thuận tiện trong file mẫu word.
Sau khi lập trình đầy đủ số liệu để tạo file mẫu (sample), xử lý bằng lệnh RUN với thời
gian rất nhanh, chỉ một vài giây cho tất cả các cách xử lý 1 lần như: phân tích phương sai, xếp
nhóm các nghiệm thức của các yếu tố, tính ma trận tương tác các yếu tố, vẽ đồ thị… Kết quả
phân tích được giải thích rất rõ ràng về so sánh các nghiệm thức và xếp nhóm (grouping) theo
ký tự A, B cho yếu tố có hai nghiệm thức và A, B, C, D, E cho yếu tố có nhiều nghiệm thức.
Các giá trị xác suất cho các yếu tố đơn và tổ hợp đều thể hiện rõ trong bảng ANOVA.
Quyển sách này trình bày một số phương pháp xử lý số liệu thí nghiệm thông dụng trong
ngành nông sinh học liên quan đến khoa học cây trồng, căn cứ trên các bài tập mẫu bao gồm
các phương thức xử lý ANOVA, tương quan, hồi qui thực hiện cho thí nghiệm phổ biến nhất.
Các bài tập mẫu thống kê về các lĩnh vực khác như y học, hóa học, xã hội, cơ học … có thể
tham khảo trong chương trình của phần mềm SAS (phần Help > Using this windows > Sample
SAS Programs and Applications). Ngoài ra SAS có thể xử lý số liệu với nhiều lệnh, bắt đầu từ
thanh công cụ với lệnh Solutions > Analysis > Analyst > Open với file Excel, file SAS>
Statistics > ANOVA.
Rất mong được sự góp ý để quyển sách được sử dụng thuận tiện hơn.
Các góp ý xin gửi về: PGS.TS Lê Quang Hưng
Khoa Nông học, Đại học Nông Lâm TP HCM. Liên hệ E-mail: lqlqhung@yahoo.com
Trân trọng,

Tác giả
Update: 29-7-09, 86 tr.

Mục lục

Chương 1
PHƯƠNG PHÁP PHÂN TÍCH PHƯƠNG SAI (ANOVA), XẾP NHÓM (GROUPING)
NGHIỆM THỨC VÀ SO SÁNH TƯƠNG TÁC (INTERACTION)
1.1. Mục tiêu 3
1.2. Nguồn số liệu theo dõi thí nghiệm 3
1
1.3. Tạo file word mẫu (sample) 4
1.4. Xử lý số liệu với SAS 6
1.5. Giải thích kết quả 8
1.6. Trình bày kết quả 9
1.7. Phương thức tạo file mẫu cho thí nghiệm hai yếu tố 10
1.8. Ý nghĩa các từ và chuyển đổi giá trị 17
1.9. Ô cơ sở (plot size) và lặp lại (replications) 18
Chương 2
THÍ NGHIỆM BỐ TRÍ HOÀN TOÀN NGẪU NHIÊN
(Completely Randomized Design, CRD)
2.1. Thí nghiệm hoàn toàn ngẫu nhiên một yếu tố 18
2.2. Thí nghiệm hoàn toàn ngẫu nhiên hai yếu tố 22
Chương 3
THÍ NGHIỆM KHỐI ĐẦY ĐỦ NGẪU NHIÊN
(Randomized Complete Block Design, RCBD)

3.1. Khối đầy đủ hoàn toàn ngẫu nhiên một yếu tố 24


3.2. Kiểu ô vuông la tinh 26
3.3. Khối đầy đủ ngẫu nhiên hai yếu tố 28
3.4. Thí nghiệm lô phụ 34
3.5. Thí nghiệm lô sọc 47
3.6. Thí nghiệm ba yếu tố 51
3.7. Các lệnh (SAS Code) để xử lý số liệu tính phương sai (ANOVA) thông dụng 59

Chương 4
TÍNH GIÁ TRỊ TRUNG BÌNH, T-TEST, CHI- BÌNH PHƯƠNG
TƯƠNG QUAN VÀ HỒI QUI
4.1. Tính giá trị trung bình 64
4.2. T- test 66
4.3. Chi-bình phương 67
4.4. Ma trận tương quan 68
4.5. Hồi qui tuyến tính đơn biến 71
4.6. Hồi qui tuyến tính đa biến 72
4.7. Hồi qui đa biến bậc hai 75
4.8. Tối ưu hóa và xác định điểm 77
4.9. Đồ thị hình lưới chiếu mặt phẳng ba chiều 80
Tài liệu tham khảo 86

Chương 1

PHƯƠNG PHÁP PHÂN TÍCH PHƯƠNG SAI (ANOVA), XẾP NHÓM (GROUPING)
NGHIỆM THỨC VÀ SO SÁNH TƯƠNG TÁC (INTERACTION)

1.1. Mục tiêu:

2
Mục tiêu của phân tích ANOVA (ANalysis Of VAriance) là xác định các nghiệm thức có ý
nghĩa khi giá trị tính F nhỏ hơn mức xác suất (probability) p < 0,05 hay p < 0,01 là mức
thường dùng trong nông nghiệp, sinh học. Sau đó các nghiệm thức được xếp nhóm (grouping,
SAS, 2004; homogeneous grouping: nhóm tương đồng (NRCS, 2007) với các ký tự A, B cho
hai nghiệm thức và A, B, C, D, E cho nhiều nghiệm thức là để so sánh sai khác và chọn được
nghiệm thức phù hợp của thí nghiệm. Đối với thí nghiệm nhiều yếu tố, cần có so sánh tương
tác (interaction) của các yếu tố. Các mẫu bài tập được tạo ra từ file excel và word để dễ sử
dụng và lưu số liệu ở dạng .doc, .xls, .sas.
1.2. Nguồn số liệu theo dõi thí nghiệm:
Số liệu được thu thập, xử lý và lưu từ file excel tùy theo kiểu bố trí thí nghiệm. Thí dụ so
sánh năng suất (kg/ô 20 m2) năm giống cải ngọt lần lượt là G22, Z15, X31, K14, D25, có thể
ghi bằng số nghiệm thức là 1, 2 , 3, 4, 5; hoặc ghi tên giống; được bố trí thí nghiệm kiểu khối
đầy đủ hoàn toàn ngẫu nhiên (Randomized Complete Block Design) bốn khối (I, II, III, IV).
Năm nghiệm thức thí nghiệm được ghi bằng tên giống trong file excel, khối ghi trước, nghiệm
thức ghi sau.
Sơ đồ thí nghiệm Chiều biến thiên
Hướng dốc cao
I 1 3 2 5 4
9.00 7.00 10.28 14.94 11.86
II 2 1 5 4 3
14.59 8.00 14.63 11.99 6.00
III 3 4 2 1 5
8.23 11.77 15.15 7.00 13.81
IV 5 1 3 2 4
14.90 9.12 7.40 15.00 8.00
thấp

Cách ghi số liệu lưu trong file excel


khoi nthuc nsuat
1 G22 9.00
1 Z15 10.28
1 X31 7.00
1 K14 11.86
1 D25 14.94
2 G22 8.00
2 Z15 14.59
2 X31 6.00
2 K14 11.99
2 D25 14.63
3 G22 7.00
3 Z15 15.15
3 X31 8.23
3 K14 11.77
3 D25 13.81
4 G22 9.12
4 Z15 15.00
4 X31 7.40
4 K14 8.00
4 D25 14.90
Để phân tích kết quả, cần thực hiện:
3
- Tạo file mẫu word
- Xử lý với chương trình thống kê SAS
- Ghi lại bảng ANOVA, nếu khác biệt của nghiệm thức ở mức p < 0,05 hay p < 0,01 thì
chọn xếp nhóm cho phù hợp. Ghi ký tự vào các trị trung bình của nghiệm thức để xếp
nhóm. Nếu p > 0,05 các nghiệm thức không khác nhau (ns, non- significant).
- Ghi LSD (khác biệt có nghĩa nhỏ nhất), xác suất p và CV%.

1.3. Tạo file word mẫu (sample): file mẫu là file thông dụng để xử lý bằng chương
trình SAS với các lệnh (command) ANOVA và xếp nhóm. File word mẫu được sử dụng và xử
lý cho nhiều file và nhiều chỉ tiêu có thể một lần trong SAS. Có thể sử dụng file excel để tạo
file mẫu. File word mẫu gồm ba phần: (1) nhập lệnh khai biến, (2) nhập số liệu từ excel (hoặc
trực tiếp, từ các file khác) và (3) nhập lệnh xử lý ANOVA và xếp nhóm.
Thí nghiệm kiểu khối đầy đủ ngẫu nhiên đơn yếu tố, theo dõi năng suất của năm giống cải
ngọt (kg/ô 20 m2), trồng trên bốn khối. Tổng số ô là 4 x 5 = 20 ô.

Các lệnh xử lý như sau:


- DATA: tên file, ghi từ một đến nhiều chữ như DATA; hay DATA CAI NGOT;
- INPUT: chọn ký hiệu cho input, chỉ ghi một ký tự hay một từ, tối đa là tám ký tự. Nếu nhiều
từ cần có gạch nối dài, hoặc xác định độ dài length$10 (mười ký tự). Nếu dùng bảng hàng
ngang có các biến nối tiếp, ghi:
INPUT T Y@@;
Datalines; (thay cho cards;)
* Cách 1: K (Khối), T (nghiệm thức), Y (năng suất), có cách một khoảng hoặc dấu $ như
INPUT K T Y; hay INPUT K $ T $ Y;
* Cách 2: ghi thẳng một từ cho một biến số: INPUT KHOI NTHUC NSUAT;
- CARDS; lệnh nhập số, kết thúc bằng dấu ;
- Số liệu excel với các số ghi dấu theo hệ ngôn ngữ Anh Mỹ: 0.5 thay vì 0,5 (tiếng Việt thì
chương trình không xử lý được).
- PROC: PROCEDURE, cách xử lý, như ANOVA, GLM, REG, SRREG (hồi qui),
PROC ANOVA;
riêng PROC GLM; được sử dụng kết hợp tính ANOVA và so sánh tương tác các yếu tố.
- CLASS: xếp loại các biến dùng phân tích, gồm có khối (K) và nghiệm thức (T),
CLASS K T;
- MODEL: mô hình phân tích năng suất (Y) = khối (K) và nghiệm thức (T)
MODEL Y = K T;
- MEANS: liệt kê các giá trị trung bình nghiệm thức (T) MEANS T;
- LSD ALPHA = 0.01: xếp nhóm các giá trị trung bình nghiệm thức ở mức alpha = 0.01. Có
thể chọn DUNCAN khi trên năm giá trị trung bình nghiệm thức. Alpha chọn ở mức alpha =
0.05 hay alpha = 0.01. Nếu ghi LSD; mặc định xếp nhóm ở mức p = 0.05. Nếu muốn chọn cả
hai, ghi đồng thời: MEANS T / LSD ALPHA = 0.05;
MEANS T / LSD ALPHA = 0.01;
SAS xử lý cả hai, khi đó xem trung bình các nghiệm thức ở bảng xếp nhóm và chọn mức có
nghĩa p<0,05 hay p<0,01.
- TITLE: tựa đề không cần ghi, nếu ghi có thể ghi nhiều chữ, có dấu ‘ ’ để nêu rõ chỉ tiêu
theo dõi như TITLE ‘NANG SUAT’;
- RUN; lệnh xử lý (RUN, SUBMIT ở thanh công cụ).
RUN;
4
Lưu ý: sau mỗi lệnh, kết thúc bằng dấu ;
Trình tự nhập số liệu được sử dụng ký tự đơn giản và giải thích như sau:
DATA; (DATA: tên dữ liệu, ghi thêm tên và kết thúc bằng dấu ;)
INPUT K $ T $ Y; (INPUT: nhập biến và có ký tự $ cách khoảng và dấu;)
CARDS; (CARDS: lệnh nhập số liệu, kết thúc bằng dấu;)
(Copy và paste chỉ có phần số từ file excel trên)
1 G22 9.00
1 Z15 10.28
1 X31 7.00
1 K14 11.86
1 D25 14.94
2 G22 8.00
2 Z15 14.59
2 X31 6.00
2 K14 11.99
2 D25 14.63
3 G22 7.00
3 Z15 15.15
3 X31 8.23
3 K14 11.77
3 D25 13.81
4 G22 9.12
4 Z15 15.00
4 X31 7.40
4 K14 8.00
4 D25 14.90
; (dấu ; cho biết đã ghi xong số liệu)
PROC ANOVA; (Xử lý ANOVA)
CLASS K T; (Xếp loại các biến dùng xử lý)
MODEL Y = K T; (Mô hình biến phụ thuộc bảng ANOVA)
MEANS T / LSD ALPHA=0.01; (Xếp hạng các trung bình theo alpha)
TITLE ‘NANG SUAT’; (Đặt tên của chỉ tiêu theo dõi)
RUN; (Lệnh xử lý)
Tóm lại các lệnh (command, code) phân tích thống kê cho cách 1 như sau:
DATA;
INPUT K $ T $ Y;
CARDS;
……Số liệu từ bảng excel
;
PROC ANOVA;
CLASS K T;
MODEL Y = K T;
MEANS T / LSD ALPHA=0.05;
TITLE ‘NANG SUAT’;
RUN;
Input cách 2 như sau:
DATA;
INPUT KHOI NTHUC NSUAT;
CARDS;
……
;
PROC ANOVA;
CLASS KHOI NTHUC;
MODEL NSUAT = KHOI NTHUC;
MEANS NTHUC / LSD ALPHA=0.05;
TITLE ‘NANG SUAT’;
RUN;

5
* Ghi chú về xếp hạng các nghiệm thức:
- Thí nghiệm từ hai đến năm nghiệm thức chọn so sánh Fisher’s LSD test, ghi:
MEANS NTHUC / LSD; kết quả xếp nhóm mặc định với APHA = 0.05; Least Significant
Difference (sai biệt nhỏ nhất có nghĩa). Xếp nhóm ở mức khác biệt p = 0,01 nếu ghi ALPHA =
0.01.
- Thí nghiệm từ sáu nghiệm thức trở lên chọn Duncan test, ghi:
MEANS NTHUC / DUNCAN; kết quả xếp nhóm mặc định với APHA = 0.05 (Trịnh Công
Thành, 2003). Trắc nghiệm đa đoạn Duncan (Duncan’s Multiple Range Test) xếp nhóm ở mức
khác biệt p = 0,01 nếu ghi ALPHA = 0.01. Duncan’s Multiple Range Test xếp nhóm toàn thí
nghiệm khi trên bốn nghiệm thức.

1.4. Xử lý số liệu với SAS


- Mở chương trình (ex: SAS v.8, v.9), giao diện có các phần cho xử lý thống kê như
Program editor, Log, Ouput ở thanh bar phía dưới cùng. Chọn (click) phần Program
editor.

Hình 1.1. Giao diện của SAS version 8

- Copy file word mẫu và patse vào phần Program editor.


- Có thể mở trực tiếp dạng file lưu từ .sas hoặc word .txt.

6
Hình 1.2. Program Editor để chuyển số liệu từ file word mẫu

File word mẫu để phân tích ANOVA, khối đầy đủ ngẫu nhiên, năm nghiệm thức, bốn khối.
Ký hiệu: K (Khối), T (nghiệm thức), Y (năng suất cải ngọt kg/ô 20 m2). Trình tự xử lý:
- Chuyển file mẫu (copy và paste) từ DATA đến RUN; vào Program Editor.
DATA;
INPUT K $ T $ Y;
CARDS;
1 G22 9.00
1 Z15 10.28
1 X31 7.00
1 K14 11.86
1 D25 14.94
2 G22 8.00
2 Z15 14.59
2 X31 6.00
2 K14 11.99
2 D25 14.63
3 G22 7.00
3 Z15 15.15
3 X31 8.23
3 K14 11.77
3 D25 13.81
4 G22 9.12
4 Z15 15.00
4 X31 7.40
4 K14 8.00
4 D25 14.90
;
PROC ANOVA;
CLASS K T;

7
MODEL Y = K T;
MEANS T / LSD ALPHA=0.01;
TITLE ‘NANG SUAT THUC THU’;
RUN;
Lưu ý: Có thể dùng mẫu này để xử lý nhiều chỉ tiêu, chỉ cần
thay mức alpha=0.05 hay alpha=0.01 sau khi đã xem kết quả bảng
ANOVA, và tựa đề (title) khi nhập số cho các chỉ tiêu khác.

- Click vào hình ở thanh công cụ (task bar) để xử lý số liệu


(Run→Submit).
- Xem kết quả trong Ouput: lưu bằng Select all→ Copy, paste vào word, hoặc save
.sas.
- Thời gian xử lý cpu time = 0.02 seconds.
NANG SUAT THUC THU
The ANOVA Procedure
Class Level Information
Class Levels Values

K 4 1234

T 5 D25 G22 K14 X31 Z15


Number of observations 20

NANG SUAT THUC THU

The ANOVA Procedure


Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F

Model 7 170.8494350 24.4070621 8.88 0.0006

Error 12 32.9776200 2.7481350

Corrected Total 19 203.8270550

R-Square Coeff Var Root MSE Y Mean

0.838208 15.16212 1.657750 10.93350


Source DF Anova SS Mean Square F Value Pr > F

K 3 0.9092550 0.3030850 0.11 0.9524


T 4 169.9401800 42.4850450 15.46 0.0001

NANG SUAT THUC THU


The ANOVA Procedure
t Tests (LSD) for Y
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.01
Error Degrees of Freedom 12
Error Mean Square 2.748135
Critical Value of t 3.05454
Least Significant Difference 3.5806

Means with the same letter are not significantly different.


t Grouping Mean N T

A 14.570 4 D25
A
B A 13.755 4 Z15
B
B C 10.905 4 K14

8
C
D C 8.280 4 G22
D
D 7.158 4 X31

1. 5. Giải thích kết quả: Xem bảng ANOVA


The ANOVA Procedure
Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 7 170.8494350 24.4070621 8.88 0.0006
Error 12 32.9776200 2.7481350
Corrected Total 19 203.8270550

R-Square Coeff Var Root MSE Y Mean


0.838208 15.16212 1.657750 10.93350
Source DF Anova SS Mean Square F Value Pr > F
K 3 0.9092550 0.3030850 0.11 0.9524
T 4 169.9401800 42.4850450 15.46 0.0001

- Nghiệm thức T có F Value 15,46 với Pr > F là <0,0001, các nghiệm thức khác biệt rất có
nghĩa ở mức p < 0,01.
- Xem xếp nhóm t grouping (t- test) ở mức p = 0,01 và các nghiệm thức được xếp bốn nhóm
theo ký tự là A, B, C, D; các trung bình cùng ký tự không khác biệt có nghĩa (Means with the
same letter are not significantly different).
- Lưu ý: xem Coeff Var = 15,16212 (hệ số biến thiên CV% trong bảng ANOVA) và Least
Significant Difference = 3,5806 (t Tests (LSD) for NSUAT).

1.6. Trình bày kết quả:


Bảng 1.1. Năng suất thực thu của năm giống cải ngọt.
Giống Năng suất (kg/ô 20m2 )
G22 8,280 cd
Z15 13,755 ab
X31 7,158 d
K14 10,905 bc
D25 14,570 a
LSD 3,5806
CV% 15,16
P 0,01
Ghi chú: Các trung bình cùng ký tự không khác biệt có nghĩa ở mức xác suất p< 0,01.
Giải thích: xếp nhóm theo ký tự có thể chia nhóm khác biệt trung bình các nghiệm thức theo
thứ tự từ cao đến thấp bốn nhóm là A , B, C và D. Năng suất cao nhất là giống D25, tiếp theo
là giống X15, thấp nhất là giống X31.

1.7. Phương thức tạo file mẫu cho thí nghiệm hai yếu tố
Thí nghiệm khảo sát năng suất đậu (kg/ô) với hai lượng phân lân (P1 = không bón lân, P2 = 25
kg/ha) và ba khoảng cách hàng (S1 = 45 cm, S2 = 90 cm, S3 = 135 cm). Ký hiệu K (khối I, II,
III), P (lân), S (khoảng cách hàng), Y (năng suất/ô), phỏng theo bài tập trang 86 (Petersen,
1994).
Sơ đồ thí nghiệm
I S2 P1 S1 P1 S3 P2 S3 P1 S1 P2 S2 P2
60 65 66 59 56 62

9
S1 P2 S3 P1 S3 P2 S1 P1 S2 P2 S2 P1
II
45 55 57 58 50 59
III S1 P1 S3 P1 S1 P2 S2 P1 S2 P2 S3 P2
55 51 43 54 45 50

Nhập số liệu với ký hiệu: K (khối), S (khoảng cách hàng), P (lượng phân lân), SP (yếu tố tương
tác khoảng cách hàng và lượng phân lân, nếu không có tương tác không cần ghi cột này và
không xếp nhóm). So sánh tương tác theo Dunnett test, xếp nhóm Duncan sáu giá trị trung bình
nghiệm thức (tất cả là 2 x 3 = 6 giá trị trung bình nghiệm thức).

Trình tự phân tích: a. Tạo file mẫu xử lý ANOVA và xếp nhóm nghiệm thức S và P.
b. Tính xác suất p so sánh tương tác hai yếu tố S*P theo Dunnett test.
c. Ghi kết quả phân tích vào bảng.

1.7. 1. Tạo file mẫu tính tương tác, không xếp nhóm các nghiệm thức trung bình của S
và P.
Kết quả sẽ cho bảng phân tích phương sai, tính tương tác S*P theo Dunnett test.
DATA;
INPUT K S P Y;
CARDS;
1 1 1 65
1 1 2 56
1 2 1 60
1 2 2 62
1 3 1 59
1 3 2 66
2 1 1 58
2 1 2 45
2 2 1 59
2 2 2 50
2 3 1 55
2 3 2 57
3 1 1 55
3 1 2 43
3 2 1 54
3 2 2 45
3 3 1 51
3 3 2 50
;
PROC GLM;
CLASS K S P;
MODEL Y = K S P S*P;
MEAN S P / LSD ALPHA=0.01;
MEAN S*P / DUNCAN ALPHA=0.01;
LSMEANS S*P / PDIFF ADJUST=DUNNETT;
TITLE ‘2 YEU TO’;
RUN;

1.7. 2. Tạo file mẫu tính tương tác, xếp nhóm các nghiệm thức trung bình của S và P.

10
Ghi thêm cột SP (yếu tố tương tác khoảng cách hàng và lượng phân lân để xếp nhóm khi tương
tác S*P có nghĩa). Kết quả sẽ cho bảng phân tích phương sai, tính tương tác S*P theo Dunnett
test, xếp nhóm các trung bình nghiệm thức của các yếu tố như sau:
DATA;
INPUT K $ S $ P $ SP $ Y;
CARDS;
1 1 1 S1P1 65
1 1 2 S1P2 56
1 2 1 S2P1 60
1 2 2 S2P2 62
1 3 1 S3P1 59
1 3 2 S3P2 66
2 1 1 S1P1 58
2 1 2 S1P2 45
2 2 1 S2P1 59
2 2 2 S2P2 50
2 3 1 S3P1 55
2 3 2 S3P2 57
3 1 1 S1P1 55
3 1 2 S1P2 43
3 2 1 S2P1 54
3 2 2 S2P2 45
3 3 1 S3P1 51
3 3 2 S3P2 50
;
PROC GLM;
CLASS K S P;
MODEL Y = K S P S*P;
MEAN S P / LSD ALPHA=0.01;
MEAN S*P / DUNCAN ALPHA=0.01;
LSMEANS S*P / PDIFF ADJUST=DUNNETT;
TITLE ‘2 YEU TO’;
RUN;

PROC GLM;
CLASS K SP;
MODEL Y = K SP;
MEAN SP / DUNCAN ALPHA=0.01;
RUN;
2 YEU TO
The GLM Procedure
Class Level Information
Class Levels Values
K 3 123

S 3 123

P 2 12

Number of observations 18

2 YEU TO

The GLM Procedure


Dependent Variable: Y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 7 684.6666667 97.8095238 14.53 0.0002

11
Error 10 67.3333333 6.7333333

Corrected Total 17 752.0000000

R-Square Coeff Var Root MSE Y Mean

0.910461 4.717940 2.594867 55.00000

Source DF Type I SS Mean Square F Value Pr > F

K 2 417.3333333 208.6666667 30.99 <.0001


S 2 21.3333333 10.6666667 1.58 0.2526
P 1 98.0000000 98.0000000 14.55 0.0034
S*P 2 148.0000000 74.0000000 10.99 0.0030

Source DF Type III SS Mean Square F Value Pr > F


K 2 417.3333333 208.6666667 30.99 <.0001
S 2 21.3333333 10.6666667 1.58 0.2526
P 1 98.0000000 98.0000000 14.55 0.0034
S*P 2 148.0000000 74.0000000 10.99 0.0030

2 YEU TO

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 10
Error Mean Square 6.733333
Critical Value of t 3.16927
Least Significant Difference 4.748

Means with the same letter are not significantly different.

t Grouping Mean N S

A 56.333 6 3
A
A 55.000 6 2
A
A 53.667 6 1

2 YEU TO

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 10
Error Mean Square 6.733333
Critical Value of t 3.16927
Least Significant Difference 3.8768

Means with the same letter are not significantly different.

t Grouping Mean N P

A 57.333 9 1

B 52.667 9 2

2 YEU TO
12
The GLM Procedure

Level of Level of --------------Y--------------


S P N Mean Std Dev

1 1 3 59.3333333 5.13160144
1 2 3 48.0000000 7.00000000
2 1 3 57.6666667 3.21455025
2 2 3 52.3333333 8.73689495
3 1 3 55.0000000 4.00000000
3 2 3 57.6666667 8.02080628

2 YEU TO
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Dunnett

H0:LSMean=
Control
S P Y LSMEAN Pr > |t|

1 1 59.3333333
1 2 48.0000000 0.0013
2 1 57.6666667 0.8899
2 2 52.3333333 0.0301
3 1 55.0000000 0.2208
3 2 57.6666667 0.8899

Giải thích: sử dụng mức xác suất p-value để so sánh tương tác theo Dunnett test (Adjustment
for Multiple Comparisons: Dunnett), khi p < 0,05 thì các giá trị trung bình bình phương có ảnh
hưởng độc lập khác nhau, nếu p > 0,05 thì các giá trị này ảnh hưởng như nhau.
Phương pháp so sánh Dunnett test cho thấy: các tương tác S1P1, S2P1, S3P1 và S3P2 có ảnh
hưởng như nhau đến năng suất (p từ 0,2208 đến 0,8899). Tương tác ảnh hưởng độc lập là S1P2
(p = 0,0013) và S2P2 (p = 0,0301).
2 YEU TO
The GLM Procedure
Class Level Information

Class Levels Values

K 3 123

SP 6 S1P1 S1P2 S2P1 S2P2 S3P1 S3P2

Number of observations 18

2 YEU TO
The GLM Procedure

Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F

Model 7 684.6666667 97.8095238 14.53 0.0002

Error 10 67.3333333 6.7333333

Corrected Total 17 752.0000000

R-Square Coeff Var Root MSE Y Mean

0.910461 4.717940 2.594867 55.00000

Source DF Type I SS Mean Square F Value Pr > F

K 2 417.3333333 208.6666667 30.99 <.0001


SP 5 267.3333333 53.4666667 7.94 0.0029

13
Source DF Type III SS Mean Square F Value Pr > F

K 2 417.3333333 208.6666667 30.99 <.0001


SP 5 267.3333333 53.4666667 7.94 0.0029

2 YEU TO

The GLM Procedure

Duncan's Multiple Range Test for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 10
Error Mean Square 6.733333

Number of Means 2 3 4 5 6
Critical Range 6.714 6.997 7.175 7.298 7.387

Means with the same letter are not significantly different.

Duncan Grouping Mean N SP

A 59.333 3 S1P1
A
A 57.667 3 S3P2
A
A 57.667 3 S2P1
A
A 55.000 3 S3P1
A
B A 52.333 3 S2P2
B
B 48.000 3 S1P2

Bảng 1.2. Năng suất đậu (kg/ô) do ảnh hưởng khoảng cách hàng và lượng lân

Yếu tố lân Yếu tố khoảng cách hàng Trung bình yếu tố lân
S1 = 45 cm S2 = 90 cm S3 = 135 cm
P1= 0 kg/ha 59,33 a 57,67 a 55,00 a 57,33 A
P2 = 25kg/ha 48,00 b 52,33 ab 57,67 a 52,67 B
Trung bình yếu tố 53,67 A 55,00 A 56,33 A
khoảng cách hàng
* Các trung bình cùng ký tự không khác biệt có nghĩa thống kê ở mức xác suất với yếu tố P: p < 0,01,
tương tác S*P : p<0,01; CV = 4,7%.

Giải thích kết quả:

- Kết quả từ bảng phương sai và xếp nhóm yếu tố khoảng cách hàng không khác biệt (F =1,58
với p = 0,2526), yếu tố lân có khác biệt có nghĩa (F = 14,55 với p = 0,0034). Xếp nhóm
Duncan các giá trị trung bình tương tác lân và khoảng cách hàng cho thấy có hai nhóm theo ký
tự là A và B trong đó năng suất cao nhất 59,33 kg/ô.
- Có tương tác của khoảng cách hàng và lân S*P đến năng suất (F = 10,99 với p = 0,003).
Năng suất ô chịu tác động của lân và khác biệt có nghĩa ở hai lượng lân.
- So sánh giá trị xác suất p các nghiệm thức trung bình tương tác theo Dunnett cho thấy tương
tác khoảng cách hàng với bón lân cho năng suất cao nhất là 59,33 kg/ô của tương tác S1P1
(khoảng cách hàng 45 cm và không bón lân) có ảnh hưởng giống như S2P1(khoảng cách hàng
90 cm và không bón lân) có p = 0,8899, giống như S3P1 (khoảng cách hàng 135 cm và không

14
bón lân) với p = 0,2208 và khoảng cách 135 cm với lượng lân 25 kg/ha (S3P2 với p = 0,8899).
Tương tác ảnh hưởng độc lập là bón lân với khoảng cách hàng 45 cm (S1P2 với p = 0,0013) và
90 cm (S2P2 với p = 0,0301).

Ghi chú: phân tích tương tác các giá trị dựa trên số trung bình bình phương nhỏ nhất:
- Khác biệt means và lsmeans:
Số trung bình (means) = tổng số các giá trị / số giá trị (theo số học).
Số trung bình bình phương nhỏ nhất (lsmeans) = tổng số các giá trị kết hợp tuyến
tính / số giá trị, được dùng để so sánh tương tác A*B, A*B*C.
 Nếu số giá trị đầy đủ trong bố trí thí nghiệm nhiều yếu tố, số trung bình bằng với số
trung bình bình phương nhỏ nhất.
 Nếu thiếu một số giá trị, số trung bình khác với số trung bình bình phương nhỏ nhất.

Xem số liệu bảng sau:

Số trung bình sẽ là:

    Số trung bình bình phương nhỏ nhất:

Nhưng thiếu 1 số như bảng sau:

Số trung bình = (4 + 6 + 2 + ....+ 4 + 2 + 3)/8 = 3,625.


Trái lại, số trung bình bình phương nhỏ nhất = (4 + 4 + 3)/3 = 3,667.

- Nếu quan tâm đến so sánh nhiều giá trị độc lập và không quan tâm đến nhiều tương tác,
sử dụng t test lặp lại với LSD.
- Nếu quan tâm đến so sánh tất cả các giá trị từng cặp, áp dụng Tukey test hoặc so sánh
tất cả giá trị với một giá trị đối chứng thì sử dụng Dunnett test để có tương tác rõ nhất
(SAS, 2004).

- So sánh giá trị p điều chỉnh giải thích tương tác của A*B, căn cứ trên giả thiết căn bản là
H0: LSMean(i) = LSMean(j) gọi là giả thiết null, có nghĩa là các trị số giống nhau. Khi so sánh
nhiều trị số với nhau, giá trị p điều chỉnh (adjusted p-value) là giá trị mức sai số chung nhỏ
nhất (FWE, Familywise Error Rate) để bác bỏ giả thiết trên (Westfall, 2008).

15
Giải thích so sánh nhiều giá trị:
- Khi so sánh, nếu không bác bỏ giả thiết null H0: các trị số giống nhau.
- Duncan multiple range test (DMRT) sử dụng so sánh t test cho nhiều giá trị trung bình
với trên bốn giá trị. LSD áp dụng cho hai biến rất dễ dàng và không cần dùng DMRT.

1.8. Ý nghĩa các từ và chuyển đổi giá trị


- SD (Standard deviation, độ lệch chuẩn): mức độ biến động của dãy A so với dãy B, mặc dù
hai giá trị trung bình của hai dãy bằng nhau.
- CV (Coefficience of variance, hệ số biến thiên): so sánh mức biến động của nhiều mẫu.
- SE (Standard error, sai số chuẩn): sai số của tổng các giá trị.

- Chia tổ: chia nhỏ thành tổ khi có số liệu thu thập lớn. Áp dụng công thức K = 5log n.
Ex: có 50 cây, K = 5log 50 = 8,49; chọn tám tổ. Khoảng cách tổ C = (Xmax-Xmin)/K
Tổ một: 3- 4,4 ; tổ hai: 4,5-5,9 ; tổ ba: 6 -7,4 … (Phạm Chí Thành, 1976).

Chuyển đổi giá trị (transformation) rất cần để so sánh khác biệt các giá trị trung bình, vì không
chuyển giá trị, thống kê không khác biệt với LSD lớn, nhưng chuyển đổi giá trị thì thống kê có
khác biệt có nghĩa vì LSD nhỏ (Clewer, 2001).

- Số liệu là đơn vị số x từ 1 đến 35, chuyển sang yi = ln (xi), (Clewer, 2001).

- Số liệu là đơn vị số có x = 0,02 cộng 1 vào các trị số và đổi sang yi = log (xi+1), lưu ý phải
có giá trị giả định lớn hơn 1 mới tính log được. Vì có số “0” nên cần giả định (assumption) để
tính số hợp lý (Phạm Chí Thành, 1976 và Clewer, 2001).
Trọng lượng khô của lúa cỏ (red rice) trong thí nghiệm ba nghiệm thức từ 0,08 đến 32 g/m 2,
được đổi số liệu sang log (x+1) trước khi thống kê so sánh LSD (Catala, 1993).

- số liệu là % với trị số x từ 0 - 30 (sau khi cộng thêm 0,5 hoặc 1 cho các giá trị (Phạm Chí
Thành, 1976) và từ 70 - 100, có thể chuyển yi = √% (Clewer, 2001).
Chuyển đổi số liệu sang √(x + 0,5) đối với chỉ số bệnh từ 1,05 đến 2,98 theo thí nghiệm của
Taa và ctv (2002).

- số liệu là % với trị số x từ 40 - 70% không cần chuyển đổi vì kết quả thống kê không khác
giữa số nguyên và số liệu chuyển đổi.

- số liệu là % với trị số x từ 1 đến 100, chuyển sang góc (angular) yi = arcsin√%, thường gặp
trong việc tính tỉ lệ nảy mầm, tỉ lệ ra rễ với tác động của chất điều hòa sinh trưởng, tỉ lệ nấm
bệnh.
Thí nghiệm khảo sát tỉ lệ nảy mầm của hạt Echinacea purpurea từ 4 đến 82% được chuyển
sang góc arcsin√% (Qu và ctv, 2005).

Lưu ý chuyển đổi trong excel:


- chuyển log: yi = LN(x)
- chuyển tỉ lệ %: đổi p = 99 →0.99→SQRT(0.99) = x1→ASIN(x1) = x2→DEGREES(x2) =
giá trị ARCSIN√% = yi

1.9. Ô cơ sở (plot size) và lặp lại (replications)


16
- Ô cơ sở cho cây nhỏ: 20-40 cây, cà phê: 4 cây, cây ăn quả nhỏ: 10-20 cây, rau: 20-30 m 2,
thuốc BVTV: 10 m2. Thí nghiệm sản xuất: 100 m2. Sai số (e) cho 1 m2 = 19,6%, 10 m2 = 7,5%,
20 m2 = 2,9%, 50 m2 = 1,3% (Phạm Chí Thành, 1976).

- Lặp lại (n): bốn lần là phù hợp, tối thiểu là ba lần, cần xác định n = ((V%)/(e%)) 2. Thí nghiệm
năm loại đất cho năng suất cải có sai số chuẩn (SE) của trị số trung bình với ba lần lặp lại là
2,83; bốn lần lặp lại là 2,45 và năm lần lặp lại là 2,20 (Petersen, 1994).

Chương 2

PHÂN TÍCH PHƯƠNG SAI THÍ NGHIỆM BỐ TRÍ


HOÀN TOÀN NGẪU NHIÊN
(Completely Randomized Design, CRD)

2.1. Thí nghiệm hoàn toàn ngẫu nhiên một yếu tố


Áp dụng trong điều kiện đồng nhất về môi trường, độ dốc, ánh sáng, độ phì nhiêu của đất, bố
trí trong phòng thí nghiệm.
Tiện lợi của phương pháp này là các nghiệm thức có số lần lặp lại khác nhau, nhưng hạn chế là
ít chính xác khi đơn vị thí nghiệm trong nghiệm thức không đồng nhất. Để khắc phục điều này,
cần tăng nhiều số lần lặp lại và kích thước ô phải lớn, do đó tốn kém hơn (Clewer, 2001).

Thí nghiệm dòng vi khuẩn ảnh hưởng hàm lượng đạm trên cỏ xa trục thảo.

Thí nghiệm gồm sáu nghiệm thức tiêm chủng 6 nhóm dòng vi khuẩn ảnh hưởng đến hàm
lượng đạm (mg N) của giống cỏ xa trục thảo đỏ (red clover), năm lần lặp lại. Năm nghiệm thức
đầu cho năm dòng vi khuẩn Rhizobium trifolii riêng biệt kết hợp với hỗn hợp năm dòng vi
khuẩn Rhizobium meliloti. Nghiệm thức compos = hỗn hợp năm dòng vi khuẩn Rhizobium
trifolii với hỗn hợp năm dòng vi khuẩn Rhizobium meliloti (phỏng theo bài tập 2, phương pháp
so sánh nhiều cách xếp hạng, xếp số theo hàng ngang với cách nhập số liệu là datalines, SAS,
1999). Tương tự, xếp số liệu theo hàng dọc cho kết quả xử lý như nhau.

data;
input T $ N @@;
datalines;
3DOK1 19.4 3DOK1 32.6 3DOK1 27 3DOK1 32.1 3DOK1 33
3DOK5 17.7 3DOK5 24.8 3DOK5 27.9 3DOK5 25.2 3DOK5 24.3
3DOK4 17 3DOK4 19.4 3DOK4 9.1 3DOK4 11.9 3DOK4 15.8
3DOK7 20.7 3DOK7 21 3DOK7 20.5 3DOK7 18.8 3DOK7 18.6
3DOK13 14.3 3DOK13 14.4 3DOK13 11.8 3DOK13 11.6 3DOK13 14.2
COMPOS 17.3 COMPOS 19.4 COMPOS 19.1 COMPOS 16.9 COMPOS 20.8
;
proc anova;
class T;
model N = T;
means T / tukey;
means t / duncan waller;
means t / lsd;
title ‘vi khuan’;   
run;
  vi khuan

17
The ANOVA Procedure

Class Level Information

Class Levels Values

T 6 3DOK1 3DOK13 3DOK4 3DOK5 3DOK7 COMPOS

Number of observations 30

vi khuan

The ANOVA Procedure

Dependent Variable: N

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 5 847.046667 169.409333 14.37 <.0001

Error 24 282.928000 11.788667

Corrected Total 29 1129.974667

R-Square Coeff Var Root MSE N Mean

0.749616 17.26515 3.433463 19.88667

Source DF Anova SS Mean Square F Value Pr > F

T 5 847.0466667 169.4093333 14.37 <.0001

vi khuan
The ANOVA Procedure

Tukey's Studentized Range (HSD) Test for N

NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type
II error rate than REGWQ.

Alpha 0.05
Error Degrees of Freedom 24
Error Mean Square 11.78867
Critical Value of Studentized Range 4.37265
Minimum Significant Difference 6.7142

Means with the same letter are not significantly different.

Tukey Grouping Mean N T

A 28.820 5 3DOK1
A
B A 23.980 5 3DOK5
B
B C 19.920 5 3DOK7
B C
B C 18.700 5 COMPOS
C
C 14.640 5 3DOK4
C
C 13.260 5 3DOK13

vi khuan

The ANOVA Procedure

Waller-Duncan K-ratio t Test for N

NOTE: This test minimizes the Bayes risk under additive loss and certain other assumptions.

18
Kratio 100
Error Degrees of Freedom 24
Error Mean Square 11.78867
F Value 14.37
Critical Value of t 1.91873
Minimum Significant Difference 4.1665

Means with the same letter are not significantly different.

Waller Grouping Mean N T

A 28.820 5 3DOK1

B 23.980 5 3DOK5
B
C B 19.920 5 3DOK7
C
C D 18.700 5 COMPOS
D
E D 14.640 5 3DOK4
E
E 13.260 5 3DOK13

vi khuan

The ANOVA Procedure

Duncan's Multiple Range Test for N

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 24
Error Mean Square 11.78867

Number of Means 2 3 4 5 6
Critical Range 4.482 4.707 4.852 4.954 5.031

Means with the same letter are not significantly different.

Duncan Grouping Mean N T

A 28.820 5 3DOK1

B 23.980 5 3DOK5
B
C B 19.920 5 3DOK7
C
C D 18.700 5 COMPOS
D
E D 14.640 5 3DOK4
E
E 13.260 5 3DOK13

vi khuan

The ANOVA Procedure

t Tests (LSD) for N

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 24
Error Mean Square 11.78867
Critical Value of t 2.06390
Least Significant Difference 4.4818

Means with the same letter are not significantly different.


19
t Grouping Mean N T

A 28.820 5 3DOK1

B 23.980 5 3DOK5
B
C B 19.920 5 3DOK7
C
C D 18.700 5 COMPOS
D
E D 14.640 5 3DOK4
E
E 13.260 5 3DOK13

Giải thích: sự khác biệt thay đổi khi so sánh các nghiệm thức với các so sánh giá trị trung bình
như sau:

Tukey's Studentized Range (HSD) Test for Nitrogen Minimum Significant Difference 6,7142
Waller-Duncan K-ratio t Test for Nitrogen Minimum Significant Difference 4,1665
t Tests (LSD) for Nitrogen Least Significant Difference 4,4818
Duncan grouping có giá trị so sánh cặp 2 trung bình với critical range là 4,482, nhưng tăng dần
khi có nhiều so sánh các nghiệm thức.

Giải thích: tổng độ tự do của thí nghiệm là 6 - 1 = 5, F tính của thí nghiệm là 14,37 với p <
0,0001. Hàm lượng đạm thay đổi và có khác biệt thống kê được chọn ở mức p< 0,05 do tác
động của sáu dòng vi khuẩn. Xếp nhóm theo Tukey test khác với các cách khác. Xếp nhóm
theo Waller, Duncan và t test LSD như nhau, xếp nhóm các trung bình chia thành năm nhóm
theo ký tự từ cao đến thấp là A, B, C, D, và E. Xếp nhóm theo Duncan test cho thấy hàm
lượng đạm tích lũy do 3DOK1 cao nhất, khác biệt có nghĩa với các dòng vi khuẩn khác, thấp
nhất là 3DOK13.

Hiện có trên 20 giá trị so sánh khác biệt các nghiệm thức (Kuehl, 2000; Clewer, 2001),
nhưng phổ biến là các cách trên. Xếp nhóm theo Duncan test được dùng phổ biến hiện nay.

2.2. Thí nghiệm hoàn toàn ngẫu nhiên hai yếu tố không cân đối
Bài tập thí nghiệm hai yếu tố không cân đối (Unbalanced 2-by-2 Factorial, SAS, 1999), yếu tố
A và B được thiết kế theo sơ đồ như sau:
A
1 2
1 12 20
B 14 18
2 11 7
9
data;
input A $ B $ Y @@;
datalines;
A1 B1 12 A1 B1 14 A1 B2 11 A1 B2 9
A2 B1 20 A2 B1 18 A2 B2 17      
;
20
proc glm;
class A B;
model Y=A B A*B;
means A/lsd;
title ‘2 YEU TO KHONG CAN DOI’;
run;
2 YEU TO KHONG CAN DOI

The GLM Procedure

Class Level Information

Class Levels Values

A 2 A1 A2

B 2 B1 B2

Number of observations 7

2 YEU TO KHONG CAN DOI

The GLM Procedure

Dependent Variable: Y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 3 91.71428571 30.57142857 15.29 0.0253

Error 3 6.00000000 2.00000000

Corrected Total 6 97.71428571

R-Square Coeff Var Root MSE Y Mean

0.938596 9.801480 1.414214 14.42857

Source DF Type I SS Mean Square F Value Pr > F

A 1 80.04761905 80.04761905 40.02 0.0080


B 1 11.26666667 11.26666667 5.63 0.0982
A*B 1 0.40000000 0.40000000 0.20 0.6850

Source DF Type III SS Mean Square F Value Pr > F

A 1 67.60000000 67.60000000 33.80 0.0101


B 1 10.00000000 10.00000000 5.00 0.1114
A*B 1 0.40000000 0.40000000 0.20 0.6850

2 YEU TO KHONG CAN DOI

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 3
Error Mean Square 2
Critical Value of t 3.18245
Least Significant Difference 3.4374
Harmonic Mean of Cell Sizes 3.428571

NOTE: Cell sizes are not equal.

21
Means with the same letter are not significantly different.

t Grouping Mean N A

A 18.333 3 A2

B 11.500 4 A1

Giải thích:
- Tổng độ tự do của thí nghiệm là n - 1 = 7 - 1 = 6. F test toàn thí nghiệm là 15,29 v ới xác suất
p = 0,0253, chứng tỏ có khác biệt trong 4 trung bình nghiệm thức.
- Thí nghiệm cân đối các ô thí nghiệm thường có bảng ước lượng Type I SS và Type III SS (SS
= Sum of Squares, tổng bình phương) bằng nhau, nhưng trong thí nghiệm không cân đối này,
sử dụng Type III SS là phù hợp.
- So sánh khác biệt ở mức α = 0,05 cho thấy không có tương tác A*B (p = 0,6850), chứng tỏ
ảnh hưởng của yếu tố A không lệ thuộc vào yếu tố B và ngược lại. Cần tính khác biệt từng yếu
tố, trong đó yếu tố B không khác biệt (p = 0,1114), yếu tố A có khác biệt (p = 0,0101) ở mức p
< 0,05.

Chương 3

PHÂN TÍCH PHƯƠNG SAI THÍ NGHIỆM


KHỐI ĐẦY ĐỦ NGẪU NHIÊN
(Randomized Complete Block Design, RCBD)

3.1. Khối đầy đủ hoàn toàn ngẫu nhiên một yếu tố


Đây là kiểu bố trí phổ biến nhất trong nghiên cứu nông nghiệp. Áp dụng cho việc so sánh
các giống, loại phân bón trong điều kiện đất đai, ngoại cảnh tương đối ít đồng nhất. Thường có
chiều biến thiên của hướng dốc hoặc hướng ánh sáng, độ phì đất, pH, cần điều chỉnh ô phù hợp
về kích thước, chiều dài ô. Kiểu RCBD giảm sai số thí nghiệm, nhưng chịu ảnh hưởng của
khối.
Thí nghiệm so sánh năng suất tươi (kg/ô 36m2) của 6 giống đậu Hà Lan trong 4 khối, sử
dụng ký tự thay tên giống (Barnard, 1994).
Bố trí thí nghiệm theo khối đầy đủ hoàn toàn ngẫu nhiên, bốn lần lặp lại, sáu nghiệm thức.
Tổng số ô = 4x6 = 24 ô (k = khối; t = nghiệm thức, tên giống; y = năng suất). Sơ đồ thí
nghiệm như sau:
Hướng dốc cao
I f d c e b a
II e f c b a d
III c d e a b f
IV e d c a f b
Thấp
data;
input k $ t $ y;
cards;
1 f 9
1 d 14.6
1 c 18.3
1 e 14.1
22
1 b 21.9
1 a 22.4
2 e 14.2
2 f 14.1
2 c 17.4
2 b 25.6
2 a 23.9
2 d 19.2
3 c 12.7
3 d 15.8
3 e 11.5
3 a 21.1
3 b 23.7
3 f 6.4
4 e 12.1
4 d 16.1
4 c 15.9
4 a 19.6
4 f 12.3
4 b 18.3
;
proc anova;
class k t;
model y = k t;
means t /duncan alpha=0.01;
title 'Thi nghiem 1 yeu to RCBD';
run;

Thi nghiem 1 yeu to RCBD

The ANOVA Procedure

Class Level Information

Class Levels Values

k 4 1234

t 6 abcdef

Number of observations 24

Thi nghiem 1 yeu to RCBD

The ANOVA Procedure

Dependent Variable: y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 8 497.3300000 62.1662500 16.42 <.0001

Error 15 56.7950000 3.7863333

Corrected Total 23 554.1250000

R-Square Coeff Var Root MSE y Mean

0.897505 11.66927 1.945850 16.67500

Source DF Anova SS Mean Square F Value Pr > F

23
k 3 52.8950000 17.6316667 4.66 0.0171
t 5 444.4350000 88.8870000 23.48 <.0001

Thi nghiem 1 yeu to RCBD

The ANOVA Procedure


Duncan's Multiple Range Test for y
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.01
Error Degrees of Freedom 15
Error Mean Square 3.786333

Number of Means 2 3 4 5 6
Critical Range 4.054 4.229 4.342 4.424 4.485

Means with the same letter are not significantly different.

Duncan Grouping Mean N t

A 22.375 4 b
A
A 21.750 4 a

B 16.425 4 d
B
B 16.075 4 c
B
C B 12.975 4 e
C
C 10.450 4 f

Giải thích: kết quả cho thấy các nghiệm thức khác biệt rất có nghĩa ở mức p < 0,01, xếp nhóm
theo ký tự chia làm ba nhóm là A, B và C và không khác biệt trong cùng nhóm với nhau.
Nghiệm thức b cho năng suất cao nhất, không khác biệt với nghiệm thức a và thấp nhất là
nghiệm thức f.

3.2. Kiểu ô vuông la tinh (Latin square)

Áp dụng khi có biến thiên hai chiều của các nghiệm thức và cần được khảo sát theo hai hướng,
thường là bố trí theo hàng và cột. Bài tập: thí nghiệm khảo sát tăng giảm chiều cao lúa mì theo
tiêu chuẩn do máy gặt trên sáu lô. Thứ tự ô (I, II, III, IV, V, VI) trên các khu vực A, B, C, D,
E, F (Barnard, 1994). Chiều cao chồi so sánh với chiều cao thực sự (cm).

Khu vực
I f b a d c e
II b f d a e c
III c e f b d a
IV d c b e a f
V e a c f b d
VI a d e c f b

Dữ liệu được sắp xếp như sau: hàng (H), cột (C), nghiệm thức (T) và chiều cao (Y).
DATA;
INPUT H C T $ Y;
CARDS;
1 1 f 3.5
1 2 b 4.2
1 3 a 6.7

24
1 4 d 6.6
1 5 c 4.1
1 6 e 3.8
2 1 b 8.9
2 2 f 1.9
2 3 d 5.8
2 4 a 4.5
2 5 e 2.4
2 6 c 5.8
3 1 c 9.6
3 2 e 3.7
3 3 f -2.7
3 4 b 3.7
3 5 d 6
3 6 a 7
4 1 d 10.5
4 2 c 10.2
4 3 b 4.6
4 4 e 3.7
4 5 a 5.1
4 6 f 3.8
5 1 e 3.1
5 2 a 7.2
5 3 c 4
5 4 f -3.3
5 5 b 3.5
5 6 d 5
6 1 a 5.9
6 2 d 7.6
6 3 e -0.7
6 4 c 3
6 5 f 4
6 6 b 8.6
;
PROC ANOVA;
CLASS H C T;
MODEL Y = H C T;
MEANS T / DUNCAN ALPHA=0.01;
TITLE ‘CHIEU CAO LUA MI’;
RUN;
CHIEU CAO LUA MI

The ANOVA Procedure

Class Level Information

Class Levels Values

H 6 123456

C 6 123456

T 6 abcdef

Number of observations 36

CHIEU CAO LUA MI

The ANOVA Procedure

Dependent Variable: Y
25
Sum of
Source DF Squares Mean Square F Value Pr > F

Model 15 263.0641667 17.5376111 5.27 0.0004

Error 20 66.5633333 3.3281667

Corrected Total 35 329.6275000


R-Square Coeff Var Root MSE Y Mean

0.798065 38.33961 1.824326 4.758333


Source DF Anova SS Mean Square F Value Pr > F

H 5 28.5991667 5.7198333 1.72 0.1763


C 5 78.8691667 15.7738333 4.74 0.0051
T 5 155.5958333 31.1191667 9.35 0.0001

CHIEU CAO LUA MI


The ANOVA Procedure
Duncan's Multiple Range Test for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.01
Error Degrees of Freedom 20
Error Mean Square 3.328167

Number of Means 2 3 4 5 6
Critical Range 2.997 3.126 3.211 3.273 3.321

Means with the same letter are not significantly different.

Duncan Grouping Mean N T

A 6.917 6 d
A
A 6.117 6 c
A
A 6.067 6 a
A
B A 5.583 6 b
B
B C 2.667 6 e
C
C 1.200 6 f
Giải thích:
Kết quả xếp nhóm cho thấy có ba nhóm theo ký tự là A , B và C. Chiều cao gặt lúa thay đổi do
thứ tự ô, các nghiệm thức khác biệt rất có nghĩa ở mức p<0,01; cao nhất là nghiệm thức d, thấp
nhất là nghiệm thức f.

3.3. Khối đầy đủ ngẫu nhiên hai yếu tố có tương tác (interaction)
Kiểu thí nghiệm căn bản này thực hiện để tìm tác động đồng thời của hai yếu tố cần khảo sát.
Thí nghiệm hai yếu tố, yếu tố A có ba nghiệm thức, yếu tố B có năm nghiệm thức
Thí nghiệm bố trí trên ba khối đầy đủ ngẫu nhiên, khảo sát năng suất cải dầu Y (kg/ô) do ảnh
hưởng ba nồng độ chất điều hòa sinh trưởng (S1, S2, S3) và năm lượng đạm (D1, D2, D3, D4,
D5), số liệu trích dẫn từ trang 168 của Clewer (2001).

Có hai bước: (1) xử lý ANOVA bằng PROC GLM (General Linear Model), xếp nhóm các
nghiệm thức của yếu tố S, D. So sánh tương tác LSMEAN bằng: LSMEANS S*D/PDIFF
ADJUST=DUNNETT; (2) tính khác biệt tương tác của yếu tố S*D dựa trên so sánh giá trị xác suất
điều chỉnh (adjust p-values) của PDIFF ADJUST=DUNNETT.
File mẫu xử lý ANOVA và xếp nhóm các nghiệm thức của yếu tố S và D mã hóa bằng số.
26
* Lưu ý sử dụng dấu $ để cách các biến số. Mã hóa bằng chữ với khối (K), nồng độ chất điều
hòa sinh trưởng (S) và lượng đạm (D), năng suất cải dầu Y (kg/ô).

DATA;
INPUT K $ S $ D $ SD $ Y;
CARDS;
1 1 1 S1D1 0.9
1 1 2 S1D2 1.2 ;
PROC GLM;
1 1 3 S1D3 1.3
CLASS K S D;
1 1 4 S1D4 1.8 MODEL Y = K S D S*D;
1 1 5 S1D5 1.1 MEAN S/LSD;
1 2 1 S2D1 0.9 MEAN D/LSD ALPHA=0.01;
1 2 2 S2D2 1.1 MEAN S*D/ DUNCAN ALPHA=0.01;
1 2 3 S2D3 1.3 LSMEANS S*D / PDIFF ADJUST=DUNNETT
1 2 4 S2D4 1.6 ALPHA=0.01;
1 2 5 S2D5 1.9 RUN;
1 3 1 S3D1 0.9
PROC GLM;
1 3 2 S3D2 1.4 CLASS K SD;
1 3 3 S3D3 1.3 MODEL Y = K SD;
1 3 4 S3D4 1.4 MEAN SD / DUNCAN ALPHA=0.01;
1 3 5 S3D5 1.2 RUN;
2 1 1 S1D1 0.9 The SAS System
The GLM Procedure
2 1 2 S1D2 1.3 Class Level Information
2 1 3 S1D3 1.5 Class Levels Values
2 1 4 S1D4 1.9
K 3 123
2 1 5 S1D5 1.4
2 2 1 S2D1 0.8 S 3 123
2 2 2 S2D2 0.9
D 5 12345
2 2 3 S2D3 1.5
2 2 4 S2D4 1.3 Number of observations 45
The SAS System
2 2 5 S2D5 1.6 The GLM Procedure
2 3 1 S3D1 1 Dependent Variable: Y
2 3 2 S3D2 1.2 Sum of
Source DF Squares Mean Square F
2 3 3 S3D3 1.4 Value Pr > F
2 3 4 S3D4 1.5
2 3 5 S3D5 1.1 Model 16 3.73866667 0.23366667
11.91 <.0001
3 1 1 S1D1 1
3 1 2 S1D2 1.2 Error 28 0.54933333 0.01961905
3 1 3 S1D3 1.4 Corrected Total 44 4.28800000
3 1 4 S1D4 2.1
3 1 5 S1D5 1.2 R-Square Coeff Var Root MSE Y
Mean
3 2 1 S2D1 0.8
3 2 2 S2D2 0.9 0.871891 11.11651 0.140068
3 2 3 S2D3 1.1 1.260000
3 2 4 S2D4 1.1 Source DF Type I SS Mean Square F
3 2 5 S2D5 1.5 Value Pr > F
3 3 1 S3D1 0.7
K 2 0.06400000 0.03200000
3 3 2 S3D2 1 1.63 0.2138
3 3 3 S3D3 1.4 S 2 0.16933333 0.08466667
4.32 0.0232
3 3 4 S3D4 1.4 D 4 2.49022222 0.62255556
3 3 5 S3D5 1.3 31.73 <.0001
S*D 8 1.01511111 0.12688889
6.47 <.0001

Source DF Type III SS Mean Square F Value Pr > F

27
K 2 0.06400000 0.03200000 1.63 0.2138
S 2 0.16933333 0.08466667 4.32 0.0232
D 4 2.49022222 0.62255556 31.73 <.0001
S*D 8 1.01511111 0.12688889 6.47 <.0001

The SAS System

The GLM Procedure


t Tests (LSD) for Y
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 28
Error Mean Square 0.019619
Critical Value of t 2.04841
Least Significant Difference 0.1048

Means with the same letter are not significantly different.


t Grouping Mean N S
A 1.34667 15 1

B 1.22000 15 2
B
B 1.21333 15 3

The SAS System

The GLM Procedure

t Tests (LSD) for Y


NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.01
Error Degrees of Freedom 28
Error Mean Square 0.019619
Critical Value of t 2.76326
Least Significant Difference 0.1825
Means with the same letter are not significantly different.

t Grouping Mean N D
A 1.56667 9 4

B 1.36667 9 5
B
B 1.35556 9 3

C 1.13333 9 2

D 0.87778 9 1
The SAS System
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Dunnett

H0:LSMean=
Control
S D Y LSMEAN Pr > |t|

1 1 0.93333333
1 2 1.23333333 0.1146
1 3 1.40000000 0.0037
1 4 1.93333333 <.0001
1 5 1.23333333 0.1146
2 1 0.83333333 0.9844
2 2 0.96666667 1.0000
2 3 1.30000000 0.0321
2 4 1.33333333 0.0161
2 5 1.66666667 <.0001
3 1 0.86666667 0.9996
3 2 1.20000000 0.2017
3 3 1.36666667 0.0078
3 4 1.43333333 0.0017
3 5 1.20000000 0.2017

The SAS System

28
The GLM Procedure

Class Level Information

Class Levels Values

K 3 123

SD 15 S1D1 S1D2 S1D3 S1D4 S1D5 S2D1 S2D2 S2D3 S2D4 S2D5 S3D1 S3D2 S3D3 S3D4 S3D5

Number of observations 45

The SAS System

The GLM Procedure

Dependent Variable: Y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 16 3.73866667 0.23366667 11.91 <.0001

Error 28 0.54933333 0.01961905

Corrected Total 44 4.28800000

R-Square Coeff Var Root MSE Y Mean

0.871891 11.11651 0.140068 1.260000

Source DF Type I SS Mean Square F Value Pr > F

K 2 0.06400000 0.03200000 1.63 0.2138


SD 14 3.67466667 0.26247619 13.38 <.0001

Source DF Type III SS Mean Square F Value Pr > F

K 2 0.06400000 0.03200000 1.63 0.2138


SD 14 3.67466667 0.26247619 13.38 <.0001

The SAS System

The GLM Procedure

Duncan's Multiple Range Test for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 28
Error Mean Square 0.019619

Number of Means 2 3 4 5 6 7 8
Critical Range .3160 .3296 .3387 .3453 .3505 .3547 .3582

Number of Means 9 10 11 12 13 14 15
Critical Range .3611 .3636 .3658 .3678 .3695 .3710 .3723

Means with the same letter are not significantly different.

Duncan Grouping Mean N SD

A 1.9333 3 S1D4
A
B A 1.6667 3 S2D5
B
B C 1.4333 3 S3D4
B C
B C 1.4000 3 S1D3
29
B C
B C 1.3667 3 S3D3
B C
B C 1.3333 3 S2D4
C
D C 1.3000 3 S2D3
D C
D C E 1.2333 3 S1D5
D C E
D C E 1.2333 3 S1D2
D C E
D F C E 1.2000 3 S3D5
D F C E
D F C E 1.2000 3 S3D2
D F E
D F G E 0.9667 3 S2D2
F G E
F G E 0.9333 3 S1D1
F G
F G 0.8667 3 S3D1
G
G 0.8333 3 S2D1

Bảng 3.1. Ảnh hưởng của nồng độ chất điều hòa sinh trưởng và đạm đến năng suất cải dầu
(kg/ô)
Nồng độ chất Trung bình nồng
điều hòa Lượng đạm (D) độ chất điều hòa
sinh trưởng (S) D1 D2 D3 D4 D5 sinh trưởng (S)
S1 0,93 efg 1,23 cde 1,40 bc 1,93 a 1,23 cde 1,35 A
S2 0,83 g 0,97 defg 1,30 dc 1,33 bc 1,67 ab 1,22 B
S3 0,87 fg 1,20 cdef 1,37 bc 1,43 bc 1,20 cdef 1,21 B
Trung bình 0,88 D 1,13 C 1,36 B 1,57 A 1,37 B
lượng đạm (D)
* Các trung bình cùng ký tự không khác biệt có nghĩa thống kê ở mức xác suất với nồng độ chất điều
hòa sinh trưởng: p<0,05; lượng đạm: p<0,01; tương tác nồng độ chất điều hòa sinh trưởng và lượng
đạm: p<0,01; CV = 11,12%.

Giải thích:
- Kết quả xếp nhóm có thể chia các giá trị trung bình từ cao đến thấp của yếu tố tương tác SD
làm bảy nhóm theo ký tự A, B, … G; trong đó giá trị trung bình cao nhất là 1,93 kg/ô của
tương tác S1D4, thấp nhất là 0,83 kg/ô của tương tác S2D1.

- Tương tác của hai yếu tố nồng độ chất điều hòa sinh trưởng và lượng đạm S*D (F = 6,47 với
p < 0,0001) ảnh hưởng rất có nghĩa đến năng suất cải dầu. Bảng so sánh giá trị xác suất p các
trung bình tương tác Dunnett cho thấy tương tác chất điều hòa sinh trưởng và lượng đạm ảnh
hưởng độc lập lớn nhất đến năng suất cải dầu là tương tác S1D4 (p < 0,0001), tiếp theo là
S2D5 (p < 0,0001), S3D4 (p = 0,0017), và các tương tác S1D3, S3D3, S2D4 và S2D3. Các
tương tác có ảnh hưởng như nhau ( p > 0,05) và năng suất thấp là tương tác S3D2, S3D5,
S1D2, S1D5, S3D1, S1D1, S2D1, S2D2.

3.4. Thí nghiệm lô phụ (Split plot) có tương tác (interaction)


Thí nghiệm kết hợp các nghiệm thức thành nhóm trong một yếu tố lô chính gọi là kiểu thí
nghiệm lô phụ (split plot design). Tùy cách chọn yếu tố nào là chính hay phụ, nhưng áp dụng
phổ biến nhất với yếu tố A thường là lô chính (main plot factor) hay là lô lớn (large plots) như
cày đất, tưới nước; lô phụ B (subplot factor) hay là lô nhỏ (small plots) như phân bón, giống
30
(Clewer, 2001). Yếu tố B được xếp theo lô phụ được xem như là yếu tố để khảo sát so với các
giá trị trung bình trong ảnh hưởng của tương tác khối với yếu tố A (K*A), để tính tương tác
của tất cả các lô. Tương tác của lô phụ được so sánh với sai số thí nghiệm residual (SAS,
1999).
Phải có test giả thiết: TEST H = A E = K*A; (giả thiết null, không khác nhau).

Sơ đồ thí nghiệm chung như sau:


Khối I Khối II Khối III
D2 D1 D3 D1 D2 D3 D1 D3 D2

V2 V1 V1 V4 V2 V4 V1 V4 V3

V3 V4 V3 V1 V3 V1 V3 V3 V1

V1 V2 V4 V3 V1 V2 V2 V1 V2

V4 V3 V2 V2 V4 V3 V4 V2 V4

Thí nghiệm khảo sát năng suất cỏ kg/ô (Y) do yếu tố chu kỳ xén cỏ và giống cỏ, xác suất thống
kê được chọn trước là p = 0,05 (NCRS 2007, trang 52).
Tên chu kỳ xén cỏ và giống có thể sử dụng mã hóa bằng số và nguyên tên giống.

 Bài tập sử dụng mã hóa bằng số như sau:


Yếu tố D lô chính: ba nghiệm thức về chu kỳ xén cỏ là D1: 30 ngày, D2: 45 ngày, D3: 60 ngày
Yếu tố V lô phụ: bốn giống là V1: Jackson, giống V2: Highlander, giống V3: San Macros,
giống V4: Medina.
Yếu tố DV: yếu tố tương tác của hai yếu tố D và V.
Bố trí thí nghiệm trên ba khối đầy đủ, ngẫu nhiên (K: 1, 2, 3).

Data;
Input K $ D $ V $ DV $ Y;
cards;
1 1 1 D1V1 6789
1 1 2 D1V2 6578
1 1 3 D1V3 6589
1 1 4 D1V4 6534
2 1 1 D1V1 6743
2 1 2 D1V2 6789
2 1 3 D1V3 6700
2 1 4 D1V4 6500
3 1 1 D1V1 6721
3 1 2 D1V2 7000
3 1 3 D1V3 6345
3 1 4 D1V4 6512
1 2 1 D2V1 8812
1 2 2 D2V2 9500

31
1 2 3 D2V3 7816
1 2 4 D2V4 6956
2 2 1 D2V1 8745
2 2 2 D2V2 9654
2 2 3 D2V3 8721
2 2 4 D2V4 6956
3 2 1 D2V1 8867
3 2 2 D2V2 9595
3 2 3 D2V3 9800
3 2 4 D2V4 7934
1 3 1 D3V1 11345
1 3 2 D3V2 11999
1 3 3 D3V3 10456
1 3 4 D3V4 10009
2 3 1 D3V1 11099
2 3 2 D3V2 11678
2 3 3 D3V3 10678
2 3 4 D3V4 10999
3 3 1 D3V1 11567
3 3 2 D3V2 11890
3 3 3 D3V3 10367
3 3 4 D3V4 11345
;
proc glm;
class K D V;
model Y = K D K*D V D*V;
test h=D e=K*D;
means D V D*V/lsd alpha=0.05;
lsmeans D*V/pdiff=control adjust=dunnett;
title‘SPLIT PLOT P 52 statistix’;
run;
proc glm;
class K DV;
model Y = K DV;
means DV/Duncan alpha=0.05; 
run;

SPLIT PLOT P 52 statistix

The GLM Procedure


Class Level Information

Class Levels Values

K 3 123

D 3 123

V 4 1234

Number of observations 36

SPLIT PLOT P 52 statistix


The GLM Procedure
Dependent Variable: Y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 17 133707792.4 7865164.3 57.51 <.0001

32
Error 18 2461661.2 136759.0

Corrected Total 35 136169453.6

R-Square Coeff Var Root MSE Y Mean

0.981922 4.205193 369.8093 8794.111

Source DF Type I SS Mean Square F Value Pr > F

K 2 875333.4 437666.7 3.20 0.0647


D 2 120440064.9 60220032.4 440.34 <.0001
K*D 4 627156.8 156789.2 1.15 0.3667
V 3 7223245.1 2407748.4 17.61 <.0001
D*V 6 4541992.2 756998.7 5.54 0.0021

Source DF Type III SS Mean Square F Value Pr > F

K 2 875333.4 437666.7 3.20 0.0647


D 2 120440064.9 60220032.4 440.34 <.0001
K*D 4 627156.8 156789.2 1.15 0.3667
V 3 7223245.1 2407748.4 17.61 <.0001
D*V 6 4541992.2 756998.7 5.54 0.0021

Tests of Hypotheses Using the Type III MS for K*D as an Error Term

Source DF Type III SS Mean Square F Value Pr > F

D 2 120440064.9 60220032.4 384.08 <.0001

SPLIT PLOT P 52 statistix


The GLM Procedure
t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 18
Error Mean Square 136759
Critical Value of t 2.10092
Least Significant Difference 317.18

Means with the same letter are not significantly different.

t Grouping Mean N D

A 11119.3 12 3

B 8613.0 12 2

C 6650.0 12 1

SPLIT PLOT P 52 statistix

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 18
Error Mean Square 136759
Critical Value of t 2.10092
Least Significant Difference 366.25

Means with the same letter are not significantly different.

t Grouping Mean N V
33
A 9409.2 9 2

B 8965.3 9 1
B
B 8608.0 9 3

C 8193.9 9 4

SPLIT PLOT P 52 statistix

The GLM Procedure

Level of Level of --------------Y--------------


D V N Mean Std Dev

1 1 3 6751.0000 34.698703
1 2 3 6789.0000 211.000000
1 3 3 6544.6667 181.604882
1 4 3 6515.3333 17.243356
2 1 3 8808.0000 61.098281
2 2 3 9583.0000 77.698134
2 3 3 8779.0000 993.270859
2 4 3 7282.0000 564.648563
3 1 3 11337.0000 234.102542
3 2 3 11855.6667 163.230920
3 3 3 10500.3333 160.169702
3 4 3 10784.3333 693.386857

SPLIT PLOT P 52 statistix

The GLM Procedure

Least Squares Means

Adjustment for Multiple Comparisons: Dunnett

H0:LSMean=
Control
D V Y LSMEAN Pr > |t|

1 1 6751.0000
1 2 6789.0000 1.0000
1 3 6544.6667 0.9936
1 4 6515.3333 0.9836
2 1 8808.0000 <.0001
2 2 9583.0000 <.0001
2 3 8779.0000 <.0001
2 4 7282.0000 0.4654
3 1 11337.0000 <.0001
3 2 11855.6667 <.0001
3 3 10500.3333 <.0001
3 4 10784.3333 <.0001

SPLIT PLOT P 52 statistix

The GLM Procedure

Class Level Information

Class Levels Values

K 3 123

DV 12 D1V1 D1V2 D1V3 D1V4 D2V1 D2V2 D2V3 D2V4 D3V1 D3V2 D3V3 D3V4

Number of observations 36

SPLIT PLOT P 52 statistix

The GLM Procedure

Dependent Variable: Y
Sum of
34
Source DF Squares Mean Square F Value Pr > F

Model 13 133080635.6 10236972.0 72.91 <.0001

Error 22 3088817.9 140400.8

Corrected Total 35 136169453.6

R-Square Coeff Var Root MSE Y Mean

0.977316 4.260817 374.7010 8794.111

Source DF Type I SS Mean Square F Value Pr > F

K 2 875333.4 437666.7 3.12 0.0643


DV 11 132205302.2 12018663.8 85.60 <.0001

Source DF Type III SS Mean Square F Value Pr > F

K 2 875333.4 437666.7 3.12 0.0643


DV 11 132205302.2 12018663.8 85.60 <.0001

SPLIT PLOT P 52 statistix

The GLM Procedure

Duncan's Multiple Range Test for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 22
Error Mean Square 140400.8

Number of Means 2 3 4 5 6 7 8 9 10 11 12
Critical Range 634.5 666.2 686.5 700.8 711.3 719.5 725.9 731.0 735.2 738.6 741.4

Means with the same letter are not significantly different.

Duncan Grouping Mean N DV

A 11855.7 3 D3V2
A
B A 11337.0 3 D3V1
B
B C 10784.3 3 D3V4
C
C 10500.3 3 D3V3

D 9583.0 3 D2V2

E 8808.0 3 D2V1
E
E 8779.0 3 D2V3

F 7282.0 3 D2V4
F
G F 6789.0 3 D1V2
G F
G F 6751.0 3 D1V1
G
G 6544.7 3 D1V3
G
G 6515.3 3 D1V4

Giải thích:
35
- Kết quả xếp nhóm tương tác các nghiệm thức của yếu tố DV có thể chia làm bảy nhóm: A, B,
C, ... G (NCRS, 2007) trong đó năng suất cao nhất ở 60 ngày xén cỏ là V2 (Highlander), tiếp
theo là V1(Jackson), thấp nhất là ở 30 ngày xén cỏ với giống V3 (San Macros) và V4
(Medina).
- Không có tương tác giữa khối và chu kỳ xén cỏ (F = 1,15 với p = 0,3367)
- Tương tác của D*V rất có nghĩa (F = 5,54 với p = 0,0021).
- Căn cứ vào bảng so sánh xác suất p các trung bình tương tác Dunnett, tương tác chu kỳ xén
cỏ D1(30 ngày) với 4 giống cỏ có ảnh hưởng như nhau vì có p > 0,05 cũng như tương tác
D2V4 (chu kỳ xén cỏ 45 ngày,giống Medina).

Tương tác chu kỳ xén cỏ D2 (45 ngày) với các giống Jackson, Highlander và San Macros ảnh
hưởng độc lập cũng như chu kỳ xén cỏ D3 (chu kỳ xén cỏ 60 ngày) tương tác với bốn giống
cỏ đều có p < 0,0001 và trong đó năng suất cao nhất là tương tác D3V2 (chu kỳ xén cỏ 60
ngày, giống Highlander) với năng suất 11855,7 (kg/ô).

Trình bày kết quả như sau:


Bảng 3.2. Ảnh hưởng của chu kỳ xén cỏ và giống đến năng suất cỏ (kg/ô)
Giống (V)
Chu kỳ xén cỏ (D) V1 V2 V3 V4 Trung bình
(Jackson) (Highlander) (San Macros) (Medina) chu kỳ xén cỏ
D1 (30 ngày) 6751,0 fg 6789,0 fg 6544,7 g 6515,3 g 6650,0 C
D2 (45 ngày) 8808,0 e 9583,0 d 8779,0 e 7282,0 f 8613,0 B
D3 (60 ngày) 11337,0 ab 11855,7 a 10500,3 c 10784,3 bc 11119,3 A
Trung bình giống 8965,3 B 9409,2 A 8608,0 B 8193,9 C
Các trung bình cùng ký tự không khác biệt có nghĩa thống kê ở mức xác suất với p < 0,05 cho yếu tố
D, yếu tố V, tương tác D*V; CV = 4,21%

 Bài tập sử dụng tên giống và chu kỳ xén cỏ (NCRS 2007, trang 52), so sánh tương
tác LSMEANS với Tukey test.

Chu kỳ xén cỏ: 30da = 30 ngày, Jackson = giống cỏ


Lưu ý: GIONG$15. và XENCOGIONG$20. là ghi độ dài tên nghiệm thức khi có số ký tự trên 8.

Kết quả giống như phần mã hóa bằng số, được rút gọn cho các phần xếp nhóm, so sánh tương
tác Tukey test như sau:

DATA;
INPUT KHOI XENCO $ GIONG$15. NSUAT XENCOGIONG$20.;
Cards;
1 30da Jackson 6789 30da Jackson
1 30da Highlander 6578 30da Highlander
1 30da San Macros 6589 30da San Macros
1 30da Medina 6534 30da Medina
2 30da Jackson 6743 30da Jackson
2 30da Highlander 6789 30da Highlander
2 30da San Macros 6700 30da San Macros
2 30da Medina 6500 30da Medina

36
3 30da Jackson 6721 30da Jackson
3 30da Highlander 7000 30da Highlander
3 30da San Macros 6345 30da San Macros
3 30da Medina 6512 30da Medina
1 45da Jackson 8812 45da Jackson
1 45da Highlander 9500 45da Highlander
1 45da San Macros 7816 45da San Macros
1 45da Medina 6956 45da Medina
2 45da Jackson 8745 45da Jackson
2 45da Highlander 9654 45da Highlander
2 45da San Macros 8721 45da San Macros
2 45da Medina 6956 45da Medina
3 45da Jackson 8867 45da Jackson
3 45da Highlander 9595 45da Highlander
3 45da San Macros 9800 45da San Macros
3 45da Medina 7934 45da Medina
1 60da Jackson 11345 60da Jackson
1 60da Highlander 11999 60da Highlander
1 60da San Macros 10456 60da San Macros
1 60da Medina 10009 60da Medina
2 60da Jackson 11099 60da Jackson
2 60da Highlander 11678 60da Highlander
2 60da San Macros 10678 60da San Macros
2 60da Medina 10999 60da Medina
3 60da Jackson 11567 60da Jackson
3 60da Highlander 11890 60da Highlander
3 60da San Macros 10367 60da San Macros
3 60da Medina 11345 60da Medina
;
proc glm;
class KHOI XENCO GIONG;
model NSUAT = KHOI XENCO KHOI*XENCO GIONG XENCO*GIONG;
test h=XENCO e=KHOI*XENCO;
means XENCO GIONG XENCO*GIONG/lsd alpha=0.05;
lsmeans XENCO*GIONG /pdiff adjust=tukey;
title‘SPLIT PLOT P 52 statistix’;
run;

proc GLM;
class KHOI XENCOGIONG;
model NSUAT = KHOI XENCOGIONG;
means XENCOGIONG /Duncan alpha=0.05;   
run;

SPLIT PLOT P 52 statistix

The GLM Procedure

Class Level Information

Class Levels Values

KHOI 3 123

XENCO 3 30da 45da 60da

GIONG 4 Highlander Jackson Medina San Macros

Number of observations 36

37
SPLIT PLOT P 52 statistix

The GLM Procedure

Dependent Variable: NSUAT

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 17 133707792.4 7865164.3 57.51 <.0001

Error 18 2461661.2 136759.0

Corrected Total 35 136169453.6

R-Square Coeff Var Root MSE NSUAT Mean

0.981922 4.205193 369.8093 8794.111

Source DF Type I SS Mean Square F Value Pr > F

KHOI 2 875333.4 437666.7 3.20 0.0647


XENCO 2120440064.9 60220032.4 440.34 <.0001
KHOI*XENCO 4 627156.8 156789.2 1.15 0.3667
GIONG 3 7223245.1 2407748.4 17.61 <.0001
XENCO*GIONG 6 4541992.2 756998.7 5.54 0.0021

Source DF Type III SS Mean Square F Value Pr > F

KHOI 2 875333.4 437666.7 3.20 0.0647


XENCO 2120440064.9 60220032.4 440.34 <.0001
KHOI*XENCO 4 627156.8 156789.2 1.15 0.3667
GIONG 3 7223245.1 2407748.4 17.61 <.0001
XENCO*GIONG 6 4541992.2 756998.7 5.54 0.0021

Tests of Hypotheses Using the Type III MS for KHOI*XENCO as an Error Term

Source DF Type III SS Mean Square F Value Pr > F

XENCO 2 120440064.9 60220032.4 384.08 <.0001

SPLIT PLOT P 52 statistix

The GLM Procedure

t Tests (LSD) for NSUAT

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 18
Error Mean Square 136759
Critical Value of t 2.10092
Least Significant Difference 317.18

Means with the same letter are not significantly different.

t Grouping Mean N XENCO

A 11119.3 12 60da

B 8613.0 12 45da

C 6650.0 12 30da

SPLIT PLOT P 52 statistix

38
The GLM Procedure

t Tests (LSD) for NSUAT

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 18
Error Mean Square 136759
Critical Value of t 2.10092
Least Significant Difference 366.25

Means with the same letter are not significantly different.

t Grouping Mean N GIONG

A 9409.2 9 Highlander

B 8965.3 9 Jackson
B
B 8608.0 9 San Macros

C 8193.9 9 Medina

SPLIT PLOT P 52 statistix

The GLM Procedure

Level of Level of ------------NSUAT------------


XENCO GIONG N Mean Std Dev

30da Highlander 3 6789.0000 211.000000


30da Jackson 3 6751.0000 34.698703
30da Medina 3 6515.3333 17.243356
30da San Macros 3 6544.6667 181.604882
45da Highlander 3 9583.0000 77.698134
45da Jackson 3 8808.0000 61.098281
45da Medina 3 7282.0000 564.648563
45da San Macros 3 8779.0000 993.270859
60da Highlander 3 11855.6667 163.230920
60da Jackson 3 11337.0000 234.102542
60da Medina 3 10784.3333 693.386857
60da San Macros 3 10500.3333 160.169702

SPLIT PLOT P 52 statistix

The GLM Procedure


Least Squares Means
Adjustment for Multiple Comparisons: Tukey

LSMEAN
XENCO GIONG NSUAT LSMEAN Number

30da Highlander 6789.0000 1


30da Jackson 6751.0000 2
30da Medina 6515.3333 3
30da San Macros 6544.6667 4
45da Highlander 9583.0000 5
45da Jackson 8808.0000 6
45da Medina 7282.0000 7
45da San Macros 8779.0000 8
60da Highlander 11855.6667 9
60da Jackson 11337.0000 10
60da Medina 10784.3333 11
60da San Macros 10500.3333 12

Least Squares Means for effect XENCO*GIONG


Pr > |t| for H0: LSMean(i)=LSMean(j)

Dependent Variable: NSUAT


39
i/j 1 2 3 4 5 6

1 1.0000 0.9981 0.9993 <.0001 0.0001


2 1.0000 0.9995 0.9999 <.0001 0.0001
3 0.9981 0.9995 1.0000 <.0001 <.0001
4 0.9993 0.9999 1.0000 <.0001 <.0001
5 <.0001 <.0001 <.0001 <.0001 0.3624
6 0.0001 0.0001 <.0001 <.0001 0.3624
7 0.8755 0.8196 0.3764 0.4280 <.0001 0.0034
8 0.0002 0.0001 <.0001 <.0001 0.3162 1.0000
9 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001
10 <.0001 <.0001 <.0001 <.0001 0.0008 <.0001
11 <.0001 <.0001 <.0001 <.0001 0.0304 0.0002
12 <.0001 <.0001 <.0001 <.0001 0.1749 0.0011

Least Squares Means for effect XENCO*GIONG


Pr > |t| for H0: LSMean(i)=LSMean(j)

Dependent Variable: NSUAT

i/j 7 8 9 10 11 12

1 0.8755 0.0002 <.0001 <.0001 <.0001 <.0001


2 0.8196 0.0001 <.0001 <.0001 <.0001 <.0001
3 0.3764 <.0001 <.0001 <.0001 <.0001 <.0001
4 0.4280 <.0001 <.0001 <.0001 <.0001 <.0001
5 <.0001 0.3162 <.0001 0.0008 0.0304 0.1749

40
SPLIT PLOT P 52 statistix

The GLM Procedure

Least Squares Means

Adjustment for Multiple Comparisons: Tukey

Least Squares Means for effect XENCO*GIONG

Pr > |t| for H0: LSMean(i)=LSMean(j)

Dependent Variable: NSUAT

i/j 7 8 9 10 11 12

6 0.0034 1.0000 <.0001 <.0001 0.0002 0.0011


7 0.0042 <.0001 <.0001 <.0001 <.0001
8 0.0042 <.0001 <.0001 0.0001 0.0009
9 <.0001 <.0001 0.8389 0.0700 0.0109
10 <.0001 <.0001 0.8389 0.7834 0.2690
11 <.0001 0.0001 0.0700 0.7834 0.9974
12 <.0001 0.0009 0.0109 0.2690 0.9974

SPLIT PLOT P 52 statistix

The GLM Procedure

Class Level Information

Class Levels Values

KHOI 3 123

XENCOGIONG 12 30da Highlander 30da Jackson 30da Medina 30da San Macros 45da Highlander
45da Jackson 45da Medina 45da San Macros 60da Highlander 60da Jackson 60da
Medina 60da San Macros

Number of observations 36

SPLIT PLOT P 52 statistix

The GLM Procedure

Dependent Variable: NSUAT

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 13 133080635.6 10236972.0 72.91 <.0001

Error 22 3088817.9 140400.8

Corrected Total 35 136169453.6

R-Square Coeff Var Root MSE NSUAT Mean

0.977316 4.260817 374.7010 8794.111

Source DF Type I SS Mean Square F Value Pr > F

KHOI 2 875333.4 437666.7 3.12 0.0643


XENCOGIONG 11 132205302.2 12018663.8 85.60 <.0001

Source DF Type III SS Mean Square F Value Pr > F

41
KHOI 2 875333.4 437666.7 3.12 0.0643
XENCOGIONG 11 132205302.2 12018663.8 85.60 <.0001

SPLIT PLOT P 52 statistix

The GLM Procedure

Duncan's Multiple Range Test for NSUAT

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 22
Error Mean Square 140400.8

Number of Means 2 3 4 5 6 7 8 9 10 11 12
Critical Range 634.5 666.2 686.5 700.8 711.3 719.5 725.9 731.0 735.2 738.6 741.4

Means with the same letter are not significantly different.

Duncan Grouping Mean N XENCOGIONG

A 11855.7 3 60da Highlander


A
B A 11337.0 3 60da Jackson
B
B C 10784.3 3 60da Medina
C
C 10500.3 3 60da San Macros

D 9583.0 3 45da Highlander

E 8808.0 3 45da Jackson


E
E 8779.0 3 45da San Macros

F 7282.0 3 45da Medina


F
G F 6789.0 3 30da Highlander
G F
G F 6751.0 3 30da Jackson
G
G 6544.7 3 30da San Macros
G
G 6515.3 3 30da Medina

Kết quả cho thấy sử dụng tên bằng chữ cho thấy xếp nhóm Duncan grouping (nhóm tương
đồng, homogeneous groups (NRCS, 2007) của yếu tố chu kỳ xén cỏ và giống, tương tác chu kỳ
xén cỏ*giống ghi rõ tên giống (Jackson) và xén cỏ (30 ngày).

So sánh tương tác ma trận Least Squares Means for effect chu kỳ xén cỏ*giống của so sánh đa
tương tác Tukey test (Adjustment for Multiple Comparisons: Tukey) và cho thấy kết quả giống
như so sánh Dunnett test: tương tác chu kỳ xén cỏ 30 ngày với giống Highlander, Jackson,
Medina, San Macros và chu kỳ xén cỏ 45 ngày và giống Medina ảnh hưởng tương tác như
nhau đến năng suất cỏ, còn lại các tương tác khác đều ảnh hưởng độc lập đến năng suất cỏ (xác
suất của tương tác p > 0,05 là có ảnh hưởng như nhau; p < 0,05 là có ảnh hưởng độc lập (SAS,
2004).

Có nhiều phương pháp so sánh tương tác đa biến như Bon, Dunnett, Tukey, Sidak… Tuy nhiên
trong xử lý thống kê, chỉ chọn một cách so sánh tương tác lsmeans chu kỳ xén cỏ*giống là
được, như Dunnett test.
42
3.5. Thí nghiệm lô sọc (strip plot)

Thí nghiệm bố trí có một yếu tố gồm một dãy các ô cơ sở trong một khối theo một hướng trong
khối, và yếu tố thứ hai cũng gồm một dãy các ô cở theo một hướng khác trong khối.

Như vậy có một yếu tố theo hướng dọc (vertical) và yếu tố thứ hai theo hướng ngang
(horizontal). Các ô cơ sở trong khối được bố trí ngẫu nhiên. Strip plot với bố trí đặc biệt còn
gọi là split-block design. Thí nghiệm áp dụng cho ô cơ sở lớn và liên tục, vì ô cơ sở nhỏ khó
thực hiện.

Cần trắc nghiệm giả thiết ảnh hưởng của khối với yếu tố A, ảnh hưởng của khối với yếu tố B.

test h=A e=KHOI*A;


test h=B e=KHOI*B;

Bài tập: thí nghiệm bố trí khối (KHOI) RCBD để tính năng suất lúa mạch Y (kg/ô cơ sở) làm
thức ăn gia súc, bón phân kali (K) có ba nghiệm thức : K1 = 0 kg/ha, K2 = 25 kg/ha và K3 =
50 kg/ha. Phân lân (P) có hai nghiệm thức: P1 = 25 kg/ha, P2 = 50 kg/ha. Bón K chạy dọc hết
ba ô. Trên các ô bón K, bón P chạy dọc theo góc thẳng (phỏng theo Petersen, 1994).

Sơ đồ thí nghiệm như sau:

K3 K1 K2 K1 K3 K2 K2 K1 K3
P1 56 32 49 P2 38 62 50 P2 54 44 51
P2 67 54 58 P1 52 72 64 P1 63 54 68
Khối 1 Khối 2 Khối 3
data;
input KHOI $ K $ P $ Y;
cards;
1 1 1 32
1 1 2 54
1 2 1 49
1 2 2 58
1 3 1 56
1 3 2 67
2 1 1 38
2 1 2 52
2 2 1 50
2 2 2 64
2 3 1 62
2 3 2 72
3 1 1 44
3 1 2 54
3 2 1 54
3 2 2 63
3 3 1 51
3 3 2 68

43
;
proc glm;
class KHOI K P;
model Y = KHOI K KHOI*K P KHOI*P K*P;
test h=K e=KHOI*K;
test h=P e=KHOI*P;
means K P K*P/lsd alpha=0.01;   
lsmeans K/pdiff adjust=dunnett alpha=0.01;
title‘STRIP PLOT P 142’;
run;
STRIP PLOT P 142

The GLM Procedure

Class Level Information

Class Levels Values

KHOI 3 123

K 3 123

P 2 12

Number of observations 18

STRIP PLOT P 142

The GLM Procedure

Dependent Variable: Y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 13 1776.888889 136.683761 9.61 0.0209

Error 4 56.888889 14.222222

Corrected Total 17 1833.777778

R-Square Coeff Var Root MSE Y Mean

0.968977 6.870673 3.771236 54.88889

Source DF Type I SS Mean Square F Value Pr > F

KHOI 2 45.7777778 22.8888889 1.61 0.3070


K 2 885.7777778 442.8888889 31.14 0.0036
KHOI*K 4 78.2222222 19.5555556 1.38 0.3826
P 1 747.5555556 747.5555556 52.56 0.0019
KHOI*P 2 3.1111111 1.5555556 0.11 0.8990
K*P 2 16.4444444 8.2222222 0.58 0.6018

Source DF Type III SS Mean Square F Value Pr > F

KHOI 2 45.7777778 22.8888889 1.61 0.3070


K 2 885.7777778 442.8888889 31.14 0.0036
KHOI*K 4 78.2222222 19.5555556 1.38 0.3826
P 1 747.5555556 747.5555556 52.56 0.0019
KHOI*P 2 3.1111111 1.5555556 0.11 0.8990
K*P 2 16.4444444 8.2222222 0.58 0.6018

Tests of Hypotheses Using the Type III MS for KHOI*K as an Error Term
Source DF Type III SS Mean Square F Value Pr > F

K 2 885.7777778 442.8888889 22.65 0.0066

Tests of Hypotheses Using the Type III MS for KHOI*P as an Error Term

Source DF Type III SS Mean Square F Value Pr > F


44
P 1 747.5555556 747.5555556 480.57 0.0021

STRIP PLOT P 142


The GLM Procedure

t Tests (LSD) for Y


NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 4
Error Mean Square 14.22222
Critical Value of t 4.60409
Least Significant Difference 10.025

Means with the same letter are not significantly different.


t Grouping Mean N K

A 62.667 6 3
A
A 56.333 6 2

B 45.667 6 1

STRIP PLOT P 142

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 4
Error Mean Square 14.22222
Critical Value of t 4.60409
Least Significant Difference 8.1851

Means with the same letter are not significantly different.

t Grouping Mean N P

A 61.333 9 2

B 48.444 9 1

STRIP PLOT P 142

The GLM Procedure

Level of Level of --------------Y--------------


K P N Mean Std Dev

1 1 3 38.0000000 6.00000000
1 2 3 53.3333333 1.15470054
2 1 3 51.0000000 2.64575131
2 2 3 61.6666667 3.21455025
3 1 3 56.3333333 5.50757055
3 2 3 69.0000000 2.64575131

STRIP PLOT P 142

The GLM Procedure


Least Squares Means
Adjustment for Multiple Comparisons: Dunnett
H0:LSMean=
Control
K Y LSMEAN Pr > |t|

1 45.6666667
2 56.3333333 0.0138
3 62.6666667 0.0025

45
Bảng 3.3. Ảnh hưởng của phân K và P đến năng suất lúa mạch (kg/ô)
Phân K
Phân P K1 K2 K3 Trung bình
(0 kg/ha) (25 kg/ha) (50 kg/ha) phân P
P1 (25 kg/ha) 38,00 51,00 56,33 48,44 B
P2 (50 kg/ha) 53,33 61,67 69,00 61,33 A
Trung bình phân K 45,67 B 56,33 A 62,67 A
Các trung bình cùng ký tự không khác biệt có nghĩa thống kê ở mức xác suất với p < 0,01; CV=6,87%.

Giải thích: vì không có tương tác K và P, cần giải thích tương tác trong yếu tố K và P.
- Xếp nhóm yếu tố lượng lân (P) với hai trung bình theo ký tự có hai nhóm là A và B. Xếp
nhóm yếu tố lượng K với ba trung bình theo ký tự có hai nhóm là A và B.
- Không có ảnh hưởng khối đến yếu tố lượng K (F = 1,38 với p = 0,3826) và lượng P(F = 0,11
với p = 0,899). Lượng phân K và P không có ảnh hưởng tương tác đến năng suất (F = 0,58 với
p = 0,6018).
- So sánh tương tác các trung bình yếu tố lượng K theo giá trị xác suất p các trung bình nghiệm
thức cho thấy K1 (0 kg/ha) ảnh hưởng độc lập với K2 (25 kg/ha) (p = 0,0138) và K3 (p =
0,0025), trong đó nghiệm thức K3(50 kg/ha) ảnh hưởng tương tác lớn nhất đến năng suất lúa
mạch (62,67 kg/ha).
- Nghiệm thức lượng lân P2 (50 kg/ha) cho năng suất 61,33 kg/ha, khác biệt có nghĩa với
P1(25 kg/ha).

3.6. Thí nghiệm ba yếu tố (3 factors=23)

Thí nghiệm thực hiện để so sánh tương tác đồng thời nhiều yếu tố như giống, lượng phân bón,
hoá chất phun, khoảng cách gieo trồng để giảm chi phí và thời gian khảo sát, nhưng cần diện
tích lớn. Thí nghiệm ba yếu tố là thí nghiệm căn bản để khảo sát tương tác của ba yếu tố.
Bài tập so sánh các giá trị trung bình và tương tác ba yếu tố (phỏng theo Clewer, 2001).
Thí nghiệm gồm bốn khối (KH), hai lượng đạm N (N1= không bón đạm, N2 = bón đạm), hai
giống lúa mì V (V1, V2), hai lượng phân K (K1 = không bón K, K2 = bón K) ảnh hưởng năng
suất (Y, tấn/ha).

Sơ đồ bố trí thí nghiệm với T1 = N1V1K1, ....T8 = N2V2K2 như sau:


Khối N1V1K1 N2V1K2 N1V2K1 N2V2K1 Khối T1 T6 T3 T7
1 N1V1K2 N2V1K1 N2V2K2 N1V2K2 1 T2 T5 T8 T4

Khối N2V1K1 N1V1K2 N2V1K2 N1V2K1 Khối T5 T2 T6 T3


2 N1V1K1 N2V2K1 N1V2K2 N2V2K2 2 T1 T7 T4 T8

Khối N1V2K2 N2V2K2 N2V1K1 N1V2K1 Khối T4 T8 T5 T3


3 N2V1K2 N1V1K1 N2V2K1 N1V1K2 3 T6 T1 T7 T2

Khối N2V2K1 N2V1K1 N2V1K2 N2V2K2 Khối T7 T5 T6 T8


4 N1V1K2 N1V1K1 N1V2K1 N1V2K2 4 T2 T1 T3 T4

Tám nghiệm thức có thể bố trí như sau:


46
T1: N1 V1 K1, không bón phân cho giống V1
T2: N1 V1 K2, bón phân K cho giống V1
T3: N1 V2 K1, không bón phân cho giống V2
T4: N1 V2 K2, bón phân K cho giống V2
T5: N2 V1 K1, bón phân N cho giống V1
T6: N2 V1 K2, bón phân K và N cho giống V1
T7: N2 V2 K1, bón phân N cho giống V2
T8: N2 V2 K2, bón phân K và N cho giống V2
* Lưu ý: Kết quả xử lý bảng phân tích phương sai yếu tố NVK với tám giá trị trung bình từ T1
đến T8 (yếu tố N = 2 x yếu tố V = 2 x yếu tố K = 2 có tám trung bình tương tác) để xếp nhóm,
sẽ có độ tự do (df) và tổng bình phương (SS, Sum of Squares) bằng tổng df và SS của yếu tố N,
yếu tố V, yếu tố K, tương tác N*V, N*K, V*K và N*V*K cộng lại (Clewer, 2001).

DATA;
input KH N V K NVK $ Y;
CARDS;
1 1 1 1 N1V1K1 4
1 1 1 2 N1V1K2 4.5
1 1 2 1 N1V2K1 5.2
1 1 2 2 N1V2K2 6.4
1 2 1 1 N2V1K1 4.8
1 2 1 2 N2V1K2 5.8
1 2 2 1 N2V2K1 5.3
1 2 2 2 N2V2K2 7
2 1 1 1 N1V1K1 3.9
2 1 1 2 N1V1K2 4.9
2 1 2 1 N1V2K1 5.4
2 1 2 2 N1V2K2 8
2 2 1 1 N2V1K1 5.2
2 2 1 2 N2V1K2 5
2 2 2 1 N2V2K1 6.1
2 2 2 2 N2V2K2 7.4
3 1 1 1 N1V1K1 5
3 1 1 2 N1V1K2 4.3
3 1 2 1 N1V2K1 4.4
3 1 2 2 N1V2K2 7.8
3 2 1 1 N2V1K1 5.2
3 2 1 2 N2V1K2 6.6
3 2 2 1 N2V2K1 7.6
3 2 2 2 N2V2K2 7.8
4 1 1 1 N1V1K1 4.3
4 1 1 2 N1V1K2 5.1
4 1 2 1 N1V2K1 4.2
4 1 2 2 N1V2K2 7.4
4 2 1 1 N2V1K1 5.6
4 2 1 2 N2V1K2 5.8
4 2 2 1 N2V2K1 6.6
4 2 2 2 N2V2K2 7.4
;
PROC GLM;
CLASS KH N V K;
47
MODEL Y = KH N|V|K;
MEANS N|V|K / LSD ALPHA=0.01;
LSMEANS V*K / PDIFF=CONTROL ADJUST=DUNNETT;
LSMEANS N*V*K / PDIFF=CONTROL ADJUST=DUNNETT;
TITLE ‘NANG SUAT LUA MI’;
RUN;

PROC GLM;
CLASS KH NVK;
MODEL Y = KH NVK;
MEANS NVK / DUNCAN ALPHA=0.05;
RUN;

(Ghi: N|V|K tương đương với N V K N*V N*K V*K N*V*K)

- Xử lý thống kê ANOVA trước, sau đó xếp nhóm và tính tương tác khi các biến số và tương
tác có nghĩa với p < 0,05. Sau khi đã xem kết quả xếp nhóm các trung bình của nghiệm thức
N,V, K, tính tương tác LSMEANS của V*K và N*V*K.
NANG SUAT LUA MI

The GLM Procedure

Class Level Information

Class Levels Values

KH 4 1234

N 2 12

V 2 12

K 2 12

Number of observations 32

NANG SUAT LUA MI

The GLM Procedure


Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F

Model 10 43.17750000 4.31775000 14.30 <.0001

Error 21 6.34250000 0.30202381

Corrected Total 31 49.52000000

R-Square Coeff Var Root MSE Y Mean

0.871920 9.557686 0.549567 5.750000

Source DF Type I SS Mean Square F Value Pr > F


KH 3 2.05750000 0.68583333 2.27 0.1099
N 1 6.48000000 6.48000000 21.46 0.0001
V 1 18.00000000 18.00000000 59.60 <.0001
N*V 1 0.08000000 0.08000000 0.26 0.6122
K 1 10.58000000 10.58000000 35.03 <.0001
N*K 1 0.98000000 0.98000000 3.24 0.0860
V*K 1 3.38000000 3.38000000 11.19 0.0031
N*V*K 1 1.62000000 1.62000000 5.36 0.0308

Source DF Type III SS Mean Square F Value Pr > F

48
KH 3 2.05750000 0.68583333 2.27 0.1099
N 1 6.48000000 6.48000000 21.46 0.0001
V 1 18.00000000 18.00000000 59.60 <.0001
N*V 1 0.08000000 0.08000000 0.26 0.6122
K 1 10.58000000 10.58000000 35.03 <.0001
N*K 1 0.98000000 0.98000000 3.24 0.0860
V*K 1 3.38000000 3.38000000 11.19 0.0031
N*V*K 1 1.62000000 1.62000000 5.36 0.0308

NANG SUAT LUA MI


The GLM Procedure
t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 21
Error Mean Square 0.302024
Critical Value of t 2.83136
Least Significant Difference 0.5501

Means with the same letter are not significantly different.

t Grouping Mean N N

A 6.2000 16 2

B 5.3000 16 1

NANG SUAT LUA MI

The GLM Procedure

t Tests (LSD) for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 21
Error Mean Square 0.302024
Critical Value of t 2.83136
Least Significant Difference 0.5501

Means with the same letter are not significantly different.

t Grouping Mean N V

A 6.5000 16 2

B 5.0000 16 1

NANG SUAT LUA MI

The GLM Procedure

Level of Level of --------------Y--------------


N V N Mean Std Dev

1 1 8 4.50000000 0.45669621
1 2 8 6.10000000 1.51563282
2 1 8 5.50000000 0.57569833
2 2 8 6.90000000 0.85356396

NANG SUAT LUA MI

The GLM Procedure

t Tests (LSD) for Y


49
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.01
Error Degrees of Freedom 21
Error Mean Square 0.302024
Critical Value of t 2.83136
Least Significant Difference 0.5501

Means with the same letter are not significantly different.

t Grouping Mean N K

A 6.3250 16 2

B 5.1750 16 1

NANG SUAT LUA MI

The GLM Procedure

Level of Level of --------------Y--------------


N K N Mean Std Dev

1 1 8 4.55000000 0.57071384
1 2 8 6.05000000 1.53529895
2 1 8 5.80000000 0.92427578
2 2 8 6.60000000 0.97979590

Level of Level of --------------Y--------------


V K N Mean Std Dev

1 1 8 4.75000000 0.61875451
1 2 8 5.25000000 0.76531973
2 1 8 5.60000000 1.13010745
2 2 8 7.40000000 0.51269596

Level of Level of Level of --------------Y--------------


N V K N Mean Std Dev

1 1 1 4 4.30000000 0.49665548
1 1 2 4 4.70000000 0.36514837
1 2 1 4 4.80000000 0.58878406
1 2 2 4 7.40000000 0.71180522
2 1 1 4 5.20000000 0.32659863
2 1 2 4 5.80000000 0.65319726
2 2 1 4 6.40000000 0.96263527
2 2 2 4 7.40000000 0.32659863

NANG SUAT LUA MI

The GLM Procedure


Least Squares Means
Adjustment for Multiple Comparisons: Dunnett

H0:LSMean=
Control
V K Y LSMEAN Pr > |t|

1 1 4.75000000
1 2 5.25000000 0.1956
2 1 5.60000000 0.0148
2 2 7.40000000 <.0001

NANG SUAT LUA MI

The GLM Procedure


Least Squares Means
Adjustment for Multiple Comparisons: Dunnett

50
H0:LSMean=
Control
N V K Y LSMEAN Pr > |t|

1 1 1 4.30000000
1 1 2 4.70000000 0.8364
1 2 1 4.80000000 0.6705
1 2 2 7.40000000 <.0001
2 1 1 5.20000000 0.1428
2 1 2 5.80000000 0.0053
2 2 1 6.40000000 0.0001
2 2 2 7.40000000 <.0001

NANG SUAT LUA MI

The GLM Procedure

Class Level Information

Class Levels Values

KH 4 1234

NVK 8 N1V1K1 N1V1K2 N1V2K1 N1V2K2 N2V1K1 N2V1K2 N2V2K1 N2V2K2

Number of observations 32

NANG SUAT LUA MI

The GLM Procedure

Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F

Model 10 43.17750000 4.31775000 14.30 <.0001

Error 21 6.34250000 0.30202381

Corrected Total 31 49.52000000

R-Square Coeff Var Root MSE Y Mean

0.871920 9.557686 0.549567 5.750000

Source DF Type I SS Mean Square F Value Pr > F

KH 3 2.05750000 0.68583333 2.27 0.1099


NVK 7 41.12000000 5.87428571 19.45 <.0001

Source DF Type III SS Mean Square F Value Pr > F

KH 3 2.05750000 0.68583333 2.27 0.1099


NVK 7 41.12000000 5.87428571 19.45 <.0001

NANG SUAT LUA MI

The GLM Procedure

Duncan's Multiple Range Test for Y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 21
Error Mean Square 0.302024

Number of Means 2 3 4 5 6 7 8
Critical Range .8081 .8484 .8741 .8921 .9054 .9156 .9236

Means with the same letter are not significantly different.

51
Duncan Grouping Mean N NVK

A 7.4000 4 N1V2K2
A
A 7.4000 4 N2V2K2

B 6.4000 4 N2V2K1
B
C B 5.8000 4 N2V1K2
C
C D 5.2000 4 N2V1K1
D
E D 4.8000 4 N1V2K1
E D
E D 4.7000 4 N1V1K2
E
E 4.3000 4 N1V1K1

Cách trình bày với bố trí thí nghiệm nhiều yếu tố, cần giải thích căn cứ vào so sánh tương tác
LSmeans Multiple Comparison Dunnett (hoặc Tukey) ở phần trên và trình bày kết quả như
sau:

Bảng 3.4. Năng suất lúa mì (tấn/ha) ảnh hưởng bởi bón N và K
Giống lúa (V)
V1 V2
N1 (không N) N2 (bón N) N1 (không N) N2 (bón N) Trung bình K
K1(không K) 4,3 e 5,2 cd 4,8 de 6,4 b 5,18 B
K2 (bón K) 4,7 de 5,8 bc 7,4 a 7,4 a 6,33 A
Trung bình N 5,3 B 6,2 A
Trung bình V V1 V2
5,0 B 6,5 A
Ghi chú: các trị có cùng ký tự không khác biệt có nghĩa ở mức xác suất với yếu tố N: p<0,01,
yếu tố V: p<0,01, yếu tố K: p<0,01; tương tác V*K: p<0,01, tương tác N*V*K: p<0,05;
CV = 9,56%.

Giải thích: - Xếp nhóm các giá trị trung bình nghiệm thức tương tác của yếu tố NVK ở mức p
< 0,05 chia làm năm nhóm là A, B , C, D và E, trong đó cho thấy năng suất lúa đạt cao nhất
là 7,4 tấn/ha và thấp nhất là 4,3 tấn/ha.
- Tương tác N*V*K có nghĩa (F = 5,36 với p = 0,0308), tương tác V*K rất có nghĩa
(F = 11,19 với p = 0,0031). Không có tương tác N*K (F = 3,24 với p = 0,086) và N*V (F =
0,26 với p = 0,6122). Không có ảnh hưởng của khối (F = 2,27 với p = 0,1099).
- Tương tác N*V*K với so sánh giá trị p các trung bình tương tác theo Dunnett cho
thấy tương tác N1V1K1 (có năng suất thấp nhất là 4,3 tấn/ha) ảnh hưởng như nhau với các
tương tác N1V1K2 (p = 0,8364), N1V2K1 (p = 0,6705) và N2V1K1 (p = 0,1428).
- Tương tác có ảnh hưởng năng suất cao và độc lập là N2V2K2 (giống V2 bón N và
K) với năng suất 7,4 tấn/ha (p < 0,001), N1V2K2 (giống V2 bón K) năng suất 7,4 tấn/ha (p <
0,001) và N2V2K1 (giống V2 bón N) năng suất 6,4 tấn/ha (p = 0,001).
- Tương tác V*K với so sánh giá trị p các trung bình theo Dunnett với V1K1 (giống
V1 không bón K) có năng suất thấp nhất là 4,75 kg/ha, ảnh hưởng giống như tương tác V1K2
(giống V1 không bón K) năng suất 5,25 tấn/ha (p = 0,1956). Tương tác có ảnh hưởng rõ nhất
và độc lập đến năng suất cao nhất (7,4 tấn/ha) là tương tác V2K2 (giống V2 bón K) với p <
0,001 và V2K1 (V2 không bón K) năng suất 5,6 tấn/ha (p = 0,0148).

52
 Trong một số trường hợp, bảng tương tác của tám trung bình nghiệm thức của thí
nghiệm ba yếu tố được trình bày theo biểu đồ như sau (theo Clewer, 2001)
8
7
6

Năng suất (tấn/ha)


5
K1
4
K2
3
2
1
0
N1 N2 N1 N2

Giống V1 Giống V2

Biểu đồ 3.1. Năng suất hai giống lúa mì do ảnh hưởng của lượng đạm (N) và kali (K)

3.7. Các lệnh (SAS Code) để xử lý số liệu tính phương sai (ANOVA) thông dụng
Đây là phần liệt kê một số cách xử lý tính phương sai thường dùng, với ký tự và chữ để dễ sử
dụng. Tuy nhiên SAS có thể dùng tên dài hơn và tùy thí nghiệm có thể thay đổi rất linh động
các chữ này, ngay cả tên các nghiệm thức được nhập vào trong hàng, có thể sửa đổi tùy ý.

- Ghi chú ký tự và chữ cho dễ lập trình, không cứng nhắc vì SAS hiểu và xử lý được các từ.

Ghi biến số ở phần Input và


Giải thích nội dung
xử lý Proc
A,B,C,... Yếu tố thí nghiệm: yếu tố A, yếu tố C
A*B, A*B*C Tương tác giữa hai yếu tố A và B, ba yếu tố A với B và C
Y Chỉ tiêu theo dõi như năng suất, chiều cao cây…
T Nghiệm thức áp dụng cho thí nghiệm một yếu tố
K Khối
Rep Lặp lại nếu không bố trí theo khối
Hang, Cot Hàng và cột (kiểu ô vuông La tin)
Ddiem Địa điểm, nơi thực hiện thí nghiệm

- Phân tích phương sai có thể áp dụng cách xử lý như PROC ANOVA, nhưng khi muốn
so sánh các lô thiếu hoặc so sánh tương tác các yếu tố, thường sử dụng PROC GLM,
hoặc PROC MIXED. Các lệnh đầy đủ để nhập biến, nhập số liệu, xử lý ANOVA, xếp
hạng các trung bình của kiểu RCBD và tính tương tác như sau (bảng số liệu được rút
gọn):

RCBD một yếu tố, so sánh các trung bình RCBD lô phụ, so sánh tương tác các trung bình
data; Data;
input K $ T $ Y; Input K $ D $ V $ DV $ Y;
cards; cards;
1 A 9 1 1 1 D1V1 6789
2 B 14.6 1 1 2 D1V2 6578
3 C 18.3
53
... 1 1 3 D1V3 6589
; 1 1 4 D1V4 6534
proc anova; ...
class K T; ;
model Y = K T; proc glm;
means T /duncan alpha=0.01; class K D V;
title 'Thi nghiem 1 yeu to RCBD'; model Y = K D K*V V D*V;
run; test h=D e=K*V;
means D V D*V/lsd alpha=0.05;
lsmeans D*V/pdiff=control
adjust=dunnett;
title‘SPLIT PLOT P 52 statistix’;
run;
proc glm;
class K DV;
model Y = K DV;
means DV/Duncan alpha=0.05;   
run;

 Ghi chú:
- Phần lệnh nhập số liệu phải có trước khi nhập số liệu như:
data;
input K $ T $ Y;
cards;
- Chuyển số liệu từ file excel vào.
- Tùy theo kết quả của bảng phân tích ANOVA, các cách xếp nhóm means với LSD,
Duncan, alpha = 0,05 hay 0,01 và so sánh tương tác như lsmeans D*V/pdiff=control
adjust=dunnett; được bổ sung vào phần lệnh xử lý, trước hàng run;

Các cách xử lý ANOVA (phỏng theo Schabenberger, 2000) như sau :

3.7. 1. Kiểu hoàn toàn ngẫu nhiên: Completely Randomized Design (CRD)

 CRD không lấy mẫu  CRD có lấy mẫu


proc anova; proc glm;
class T; class Rep T;
model Y = T; model Y = Rep(T) T;
means T; test h=T e=Rep(T);
run; means T;
 CRD ba yếu tố run;
có tương tác các yếu tố
 CRD hai yếu tố
proc glm; proc glm;
class A B; class A B C;
model Y=A B A*B; model Y = A B C A*B A*C B*C A*B*C;
means A B A*B; means A B C A*B A*C B*C A*B*C;
run; run;
hoặc sử dụng thanh đứng A | B | C;
= A B C A*B A*C A*B*C;
proc glm;
class A B C;
model Y =54A | B | C;
means A | B | C;
run;
3.7. 2. Khối đầy đủ hoàn toàn ngẫu nhiên: Randomized Complete Block Designs
(RCBD) với ảnh hưởng khối cố định

GLM MIXED
 proc glm;  proc mixed;
 class K T;  class K T;
 model Y = K T;  model Y = K T;
means T; means T;
 run;   run;

 RCBD khảo sát ảnh hưởng của khối ngẫu nhiên

GLM MIXED
 proc mixed;
 proc glm;
class K T;
   class K T;
   model Y = K T;
   model Y = K T;
   lsmeans T / pdiff stderr;
   lsmeans T / pdiff stderr;
   random K;
 
 run;
 run;
   

 Ghi chú: stderr (standard error), sai số chuẩn; pdiff: khác biệt xác suất p.

 Các thí nghiệm bố trí ở nhiều địa điểm (Tree Fruit Research and Extension Center, 2000)

proc glm;
class ddiem K T;
model Y = ddiem ddiem(K) T T*ddiem ;
test h = ddiem e = ddiem(K);
means T;
run;

 Các thí nghiệm bố trí với nhiều thời gian

proc glm;

class tgian K T;
model Y = tgian tgian(K) T T* tgian ;
test h = tgian e = tgian(K);
55
means T;
run;

 Khối không đầy đủ với khối cố định: Incomplete Block Designs (IBD)

proc glm;
        class K T;
        model Y = K T;
        lsmeans T/ pdiff stderr;
run;

 Kiểu ô vuông La tin: Latin Square Designs

    proc glm;


        class Hang Cot T;
        model Y = Hang Cot T;
means T;
run;

 Kiểu lô phụ có khối cố định, lô chính A, Split-Plot Designs (SPD)

GLM MIXED
 proc mixed;
 proc glm;
class K A B;
    class K A B;
model Y = K A K*A B A*B/
    model Y = K A K*A B A*B;
ddfm=satterth;
test h=A e=K*A;
random K*A;
means A B A*B;
means A B A*B;
run;
run;

Ghi chú: MODEL của MIXED tính độ tự do (degrees of freedom) theo phương pháp
Satterthwaite.

 Kiểu lô sọc cố định lần lặp lại, Split-Block (Strip-Plot) (SBD)

GLM MIXED
proc glm; proc mixed;
class K A B; class K A B;
model y = K A K*A B K*B A*B; model y = K A B A*B
    test  h = A e=K*A;   /ddfm=satterth ;
    test  h = B e=K*B; random K*A K*B;
means A B A*B; means A B A*B;
 run; run;

 Kiểu khối đầy đủ ngẫu nhiên RCBD ba yếu tố có tương tác các yếu tố
56
proc glm;
class K A B C;
model Y = K A B C A*B A*C B*C A*B*C;
means A B C A*B A*C A*B*C;
run;
hoặc sử dụng thanh đứng A | B | C; = A B C A*B A*C A*B*C;
proc glm;
class K A B C;
model Y = K A | B | C;
means A | B | C;
run;

 Kiểu khối đầy đủ ngẫu nhiên RCBD 3 yếu tố bố trí lô phụ (three way factorial
one split,không phải split plit plot), lô chính A*B, lô phụ C.
proc glm;
class K A B C;
model Y = K A B A*B K*A*B C A*C B*C A*B*C;
test h= a e= K*A*B;
test h= b e= Ki*A*B;
test h=a*b e= K*A*B;
means A B C A*B A*C B*C A*B*C;
run; 

 Kiểu khối đầy đủ ngẫu nhiên RCBD ba yếu tố bố trí lô phụ (three way
factorial one split,không phải split plit plot),lô chính A, lô phụ
B*C.

proc glm;
class K A B C;
model y = K A K*A B A*B C A*C B*C A*B*C;
test h=A e=K*A;
means A B C A*B A*C B*C A*B*C;
run; 

 Kiểu lô phụ của lô phụ: Split-Split-Plot Design (SSPD)

GLM MIXED
 proc glm;  proc mixed;
   class K A B C;    class K A B C;
   model y = K A K*A    model y = K A
             B A*B K*A*B              B A*B
             C A*C B*C              C A*C B*C A*B*C ;
A*B*C;    random K*A K*A*B;
   test h=A   e=K*A; means A B C A*B A*C A*B*C;
57
   test h=B   e=K*A*B;
run; 
   test h=A*B e=K*A*B;
means A B C A*B A*C A*B*C;
run; 

 Kiểu Strip Split Plot (Barnard, 1994)

58
(ghi chú: soil: loại đất, fert: phân bón, ca: calcium: vôi)
proc anova;
class rep soil fert ca;
model y = rep fert fert*rep ca ca*fert rep*fert*ca soil rep*soil fert*soil rep*fert*soil
soil*ca soil*fert*ca;
test h=fert e=rep*fert;
test h=ca fert*ca e=rep*fert*ca;
test h=soil e=rep*soil;
test h=fert*soil e=rep*fert*soil;
means fert ca soil ca*fert;
run;

59
Chương 4

TÍNH GIÁ TRỊ TRUNG BÌNH, T-TEST, CHI-BÌNH PHƯƠNG


TƯƠNG QUAN VÀ HỒI QUI

4.1. Tính giá trị trung bình và độ lệch chuẩn


Bài tập chủ đề: thống kê mô tả tính giá trị trung bình (MEAN) và độ lệch chuẩn (SD, STD,
standard deviation) của thí nghiệm khối đầy đủ ngẫu nhiên, ba khối của 13 giống cỏ ký hiệu là
4405, 4366... Khảo sát ba chỉ tiêu là tỉ lệ nảy mầm % (TLNMAM), điểm cường lực (vigor,
CLUC) và điểm khả năng sản xuất hạt (SXHAT). Lưu ý: K là khối, giá trị này chỉ ghi theo
khối, không dùng phân tích mô tả (phỏng theo bài tập thống kê mô tả, NRCS, 2007).
data A;
input K GIONG $ TLNMAM CLUC SXHAT;
cards;
1 4405 39 6 6
1 4366 100 7 6
1 4356 90 6 5
1 4414 100 5 5
1 2275 56 7 5
1 4386 100 7 6
1 4432 98 5 6
1 4361 100 5 4
1 4365 75 7 5
1 4456 100 4 5
1 4430 88 6 6
1 4376 100 5 6
1 1261 100 6 7
2 4405 56 5 6
2 4366 98 7 5
2 4356 100 5 7
2 4414 100 6 6
2 2275 89 4 4
2 4386 98 7 6
2 4432 89 8 8
2 4361 100 4 5
2 4365 85 5 7
2 4456 95 5 3
2 4430 90 6 5
2 4376 100 9 4
2 1261 100 7 6
3 4405 65 6 4
3 4366 90 5 5
3 4356 100 4 6
3 4414 100 8 4
3 2275 85 7 5
3 4386 93 6 3
3 4432 88 4 5
3 4361 100 4 6
3 4365 88 8 7
3 4456 100 8 4
3 4430 93 5 7
3 4376 100 5 8
64
3 1261 98 6 9
;
proc sort;
by GIONG;
proc means data=A noprint;
var TLNMAM CLUC SXHAT;
by GIONG;
output out=newA;
proc print data=newA;
run;
The SAS System

Obs GIONG _TYPE_ _FREQ_ _STAT_ TLNMAM CLUC SXHAT

1 1261 0 3 N 3.000 3.00000 3.00000


2 1261 0 3 MIN 98.000 6.00000 6.00000
3 1261 0 3 MAX 100.000 7.00000 9.00000
4 1261 0 3 MEAN 99.333 6.33333 7.33333
5 1261 0 3 STD 1.155 0.57735 1.52753
6 2275 0 3 N 3.000 3.00000 3.00000
7 2275 0 3 MIN 56.000 4.00000 4.00000
8 2275 0 3 MAX 89.000 7.00000 5.00000
9 2275 0 3 MEAN 76.667 6.00000 4.66667
10 2275 0 3 STD 18.009 1.73205 0.57735
11 4356 0 3 N 3.000 3.00000 3.00000
12 4356 0 3 MIN 90.000 4.00000 5.00000
13 4356 0 3 MAX 100.000 6.00000 7.00000
14 4356 0 3 MEAN 96.667 5.00000 6.00000
15 4356 0 3 STD 5.774 1.00000 1.00000
16 4361 0 3 N 3.000 3.00000 3.00000
17 4361 0 3 MIN 100.000 4.00000 4.00000
18 4361 0 3 MAX 100.000 5.00000 6.00000
19 4361 0 3 MEAN 100.000 4.33333 5.00000
20 4361 0 3 STD 0.000 0.57735 1.00000
21 4365 0 3 N 3.000 3.00000 3.00000
22 4365 0 3 MIN 75.000 5.00000 5.00000
23 4365 0 3 MAX 88.000 8.00000 7.00000
24 4365 0 3 MEAN 82.667 6.66667 6.33333
25 4365 0 3 STD 6.807 1.52753 1.15470
26 4366 0 3 N 3.000 3.00000 3.00000
27 4366 0 3 MIN 90.000 5.00000 5.00000
28 4366 0 3 MAX 100.000 7.00000 6.00000
29 4366 0 3 MEAN 96.000 6.33333 5.33333
30 4366 0 3 STD 5.292 1.15470 0.57735
31 4376 0 3 N 3.000 3.00000 3.00000
32 4376 0 3 MIN 100.000 5.00000 4.00000
33 4376 0 3 MAX 100.000 9.00000 8.00000
34 4376 0 3 MEAN 100.000 6.33333 6.00000
35 4376 0 3 STD 0.000 2.30940 2.00000
36 4386 0 3 N 3.000 3.00000 3.00000
37 4386 0 3 MIN 93.000 6.00000 3.00000
38 4386 0 3 MAX 100.000 7.00000 6.00000
39 4386 0 3 MEAN 97.000 6.66667 5.00000
40 4386 0 3 STD 3.606 0.57735 1.73205
41 4405 0 3 N 3.000 3.00000 3.00000
42 4405 0 3 MIN 39.000 5.00000 4.00000
43 4405 0 3 MAX 65.000 6.00000 6.00000
44 4405 0 3 MEAN 53.333 5.66667 5.33333
45 4405 0 3 STD 13.204 0.57735 1.15470
46 4414 0 3 N 3.000 3.00000 3.00000
47 4414 0 3 MIN 100.000 5.00000 4.00000
48 4414 0 3 MAX 100.000 8.00000 6.00000
49 4414 0 3 MEAN 100.000 6.33333 5.00000
50 4414 0 3 STD 0.000 1.52753 1.00000
51 4430 0 3 N 3.000 3.00000 3.00000
52 4430 0 3 MIN 88.000 5.00000 5.00000
53 4430 0 3 MAX 93.000 6.00000 7.00000
54 4430 0 3 MEAN 90.333 5.66667 6.00000
55 4430 0 3 STD 2.517 0.57735 1.00000
56 4432 0 3 N 3.000 3.00000 3.00000
57 4432 0 3 MIN 88.000 4.00000 5.00000

65
58 4432 0 3 MAX 98.000 8.00000 8.00000
59 4432 0 3 MEAN 91.667 5.66667 6.33333
60 4432 0 3 STD 5.508 2.08167 1.52753
61 4456 0 3 N 3.000 3.00000 3.00000
62 4456 0 3 MIN 95.000 4.00000 3.00000
63 4456 0 3 MAX 100.000 8.00000 5.00000
64 4456 0 3 MEAN 98.333 5.66667 4.00000
65 4456 0 3 STD 2.887 2.08167 1.00000

Giải thích: N là số lần lặp lại, MAX và MIN là giá trị cao nhất và thấp nhất. MEAN là giá trị
trung bình, STD là standard deviation: độ lệch chuẩn. Kết quả đối với giống cỏ 4456 có giá trị
tỉ lệ nảy mầm trung bình là 98,33 với STD là 2,89; điểm cường lực trung bình là 5,67 và STD
là 2,08; điểm khả năng sản xuất hạt là 4 với STD là 1.

4.2. T test: so sánh khác biệt trung bình hai mẫu

Áp dụng trong trường hợp điều tra chọn mẫu hai lô đối chứng và tác động kỹ thuật như phun
thuốc tăng nở hoa, đậu quả, bón phân và không bón, xịt thuốc diệt cỏ và không xịt thuốc. So
sánh hai giá trị trung bình của hai biến, cũng căn cứ trên xác suất p. Nếu p > 0,05 thì hai biến
số không khác nhau có nghĩa. Áp dụng cho chọn mẫu có số điểm chọn bằng nhau. Nếu bố trí
các ô theo dõi ở vị trí giống nhau của hai nhóm mẫu, gọi là bắt cặp (paired comparison), nếu
bố trí các ô theo dõi ở vị trí khác nhau của hai mẫu, gọi là không bắt cặp (unpaired
comparison).

Thí nghiệm sử dụng chất điều hòa sinh trưởng Z cho giống cải dầu (B) và giống đối chứng (A)
không xử lý, kết quả năng suất (tấn/ha) như sau (phỏng theo Clewer, 2001):

data;
      input S A B;
      diff=B-A;
      cards;    
1 3.5 5.5
2 4.6 4.1
3 4.0 4.5
4 4.3 6.1
5 4.0 4.6
6 4.6 5.3
7 5.0 5.4
8 3.9 3.9
9 3.5 4.4
10 4.8 6.1
   ;
   proc means mean stderr t prt;
      var diff;
      title 'SO SANH T TEST';
   run;

SO SANH T TEST

The MEANS Procedure

Analysis Variable : diff

66
Mean Std Error t Value Pr > |t|
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
0.7700000 0.2431506 3.17 0.0114
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

Giải thích:
Giá trị Pr > |t| = 0,0114 cho thấy giống cải dầu B có sử dụng chất điều hoà sinh trưởng Z có
khác biệt năng suất với giống A không xử lý ở mức p < 0,05.

4.3. Chi-bình phương (Chi-square) so sánh tính độc lập của hai yếu tố

Trắc nghiệm tính độc lập căn cứ vào vấn đề đặt ra là giả thiết H0 là các biện pháp áp dụng đều
có ảnh hưởng như nhau. Sử dụng xác suất của Chi-bình phương để tính, nếu p < 0,05 là bác bỏ
giả thiết trên, kỹ thuật áp dụng có ảnh hưởng, nếu p > 0,05 thì chấp nhận giả thiết trên, kỹ thuật
áp dụng như nhau. Thường áp dụng cho việc áp dụng các biện pháp kỹ thuật để xác định ảnh
hưởng đến sinh trưởng của cây, cây bệnh hay không bệnh.

Điều tra sau phun thuốc ảnh hưởng sinh trưởng cây với hai yếu tố là: (1) phun thuốc và không
phun, (2) cây tốt và cây bệnh. Số lượng cây được đếm trong tổng số 1000 cây. Giả thiết H0 là
chấp nhận phun thuốc và cây bệnh không ảnh hưởng nhau.
data Dieutra;
input Xitthuoc $ Struong $ Soluong @@;
datalines;
phun benh 10
phun tot 190
khong benh 96
khong tot 704
;
proc freq data=Dieutra order=data;
weight Soluong;
tables Xitthuoc*Struong / chisq expected cellchi2 norow nocol;
output out=ChiSqData pchi lrchi n nmiss;
title 'Chi-Square Tests Xitthuoc';
run;

Chi-Square Tests Xitthuoc

The FREQ Procedure

Table of Xitthuoc by Struong

Xitthuoc Struong

Frequency ‚
Expected ‚
Cell Chi-Square‚
Percent ‚benh ‚tot ‚ Total
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
phun ‚ 10 ‚ 190 ‚ 200
‚ 21.2 ‚ 178.8 ‚
‚ 5.917 ‚ 0.7016 ‚
‚ 1.00 ‚ 19.00 ‚ 20.00
67
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
khong ‚ 96 ‚ 704 ‚ 800
‚ 84.8 ‚ 715.2 ‚
‚ 1.4792 ‚ 0.1754 ‚
‚ 9.60 ‚ 70.40 ‚ 80.00
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Total 106 894 1000
10.60 89.40 100.00

Statistics for Table of Xitthuoc by Struong

Statistic DF Value Prob


ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Chi-Square 1 8.2732 0.0040
Likelihood Ratio Chi-Square 1 9.6535 0.0019
Continuity Adj. Chi-Square 1 7.5510 0.0060
Mantel-Haenszel Chi-Square 1 8.2649 0.0040
Phi Coefficient -0.0910
Contingency Coefficient 0.0906
Cramer's V -0.0910

Fisher's Exact Test


ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Cell (1,1) Frequency (F) 10
Left-sided Pr <= F 0.0017
Right-sided Pr >= F 0.9994

Table Probability (P) 0.0011


Two-sided Pr <= P 0.0030

Sample Size = 1000

Giải thích:
Kết quả cho thấy giá trị của Chi-Square là 8,273 với p = 0,004 < 0,05 có nghĩa là bác bỏ giả
thiết trên, xịt thuốc hạn chế cây bệnh.

4.4. Ma trận tương quan (correlation matrix)

Xác định ma trận tương quan hai chiều các biến số đồng nhất áp dụng đối với năng suất cây là
tìm yếu tố nào ảnh hưởng lớn nhất đến năng suất cây, từ đó đề xuất biện pháp cải thiện năng
suất hợp lý. Sử dụng giá trị hệ số tương quan r và xác suất p. Nếu r > 0,7 là tương quan chặt,
nếu p < 0,05 thì kết luận có khác biệt giữa hai biến số. Nếu p > 0,05 thì hai biến số không khác
nhau có nghĩa.

Khảo sát tương quan năng suất cây cà phê (kg/cây), ký hiệu là NSUATCAY với tỉ lệ hạt tròn
(%) (HATTRON), tỉ lệ nhân/quả (%) (NHANQUA), cấp hạt R1 (%) là tỉ lệ hạt được giữ lại
trên sàng rây 6,3 mm, và trọng lượng 100 quả (g) (TL100QUA). Tương quan này được khảo
sát từ thí nghiệm bón phân đạm kết hợp thạch cao.

DATA;
INPUT NSUATCAY HATTRON NHANQUA R1 TL100QUA;
CARDS;
1.83 22.8 15.6 40.8 103.7
1.82 18.0 16.2 41.3 112.6
1.82 21.1 15.7 42.4 106.6
1.83 20.9 15.5 41.2 105.9
1.84 14.9 16.6 43.7 112.5
1.86 12.8 16.9 44.9 124.4
1.90 12.8 17.1 42.4 118.6

68
1.93 11.9 17 69.6 134.2
1.85 12.4 17.2 43.9 118.6
1.96 11.9 17.2 70.7 128.7
2.08 11.5 17.4 80.4 142.3
2.01 12.5 17.0 70.4 134.6
;
PROC CORR OUTP=P;
RUN;
PROC PRINT DATA=P;
RUN;
The SAS System

The CORR Procedure

5 Variables: NSUATCAY HATTRON NHANQUA R1 TL100QUA

Simple Statistics

Variable N Mean Std Dev Sum Minimum Maximum

NSUATCAY 12 1.89417 0.08469 22.73000 1.82000 2.08000


HATTRON 12 15.29167 4.21048 183.50000 11.50000 22.80000
NHANQUA 12 1.66167 0.06873 19.94000 1.55000 1.74000
R1 12 52.64167 15.15205 631.70000 40.80000 80.40000
TL100QUA 12 120.22500 12.66894 1443 103.70000 142.30000

Pearson Correlation Coefficients, N = 12


Prob > |r| under H0: Rho=0

NSUATCAY HATTRON NHANQUA R1 TL100QUA

NSUATCAY 1.00000 -0.66965 0.69682 0.93389 0.90831


0.0172 0.0118 <.0001 <.0001

HATTRON -0.66965 1.00000 -0.98192 -0.63167 -0.85691


0.0172 <.0001 0.0276 0.0004

NHANQUA 0.69682 -0.98192 1.00000 0.63218 0.84715


0.0118 <.0001 0.0274 0.0005

R1 0.93389 -0.63167 0.63218 1.00000 0.90515


<.0001 0.0276 0.0274 <.0001

TL100QUA 0.90831 -0.85691 0.84715 0.90515 1.00000


<.0001 0.0004 0.0005 <.0001

The SAS System

Obs _TYPE_ _NAME_ NSUATCAY HATTRON NHANQUA R1 TL100QUA

1 MEAN 1.8942 15.2917 1.6617 52.6417 120.225


2 STD 0.0847 4.2105 0.0687 15.1520 12.669
3 N 12.0000 12.0000 12.0000 12.0000 12.000
4 CORR NSUATCAY 1.0000 -0.6697 0.6968 0.9339 0.908
5 CORR HATTRON -0.6697 1.0000 -0.9819 -0.6317 -0.857
6 CORR NHANQUA 0.6968 -0.9819 1.0000 0.6322 0.847
7 CORR R1 0.9339 -0.6317 0.6322 1.0000 0.905
8 CORR TL100QUA 0.9083 -0.8569 0.8472 0.9052 1.000

Pearson Correlation Coefficients là hệ số tương quan, thường gọi là r. Hệ số tương quan r chặt
khi từ 0,7 trở lên. Prob > |r| là xác xuất có nghĩa của hệ số r.

Trình bày tương quan của năng suất với các chỉ tiêu như sau (phỏng theo trình bày của Filippi,
1997):

69
Bảng 4.1. Tương quan của năng suất cây (kg/cây) và các chỉ tiêu theo dõi

NSUATCAY HATTRON NHANQUA R1 TL100QUA

NSUATCAY 1.00000 -0.66965 0.69682 0.93389 0.90831


0.0172 0.0118 <.0001 <.0001

HATTRON -0.66965 1.00000 -0.98192 -0.63167 -0.85691


0.0172 <.0001 0.0276 0.0004

NHANQUA 0.69682 -0.98192 1.00000 0.63218 0.84715


0.0118 <.0001 0.0274 0.0005

R1 0.93389 -0.63167 0.63218 1.00000 0.90515


<.0001 0.0276 0.0274 <.0001

TL100QUA 0.90831 -0.85691 0.84715 0.90515 1.00000


<.0001 0.0004 0.0005 <.0001

Chú thích: hàng trên là hệ số tương quan r (Pearson Correlation Coefficients), số mẫu quan
sát = 12, hàng dưới là xác suất p.

Giải thích: năng suất cây có tương quan với các chỉ tiêu: cấp hạt R1 với hệ số tương quan r =
0,93389 và trọng lượng 100 quả với hệ số tương quan r = 0,90831 (xác suất đều là p < 0,0001).
Năng suất cây tương quan nghịch với tỉ lệ hạt tròn, khi tỉ lệ hạt tròn thấp thì năng suất cao, với
hệ số tương quan r = - 0,66965.
4.5. Hồi qui tuyến tính đơn biến (simple regression)

Xác định phương trình y = ax + b của hai chỉ tiêu thể hiện với phương trình hồi qui có nghĩa.
Khảo sát phương trình hồi qui của trọng lượng khô X (g) và diện tích lá Y (cm 2) của cây cỏ
thức ăn gia súc do bón phân như sau (Clewer, 2001):

DATA A;
   INPUT TLKHO DTLA;
CARDS;    
0.29 144
0.43 180
0.21 60
0.53 226
0.27 105
0.33 111
0.47 217
0.40 221
0.48 218
0.30 137
0.37 153
0.30 105
;
 PROC REG DATA=A;
   MODEL DTLA = TLKHO;
RUN;
PLOT R.*P.;
RUN;

The SAS System

70
The REG Procedure
Model: MODEL1
Dependent Variable: DTLA

Analysis of Variance

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 29416 29416 61.22 <.0001


Error 10 4805.16144 480.51614
Corrected Total 11 34221

Root MSE 21.92068 R-Square 0.8596


Dependent Mean 156.41667 Adj R-Sq 0.8455
Coeff Var 14.01429

Parameter Estimates

Parameter Standard
Variable DF Estimate Error t Value Pr > |t|

Intercept 1 -36.49953 25.45564 -1.43 0.1821


TLKHO 1 528.53751 67.55225 7.82 <.0001

Giải thích: phương trình hồi qui có nghĩa ở mức p < 0,01, giá trị X của phương trình có
xác suất p < 0,01 nên chấp nhận là rất có nghĩa, phương trình được ghi như sau:
Diện tích lá = 528,54 Trọng lượng khô – 36,50.

D T L A = - 3 6 . 5 +5 2 8 . 5 4 T L K H O
50 N
12
Rs q
40 0. 8596
Adj Rs q
0. 8455
30 R MS E
21. 921

20

10

- 10

- 20

- 30

60 80 100 120 140 160 180 200 220 240 260

Pr edi c t ed Val ue

Hình 4.1. Phương trình tương quan và sai số của diện tích lá và trọng lượng khô cỏ.

4.6. Hồi qui tuyến tính đa biến (multiple regression)

Thí nghiệm tính hồi qui năng suất với cấp hạt R1 và trọng lượng 100 quả cà phê.

Xác định phương trình hồi qui đa biến y = ax 1 + bx2 + cx3 để tìm ra các biến số x nào có p <
0,05 là chấp nhận có ảnh hưởng đến y. Trước hết xác định phương trình hồi qui và xem xác
suất p của từng biến, sau đó chọn các biến có giá trị p < 0,05 để xác định phương trình hồi qui
đa biến có nghĩa.

Từ kết quả ma trận tương quan của năng suất cà phê (kg/cây) tương quan rất chặt với cấp hạt
R1 và trọng lượng 100 quả đó là tương quan đơn. Để tính hồi qui tuyến tính đa biến, lập bảng
71
tính sau đây để xác định tương quan đa biến và hai biến số này có ảnh hưởng đến năng suất có
nghĩa hay không.
data HOIQUI;
input NSUATCAY R1 TL100QUA;
cards;
1.83 40.8 103.7
1.82 41.3 112.6
1.82 42.4 106.6
1.83 41.2 105.9
1.84 43.7 112.5
1.86 44.9 124.4
1.9 42.4 118.6
1.93 69.6 134.2
1.85 43.9 118.6
1.96 70.7 128.7
2.08 80.4 142.3
2.01 70.4 134.6
;
 proc reg data=HOIQUI;
   model NSUATCAY=R1 TL100QUA;
run;

The SAS System

The REG Procedure

Model: MODEL1

Dependent Variable: NSUATCAY

Analysis of Variance

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 2 0.07054 0.03527 38.00 <.0001


Error 9 0.00835 0.00092820
Corrected Total 11 0.07889

Root MSE 0.03047 R-Square 0.8941


Dependent Mean 1.89417 Adj R-Sq 0.8706
Coeff Var 1.60844

Parameter Estimates

Parameter Standard
Variable DF Estimate Error t Value Pr > |t|

Intercept 1 1.43207 0.14105 10.15 <.0001


R1 1 0.00346 0.00143 2.42 0.0384
TL100QUA 1 0.00233 0.00171 1.37 0.2050

Giải thích: từ kết quả ước tính của hồi qui đa biến cho thấy chỉ có cấp hạt R1 là có xác suất có
nghĩa với năng suất (p = 0,0384) còn trọng lượng 100 quả không có ý nghĩa (p = 0,205). Kết
luận phương trình hồi qui năng suất với cấp hạt R1 có nghĩa ở mức p < 0,05 và cần lập phương
trình tương quan đơn biến cho hai chỉ tiêu này. Phương trình hồi qui của năng suất cây và cấp
hạt R1 như sau:

72
data HOIQUI;
input NSUATCAY R1;
cards;
1.83 40.8
1.82 41.3
1.82 42.4
1.83 41.2
1.84 43.7
1.86 44.9
1.9 42.4
1.93 69.6
1.85 43.9
1.96 70.7
2.08 80.4
2.01 70.4
;
 proc reg data=HOIQUI;
   model NSUATCAY=R1;
run;
PLOT R.*P.;
RUN;

The SAS System

The REG Procedure


Model: MODEL1
Dependent Variable: NSUATCAY

Analysis of Variance

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 0.06881 0.06881 68.22 <.0001


Error 10 0.01009 0.00101
Corrected Total 11 0.07889

Root MSE 0.03176 R-Square 0.8721


Dependent Mean 1.89417 Adj R-Sq 0.8594
Coeff Var 1.67668

Parameter Estimates

Parameter Standard
Variable DF Estimate Error t Value Pr > |t|

Intercept 1 1.61939 0.03451 46.93 <.0001


R1 1 0.00522 0.00063197 8.26 <.0001

Giải thích:
Phương trình hồi qui năng suất và cấp hạt R1 được viết là:
Năng suất cây = 0,0052 R1 + 1,6194 với R2 = 0,8721

73
NS UAT C A Y = 1 . 6 1 9 4 +0 . 0 0 5 2 R 1
0. 06 N
12
Rs q
0. 8721
0. 04 Adj Rs q
0. 8594
R MS E
0. 0318
0. 02

0. 00

- 0. 02

- 0. 04

- 0. 06

1. 825 1. 850 1. 875 1. 900 1. 925 1. 950 1. 975 2. 000 2. 025 2. 050

Pr edi c t ed Val ue

Hình 4.2. Phương trình tương quan và sai số của năng suất và cấp hạt R1 cà phê.
4.7. Hồi qui đa biến bậc hai

Đối với một số thí nghiệm, cần xác định phương trình hồi qui của quan hệ năng suất và các
nghiệm thức như phân bón thường có giới hạn khi tăng lượng phân bón cao, lúc đó năng suất
giảm khi lượng phân bón cao, đường biểu diễn không phải là tuyến tính mà là đường cong
thuộc phương trình bậc hai.

Thí nghiệm về lượng phân đạm N (lbs/acre) đến năng suất cỏ (tấn/ha) biểu thị bằng đường biểu
diễn của phương trình bậc hai y = ax2 + bx + c (NRCS, 2007). Phương trình hồi qui được xác
định như sau:

data HOIQUI;
input N NSUATCO;
cards;
0 2.30545
120 3.5875
240 4.862
360 4.899
480 5.179
0 2.8665
120 3.544
240 4.042
360 5.479
480 5.3125
0 2.3125
120 3.207
240 4.5475
360 4.6585
480 4.5945
;
 proc rsreg data=HOIQUI;
   model NSUATCO=N/lackfit;
run;

74
The RSREG Procedure

Coding Coefficients for the Independent Variables

Factor Subtracted off Divided by

N 240.000000 240.000000

Response Surface for Variable NSUATCO

Response Mean 4.093130


Root MSE 0.342317
R-Square 0.9111
Coefficient of Variation 8.3632

Type I Sum
Regression DF of Squares R-Square F Value Pr > F

Linear 1 13.201793 0.8345 112.66 <.0001


Quadratic 1 1.212814 0.0767 10.35 0.0074
Crossproduct 0 0 0.0000 . .
Total Model 2 14.414607 0.9111 61.51 <.0001

Sum of
Residual DF Squares Mean Square F Value Pr > F

Lack of Fit 2 0.122413 0.061207 0.48 0.6342


Pure Error 10 1.283757 0.128376
Total Error 12 1.406171 0.117181

Parameter
Estimate
Standard from Coded
Parameter DF Estimate Error t Value Pr > |t| Data

Intercept 1 2.426528 0.186001 13.05 <.0001 4.432992


N 1 0.011192 0.001836 6.10 <.0001 1.326740
N*N 1 -0.000011801 0.000003668 -3.22 0.0074 -0.679724

Sum of
Factor DF Squares Mean Square F Value Pr > F
N 2 14.414607 7.207303 61.51 <.0001
06:19 Wednesday, June 16, 1993 7
The RSREG Procedure
Canonical Analysis of Response Surface Based on Coded Data

Critical Value
Factor Coded Uncoded

N 0.975941 474.225722

Predicted value at stationary point: 5.080402

Eigenvectors
Eigenvalues N

-0.679724 1.000000

Stationary point is a maximum.

Giải thích:
- Giá trị xác suất của N là p < 0,0001 và N*N là p = 0,0074, do đó hai giá trị này rất có nghĩa
trong phương trình hồi qui bậc hai.

75
- Phương trình được viết là: Năng suất cỏ (tấn/ha) = - 0,0000118N 2 + 0,0112N + 2,4265 với hệ
số tương quan đa biến là R2 = 0,9111.

- Xác định điểm tối đa năng suất cỏ ở lượng đạm:


Năng suất cỏ Y đạt tối đa khi X = - (β1/2 β2) = - 0,01192/(2(- 0,0000118)) = 474,2 lbs N/acre.
- Tương tự theo kết quả xử lý, yếu tố đạm N có Critical Value Uncoded là 474,2 và đây là
điểm tối đa cho năng suất cỏ tối ưu.

4.8. Tối ưu hóa và xác định điểm (simple optimum)


Đáp ứng mặt phẳng: Saddle-Surface Response Using Ridge Analysis
Bài tập tính hiệu suất % Mercaptobenzothiazole do ảnh hưởng của thời gian và nhiệt độ.
Đường đồng mức xác định điểm tối ưu.
nguồn: từ Myers, Response Surface Methodology 1976 (SAS,2004).
 
   data d;
      input Thgian Nhietdo MBT;
      label Thgian = "Thoi gian phan ung(gio)"
            Nhietdo = "Nhiet do (do C)"
            MBT  = "Hieu suat (%)Mercaptobenzothiazole";
      datalines;
    4.0   250   83.8
   20.0   250   81.7
   12.0   250   82.4
   12.0   250   82.9
   12.0   220   84.7
   12.0   280   57.9
   12.0   250   81.2
    6.3   229   81.3
    6.3   271   83.1
   17.7   229   85.3
   17.7   271   72.7
    4.0   250   82.0
   ;
   proc sort;
      by Thgian Nhietdo;
   run;
 
   proc rsreg;
      model MBT=Thgian Nhietdo / lackfit;
      ridge max;
   run;
 
   /* Plot contours of predicted response */
   data b;
      set d;
      flag=1;
      MBT=.;
      do Thgian=0 to 20 by 1;
         do Nhietdo=220 to 280 by 5;
            output;
         end;
      end;
   data c;
      set d b;
   run;
 

76
   proc rsreg data=c out=e noprint;
     model MBT=Thgian Nhietdo / predict;
     id flag;
   run;
 
   data f;
      set e;
      if flag=1;
   data annote;
      length function color style $8 text $8;
      retain hsys ysys xsys '2' size 1 function 'label'
             color 'black' style 'swissl' position '5';
      x=255; y=10  ; text='80.3'; output;
      x=245; y=11  ; text='82.9'; output;
      x=227; y= 7  ; text='80.3'; output;
      x=235; y= 8  ; text='82.9'; output;
      x=235; y=14.5; text='85.5'; output;
      x=230; y=18  ; text='88.1'; output;
      x=250; y= 3  ; text='85.5'; output;
   run;
   axis1 label=(angle=90) minor=none;
   axis2 order=(220 to 280 by 20) minor=none;
 
   proc gcontour data=f annotate=annote;
      plot Thgian*Nhietdo=MBT
           / nlevels=12 vaxis=axis1 haxis=axis2 nolegend;
   run;

The SAS System

The RSREG Procedure

Coding Coefficients for the Independent Variables

Factor Subtracted off Divided by

Thgian 12.000000 8.000000


Nhietdo 250.000000 30.000000

Response Surface for Variable MBT: Hieu suat (%%)Mercaptobenzothiazole

Response Mean 79.916667


Root MSE 4.615964
R-Square 0.8003
Coefficient of Variation 5.7760

Type I Sum
Regression DF of Squares R-Square F Value Pr > F

Linear 2 313.585803 0.4899 7.36 0.0243


Quadratic 2 146.768144 0.2293 3.44 0.1009
Crossproduct 1 51.840000 0.0810 2.43 0.1698
Total Model 5 512.193947 0.8003 4.81 0.0410

Sum of
Residual DF Squares Mean Square F Value Pr > F

Lack of Fit 3 124.696053 41.565351 39.63 0.0065


Pure Error 3 3.146667 1.048889
Total Error 6 127.842720 21.307120

Parameter
Estimate
Standard from Coded

77
Parameter DF Estimate Error t Value Pr > |t| Data

Intercept 1 -545.867976 277.145373 -1.97 0.0964 82.173110


Thgian 1 6.872863 5.004928 1.37 0.2188 -1.014287
Nhietdo 1 4.989743 2.165839 2.30 0.0608 -8.676768
Thgian*Thgian 1 0.021631 0.056784 0.38 0.7164 1.384394
Nhietdo*Thgian 1 -0.030075 0.019281 -1.56 0.1698 -7.218045
Nhietdo*Nhietdo 1 -0.009836 0.004304 -2.29 0.0623 -8.852519

The SAS System

The RSREG Procedure

Sum of
Factor DF Squares Mean Square F Value Pr > F Label

Thgian 3 61.290957 20.430319 0.96 0.4704 Thoi gian phan ung(gio)


Nhietdo 3 461.250925 153.750308 7.22 0.0205 Nhiet do (do C)

The SAS System

The RSREG Procedure


Canonical Analysis of Response Surface Based on Coded Data

Critical Value
Factor Coded Uncoded Label

Thgian -0.441758 8.465935 Thoi gian phan ung(gio)


Nhietdo -0.309976 240.700718 Nhiet do (do C)

Predicted value at stationary point: 83.741940

Eigenvectors
Eigenvalues Thgian Nhietdo

2.528816 0.953223 -0.302267


-9.996940 0.302267 0.953223

Stationary point is a saddle point.

The SAS System

The RSREG Procedure

Estimated Ridge of Maximum Response for Variable MBT: Hieu suat (%%)Mercaptobenzothiazole

Coded Estimated Standard Uncoded Factor Values


Radius Response Error Thgian Nhietdo

0.0 82.173110 2.665023 12.000000 250.000000


0.1 82.952909 2.648671 11.964493 247.002956
0.2 83.558260 2.602270 12.142790 244.023941
0.3 84.037098 2.533296 12.704153 241.396084
0.4 84.470454 2.457836 13.517555 239.435227
0.5 84.914099 2.404616 14.370977 237.919138
0.6 85.390012 2.410981 15.212247 236.624811
0.7 85.906767 2.516619 16.037822 235.449230
0.8 86.468277 2.752355 16.850813 234.344204
0.9 87.076587 3.130961 17.654321 233.284652

78
1.0 87.732874 3.648568 18.450682 232.256238
 

20

15

10

0
220 240 260 280

Nh i e t do ( do C)
 
Hình 4.3. Hiệu suất % Mercaptobenzothiazole (MBT) do ảnh hưởng của thời gian phản ứng và nhiệt
độ theo mặt phẳng đồng mức.

4.9. Đồ thị hình lưới chiếu mặt phẳng ba chiều: của ảnh hưởng nhiệt độ (độ C) và nồng
độ chất xúc tác (g) đến năng suất sinh khối (g) của vi khuẩn (bài tập rút gọn từ
TSPLINE, SAS, 1999).

data VIKHUAN;
input nhiet nongdo nsuat @@;
datalines;
60 0 6.8389 64 0 7.3874 68 0 7.6236 72 0 7.5902 76 0 7.3299
60 0.002 7.1584 64 0.002 7.7366 68 0.002 7.9968 72 0.002 7.9817 76 0.002 7.7339
60 0.004 7.4337 64 0.004 8.0436 68 0.004 8.3297 72 0.004 8.3348 76 0.004 8.1016
60 0.006 7.6658 64 0.006 8.3092 68 0.006 8.6232 72 0.006 8.6504 76 0.006 8.4337
60 0.008 7.8556 64 0.008 8.5345 68 0.008 8.8783 72 0.008 8.9296 76 0.008 8.7313
60 0.01 8.004 64 0.01 8.7204 68 0.01 9.0959 72 0.01 9.1733 76 0.01 8.9953
60 0.012 8.1121 64 0.012 8.8678 68 0.012 9.277 72 0.012 9.3824 76 0.012 9.2267
60 0.014 8.1807 64 0.014 8.9778 68 0.014 9.4226 72 0.014 9.5579 76 0.014 9.4265
60 0.016 8.2109 64 0.016 9.0512 68 0.016 9.5336 72 0.016 9.7008 76 0.016 9.5955
60 0.018 8.2035 64 0.018 9.089 68 0.018 9.6109 72 0.018 9.8119 76 0.018 9.7347
60 0.02 8.1595 64 0.02 9.0922 68 0.02 9.6555 72 0.02 9.8923 76 0.02 9.8451
60 0.022 8.08 64 0.022 9.0617 68 0.022 9.6684 72 0.022 9.9428 76 0.022 9.9277
60 0.024 7.9657 64 0.024 8.9985 68 0.024 9.6505 72 0.024 9.9646 76 0.024 9.9834
60 0.026 7.8178 64 0.026 8.9035 68 0.026 9.6028 72 0.026 9.9584 76 0.026 10.0131
60 0.028 7.6371 64 0.028 8.7777 68 0.028 9.5262 72 0.028 9.9253 76 0.028 10.0178
60 0.03 7.4245 64 0.03 8.622 68 0.03 9.4217 72 0.03 9.8662 76 0.03 9.9984
60 0.032 7.1812 64 0.032 8.4375 68 0.032 9.2902 72 0.032 9.7821 76 0.032 9.956
60 0.034 6.9079 64 0.034 8.2249 68 0.034 9.1327 72 0.034 9.6739 76 0.034 9.8914
60 0.036 6.6057 64 0.036 7.9854 68 0.036 8.9501 72 0.036 9.5426 76 0.036 9.8057

79
60 0.038 6.2755 64 0.038 7.7198 68 0.038 8.7434 72 0.038 9.3891 76 0.038 9.6997
60 0.04 5.9183 64 0.04 7.4291 68 0.04 8.5135 72 0.04 9.2144 76 0.04 9.5744
60 0.042 5.5349 64 0.042 7.1142 68 0.042 8.2615 72 0.042 9.0194 76 0.042 9.4308
60 0.044 5.1265 64 0.044 6.7762 68 0.044 7.9882 72 0.044 8.8051 76 0.044 9.2699
60 0.046 4.6939 64 0.046 6.4159 68 0.046 7.6946 72 0.046 8.5725 76 0.046 9.0925
60 0.048 4.238 64 0.048 6.0344 68 0.048 7.3816 72 0.048 8.3225 76 0.048 8.8997
60 0.05 3.7599 64 0.05 5.6325 68 0.05 7.0503 72 0.05 8.056 76 0.05 8.6923
60 0.052 3.2604 64 0.052 5.2112 68 0.052 6.7015 72 0.052 7.774 76 0.052 8.4714
60 0.054 2.7406 64 0.054 4.7716 68 0.054 6.3362 72 0.054 7.4774 76 0.054 8.2379
60 0.056 2.2014 64 0.056 4.3144 68 0.056 5.9554 72 0.056 7.1673 76 0.056 7.9927
60 0.058 1.6438 64 0.058 3.8407 68 0.058 5.5601 72 0.058 6.8445 76 0.058 7.7369
60 0.06 1.0686 64 0.06 3.3515 68 0.06 5.1511 72 0.06 6.5101 76 0.06 7.4713
60 0.062 0.4769 64 0.062 2.8476 68 0.062 4.7294 72 0.062 6.1649 76 0.062 7.1969
60 0.064 0 64 0.064 2.3302 68 0.064 4.2961 72 0.064 5.81 76 0.064 6.9146
60 0.066 0 64 0.066 1.7999 68 0.066 3.8519 72 0.066 5.4462 76 0.066 6.6255
60 0.068 0 64 0.068 1.258 68 0.068 3.398 72 0.068 5.0745 76 0.068 6.3305
60 0.07 0 64 0.07 0.7053 68 0.07 2.9352 72 0.07 4.696 76 0.07 6.0305
60 0.072 0 64 0.072 0.1427 68 0.072 2.4645 72 0.072 4.3115 76 0.072 5.7264
60 0.074 0 64 0.074 0 68 0.074 1.9868 72 0.074 3.9219 76 0.074 5.4193
60 0.076 0 64 0.076 0 68 0.076 1.5032 72 0.076 3.5283 76 0.076 5.1101
60 0.078 0 64 0.078 0 68 0.078 1.0145 72 0.078 3.1316 76 0.078 4.7997
60 0.08 0 64 0.08 0 68 0.08 0.5217 72 0.08 2.7328 76 0.08 4.4891
62 0 7.1549 66 0 7.5419 70 0 7.6379 74 0 7.4857 78 0 7.128
62 0.002 7.49 66 0.002 7.9038 70 0.002 8.021 74 0.002 7.8842 78 0.002 7.5362
62 0.004 7.7818 66 0.004 8.2244 70 0.004 8.3647 74 0.004 8.2453 78 0.004 7.909
62 0.006 8.0314 66 0.006 8.5047 70 0.006 8.67 74 0.006 8.5699 78 0.006 8.2472
62 0.008 8.2396 66 0.008 8.7456 70 0.008 8.9378 74 0.008 8.859 78 0.008 8.5519
62 0.01 8.4075 66 0.01 8.9481 70 0.01 9.1692 74 0.01 9.1136 78 0.01 8.824
62 0.012 8.536 66 0.012 9.1131 70 0.012 9.365 74 0.012 9.3345 78 0.012 9.0644
62 0.014 8.626 66 0.014 9.2416 70 0.014 9.5263 74 0.014 9.5229 78 0.014 9.2741
62 0.016 8.6784 66 0.016 9.3345 70 0.016 9.6539 74 0.016 9.6795 78 0.016 9.454
62 0.018 8.6944 66 0.018 9.3927 70 0.018 9.7488 74 0.018 9.8054 78 0.018 9.6052
62 0.02 8.6747 66 0.02 9.4174 70 0.02 9.8121 74 0.02 9.9015 78 0.02 9.7285
62 0.022 8.6204 66 0.022 9.4093 70 0.022 9.8445 74 0.022 9.9688 78 0.022 9.8249
62 0.024 8.5324 66 0.024 9.3694 70 0.024 9.8471 74 0.024 10.0082 78 0.024 9.8954
62 0.026 8.4116 66 0.026 9.2988 70 0.026 9.8209 74 0.026 10.0207 78 0.026 9.9409
62 0.028 8.2591 66 0.028 9.1983 70 0.028 9.7668 74 0.028 10.0072 78 0.028 9.9624
62 0.03 8.0757 66 0.03 9.0689 70 0.03 9.6857 74 0.03 9.9687 78 0.03 9.9608
62 0.032 7.8624 66 0.032 8.9116 70 0.032 9.5786 74 0.032 9.9062 78 0.032 9.937
62 0.034 7.6202 66 0.034 8.7273 70 0.034 9.4464 74 0.034 9.8205 78 0.034 9.8921
62 0.036 7.3501 66 0.036 8.5169 70 0.036 9.2902 74 0.036 9.7127 78 0.036 9.827
62 0.038 7.0529 66 0.038 8.2815 70 0.038 9.1108 74 0.038 9.5836 78 0.038 9.7427
62 0.04 6.7296 66 0.04 8.0219 70 0.04 8.9092 74 0.04 9.4344 78 0.04 9.64
62 0.042 6.3813 66 0.042 7.7392 70 0.042 8.6864 74 0.042 9.2658 78 0.042 9.52
62 0.044 6.0087 66 0.044 7.4342 70 0.044 8.4434 74 0.044 9.0789 78 0.044 9.3835
62 0.046 5.613 66 0.046 7.108 70 0.046 8.1809 74 0.046 8.8746 78 0.046 9.2316
62 0.048 5.195 66 0.048 6.7615 70 0.048 7.9002 74 0.048 8.6538 78 0.048 9.0653
62 0.05 4.7557 66 0.05 6.3956 70 0.05 7.602 74 0.05 8.4176 78 0.05 8.8853
62 0.052 4.2961 66 0.052 6.0113 70 0.052 7.2873 74 0.052 8.1669 78 0.052 8.6928
62 0.054 3.817 66 0.054 5.6095 70 0.054 6.9571 74 0.054 7.9026 78 0.054 8.4887
62 0.056 3.3196 66 0.056 5.1912 70 0.056 6.6123 74 0.056 7.6256 78 0.056 8.2739
62 0.058 2.8046 66 0.058 4.7574 70 0.058 6.254 74 0.058 7.337 78 0.058 8.0493
62 0.06 2.2731 66 0.06 4.309 70 0.06 5.883 74 0.06 7.0377 78 0.06 7.816
62 0.062 1.7261 66 0.062 3.847 70 0.062 5.5003 74 0.062 6.7287 78 0.062 7.5749

80
62 0.064 1.1644 66 0.064 3.3723 70 0.064 5.1068 74 0.064 6.4108 78 0.064 7.3269
62 0.066 0.589 66 0.066 2.8858 70 0.066 4.7036 74 0.066 6.085 78 0.066 7.0729
62 0.068 0.0009 66 0.068 2.3886 70 0.068 4.2915 74 0.068 5.7524 78 0.068 6.8141
62 0.07 0 66 0.07 1.8815 70 0.07 3.8715 74 0.07 5.4138 78 0.07 6.5512
62 0.072 0 66 0.072 1.3656 70 0.072 3.4446 74 0.072 5.0703 78 0.072 6.2852
62 0.074 0 66 0.074 0.8417 70 0.074 3.0117 74 0.074 4.7227 78 0.074 6.0172
62 0.076 0 66 0.076 0.3109 70 0.076 2.5738 74 0.076 4.372 78 0.076 5.748
62 0.078 0 66 0.078 0 70 0.078 2.1319 74 0.078 4.0191 78 0.078 5.4787
62 0.08 0 66 0.08 0 70 0.08 1.6868 74 0.08 3.6651 78 0.08 5.2101
80 0 6.8855 84 0 6.2997 88 0 5.6152 92 0 4.8749 100 0 3.3975
80 0.002 7.2964 84 0.002 6.7118 88 0.002 6.0229 92 0.002 5.2723 100 0.002 3.7574
80 0.004 7.6729 84 0.004 7.0914 88 0.004 6.3999 92 0.004 5.6411 100 0.004 4.0926
80 0.006 8.0158 84 0.006 7.4394 88 0.006 6.7472 92 0.006 5.9821 100 0.006 4.4038
80 0.008 8.3261 84 0.008 7.7567 88 0.008 7.0659 92 0.008 6.2963 100 0.008 4.6922
80 0.01 8.6048 84 0.01 8.0443 88 0.01 7.3567 92 0.01 6.5847 100 0.01 4.9586
80 0.012 8.8528 84 0.012 8.3032 88 0.012 7.6208 92 0.012 6.8483 100 0.012 5.204
80 0.014 9.071 84 0.014 8.5343 88 0.014 7.859 92 0.014 7.088 100 0.014 5.4294
80 0.016 9.2605 84 0.016 8.7385 88 0.016 8.0723 92 0.016 7.3046 100 0.016 5.6358
80 0.018 9.4221 84 0.018 8.9169 88 0.018 8.2617 92 0.018 7.4993 100 0.018 5.824
80 0.02 9.5569 84 0.02 9.0703 88 0.02 8.4281 92 0.02 7.6729 100 0.02 5.995
80 0.022 9.6657 84 0.022 9.1997 88 0.022 8.5724 92 0.022 7.8264 100 0.022 6.1498
80 0.024 9.7496 84 0.024 9.3061 88 0.024 8.6956 92 0.024 7.9608 100 0.024 6.2893
80 0.026 9.8095 84 0.026 9.3905 88 0.026 8.7987 92 0.026 8.077 100 0.026 6.4145
80 0.028 9.8463 84 0.028 9.4537 88 0.028 8.8827 92 0.028 8.1759 100 0.028 6.5264
80 0.03 9.861 84 0.03 9.4968 88 0.03 8.9484 92 0.03 8.2586 100 0.03 6.6258
80 0.032 9.8546 84 0.032 9.5206 88 0.032 8.9968 92 0.032 8.3259 100 0.032 6.7138
80 0.034 9.8279 84 0.034 9.5262 88 0.034 9.0289 92 0.034 8.3788 100 0.034 6.7914
80 0.036 9.7821 84 0.036 9.5145 88 0.036 9.0457 92 0.036 8.4184 100 0.036 6.8593
80 0.038 9.7179 84 0.038 9.4864 88 0.038 9.048 92 0.038 8.4454 100 0.038 6.9187
80 0.04 9.6364 84 0.04 9.4429 88 0.04 9.0369 92 0.04 8.4609 100 0.04 6.9704
80 0.042 9.5384 84 0.042 9.385 88 0.042 9.0132 92 0.042 8.4659 100 0.042 7.0154
80 0.044 9.4251 84 0.044 9.3136 88 0.044 8.978 92 0.044 8.4612 100 0.044 7.0548
80 0.046 9.2973 84 0.046 9.2296 88 0.046 8.9323 92 0.046 8.4479 100 0.046 7.0893
80 0.048 9.156 84 0.048 9.1341 88 0.048 8.8768 92 0.048 8.4269 100 0.048 7.12
80 0.05 9.0021 84 0.05 9.028 88 0.05 8.8127 92 0.05 8.3991 100 0.05 7.1478
80 0.052 8.8365 84 0.052 8.9121 88 0.052 8.7409 92 0.052 8.3656 100 0.052 7.1737
80 0.054 8.6603 84 0.054 8.7875 88 0.054 8.6622 92 0.054 8.3272 100 0.054 7.1987
80 0.056 8.4744 84 0.056 8.6552 88 0.056 8.5778 92 0.056 8.2849 100 0.056 7.2236
80 0.058 8.2798 84 0.058 8.5161 88 0.058 8.4884 92 0.058 8.2396 100 0.058 7.2495
80 0.06 8.0773 84 0.06 8.3711 88 0.06 8.3952 92 0.06 8.1924 100 0.06 7.2773
80 0.062 7.868 84 0.062 8.2211 88 0.062 8.2989 92 0.062 8.1442 100 0.062 7.3079
80 0.064 7.6528 84 0.064 8.0672 88 0.064 8.2007 92 0.064 8.0958 100 0.064 7.3423
80 0.066 7.4327 84 0.066 7.9104 88 0.066 8.1014 92 0.066 8.0484 100 0.066 7.3815
80 0.068 7.2085 84 0.068 7.7514 88 0.068 8.0019 92 0.068 8.0028 100 0.068 7.4264
80 0.07 6.9814 84 0.07 7.5914 88 0.07 7.9033 92 0.07 7.9599 100 0.07 7.478
80 0.072 6.7521 84 0.072 7.4312 88 0.072 7.8066 92 0.072 7.9208 100 0.072 7.5371
80 0.074 6.5217 84 0.074 7.2719 88 0.074 7.7125 92 0.074 7.8864 100 0.074 7.6049
80 0.076 6.2912 84 0.076 7.1143 88 0.076 7.6222 92 0.076 7.8577 100 0.076 7.6822
80 0.078 6.0614 84 0.078 6.9594 88 0.078 7.5365 92 0.078 7.8355 100 0.078 7.7699
80 0.08 5.8333 84 0.08 6.8082 88 0.08 7.4565 92 0.08 7.8209 100 0.08 7.8691
82 0 6.6076 86 0 5.9671 90 0 5.2494 94 0 4.4971 98 0 3.7531
82 0.002 7.0198 86 0.002 6.3777 90 0.002 5.6526 94 0.002 4.8873 98 0.002 4.1245
82 0.004 7.3986 86 0.004 6.7567 90 0.004 6.0262 94 0.004 5.2498 98 0.004 4.4702
82 0.006 7.7447 86 0.006 7.1051 90 0.006 6.3711 94 0.006 5.5855 98 0.006 4.791

81
82 0.008 8.0593 86 0.008 7.4238 90 0.008 6.6883 94 0.008 5.8954 98 0.008 5.088
82 0.01 8.3431 86 0.01 7.7137 90 0.01 6.9786 94 0.01 6.1805 98 0.01 5.3621
82 0.012 8.5973 86 0.012 7.9759 90 0.012 7.2431 94 0.012 6.4416 98 0.012 5.6142
82 0.014 8.8226 86 0.014 8.2113 90 0.014 7.4828 94 0.014 6.6799 98 0.014 5.8453
82 0.016 9.0202 86 0.016 8.4208 90 0.016 7.6985 94 0.016 6.8961 98 0.016 6.0563
82 0.018 9.1909 86 0.018 8.6053 90 0.018 7.8912 94 0.018 7.0913 98 0.018 6.2483
82 0.02 9.3357 86 0.02 8.766 90 0.02 8.0619 94 0.02 7.2664 98 0.02 6.4221
82 0.022 9.4556 86 0.022 8.9035 90 0.022 8.2116 94 0.022 7.4224 98 0.022 6.5787
82 0.024 9.5514 86 0.024 9.0191 90 0.024 8.3411 94 0.024 7.5602 98 0.024 6.7191
82 0.026 9.6243 86 0.026 9.1135 90 0.026 8.4514 94 0.026 7.6807 98 0.026 6.8442
82 0.028 9.675 86 0.028 9.1878 90 0.028 8.5436 94 0.028 7.785 98 0.028 6.9549
82 0.03 9.7046 86 0.03 9.2429 90 0.03 8.6185 94 0.03 7.874 98 0.03 7.0523
82 0.032 9.714 86 0.032 9.2797 90 0.032 8.6771 94 0.032 7.9487 98 0.032 7.1373
82 0.034 9.7042 86 0.034 9.2993 90 0.034 8.7203 94 0.034 8.0099 98 0.034 7.2108
82 0.036 9.6761 86 0.036 9.3025 90 0.036 8.7491 94 0.036 8.0586 98 0.036 7.2738
82 0.038 9.6307 86 0.038 9.2904 90 0.038 8.7645 94 0.038 8.0959 98 0.038 7.3272
82 0.04 9.5689 86 0.04 9.2638 90 0.04 8.7675 94 0.04 8.1226 98 0.04 7.372
82 0.042 9.4917 86 0.042 9.2237 90 0.042 8.7588 94 0.042 8.1397 98 0.042 7.4092
82 0.044 9.4 86 0.044 9.1712 90 0.044 8.7396 94 0.044 8.1482 98 0.044 7.4396
82 0.046 9.2949 86 0.046 9.107 90 0.046 8.7108 94 0.046 8.149 98 0.046 7.4643
82 0.048 9.1771 86 0.048 9.0322 90 0.048 8.6733 94 0.048 8.143 98 0.048 7.4842
82 0.05 9.0478 86 0.05 8.9478 90 0.05 8.6281 94 0.05 8.1313 98 0.05 7.5003
82 0.052 8.9078 86 0.052 8.8547 90 0.052 8.5761 94 0.052 8.1148 98 0.052 7.5135
82 0.054 8.7582 86 0.054 8.7538 90 0.054 8.5183 94 0.054 8.0943 98 0.054 7.5247
82 0.056 8.5998 86 0.056 8.6461 90 0.056 8.4556 94 0.056 8.071 98 0.056 7.535
82 0.058 8.4336 86 0.058 8.5326 90 0.058 8.389 94 0.058 8.0457 98 0.058 7.5452
82 0.06 8.2606 86 0.06 8.4141 90 0.06 8.3195 94 0.06 8.0193 98 0.06 7.5564
82 0.062 8.0817 86 0.062 8.2918 90 0.062 8.2479 94 0.062 7.9929 98 0.062 7.5694
82 0.064 7.8978 86 0.064 8.1664 90 0.064 8.1754 94 0.064 7.9674 98 0.064 7.5853
82 0.066 7.71 86 0.066 8.039 90 0.066 8.1027 94 0.066 7.9438 98 0.066 7.605
82 0.068 7.5192 86 0.068 7.9106 90 0.068 8.0309 94 0.068 7.9229 98 0.068 7.6294
82 0.07 7.3263 86 0.07 7.782 90 0.07 7.9609 94 0.07 7.9058 98 0.07 7.6595
82 0.072 7.1323 86 0.072 7.6542 90 0.072 7.8937 94 0.072 7.8934 98 0.072 7.6962
82 0.074 6.9382 86 0.074 7.5282 90 0.074 7.8301 94 0.074 7.8867 98 0.074 7.7406
82 0.076 6.7448 86 0.076 7.405 90 0.076 7.7713 94 0.076 7.8866 98 0.076 7.7935
82 0.078 6.5532 86 0.078 7.2854 90 0.078 7.7181 94 0.078 7.894 98 0.078 7.8559
82 0.08 6.3643 86 0.08 7.1705 90 0.08 7.6715 94 0.08 7.91 98 0.08 7.9288
;
%let nlevels=8;
%let colors='black vibg cyan green lime gold orange red';
proc means data= VIKHUAN noprint min max;
var nhiet nongdo nsuat;
output out=range
min=nhietmin nongdomin nsuatmin
max=nhietmax nongdomax nsuatmax;
run;
data _null_;
set range;
call symput('nhietmin', nhietmin);
call symput('nhietmax', nhietmax);
call symput('nongdomin', nongdomin);
call symput('nongdomax', nongdomax);
call symput('nsuatmin', nsuatmin);
call symput('nsuatmax', nsuatmax);
call symput('floor', int(nsuatmin-4));
call symput('ceil', int(nsuatmax+2));

82
call symput('step', (nsuatmax- nsuatmin)/&nlevels);
run;
proc sort data= VIKHUAN;
by nhiet nongdo;
run;
data plane1 surf1;
length function color $ 8;
retain xsys ysys zsys '2';
drop nongdo nhiet nsuat ncol;
set VIKHUAN;
by nhiet;
x=nhiet; y=nongdo; z=&floor;
if first.nhiet then function='move';
else
do;
function='draw';
ncol=min(&nlevels,int(1+(nsuat-&nsuatmin)/&step));
color=scan(&colors,ncol);
end;
output plane1;
z=nsuat; output surf1;
run;

proc sort data= VIKHUAN;


by nongdo nhiet;
run;
data plane2 surf2;
length function color $ 8;
retain xsys ysys zsys '2';
drop nongdo nhiet nsuat ncol;
set VIKHUAN;
by nongdo;
x=nhiet; y=nongdo; z=&floor;
if first.nongdo then function='move';
else
do;
function='draw';
ncol=min(&nlevels,int(1+(nsuat-&nsuatmin)/&step));
color=scan(&colors,ncol);
end;
output plane2;
z=nsuat; output surf2;
run;
data legend;
length function color $ 8;
retain xsys ysys zsys '2';
drop legend ncol;
do legend=&nsuatmin to (&nsuatmax-&step) by &step;
x=&nhietmin; y=&nongdomax; z=legend;
function='poly'; style='solid';
ncol=min(&nlevels, int(1+(legend+(&step/2)-&nsuatmin)/&step));
color=scan(&colors,ncol); output;
z=legend+&step;
function='polycont'; output;
x=&nhietmin+(&nhietmax-&nhietmin)*.05; output;
z=legend; output;
end;
run;
data annoall;
set surf1 surf2 plane1 plane2 legend;
run;

83
data plotdata;
nhiet=&nhietmin; nongdo=&nongdomin; nsuat=&floor; output;
nhiet=&nhietmax; nongdo=&nongdomax; output;
run;
proc g3d data=plotdata;
scatter nongdo*nhiet=nsuat/rotate=40 xticknum=5 yticknum=5 zticknum=5
shape='point' zmin=&floor zmax=&ceil annotate=annoall;
label nongdo='Chat xuc tac(g)'
nhiet ='Nhiet do (do C)'
nsuat ='Nang suat sinh khoi(g)';
run;
quit;

Na n g s u a t s i nh khoi ( g)

12

- 4
0. 08
100
0. 06
90
0. 04 80
Ch at xuc t ac( g) 0. 02 70 Nh i e t do ( do C)
0. 00 60

Hình 4.4. Tương quan ba chiều và mặt phẳng năng suất sinh khối của vi khuẩn với nồng độ chất
xúc tác và nhiệt độ.

Tài liệu tham khảo

Tiếng Anh
Barnard, J., 1994. Computer Analysis of Standard Experimental Designs (with GENSTAT,
MINITAB, S, and SAS). New York State Agricultural Experiment Station, 115 pp.

84
Catala, M., 1993. Red Rice (Oryza sativa L.) Control In Rice Fields With The Puddling
Technique. Cahiers Options Méditerranéennes, vol. 15, no. 4, 143-146.
Clewer, A. G. and D. H. Scarisbrick, 2001. Practical Statistics and Experimental Design for
Plant and Crop Science. John Wiley & Sons, Ltd, 331 pp.
Filippi, M. C. and A. S. Prabhu, 1997. Integrated Effect of Host Plant Resistance and
Fungicidal Seed Treatment on Rice Blast Control in Brazil. Plant Disease, April 1997, 351.
Gomez, K. A. and A. A. Gomez , 1984. Statistical Procedures for Agricultural Research, 2nd
ed. Wiley, New York, 590-601.
Hasanuzzaman, M., 2008. Data analysis with MSTAT-C. AGRO 516 Lecture Sheet# 09. 4 pp.
Kuehl, R. O., 2000. Design of Experiments: Statistical Principles of Research Design and
Analysis. 2nd ed. 666 pp.
MSTAT Development Team, 1993. MSTATC, Computer Program for the Design,
Management and Analysis of Agromomic Research Experiment. Michigan State University,
152 pp.
NRCS (Natural Resource Conservation Service, USDA), 2007. Statistix 8 User Guide for the
Plant Materials Program, version 2.0, 80 pp.
Petersen, R.G., 1994. Agricultural Field Experiment. Marcel Dekker, Inc. USA, 409 pp.
Qu, L., X. Wang, Y. Chen, and R. Scalzo, 2005. Commercial Seed Lots Exhibit Reduced Seed
Dormancy in Comparison to Wild Seed Lots of Echinacea purpurea. Hort Science. October;
40(6): 1843–1845.
SAS. 2004. SAS/STAT User’s Guide 9.1, 5123 pp.
SAS Institute, 1999. SAS version 8. Cary, NC, USA.
Schabenberger, O., 2000. SAS Code for Some Advanced Experimental Designs. UCLA
Academic Technological Services.
Statistix 9, 2008. Statistical software.
Taa, A.; Tanner and A. T. P. Bennie, 2002. Effects of Stubble Management, Tillage and
Cropping Sequence on the Severity of Take-all and Eyespot Diseases of Wheat. African Crop
Science Journal, Vol. 10. No. 1, 67-79.
Tree Fruit Research and Extension Center , 2000. A Field Guide to Experimental Designs.
Washington State University.
Westfall, P. H., 2008. A Course in Multiple Comparisons and Multiple Tests. Texas Tech
University.

Tiếng Việt
Bùi Việt Hải, 2001. Phương pháp nghiên cứu khoa học và xử lý số liệu thực nghiệm. ĐH Nông
Lâm TP HCM, 135 tr.
Ngô Đằng Phong, Huỳnh Thị Thùy Trang, Nguyễn Duy Năng, 2003. Hướng dẫn sử dụng phần
mềm MSTATC trong phương pháp thí nghiệm nông nghiệp, 90 tr.
Phạm Chí Thành, 1976. Phương pháp thí nghiệm đồng ruộng. XN in Hà Nội, 264 tr.
Trịnh Công Thành, 2003. Ứng dụng SAS trong phân tích số liệu. ĐH Nông Lâm TP HCM,
304 tr.

85

You might also like