You are on page 1of 6

SỬ DỤNG SAS DỄ DÀNG

PGS.TS. Lê Quang Hưng


08/08/2019
Sử dụng SAS thật dễ dàng với thao tác Copy file word mẫu, Paste, Submit ( ) vào Program
Editor là có kết quả ngay trong Output. Lưu số liệu bằng thao tác copy từ Ouput hoặc save vào
word. File mẫu word bao gồm các câu lệnh ngắn, số liệu lưu trong bảng excel, copy và paste qua
dưới câu lệnh là được.
Bài này trình bày thao tác với xử lý thống kê mô tả và thí nghiệm cùng với giải thích kết quả xếp
hạng. Bài đăng của tác giả đầu tiên trên web là vào ngày 20/10/2018, với đề mục “SAS 2018
THỐNG KÊ THÍ NGHIỆM”, 114 tr pdf. Rất mong sự góp ý của quý đọc giả, xin liên hệ về:

PGS.TS. Lê Quang Hưng


Mail: lhung789@gmail.com
DĐ: 0918039117

1. Thống kê mô tả

Tính trung bình (MEAN), độ lêch chuẩn (STD), sai số chuẩn (STDERR) của hàm lượng Ni,
Pb, Cd, Zn (mg/kg) trong mẫu bùn cống.

Số liệu được thu thập, xử lý và lưu từ bảng file excel hay word. Copy số liệu từ nguyên bảng có
kẻ ô Excel hay word ngay dưới Câu lệnh nhập dữ liệu, chú ý tiếng Anh sửa lại dấu chấm (tiếng
Việt dấu phẩy).

DATA TEST; INPUT STT $ Ni Pb Cd Zn; CARDS; /* Câu lệnh nhập dữ liệu*/
1 11.4 55 1.24 895
2 12.2 58 1.19 994
3 17 68 1.4 1061
4 16 67 2.5 1095
5 34 68 0.9 998
6 28 62 2.4 810
; PROC MEANS DATA=TEST N MEAN STD STDERR;
VAR Ni Pb Cd Zn;
RUN; /*Câu lệnh xử lý*/

Copy file trên từ DATA đến RUN; và paste vào Program Editor của SAS, xử lý với với click
vào ở thanh bar trên cùng.
Xem kết quả trong Output. Lưu kết quả:
a) Chọn ouput, bôi đen, copy và paste vào Word mới. Nếu chạy hàng, chọn font 7.
b) Chọn File > Save as > Desktop > Save as type > RTF files > File name: 111 > OK.
Xem kết quả và giải thích.
Kết quả xử lý với SAS:
The MEANS Procedure
Variable N Mean Std Dev Std Error
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Ni 6 19.7666667 9.1594032 3.7393107
Pb 6 63.0000000 5.5856960 2.2803509
Cd 6 1.6050000 0.6749148 0.2755328
Zn 6 975.5000000 106.1220995 43.3241657
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

2. Phân tích phương sai và xếp hạng các nghiệm thức

2.1. Kiểu hoàn toàn ngẫu nhiên (CRD) 1 yếu tố

Thí nghiệm chất bảo quản dâu tây ảnh hưởng điểm đổi màu

Dâu tây được cho chất bảo quản (CBQUAN) và đóng gói để trữ lạnh 0oC trong 6 tháng. Có 4
nhóm, nhóm 1 là đối chứng (Dchung) không chất bảo quản, nhóm 2 đến 4 là 3 chất bảo quản
khác nhau (CBQ1, CBQ2, CBQ3). Mỗi nhóm có 8 gói. Tổng cộng 32 gói để ngẫu nhiên trong tủ
lạnh. Sau 6 tháng lấy ra tính điểm đổi màu (DIEM), thấp nhất là 1 điểm (ít đổi màu) đến cao nhất
là 10 điểm (đổi màu nhiều).
DATA; INPUT CBQUAN $ DIEM; CARDS;
Dchung 10
Dchung 8
Dchung 7.5
Dchung 8
Dchung 9.5
Dchung 9
Dchung 7.5
Dchung 7
CBQ1 6
CBQ1 7.5
CBQ1 8
CBQ1 7
CBQ1 6.5
CBQ1 6
CBQ1 5
CBQ1 5.5
CBQ2 3
CBQ2 5.5
CBQ2 4
CBQ2 4.5
CBQ2 3
CBQ2 3.5
CBQ2 4
CBQ2 4.5
CBQ3 2
CBQ3 1
CBQ3 2.5
CBQ3 3
CBQ3 4
CBQ3 3.5
CBQ3 2
CBQ3 2
; PROC ANOVA; CLASS CBQUAN; MODEL DIEM = CBQUAN; MEANS CBQUAN / LSD; MEANS CBQUAN /
LSD ALPHA = 0.01; MEANS CBQUAN / CLDIFF; TITLE ‘CHAT BAO QUAN DAU TAY’; RUN;

Kết quả xử lý với SAS:


R-Square Coeff Var Root MSE DIEM Mean
0.856422 18.37706 0.976281 5.312500
Source DF Anova SS Mean Square F Value Pr > F
CBQUAN 3 159.1875000 53.0625000 55.67 <.0001
Alpha 0.01
Error Degrees of Freedom 28
Error Mean Square 0.953125
Critical Value of t 2.76326
Least Significant Difference 1.3489
Means with the same letter are not significantly different.
t Grouping Mean N CBQUAN
A 8.3125 8 Dchung
B 6.4375 8 CBQ1
C 4.0000 8 CBQ2
D 2.5000 8 CBQ3

Giải thích:
Vì trong bảng Anova, xác suất của CBQUAN có Pr > F là < 0,0001, nên xếp hạng ở mức P <
0,01. Xếp hạng LSD thích hợp cho thí nghiệm có 5 nghiệm thức.

2.2. Kiểu khối hoàn toàn ngẫu nhiên (RCBD) 1 yếu tố

Thí nghiệm so sánh năng suất đậu phụng

Thí nghiệm khối hoàn toàn ngẫu nhiên (KHOI), so sánh năng suất đậu phụng Y (T/ha) với 8
nghiệm thức phân N (T, Treatment). Xếp hạng các nghiệm thức với LSD, DUNCAN, TUKEY ở
2 mức alpha = 0,05 và 0,01.

DATA; INPUT KHOI $ T $ Y; CARDS;


1 NT1 1.7
1 NT2 1.8
1 NT3 1.6
1 NT4 1.2
1 NT5 1.2
1 NT6 1.3
1 NT7 1.4
1 NT8 1.2
2 NT1 1.9
2 NT2 1.7
2 NT3 1.6
2 NT4 1.3
2 NT5 1.2
2 NT6 1.5
2 NT7 1.3
2 NT8 1.5
3 NT1 1.7
3 NT2 1.9
3 NT3 1.5
3 NT4 1.2
3 NT5 1.3
3 NT6 1.1
3 NT7 1.3
3 NT8 1.2

;PROC ANOVA; CLASS KHOI T; MODEL Y = KHOI T;


MEANS T /LSD DUNCAN TUKEY; MEANS T /LSD DUNCAN TUKEY ALPHA=0.01; RUN;

Kết quả xử lý với SAS:


R-Square Coeff Var Root MSE Y Mean
0.876663 7.643558 0.110195 1.441667
Source DF Anova SS Mean Square F Value Pr > F
KHOI 2 0.04333333 0.02166667 1.78 0.2040
T 7 1.16500000 0.16642857 13.71 <.0001
Alpha 0.01
Error Degrees of Freedom 14
Error Mean Square 0.012143
Critical Value of t 2.97684
Least Significant Difference 0.2678
Means with the same letter are not significantly different.
t Grouping Mean N T
A 1.80000 3 NT2
A
A 1.76667 3 NT1
A
B A 1.56667 3 NT3
B
B C 1.33333 3 NT7
B C
B C 1.30000 3 NT8
B C
B C 1.30000 3 NT6
C
C 1.23333 3 NT5
C
C 1.23333 3 NT4
Alpha 0.01
Error Degrees of Freedom 14
Error Mean Square 0.012143
Number of Means 2 3 4 5 6 7 8
Critical Range .2678 .2793 .2868 .2921 .2961 .2992 .3017
Means with the same letter are not significantly different.
Duncan Grouping Mean N T
A 1.80000 3 NT2
A
A 1.76667 3 NT1
A
B A 1.56667 3 NT3
B
B C 1.33333 3 NT7
B C
B C 1.30000 3 NT8
B C
B C 1.30000 3 NT6
C
C 1.23333 3 NT5
C
C 1.23333 3 NT4
Alpha 0.01
Error Degrees of Freedom 14
Error Mean Square 0.012143
Critical Value of Studentized Range 6.25827
Minimum Significant Difference 0.3982
Means with the same letter are not significantly different.
Tukey Grouping Mean N T
A 1.80000 3 NT2
A
A 1.76667 3 NT1
A
B A 1.56667 3 NT3
B
B 1.33333 3 NT7
B
B 1.30000 3 NT8
B
B 1.30000 3 NT6
B
B 1.23333 3 NT5
B
B 1.23333 3 NT4

Giải thích:
Vì trong bảng Anova, xác suất của T có Pr > F là < 0,0001, nên xếp hạng ở mức P < 0,01. Xếp
hạng của LSD và Duncan có ký tự giống nhau là 3 nhóm A, B, C. Vì LSD = 0,2678 giống như
dãy Duncan bắt đầu như LSD là .2678 (0,2678) sau đó cộng dồn khi tăng nghiệm thức đến 8 là
0,3017 nhưng không đủ tạo khác biệt. Do đó Tukey có MSD là 0,3982 đủ tạo sự khác biệt, xếp 2
nhóm là A và B. Xếp hạng Tukey phù hợp nhất cho thí nghiệm này.
2.3. Kiểu thí nghiệm phức tạp (complex experiment)
Vài thí nghiệm là lô phụ (Split Plot), lô sọc (Strip Plot), lô phụ của lô phụ (Split Split Plot), lô
phụ của lô sọc (Strip Split plot). Đối với các thí nghiệm này, sơ đồ bố trí thí nghiệm thì dễ cho
theo dõi, nhưng phân tích tương tác để xếp hạng theo ký tự cần chú ý:
- Lô phụ: có 4 LSD.
- Lô sọc: có 5 LSD.
- Lô phụ của lô phụ: có 12 LSD.
- Lô phụ của lô sọc: có 14 LSD.
Có thể tham khảo trang 58-80 trong tài liệu tham khảo.

Tài liệu tham khảo


Lê Quang Hưng, 2018. Phân tích thống kê thí nghiệm với SAS. 58-80.
https://hunglequang.blogspot.com/2019/

You might also like