You are on page 1of 8

T.

TEST ĐỘC LẬP

Điều kiện: Số liệu mỗi nhóm phải tuân theo PPC

setwd("D:/bai tap R")

library(readxl)

> bt<-read_excel("t3bt1.xlsx")

> bt

# A tibble: 12 × 9: 12 hàng, 9 cột

id transect vegtype season BA BDW BL BW SLA

<dbl> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>

1 1B F 13wet 36.5 0.38 12.8 4.01 95.9

2 2B F 13wet 39.9 0.45 13.3 4.29 88.8

3 3B F 13wet 18.1 0.15 9.02 2.96 121.

4 4B F 14dry 62.3 0.72 15.7 5.65 86.5

5 5B F 14dry 35.7 0.35 12.4 4.25 102.

6 6B F 14dry 22.0 0.22 9.48 3.31 99.8

7 7B O 13wet 42.3 0.67 14.7 4.03 63.1

8 8B O 13wet 36.4 0.57 13.1 3.98 63.9

9 9B O 13wet 43.6 0.64 13.4 4.52 68.1

10 10 B O 14dry 36.9 0.66 12.2 4.18 55.9

11 11 B O 14dry 35.1 0.68 11.3 4.18 51.6

12 12 B O 14dry 41.1 0.92 13.3 4.39 44.7


> str(bt)

tibble [12 × 9] (S3: tbl_df/tbl/data.frame)

$ id : num [1:12] 1 2 3 4 5 6 7 8 9 10 ... biến định lượng liên tục

$ transect: chr [1:12] "B" "B" "B" "B" ...

$ vegtype : chr [1:12] "F" "F" "F" "F" ...

$ season : chr [1:12] "13wet" "13wet" "13wet" "14dry" ...

$ BA : num [1:12] 36.5 39.9 18.1 62.3 35.7 ...

$ BDW : num [1:12] 0.38 0.45 0.15 0.72 0.35 0.22 0.67 0.57 0.64 0.66 ...

$ BL : num [1:12] 12.84 13.27 9.03 15.71 12.4 ...

$ BW : num [1:12] 4.01 4.29 2.96 5.65 4.25 ...

$ SLA : num [1:12] 95.9 88.8 120.7 86.5 101.9 ...

Num: biến định lượng

> attach(bt)

Câu hỏi nghiên cứu: So sánh phương sai diện tích phiến lá Đước đôi BA giữa vùng
nguyên trạng F và vùng gãy đổ O

So sánh nguyên trạng F và vùng gãy đổ O => t.test

y: khó xác định: BA ( diện tích phiến lá đước đôi)- khó đo- định lượng liên tục

X: dễ xác định: kiểu sinh cảnh, kiểu rừng(F và O)- vegtype- biến định tính

Đây là số liệu độc lập, lá trên các cây thu được khác nhau

Phương pháp kiểm định: t.test độc lập

Đặt giả thiết:

H0: Số liệu biến BA của vùng nguyên trạng F tuân theo phân phối chuẩn.
H1: Số liệu biến BA của vùng nguyên trạng F không tuân theo phân phối chuẩn.

> baf<-subset(bt$BA, vegtype == "F") Trích số liệu

> baf

[1] 36.456 39.948 18.100 62.300 35.664 21.954

> library(pastecs)

> stat.desc(x = baf, basic = T, desc = T, norm = T, p = 0.95)

nbr.val nbr.null nbr.na min max

6.0000000 0.0000000 0.0000000 18.1000000 62.3000000

range sum median mean SE.mean

44.2000000 214.4220000 36.0600000 35.7370000 6.3897904

CI.mean.0.95 var std.dev coef.var skewness

16.4254791 244.9765276 15.6517260 0.4379698 0.4656691

skew.2SE kurtosis kurt.2SE normtest.W normtest.p

0.2754936 -1.2475447 -0.3583299 0.9184195 0.4940510

THỐNG KÊ MÔ TẢ:

Trung bình = 35,74 (cm2)

Độ lệch chuẩn = 15,65 (cm2)

Phân phối chuẩn của số liệu:

Kết quả phân tích Shapiro – Wilk test cho thấy biến tuân theo phân phối chuẩn (W = 0,92 ; p -
value = 0,49 > 0,05). Các giá trị Skewness = 0,47 ; Kurtosis = -1,25 ; Kurt.2SE = -0,36 ;
Skew.2SE = 0,28

Đặt giả thiết:

H0: Số liệu biến BA của vùng gãy đổ O tuân theo phân phối chuẩn.
H1: Số liệu biến BA của vùng gãy đổ O không tuân theo phân phối chuẩn.

> bao<-subset(bt$BA, vegtype == "O")

> bao

[1] 42.253 36.426 43.559 36.915 35.091 41.139

> stat.desc(x = bao, basic = T, desc = T, norm = T, p = 0.95)

nbr.val nbr.null nbr.na min max

6.00000000 0.00000000 0.00000000 35.09100000 43.55900000

range sum median mean SE.mean

8.46800000 235.38300000 39.02700000 39.23050000 1.43615240

CI.mean.0.95 var std.dev coef.var skewness

3.69174727 12.37520230 3.51784057 0.08967106 0.03926831

skew.2SE kurtosis kurt.2SE normtest.W normtest.p

0.02323145 -2.09455404 -0.60161485 0.89775906 0.36085347

THỐNG KÊ MÔ TẢ

Trung bình = 39,23 (cm2)

Độ lệch chuẩn = 3,52 (cm2)

Phân phối chuẩn của số liệu:

Kết quả phân tích Shapiro – Wilk test cho thấy biến tuân theo phân phối chuẩn (W = 0,90 ; p -
value = 0,36 > 0,05. Các giá trị Skewness = 0,04 ; Kurtosis = -2,09 ; Kurt.2SE = -0,60 ;
Skew.2SE = 0,02.

Tuân theo PPC là điều kiện cần để dùng t.test độc lập

> boxplot(BA~as.factor(vegtype), col = 2:3, data = bt, ylab="Dien tich phien la Duoc doi
(cm2)", xlab = "Kieu sinh canh", main = "Boxplot dien tich phien la Duoc doi giua F va O",
cex.lab= 1.5, col.black="black")
Đồ thị có tên là MSSV- tên, màu đồ thị rõ ràng để thấy đường trung vị

D ie n tic h p h ie n la D u o c d o i (c m 2 ) Boxplot dien tich phien la Duoc doi giua F va O

60
50
40
30
20

F O

Kieu sinh canh

Nhận xét về đồ thị:

Đa số lá ở vùng nguyên trạng F có kích thước nhỏ (màu đỏ nằm tương đối thấp)

Diện tích phiến lá Đước đôi ở vùng nguyên trạng có độ lệch kích thước cao hơn so với vùng
gãy đổ (SD)

Khi tịnh tiến F và O có thể chồng lên nhau

Phương sai: Đồng hay dị phương sai

Kiểm định phương sai

Đặt giả thiết:

Ho: 2 phương sai không khác biệt: đồng phương sai- p-value> 0,05
H1: 2 phương sai có sự khác biệt: dị phương sai

Ý nghĩa: Xác định dị hay đồng PS


> var.test(baf, bao, alternative = "two.sided", conf.level = 0.95)

F test to compare two variances

data: baf and bao

F = 19.796, num df = 5, denom df = 5, p-value = 0.005228

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

2.770039 141.468055

sample estimates:

ratio of variances

19.79576

p-value=0,005< alpha= 0,05=> Nhận H1: có sự khác biệt rõ rệt

Welch Two Sample t-test

data: baf and bao

t = -0.53342, df = 5.5039, p-value = 0.6146

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-19.87556 12.88856 do baf là x, bao là y nên dấu âm ở trước

sample estimates:

mean of x mean of y
35.7370 39.2305

p-value= 0,61> alpha=0,05

 Chấp nhận H0: không có sự khác biệt


Về mặt sinh học: lá ở vùng nguyên trạng có diện tích lớn hơn => số liệu sai do thiết kế thí
nghiệm

> t.test(baf, bao, paired = F, var.equal = F, alternative = "greater", conf.level = 0.95)

Welch Two Sample t-test

data: baf and bao

t = -0.53342, df = 5.5039, p-value = 0.6927

alternative hypothesis: true difference in means is greater than 0

95 percent confidence interval:

-16.42819 Inf

sample estimates:

mean of x mean of y

35.7370 39.2305

> t.test(baf, bao, paired = F, var.equal = F, alternative = "less", conf.level = 0.95)

Welch Two Sample t-test


data: baf and bao

t = -0.53342, df = 5.5039, p-value = 0.3073

alternative hypothesis: true difference in means is less than 0

95 percent confidence interval:

-Inf 9.441191

sample estimates:

mean of x mean of y

35.7370 39.2305

> detach(bt)

Kết luận

So sánh 2 phương sai:

- Kết quả kiểm định phương sai cho thấy phương sai biến BA của vùng nguyên trạng F
(SD = 15,65 ) có sự khác biệt rõ rệt với vùng gãy đổ O ( SD = 3,52 ) (F = 19,80 ; P-value
= 0,01 < alpha = 0,05 ; two-sided) với 95% C.I. = [ 2,77; 141,47].

t.test hai nhóm độc lập:

- Kết quả phân tích t.test hai nhóm độc lập cho thấy biến BA của vùng nguyên trạng F
(mean = 35,74 ; SD = 15,65 ) so với vùng gãy đổ O (mean = 39,23 ; SD = 3,52) không
có sự khác biệt rõ rệt (df = 5,50 ; t = -0,53 ; P-value = 0,61 > alpha = 0,05; two-sided)
với 95% C.I. = [ -19,88; 12,89].

You might also like