You are on page 1of 48

HOMEWORK 3.

1 TỔNG 43Đ
Bài 6.5 Phòng khảo thí của 1 trường đại học muốn kiểm định xem việc áp dụng 1
phương pháp học tập mới có mang lại hiệu quả không nên đã quan sát ngẫu
nhiên một số sinh viên trước và sau khi áp dụng phương pháp học tập mới thì
thu được kết quả học tập sau: (2đ)

Kết quả học tập trước khi áp


6,4 6,8 6,3 7,3 6,9 8,2 7,8 8,3
dụng pp mới (A)

Kết quả học tập sau khi áp


6,8 7,3 6,5 7,3 7,2 8,2 7,9 8,4
dụng pp mới (B)

a) Theo bạn nên sử dụng kiểm định phi tham số nào để kiểm định xem phương
pháp học tập mới có mang lại hiệu quả không ? Tại sao ?

nên sử dụng kiểm định dấu và hạng Wilconxon trên mẫu cặp để kiểm định xem
phương pháp học tập mới có mang lại hiệu quả không. Vì

- đề bài không giả định là “tuân theo phân phối chuẩn” => kiểm định phi tham số
- cỡ mẫu là n = 8 < 20 => sử dụng Wilconxon W0
- dữ liệu này thu thập trên 2 nhóm tính chất (kết quả học tập trước và sau khi áp
dụng phương pháp học tập mới) của 1 biến Sinh viên => Wilconxon trên mẫu
cặp

b) Với mức ý nghĩa 3% hãy kiểm định phương pháp học tập mới có mang lại
hiệu quả không ?

Cặp giả thuyết:

H0: phương pháp học tập mới không mang lại hiệu quả

H1: phương pháp học tập mới có mang lại hiệu quả

H0: Med dX ≤ 0

H1: Med dX > 0

Trong đó:
+ Med Xa là giá trị trung vị về kết quả học tập trước khi áp dụng phương pháp
mới
+ Med Xb là giá trị trung vị về kết quả học tập sau khi áp dụng phương pháp mới
+ Med dX = Med Xb - Med Xa

Kết quả tính toán:

kiểm định 1 phía (phải) W0 = {𝑡ổ𝑛𝑔 ℎạ𝑛𝑔 𝑅 +} = 21

tra bảng Wilconxon ta có W(0,03;6) = (0,4;20, 6)

21 > 20,6 => bác bỏ H0

Với mức ý nghĩa 3%, phương pháp học tập mới có mang lại hiệu quả.
dùng spss, p_value = 0,027 < 0,03

bác bỏ giả thuyết H0, chấp nhận H1

Với mức ý nghĩa 3%, phương pháp học tập mới có mang lại hiệu quả.

Bài 6.6 Bộ phận chăm sóc khách hàng của 1 công ty muốn đánh giá về mức độ
hài lòng của dịch vụ chăm sóc khách hàng nên đã khảo sát ngẫu nhiên 9 khách
hàng về câu hỏi “Bạn hãy cho biết mức độ hài lòng với dịch vụ chăm sóc khách
hàng của chúng tôi? “ thì thu được bảng số liệu sau: (2đ)

Khách hàng 1 2 3 4 5 6 7 8 9

Điểm hài lòng 7 8 6 9 6 7 8 7 10

a) Theo bạn kiểm định nào sẽ được sử dụng để đánh giá về mức độ hài lòng của
khách hàng ? Tại sao?

Kiểm định dấu và hạng Wilconxon trên 1 mẫu sẽ được sử dụng để đánh giá về mức độ
hài lòng của khách hàng. Vì:

- đề bài không giả định “tuân theo phân phối chuẩn” => kiểm định phi tham số
- cỡ mẫu n = 9 < 20 => sử dụng Wilconxon (n > 20 thì sử dụng Z)
- dữ liệu thu thập chỉ có 1 nhóm tính chất (mức độ hài lòng) của biến Khách
hàng => Wilconxon trên 1 mẫu

b) Giám đốc công ty thông báo rằng bộ phận chăm sóc khách hàng của công ty
chỉ được thưởng nếu điểm hài lòng ít nhất là 7,5. Với mức ý nghĩa 4% bạn hãy
cho biết bộ phận chăm sóc khách hàng của công ty có được thưởng không ?
Cặp giả thuyết:
H0: bộ phận chăm sóc khách hàng của công ty sẽ được thưởng nếu điểm hài lòng ít
nhất là 7,5
H1: bộ phận chăm sóc khách hàng của công ty sẽ không được thưởng nếu điểm hài
lòng thấp hơn 7,5
H0: Med X ≥ 7, 5
H1: Med X < 7,5
Kết quả tính toán:

kiểm định 1 phía (trái) W0 = {𝑡ổ𝑛𝑔 ℎạ𝑛𝑔 𝑅 −} = 23


giá trị tra bảng Wilconxon W (0,04;9) = (6,8;38,2)
23 > 6, 8 => chấp nhận H0
Với mức ý nghĩa 4%, bộ phận chăm sóc khách hàng của công ty sẽ được thưởng
Hoặc sử dụng Stata được kết quả như hình dưới:

dùng stata, P_value = 0.9517 > α = 4%


=> chấp nhận H0
Với mức ý nghĩa 4%, bộ phận chăm sóc khách hàng của công ty sẽ được thưởng
HOMEWORK 3.2

Bài 6.3 Để khảo sát về mức độ hài lòng của môn học Thống kê ứng dụng ở 2 lớp
K13404 và K13405 có sự khác biệt không người ta đã chọn ngẫu nhiên 1 số sinh
viên ở hai lớp và hỏi về mức độ hài lòng với câu hỏi: “ Bạn hãy đánh giá về mức
độ hài lòng môn học Thống kê ứng dụng? “ (ghi rõ điểm số) thì thu được bảng số
liệu sau: (2đ)

K13404 (2) 5 3 4 4 3 4 3 3

K13405 (1) 4 3 4 2 3 4

a) Theo bạn nên sử dụng kiểm định nào cho việc tìm hiểu có hay không sự khác
biệt về mức độ hài lòng giữa 2 lớp.

Nên sử dụng kiểm định tổng và hạng Wilconxon cho việc tìm hiểu có hay không sự
khác biệt về mức độ hài lòng giữa 2 lớp. Vì:

+ đề bài không giả định “tuân theo phân phối chuẩn” => kiểm định phi tham số
+ n = 14 < 20 => kiểm định Wilconxon
+ đây là bài toán về sự khác biệt giữa hai tổng thể (K13404 và K13405) trên cùng
1 dấu hiệu định tính (mức độ hài lòng) => kiểm định tổng và hạng Wilconxon

b) Với mức ý nghĩa 5% bạn hãy kiểm định về giả thuyết cho rằng không có sự
khác biệt về mức độ hài lòng giữa 2 lớp.
cặp giả thuyết:
H0: không có sự khác biệt về mức độ hài lòng giữa 2 lớp
H1: có sự khác biệt về mức độ hài lòng giữa 2 lớp
H0: Med 1 = Med 2
H1: Med 1 ≠ 𝑀𝑒𝑑 2

K13404 K13405 Mẫu kết Hạng của mẫu Hạng của Hạng của
STT (2) (1) hợp kết hợp mẫu 2 mẫu 1

1 5 4 5 14 14
2 3 3 3 4,5 4,5

3 4 4 4 10,5 10,5

4 4 2 4 10,5 10,5

5 3 3 3 4,5 4,5

6 4 4 4 10,5 10,5

7 3 3 4,5 4,5

8 3 3 4,5 4,5

4 10,5 10,5

3 4,5 4,5

4 10,5 10,5

2 1 1

3 4,5 4,5

4 10,5 10,5

Tổng 105 63,5 41,5

T0= tổng hạng của K13405 = 41,5


Giá trị tra bảng W(0.025; 6;8) = (29;61) => T0 ∊ W
=> Chấp nhận H0.
Nghĩa là với mức ý nghĩa 5% thì không có sự khác biệt về mức độ hài lòng giữa hai
lớp.
Hoặc sử dụng SPSS thì ta có kết quả sau:
dùng spss, p_value = 0,623 > α = 0, 05
=> Chấp nhận H0. Nghĩa là với mức ý nghĩa 5% thì không có sự khác biệt về mức độ
hài lòng giữa hai lớp.

HOMEWORK 3.3

BÀI 12.49 The following information is available for two samples selected from
independent populations: (1đ)

Sample 1: Assigned ranks: n1 = 7 4 1 8 2 5 10 11


Sample 2: Assigned ranks: n2 = 9 7 16 12 9 3 14 13 6 15
What is the value of T1 if you are testing the null hypothesis H0: M1 = M2?

n1+n2 4 1 8 2 5 10 11 7 16 12 9 3 14 13 6 15 Tổng

Hạng n1 4 1 8 2 5 10 11 41

Hạng n2 7 16 12 9 3 14 13 6 15 95
T1 = 4 + 1 + 8 + 2 + 5 + 10 + 11 = 41
Hoặc sử dụng SPSS để tính toán:

T1 = 41 (vì n1 < n2 => chọn hạng của n1)

BÀI 12.50 In Problem 12.49, what are the lower- and upper-tail critical values for
the test statistic T1 from Table E.6 if you use a 0.05 level of significance and the
alternative hypothesis is H1: M1 ≠ M2? (1đ)

W(0,025;7;9) = (40;79)
the lower-tail critical value is 40
the upper-tail critical value is 79

BÀI 12.51 In Problems 12.49 and 12.50, what is your statistical decision? (1đ)

T1 ∈ (40;79) hoặc p_value = 0,050000…..> α = 0, 05


Chấp nhận giả thuyết H0: M1 = M2
Kết luận: Với mức ý nghĩa 5%, không có sự khác biệt giữa hai mẫu.
BÀI 12.52 The following information is available for two samples selected from
independent and similarly shaped right skewed populations: (4đ)

Sample 1: n1 = 5 1.1 2.3 2.9 3.6 14.7


Sample 2: n2 = 6 2.8 4.4 4.4 5.2 6.0 18.5
a. Replace the observed values with the corresponding ranks (where 1 = smallest
value; n = n1 + n2 = 11 = largest value) in the combined samples.
b. What is the value of the test statistic T1
c. Compute the value of T2, the sum of the ranks in the larger sample.
d. To check the accuracy of your rankings, use Equation (12.8) on page 495 to
demonstrate that:
𝑛(𝑛+1)
T1 + T2 = 2

a/

n 1.1 2.3 2.8 2.9 3.6 4.4 4.4 5.2 6.0 14.7 18.5 Tổng

Rank n1 1 2 4 5 10 22

Rank n2 3 6.5 6.5 8 9 11 44


b/ The value of the test statistic T1 is 22

c/ The value of T2 is 44

d/ Sum of Rank n = 22 + 44 = 66
11 (11+1)
Equation 12.8 = 2
= 66
𝑛(𝑛+1)
=> 𝑇1 + 𝑇2 = 2
is correct

BÀI 12.53 From Problem 12.52, at the 0.05 level of significance, determine the
lower-tail critical value for the Wilcoxon rank sum test statistic, T1, if you want
to test the null hypothesis, H0: 𝑀1 ≥ 𝑀2, against the one-tail alternative, H1:

(1đ)

𝑀1 < 𝑀2

T0 = T1 = 22
W(0,05;5;6) = (20;40)
The lower-tail critical value for the Wilcoxon rank sum test statistic is 20
𝑇0 > 20

Chấp nhận giả thuyết H0: 𝑀1 ≥ 𝑀2

Hoặc P_value = 0,143 > α = 0, 05


Chấp nhận giả thuyết H0: 𝑀1 ≥ 𝑀2

BÀI 12.54 In Problems 12.52 and 12.53, what is your statistical decision? (1đ)

Chấp nhận giả thuyết H0: 𝑀1 ≥ 𝑀2

BÀI 12.55 A vice president for marketing recruits 20 college graduates for
management training. Each of the 20 individuals is randomly assigned, 10 each,
to one of two groups. A “traditional” method of training (T) is used in one group,
and an “experimental method (E) is used in the other. After the graduates spend
six months on the job, the vice president ranks them on the basis of their
performance, from 1 (worst) to 20 (best), with the following results (stored in the
file TestRank) (1đ)

Is there evidence of a difference in the median performance between the two


methods? (Use α = 0, 05 )
cặp giả thuyết:
H0: không có sự khác biệt trong hiệu suất giữa hai phương pháp
H1: có sự khác biệt trong hiệu suất giữa hai phương pháp
𝐻0: 𝑀𝑒𝑑𝑇 = 𝑀𝑒𝑑𝐸

𝐻1: 𝑀𝑒𝑑𝑇 ≠ 𝑀𝑒𝑑𝐸

T+E 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total

Rank T 1 2 3 5 9 10 12 13 14 15 84
Rank E 4 6 7 8 11 16 17 18 19 20 126

W(0,025;10;10) = (78;132)
𝑇0 ∈ (78; 132)

=> chấp nhận giả thuyết H0

P_value = 0,112 > α = 0, 05


=> chấp nhận giả thuyết 𝐻0

Với mức ý nghĩa 5%, không có sự khác biệt trong hiệu suất giữa hai phương pháp
truyền thống (traditional method) và thực nghiệm (experimental method)
BÀI 12.56 Wine experts Gaiter and Brecher use a six-category scale when rating
wines: Yech, OK, Good, Very Good, Delicious, and Delicious! (Data extracted
from D. Gaiter and J. Brecher, “A Good U.S. Cabernet Is Hard to Find,” The
Wall Street Journal, May 19, 2006, p. W7.) Suppose Gaiter and Brecher tested a
random sample of eight inexpensive California Cabernets and a random sample
of eight inexpensive Washington Cabernets. Inexpensive is defined as a suggested
retail value in the United States of under $20. The data, stored in Cabernet, are
as follows: (3đ)

a. Are the data collected by rating wines using this scale nominal, ordinal,
interval, or ratio?
The data are collected by rating wines using this scale ordinal (thang đo thứ bậc). Bởi
vì nó là dữ liệu định tính nhưng có tính hơn kém nhau, xếp hạng được

b. Why is the two-sample t test defined in Section 10.1 inappropriate to test the
mean rating of California Cabernets versus Washington Cabernets?
Không sử dụng kiểm định dấu và hạng Wilconxon trên mẫu cặp mà sử dụng kiểm
định tổng và hạng Wilconxon vì đây là 2 đối tượng (2 mẫu) khác nhau: California
Cabernets và Washington Cabernets với cùng 1 tính chất là đánh giá độ ngon của rượu
trên 6 bậc, còn kiểm định dấu và hạng Wilconxon trên mẫu cặp thì phải là 1 mẫu - 2
tính chất.

c. Is there evidence of a significant difference in the median rating of California


Cabernets and Washington Cabernets? (Use α = 0, 05 )
Gọi rating of California Cabernets is 1, rating of Washington Cabernets is 2
cặp giả thuyết:
H0: Không có sự khác biệt trong xếp hạng của California Cabernets và Washington
Cabernets
H1: Có sự khác biệt trong xếp hạng của California Cabernets và Washington
Cabernets
𝐻0: 𝑀𝑒𝑑1 = 𝑀𝑒𝑑2

𝐻1: 𝑀𝑒𝑑1 ≠ 𝑀𝑒𝑑2

T0 = 47 hoặc 89 (cả hai đều được do có n đều bằng nhau)


W(0,025;8;8) = (49;87)
T0 ∉ (49; 87)
bác bỏ H0, chấp nhận H1

p_value = 0,025 < α = 0, 05


bác bỏ H0, chấp nhận H1
Với mức ý nghĩa 5%, có sự khác biệt đáng kể trong xếp hạng của California Cabernets
và Washington Cabernets
BÀI 12.57 A problem with a telephone line that prevents a customer from
receiving or making calls is upsetting to both the customer and the telephone
company. The file Phone contains samples of 20 problems reported to two
different offices of a telephone company and the time to clear these problems (in
minutes) from the customers’ lines: (3đ)

văn phòng 1:

văn phòng 2

a. Is there evidence of a difference in the median time to clear problems between


offices? (Use α = 0, 05 )
cặp giả thuyết:
H0: không có sự khác biệt về thời gian để giải quyết vấn đề giữa các văn phòng
H1: có sự khác biệt về thời gian để giải quyết vấn đề giữa các văn phòng
𝐻0: 𝑀𝑒𝑑1 = 𝑀𝑒𝑑2

𝐻1: 𝑀𝑒𝑑1 ≠ 𝑀𝑒𝑑2


Kết quả từ SPSS như hình trên
P_value = 0,507 > α = 5%
Chấp nhận giả thuyết H0.
Với mức ý nghĩa 5%, không có sự khác biệt về thời gian để giải quyết vấn đề giữa các
văn phòng 1 và 2

b. What assumptions must you make in (a)?


+ không có giả thiết tuân theo phân phối chuẩn
+ cần so sánh xem có hay không sự khác biệt giữa giá trị trung bình trên tổng thể
1 và 2 trên cùng 1 dấu hiệu định tính

c. Compare the results of (a) with those of Problem 10.9(a) on page 375.
10.9 a/ Assuming that the population variances from both offices are equal, is there
evidence of a difference in the mean waiting time between the two offices?
Hai kết quả giống nhau. Ở câu 10.9 a là tính giá trị trung bình (nhưng có giả định tuân
theo phân phối chuẩn - phương sai bằng nhau) nên cũng giống như tính Med ở bài
12.57a.
Kết quả từ SPSS của câu 10.9a như hình dưới:
𝐻0: µ0 = µ1
𝐻1: µ0 < µ1

P_value = 0,725 > α = 5%


=> chấp nhận H0.
The results of (a) with those of Problem 10.9(a) on page 375 is similar

HOMEWORK 3.5

BÀI 12.65 A pet food company has the business objective of expanding its
product line beyond its current kidney- and shrimp-based cat foods. The
company developed two new products—one based on chicken livers and the
other based on salmon. The company conducted an experiment to compare the
two new products with its two existing ones as well as a generic beef-based
product sold in a supermarket chain. (3đ)

For the experiment, a sample of 50 cats from the population at a local animal
shelter was selected. Ten cats were randomly assigned to each of the five products
being tested. Each of the cats was then presented with 3 ounces of the selected
food in a dish at feeding time. The researchers defined the variable to be
measured as the number of ounces of food that the cat consumed within a
10-minute time interval that began when the filled dish was presented. The
results for this experiment are summarized in the following table and stored in
Cat Food
a. At the 0.05 level of significance, is there evidence of a significant difference in
the median amount of food eaten among the various products?
Gọi: 1 = Kidney; 2 = Shrimp; 3 = Chicken Liver; 4 = Salmon; 5 = Beef
cặp giả thuyết
H0: không có sự khác biệt đáng kể về lượng thực phẩm trung bình được ăn giữa các
sản phẩm khác nhau
H1: tồn tại ít nhất 1 loại sản phẩm có sự khác biệt đáng kể về lượng thực phẩm trung
bình được ăn
𝐻0: 𝑀𝑒𝑑1 = 𝑀𝑒𝑑2 =𝑀𝑒𝑑3 = 𝑀𝑒𝑑4 = 𝑀𝑒𝑑5

𝐻1: ∃! 𝑀𝑒𝑑𝑖 ≠ 𝑀𝑒𝑑𝑗

Kết quả SPSS như hình dưới


P_value ≈ 0, 00000 < α = 0, 05
=> bác bỏ giả thuyết H0
At the 0.05 level of significance, there is evidence of a significant difference in the
median amount of food eaten among the various products
+ p_value (5-4)= 0,243 > α = 0, 05
Accept H0 Hypothesis. At the 0.05 level of significance, there is no evidence of a
significant difference in the median amount of food eaten among Beef and Salmon.
+ p_value (5-3) = 0,0000 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Beef and Chicken
Liver
+ p_value (5-2) = 0,0000 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Beef and Srimp
+ p_value (5-1) = 0,0000 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Beef and Kidney
+ p_value (4-3)= 0,013 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Salmon and Chicken
Liver
+ p_value (4-2) = 0,003 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Salmon and Shrimp
+ p_value (4-1) = 0,0000 < α = 0, 05
Reject H0 Hypothesis. At the 0.05 level of significance, there is evidence of a
significant difference in the median amount of food eaten among Salmon and Kidney
+ p_value (3-2)= 0,667 > α = 0, 05
Accept H0 Hypothesis. At the 0.05 level of significance, there is no evidence of a
significant difference in the median amount of food eaten among Chicken Liver and
Shrimp
+ p_value (3-1)= 0,279 > α = 0, 05
Accept H0 Hypothesis. At the 0.05 level of significance, there is no evidence of a
significant difference in the median amount of food eaten among Chicken Liver and
Kidney
+ p_value (2-1)= 0,514 > α = 0, 05
Accept H0 Hypothesis. At the 0.05 level of significance, there is no evidence of a
significant difference in the median amount of food eaten among Shrimp and Kidney

b. Compare the results of (a) with those of Problem 11.13 (a) on page 429.
The results of problem 11.13 a on page 429 and the results of (a) are similar. At the
0.05 level of significance, there is evidence of a significant difference in the median
amount of food eaten among the various products.
Tuy nhiên, nếu so sánh sâu hơn thì sẽ có chút khác biệt:
0.044 1 1
T = 3.79 * 2
* ( 10 + 10
) = 0.251

|𝑋1 − 𝑋2| = 0. 047 < T => chấp nhận giả thuyết H0


|𝑋1 − 𝑋3| = 0. 088 < T => chấp nhận giả thuyết H0
|𝑋1 − 𝑋4| = 0. 428 > T => bác bỏ giả thuyết H0
|𝑋1 − 𝑋5| = 0. 702 > T => bác bỏ giả thuyết H0
|𝑋2 − 𝑋3| = 0. 041 < T => chấp nhận giả thuyết H0
|𝑋2 − 𝑋4| = 0. 381 > T => bác bỏ giả thuyết H0
|𝑋2 − 𝑋5| = 0. 655 > T => bác bỏ giả thuyết H0
|𝑋3 − 𝑋4| = 0. 34 > T => bác bỏ giả thuyết H0
|𝑋3 − 𝑋5| = 0. 614 > T => bác bỏ giả thuyết H0
|𝑋4 − 𝑋5| = 0. 274 > T => bác bỏ giả thuyết H0

Hai kết quả của hai bài giống nhau.

c. Which test is more appropriate for these data, the Kruskal-Wallis rank test or
the one-way ANOVA F test? Explain.
The Kruskal-Wallis rank test is more appropriate for these data. Bởi vì:
+ không phải lúc nào đề bài cũng xảy ra trường hợp tuân theo phân phối chuẩn.
Trên thực tế là ít khi xảy ra nên one-way ANOVA không phổ quát và độ chính
2
xác không cao bằng (các tham số µ, σ , 𝑝𝑎 không đại diện được cho biến định

lượng) nên phải sử dụng kiểm định phi tham số mà cụ thể là The
Kruskal-Wallis rank test.

BÀI 12.66 A hospital conducted a study of the waiting time in its emergency
room. The hospital has a main campus, along with three satellite locations.
Management had a business objective of reducing waiting time for emergency
room cases that did not require immediate attention. To study this, a random
sample of 15 emergency room cases at each location were selected on a particular
day, and the waiting time (recorded from check-in to when the patient was called
into the clinic area) was measured. The results are stored in ERwaiting: (2đ)

Main (0) Satellite 1 (1) Satellite 2 (2) Satellite 3 (3)


120,08 30,75 75,86 54,05
81,90 61,83 37,88 38,82
78,79 26,40 68,73 36,85
63,83 53,84 51,08 32,83
79,77 72,30 50,21 52,94
47,94 53,09 58,47 34,13
79,88 27,67 86,29 69,37
48,63 52,46 62,90 78,52
55,43 10,64 44,84 55,95
64,06 53,50 64,17 49,61
64,99 37,28 50,68 66,40
53,82 34,31 47,97 76,06
62,43 66,00 60,57 11,37
65,07 8,99 58,37 83,51
81,02 29,75 30,40 39,17
a. At the 0.05 level of significance, is there evidence of a difference in the median
waiting times in the four locations?
Cặp giả thuyết:
H0 : Không có sự khác biệt về thời gian chờ đợi trung bình trong phòng cấp cứu giữa
các cơ sở bệnh viện.
H1: Có ít nhất một cơ sở có thời gian chờ đợi trung bình trong phòng cấp cứu khác với
các cơ sở còn lại.
𝐻0: 𝑀𝑒𝑑1 = 𝑀𝑒𝑑2 =𝑀𝑒𝑑3 = 𝑀𝑒𝑑0

𝐻1: ∃! 𝑀𝑒𝑑𝑖 ≠ 𝑀𝑒𝑑𝑗

p_value = 0,004 < α = 0, 05


=> bác bỏ H0
Với mức ý nghĩa 5%, có ít nhất một cơ sở có thời gian chờ đợi trung bình trong phòng
cấp cứu khác với các cơ sở còn lại.
+ p_value (1-3) = 0,143 > α = 0, 05
chấp nhận H0. Với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ đợi trung
bình trong phòng cấp cứu giữa cơ sở 1 và 3
+ p_value (1-2) = 0,064 > α = 0, 05
chấp nhận H0. Với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ đợi trung
bình trong phòng cấp cứu giữa các cơ sở 1 và 2
+ p_value (1-0) = 0,000 < α = 0, 05
bác bỏ H0. Với mức ý nghĩa 5%, có sự khác biệt về thời gian chờ đợi trung bình trong
phòng cấp cứu giữa cơ sở chính và cơ sở 1.
+ p_value (3-2) = 0,699 > α = 0, 05
chấp nhận H0. với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ đợi trung
bình trong phòng cấp cứu giữa cơ sở 3 và cơ sở 2
+ p_value (3-0) = 0,029 < α = 0, 05
bác bỏ H0. với mức ý nghĩa 5%, có sự khác biệt về thời gian chờ đợi trung bình trong
phòng cấp cứu giữa các cơ sở bệnh viện chính và cơ sở 3
+ p_value (2-0) = 0,072 > α = 0, 05
chấp nhận H0. với mức ý nghĩa 5%, không có sự khác biệt về thời gian chờ đợi trung
bình trong phòng cấp cứu giữa các cơ sở bệnh viện chính và cơ sở 2
b. Compare the results of (a) with those of Problem 11.9 (a) on page 428.
kết quả kiểm định one-way ANOVA từ SPSS của bài 11.9a

P_value = 0,001 < α = 0, 05 => 𝑏á𝑐 𝑏ỏ 𝑔𝑖ả 𝑡ℎ𝑢𝑦ế𝑡 𝐻0


+ p_value (1-3) = 0,379 > α = 0, 05. Chấp nhận H0
+ p_value (1-2) = 0,109 > α = 0, 05. chấp nhận H0
+ p_value (1-0) = 0,000 < α = 0, 05. Bác bỏ H0
+ p_value (3-2) = 0,9 > α = 0, 05. Chấp nhận H0
+ p_value (3-0) = 0,045 < α = 0, 05. Bác bỏ H0
+ p_value (2-0) = 0,2 > α = 0, 05. Chấp nhận H0.
=> Kết quả của 2 bài mặc dù khác nhau giá trị P_value nhưng đều giống nhau về kết
luận chấp nhận hay bác bỏ H0.
BÀI 12.67 The per-store daily customer count (i.e., the mean number of
customers in a store in one day) for a nationwide convenience store chain that
operates nearly 10,000 stores has been steady, at 900, for some time. To increase
the customer count, the chain is considering cutting prices for coffee beverages.
Management needs to determine how much prices can be cut in order to increase
the daily customer count without reducing the gross margin on coffee sales too
much. You decide to carry out an experiment in a sample of 24 stores where
customer counts have been running almost exactly at the national average of 900.
In 6 of the stores, a small coffee will be $0.59, in another 6 stores the price will be
$0.69, in a third group of 6 stores, the price will be $0.79, and in a fourth group of
6 stores, the price will now be $0.89. After four weeks, the daily customer count
in the stores is stored in Coffee Sales (2đ)

59 cents 69 cents 79 cents 89 cents


964 953 942 920
972 950 937 918
962 959 945 925
968 955 948 919

975 960 945 915


960 954 941 906

a. At the 0.05 level of significance, is there evidence of a difference in the daily


customer count based on the price of a small coffee?
cặp giả thuyết:
H0: không có sự khác biệt về số lượng khách hàng hàng ngày dựa trên giá của một ly
cà phê
H1: tồn tại ít nhất 1 ly cà phê có sự khác biệt về số lượng khách hàng hàng ngày dựa
trên giá của nó
𝐻0: 𝑀𝑒𝑑59 = 𝑀𝑒𝑑69 =𝑀𝑒𝑑79 = 𝑀𝑒𝑑89

𝐻1: ∃! 𝑀𝑒𝑑𝑖 ≠ 𝑀𝑒𝑑𝑗

Kết quả từ SPSS:


Hoặc tính trên Stata:

P_value ≈ 0, 0000 < α = 0, 05


=> bác bỏ giả thuyết H0
Với mức ý nghĩa 5%, tồn tại ít nhất 1 ly cà phê có sự khác biệt về số lượng khách
hàng hàng ngày dựa trên giá của nó.
+ P_value (89-79 cents) = 0,141 > α = 0, 05
chấp nhận H0. Với mức ý nghĩa 5%, không có sự khác biệt về số lượng khách hàng
hàng ngày dựa trên giá của ly cà phê 79 cents và 89 cents.
+ P_value (89-69 cents) = 0,003 < α = 0, 05
bác bỏ H0. Với mức ý nghĩa 5%, có sự khác biệt về số lượng khách hàng hàng ngày
dựa trên giá của ly cà phê 69 cents và 89 cents.
+ P_value (89-59 cents) = 0,0000 < α = 0, 05
bác bỏ H0. Với mức ý nghĩa 5%, có sự khác biệt về số lượng khách hàng hàng ngày
dựa trên giá của ly cà phê 59 cents và 89 cents.
+ P_value (79-69 cents) = 0,136 > α = 0, 05
chấp nhận H0. Với mức ý nghĩa 5%, không có sự khác biệt về số lượng khách hàng
hàng ngày dựa trên giá của ly cà phê 79 cents và 69 cents
+ P_value (79-59 cents) = 0,003 < α = 0, 05
bác bỏ H0. Với mức ý nghĩa 5%, có sự khác biệt về số lượng khách hàng hàng ngày
dựa trên giá của ly cà phê 79 cents và 59 cents.
+ P_value (69-59 cents) = 0,153 > α = 0, 05
chấp nhận H0. Với mức ý nghĩa 5%, không có sự khác biệt về số lượng khách hàng
hàng ngày dựa trên giá của ly cà phê 59 cents và 69 cents.
b. Compare the results of (a) with those of Problem 11.11 (a) on page 428.
Kết quả từ SPSS của bài 11.11 trang 428

tất cả các P_value đều nhỏ hơn α


=> bác bỏ tất cả các giả thuyết H0
Với mức ý nghĩa 5%, có sự khác biệt về số lượng khách hàng hàng ngày dựa trên giá
của 1 ly cà phê.
Kết quả của hai bài giống nhau
HOMEWORK 3.6
Câu 6.T1 Một doanh nghiệp muốn quảng cáo về một loại sản phẩm mới sản xuất.
Giám đốc công ty yêu cầu phòng Media tiến hành khảo sát để chọn hình thức
quảng cáo phù hợp. Khảo sát về chi phí quảng cáo (đơn vị: triệu VND) ở 3 loại
hình: phát tờ rơi (leaflet), quảng cáo trên báo giấy, quảng cáo trên các pano; thu
được dữ liệu như sau (1đ)

Phát tờ rơi 42 58 46 35 59 60 61 38

Quảng cáo trên


72 81 64 55 75
báo giấy

Quảng cáo trên các


73 92 68 85 82 94 62
pano

Với mức ý nghĩa , bạn hãy cho biết có hay không sự khác biệt về chi phí quảng
cáo của các hình thức quảng cáo nói trên? (Dùng kiểm định Kruskal-Wallis).
0,05
A. Có sự khác biệt vì 𝐻𝑞𝑠(𝑤) = 12, 67 > 𝑥 (2) = 5, 9915

0,05
B. Có sự khác biệt vì 𝐻𝑞𝑠(𝑤) = 12, 67 > 𝑥 (3) = 7, 8147

0,05
C. Có sự khác biệt vì 𝐻𝑞𝑠(𝑤) = 12, 67 > 𝑥 (2) = 7, 3778

0,05
D. Có sự khác biệt vì 𝐻𝑞𝑠(𝑤) = 12, 67 > 𝑥 (3) = 9, 3484

0,05
k = 3 và α = 0, 05 => 𝑥 (2)
0,05
(tra bảng phân phối chi bình phương ta có 𝑥 (2) = 5, 9915)

chọn câu A
Câu 6.T2 Bảng sau đây là số liệu về trọng lượng lúc sinh (đơn vị tính: kg) của trẻ
em có bố/mẹ hút thuốc (B) và không hút thuốc (A): (1đ)

Nhóm
3.99 3.79 3.60 3.73 3.21 3.60 4.08 3.61 3.83
A

Nhóm
3.18 2.84 2.90 3.27 3.85 3.52 3.23 2.76 3.60
B

Với mức ý nghĩa α = 5% , bạn hãy cho biết trọng lượng trẻ em lúc sinh của
những cặp bố/ mẹ hút thuốc có nhỏ hơn trọng lượng trẻ có bố/ mẹ không hút
thuốc hay không?

A. Trọng lượng trẻ em lúc sơ sinh của những cặp bố mẹ không hút thuốc lớn hơn
trọng lượng trẻ em có bố/mẹ hút thuốc vì tổng hạng của nhóm A,
𝑇 = 114 > 𝑇𝑈 = 105

B. Trọng lượng trẻ em lúc sơ sinh của những cặp bố mẹ không hút thuốc lớn hơn
trọng lượng trẻ em có bố/mẹ hút thuốc vì tổng hạng của nhóm A,
𝑇 = 114 > 𝑇𝑈 = 109

C. Trọng lượng trẻ em lúc sơ sinh của những cặp bố mẹ không hút thuốc lớn hơn
trọng lượng trẻ em có bố/mẹ hút thuốc vì tổng hạng của nhóm A,
𝑇 = 57 < 𝑇𝐿 = 62

D. Trọng lượng trẻ em lúc sơ sinh của những cặp bố mẹ không hút thuốc nhỏ hơn
trọng lượng trẻ em có bố/mẹ hút thuốc vì tổng hạng của nhóm A,
𝑇 = 57 < 𝑇𝑈 = 66

TL : giới hạn dưới; TU : giới hạn trên

H0: trọng lượng trẻ em lúc sinh của những cặp bố/ mẹ không hút thuốc không lớn hơn
trọng lượng trẻ có bố/ mẹ có hút thuốc

H1: trọng lượng trẻ em lúc sinh của những cặp bố/ mẹ không hút thuốc lớn hơn trọng
lượng trẻ có bố/ mẹ có hút thuốc
𝐻0: 𝑀𝑒𝑑𝐴 = 𝑀𝑒𝑑𝐵

𝐻1: 𝑀𝑒𝑑𝐴 > 𝑀𝑒𝑑𝐵

Hoặc tính bằng Stata:

P_value = 0,012 < α = 0, 05

=> bác bỏ H0.


𝑊0,05;9;9 = (66; 105)

𝑇 = 114 > 𝑇𝑈 = 105

chọn câu A

Câu 6.T3 Một cuộc điều tra được tiến hành trên mẫu ngẫu nhiên gồm 150 nam
và 170 nữ: mỗi người được yêu cầu chỉ được chọn duy nhất một nhãn hiệu nước
giải khát yêu thích nhất trong 3 loại Coca-cola, Pepsi, 7-Up. Kết quả cuộc điều
tra được thể hiện trong bảng sau: (1đ)

Nhãn hiệu ưa thích


Giới tính
Coca-cola Pepsi 7-Up Tổng

Nam 68 47 35 150

Nữ 55 84 31 170

Tổng 123 131 66 320

Bạn hãy chọn câu trả lời ĐÚNG trong các khẳng định sau:

A. Có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích vì
2
𝑥𝑞𝑠 = 10, 86 > 𝑥0,05(2) = 5, 9915

B. Có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích vì
2
𝑥𝑞𝑠 = 10, 86 > 𝑥0,05(2) = 7, 3778

C. Không có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích vì
2
𝑥𝑞𝑠 = 10, 86 < 𝑥0,05(6) = 12, 5916

D. Không có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích vì
2
𝑥𝑞𝑠 = 10, 86 < 𝑥0,05(6) = 14, 4494

Đây là kiểm định chi bình phương (kiểm định tính độc lập trên 2 biến định tính)
H0: Không có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích

H1: Có mối liên hệ giữa giới tính và nhãn hiệu nước giải khát yêu thích

ta có r = 2; c = 3 => loại câu C, D


2 2
=> 𝑥α;(𝑟−1)(𝑐−1) = 𝑥0,05(2) = 5, 9915

chọn câu A

Câu 6.T4 Kiểm định phi tham số sẽ được sử dụng nếu giả thiết nào sau đây bị vi
phạm: (1đ)

A. Tổng thể có phân phối bình thường (Laplace) hay phân phối Student.

B. Dữ liệu xuất hiện các giá trị ngoại lệ (giá trị cực lớn hoặc cực nhỏ)

C. Dữ liệu thu thập ở thang đo : định danh, thứ bậc

D. Cả A, B, C đều đúng

Chọn câu D

Câu 6.T5 Trong các yếu tố ảnh hưởng đến mức lương của một sinh viên mới ra
trường thì kết quả học tập là một trong nhiều yếu tố quan trọng. Để khẳng định
rằng kết quả học tập có tác động đến mức lương người ta tiến hành khảo sát
ngẫu nhiên 2 nhóm sinh viên ( Nhóm 1: Kết quả học tập trên 7.0; Nhóm 2: Kết
quả học tập dưới 7.0) về mức lương họ nhận được thì thu được bảng số liệu sau:
(1đ)

Mức lương
3 4 5 6 7 8 9 10 11 12 13
(triệu/tháng)

Nhóm 1 (số
2 3 5 6 4 2 3 2 1 1 1
sinh viên )
Nhóm 2 ( số
3 5 3 2 2 2 2 1 0 0 0
sinh viên)

Hãy cho biết trong các kiểm định phi tham số sau, kiểm định nào là phù hợp để
khẳng định kết quả học tập có tác động đến mức lương ?

A. Kiểm định chi bình phương về tính độc lập.

B. Kiểm định Kruskal- Wallis

C. Kiểm định dấu và hạng Wilconxon cho mẫu phối hợp từng cặp

D. Kiểm định tổng và hạng Wilconxon cho hai mẫu độc lập

⇒ Chọn câu A vì đề bài cho dạng kiểm định giữa 2 biến định tính có sự phụ thuộc
hay không (kết quả học tập và mức lương) => nên phải sử dụng kiểm định chi bình
phương về tính độc lập

Câu 6.T6 Để đánh giá về mức lương của 4 nhóm nhân viên ở 4 lĩnh vực khác
nhau lần lượt là: nhân viên kinh doanh, kỹ sư, bác sĩ, công nghệ thông tin có hay
không sự khác biệt người ta đã tiến hành khảo sát ngẫu nhiên về thu nhập (đơn
vị: triệu đồng/tháng) một số nhân viên ở các lĩnh vực này và thu được bảng số
liệu sau: (1đ)

Mức lương (triệu


5- 8 8 -12 12 -20 20 – 30
đồng/tháng)

Số nhân viên (kinh doanh) 4 6 2 2

Số nhân viên (kỹ sư) 7 4 2 1

Số nhân viên (bác sĩ) 2 4 8 3

Số nhân viên (công nghệ


4 9 3 2
thông tin)
Hãy cho biết kiểm định nào sau đây là phù hợp để đánh giá về sự khác biệt mức
lương của 4 nhóm nhân viên trên nếu giả định rằng phương sai về mức lương là
không bằng nhau

A. Phân tích ANOVA

B. Kiểm định Kruskal- Wallis

C. Không đủ thông tin để kiểm định.

D. Kiểm định chi bình phương về tính độc lập.

Chọn câu B vì

+ giả định rằng phương sai về mức lương là không bằng nhau => loại ANOVA =
loại Câu A
+ loại câu D vì kiểm định chi bình phương về tính độc lập chỉ kiểm định giữa 2
biến định tính
+ chọn câu B vì phương sai không bằng nhau (thay thế ANOVA)

HOMEWORK 3.8
Bài 6.1 Một mẫu khảo sát gồm 500 người tiêu dùng được chọn lựa để khảo sát về
thông tin của người tiêu dùng. Trong bảng hỏi có câu hỏi “ Bạn có thích mua sắm
quần áo không? “ thì thu được bảng số liệu sau: (2đ)

Giới tính Nam Nữ Tổng

Bạn có thích mua sắm quần áo không?

Có 136 224 360

Không 104 36 140

Tổng 240 260 500


a) Theo bạn nên áp dụng kiểm định phi tham số nào cho việc tìm hiểu mối liên hệ
giữa giới tính và việc thích mua sắm quần áo ? Tại sao?

nên áp dụng kiểm định Chi bình phương về tính độc lập. Vì đây là kiểm định có hay
không sự phụ thuộc giữa 2 biến định tính (giới tính và việc thích mua sắm quần áo).

b) Với mức ý nghĩa 5% bạn hãy cho biết có hay không mối liên hệ giữa giới tính
và việc thích mua sắm quần áo ?

cặp giả thuyết:

𝐻0: 𝑘ℎô𝑛𝑔 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑔𝑖ớ𝑖 𝑡í𝑛ℎ 𝑣à 𝑣𝑖ệ𝑐 𝑡ℎí𝑐ℎ 𝑚𝑢𝑎 𝑠ắ𝑚 𝑞𝑢ầ𝑛 á𝑜

𝐻1: 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑔𝑖ớ𝑖 𝑡í𝑛ℎ 𝑣à 𝑣𝑖ệ𝑐 𝑡ℎí𝑐ℎ 𝑚𝑢𝑎 𝑠ắ𝑚 𝑞𝑢ầ𝑛 á𝑜

Tính toán trên excel ta thu được kết quả như sau:

Tính bằng SPSS:

−13
p_value = 2, 19 × 10 < α = 0, 05

=> bác bỏ giả thuyết H0

Với mức ý nghĩa 5%, có mối liên hệ giữa giới tính và việc yêu thích mua sắm quần áo
Bài 6.2 Một cuộc khảo sát được tiến hành ngẫu nhiên trên một số người về sở
thích ăn Pizza dựa trên các mức giá khác nhau. (2đ)

Mức giá (USD) 8,49 11,49 14,49 Tổng

Loại Piza bạn mua ?

Pizza Hurt 10 5 2 17

Loại khác 25 23 27 75

Tổng 35 28 29 92

a) Theo bạn nên áp dụng kiểm định phi tham số nào cho việc tìm hiểu có hay
không mối liên hệ giữa giá bán và loại Pizza chọn lựa?

nên áp dụng kiểm định Chi bình phương về tính độc lập. Vì đây là kiểm định có hay
không sự phụ thuộc giữa 2 biến định tính (giá bán và loại Pizza chọn lựa)

b) Với mức ý nghĩa 5% bạn hãy kiểm định về mối liên hệ giữa giá bán và loại
Pizza chọn lựa ?

cặp giả thuyết:

𝐻0: 𝑘ℎô𝑛𝑔 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑔𝑖á 𝑏á𝑛 𝑣à 𝑙𝑜ạ𝑖 𝑃𝑖𝑧𝑧𝑎 𝑐ℎọ𝑛 𝑙ự𝑎

𝐻1: 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑔𝑖á 𝑏á𝑛 𝑣à 𝑙𝑜ạ𝑖 𝑃𝑖𝑧𝑧𝑎 𝑐ℎọ𝑛 𝑙ự𝑎

Tính trong Stata:


Tính bằng SPSS:

P_value = 0,084 > α = 0, 05

chấp nhận giả thuyết 𝐻0

với mức ý nghĩa 5%, không có mối liên hệ giữa giá bán và loại Pizza chọn lựa
HOMEWORK 3.9

BÀI 12.22 The owner of a restaurant serving Continental-style entrées has the
business objective of learning more about the patterns of patron demand during
the Friday-to-Sunday weekend time period. Data were collected from 630
customers on the type of entrée ordered and the type of dessert ordered and
organized into the following table: (1đ)

At the 0.05 level of significance, is there evidence of a relationship between type


of dessert and type of entrée?
Cặp giả thuyết

𝐻0: 𝑘ℎô𝑛𝑔 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑡𝑟á𝑛𝑔 𝑚𝑖ệ𝑛𝑔 𝑣à 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑘ℎ𝑎𝑖 𝑣ị

𝐻1: 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑡𝑟á𝑛𝑔 𝑚𝑖ệ𝑛𝑔 𝑣à 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑘ℎ𝑎𝑖 𝑣ị

−23
p_value = 1, 68 × 10 < α = 0, 05

=> bác bỏ giả thuyết 𝐻0

𝑣ớ𝑖 𝑚ứ𝑐 ý 𝑛𝑔ℎĩ𝑎 5%, 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑡𝑟á𝑛𝑔 𝑚𝑖ệ𝑛𝑔 𝑣à 𝑙𝑜ạ𝑖 𝑚ó𝑛 𝑘ℎ𝑎𝑖 𝑣ị

Hoặc tính bằng Stata:


Hoặc tính bằng SPSS:

BÀI 12.23 Is there a generation gap in the type of music that people listen to?
The following table represents the type of favorite music for a sample of 1,000
respondents classified according to their age group: (1đ)

At the 0.05 level of significance, is there evidence of a relationship between


favorite type of music and age group?

𝐻0: 𝑘ℎô𝑛𝑔 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑡ℎể 𝑙𝑜ạ𝑖 â𝑚 𝑛ℎạ𝑐 𝑦ê𝑢 𝑡ℎí𝑐ℎ 𝑣à 𝑛ℎó𝑚 𝑡𝑢ổ𝑖
𝐻1: 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑡ℎể 𝑙𝑜ạ𝑖 â𝑚 𝑛ℎạ𝑐 𝑦ê𝑢 𝑡ℎí𝑐ℎ 𝑣à 𝑛ℎó𝑚 𝑡𝑢ổ𝑖

−14
P_value = 1, 797 × 10 < α = 0, 05

bác bỏ giả thuyết 𝐻0

với mức ý nghĩa 5%, có mối liên hệ giữa thể loại âm nhạc yêu thích và nhóm tuổi

➢ Hoặc tính bằng Stata:

Nhom A: 16-29 Nhom B: 30-49 Nhom C: 50-64 Nhom D: 65 and over

Tính bằng SPSS:


BÀI 12.24 A large corporation is interested in determining whether a
relationship exists between the commuting time of its employees and the level of
stress-related problems observed on the job. A study of 116 workers reveals the
following: (2đ)

a. At the 0.01 level of significance, is there evidence of a significant relationship


between commuting time and stress level?

𝐻0: 𝑘ℎô𝑛𝑔 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑡ℎờ𝑖 𝑔𝑖𝑎𝑛 đ𝑖 𝑙ạ𝑖 𝑣à 𝑚ứ𝑐 độ 𝑐ă𝑛𝑔 𝑡ℎẳ𝑛𝑔

𝐻1: 𝑐ó 𝑚ố𝑖 𝑙𝑖ê𝑛 ℎệ 𝑔𝑖ữ𝑎 𝑡ℎờ𝑖 𝑔𝑖𝑎𝑛 đ𝑖 𝑙ạ𝑖 𝑣à 𝑚ứ𝑐 độ 𝑐ă𝑛𝑔 𝑡ℎẳ𝑛𝑔

P_value = 0,0434 > α = 0, 01

=> chấp nhận 𝐻0

với mức ý nghĩa 1%, không có mối liên hệ giữa thời gian đi lại và mức độ căng thẳng
Cách 2:

b. What is your answer to (a) if you use the 0.05 level of significance?

P_value = 0,0434 < α = 0, 05

=> bác bỏ 𝐻0

với mức ý nghĩa 5%, có mối liên hệ giữa thời gian đi lại và mức độ căng thẳng.

Câu 1: (1đ)
đây là dạng bài kiểm định dấu và hạng Wilconxon trên mẫu cặp (vì cùng 1 mẫu (điểm
số) nhưng xét trên 2 tính chất (trước và sau khi học tại trung tâm))
cặp giả thuyết:
𝐻0: đ𝑖ể𝑚 𝑠ố 𝑡𝑟ướ𝑐 𝑣à 𝑠𝑎𝑢 𝑘ℎ𝑖 ℎọ𝑐 𝑡ạ𝑖 𝑡𝑟𝑢𝑛𝑔 𝑡â𝑚 𝑠ẽ 𝑡ă𝑛𝑔 í𝑡 𝑛ℎấ𝑡 0, 5
𝐻1: đ𝑖ể𝑚 𝑠ố 𝑡𝑟ướ𝑐 𝑣à 𝑠𝑎𝑢 𝑘ℎ𝑖 ℎọ𝑐 𝑡ạ𝑖 𝑡𝑟𝑢𝑛𝑔 𝑡â𝑚 𝑠ẽ 𝑡ă𝑛𝑔 í𝑡 ℎơ𝑛 0, 5

𝑀𝑒𝑑𝑑 = 0, 5

𝑀𝑒𝑑𝑑 < 0, 5

với 𝑀𝑒𝑑𝑑 = 𝑀𝑒𝑑𝑠𝑎𝑢 − 𝑀𝑒𝑑𝑡𝑟ướ𝑐

Thu thập số liệu về điểm số trước và sau khi học tại Trung tâm và tính toán:
+ Nếu P_value > α thì chấp nhận 𝐻0 và ngược lại

+ Hoặc kiểm định phía trái 𝑊0 = {𝑡ổ𝑛𝑔 ℎạ𝑛𝑔 𝑅 −}

Nếu 𝑊0 ≥ 𝑊𝐿 thì chấp nhận 𝐻0 và ngược lại

Kết luận (nếu chấp nhận 𝐻0 ): với mức ý nghĩa α, điểm số trước và sau khi học tại

Trung tâm sẽ tăng ít nhất 0,5


Câu 2: (1đ)
Đây là kiểm định chi bình phương về tính độc lập trên 2 biến định tính (tỷ lệ sinh viên
vào ngành toán kinh tế và tổ hợp tuyển sinh)
cặp giả thuyết:
𝐻0: tỷ lệ sinh viên đăng ký nguyện vọng vào chuyên ngành toán kinh tế phụ thuộc vào

các tổ hợp tuyển sinh


𝐻1: tỷ lệ sinh viên đăng ký nguyện vọng vào chuyên ngành toán kinh tế không phụ

thuộc vào các tổ hợp tuyển sinh


Ví dụ như bảng sau:

tổ hợp/ ngành toán kinh tế marketing …..

A00 400

A01 510

D01 370

Tính các giá trị kiểm định bằng phương pháp thông thường hoặc SPSS
Kết luận: nếu P_value > α thì chấp nhận giả thuyết 𝐻0 và ngược lại.
Nếu chấp nhận 𝐻0 thì có nghĩa là với mức ý nghĩa là α thì tỷ lệ sinh viên đăng ký

nguyện vọng vào chuyên ngành toán kinh tế phụ thuộc vào các tổ hợp tuyển sinh

____________________________________________________________________

THAM KHẢO CÂU HỎI TRONG ĐỀ THI

A sai vì P_value = 0,004 < α = 0, 05


=> bác bỏ 𝐻0 => việc đến trung tâm ôn thi để lấy chứng chỉ SAT có ảnh hưởng đến

điểm số
B sai vì Z = -2,842
C sai vì các số 𝑑𝑖(𝑚𝑎𝑛𝑔 𝑑ấ𝑢 â𝑚) = 26 chứ không phải bằng 9

chọn câu D
i đúng
ii sai vì bậc tự do = df = 2
p_value = 0,337 > α = 0, 05
=> chấp nhận 𝐻0 => có 3 tổng thể có mức độ hài lòng đều giống nhau => iii sai

=> có 2 khẳng định sai


=> chọn câu C

You might also like