You are on page 1of 44

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM


----------

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ


Giáo viên hướng dẫn: Nguyễn Tiến Dũng
Nhóm- Lớp L-16
STT Họ và tên MSSV Lớp Ký tên
1 Nguyễn Tấn Sang 1813803 L16
2 Đồng Minh Dương 1811805 L16
3 Trần Thanh Duy 1811748 L16
4 Nguyễn Minh Thành 1814021 L16
5 Lê Văn Hiếu 1812169 L16

*Phương pháp thống kê:

+Phương pháp mô tả

+Kiểm định Kruskal-Wallis

+Kiểm định hoán vị

Tp HCM, 5/12/2019

1
MỤC LỤC

I,THỐNG KÊ MÔ TẢ .................................................................... 3
1, DỮ LIỆU ĐỊNH LƯỢNG: ...................................................................................3

2, DỮ LIỆU ĐỊNH TÍNH: .........................................................................................8

II,KIỂM ĐỊNH KRUSKAL-WALLIS ............................................... 11


1, CƠ SỞ LÝ THUYẾT:..........................................................................................11

2, ÁP DỤNG KIỂM ĐỊNH KRUSKAL WALLIS ĐỂ KIỂM ĐỊNH TRONG


THỰC TẾ: ................................................................................................................12

3, GIẢI QUYẾT BÀI TOÁN ...................................................................................21

4, THỰC HIỆN KIỂM ĐỊNH BẰNG R: ...............................................................31

III,KIỂM ĐỊNH HOÁN VỊ (PERMUTATION TEST) ............................ 37


1, CƠ SỞ LÝ THUYẾT:..........................................................................................37

2, ÁP DỤNG KIỂM ĐỊNH PERMUTATION TEST ĐỂ KIỂM ĐỊNH TRONG


THỰC TẾ: ................................................................................................................38

2
I,THỐNG KÊ MÔ TẢ
1, DỮ LIỆU ĐỊNH LƯỢNG: Khảo sát sinh viên về số giờ sinh viên dành ra cho
việc chơi game. Bảng số liệu dưới đây chỉ ra số giờ chơi game của 105 sinh viên
10 5 10 1 30 14 4 13
14 22 12 1 19 28 3 8
6 15 13 1 12 10 6 12
7 7 8 4 2 12 2 10
5 8 5 28 14 13 14 7
7 5 20 3 15 8 7 14
7 10 15 24 1 14 10 10
20 5 25 19 9 10 5 3
21 13 10 15 13 6 4 9
12 15 14 6 14 28 6 8
10 20 9 19 9 6 3 23
13 7 8 6 0 15 4 7
9 10 2 3 21 6 23 28

*Công cụ giải: Histogram, công cụ vẽ trong Insert

*Giải quyết bài toán trên Excel:

1.1, Thực hiện phương pháp phân tổ dữ liệu

B1: Nhập dữ liệu trên vào Excel

1
B2: - Xác định số tổ cần chia: k = (2 * n) 3
- Nhập vào ô A15 biểu thức: = (2*COUNT(A1:H13))^(1/3)
-Kết quả : 5.924992137,chọn k=6

3
B3: Xác định trị số khoảng cách h theo công thức: h = ((X_max − X_min ))/k
+ Nhập vào ô B15 công thức: = (MAX(A1:H13)-MIN(A1:H13))/6
+ Kết quả: 5
+ Chọn h = 5
B4: Xác định được cận trên và cận dưới các tổ:
+ Tổ 1: 0 - 5
+ Tổ 2: 5 - 10
+ Tổ 3: 10 - 15
+ Tổ 4: 15 - 20
+ Tổ 5: 20 - 25
+ Tổ 6: 25 - 30
- Nhập vào các ô K2->K7 lần lượt các giá trị:

B5: Sử dụng công cụ “Histogram” trong Data Analysis

4
- Chọn chức năng Data/Data Analysis/Histogram.

- Input Range: Địa chỉ tuyệt đối chứa dữ liệu

- Bin Range: Địa chỉ chứa bảng phân nhóm.

- Output options: Vị trí xuất kết quả.

- Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel
chỉ tính tần số.

Kết quả

1.2, Vẽ đồ thị tần số và đa giác tần số (A)


- Quét bảng tần số từ D22:D27

5
- Insert Column Chart

- Kết quả:

- Vẽ đa giác tần số:

+ Sử dụng bảng phân phối tần số của dữ liệu (A):

+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số

+Quét chọn B22:B29, dung chức năng Insert Line Chart

-Kết quả sau chỉnh sửa:

6
*Nhận xét: Theo biểu đồ đa giác tần số, ta nhận thấy rằng phần lớn sinh viên dành thời
gian cho chơi game tầm từ 5 tiếng đến 10 tiếng mỗi tuần.

7
2, DỮ LIỆU ĐỊNH TÍNH:Bảng dưới đây thể hiện sự ảnh hưởng của việc chơi
game đối với sinh viên

*Công cụ giải: Công cụ vẽ Insert Pie, Insert Column

*Giải quyết bài toán trên Excel

B1: Nhập bảng số liệu trên Excel

B2: Tính tỉ lệ sinh viên cho các việc ảnh hưởng

+D38 = C38/$C$43

+D39 = C39/$C$43

+D40 = C40/$C$43

+D41 = C41/$C$43

+D42 = C42/$C$43

Kết quả:

8
*Vẽ biểu đồ thể đứng: thể hiện số sinh viên ở các sự ảnh hưởng của việc chơi game

-Quét chọn cột Sinh viên B38:B42

- Dùng chức năng Insert/Insert Column Chart/2-D Column trên menu Insert.

* Kết quả:

* Vẽ biểu đồ tròn: thể hiện tỉ lệ sinh viên ở các sự ảnh hưởng của việc chơi game

- Quét chọn cột Sinh viên B38:B42

- Dùng chức năng Insert/Insert Pie/2-D trên menu Insert.

* Kết quả:

9
*Nhận xét: Chơi game ảnh hưởng nhiều đến đời sống của sinh viên nói riêng và xã hội
nói chung. Thông qua biểu đồ, ta thấy rằng chơi game giúp sinh viên giải tỏa căng thẳng,
thư giản đầu óc chiếm tỉ trọng gần như phân nửa. Không chỉ thế , nó góp phần không
nhỏ đến việc phát triển tư duy, ngôn ngữ . Nhưng bên cạnh đó, chơi game nhiều sẽ gây
hại chẳng hạn như suy giảm về thị lực, sức khỏe chiếm phần không nhỏ ( gần đến
¼).Điển hình nhiều sinh viên lạm dụng game quá nhiều cày ngày cày đêm ảnh hưởng
đến học tập sa sút.

*Kết luận: Cân bằng thời gian giữa việc chơi game và học tập, làm việc. Không được
lạm dụng game dẫn đến gây nghiện ảnh hưởng nghiệm trọng đến sức khỏe bản than hơn
nữa gia đình, xã hội ( ví dụ gia tăng bạo lực, gây mất trật tự an ninh xã hội).

10
II, KIỂM ĐỊNH KRUSKAL-WALLIS

Kiểm định Kruskal-Wallis được sử dụng để so sánh sự khác nhau về giá trị trung bình
của một biến phụ thuộc theo hai hay nhiều nhóm của biến độc lập (dạng phân loại),
nhưng không yêu cầu biến phụ thuộc phải có phân phối chuẩn cũng như không yêu cầu
các nhóm so sánh phải có phương sai bằng nhau.

*Dạng bài:Kiểm định hoán vị

*Công cụ giải:R

1, CƠ SỞ LÝ THUYẾT:
Các bước kiểm định:

Giả sử ta có k mẫu chứa n1, n2,…, nk phần tử được lấy chọn từ k tổng thể. µ1, µ2,…,
µ𝑘 lần lượt là giá trị trung bình của k tổng thể đó

Bước 1: Đặt giả thuyết

H0: các nhóm có trung bình bằng nhau (µ1=µ2=…=µ𝑘)

H1: tồn tại ít nhất một cặp trung bình khác nhau (Ǝ! µi≠µj, i≠j)

Bước 2: Xếp hạng tất cả các giá trị của k mẫu theo thứ tự tăng dần. Những giá trị hạng
bằng nhau sẽ nhận giá trị trung bình.

Bước 3: Cộng các hạng của tất cả các giá trị của từng mẫu lại, kí hiệu R1, R2,…, Rk.

Bước 4: Tính giá trị kiểm định.

12 𝑅𝑖 2
W= ∑𝑘𝑖=1 − 3(𝑛 + 1)
𝑛(𝑛+1) 𝑛𝑖

Bước 5: So sánh và kết luận

Qui tắc quyết định: Bác bỏ H0 nếu W > X2k-1,α (với X2k-1,α có phân phối Chi Bình
Phương, bậc tự do là k-1, α là mức ý nghĩa, ta thường lấy α=5%)

11
*Trong trường hợp bác bỏ H0, ta có thể phân tích hậu định K-W tức là so sánh các trung
bình của từng cặp nhóm với nhau

Bước 1: Đặt giả thuyết

H0: hai nhóm có trung bình bằng nhau (µi=µj)

H1: hai nhóm có trung bình khác nhau (µi≠µj)

Bước 2: Tính hạng trung bình

𝑅𝑖
̅̅̅
𝑅𝑖 =
𝑛𝑖

Bước 3: Tính chênh lệch hạng trung bình

̅̅̅ − 𝑅𝑗
Dij = |𝑅𝑖 ̅̅̅|

Bước 4: Tính Ck

𝑛(𝑛+1) 1 1
Ck = √𝑋 2 𝑘−1,𝛼 ( )( + )
12 𝑛𝑖 𝑛𝑗

Bước 5: Kết luận

Bác bỏ H0 nếu Dij > Ck

2, ÁP DỤNG KIỂM ĐỊNH KRUSKAL WALLIS ĐỂ KIỂM ĐỊNH TRONG


THỰC TẾ:

Bảng dữ liệu: Lượng khí thải CO2 của các nước và vùng kinh tế trong các năm 2012,
2013 và 2014 (tấn)

Country Name 2012 2013 2014


Aruba 13.1577223 8.35356101 8.410064178
Afghanistan 0.34514878 0.31034101 0.293946407

12
Angola 1.33021857 1.25377617 1.290306776
Albania 1.69290833 1.74921108 1.978763312
Andorra 5.91688403 5.90177532 5.832906215
Arab World 4.83777959 4.67492482 4.886987513
United Arab Emirates 19.2949204 18.5592362 22.93960631
Argentina 4.60917986 4.49853999 4.781507775
Armenia 1.97447949 1.89704009 1.898719374
Antigua and Barbuda 5.80009734 5.72993793 5.744419956
Australia 17.0729047 16.0958332 15.38876602
Austria 7.38707716 7.36874814 6.86986793
Azerbaijan 3.82487717 3.78506884 3.931560609
Burundi 0.03053854 0.03036522 0.044699992
Belgium 8.56287875 8.68954309 8.328159898
Benin 0.56234192 0.58095296 0.61420609
Burkina Faso 0.15866272 0.17913186 0.162018438
Bangladesh 0.44703519 0.45632061 0.47365761
Bulgaria 6.11945653 5.45069596 5.871615869
Bahrain 20.5191751 23.8112718 23.45540632
Bahamas, The 5.41602216 7.6302619 6.520069719
Bosnia and Herzegovina 6.17444185 6.18791144 6.384938819
Belarus 6.67999159 6.73665225 6.701957705
Belize 1.41038462 1.4849804 1.400941234
Bermuda 7.35686287 7.05181459 8.838314988
Bolivia 1.81094255 1.79447717 1.90636432
Brazil 2.35854836 2.50540879 2.612933521
Barbados 5.18317589 5.09491868 4.467476521
Brunei Darussalam 24.2267631 19.29518 22.2291779
Bhutan 1.16556559 1.29592756 1.392229534
Botswana 2.07482823 2.53529732 3.367451334
Central African Republic 0.06612546 0.06677852 0.067357126
Canada 14.9062164 14.7410813 15.15892722

13
Central Europe and the Baltics 6.50436699 6.34483826 6.14888254
Switzerland 4.72357429 4.97283588 4.311562994
Chile 4.65362524 4.73643109 4.6490622
China 7.42475092 7.55721104 7.543907641
Cote d'Ivoire 0.43141801 0.48378656 0.487688034
Cameroon 0.2851981 0.30678342 0.308791722
Congo, Dem. Rep. 0.03479946 0.05030904 0.063330889
Congo, Rep. 0.65856754 0.66791556 0.653359719
Colombia 1.73517948 1.92753581 1.790356827
Comoros 0.19756697 0.23737669 0.202812784
Cabo Verde 1.00160519 0.97452652 0.948113817
Costa Rica 1.65672056 1.60224643 1.618087849
Caribbean small states 8.88821696 9.13232459 8.871219716
Cuba 3.21189443 3.08434757 3.080994246
Curacao 39.445663 33.8994032 37.72628905
Cayman Islands 9.08073544 8.93315758 8.91920852
Cyprus 6.09634235 5.19979963 5.260461605
Czech Republic 9.61198588 9.3848916 9.165978376
Germany 9.19929976 9.39062342 8.889370395
Djibouti 0.59558295 0.68915071 0.803830216
Dominica 1.91191432 1.85890504 1.908686783
Denmark 6.51480085 6.86256503 5.935712482
Dominican Republic 2.227692 2.13380484 2.11899467
Algeria 3.47710809 3.52555736 3.735520147
East Asia & Pacific (excluding high 5.77394813 5.79115436 5.776128446
income)
Early-demographic dividend 2.29763957 2.21307606 2.298216409
East Asia & Pacific 6.30783541 6.33119088 6.294256272
Europe & Central Asia (excluding high 8.00071166 7.73393729 7.421073334
income)
Europe & Central Asia 7.47383972 7.28951506 6.915939022

14
Ecuador 2.46479356 2.6100352 2.753266363
Egypt, Arab Rep. 2.51171533 2.41403693 2.232732005
Euro area 6.99709697 6.84446209 6.474920854
Spain 5.6609388 5.08439835 5.033824487
Estonia 13.3240004 15.093718 14.84881917
Ethiopia 0.09234039 0.11148726 0.118240576
European Union 6.91780246 6.75382531 6.379149049
Fragile and conflict affected situations 0.84936314 0.88826872 0.895930924
Finland 9.07543336 8.68178012 8.660721243
Fiji 1.22506182 1.33020721 1.350070921
France 5.07506234 5.06217196 4.573181595
Faroe Islands 12.3400915 14.1651006 12.46290659
Micronesia, Fed. Sts. 1.29828909 1.35012178 1.399279638
Gabon 2.9173667 2.90603944 2.756381782
United Kingdom 7.35589828 7.14584436 6.49744049
Georgia 2.26380242 2.11379311 2.416460496
Ghana 0.45688598 0.54947857 0.531371738
Gibraltar 13.7324496 14.5844117 15.65746479
Guinea 0.24235458 0.21107584 0.219671873
Gambia, The 0.23869049 0.22035116 0.253640982
Guinea-Bissau 0.15764879 0.15573421 0.160335469
Equatorial Guinea 4.96073472 4.79661245 4.763967152
Greece 7.24700736 6.33661459 6.180337268
Grenada 2.5255291 2.81372839 2.222383427
Greenland 10.0050167 9.80325054 8.989181988
Guatemala 0.78403045 0.87420252 1.151000836
Guyana 2.64078719 2.54999901 2.632392779
High income 11.0796957 10.9988656 10.92583151
Hong Kong SAR, China 6.07328765 6.26907897 6.393600526
Honduras 1.03974902 1.03026679 1.057648023
Heavily indebted poor countries (HIPC) 0.24289522 0.25699304 0.267777322

15
Croatia 4.21645564 4.12395314 3.973804906
Haiti 0.22572362 0.23128811 0.271140187
Hungary 4.49412894 4.25965983 4.265574976
IBRD only 4.53164969 4.5103187 4.518461558
IDA & IBRD total 3.56755878 3.54360325 3.538532139
IDA total 0.53152736 0.53679658 0.528406895
IDA blend 0.92089429 0.91472658 0.865592101
Indonesia 2.56418887 1.94683915 1.81937838
IDA only 0.33012885 0.34107692 0.353659149
India 1.5946684 1.5886001 1.727670507
Ireland 7.73815559 7.5381103 7.313939808
Iran, Islamic Rep. 8.09848284 8.10358603 8.384101101
Iraq 4.78906125 4.99158936 4.89491703
Iceland 5.61399182 5.86694629 6.059657407
Israel 9.54796776 8.32178547 7.863181348
Italy 6.20541386 5.73294188 5.270866786
Jamaica 2.62561521 2.83102233 2.581445886
Jordan 3.02120983 2.86244305 2.965238308
Japan 9.63862829 9.78081507 9.538706103
Kazakhstan 14.4694179 15.4293165 14.36316974
Kenya 0.28223971 0.29290959 0.305923722
Kyrgyz Republic 1.80694839 1.72078957 1.646395339
Cambodia 0.36916972 0.37289047 0.437653585
Kiribati 0.5860581 0.57780146 0.569873207
St. Kitts and Nevis 4.41036743 4.44431861 4.549986213
Korea, Rep. 11.6328246 11.7492008 11.57034541
Kuwait 30.5582147 27.888466 25.84922928
Latin America & Caribbean (excluding 2.91345931 2.92400533 2.962682203
high income)
Lao PDR 0.26345149 0.24105438 0.294364883
Lebanon 4.08633681 3.8178923 3.843598231

16
Liberia 0.24826999 0.22528525 0.214493389
Libya 8.38146426 8.9024133 8.95879433
St. Lucia 2.30425257 2.29299826 2.282928389
Latin America & Caribbean 3.06075117 3.07258159 3.101639104
Least developed countries: UN 0.28270894 0.29921602 0.319277934
classification
Low income 0.31928007 0.30239589 0.307958345
Liechtenstein 1.30195275 1.38999296 1.182172313
Sri Lanka 0.78492651 0.75246092 0.885247473
Lower middle income 1.50136841 1.43166989 1.465210654
Low & middle income 3.52101948 3.49437545 3.494088681
Lesotho 1.19382826 1.20032792 1.207715726
Late-demographic dividend 6.70980343 6.77778727 6.752829594
Lithuania 4.62950967 4.27365724 4.378090123
Luxembourg 20.0842195 18.4983197 17.36212137
Latvia 3.47174755 3.5182409 3.498192882
Macao SAR, China 2.32747381 2.04508359 2.174572354
Morocco 1.88711755 1.75237994 1.750794556
Moldova 1.38355238 1.40453233 1.386829142
Madagascar 0.12110303 0.13574825 0.130420845
Maldives 2.79707328 2.62941387 3.068372355
Middle East & North Africa 6.14188914 5.964599 6.205010364
Mexico 4.23217531 4.12649966 3.990446149
Marshall Islands 1.81032142 1.80329481 1.795694223
Middle income 3.88591814 3.86283825 3.866731892
North Macedonia 4.32237868 3.77992618 3.614451035
Mali 0.0621895 0.06241754 0.083369355
Malta 6.38190073 5.49231748 5.400613957
Myanmar 0.21532536 0.24801468 0.41375859
Middle East & North Africa (excluding 3.96270547 3.95142339 3.965035582
high income)

17
Montenegro 3.76389822 3.61855388 3.55607179
Mongolia 9.28466502 13.4474855 7.088025678
Mozambique 0.12551427 0.15723466 0.320578017
Mauritania 0.71627393 0.69930064 0.689388119
Mauritius 3.15928885 3.23390958 3.353110472
Malawi 0.07121542 0.07732541 0.078339597
Malaysia 7.52394446 8.02577374 8.130210313
North America 16.1689902 16.1636907 16.36685114
Namibia 1.54212943 1.17717807 1.651692817
New Caledonia 14.0167181 16.0922397 16.00593173
Niger 0.10488806 0.10483227 0.110542757
Nigeria 0.58903116 0.57133767 0.545794085
Nicaragua 0.77231925 0.75064438 0.791576323
Netherlands 10.1647588 10.3100628 9.920138075
Norway 9.94098023 11.4501188 9.270945132
Nepal 0.21697773 0.24657453 0.298463303
Nauru 3.92421442 4.06653729 4.021851008
New Zealand 7.74727683 7.53195741 7.686575825
OECD members 9.7809491 9.70883431 9.550638232
Oman 16.9122986 16.3031674 15.18879511
Other small states 7.08519925 6.77480108 7.62789783
Pakistan 0.87300072 0.85916081 0.851472804
Panama 2.68220486 2.79463357 2.255854757
Peru 1.8663843 1.91959048 2.051984358
Philippines 0.93820748 0.99248892 1.05114223
Palau 14.3437075 14.5796887 14.77119029
Papua New Guinea 0.66554759 0.79428967 0.795074226
Poland 7.87983006 7.94628251 7.517151585
Pre-demographic dividend 0.52889036 0.54134894 0.542315604
Korea, Dem. People’s Rep. 1.97806111 1.44447379 1.617371103
Portugal 4.37605313 4.34402931 4.331554028

18
Paraguay 0.82288206 0.83475631 0.864029477
Pacific island small states 1.00536252 1.04127998 1.066127745
Post-demographic dividend 10.600844 10.5443248 10.35978947
French Polynesia 3.0263199 3.03856056 2.955679873
Qatar 42.8603754 36.3879175 43.85730795
Romania 4.07431546 3.55016708 3.516153691
Russian Federation 12.784979 12.3935565 11.85752777
Rwanda 0.0698663 0.07427922 0.075764224
South Asia 1.35654512 1.35008778 1.456572745
Saudi Arabia 19.3736599 18.0034004 19.44066648
Sudan 0.30070684 0.30968739 0.299732598
Senegal 0.59046346 0.61114804 0.624760004
Singapore 6.84675847 10.3119819 10.30633191
Solomon Islands 0.35610649 0.35300655 0.343539796
Sierra Leone 0.15350683 0.1736274 0.186560088
El Salvador 1.06813422 0.99428079 0.998428944
Somalia 0.0478724 0.04659643 0.045347231
Serbia 6.12060018 6.26511069 5.282521917
Sub-Saharan Africa (excluding high 0.83596491 0.83112261 0.8487486
income)
South Sudan 0.13161632 0.13988025 0.141748232
Sub-Saharan Africa 0.83636201 0.83146875 0.84917769
Small states 7.05944973 6.87537361 7.462652569
Sao Tome and Principe 0.60336829 0.59179955 0.580793656
Suriname 4.17347412 3.50424363 3.598912291
Slovak Republic 6.0590229 6.11280356 5.661581328
Slovenia 7.18548104 6.86955139 6.213686845
Sweden 4.94230083 4.67142078 4.478182178
Eswatini 1.11781378 1.00207942 1.098404505
Sint Maarten (Dutch part) 20.1134527 19.5335592 19.46132413
Seychelles 4.98329615 4.48443007 5.418677963

19
Syrian Arab Republic 2.18808738 1.86062445 1.640539063
Turks and Caicos Islands 5.8127752 5.70147707 5.805988295
Chad 0.04789996 0.05297841 0.053407242
East Asia & Pacific (IDA & IBRD 5.821845 5.84587201 5.828371644
countries)
Europe & Central Asia (IDA & IBRD 7.95302984 7.71664246 7.395730502
countries)
Togo 0.36703526 0.38226911 0.36731663
Thailand 4.3722824 4.40371476 4.620377146
Tajikistan 0.37252844 0.43177205 0.628730158
Turkmenistan 12.3147548 12.4359056 12.51709612
Latin America & the Caribbean (IDA & 3.02705251 3.04206466 3.071084588
IBRD countries)
Timor-Leste 0.25892458 0.38155025 0.399696508
Middle East & North Africa (IDA & IBRD 4.00250138 3.99079367 4.004803622
countries)
Tonga 1.03509933 1.11702107 1.19779665
South Asia (IDA & IBRD) 1.35654512 1.35008778 1.456572745
Sub-Saharan Africa (IDA & IBRD 0.83636201 0.83146875 0.84917769
countries)
Trinidad and Tobago 33.773712 34.3810032 33.96641445
Tunisia 2.48951627 2.52603294 2.605932406
Turkey 4.41456543 4.27732997 4.479773496
Tuvalu 1.02439706 1.01326333 1.002643092
Tanzania 0.20286286 0.23053823 0.231426985
Uganda 0.11777975 0.13642646 0.141664527
Ukraine 6.48760281 5.97664185 5.020747064
Upper middle income 6.49097274 6.53796747 6.527571821
Uruguay 2.57310562 2.23843031 1.984240835
United States 16.3104711 16.3234768 16.50283724
Uzbekistan 3.88973319 3.41744243 3.420722746

20
St. Vincent and the Grenadines 2.33340711 1.92427869 1.920054014
Venezuela, RB 6.76939679 6.17528543 6.164731034
British Virgin Islands 6.14366492 6.10170902 6.198316603
Vietnam 1.58370812 1.62230763 1.819893977
Vanuatu 0.45562106 0.4143745 0.583633966
World 5.00506885 4.99759902 4.980706852
Samoa 1.04722669 1.03828185 1.030157995
Yemen, Rep. 0.76282275 1.01389989 0.878995612
South Africa 8.87252339 8.68659025 8.979062348
Zambia 0.25350635 0.26507835 0.292412222
Zimbabwe 0.59415152 0.87456305 0.884721294

3, GIẢI QUYẾT BÀI TOÁN


N=750

Bước 1: Đặt giả thuyết

H0: các nhóm có trung bình bằng nhau (µ1=µ2=µ3)

H1: tồn tại ít nhất một cặp trung bình khác nhau (Ǝ! µi≠µj, i≠j)

Bước 2: Xếp hạng tất cả các giá trị của k mẫu theo thứ tự tăng dần. Những giá trị hạng
bằng nhau sẽ nhận giá trị trung bình.

Country Name: 2012 Xếp 2013 Xếp 2014 Xếp


hạng hạng hạng
của dữ của dữ của
liệu liệu dữ
năm năm liệu
2012 2013 năm
2014
Aruba 13.15772 63 8.353561 126 8.410064 123

21
Afghanistan 0.345149 646 0.310341 653 0.293946 665
Angola 1.330219 509 1.253776 515 1.290307 514
Albania 1.692908 475 1.749211 471 1.978763 443
Andorra 5.916884 230 5.901775 231 5.832906 235
Arab World 4.83778 277 4.674925 284 4.886988 276
United Arab Emirates 19.29492 26 18.55924 27 22.93961 16
Argentina 4.60918 290 4.49854 296 4.781508 280
Armenia 1.974479 445 1.89704 455 1.898719 454
Antigua and Barbuda 5.800097 240 5.729938 246 5.74442 244
Australia 17.0729 31 16.09583 40 15.38877 45
Austria 7.387077 156 7.368748 157 6.869868 173
Azerbaijan 3.824877 341 3.785069 343 3.931561 334
Burundi 0.030539 749 0.030365 750 0.0447 747
Belgium 8.562879 122 8.689543 118 8.32816 127
Benin 0.562342 613 0.580953 608 0.614206 598
Burkina Faso 0.158663 706 0.179132 702 0.162018 704
Bangladesh 0.447035 629 0.456321 627 0.473658 625
Bulgaria 6.119457 220 5.450696 252 5.871616 232
Bahrain 20.51918 18 23.81127 14 23.45541 15
Bahamas, The 5.416022 254 7.630262 143 6.52007 189
Bosnia and Herzegovina 6.174442 214 6.187911 211 6.384939 197
Belarus 6.679992 186 6.736652 183 6.701958 185
Belize 1.410385 495 1.48498 489 1.400941 497
Bermuda 7.356863 158 7.051815 168 8.838315 117
Bolivia 1.810943 462 1.794477 467 1.906364 453
Brazil 2.358548 419 2.505409 414 2.612934 403
Barbados 5.183176 260 5.094919 261 4.467477 301
Brunei Darussalam 24.22676 13 19.29518 25 22.22918 17
Bhutan 1.165566 523 1.295928 513 1.39223 499
Botswana 2.074828 439 2.535297 410 3.367451 367
Central African Republic 0.066125 736 0.066779 735 0.067357 734

22
Canada 14.90622 49 14.74108 52 15.15893 47
Central Europe and the Baltics 6.504367 191 6.344838 200 6.148883 216
Switzerland 4.723574 283 4.972836 272 4.311563 312
Chile 4.653625 286 4.736431 282 4.649062 287
China 7.424751 153 7.557211 145 7.543908 146
Cote d'Ivoire 0.431418 632 0.483787 624 0.487688 623
Cameroon 0.285198 668 0.306783 657 0.308792 655
Congo, Dem. Rep. 0.034799 748 0.050309 742 0.063331 737
Congo, Rep. 0.658568 594 0.667916 592 0.65336 595
Colombia 1.735179 472 1.927536 447 1.790357 468
Comoros 0.197567 700 0.237377 686 0.202813 699
Cabo Verde 1.001605 545 0.974527 549 0.948114 550
Costa Rica 1.656721 476 1.602246 483 1.618088 481
Caribbean small states 8.888217 114 9.132325 104 8.87122 116
Cuba 3.211894 370 3.084348 373 3.080994 374
Curacao 39.44566 3 33.8994 8 37.72629 4
Cayman Islands 9.080735 105 8.933158 110 8.919209 111
Cyprus 6.096342 223 5.1998 259 5.260462 258
Czech Republic 9.611986 94 9.384892 99 9.165978 103
Germany 9.1993 102 9.390623 98 8.88937 113
Djibouti 0.595583 601 0.689151 591 0.80383 578
Dominica 1.911914 451 1.858905 459 1.908687 452
Denmark 6.514801 190 6.862565 175 5.935712 229
Dominican Republic 2.227692 431 2.133805 436 2.118995 437
Algeria 3.477108 363 3.525557 355 3.73552 346
East Asia & Pacific 5.773948 243 5.791154 241 5.776128 242
(excluding high income)
Early-demographic dividend 2.29764 424 2.213076 433 2.298216 423
East Asia & Pacific 6.307835 203 6.331191 202 6.294256 204
Europe & Central Asia 8.000712 133 7.733937 140 7.421073 154
(excluding high income)

23
Europe & Central Asia 7.47384 151 7.289515 161 6.915939 171
Ecuador 2.464794 416 2.610035 404 2.753266 397
Egypt, Arab Rep. 2.511715 413 2.414037 418 2.232732 430
Euro area 6.997097 169 6.844462 177 6.474921 195
Spain 5.660939 249 5.084398 262 5.033824 265
Estonia 13.324 62 15.09372 48 14.84882 50
Ethiopia 0.09234 726 0.111487 722 0.118241 720
European Union 6.917802 170 6.753825 181 6.379149 199
Fragile and conflict affected 0.849363 566 0.888269 555 0.895931 554
situations
Finland 9.075433 106 8.68178 120 8.660721 121
Fiji 1.225062 516 1.330207 510 1.350071 508
France 5.075062 263 5.062172 264 4.573182 291
Faroe Islands 12.34009 69 14.1651 58 12.46291 66
Micronesia, Fed. Sts. 1.298289 512 1.350122 505 1.39928 498
Gabon 2.917367 388 2.906039 390 2.756382 396
United Kingdom 7.355898 159 7.145844 164 6.49744 192
Georgia 2.263802 427 2.113793 438 2.41646 417
Ghana 0.456886 626 0.549479 614 0.531372 620
Gibraltar 13.73245 60 14.58441 53 15.65746 43
Guinea 0.242355 683 0.211076 697 0.219672 693
Gambia, The 0.23869 685 0.220351 692 0.253641 677
Guinea-Bissau 0.157649 707 0.155734 709 0.160335 705
Equatorial Guinea 4.960735 273 4.796612 278 4.763967 281
Greece 7.247007 162 6.336615 201 6.180337 212
Grenada 2.525529 412 2.813728 393 2.222383 432
Greenland 10.00502 86 9.803251 89 8.989182 107
Guatemala 0.78403 583 0.874203 560 1.151001 524
Guyana 2.640787 399 2.549999 409 2.632393 400
High income 11.0797 76 10.99887 77 10.92583 78
Hong Kong SAR, China 6.073288 224 6.269079 205 6.393601 196

24
Honduras 1.039749 534 1.030267 537 1.057648 530
Heavily indebted poor 0.242895 682 0.256993 676 0.267777 672
countries (HIPC)
Croatia 4.216456 318 4.123953 321 3.973805 330
Haiti 0.225724 690 0.231288 688 0.27114 671
Hungary 4.494129 297 4.25966 316 4.265575 315
IBRD only 4.53165 293 4.510319 295 4.518462 294
IDA & IBRD total 3.567559 350 3.543603 353 3.538532 354
IDA total 0.531527 619 0.536797 618 0.528407 622
IDA blend 0.920894 552 0.914727 553 0.865592 562
Indonesia 2.564189 408 1.946839 446 1.819378 461
IDA only 0.330129 649 0.341077 648 0.353659 644
India 1.594668 484 1.5886 485 1.727671 473
Ireland 7.738156 139 7.53811 147 7.31394 160
Iran, Islamic Rep. 8.098483 131 8.103586 130 8.384101 124
Iraq 4.789061 279 4.991589 269 4.894917 275
Iceland 5.613992 250 5.866946 233 6.059657 225
Israel 9.547968 96 8.321785 128 7.863181 137
Italy 6.205414 208 5.732942 245 5.270867 257
Jamaica 2.625615 402 2.831022 392 2.581446 406
Jordan 3.02121 383 2.862443 391 2.965238 384
Japan 9.638628 93 9.780815 91 9.538706 97
Kazakhstan 14.46942 55 15.42932 44 14.36317 56
Kenya 0.28224 670 0.29291 666 0.305924 658
Kyrgyz Republic 1.806948 464 1.72079 474 1.646395 478
Cambodia 0.36917 640 0.37289 638 0.437654 630
Kiribati 0.586058 606 0.577801 610 0.569873 612
St. Kitts and Nevis 4.410367 304 4.444319 302 4.549986 292
Korea, Rep. 11.63282 73 11.7492 72 11.57035 74
Kuwait 30.55821 10 27.88847 11 25.84923 12

25
Latin America & Caribbean 2.913459 389 2.924005 387 2.962682 385
(excluding high income)
Lao PDR 0.263451 674 0.241054 684 0.294365 664
Lebanon 4.086337 322 3.817892 342 3.843598 340
Liberia 0.24827 679 0.225285 691 0.214493 696
Libya 8.381464 125 8.902413 112 8.958794 109
St. Lucia 2.304253 422 2.292998 425 2.282928 426
Latin America & Caribbean 3.060751 378 3.072582 375 3.101639 372
Least developed countries: 0.282709 669 0.299216 662 0.319278 652
UN classification
Low income 0.31928 651 0.302396 659 0.307958 656
Liechtenstein 1.301953 511 1.389993 500 1.182172 521
Sri Lanka 0.784927 582 0.752461 586 0.885247 556
Lower middle income 1.501368 488 1.43167 494 1.465211 490
Low & middle income 3.521019 356 3.494375 361 3.494089 362
Lesotho 1.193828 520 1.200328 518 1.207716 517
Late-demographic dividend 6.709803 184 6.777787 178 6.75283 182
Lithuania 4.62951 288 4.273657 314 4.37809 306
Luxembourg 20.08422 20 18.49832 28 17.36212 30
Latvia 3.471748 364 3.518241 357 3.498193 360
Macao SAR, China 2.327474 421 2.045084 441 2.174572 435
Morocco 1.887118 456 1.75238 469 1.750795 470
Moldova 1.383552 502 1.404532 496 1.386829 501
Madagascar 0.121103 719 0.135748 715 0.130421 717
Maldives 2.797073 394 2.629414 401 3.068372 377
Middle East & North Africa 6.141889 218 5.964599 228 6.20501 209
Mexico 4.232175 317 4.1265 320 3.990446 329
Marshall Islands 1.810321 463 1.803295 465 1.795694 466
Middle income 3.885918 337 3.862838 339 3.866732 338
North Macedonia 4.322379 311 3.779926 344 3.614451 348
Mali 0.062189 739 0.062418 738 0.083369 727

26
Malta 6.381901 198 5.492317 251 5.400614 255
Myanmar 0.215325 695 0.248015 680 0.413759 634
Middle East & North Africa 3.962705 332 3.951423 333 3.965036 331
(excluding high income)
Montenegro 3.763898 345 3.618554 347 3.556072 351
Mongolia 9.284665 100 13.44749 61 7.088026 165
Mozambique 0.125514 718 0.157235 708 0.320578 650
Mauritania 0.716274 588 0.699301 589 0.689388 590
Mauritius 3.159289 371 3.23391 369 3.35311 368
Malawi 0.071215 732 0.077325 729 0.07834 728
Malaysia 7.523944 149 8.025774 132 8.13021 129
North America 16.16899 38 16.16369 39 16.36685 34
Namibia 1.542129 487 1.177178 522 1.651693 477
New Caledonia 14.01672 59 16.09224 41 16.00593 42
Niger 0.104888 724 0.104832 725 0.110543 723
Nigeria 0.589031 605 0.571338 611 0.545794 615
Nicaragua 0.772319 584 0.750644 587 0.791576 581
Netherlands 10.16476 85 10.31006 83 9.920138 88
Norway 9.94098 87 11.45012 75 9.270945 101
Nepal 0.216978 694 0.246575 681 0.298463 663
Nauru 3.924214 335 4.066537 324 4.021851 325
New Zealand 7.747277 138 7.531957 148 7.686576 142
OECD members 9.780949 90 9.708834 92 9.550638 95
Oman 16.9123 32 16.30317 37 15.1888 46
Other small states 7.085199 166 6.774801 179 7.627898 144
Pakistan 0.873001 561 0.859161 564 0.851473 565
Panama 2.682205 398 2.794634 395 2.255855 428
Peru 1.866384 457 1.91959 450 2.051984 440
Philippines 0.938207 551 0.992489 548 1.051142 531
Palau 14.34371 57 14.57969 54 14.77119 51
Papua New Guinea 0.665548 593 0.79429 580 0.795074 579

27
Poland 7.87983 136 7.946283 135 7.517152 150
Pre-demographic dividend 0.52889 621 0.541349 617 0.542316 616
Korea, Dem. People’s Rep. 1.978061 444 1.444474 493 1.617371 482
Portugal 4.376053 307 4.344029 309 4.331554 310
Paraguay 0.822882 577 0.834756 573 0.864029 563
Pacific island small states 1.005363 542 1.04128 533 1.066128 529
Post-demographic dividend 10.60084 79 10.54432 80 10.35979 81
French Polynesia 3.02632 382 3.038561 380 2.95568 386
Qatar 42.86038 2 36.38792 5 43.85731 1
Romania 4.074315 323 3.550167 352 3.516154 358
Russian Federation 12.78498 64 12.39356 68 11.85753 71
Rwanda 0.069866 733 0.074279 731 0.075764 730
South Asia 1.356545 503.5 1.350088 507 1.456573 492
Saudi Arabia 19.37366 24 18.0034 29 19.44067 23
Sudan 0.300707 660 0.309687 654 0.299733 661
Senegal 0.590463 604 0.611148 599 0.62476 597
Singapore 6.846758 176 10.31198 82 10.30633 84
Solomon Islands 0.356106 643 0.353007 645 0.34354 647
Sierra Leone 0.153507 710 0.173627 703 0.18656 701
El Salvador 1.068134 528 0.994281 547 0.998429 546
Somalia 0.047872 744 0.046596 745 0.045347 746
Serbia 6.1206 219 6.265111 206 5.282522 256
Sub-Saharan Africa 0.835965 572 0.831123 576 0.848749 569
(excluding high income)
South Sudan 0.131616 716 0.13988 713 0.141748 711
Sub-Saharan Africa 0.836362 570.5 0.831469 574 0.849178 567.5
Small states 7.05945 167 6.875374 172 7.462653 152
Sao Tome and Principe 0.603368 600 0.5918 603 0.580794 609
Suriname 4.173474 319 3.504244 359 3.598912 349
Slovak Republic 6.059023 226 6.112804 221 5.661581 248
Slovenia 7.185481 163 6.869551 174 6.213687 207

28
Sweden 4.942301 274 4.671421 285 4.478182 300
Eswatini 1.117814 525 1.002079 544 1.098405 527
Sint Maarten (Dutch part) 20.11345 19 19.53356 21 19.46132 22
Seychelles 4.983296 270 4.48443 298 5.418678 253
Syrian Arab Republic 2.188087 434 1.860624 458 1.640539 479
Turks and Caicos Islands 5.812775 238 5.701477 247 5.805988 239
Chad 0.0479 743 0.052978 741 0.053407 740
East Asia & Pacific (IDA & 5.821845 237 5.845872 234 5.828372 236
IBRD countries)
Europe & Central Asia (IDA 7.95303 134 7.716642 141 7.395731 155
& IBRD countries)
Togo 0.367035 642 0.382269 636 0.367317 641
Thailand 4.372282 308 4.403715 305 4.620377 289
Tajikistan 0.372528 639 0.431772 631 0.62873 596
Turkmenistan 12.31475 70 12.43591 67 12.5171 65
Latin America & the 3.027053 381 3.042065 379 3.071085 376
Caribbean (IDA & IBRD
countries)
Timor-Leste 0.258925 675 0.38155 637 0.399697 635
Middle East & North Africa 4.002501 327 3.990794 328 4.004804 326
(IDA & IBRD countries)
Tonga 1.035099 536 1.117021 526 1.197797 519
South Asia (IDA & IBRD) 1.356545 503.5 1.350088 506 1.456573 491
Sub-Saharan Africa (IDA & 0.836362 570.5 0.831469 575 0.849178 567.5
IBRD countries)
Trinidad and Tobago 33.77371 9 34.381 6 33.96641 7
Tunisia 2.489516 415 2.526033 411 2.605932 405
Turkey 4.414565 303 4.27733 313 4.479773 299
Tuvalu 1.024397 539 1.013263 541 1.002643 543
Tanzania 0.202863 698 0.230538 689 0.231427 687
Uganda 0.11778 721 0.136426 714 0.141665 712

29
Ukraine 6.487603 194 5.976642 227 5.020747 266
Upper middle income 6.490973 193 6.537967 187 6.527572 188
Uruguay 2.573106 407 2.23843 429 1.984241 442
United States 16.31047 36 16.32348 35 16.50284 33
Uzbekistan 3.889733 336 3.417442 366 3.420723 365
St. Vincent and the 2.333407 420 1.924279 448 1.920054 449
Grenadines
Venezuela, RB 6.769397 180 6.175285 213 6.164731 215
British Virgin Islands 6.143665 217 6.101709 222 6.198317 210
Vietnam 1.583708 486 1.622308 480 1.819894 460
Vanuatu 0.455621 628 0.414375 633 0.583634 607
World 5.005069 267 4.997599 268 4.980707 271
Samoa 1.047227 532 1.038282 535 1.030158 538
Yemen, Rep. 0.762823 585 1.0139 540 0.878996 558
South Africa 8.872523 115 8.68659 119 8.979062 108
Zambia 0.253506 678 0.265078 673 0.292412 667
Zimbabwe 0.594152 602 0.874563 559 0.884721 557
Lượng khí thải trung bình của 4.973038 x 4.88987 x 4.88632 x
các năm 6

Tổng xếp hạng của các nhóm x 93719 x 93996 x 93910

Bước 3: Cộng các hạng của tất cả các giá trị của từng mẫu lại, kí hiệu R1, R2, R3

R1 = 93719

R2 = 93996

R3 = 93910

Bước 4: Tính giá trị kiểm định.

30
12 𝑅𝑖 2 12 𝑅𝑖 2 12
W= ∑𝑘𝑖=1 − 3(𝑛 + 1) = ∑3𝑖=1 − 3(750 + 1) = ∙
𝑛(𝑛+1) 𝑛𝑖 750(750+1) 𝑛𝑖 750(750+1)

937192 +939962 +939102


( ) − 3(750 + 1) = 0.003
250

Bước 5: So sánh và kết luận

Tra bảng Chi Bình Phương ta thấy X23-1,0.05 = 5.99

Vì W < X23-1,0.05 nên ta không có đủ cơ sở để bác bỏ H0, tức là không có đủ cơ sở để nói


rằng lượng khí thải CO2 trong các năm 2012, 2013 và 2014 có sự khác biệt.

4, THỰC HIỆN KIỂM ĐỊNH BẰNG R:


Code :

A = c(13.15772, 0.345149, 1.330219, 1.692908, 5.916884, 4.83778, 19.29492, 4.60918,


1.974479, 5.800097, 17.0729, 7.387077, 3.824877, 0.030539, 8.562879, 0.562342,
0.158663, 0.447035, 6.119457, 20.51918, 5.416022, 6.174442, 6.679992, 1.410385,
7.356863, 1.810943, 2.358548, 5.183176, 24.22676, 1.165566, 2.074828, 0.066125,
14.90622, 6.504367, 4.723574, 4.653625, 7.424751, 0.431418, 0.285198, 0.034799,
0.658568, 1.735179, 0.197567, 1.001605, 1.656721, 8.888217, 3.211894, 39.44566,
9.080735, 6.096342, 9.611986, 9.1993, 0.595583, 1.911914, 6.514801, 2.227692,
3.477108, 5.773948, 2.29764, 6.307835, 8.000712, 7.47384, 2.464794, 2.511715,
6.997097, 5.660939, 13.324, 0.09234, 6.917802, 0.849363, 9.075433, 1.225062,
5.075062, 12.34009, 1.298289, 2.917367, 7.355898, 2.263802, 0.456886, 13.73245,
0.242355, 0.23869, 0.157649, 4.960735, 7.247007, 2.525529, 10.00502, 0.78403,
2.640787, 11.0797, 6.073288, 1.039749, 0.242895, 4.216456, 0.225724, 4.494129,
4.53165, 3.567559, 0.531527, 0.920894, 2.564189, 0.330129, 1.594668, 7.738156,
8.098483, 4.789061, 5.613992, 9.547968, 6.205414, 2.625615, 3.02121, 9.638628,
14.46942, 0.28224, 1.806948, 0.36917, 0.586058, 4.410367, 11.63282, 30.55821,
2.913459, 0.263451, 4.086337, 0.24827, 8.381464, 2.304253, 3.060751, 0.282709,

31
0.31928, 1.301953, 0.784927, 1.501368, 3.521019, 1.193828, 6.709803, 4.62951,
20.08422, 3.471748, 2.327474, 1.887118, 1.383552, 0.121103, 2.797073, 6.141889,
4.232175, 1.810321, 3.885918, 4.322379, 0.062189, 6.381901, 0.215325, 3.962705,
3.763898, 9.284665, 0.125514, 0.716274, 3.159289, 0.071215, 7.523944, 16.16899,
1.542129, 14.01672, 0.104888, 0.589031, 0.772319, 10.16476, 9.94098, 0.216978,
3.924214, 7.747277, 9.780949, 16.9123, 7.085199, 0.873001, 2.682205, 1.866384,
0.938207, 14.34371, 0.665548, 7.87983, 0.52889, 1.978061, 4.376053, 0.822882,
1.005363, 10.60084, 3.02632, 42.86038, 4.074315, 12.78498, 0.069866, 1.356545,
19.37366, 0.300707, 0.590463, 6.846758, 0.356106, 0.153507, 1.068134, 0.047872,
6.1206, 0.835965, 0.131616, 0.836362, 7.05945, 0.603368, 4.173474, 6.059023,
7.185481, 4.942301, 1.117814, 20.11345, 4.983296, 2.188087, 5.812775, 0.0479,
5.821845, 7.95303, 0.367035, 4.372282, 0.372528, 12.31475, 3.027053, 0.258925,
4.002501, 1.035099, 1.356545, 0.836362, 33.77371, 2.489516, 4.414565, 1.024397,
0.202863, 0.11778, 6.487603, 6.490973, 2.573106, 16.31047, 3.889733, 2.333407,
6.769397, 6.143665, 1.583708, 0.455621, 5.005069, 1.047227, 0.762823, 8.872523,
0.253506, 0.594152)

B = c(8.353561, 0.310341, 1.253776, 1.749211, 5.901775, 4.674925, 18.55924,


4.49854, 1.89704, 5.729938, 16.09583, 7.368748, 3.785069, 0.030365, 8.689543,
0.580953, 0.179132, 0.456321, 5.450696, 23.81127, 7.630262, 6.187911, 6.736652,
1.48498, 7.051815, 1.794477, 2.505409, 5.094919, 19.29518, 1.295928, 2.535297,
0.066779, 14.74108, 6.344838, 4.972836, 4.736431, 7.557211, 0.483787, 0.306783,
0.050309, 0.667916, 1.927536, 0.237377, 0.974527, 1.602246, 9.132325, 3.084348,
33.8994, 8.933158, 5.1998, 9.384892, 9.390623, 0.689151, 1.858905, 6.862565,
2.133805, 3.525557, 5.791154, 2.213076, 6.331191, 7.733937, 7.289515, 2.610035,
2.414037, 6.844462, 5.084398, 15.09372, 0.111487, 6.753825, 0.888269, 8.68178,
1.330207, 5.062172, 14.1651, 1.350122, 2.906039, 7.145844, 2.113793, 0.549479,
14.58441, 0.211076, 0.220351, 0.155734, 4.796612, 6.336615, 2.813728, 9.803251,
0.874203, 2.549999, 10.99887, 6.269079, 1.030267, 0.256993, 4.123953, 0.231288,
4.25966, 4.510319, 3.543603, 0.536797, 0.914727, 1.946839, 0.341077, 1.5886,
7.53811, 8.103586, 4.991589, 5.866946, 8.321785, 5.732942, 2.831022, 2.862443,
9.780815, 15.42932, 0.29291, 1.72079, 0.37289, 0.577801, 4.444319, 11.7492,

32
27.88847, 2.924005, 0.241054, 3.817892, 0.225285, 8.902413, 2.292998, 3.072582,
0.299216, 0.302396, 1.389993, 0.752461, 1.43167, 3.494375, 1.200328, 6.777787,
4.273657, 18.49832, 3.518241, 2.045084, 1.75238, 1.404532, 0.135748, 2.629414,
5.964599, 4.1265, 1.803295, 3.862838, 3.779926, 0.062418, 5.492317, 0.248015,
3.951423, 3.618554, 13.44749, 0.157235, 0.699301, 3.23391, 0.077325, 8.025774,
16.16369, 1.177178, 16.09224, 0.104832, 0.571338, 0.750644, 10.31006, 11.45012,
0.246575, 4.066537, 7.531957, 9.708834, 16.30317, 6.774801, 0.859161, 2.794634,
1.91959, 0.992489, 14.57969, 0.79429, 7.946283, 0.541349, 1.444474, 4.344029,
0.834756, 1.04128, 10.54432, 3.038561, 36.38792, 3.550167, 12.39356, 0.074279,
1.350088, 18.0034, 0.309687, 0.611148, 10.31198, 0.353007, 0.173627, 0.994281,
0.046596, 6.265111, 0.831123, 0.13988, 0.831469, 6.875374, 0.5918, 3.504244,
6.112804, 6.869551, 4.671421, 1.002079, 19.53356, 4.48443, 1.860624, 5.701477,
0.052978, 5.845872, 7.716642, 0.382269, 4.403715, 0.431772, 12.43591, 3.042065,
0.38155, 3.990794, 1.117021, 1.350088, 0.831469, 34.381, 2.526033, 4.27733,
1.013263, 0.230538, 0.136426, 5.976642, 6.537967, 2.23843, 16.32348, 3.417442,
1.924279, 6.175285, 6.101709, 1.622308, 0.414375, 4.997599, 1.038282, 1.0139,
8.68659, 0.265078, 0.874563)

C = c(8.410064, 0.293946, 1.290307, 1.978763, 5.832906, 4.886988, 22.93961,


4.781508, 1.898719, 5.74442, 15.38877, 6.869868, 3.931561, 0.0447, 8.32816,
0.614206, 0.162018, 0.473658, 5.871616, 23.45541, 6.52007, 6.384939, 6.701958,
1.400941, 8.838315, 1.906364, 2.612934, 4.467477, 22.22918, 1.39223, 3.367451,
0.067357, 15.15893, 6.148883, 4.311563, 4.649062, 7.543908, 0.487688, 0.308792,
0.063331, 0.65336, 1.790357, 0.202813, 0.948114, 1.618088, 8.87122, 3.080994,
37.72629, 8.919209, 5.260462, 9.165978, 8.88937, 0.80383, 1.908687, 5.935712,
2.118995, 3.73552, 5.776128, 2.298216, 6.294256, 7.421073, 6.915939, 2.753266,
2.232732, 6.474921, 5.033824, 14.84882, 0.118241, 6.379149, 0.895931, 8.660721,
1.350071, 4.573182, 12.46291, 1.39928, 2.756382, 6.49744, 2.41646, 0.531372,
15.65746, 0.219672, 0.253641, 0.160335, 4.763967, 6.180337, 2.222383, 8.989182,
1.151001, 2.632393, 10.92583, 6.393601, 1.057648, 0.267777, 3.973805, 0.27114,
4.265575, 4.518462, 3.538532, 0.528407, 0.865592, 1.819378, 0.353659, 1.727671,
7.31394, 8.384101, 4.894917, 6.059657, 7.863181, 5.270867, 2.581446, 2.965238,

33
9.538706, 14.36317, 0.305924, 1.646395, 0.437654, 0.569873, 4.549986, 11.57035,
25.84923, 2.962682, 0.294365, 3.843598, 0.214493, 8.958794, 2.282928, 3.101639,
0.319278, 0.307958, 1.182172, 0.885247, 1.465211, 3.494089, 1.207716, 6.75283,
4.37809, 17.36212, 3.498193, 2.174572, 1.750795, 1.386829, 0.130421, 3.068372,
6.20501, 3.990446, 1.795694, 3.866732, 3.614451, 0.083369, 5.400614, 0.413759,
3.965036, 3.556072, 7.088026, 0.320578, 0.689388, 3.35311, 0.07834, 8.13021,
16.36685, 1.651693, 16.00593, 0.110543, 0.545794, 0.791576, 9.920138, 9.270945,
0.298463, 4.021851, 7.686576, 9.550638, 15.1888, 7.627898, 0.851473, 2.255855,
2.051984, 1.051142, 14.77119, 0.795074, 7.517152, 0.542316, 1.617371, 4.331554,
0.864029, 1.066128, 10.35979, 2.95568, 43.85731, 3.516154, 11.85753, 0.075764,
1.456573, 19.44067, 0.299733, 0.62476, 10.30633, 0.34354, 0.18656, 0.998429,
0.045347, 5.282522, 0.848749, 0.141748, 0.849178, 7.462653, 0.580794, 3.598912,
5.661581, 6.213687, 4.478182, 1.098405, 19.46132, 5.418678, 1.640539, 5.805988,
0.053407, 5.828372, 7.395731, 0.367317, 4.620377, 0.62873, 12.5171, 3.071085,
0.399697, 4.004804, 1.197797, 1.456573, 0.849178, 33.96641, 2.605932, 4.479773,
1.002643, 0.231427, 0.141665, 5.020747, 6.527572, 1.984241, 16.50284, 3.420723,
1.920054, 6.164731, 6.198317, 1.819894, 0.583634, 4.980707, 1.030158, 0.878996,
8.979062, 0.292412, 0.884721)

x = c(A, B, C)

group = c(rep("A", 250), rep("B", 250), rep("C", 250))

data = data.frame(x,group)

av = aov(x ~ group)

summary(av)

TukeyHSD(av)

kruskal.test(x ~ as.factor(group))

Kết quả:

34
*Nhận xét:

Dòng cuối trong hình trên:

Kruskal-Wallis chi-squared = 0.003426, df = 2, p-value = 0.9983

Ta thấy giá trị W=0.003426, bậc tự do df = 2, p-value = 0.9983>α. Vậy ta không có đủ


cơ sở để bác bỏ H0, tức là không có đủ cơ sở nói lượng khí thải CO2 trong các năm
2012, 2013 và 2014 có sự khác biệt.

Vì ta chấp nhận H0 nên không cần phân tích hậu định, trong trường hợp bác bỏ H0, ta
có thể phân tích hậu định K-W bằng R với code sau:

Require(pgirmess)

35
Kruskalmc(x, group)

R sẽ tự động so sánh trung bình của từng cặp nhóm

*Kết quả:

Trong hình trên có ba cột, cột thứ nhất là giá trị Dij, cột thứ hai là giá trị Ck, cột thứ ba
là kết quả cho biết trung bình của hai nhóm có khác nhau hay không. Vì trung bình của
ba nhóm đều bằng nhau nên cột thứ ba cho kết quả FALSE ở cả ba hàng.

36
III, KIỂM ĐỊNH HOÁN VỊ (PERMUTATION TEST)

*Kiểm định hoán vị (Permutation Test) được sử dụng để so sánh sự tương quan giữa
hai mẫu số liệu, kiểm định xem hai mẫu có sự khác biệt với nhau hay có ý nghĩa thống
kê hay không, nhưng không yêu cầu biến phụ thuộc phải có phân phối chuẩn cũng như
không yêu cầu các nhóm so sánh phải có phương sai bằng nhau.

*Dạng bài:Kiểm định hoán vị

*Công cụ giải:R

1, CƠ SỞ LÝ THUYẾT:
Các bước kiểm định:

Giả định: H0 : d=0 (hai mẫu không có sai lệch)

H1 : d≠0 (hai mẫu khác nhau)

Giả sử ta có 2 mẫu. Mẫu 1 có n phần tử, mẫu 2 có m phần tử.

Bước 1: Nhâp hai mẫu thành một mẫu.

M=n+m (phần tử)

Bước 2: Chọn ngẫu nhiên không hoàn lại n trong số M phần tử coi như nhóm 1. Tính
trung bình 𝑥1 .

Bước 3: Chọn ngẫu nhiên không hoàn lại m trong số M phần tử coi như nhóm 2. Tính
trung bình 𝑥2 .

Bước 4: Tính hiệu số d= 𝑥1 − 𝑥2

Bước 5: Lặp lại bước 2,3,4 nhiều lần, ta có một tập hợp d.

Bước 6: Thẩm định phân bố của d.

* Qui tắc quyết định: Bác bỏ H0 nếu p-value < α ( α là mức ý nghĩa, ta thường lấy
α=5%).
37
2, ÁP DỤNG KIỂM ĐỊNH PERMUTATION TEST ĐỂ KIỂM ĐỊNH TRONG
THỰC TẾ:
Thực hiện giải bài toán trên R.

Bảng dữ liệu: Fossil fuel energy consumption (% of total) between two country
Australia and Italy through years.

Time Autralia Italy


1960 85.9067 85.6104
1961 86.2519 87.6171
1962 87.0699 89.3110
1963 87.1282 89.1612
1964 87.9758 90.1198
1965 88.0420 90.0527
1966 89.2418 90.5499
1967 89.5008 91.6290
1968 90.1046 92.4356
1969 90.2696 93.3052
1970 91.5311 93.3180
1971 91.1778 93.4644
1972 91.3056 93.7367
1973 92.0978 94.5456
1974 91.8273 93.6837
1975 91.7809 93.1620
1976 91.8876 93.9232
1977 92.6790 93.0277
1978 92.6550 93.4931
1979 92.8209 93.8441
1980 93.1825 93.7304
1981 92.7756 93.3511
1982 92.9254 92.5889
38
1983 92.8494 92.5222
1984 93.2067 91.6157
1985 92.8789 91.8148
1986 93.4217 91.4578
1987 93.7386 93.3834
1988 93.5784 92.9048
1989 93.8522 93.2946
1990 93.9113 93.4382
1991 93.6887 92.8954
1992 94.3427 92.5812
1993 93.7583 92.2703
1994 93.8865 92.0879
1995 93.8318 93.0247
1996 93.6482 92.6147
1997 93.5127 92.4435
1998 93.8787 92.2859
1999 93.9279 91.8414
2000 89.3282 91.7301
2001 98.0531 91.4034
2002 95.8902 91.0359
2003 93.8860 90.2161
2004 94.0682 90.4062
2005 94.2159 89.8014
2006 94.2832 89.1909
2007 94.2931 88.1830
2008 94.3515 86.8422
2009 95.5101 84.8513
2010 94.4247 84.6288
2011 94.4217 84.4648
2012 94.3770 82.2014
2013 93.7080 79.9643

39
2014 93.3868 78.5864
2015 89.6256 79.9485

n=56, m=56

Đặt giả thuyết:

H0: d= 0 (hai mẫu không có sự khác biệt)

H1: d≠ 0 (hai mẫu có sự khác biệt)

Bước 1: Đưa dữ liệu vào R.

a=c(85.9067,86.2519,87.0699,87.1282,87.9758,88.0420,89.2418,89.5008,90.1046,90.
2696,91.5311,91.1778,91.3056,92.0978,91.8273,91.7809,91.8876,92.6790,92.6550,92
.8209,93.1825,92.7756,92.9254,92.8494,93.2067,92.8789,93.4217,93.7386,93.5784,9
3.8522,93.9113,93.6887,94.3427,93.7583,93.8865,93.8318,93.6482,93.5127,93.8787,
93.9279,89.3282,98.0531,95.8902,93.8860,94.0682,94.2159,94.2832,94.2931,94.3515
,95.5101,94.4247,94.4217,94.3770,93.7080,93.3868,89.6256)

40
b=c(85.6104,87.6171,89.3110,89.1612,90.1198,90.0527,90.5499,91.6290,92.4356,93.
3052,93.3180,93.4644,93.7367,94.5456,93.6837,93.1620,93.9232,93.0277,93.4931,93
.8441,93.7304,93.3511,92.5889,92.5222,91.6157,91.8148,91.4578,93.3834,92.9048,9
3.2946,93.4382,92.8954,92.5812,92.2703,92.0879,93.0247,92.6147,92.4435,92.2859,
91.8414,91.7301,91.4034,91.0359,90.2161,90.4062,89.8014,89.1909,88.1830,86.8422
,84.8513,84.6288,84.4648,82.2014,79.9643,78.5864,79.9485)

Bước 2: Nhập hai mẫu thành một mẫu x.

41
Bước 3: Đặt tên hai nhóm:

Bước 4: Thực hiện kiểm định với các lệnh có sẵn trong R.

Số lần lặp lại việc lấy mẫu và tính trung bình là 1000 lần.

42
R code:

a=c(85.9067,86.2519,87.0699,87.1282,87.9758,88.0420,89.2418,89.5008,90.1046,90.
2696,91.5311,91.1778,91.3056,92.0978,91.8273,91.7809,91.8876,92.6790,92.6550,92
.8209,93.1825,92.7756,92.9254,92.8494,93.2067,92.8789,93.4217,93.7386,93.5784,9
3.8522,93.9113,93.6887,94.3427,93.7583,93.8865,93.8318,93.6482,93.5127,93.8787,
93.9279,89.3282,98.0531,95.8902,93.8860,94.0682,94.2159,94.2832,94.2931,94.3515
,95.5101,94.4247,94.4217,94.3770,93.7080,93.3868,89.6256)

b=c(85.6104,87.6171,89.3110,89.1612,90.1198,90.0527,90.5499,91.6290,92.4356,93.
3052,93.3180,93.4644,93.7367,94.5456,93.6837,93.1620,93.9232,93.0277,93.4931,93
.8441,93.7304,93.3511,92.5889,92.5222,91.6157,91.8148,91.4578,93.3834,92.9048,9
3.2946,93.4382,92.8954,92.5812,92.2703,92.0879,93.0247,92.6147,92.4435,92.2859,
91.8414,91.7301,91.4034,91.0359,90.2161,90.4062,89.8014,89.1909,88.1830,86.8422
,84.8513,84.6288,84.4648,82.2014,79.9643,78.5864,79.9485)

43
x=c(a,b)

group= c (rep (1,56), rep (2,56))

library (coin)

oneway_test (x~as.factor (group), distribution= approximate (B=1000))

*Nhận xét:

Dòng cuối trong hình trên:

Ta thấy: Z= 2.9444, p-value= 0.003, giá trị của p-value < α= 0.05 vì vậy ta sẽ bác bỏ giả
định H0 , nói cách khác với α= 0.05 thì Z= 1.96, ở đây Z= 2.9444 có nghĩa là sự khác
biệt giữa hai nhóm cao gấp 2.9444 lần so với độ lệch chuẩn. Vậy sự khác biệt giữa hai
mẫu là có ý nghĩa thống kê.

44

You might also like