Professional Documents
Culture Documents
Nhiệt độ 14.2 16.4 11.9 15.2 18.5 22.1 19.4 25.1 23.4 18.1 22.6 17.2
Doanh thu 215 325 185 332 406 522 412 614 544 421 445 408
(Nghìn
đồng)
a. Tính giá trị trung bình, trung vị, mode, độ lệch chuẩn của Nhiệt độ và Doanh thu.
b. Vẽ biểu đồ Boxplot của Nhiệt độ và Doanh thu.
c. Vẽ biểu đồ Scatter plot giữa Nhiệt độ và Doanh thu.
Giải
a. – Nhiệt độ:
Tính :
1 176.94
σ 2=
12
x (45.9 + 20.02 + 12.07 + 5.17 + 2.17 +0.33 + 0.03 + 0.52 + 11.73 + 15.4 +22.32 +41.28) = 12
=
14.745
Độ lệch chuẩn:
σ❑ = 3.84
- Doanh thu:
215+325+185+332+406 +522+ 412+614+ 544+ 421+ 445+ 408
x́ Doanhthu = 12 = 402.41
Tính:
(215−402.41)2 = 35122 ( 412−402.41)2 = 91.96
(325−402.41)2 = 5992.3 (614−402.41)2 = 44770.32
(185−402.41)2 = 47267.1 (544−402.41)2 = 20047.72
(332−402.41)2 = 4957.56 ( 421−402.41)2 = 345.58
( 406−402.41)2 = 12.88 ( 445−402.41)2 = 1813.9
(522−402.41)2 = 14301.76 ( 408−402.41)2 = 31.24
1
σ 2=
12
x (35122 + 5992.3 + 47267.1 + 4957.56 + 12.88 + 14301.76 + 91.96 + 44770.32 + 20047.72 + 345.58
174754.32
+ 1813.9 + 31.24) = 12 = 14562.86
Độ lệch chuẩn:
σ❑ = 120.68
b. – Nhiệt độ
Dãy sắp xếp:
11.9, 14.2, 15.2, 16.4, 17.2, 18.1, 18.5, 19.4, 22.1, 22.6, 23.4, 25.1
Tính:
Số phần tử quan sát: N = 12
Min = 11.9
Max = 25.1
15.2+16.4
Q1 = (median nửa trái) = 2 = 15.8
22.1+ 22.6
Q3 = (median nửa phải) = 2 = 22.35
Q2 = median = 18.3
IQR = Q3 – Q1 = 22.35 – 15.8 = 6.55
Giá trị thấp của biến L(overmin) = Q1 – 1.5 x IQR = 15.8 – 1.5 x 6.55 = 5.975
Giá trị cao của biến U(overmax) = Q3 + 1,5 x IQR = 22.35 + 1.5 x 6.55 = 32.175
Ngoại lai là số nằm ngoài khoảng [L,U]
- Doanh thu
- Dãy sắp xếp:
185, 215, 325, 332, 406, 408, 412, 421, 445, 522, 544, 614
Tính:
Số phần tử quan sát: N = 12
Min = 185
Max = 614
325+332
Q1 = (median nửa trái) = 2 = 328.5
522+ 445
Q3 = (median nửa phải) = 2 = 483.5
Q2 = median = 410
IQR = Q3 – Q1 = 483.5 – 328.5 = 155
Giá trị thấp của biến L = Q1 – 1.5 x IQR = 328.5 - 1.5 x 155 = 96
Giá trị cao của biến U = Q3 + 1,5 x IQR = 483.5 + 1.5 x 155 = 716
Tuổi Số lượng
1-5 150
6 - 15 1500
16 - 22 300
23 - 50 450
51 - 80 650
81 - 100 60
Tính:
N = 150 + 1500 + 300 + 450 + 650 + 60 = 3110
Khoảng trung vị: 3110/2 = 1555 (tần số tích luỹ so sánh >= 1/2 )
(∑ freq)l = 150
freqmedian = 1500
L1 = 6
width = 15 – 6 = 9
N /2−(∑freq)l 1555−150
median = L1 + ( freq median
)x width =6+( 1500 ) x 9 = 14.43
Bài 3. Tính ma trận khác biệt của các đối tượng sau:
A1 A2 A3 A4
X1 Orange Good 25 Yes
X2 Pomme Bad 15 Yes
X3 Raisin Excellent 10 Yes
X4 Tomate Fair 30 No