You are on page 1of 6

Bài 1: Cho tập dữ liệu thu thập được giữa nhiệt độ và doanh thu bán kem như sau:

Nhiệt độ 14.2 16.4 11.9 15.2 18.5 22.1 19.4 25.1 23.4 18.1 22.6 17.2

Doanh thu 215 325 185 332 406 522 412 614 544 421 445 408
(Nghìn
đồng)

a. Tính giá trị trung bình, trung vị, mode, độ lệch chuẩn của Nhiệt độ và Doanh thu.
b. Vẽ biểu đồ Boxplot của Nhiệt độ và Doanh thu.
c. Vẽ biểu đồ Scatter plot giữa Nhiệt độ và Doanh thu.

Giải
a. – Nhiệt độ:

14.2+16.4 +11.9+15.2+18.5+22.1+19.4 +24.1+23.4+18.1+22.6+ 17.2


x́ Nhiệt độ = 12 = 18.675

Dãy sắp xếp:


11.9, 14.2, 15.2, 16.4, 17.2, 18.1, 18.5, 19.4, 22.1, 22.6, 23.4, 25.1
Dãy chẵn:
18.1+18.5
=> Median = 2 = 18.3

Yếu vị: Không có

    
Tính :

(11.9−18.675)2 = 45.9 (18.5−18.675)2 = 0.03


(14.2−18.675) = 20.02 (19.4−18.675) = 0.52
2 2

(15.2−18.675)2 = 12.07 (22.1−18.675)2 = 11.73


(16.4−18.675)2 = 5.17 (22.6−18.675)2 = 15.4
(17.2−18.675)2 = 2.17 (23.4−18.675)2 = 22.32
(18.1−18.675)2 = 0.33 (25.1−18.675)2 = 41.28

1 176.94
σ 2=
12
x (45.9 + 20.02 + 12.07 + 5.17 + 2.17 +0.33 + 0.03 + 0.52 + 11.73 + 15.4 +22.32 +41.28) = 12
=
14.745
Độ lệch chuẩn:
σ❑ = 3.84

- Doanh thu:
215+325+185+332+406 +522+ 412+614+ 544+ 421+ 445+ 408
x́ Doanhthu = 12 = 402.41

- Dãy sắp xếp:


185, 215, 325, 332, 406, 408, 412, 421, 445, 522, 544, 614
Dãy chẵn:
412+408
=> Median = 2 = 410

Tính:
(215−402.41)2 = 35122 ( 412−402.41)2 = 91.96
(325−402.41)2 = 5992.3 (614−402.41)2 = 44770.32
(185−402.41)2 = 47267.1 (544−402.41)2 = 20047.72
(332−402.41)2 = 4957.56 ( 421−402.41)2 = 345.58
( 406−402.41)2 = 12.88 ( 445−402.41)2 = 1813.9
(522−402.41)2 = 14301.76 ( 408−402.41)2 = 31.24

1
σ 2=
12
x (35122 + 5992.3 + 47267.1 + 4957.56 + 12.88 + 14301.76 + 91.96 + 44770.32 + 20047.72 + 345.58
174754.32
+ 1813.9 + 31.24) = 12 = 14562.86

Độ lệch chuẩn:
σ❑ = 120.68

b. – Nhiệt độ
Dãy sắp xếp:
11.9, 14.2, 15.2, 16.4, 17.2, 18.1, 18.5, 19.4, 22.1, 22.6, 23.4, 25.1
Tính:
Số phần tử quan sát: N = 12
Min = 11.9
Max = 25.1
15.2+16.4
Q1 = (median nửa trái) = 2 = 15.8
22.1+ 22.6
Q3 = (median nửa phải) = 2 = 22.35

Q2 = median = 18.3
IQR = Q3 – Q1 = 22.35 – 15.8 = 6.55
Giá trị thấp của biến L(overmin) = Q1 – 1.5 x IQR = 15.8 – 1.5 x 6.55 = 5.975
Giá trị cao của biến U(overmax) = Q3 + 1,5 x IQR = 22.35 + 1.5 x 6.55 = 32.175
Ngoại lai là số nằm ngoài khoảng [L,U]

- Doanh thu
- Dãy sắp xếp:
185, 215, 325, 332, 406, 408, 412, 421, 445, 522, 544, 614
Tính:
Số phần tử quan sát: N = 12
Min = 185
Max = 614
325+332
Q1 = (median nửa trái) = 2 = 328.5
522+ 445
Q3 = (median nửa phải) = 2 = 483.5

Q2 = median = 410
IQR = Q3 – Q1 = 483.5 – 328.5 = 155
Giá trị thấp của biến L = Q1 – 1.5 x IQR = 328.5 - 1.5 x 155 = 96
Giá trị cao của biến U = Q3 + 1,5 x IQR = 483.5 + 1.5 x 155 = 716

c. Vẽ biểu đồ Scatter plot giữa Nhiệt độ và Doanh thu.


Bài 2: Tìm trung vị của tập dữ liệu tuổi

Tuổi Số lượng
1-5 150
6 - 15 1500
16 - 22 300
23 - 50 450
51 - 80 650
81 - 100 60

Tuổi Số lượng Tần số tích luỹ


1-5 150 150
6 - 15 1500 1650
16 - 22 300 1950
23 - 50 450 2400
51 - 80 650 3050
81 - 100 60 3110

Tính:
N = 150 + 1500 + 300 + 450 + 650 + 60 = 3110
Khoảng trung vị: 3110/2 = 1555 (tần số tích luỹ so sánh >= 1/2 )
(∑ freq)l = 150
freqmedian = 1500
L1 = 6
width = 15 – 6 = 9

N /2−(∑freq)l 1555−150
median = L1 + ( freq median
)x width =6+( 1500 ) x 9 = 14.43
Bài 3. Tính ma trận khác biệt của các đối tượng sau:
A1 A2 A3 A4
X1 Orange Good 25 Yes
X2 Pomme Bad 15 Yes
X3 Raisin Excellent 10 Yes
X4 Tomate Fair 30 No

You might also like