Professional Documents
Culture Documents
Chương 4
MÔ TẢ DỮ LIỆU BẰNG
CÁC ĐẠI LƯỢNG SỐ
VD: Có các tiêu thức như Thu nhập của dân chúng, Vốn
đầu tư của doanh nghiệp, Lợi nhuận của doanh nghiệp,
Năng suất lúa . . .
1
3/26/2024
b) Đặc điểm
2
3/26/2024
i 1
xi
x
n
x : giá trị trung bình
xi : lượng biến
i : 1; 2; 3…n
: ký hiệu tổng số
3
3/26/2024
i 1
xi
x
n
Đơn vị A B C D E F
Tổng thể
Lượng X1 X2 X3 X4 X5 X6
biến
Lượng 50 57 62 60 65 69
x1 x2 x3 x4 x5 x6
x
n
50 + 57 + 62 + 60 + 65 + 69 = 60,5
6
11
4
3/26/2024
Ví dụ
• Dãy số sau khi phân tổ
Nhận xét
i 1
fi
5
3/26/2024
n
n
xid
x i 1
i
x xd i i
100 i 1
z d
i 1
i i
z
100
6
3/26/2024
VD thực hành
Số sản phẩm đạt tiêu chuẩn kỹ thuật trong 60 ngày ở một phân
xưởng ghi nhận được như sau
450 20
500 28
600 12
VD thực hành
ĐƠN VỊ Xi fi
A 50 5
B 57 4
C 62 6
D 60 3
E 65 4
F 69 5
Xi : lượng biến
fi : tần số hay quyền số
20
7
3/26/2024
x f
i 1
i i
450 *100 550 * 300 650 * 450 750 * 800 850 * 300 950 * 50
x n
100 300 450 800 300 50
f
i 1
i
1405000
x 702,5(kg / ng )
2000
8
3/26/2024
VD thực hành
Trong một đợt sản xuất người ta chọn ngẫu nhiên 50 sản phẩm
và ghi nhận trọng lượng. SP được phân nhóm theo trọng lượng
như sau:
Chú ý:
27
9
3/26/2024
i1
M i Với : Mi = Xi x fi
x n
Xi : lượng biến
M i
i1 xi
fi : tần số (quyền số)
28
• Ví dụ:
• Cách xác định
Sản
X NSLĐ bình NSLĐ bình quân
lượng
N quân (sp/CN)
(sp)
C1: trước tiên xác định
A 21250 425 fi qua Mi và xi
Sau đó sử dụng CT
bình quân gia quyền
B 32400 432
C2: tính trực tiếp, sử
C 32550 434 dụng CT bình quân
cộng điều hoà
Ví dụ:
10
3/26/2024
VD thực hành
Có tình hình về doanh số bán của 3 loại gạo tại một
cửa hàng như sau
VD thực hành
Chi phí sản xuất và giá thành đơn vị của các tổ ở
một phân xưởng
Mi Mi
x 1
Mi 1
Mi
Xi Xi
Trường hợp: M1=M2=M3=Mn-1=Mn,
thì sử dụng công thức 2
n. M i n. M i n
X n
n
n 2
1 1 1
i 1 X i
M i M i
i 1 X i
i 1 Xi
33
11
3/26/2024
VD thực hành.
Xác định giá, lượng xuất khẩu bình quân
Đợt 1 2 3
12
3/26/2024
p pq
i 1
i i
p n
q
i 1
i
q i
q q i 1
n
13
3/26/2024
DT99 DT00
t1 100% t2 105%
DT98 DT99
DT01 DT02
t3 115% t4 110%
DT00 DT01
DT 99 DT 00 DT 01 DT 01
t1 t 2 t 3
DT 98 DT 99 DT 00 DT 98
14
3/26/2024
n
t t1 t2 ... tn
n t n
t
i 1
i
15
3/26/2024
VD thực hành
Năm 2011 2012 2013 2014 2015 2016
GDP thực
(Tỷ đồng) 2915553.9 3076041.9 3246870.2 3455392.1 3696825.7 3944143.7
Tốc độ phát
triển (%) 105.50 105.55 106.42 106.99 106.69
Tính tốc độ phát triển bình quân của GDP thực giai đoạn
2011 - 2021
47
VD thực hành.
Có tài liệu theo dõi về tốc độ phát triển DT của 1
doanh nghiệp qua 10 năm (’93 ’03)
16
3/26/2024
51
17
3/26/2024
54
18
3/26/2024
19
3/26/2024
DM o DM o 1
M o x M o min hM o
( DM o DM o 1 ) ( DM o DM o 1 )
Với:
xMomin: giới hạn dưới của tổ chứa Mo
hMo: khoảng cách tổ của tổ chứa Mo
fMo (DMo): tần số (mật độ) của tổ chứa Mo
fMo-1(Dmo-1): tần số (mật độ) của tổ liền trước tổ chứa Mo
fMo+1(Dmo+1): tần số (mật độ) của tổ liền sau tổ chứa Mo
400 – 500 10
500 – 600 30
600 – 700 45
700 – 800 80
800 – 900 30
900 – 1000 5
Xác định Mo?
Nhận xét
20
3/26/2024
xMomin = 700
hMo = 100
fMo = 80
fMo-1 = 45
fMo+1 =30
80 45
M o 700 100 741,2(kg / ng )
(80 45) (80 30)
0,25 0,12
M0 = 500 + 100
0,25 0,12 0,25 0,125
= 550,9trđ
21
3/26/2024
64
130100
Mo 1705 173,3kg
(130100) (130 114)
65
66
22
3/26/2024
4. Trung vị - Me (Median)
a) Khái niệm: Trung vị là lượng biến của đơn vị
đứng ở vị trí chính giữa trong dãy số lượng biến
được sắp xếp theo thứ tự tăng dần
b) Tính chất
- Trung vị phân chia dãy số lượng biến thành hai
phần có số lượng đơn vị tổng thể bằng nhau.
- Tổng các độ chênh lệch tuyệt đối giữa các
lượng biến với trung vị là một trị số nhỏ nhất
(so với số bình quân hay Mo)
4. Trung vị - Me (Median)
c) Tác dụng
- Trung vị không san bằng, bù trừ chênh lệch
giữa các lượng biến dùng trung vị để bổ sung
hoặc thay thế số bình quân cộng
- Nó không bị tác động bởi các giá trị của lượng
biến bất thường
- Được ứng dụng trong nhiều công tác kỹ thuật
và phục vụ công cộng
- Me có thể tính cho dữ liệu sử dụng thang đo tỷ
lệ, thang đo khoảng và thang đo thứ bậc
4. Trung vị - Me (Median)
d) Phương pháp xác định trung vị:
* Đối với dãy số lượng biến không phân tổ và
không có khoảng cách tổ
– Bước 1: Xác định vị trí chính giữa (vị trí của đơn
vị đứng ở vị trí chính giữa).
• Nếu số đơn vị (n) lẻ: vị trí trung vị là đơn vị thứ:
(n+1)/2
• Nếu số đơn vị (n) chẵn: vị trí trung vị là đơn vị
thứ:
(n/2) và (n/2 +1)
23
3/26/2024
4. Trung vị - Me (Median)
24
3/26/2024
73
120 6 8
150 16 24
170 12 36
200 4 40
Cộng 40/2 = 20 -
74
4. Trung vị - Me (Median)
* Đối với dãy số lượng biến có khoảng cách tổ
đều và không đều
Bước 1: Xác định vị trí tổ chứa giá trị trung vị
(tổ chứa đơn vị đứng ở vị trí có tần số tích lũy ≥
Σfi/2 + 1)
Bước 2: Xác định giá trị gần đúng của trung vị
theo công thức fi
SMe1
Me xMemin hMe 2
f Me
25
3/26/2024
fi
S Me 1
Me x Me min h Me 2
f Me
XMe(min): Giới hạn dưới của tổ có số trung vị
hMe: Trị số khoảng cách tổ có số trung vị
SMe – 1 : Tần số tích lũy của các tổ đứng trước tổ có trung vị
fMe: Tần số của tổ có số trung vị
Σfi: Tổng các tần số
Nhận xét
26
3/26/2024
200
85
Me 700 100 2 718,75( kg / ng )
80
32226
VD thực hành. 11265
Me 3 2 2 4, 291250tr
Tìm Me 7509
Tiền lương Số công Tần số tích
triệu đồng nhân(người) lũy
Dưới 1 2531 2531
1 - 2 3932 6463
2 - 3 4802 11265
3 - 5 7509 18756
5 - 10 7831 …
10 - 20 3416 …
> 20 2223 32226
cộng 32226 … 80
5. Phân vị (percentiles)
Phân vị cung cấp thông tin về cách thức dữ liệu được
trải ra trong một khoảng từ giá trị nhỏ nhất đến giá trị
lớn nhất.
Phân vị thứ p là một giá trị A mà ít nhất có p% các quan
sát có giá trị nhỏ hơn hoặc bằng giá trị A và ít nhất có
(100-p)% có các quan sát có giá trị lớn hơn hoặc bằng
giá trị A.
VD. Một dãy số phân phối có phân vị thứ 20 là A, nghĩa là
trong tập dữ liệu có ít nhất 20% các quan sát có giá trị nhỏ
hơn hoặc bằng giá trị phân vị thứ 20 là A. Ít nhất 80%
quan sát có giá trị lớn hơn hoặc bằng giá trị phân vị thứ 20
là A.
27
3/26/2024
5. Phân vị (percentiles)
* Phương pháp tính phân vị:
- Bước 1: Sắp xếp dữ liệu theo thứ tự tăng dần (từ giá
trị nhỏ đến lớn)
p
- Bước 2: Tính chỉ số i: i = ( )n
100
Với p: là phân vị cần tính và n là số quan sát
- Bước 3:
+ Nếu i không là một số nguyên thì làm tròn i. Số
nguyên tiếp theo lớn hơn i là vị trí của phân vị thứ p.
+ Nếu i là một số nguyên, phân vị thứ p là trung bình
của các giá trị ở vị trí thứ i và i + 1.
5. Phân vị (percentiles)
VD. Có dãy số phân phối sau:
5. Phân vị (percentiles)
a.
Bước 1: Sắp xếp dữ liệu
28
3/26/2024
5. Phân vị (percentiles)
b.
Bước 1: Sắp xếp dữ liệu
p 80
i( ) n 15 12
100 100
+ Bước 3. Do i = 12, phân vị thứ 80 là giá trị trung bình
của dữ liệu thứ 12 và 13 ứng với giá trị 12 (11 + 13)/2.
6. Tứ phân vị (Quartiles)
29
3/26/2024
30
3/26/2024
Tổ 2 58 59 60 61 62 x2 = 60 R*2 = 4
Ưu điểm
• Dễ tính toán, xác định
• Khoảng biến thiên càng nhỏ thì tổng thể càng
đồng đều, số bình quân càng có tính đại biểu
• Giúp ta nhận xét nhanh chóng chênh lệch giữa
đơn vị tiến tiến và lạc hậu
Nhược điểm
• Chỉ liên quan đến Xmax và Xmin mà không tính
tới các lượng biến khác trong dãy số lượng biến
không toàn diện, dễ dẫn đến sai số
Tổ 1 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3,0 3,3 3,6 3,9
Tổ 2 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
31
3/26/2024
i 1
fi
Xét ví dụ: Tính độ lệch tuyệt đối bình quân cho NSLĐ
của 2 tổ CN (5 người/tổ)
(đv:sp/h)
Tổ 1 40 50 60 70 80 x1 = 60 d = ?
Tổ 2 58 59 60 61 62 x2 = 60 d = ?
32
3/26/2024
VD thực hành
Tên CN SẢN PHẨM xi x xi x (xi x)2
(xi) -20 20 400
A 360 -10 10 100
B 370 0 0 0
C 380 10 10 100
D 390 20 20 400
E 400 (xi x) xi x (xi x)2
CỘNG 1.900 0 60 1.000
x x x
2 2
i i
x
2 i 1
n
i 1
n
x
2
x x f x
2 2
i i i fi
2
x i 1
n
i 1
n
x
2
f i 1
i f
i 1
i
33
3/26/2024
Ví dụ
Tổ 1 40 50 60 70 80 x1 = 60
Tổ 2 58 59 60 61 62 x2 = 60
n n
x x x
2 2
i i
19000
2
x1 i 1
n
i 1
n
x
2
5
3600 200
n n
x x x
2 2
i i
18010
2
x2 i 1
n
i 1
n
x
2
5
3600 2
34
3/26/2024
x x
2 2
i x i
x i 1
n
i 1
n
x 2
n n
x x f
2 2
i i x i fi
x i 1
n
i 1
n
x
2
f i 1
i f
i 1
i
Ví dụ
Tổ 1 40 50 60 70 80 x1 = 60 2 = 200
Tổ 2 58 59 60 61 62 x2 = 60 2 = 2
x x
2
i
i 1
x1 200 14,142( sp / h)
n
n
x x
2
i
i 1
x2 2 1, 4142( sp / h)
n
35
3/26/2024
Vx 100% Vx 100%
x Mo
Vx 100 %
Me
Ý nghĩa:
- Dùng so sánh độ phân tán giữa các hiện
tượng có đơn vị tính khác nhau
- Dùng so sánh độ phân tán giữa các hiện
tượng cùng loại nhưng số trung bình không
bằng nhau
36
3/26/2024
Ví dụ
SV Nam SV nữ
Chiều cao bình quân (cm) 167 156
Trọng lượng bình quân (kg) 57 44
CC (cm) 10 11
TL (kg) 9 5
VCC (%) 5,98 7,05
VTL (%) 15,79 11,36
Ví dụ
Có tài liệu về mối liên hệ giữa NSLD (sp/h) với thu nhập (tr$) tại
1 tổ công nhân như sau:
NSLĐ
22 22 24 26 28 29 35 36 40 45
(sp/h)
Thu
nhập 1,0 1,1 1,3 1,4 1,6 1,6 1,8 1,8 2,0 2,1
(tr $)
Yêu cầu:
Xác định NSLD và thu nhập bình quân của công nhân tổ đó
So sánh trình độ đại biểu của 2 số bình quân trên
10
10
37
3/26/2024
10
x 2
7,524
i
Vx 24,51%
x i 1
10
2
x 7,524(sp / h) 30,7
10
y 2 0,349
i Vy 22,26%
y i 1
10
2
y 0,349(tr$) 1,57
VD thực hành
Chọn ngẫu nhiên một số doanh nghiệp của 2 ngành
kinh doanh A và B, tỷ lệ lãi trên vốn (%) của các DN
được ghi nhận như sau:
Ngành A 10,5 9 12 10 8,5 12,5 9,5
Ngành B 8 12 15 10 16 5 6
Hãy tính :
Tỷ lệ lãi trung bình, số trung vị, Mốt
Khoảng biến thiên
Tứ phân vị
Độ trải giữa
Độ lệch tuyệt đối bình quân
Phương sai
Độ lệch chuẩn
Hệ số biến thiên
114
38
3/26/2024
115
39