You are on page 1of 39

3/26/2024

Chương 4

MÔ TẢ DỮ LIỆU BẰNG
CÁC ĐẠI LƯỢNG SỐ

4.1. Các tham số đo độ 4.2. Các tham số đo độ


tập trung biến thiên tiêu thức
1. Khái niệm, đặc điểm, 1. Ý nghĩa
điều kiện vận dụng 2. Các loại tham số đo độ
2. Các loại tham số đo độ biến thiên tiêu thức
tập trung tiêu thức - Khoảng biến thiên
- Số bình quân cộng
- Số bình quân nhân - Độ trải giữa
- Mốt (Mode) - Độ lệch tuyệt đối
- Trung vị (Median) - Phương sai
- Phân vị - Độ lệch tiêu chuẩn
- Hệ số biến thiên

4.1. Các tham số đo độ tập trung

4.1.1. Tham số đo độ tập trung trong thống kê


a) Khái niệm
Tham số đo độ tập trung là trị số biểu hiện mức độ
đại biểu theo một tiêu thức nào đó của một hiện
tượng bao gồm nhiều đơn vị cùng loại.

VD: Có các tiêu thức như Thu nhập của dân chúng, Vốn
đầu tư của doanh nghiệp, Lợi nhuận của doanh nghiệp,
Năng suất lúa . . .

1
3/26/2024

b) Đặc điểm

- Có tính tổng hợp và khái quát cho hiện tượng


nghiên cứu, dùng một trị số để nêu lên mức độ
phổ biến, có tính đại diện của tiêu thức nghiên
cứu
- San bằng mọi chênh lệch giữa các đơn vị về trị
số của tiêu thức nghiên cứu

c) Điều kiện vận dụng

- Chỉ được tính tham số đo độ tập trung cho một


tổng thể bao gồm các đơn vị cùng loại

- Tham số đo độ tập trung cần được tính lấy ra từ


tổng thể có nhiều đơn vị

d) Tác dụng (ý nghĩa)


- Được sử dụng để phản ánh đặc điểm chung về
mặt lượng của hiện tượng kinh tế xã hội số lớn
trong điều kiện thời gian, không gian cụ thể.
Ví dụ: giá thành bình quân, năng suất bình quân
-Được sử dụng để so sánh các hiện tượng không
cùng quy mô.
Ví dụ: Để so sánh giữa các doanh nghiệp không có cùng qui mô,
người ta không thể so sánh lợi nhuận, doanh thu của từng doanh
nghiệp mà phải so sánh NSLĐ bình quân, mức lợi nhuận bình
quân…

2
3/26/2024

d) Tác dụng (ý nghĩa)


-Được sử dụng trong nghiên cứu các quá trình,
xu hướng biến động qua thời gian
Ví dụ: Thông qua NSLĐ bình quân của doanh nghiệp qua các
năm, có thể thấy được xu hướng phát triển của NSLĐ trong toàn
doanh nghiệp.
- Nó có vị trí quan trọng trong việc vËn dông c¸c
phương ph¸p ph©n tÝch thèng kª
Ví dụ: Phân tích biến động của hiện tượng, phân tích mối liên hệ
giữa các hiện tượng, dự đoán mức độ của hiện tượng, điều tra
chọn mẫu . . .

4.1.2. Các loại tham số đo độ tập trung


1. Số bình quân cộng
a) Điều kiện vận dụng:
Các lượng biến phải có quan hệ tổng với nhau

VD. Thu nhập CN1 tháng 8/2022 là 6 tr VDN


Thu nhập CN2 tháng 8/2022 là 8 tr VDN
Tổng 2 giá trị trên: 14 tr VND là tổng thu nhập của hai công
nhân trong tháng 8/2022

4.1.2. Các loại tham số đo độ tập trung

b) Công thức tổng quát:


n


i 1
xi
x 
n
x : giá trị trung bình
xi : lượng biến
i : 1; 2; 3…n
: ký hiệu tổng số

3
3/26/2024

Các trường hợp vận dụng cụ thể

- Trường hợp các đơn vị không được phân tổ


 sử dụng công thức tổng quát
 Công thức số bình quân cộng giản đơn:
n


i 1
xi
x
n

Đơn vị A B C D E F
Tổng thể
Lượng X1 X2 X3 X4 X5 X6
biến
Lượng 50 57 62 60 65 69

x1  x2  x3  x4  x5  x6
x
n
50 + 57 + 62 + 60 + 65 + 69 = 60,5
6
11

- Trường hợp dãy số đã được phân tổ


+ Dãy số đã được phân tổ không có khoảng cách
tổ; bao gồm các thành phần: lượng biến, tần số
và/hoặc tần suất tương ứng
• Ví dụ: thu nhập của tổ CN T2/04 (triệu VND)

1.5 1.5 1.0 1.5 1.0 2.0 1.0 2.0


1.5 2.5 1.0 0.6 1.5 1.5 1.5 1.0
2.0 1.5 1.5 2.0 0.6 1.0 2.0 1.5
1.0 1.0 0.6 1.5 2.5 1.0 0.6 1.0
0.6 1.0 1.0 1.0 1.5 1.0 1.0 2.0

4
3/26/2024

Ví dụ
• Dãy số sau khi phân tổ

Mức thu nhập


(trđ)
0,6 1,0 1,5 2,0 2,5
Số lượng công
nhân (người)
5 15 12 6 2

Nhận xét

• Lượng biến x1 = 0,6 (tr) có tần số f1= 5 có nghĩa là


số lần xuất hiện của nó trong tổng thể là 5 lần
• Do vậy tổng giá trị của các lượng biến x1 không
phải là 0,6 (tr$) mà phải là 0,6 * 5 = 3,0 (trđ)

xi (trđ) 0,6 1,0 1,5 2,0 2,5


fi (người) 5 15 12 6 2
xi (trđ) 3,0 15,0 18,0 12,0 5,0

+ Dãy số đã được phân tổ không có


khoảng cách tổ

Thu nhập bình quân:


n
   xi 3  15  18  12  5 53
i 1
x    1,325( tr $)
n 5  15  12  6  2 40
n
Công thức tổng quát:
(CT bình quân gia quyền x
i 1
i  fi
với fi là quyền số) x n

 i 1
fi

5
3/26/2024

Các biến thể của CT bình quân gia quyền

* Khi quyền số là tần Khi quyền số là tần


suất di (%) suất di (lần)

n
n
 xid
x  i 1
i
x xd i i
100 i 1

Tại sao? Tại sao?


di = 100 di = 1

Ví dụ: Tính giá thành sản xuất bình quân

Giá thành sản


Tỷ lệ (%)
xuất ($/sp)

Tháng 4/03 155 58

Tháng 5/03 156 32

Tháng 6/03 158 10

Tính giá thành sản xuất bình quân

z d
i 1
i i
z
100

155 * 58  156 * 32  158 *10


z  155,62($ / sp)
100

6
3/26/2024

VD thực hành
Số sản phẩm đạt tiêu chuẩn kỹ thuật trong 60 ngày ở một phân
xưởng ghi nhận được như sau

Số sản phẩm đạt tiêu chuẩn kỹ thuật Số ngày

450 20
500 28
600 12

Tính số sản phẩm đạt tiêu chuẩn kỹ thuật trung bình


trong một ngày (503,3 SP)

VD thực hành
ĐƠN VỊ Xi fi
A 50 5
B 57 4
C 62 6
D 60 3
E 65 4
F 69 5
Xi : lượng biến
fi : tần số hay quyền số

20

+ Dãy số lượng biến có khoảng cách tổ


Khối lượng
• Xét ví dụ: lương thực Số người
bình quân (người)
• Tài liệu thống kê
(kg/người)
khối lượng lương
thực bình quân đầu 400 – 500 100
người tại 1 địa 500 – 600 300
phương năm 1995 600 – 700 450
700 – 800 800
800 – 900 300
900 – 1000 50

7
3/26/2024

Các bước tiến hành

Bước 1: Tính trị số giữa ximin  ximax xi


của từng tổ theo công 400  500 450
thức 550
500  600
600  700 650
ximin ximax
xi  700  800 750
2 800  900 850
900  1000 950

Các bước tiến hành

Bước 2: Xác định giá trị xi fi xifi


của số bình quân bằng 450 100 45000
công thức bình quân gia
quyền 550 300 165000
n 650 450 292500
i 1
xi fi 750 800 600000
x  n 850 300 255000
i1
fi 950 50 47500

Xác định số bình quân cộng cho VD trên

x f
i 1
i i
450 *100  550 * 300  650 * 450  750 * 800  850 * 300  950 * 50
x n

100  300  450  800  300  50
f
i 1
i

1405000
x  702,5(kg / ng )
2000

8
3/26/2024

VD thực hành
Trong một đợt sản xuất người ta chọn ngẫu nhiên 50 sản phẩm
và ghi nhận trọng lượng. SP được phân nhóm theo trọng lượng
như sau:

Trọng lượng (gam) Số sản phẩm


484-490 5
490-496 10
496-502 15
502-508 13
508-514 7
Tổng 50
Tính trọng lượng trung bình trên 1 sản phẩm

Chú ý:

Đối với những dãy số có khoảng cách tổ mở,


chúng ta phải căn cứ vào khoảng cách tổ cũng
như trị số giữa của tổ sát cạnh đó để tính.

ximin – Dưới 500 - 600 - 700 - 800 - 900


trở
ximax (kg) 500 600 700 800 900 lên
fi (ng) 100 300 450 800 300 100
xi 450 550 650 750 850 950

** Số bình quân điều hòa gia quyền


Áp dụng khi biết giá trị của các lượng biến xi
và tổng lượng biến của từng tổ Mi (= xifi), khi
không có trực tiếp số đơn vị có trong tổng thể
Số bình quân điều hòa gia quyền được sử dụng
khi không biết đầy đủ các thông tin để tính toán;
đồng thời phải dựa vào các phương trình kinh tế
có liên quan

27

9
3/26/2024

Sản lượng = Năng suất bình quân x Diện tích


Tổng mức tiền lương = Tiền lương b/q x số lao động
Doanh thu = Giá bán x Lượng tiêu thụ
Lượng sản phẩm = NSLĐb/q x số lao động
Chi phí sản xuất = Giá thành đơn vị x Sản lượng
......
M 1  M 2  M 3  ...  Mn  1  Mn
x
M1 M 2 M 3 Mn  1 Mn
   ...  
X1 X 2 X 3 Xn  1 Xn
n


i1
M i Với : Mi = Xi x fi
x  n
Xi : lượng biến
M i

i1 xi
fi : tần số (quyền số)
28

• Ví dụ:
• Cách xác định
Sản
X NSLĐ bình NSLĐ bình quân
lượng
N quân (sp/CN)
(sp)
C1: trước tiên xác định
A 21250 425 fi qua Mi và xi
Sau đó sử dụng CT
bình quân gia quyền
B 32400 432
C2: tính trực tiếp, sử
C 32550 434 dụng CT bình quân
cộng điều hoà

Ví dụ:

21250  32400  32550


x
21250 32400 32550
 
425 432 434
NSLĐ 86200
Bquân của  x  50  75  75  431 ( sp / CN )
3 XN

10
3/26/2024

VD thực hành
Có tình hình về doanh số bán của 3 loại gạo tại một
cửa hàng như sau

Loại gạo Đơn giá Doanh thu


(1000/kg) (1000 đồng)
Loại 1 8 24.000
Loại 2 6 24.000
Loại 3 4 24.000

• Tính giá trung bình 1 kg gạo mà cửa hàng


bán ra

VD thực hành
Chi phí sản xuất và giá thành đơn vị của các tổ ở
một phân xưởng

Tổ Giá thành đơn vị Chi phí sản


SP (trđ/SP) xuất (trđ)
Tổ 1 20,0 6000
Tổ 2 20,2 5050
Tổ 3 20,4 4080

• Tính giá thành bình quân 1 sp của phân


xưởng

Chú ý: Trường hợp: M1≠M2≠M3≠…Mn-


1≠Mn, thì sử dụng công thức 1

Mi Mi
x  1
Mi 1
   Mi
Xi Xi
Trường hợp: M1=M2=M3=Mn-1=Mn,
thì sử dụng công thức 2
n. M i n. M i n
X  n
 n
 n 2
1 1 1

i 1 X i
M i M i 
i 1 X i
i 1 Xi
33

11
3/26/2024

Vd: Tại một địa phương có tình hình


thu hoạch một loại cây trồng, thống kê
ghi nhận thông tin sau:
Tên Sản lượng Năng suất Diện tích
xã thu hoạch thu hoạch sản xuất
(tạ) M (tạ/ha) Xi (ha) fi
A 600 40 15,0
B 600 30 20,0
C 600 48 12,5
D 600 60 10,0
E 600 50 12,0
34

• Tính năng suất thu hoạch bình quân


của 5 xã nêu trên ?
5
Nsth   43,16547ta / ha
1 1 1 1 1
   
40 30 48 60 50
Sản lượng = NS thu hoạch bình quân x Diện tích gieo trồng

SL = NSTH b/q x DT gieo trồng


3.000 = 43,16546763 x 69,5
35

VD thực hành.
Xác định giá, lượng xuất khẩu bình quân

Có tài liệu về tình hình XNK của CT X tháng 8/03

Đợt 1 2 3

Giá xuất khẩu (USD/t) 180 186 185

Lượng xuất khẩu (t) 2200 1800 2000

12
3/26/2024

Công thức nào sẽ được sử dụng?


n

p pq
i 1
i i
p n

q
i 1
i

q i
q q i 1
n

Tình hình xuất khẩu của công ty X

Giá xuất khẩu bình quân


tháng (USD/t) 183,467
Khối lượng xuất khẩu
bình quân mỗi đợt hàng
trong tháng (t)
2.000

2. Số bình quân nhân


Điều kiện vận dụng: khi các lượng biến có quan
hệ tích với nhau
• Quan hệ giữa các lượng biến là quan hệ tích
khi nhân các lượng biến lại với nhau, thu được
kết quả là giá trị có ý nghĩa
• VD: Thu nhập của ông B bằng 1,5 lần thu nhập
của ông A, còn thu nhập của ông C bằng 1,1
lần thu nhập của ông B  thu nhập của ông C
bằng 1,1*1,5 thu nhập của ông A

13
3/26/2024

VD. Có tài liệu về tình hình doanh thu của


Công ty A qua các năm (đv: %)

DT 99’ so DT 00’ so DT 01’ so DT 02’ so


với DT 98’ với DT 99’ với DT 00’ với DT 01’

100 105 115 110

Các lượng biến liền nhau có quan hệ tích với


nhau

Tình hình doanh thu của Công ty A

DT99 DT00
t1   100% t2   105%
DT98 DT99

DT01 DT02
t3   115% t4   110%
DT00 DT01

Quan hệ tích giữa các lượng biến


DT99 DT00 DT00
t1  t 2     100% 105%
DT98 DT99 DT98

DT 99 DT 00 DT 01 DT 01
t1  t 2  t 3    
DT 98 DT 99 DT 00 DT 98

DT99 DT00 DT01 DT02 DT02


t1  t2  t3  t4     
DT98 DT99 DT00 DT01 DT98

14
3/26/2024

Tình hình doanh thu của Công ty A

DT99 DT00 DT01 DT02 DT02


t1 t2 t3 t4     
DT98 DT99 DT00 DT01 DT98

Tốc độ phát triển DT trong cả giai đoạn 1998 –


2002 là T = ti (=132,825%)

 Tốc độ phát triển bình quân về DT trong giai


đoạn đó chính là số bình quân nhân

Công thức số bình quân nhân

n
t  t1  t2  ... tn
n t n
t
i 1
i

Tốc độ phát triển DT bình quân của CT X


trong giai đoạn 1998 – 2002:

t  4 100 105 115 110  107,35(%)

15
3/26/2024

VD thực hành
Năm 2011 2012 2013 2014 2015 2016
GDP thực
(Tỷ đồng) 2915553.9 3076041.9 3246870.2 3455392.1 3696825.7 3944143.7
Tốc độ phát
triển (%) 105.50 105.55 106.42 106.99 106.69

Năm 2017 2018 2019 2020 2021


GDP thực (Tỷ
đồng) 4217874.8 4532739.4 4866315.6 5005755.7 5133981.3
Tốc độ phát
triển (%) 106.94 107.47 107.36 102.87 102.56

Tính tốc độ phát triển bình quân của GDP thực giai đoạn
2011 - 2021

• Tính trung bình nhân trên nền Excel

Năm Chỉ số cá thể


2011 1.06
2012 1.05 =GEOMEAN(1.06...1.1)
2013 1.1
2014 1.07
2015 1.1
- 1.075803276

47

VD thực hành.
Có tài liệu theo dõi về tốc độ phát triển DT của 1
doanh nghiệp qua 10 năm (’93 ’03)

Năm 1994 1995 1996 1997 1998

t (%) 110 125 115 110 110

Năm 1999 2000 2001 2002 2003

t (%) 110 110 115 125 115

16
3/26/2024

Nếu tính số bình quân nhân theo CT giản đơn:


t  10 110 125 115 110 110 110 110 115 125 115
Cách này quá dài dòng và phức tạp khi số lượng lượng
biến nhiều
Nên phân tổ số liệu

Tốc độ phát triển DT (%) 110 115 125 ti


Số năm có tốc độ tương ứng
5 3 2 fi

• Sử dụng CT bình quân nhân gia quyền


n
fi
t fi
t i
i 1

t  53 2 1105 1153 1252



10
t 3.827163 1,1436 114,36%

Ví dụ: Có tình hình sản xuất của một


đơn vị trong 10 năm, tốc độ phát triển
bình quân 5 năm đầu 110%; 3 năm kế
tiếp 115% và 2 năm cuối cùng là
125%

t  10 (1,1)5  (1,15)3  (1,25)2  1,14 100%  114%

51

17
3/26/2024

3. Mốt (Mode - Mo)

Khái niệm: Còn gọi là yếu vị, là biểu hiện


của một tiêu thức có giá trị gặp nhiều lần
nhất trong tổng thể hay trong dãy số phân
phối

3. Mốt (Mode - Mo)


Tác dụng của Mode
– Biểu hiện mức độ phổ biến nhất, đo lường khuynh hướng
tập trung.
– Không san bằng, bù trừ chênh lệch giữa các lượng biến
 Mode có thể sử dụng để bổ sung hay thay thế cho số bình
quân trong trường hợp tính số bình quân gặp khó khăn
– Không chịu ảnh hưởng của các lượng biến có giá trị đột
xuất (quá lớn hay quá nhỏ)
– Một tập dữ liệu có thể không xác định đượng trị số của Mo
và không có giá trị xuất hiện nhiều nhất; ngược lại trong
một số trường hợp sẽ có hiện tượng nhiều Mo.

Trong thực tế vận dụng Mo để tổ chức


sản xuất, bán hàng hợp với thị hiếu
người tiêu dùng (cỡ giày dép, cỡ và
kiểu dáng quần áo…), mùa vụ, vùng,
dân tộc…

54

18
3/26/2024

 Phương pháp tính Mo


Tiến hành phân tổ

TH1: Dãy số phân phối không có khoảng cách tổ:


Lượng biến có tần số lớn nhất chính là Mo
VD. Điểm số môn TKUD của một lớp như sau
Điểm số (Xi) Số sinh viên Độ tuổi (Xi) Số sinh viên
4 10 18 530
5 15 19 400
6 30 20 50
7 52 21 20
8 15 Tổng 3000
9 2 VD. Tuổi sinh viên năm 1 của môt
Tổng 124 trường Đại học năm học 2019-2020

 Phương pháp tính Mo


TH2: Dãy số phân tổ có khoảng cách tổ:
+ Xác định vị trí của Mo
+ Xác định giá trị gần đúng của Mo

Xác định vị trí của Mo


* Các tổ có khoảng cách tổ đều nhau
Tổ có tần số (tần suất) lớn nhất là tổ chứa Mo

* Các tổ có khoảng cách tổ không đều nhau


 Tổ có mật độ phân phối lớn nhất là tổ chứa
Mo (mật độ phân phối là tỷ số giữa các tần số với khoảng cách
tổ tương ứng)

19
3/26/2024

 Xác định giá trị gần đúng của Mo


f M  f M 1
M o  xM min  hM o o
o
( f M  f M 1 )  ( f M  f M 1 )
o
o o o o

DM o  DM o 1
M o  x M o min  hM o
( DM o  DM o 1 )  ( DM o  DM o 1 )
Với:
xMomin: giới hạn dưới của tổ chứa Mo
hMo: khoảng cách tổ của tổ chứa Mo
fMo (DMo): tần số (mật độ) của tổ chứa Mo
fMo-1(Dmo-1): tần số (mật độ) của tổ liền trước tổ chứa Mo
fMo+1(Dmo+1): tần số (mật độ) của tổ liền sau tổ chứa Mo

VD. Nhận xét tình hình lương thực bình quân


đầu người tại địa phương

Khối lượng lương thực


bình quân (kg/người) Số người (người)

400 – 500 10
500 – 600 30
600 – 700 45
700 – 800 80
800 – 900 30
900 – 1000 5
Xác định Mo?

Nhận xét

Dãy số phân phối có


khoảng cách tổ đều xi min - ximax
(kg/người) fi (người)
nhau  xác định Mo
dựa vào tần số 400 – 500 10
Vị trí của Mo là tổ thứ 500 – 600 30
4 (khối lưượng 700- 600 – 700 45
800 kg) vì f4 = 80 700 – 800 80
(max) 800 – 900 30
900 – 1000 5

20
3/26/2024

Áp dụng CT1 tính giá trị gần đúng của Mo

xMomin = 700
hMo = 100
fMo = 80
fMo-1 = 45
fMo+1 =30
80  45
M o  700  100   741,2(kg / ng )
(80  45)  (80  30)

VD. Có tài liệu về doanh thu của 79 cửa hàng trong


tháng 12/20xx như sau:
Doanh thu Cửa hàng Khoảng Mật độ
(trđ) (fi) cách tổ (hi) phân phối
(Di)
200 – 400 8 200 0,04
400 – 500 12 100 0,12
500 – 600 25 100 0,25
600 – 800 25 200 0,125
800 – 1000 9 200 0,045
Tổng 79

• Mode ở vị trí tổ 3 (500 – 600) vì có mật độ


phân phối lớn nhất. Ta có:

0,25 0,12
M0 = 500 + 100
0,25 0,12  0,25 0,125
= 550,9trđ

21
3/26/2024

VD Thực Hành (Mode)


Năng suất (kg) Số công nhân (người)
150 – 155 4
155 – 160 10
160 – 165 61
165 - 170 100
170 - 175 130
175 - 180 114
180 – 185 62
185 - 190 11
190 – 195 8
Cộng 500

64

130100
Mo 1705 173,3kg
(130100)  (130 114)

173,3kg là giá trị gần đúng của mốt,


hay năng suất lao động 173,3kg được
gặp nhiều nhất trong số 500 công nhân
này.

65

VD Thực Hành (Mode)


Mức Số công Khoảng cách Mật độ
lương nhân (fi) tổ (hi) phân phối
(tr đ) Di = fi/hi
4 – 4,5 10
4,5 – 5,0 15
5,0 – 6,0 40
6,0 - 8,0 30
8,0 -12,0 5

66

22
3/26/2024

4. Trung vị - Me (Median)
a) Khái niệm: Trung vị là lượng biến của đơn vị
đứng ở vị trí chính giữa trong dãy số lượng biến
được sắp xếp theo thứ tự tăng dần
b) Tính chất
- Trung vị phân chia dãy số lượng biến thành hai
phần có số lượng đơn vị tổng thể bằng nhau.
- Tổng các độ chênh lệch tuyệt đối giữa các
lượng biến với trung vị là một trị số nhỏ nhất
(so với số bình quân hay Mo)

4. Trung vị - Me (Median)
c) Tác dụng
- Trung vị không san bằng, bù trừ chênh lệch
giữa các lượng biến dùng trung vị để bổ sung
hoặc thay thế số bình quân cộng
- Nó không bị tác động bởi các giá trị của lượng
biến bất thường
- Được ứng dụng trong nhiều công tác kỹ thuật
và phục vụ công cộng
- Me có thể tính cho dữ liệu sử dụng thang đo tỷ
lệ, thang đo khoảng và thang đo thứ bậc

4. Trung vị - Me (Median)
d) Phương pháp xác định trung vị:
* Đối với dãy số lượng biến không phân tổ và
không có khoảng cách tổ
– Bước 1: Xác định vị trí chính giữa (vị trí của đơn
vị đứng ở vị trí chính giữa).
• Nếu số đơn vị (n) lẻ: vị trí trung vị là đơn vị thứ:
(n+1)/2
• Nếu số đơn vị (n) chẵn: vị trí trung vị là đơn vị
thứ:
(n/2) và (n/2 +1)

23
3/26/2024

4. Trung vị - Me (Median)

- Bước 2: Xác định trung vị:


• Nếu số đơn vị là lẻ thì: Me = xm
• Nếu số đơn vị là chẵn thì:
x  xm 1
Me  m
2

Ví dụ: Theo dõi doanh thu của 10 cửa hàng


thuộc công ty thương mại trong tháng 2/03 (đv:
tỷ VND)

0,5 1,6 0,8 1,1 0,3

0,9 2,1 1,2 1,3 1,4

Dãy số sắp xếp


0,3 0,5 0,8 0,9 1,1
1,2 1,3 1,4 1,6 2,1

Ví dụ: Theo dõi doanh thu của 10 cửa hàng


thuộc công ty thương mại trong tháng 2/03
(đv: tỷ VND)
n = 10, vị trí trung vị là đơn vị thứ 5 và 6
 X5 = 1,1 và X6 = 1,2
• Với số đơn vị là chẵn nên ta có giá trị trung
vị:
Me = (1,1 + 1,2)/2 = 1,15

24
3/26/2024

* Đối với dãy số lượng biến có phân tổ


nhưng không có khoảng cách tổ

Cộng dồn tần số tích lũy đến vừa


bằng hoặc vượt quá một nửa tổng tần
số, thì lượng biến ứng với tần số tích
lũy này có số trung vị.

73

Năng suất LĐ Số công nhân Tần số tích lũy


(tạ) (người) (Sm)
100 2 2

120 6 8

150 16 24

170 12 36

200 4 40

Cộng 40/2 = 20 -
74

4. Trung vị - Me (Median)
* Đối với dãy số lượng biến có khoảng cách tổ
đều và không đều
Bước 1: Xác định vị trí tổ chứa giá trị trung vị
(tổ chứa đơn vị đứng ở vị trí có tần số tích lũy ≥
Σfi/2 + 1)
Bước 2: Xác định giá trị gần đúng của trung vị
theo công thức  fi
 SMe1
Me  xMemin  hMe 2
f Me

25
3/26/2024

 fi
 S Me  1
Me  x Me min  h Me 2
f Me
XMe(min): Giới hạn dưới của tổ có số trung vị
hMe: Trị số khoảng cách tổ có số trung vị
SMe – 1 : Tần số tích lũy của các tổ đứng trước tổ có trung vị
fMe: Tần số của tổ có số trung vị
Σfi: Tổng các tần số

Nhận xét tình hình lương thực tại địa


phương

Khối lượng lương thực


Số người (người)
bình quân (kg/người)
400 – 500 10
500 – 600 30
600 – 700 45
700 – 800 80
800 – 900 30
900 – 1000 5
Xác định Me?

Nhận xét

Khối lượng Tần


Vị trí của Me là tổ Số
lương thực số tích
người
(700-800) vì có tần bình quân lũy
(fi)
số bằng 165  (kg/người) (Si)
(200/2+1 = 101) 400 – 500 10 10
Tổ chứa Me là tổ 500 – 600 30 40
thứ 4 600 – 700 45 85
700 – 800 80 165
800 – 900 30 195
900 – 1000 5 200

26
3/26/2024

Áp dụng CT tính giá trị gần đúng của Me

xMe min = 700


hMe = 100
fMe = 80
SMe-1 = 85

200
 85
Me  700  100  2  718,75( kg / ng )
80

 32226 
VD thực hành.   11265 
Me  3  2   2   4, 291250tr
Tìm Me  7509 
 
Tiền lương Số công Tần số tích
triệu đồng nhân(người) lũy
Dưới 1 2531 2531
1 - 2 3932 6463
2 - 3 4802 11265
3 - 5 7509 18756
5 - 10 7831 …
10 - 20 3416 …
> 20 2223 32226
cộng 32226 … 80

5. Phân vị (percentiles)
 Phân vị cung cấp thông tin về cách thức dữ liệu được
trải ra trong một khoảng từ giá trị nhỏ nhất đến giá trị
lớn nhất.
 Phân vị thứ p là một giá trị A mà ít nhất có p% các quan
sát có giá trị nhỏ hơn hoặc bằng giá trị A và ít nhất có
(100-p)% có các quan sát có giá trị lớn hơn hoặc bằng
giá trị A.
VD. Một dãy số phân phối có phân vị thứ 20 là A, nghĩa là
trong tập dữ liệu có ít nhất 20% các quan sát có giá trị nhỏ
hơn hoặc bằng giá trị phân vị thứ 20 là A. Ít nhất 80%
quan sát có giá trị lớn hơn hoặc bằng giá trị phân vị thứ 20
là A.

27
3/26/2024

5. Phân vị (percentiles)
* Phương pháp tính phân vị:
- Bước 1: Sắp xếp dữ liệu theo thứ tự tăng dần (từ giá
trị nhỏ đến lớn)
p
- Bước 2: Tính chỉ số i: i = ( )n
100
Với p: là phân vị cần tính và n là số quan sát
- Bước 3:
+ Nếu i không là một số nguyên thì làm tròn i. Số
nguyên tiếp theo lớn hơn i là vị trí của phân vị thứ p.
+ Nếu i là một số nguyên, phân vị thứ p là trung bình
của các giá trị ở vị trí thứ i và i + 1.

5. Phân vị (percentiles)
VD. Có dãy số phân phối sau:

a. Tính phân vị thứ 90 cho dãy số trên


b. Tính phân vị thứ 80 cho dãy số trên

5. Phân vị (percentiles)
a.
 Bước 1: Sắp xếp dữ liệu

 Bước 2: Tính chỉ số i


p  90 
i( ) n    15  13,5
100  100vị thứ 90 là vị trí thứ 14
+ Bước 3: Do i = 13,5, phân
tương ứng là 15.

28
3/26/2024

5. Phân vị (percentiles)
b.
 Bước 1: Sắp xếp dữ liệu

 Bước 2. Tính chỉ số I

p  80 
i( ) n    15  12
100  100
+ Bước 3. Do i = 12, phân vị thứ 80 là giá trị trung bình
của dữ liệu thứ 12 và 13 ứng với giá trị 12 (11 + 13)/2.

6. Tứ phân vị (Quartiles)

Tứ phân vị chia dữ liệu ra làm 4 phần, mỗi phần chức


khoảng ¼ hoặc 25% các quan sát.
- Q1: Tứ phân vị thứ 1 hay là phân vị thứ 25
- Q2: Tứ phân vị thứ 2, phân vị thứ 50 hay trung vị
- Q3: Tứ phân vị thứ 3, phân vị thứ 75
Để tính tứ phân vị trong Excel ta dùng hàm Quartile
(array,quart) với array ta chọn toàn bộ dữ liệu, quart
tương ứng với 1, 2, 3 ứng với Q1, Q2, Q3.

4.2. Độ biến thiên tiêu thức


4.2.1. Ý nghĩa của độ biến thiên tiêu thức

- Đánh giá trình độ đại biểu của số bình quân, số


trung vị, Mốt. Độ biến thiên tiêu thức càng lớn,
mức độ đại biểu càng thấp.

- Phản ánh đặc trưng của dãy số như đặc trưng về


phân phối, về kết cấu, về tính chất đồng đều của
tổng thể.

29
3/26/2024

4.2. Độ biến thiên tiêu thức


4.2.1. Ý nghĩa của độ biến thiên tiêu thức
- Phản ánh chất lượng công tác và nhịp điệu hoàn
thành kế hoạch chung của tổng thể cũng như của
từng bộ phận, phát hiện khả năng tiềm tàng của các
đơn vị.
- Độ biến thiên tiêu thức còn được dùng trong nhiều
trường hợp nghiên cứu thống kê khác như phân tích
sự biến động, phân tích mối liên hệ, dự đoán thống
kê và điều tra chọn mẫu.

4.2. Độ biến thiên tiêu thức


VD. Có hai tổ công nhân, mỗi tổ có 5
người với các mức năng suất lao động như
sau (sp/h)
Tổ 1: 40, 50, 60, 70, 80
Tổ 2: 58, 59, 60, 61, 62
NSLĐ trung bình của mỗi tổ là bao nhiêu?
NSLĐ trung bình của tổ nào đại diện hơn?

4.2.2. Các tham số đo độ biến thiên tiêu


thức
(1) Khoảng biến thiên
(2) Độ trải giữa
(3) Độ lệch tuyệt đối trung bình
(4) Phưương sai
(5) Độ lệch tiêu chuẩn
(6) Hệ số biến thiên

30
3/26/2024

1. Khoảng biến thiên (Range) - R*

Khái niệm: Khoảng biến thiên là độ lệch giữa


lượng biến lớn nhất và lượng biến nhỏ nhất
trong dãy số lượng biến
R* = Xmax - Xmin
Xét ví dụ: NSLĐ của 2 tổ CN (5 người/tổ)
(đv:sp/h)
Tổ 1 40 50 60 70 80 x1 = 60 R*1 = 40

Tổ 2 58 59 60 61 62 x2 = 60 R*2 = 4

Nhận xét về ưu, nhược điểm của R*

Ưu điểm
• Dễ tính toán, xác định
• Khoảng biến thiên càng nhỏ thì tổng thể càng
đồng đều, số bình quân càng có tính đại biểu
• Giúp ta nhận xét nhanh chóng chênh lệch giữa
đơn vị tiến tiến và lạc hậu
Nhược điểm
• Chỉ liên quan đến Xmax và Xmin mà không tính
tới các lượng biến khác trong dãy số lượng biến
không toàn diện, dễ dẫn đến sai số

2. Độ trải giữa (Interquartile range)


• Khái niệm: Độ trải giữa là chênh lệch giữa tứ
phân vị thứ 3 và tứ phân vị thứ nhất, thể hiện độ
phân tán của 50% dữ liệu ở giữa của dãy số
• RI = Q3-Q1
• VD: Xác định các giá trị RI cho dãy 2 dãy số liệu
về tiền lương (tr.) của 2 tổ, mỗi tổ có 11 người

Tổ 1 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3,0 3,3 3,6 3,9
Tổ 2 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9

Tổ 1: RI = 3,3 – 1,5 = 1,8 triệu đồng


Tổ 2: RI = 2,7 – 2,1 = 0,6 triệu đồng

31
3/26/2024

3. Độ lệch tuyệt đối bình quân


(Mean absolute deviation)
n
Khái niệm: Độ lệch tuyệt
đối bình quân là số bình  i 1
xi  x
quân cộng của các độ dx 
lệch tuyệt đối giữa lượng n
n
biến với số bình quân
của các lượng biến đó

i 1
xi  x  f i
dx  n

i 1
fi

(khi xi có các tần số fi khác nhau)

3. Độ lệch tuyệt đối bình quân


(Mean absolute deviation)
Độ lệch tuyệt đối bình quân tính đến chênh lệch của tất
cả các lượng biến so với số bình quân (xi - )  khắc
X
phục được nhược điểm của khoảng biến thiên
Các độ lệch này có thể mang dấu (+) hoặc dấu (-) và
tổng các độ lệch bao giờ cũng bằng 0 (số bình quân san
bằng chênh lệch). Vì vậy, muốn tổng hợp được các độ
lệch phải loại trừ dấu của nó, nghĩa là lấy giá trị tuyệt
đối của các độ lệch
Nhược điểm: Bỏ qua sự khác biệt thực tế về dấu cộng,
trừ (+,-) của các độ lệch.

3. Độ lệch tuyệt đối bình quân


(trung bình)

Xét ví dụ: Tính độ lệch tuyệt đối bình quân cho NSLĐ
của 2 tổ CN (5 người/tổ)
(đv:sp/h)
Tổ 1 40 50 60 70 80 x1 = 60 d = ?

Tổ 2 58 59 60 61 62 x2 = 60 d = ?

32
3/26/2024

VD thực hành
Tên CN SẢN PHẨM xi  x xi  x (xi x)2
(xi) -20 20 400
A 360 -10 10 100
B 370 0 0 0
C 380 10 10 100
D 390 20 20 400
E 400 (xi x)  xi  x (xi  x)2
CỘNG 1.900 0 60 1.000

360  370  380  390  400  xi  x 60


x  380 d   12
5 n 5
97

4. Phương sai (variance) - 2


Khái niệm: Phương sai là số bình quân cộng của
bình phương các độ lệch giữa lượng biến với số
bình quân của các lượng biến đó.
Công thức 1 (trường hợp dãy số không phân tổ)
n n

 x  x   x
2 2
i i
x 
2 i 1
n
 i 1
n

 x
2

Công thức 2 (trường hợp dãy số đã phân tổ –


mỗi lượng biến xi có tần số xuất hiện là fi)
n n

 x  x  f  x
2 2
i i i  fi
2
x  i 1
n
 i 1
n

 x
2

f i 1
i f
i 1
i

33
3/26/2024

Ví dụ
Tổ 1 40 50 60 70 80 x1 = 60

Tổ 2 58 59 60 61 62 x2 = 60

n n

 x  x   x
2 2
i i
19000
2
 x1  i 1
n
 i 1
n

 x 
2

5
 3600  200
n n

 x  x   x
2 2
i i
18010
2
 x2  i 1

n
 i 1

n

 x 
2

5
 3600  2

Excel: var(number1, number2, number3, . . .)

Nhận xét về ưu, nhược điểm của 2


Ưu điểm
- Trong công thức tính toán đã bao gồm tất
cả các đơn vị tổng thể  toàn diện hơn R*
- Sự khác nhau về dấu giữa các độ lệch đã
được khắc phục bằng cách tính phương sai
Nhược điểm
- Khuyếch đại sai số
- Đơn vị tính toán không đồng nhất

VD. Thực hành


Xác định phương sai
Khối lượng lương thực
Số người (người)
bình quân (kg/người)
400 – 500 10
500 – 600 30
600 – 700 45
700 – 800 80
800 – 900 30
900 – 1000 5
Tính phương sai của khối lượng lương thực bình quân

34
3/26/2024

VD. Thực hành


Số lỗi tìm thấy trong một cuốn sách 500 trang
Số lỗi Số trang
0 102
1 138
2 140
3 79
4 33
5 8
Tổng 500

Tính phương sai số lỗi trong cuốn sách

5. Độ lệch tiêu chuẩn (Standard deviation) - 


Khái niệm: Độ lệch tiêu chuẩn là căn bậc hai
của phương của phương sai.
Công thức:  x   x2
n n

 x  x 
2 2
i x i
x  i 1

n
 i 1

n
 x  2

n n

 x  x   f
2 2
i i x i  fi
x  i 1
n
 i 1
n

 x
2

f i 1
i f
i 1
i

Ví dụ
Tổ 1 40 50 60 70 80 x1 = 60 2 = 200

Tổ 2 58 59 60 61 62 x2 = 60 2 = 2

 x  x 
2
i
i 1
 x1   200  14,142( sp / h)
n
n

 x  x 
2
i
i 1
 x2   2  1, 4142( sp / h)
n

35
3/26/2024

Nhận xét về ưu, nhược điểm của độ lệch


chuẩn 
Ưu điểm
- Trong công thức tính toán đã bao gồm tất cả các
đơn vị tổng thể  toàn diện hơn R*
- Không khuyếch đại sai số nên tốt hơn 2
 Độ lệch tiêu chuẩn là chỉ tiêu đo độ biến thiên
khá toàn diện
Nhược điểm:
- Không so sánh được độ biến thiên tiêu thức của các
hiện tượng khác nhau, hoặc giữa các hiện tượng
cùng loại nhưng số bình quân không bằng nhau.

6. Hệ số biến thiên (Coefficient)- V


Khái niệm: Hệ số biến thiên là số tương đối tính được
bằng cách so sánh giữa độ lệch tiêu chuẩn với số bình
quân của các lượng biến.
Công thức:

 
Vx   100% Vx  100%
x Mo

Vx   100 %
Me

6. Hệ số biến thiên (Coefficient)- V

Ý nghĩa:
- Dùng so sánh độ phân tán giữa các hiện
tượng có đơn vị tính khác nhau
- Dùng so sánh độ phân tán giữa các hiện
tượng cùng loại nhưng số trung bình không
bằng nhau

36
3/26/2024

Ví dụ

SV Nam SV nữ
Chiều cao bình quân (cm) 167 156
Trọng lượng bình quân (kg) 57 44
CC (cm) 10 11
TL (kg) 9 5
VCC (%) 5,98 7,05
VTL (%) 15,79 11,36

Ví dụ
Có tài liệu về mối liên hệ giữa NSLD (sp/h) với thu nhập (tr$) tại
1 tổ công nhân như sau:

NSLĐ
22 22 24 26 28 29 35 36 40 45
(sp/h)
Thu
nhập 1,0 1,1 1,3 1,4 1,6 1,6 1,8 1,8 2,0 2,1
(tr $)
Yêu cầu:
Xác định NSLD và thu nhập bình quân của công nhân tổ đó
So sánh trình độ đại biểu của 2 số bình quân trên

10

NSLD bình quân: x


i 1
i
307
x   30,7 (sp / h)
10 10

10

Thu nhập bình y i


15,7
quân y  i1  1,57(tr$)
10 10

37
3/26/2024

So sánh trình độ đại biểu của 2 số bình quân

10

x 2
7,524
i
Vx   24,51%
x  i 1
10
2
 x  7,524(sp / h) 30,7

10

y 2 0,349
i Vy   22,26%
y  i 1
10
 2
 y  0,349(tr$) 1,57

VD thực hành
Chọn ngẫu nhiên một số doanh nghiệp của 2 ngành
kinh doanh A và B, tỷ lệ lãi trên vốn (%) của các DN
được ghi nhận như sau:
Ngành A 10,5 9 12 10 8,5 12,5 9,5
Ngành B 8 12 15 10 16 5 6
Hãy tính :
Tỷ lệ lãi trung bình, số trung vị, Mốt
Khoảng biến thiên
Tứ phân vị
Độ trải giữa
Độ lệch tuyệt đối bình quân
Phương sai
Độ lệch chuẩn
Hệ số biến thiên

Ứng dụng phần mềm Excel trong tính các chỉ


tiêu đo lường mức độ phân tán

114

38
3/26/2024

115

Ứng dụng phần mềm SPSS trong tính các chỉ


tiêu đo lường mức độ tập trung
- Vào menu Analyze  Descriptive Statistics 
Frequencies
- Chọn biến định lượng
- Nhấn nút Statictic để mở hộp thoại tính các đại
lượng thống kê mô tả
- Trong hộp thoại này, phần Central Tendency nhấn
chuột vào các ô để tính các đại lượng phản ánh
mức độ tập trung (Mean, Median, Mode)
- Nhấn nút  Ok

Ứng dụng phần mềm SPSS trong tính các chỉ


tiêu đo lường mức độ phân tán
- Vào menu Analyze  Descriptive Statistics 
Frequencies
- Chọn biến định lượng
- Nhấn nút Statictic để mở hộp thoại tính các đại
lượng thống kê mô tả
- Trong hộp thoại này, phần Dispersion nhấn chuột
vào các ô để tính các đại lượng phản ánh mức độ
phân tán (Std.Deviation, Variance, Range,
Minimum, Maximum)
- Nhấn nút  Ok

39

You might also like