You are on page 1of 27

8/7/2022

Chương 4
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ

Nội dung chính

I II III

SỐ TUYỆT CÁC MỨC ĐỘ CÁC MỨC ĐỘ


ĐỐI VÀ SỐ TRUNG TÂM BIẾN THIÊN
TƯƠNG ĐỐI
TRONG
THỐNG KÊ

1
8/7/2022

Số tuyệt đối và số tương đối trong thống kê

• Số tuyệt đối trong thống kê

• Số tương đối trong thống kê

• Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê

Số tuyệt đối trong thống kê

Số tuyệt đối trong thống kê biểu hiện quy mô, khối lượng của hiện
tượng nghiên cứu trong điều kiện thời gian, địa điểm cụ thể.
 Ví dụ
• Tổng số dân Việt Nam vào lúc 0h ngày 1/4/2019 là 96.208.984 người.
• Tổng kim ngạch hàng hóa xuất khẩu của Việt Nam năm 2021 đạt
336,25 tỷ USD.

Các loại số tuyệt đối trong thống kê


 Số tuyệt đối thời điểm: được xác định tại một mốc thời điểm cụ thể.
 Số tuyệt đối thời kỳ: được xác định trong một khoảng thời gian.

2
8/7/2022

Số tuyệt đối trong thống kê

Đặc điểm
 Luôn bao hàm một nội dung KTXH cụ thể trong điều kiện thời gian và địa
điểm nhất định.
 Chỉ xác định được qua điều tra thực tế và tổng hợp tài liệu.
 Có đơn vị tính cụ thể (hiện vật hoặc giá trị).

Tác dụng
 Cung cấp nhận thức cụ thể về quy mô, khối lượng hiện tượng.
 Là cơ sở để phân tích thống kê và tiến hành tính toán các mức độ khác
trong nghiên cứu thống kê

Số tương đối trong thống kê


Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ
của hiện tượng.
 Ví dụ:
• Giá trị kim ngạch hàng hóa xuất khẩu của Việt Nam năm 2021 bằng
119% so với năm 2020.
Đặc điểm
• Là kết quả so sánh 2 số đã có, không trực tiếp thu thập được qua điều tra.
• Mỗi số tương đối đều có gốc so sánh.
• Đơn vị tính: lần, %, đơn vị kép tùy thuộc loại số tương đối.

3
8/7/2022

Số tương đối trong thống kê


Tác dụng

 Phân tích hiện tượng qua quan hệ so sánh


 Nêu rõ tình hình thực tế khi cần bảo đảm tính chất bí mật của số tuyệt đối.
 Thường dùng để lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch

Số tương đối trong thống kê


Các loại số tương đối trong thống kê
Số tương đối động thái (tốc độ phát triển): phản ánh xu hướng biến động của
hiện tượng qua thời gian.
y1
t 
y0

Số tương đối kế hoạch: dùng để lập và kiểm tra tình hình thực hiện kế hoạch.
• Số tương đối nhiệm vụ kế hoạch: yk
Kn 
y0
• Số tương đối thực hiện (hoàn thành) kế hoạch: y
Kt  1
yk
t  Kn  KT
8

4
8/7/2022

Số tương đối trong thống kê


Các loại số tương đối trong thống kê
Số tương đối kết cấu: biểu hiện tỷ trọng của từng bộ phận chiếm trong toàn bộ hiện
tượng. y bp
d 
y tt

Số tương đối không gian: sử dụng trong hai trường hợp:

• So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian.

• So sánh giữa hai bộ phận trong một tổng thể.

Số tương đối cường độ: nói lên trình độ phổ biến của hiện tượng, là kết quả so
sánh hai mức độ khác loại nhưng có mối liên hệ với nhau.

• Số tương đối cường độ có đơn vị kép.

Điều kiện vận dụng

 Phải căn cứ vào tính chất và đặc điểm của hiện tượng nghiên cứu để rút
ra kết luận cho chính xác.

 Phải vận dụng kết hợp các số tương đối và số tuyệt đối

10

5
8/7/2022

Các mức độ trung tâm

• Số trung bình

• Số trung vị

• Mốt

• Phân vị

11

Số trung bình
Số trung bình (hay số bình quân) trong thống kê là mức độ đại biểu
theo một tiêu thức nào đó của một tổng thể gồm nhiều đơn vị cùng loại.
 Ví dụ
• Thu nhập bình quân đầu người của Việt Nam năm 2020 là 4,249 triệu
đồng.
Tác dụng
 Phản ánh mức độ đại biểu, nêu lên đặc trưng chung nhất của tổng thể.
 So sánh các hiện tượng không có cùng quy mô.
 Nghiên cứu các quá trình biến động qua thời gian.
 Lập kế hoạch và phân tích thống kê.

12

6
8/7/2022

Số trung bình
Đặc điểm:

 Mang tính tổng hợp, khái quát cao.

 Chỉ áp dụng đối với tiêu thức số lượng.

 San bằng, bù trừ chênh lệch giữa các lượng biến.

→ Hạn chế là chịu ảnh hưởng của các lượng biến đột xuất.

13

Số trung bình

Các loại số trung bình:

 Số trung bình cộng: được tính bằng công thức trung bình cộng trong
toán học, áp dụng khi các lượng biến có mối quan hệ tổng.

𝑇ổ𝑛𝑔 𝑙ượ𝑛𝑔 𝑏𝑖ế𝑛 𝑐ủ𝑎 𝑡𝑖ê𝑢 𝑡ℎứ𝑐


𝑆ố 𝑡𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ 𝑐ộ𝑛𝑔
𝑇ổ𝑛𝑔 𝑠ố đơ𝑛 𝑣ị 𝑡𝑟𝑜𝑛𝑔 𝑡ổ𝑛𝑔 𝑡ℎể

 Số trung bình nhân: được tính bằng công thức trung bình nhân, áp dụng
khi các lượng biến có mối quan hệ tích với nhau.

14

7
8/7/2022

Số trung bình cộng (Mean) – tính từ dữ


liệu thô
Với tổng thể có N đơn vị:
N

x i
x1  x 2    x N Các giá trị
μ i1
 của tổng thể
N N
Qui mô tổng thể

Với mẫu có n đơn vị:


n

x i
x1  x 2    x n Các giá trị
x i 1
 quan sát
n n
Cỡ mẫu
Có thể bị ảnh hưởng bởi các giá trị bất thường do số trung bình được tính
dựa trên tất cả các giá trị của bộ số liệu.
15

Số trung bình cộng (Mean) – tính từ dữ


liệu thô
 Ví dụ
Giá thuê/tháng ($) của 70 căn hộ một phòng ngủ ở khu đô thị Phú Mỹ Hưng
được ghi chép lại như sau. Dữ liệu đã được sắp xếp theo trật tự từ thấp đến cao.

425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

x
x i

34.356
 490.8$
n 70

16

8
8/7/2022

Số trung bình cộng (Mean) – tính từ dữ


liệu đã phân tổ
 Gọi là số trung bình cộng gia quyền.
n

x f  x 2 f 2  ...  x n f n
 xifi
i 1
x 1 1 
f 1  f 2  ...  f n n
 fi
i 1
fi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số)
→ tầm quan trọng của từng lượng biến trong tính số bình quân.
• Lưu ý: với tổ có khoảng cách tổ, xi là trị số giữa của mỗi tổ.

17

Số trung bình cộng (Mean)


Tính tiền lương trung bình/ tháng của một lao động trong doanh nghiệp A năm
2021, biết:
Tiền lương/tháng Số lao động
xifi di xidi
(1000 đồng) xi (Người) fi
5000 15 75000 0,075 375.0
5500 30 165000 0,150 825.0
6000 45 270000 0,225 1350.0
6500 55 357500 0,275 1787.5
7000 40 280000 0,200 1400.0
7500 15 112500 0,075 562.5
Chung 200 1260000 1,000 6300.0

∑𝑥 𝑓 1260000 ∑𝑥 𝑓
𝑥̅ 6300 𝑛𝑔ℎì𝑛 đồ𝑛𝑔 𝑥̅ 𝑥𝑑 6300 𝑛𝑔ℎì𝑛 đồ𝑛𝑔
∑𝑓 200 ∑𝑓

Với 𝑑 ∑

18

9
8/7/2022

Số trung bình cộng (Mean) – khi mỗi quan


sát được gán một quyền số
• Trường hợp mỗi quan sát được gán một quyền số để chỉ ra tầm quan
trọng của nó trong bộ dữ liệu, công thức số trung bình cộng gia quyền là:

x
w x i i
xi – quan sát thứ i

w i
wi – quyền số được gán cho quan
sát thứ i

Tùy từng trường hợp áp dụng mà lựa chọn quyền số cho phù hợp.
Chọn quyền số phản ánh tốt nhất tầm quan trọng của từng quan sát trong
xác định số trung bình.

19

Số trung bình cộng (Mean) – khi mỗi quan


sát được gán một quyền số
• Tính giá thành đơn vị một sản phẩm sản xuất ra trong tháng 1/2022 của
doanh nghiệp A, biết:

Phân Giá thành Sản lượng CPSX


xưởng đơn vị (trđ) (SP) (trđ)
xi wi xi . wi
∑𝑥 .𝑤 18500
1 3.00 1200 3600 𝑥̅ 2,96 𝑡𝑟đ
∑𝑤 6250
2 3.40 500 1700
3 2.80 2750 7700
4 2.90 1000 2900
5 3.25 800 2600
Tổng 6250 18500

20

10
8/7/2022

Số trung bình nhân (Geometric Mean)

 Số trung bình nhân thường được dùng để đo lường tốc độ phát triển bình
quân qua thời gian.

 Số trung bình nhân giản đơn


n
x  x1  x 2  ...  x n 
n n
x
i 1
i

 Số trung bình nhân gia quyền


n
x   i x1f1  x f22  ...  x fnn   f i  x if i
f

i 1

21

Số trung bình nhân


• Ví dụ. Tốc độ phát triển GDP của Viêt Nam trong các năm 2016, 2017,
2018 lần lượt là 106.21%, 106.81% và 107.08%. Tính tốc độ phát triển
bình quân một năm của GDP Việt Nam trong giai đoạn 2016-2018.

𝑋 1.0621𝑥1.0681𝑥1.0708 / 1.0670 hay 106.7%

Tốc độ tăng GDP bình quân một năm trong giai đoạn 2016-2018 là 6.7%.

22

11
8/7/2022

Điều kiện vận dụng số bình quân

 Số bình quân chỉ nên tính từ tổng thể đồng chất.

 Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ
và dãy số phân phối.

23

Số trung vị (Median - Me)


Số trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong một dãy số
lượng biến, chia dãy số thành hai phần bằng nhau.

Đặc điểm
 Không chịu ảnh hưởng của lượng biến đột xuất.
 Chỉ áp dụng với tiêu thức số lượng.
Tác dụng
 Dùng để bổ sung hay thay thế cho số trung bình cộng, đặc biệt khi dãy số
phân phối quá lệch, hoặc khi dãy số có quá ít đơn vị.
 Cho biết đặc trưng phân phối của dãy số.

24

12
8/7/2022

Số trung vị - tính từ dữ liệu thô


• Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
• Với cỡ mẫu n là lẻ (n=2m+1), trung vị là giá trị của quan sát đứng ở vị trí
thứ m+1.
𝑴𝒆 𝒙𝒎 𝟏

7 quan sát 26 18 27 12 14 27 19

Sắp xếp 12 14 18 19 26 27 27

Me = 19

25

Số trung vị - tính từ dữ liệu thô

• Sắp xếp dữ liệu theo thứ tự từ thấp đến cao


• Với cỡ mẫu n là chẵn (n=2m), trung vị là trung bình cộng của giá trị của
hai quan sát đứng ở vị trí chính giữa là m và m+1.

𝑴𝒆 𝒙𝒎 𝒙 𝒎 𝟏 /𝟐

8 Quan sát 26 18 27 12 14 27 30 19

Sắp xếp 12 14 18 19 26 27 27 30

Me = (19 + 26)/2 = 22.5

26

13
8/7/2022

Số trung vị - tính từ dãy số đã phân tổ


• Bước 1: xác định tổ có trung vị - là tổ chứa lượng biến của đơn vị đứng ở
vị trí giữa.
• Bước 2: tính trị số gần đúng của trung vị theo công thức:

fi
 2 S Me1
Me  x Me min  hMe .
f Me

Lưu ý: xác định vị trí chính giữa dựa vào tần số tích lũy.

27

Mốt (Mode - Mo)


Mốt là biểu hiện của tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể
hay trong một dãy số phân phối.
Đặc điểm
 Không chịu ảnh hưởng của lượng biến đột xuất.
 Mốt kém nhạy bén với sự biến thiên của tiêu thức.
 Áp dụng với cả tiêu thức thuộc tính và tiêu thức số lượng.
Tác dụng
 Dùng để bổ sung hay thay thế cho số trung bình cộng.
 Cho biết đặc trưng phân phối của dãy số.
 Sử dụng trong bài toán lý thuyết phục vụ đám đông.

28

14
8/7/2022

Mốt
• Một bộ dữ liệu có thể không có mốt hoặc có thể có nhiều mốt:
• Nếu bộ dữ liệu chỉ có chính xác hai mốt, gọi là bimodal
• Nếu bộ dữ liệu có nhiều hơn hai mốt, gọi là multimodal

29

Mốt
Cách xác định Mốt
Với dãy số không có khoảng cách tổ, Mốt là biểu hiện hoặc lượng biến có tần số
fi lớn nhất.
Với dãy số có khoảng cách tổ.
 Bước 1: xác định tổ có Mốt
• là tổ có tần số fi lớn nhất nếu khoảng cách tổ bằng nhau.
• hoặc tổ có mật độ mi lớn nhất nếu khoảng cách tổ không bằng nhau.
 Bước 2: tính trị số gần đúng của Mốt theo công thức

1 𝛿 𝑓 𝑓 hoặc 𝑚 𝑚
M0  x M0 min  hM0 .
1   2 𝛿 𝑓 𝑓 hoặc 𝑚 𝑚

30

15
8/7/2022

Mốt
• Ví dụ. Apartment Rents
Lượng biến 450 được gặp nhiều nhất (7 lần)
Mode = 450

425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

31

Phân vị (Percentiles)
Phân vị cung cấp thông tin về phân phối của dữ liệu trên khoảng từ giá trị
nhỏ nhất đến giá trị lớn nhất.

Phân vị mức p là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p và có ít nhất (100-p)% số quan sát có giá
trị lớn hơn hoặc bằng giá trị phân vị mức p.

32

16
8/7/2022

Phân vị (Percentiles)
Cách tính phân vị mức p:
 Bước 1: sắp xếp dữ liệu theo thứ từ nhỏ đến lớn.
 Bước 2: xác định vị trí của phân vị mức p:
p
L n 1
100
Với p là phân vị cần tính, n là số đơn vị tổng thể.
 Bước 3: tính giá trị của phân vị mức p.

33

Phân vị (Percentiles)
Có mức lương/tháng (triệu đồng) của 12 nhân viên ngân hàng như sau:

34,50 35,50 36,50 34,80 33,55 33,10


34,90 37,30 35,40 39,25 35,20 34,80
Với số liệu trên, xác định phân vị mức 85. Giải thích ý nghĩa.
• Sắp xếp theo thứ tự tăng dần.
33,10 33,55 34,50 34,80 34,80 34,90 35,20 35,40 35,50 36,50 37,30 39,25

• 𝐿 𝑛 1 12 1 11,05

• Vị trí của phân vị mức 85 là 11,05.


• Giá trị của phân vị mức 85: 37,30+(39,25-37,30)x0,05= 37,3975

34

17
8/7/2022

Phân vị (Percentiles)
Tứ phân vị (Quartiles): chia tổng thể thành 4 phần có số đơn vị bằng
nhau, mỗi phần có chứa 25% tổng số đơn vị trong tổng thể.

25% 25% 25% 25%


Q1 Q2 Q3

Phân vị Phân vị Phân vị


mức 25 mức 50 mức 75

35

Các mức độ biến thiên


Cho biết:
 Đặc trưng về phân phối
Curve A
 Kết cấu và tính đồng đều của tổng thể.
 Trình độ đại biểu của số trung bình
→Giá trị của các tham số càng nhỏ, tổng thể Curve B
càng đồng đều, mức độ biến thiên ít, trình độ
đại biểu của số trung bình càng cao. Cùng giá trị trung
bình, mức độ biến
thiên khác nhau

36

18
8/7/2022

Các mức độ biến thiên


Gồm có:
 Khoảng biến thiên
 Độ lệch tuyệt đối bình quân
 Phương sai
 Độ lệch chuẩn
 Hệ số biến thiên

37

Khoảng biến thiên (Range)


Cho biết chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất.
R = xmax - xmin

Đặc điểm:
 Không phụ thuộc vào sự phân bố của dữ liệu

 Chỉ phụ thuộc vào lượng biến lớn nhất và nhỏ nhất

 Rất nhạy cảm với các lượng biến đột xuất

R = 12 - 7 = 5 R = 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12

38

19
8/7/2022

Độ lệch tuyệt đối bình quân (Mean


absolute deviation)
Là số trung bình cộng của các độ lệch tuyệt đối giữa lượng biến và số
trung bình cộng của các lượng biến đó.
• Công thức giản đơn

d
x i -x
n
• Công thức gia quyền

d
 x -x f i i

f i

39

Phương sai (Variance)


Cho biết cho biết độ biến thiên xung quanh giá trị trung bình.
Công thức Tổng thể, qui mô N Mẫu, qui mô n
Giản đơn ∑ 𝑥 𝜇 ∑ 𝑥 𝑥̅
𝜎 𝑥 𝜇 𝑆
𝑁 𝑛 1
Gia quyền ∑ 𝑥 𝜇 𝑓 ∑ 𝑥 𝑥̅ 𝑓
𝜎 𝑥 𝜇 𝑆
∑𝑓 ∑𝑓 1
∑𝑓
𝑥 𝑥̅
∑𝑓 1

Đặc điểm:
 Giá trị bị khuyếch đại do phép bình phương.

 Không có đơn vị tính phù hợp


40

20
8/7/2022

Độ lệch chuẩn (Standard deviation)


Cho biết cho biết độ biến thiên xung quanh giá trị trung bình.
 Với tổng thể: 𝜎 𝜎
 Với mẫu: S 𝑆
Là tham số tốt nhất phản ánh độ biến thiên của tiêu thức.

 Lưu ý: Bốn tham số này chỉ dùng để so sánh độ biến thiên của hai hiện
tượng cùng loại, có số trung bình bằng nhau.

41

Độ lệch chuẩn (Standard deviation)


Data A
x  15,5
11 12 13 14 15 16 17 18 19 20 21 S = 3.338
Data B
x  15,5
11 12 13 14 15 16 17 18 19 20 21 S = 0.9258

Data C
x  15,5
11 12 13 14 15 16 17 18 19 20 21
S = 4.57

42

21
8/7/2022

Hệ số biến thiên (Coefficient of Variation)


Cho biết độ biến thiên tương đối xung quanh giá trị trung bình (đơn vị: %)
 Dùng để so sánh hai hoặc nhiều hơn các hiện tượng khác nhau hoặc
hiện tượng cùng loại có số trung bình khác nhau.
Công thức (đối với mẫu):
𝑆
𝐶𝑉 . 100 %
𝑥̅

43

Hệ số biến thiên (Coefficient of Variation)


• Ví dụ: Có tài liệu về NSLĐ và tiền lương trong DN A năm 2021 như sau:
NSLĐ: 𝑥̅ Đ = 40 (SP/người) 𝑆 Đ = 4 (SP/người)
Tiền lương: 𝑥̅ = 5000 (nghìn đồng) 𝑆 = 200 (nghìn đồng)
• So sánh độ biến thiên của TL và NSLĐ:
𝑆 Đ 4
𝐶𝑉 Đ 𝑥100 𝑥100 10%
𝑥̅ Đ 40
𝑆 200
𝐶𝑉 𝑥100 𝑥100 4%
𝑥̅ 5000
→ CVNSLĐ > CVTL

44

22
8/7/2022

Đặc trưng phân phối của dãy số

𝑋 < Me < Mo Mo < Me < 𝑋 𝑋 = Me = Mo


Lệch trái Lệch phải Đối xứng
45

Định lý Chebyshev hay quy luật 3 sigma


 Với phân phối chuẩn:
• 68.26% số quan sát trong tổng thể có giá trị chênh lệch 1 độ lệch chuẩn so với trung bình
• 95.45% số quan sát trong tổng thể có giá trị chênh lệch 2 độ lệch chuẩn so với trung bình
• 99.73% số quan sát trong tổng thể có giá trị chênh lệch 3 độ lệch chuẩn so với trung bình

46

23
8/7/2022

Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C1: Chọn Analyze > Descriptive Statistics > Frequencies…

 Chọn biến cần tính sang hộp


Variables
 Chọn Statistics

47

Sử dụng SPSS
Hộp thoại Statistics có dạng:

 Chọn  vào các thống kê


cần tính, trong đó:

48

24
8/7/2022

Sử dụng SPSS

 Mục Percentile Values:

• Quartiles: tứ phân vị
• Cut points for… equal groups: SPSS sẽ chia tổng số đơn vị thành k
nhóm theo yêu cầu, trong đó, mỗi nhóm sẽ có số đơn vị như nhau.
• Percentile(s): cho biết giá trị của các các mức phân vị.

49

Sử dụng SPSS

 Mục Central Tendency:  Mục Dispersion:


• Mean: Số trung bình Std.deviation: độ lệch chuẩn
• Median: Số trung vị Variance: phương sai
• Mode: Mốt Range: khoảng biến thiên
• Sum: Tổng các lượng biến Minimum: lượng biến nhỏ nhất
Maximum: lượng biến lớn nhất
S.E.mean: sai số chuẩn của trung bình

50

25
8/7/2022

Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C2: Chọn Analyze > Descriptive Statistics > Descriptives…

Đưa các biến sang Variable(s)


và nhấn Options…

51

Sử dụng SPSS

Chọn các thống kê cần tính toán:

52

26
8/7/2022

Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C3: Chọn Analyze > Descriptive Statistics > Explore …

Đưa các biến cần tính toán các tham


số sang Dependent List
Muốn phân tích theo biến nào đó thì
đưa sang biến sang Factor List
Trong mục Display chọn Statistics
hoặc Both

53

27

You might also like