Professional Documents
Culture Documents
Chương 4
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ
I II III
1
8/7/2022
• Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê
Số tuyệt đối trong thống kê biểu hiện quy mô, khối lượng của hiện
tượng nghiên cứu trong điều kiện thời gian, địa điểm cụ thể.
Ví dụ
• Tổng số dân Việt Nam vào lúc 0h ngày 1/4/2019 là 96.208.984 người.
• Tổng kim ngạch hàng hóa xuất khẩu của Việt Nam năm 2021 đạt
336,25 tỷ USD.
2
8/7/2022
Đặc điểm
Luôn bao hàm một nội dung KTXH cụ thể trong điều kiện thời gian và địa
điểm nhất định.
Chỉ xác định được qua điều tra thực tế và tổng hợp tài liệu.
Có đơn vị tính cụ thể (hiện vật hoặc giá trị).
Tác dụng
Cung cấp nhận thức cụ thể về quy mô, khối lượng hiện tượng.
Là cơ sở để phân tích thống kê và tiến hành tính toán các mức độ khác
trong nghiên cứu thống kê
3
8/7/2022
Số tương đối kế hoạch: dùng để lập và kiểm tra tình hình thực hiện kế hoạch.
• Số tương đối nhiệm vụ kế hoạch: yk
Kn
y0
• Số tương đối thực hiện (hoàn thành) kế hoạch: y
Kt 1
yk
t Kn KT
8
4
8/7/2022
Số tương đối không gian: sử dụng trong hai trường hợp:
• So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian.
Số tương đối cường độ: nói lên trình độ phổ biến của hiện tượng, là kết quả so
sánh hai mức độ khác loại nhưng có mối liên hệ với nhau.
Phải căn cứ vào tính chất và đặc điểm của hiện tượng nghiên cứu để rút
ra kết luận cho chính xác.
Phải vận dụng kết hợp các số tương đối và số tuyệt đối
10
5
8/7/2022
• Số trung bình
• Số trung vị
• Mốt
• Phân vị
11
Số trung bình
Số trung bình (hay số bình quân) trong thống kê là mức độ đại biểu
theo một tiêu thức nào đó của một tổng thể gồm nhiều đơn vị cùng loại.
Ví dụ
• Thu nhập bình quân đầu người của Việt Nam năm 2020 là 4,249 triệu
đồng.
Tác dụng
Phản ánh mức độ đại biểu, nêu lên đặc trưng chung nhất của tổng thể.
So sánh các hiện tượng không có cùng quy mô.
Nghiên cứu các quá trình biến động qua thời gian.
Lập kế hoạch và phân tích thống kê.
12
6
8/7/2022
Số trung bình
Đặc điểm:
→ Hạn chế là chịu ảnh hưởng của các lượng biến đột xuất.
13
Số trung bình
Số trung bình cộng: được tính bằng công thức trung bình cộng trong
toán học, áp dụng khi các lượng biến có mối quan hệ tổng.
Số trung bình nhân: được tính bằng công thức trung bình nhân, áp dụng
khi các lượng biến có mối quan hệ tích với nhau.
14
7
8/7/2022
x i
x1 x 2 x N Các giá trị
μ i1
của tổng thể
N N
Qui mô tổng thể
x i
x1 x 2 x n Các giá trị
x i 1
quan sát
n n
Cỡ mẫu
Có thể bị ảnh hưởng bởi các giá trị bất thường do số trung bình được tính
dựa trên tất cả các giá trị của bộ số liệu.
15
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
x
x i
34.356
490.8$
n 70
16
8
8/7/2022
x f x 2 f 2 ... x n f n
xifi
i 1
x 1 1
f 1 f 2 ... f n n
fi
i 1
fi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số)
→ tầm quan trọng của từng lượng biến trong tính số bình quân.
• Lưu ý: với tổ có khoảng cách tổ, xi là trị số giữa của mỗi tổ.
17
∑𝑥 𝑓 1260000 ∑𝑥 𝑓
𝑥̅ 6300 𝑛𝑔ℎì𝑛 đồ𝑛𝑔 𝑥̅ 𝑥𝑑 6300 𝑛𝑔ℎì𝑛 đồ𝑛𝑔
∑𝑓 200 ∑𝑓
Với 𝑑 ∑
18
9
8/7/2022
x
w x i i
xi – quan sát thứ i
w i
wi – quyền số được gán cho quan
sát thứ i
Tùy từng trường hợp áp dụng mà lựa chọn quyền số cho phù hợp.
Chọn quyền số phản ánh tốt nhất tầm quan trọng của từng quan sát trong
xác định số trung bình.
19
20
10
8/7/2022
Số trung bình nhân thường được dùng để đo lường tốc độ phát triển bình
quân qua thời gian.
i 1
21
Tốc độ tăng GDP bình quân một năm trong giai đoạn 2016-2018 là 6.7%.
22
11
8/7/2022
Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ
và dãy số phân phối.
23
Đặc điểm
Không chịu ảnh hưởng của lượng biến đột xuất.
Chỉ áp dụng với tiêu thức số lượng.
Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng, đặc biệt khi dãy số
phân phối quá lệch, hoặc khi dãy số có quá ít đơn vị.
Cho biết đặc trưng phân phối của dãy số.
24
12
8/7/2022
7 quan sát 26 18 27 12 14 27 19
Sắp xếp 12 14 18 19 26 27 27
Me = 19
25
𝑴𝒆 𝒙𝒎 𝒙 𝒎 𝟏 /𝟐
8 Quan sát 26 18 27 12 14 27 30 19
Sắp xếp 12 14 18 19 26 27 27 30
26
13
8/7/2022
fi
2 S Me1
Me x Me min hMe .
f Me
Lưu ý: xác định vị trí chính giữa dựa vào tần số tích lũy.
27
28
14
8/7/2022
Mốt
• Một bộ dữ liệu có thể không có mốt hoặc có thể có nhiều mốt:
• Nếu bộ dữ liệu chỉ có chính xác hai mốt, gọi là bimodal
• Nếu bộ dữ liệu có nhiều hơn hai mốt, gọi là multimodal
29
Mốt
Cách xác định Mốt
Với dãy số không có khoảng cách tổ, Mốt là biểu hiện hoặc lượng biến có tần số
fi lớn nhất.
Với dãy số có khoảng cách tổ.
Bước 1: xác định tổ có Mốt
• là tổ có tần số fi lớn nhất nếu khoảng cách tổ bằng nhau.
• hoặc tổ có mật độ mi lớn nhất nếu khoảng cách tổ không bằng nhau.
Bước 2: tính trị số gần đúng của Mốt theo công thức
1 𝛿 𝑓 𝑓 hoặc 𝑚 𝑚
M0 x M0 min hM0 .
1 2 𝛿 𝑓 𝑓 hoặc 𝑚 𝑚
30
15
8/7/2022
Mốt
• Ví dụ. Apartment Rents
Lượng biến 450 được gặp nhiều nhất (7 lần)
Mode = 450
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
31
Phân vị (Percentiles)
Phân vị cung cấp thông tin về phân phối của dữ liệu trên khoảng từ giá trị
nhỏ nhất đến giá trị lớn nhất.
Phân vị mức p là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p và có ít nhất (100-p)% số quan sát có giá
trị lớn hơn hoặc bằng giá trị phân vị mức p.
32
16
8/7/2022
Phân vị (Percentiles)
Cách tính phân vị mức p:
Bước 1: sắp xếp dữ liệu theo thứ từ nhỏ đến lớn.
Bước 2: xác định vị trí của phân vị mức p:
p
L n 1
100
Với p là phân vị cần tính, n là số đơn vị tổng thể.
Bước 3: tính giá trị của phân vị mức p.
33
Phân vị (Percentiles)
Có mức lương/tháng (triệu đồng) của 12 nhân viên ngân hàng như sau:
• 𝐿 𝑛 1 12 1 11,05
34
17
8/7/2022
Phân vị (Percentiles)
Tứ phân vị (Quartiles): chia tổng thể thành 4 phần có số đơn vị bằng
nhau, mỗi phần có chứa 25% tổng số đơn vị trong tổng thể.
35
36
18
8/7/2022
37
Đặc điểm:
Không phụ thuộc vào sự phân bố của dữ liệu
Chỉ phụ thuộc vào lượng biến lớn nhất và nhỏ nhất
R = 12 - 7 = 5 R = 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
38
19
8/7/2022
d
x i -x
n
• Công thức gia quyền
d
x -x f i i
f i
39
Đặc điểm:
Giá trị bị khuyếch đại do phép bình phương.
20
8/7/2022
Lưu ý: Bốn tham số này chỉ dùng để so sánh độ biến thiên của hai hiện
tượng cùng loại, có số trung bình bằng nhau.
41
Data C
x 15,5
11 12 13 14 15 16 17 18 19 20 21
S = 4.57
42
21
8/7/2022
43
44
22
8/7/2022
46
23
8/7/2022
Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C1: Chọn Analyze > Descriptive Statistics > Frequencies…
47
Sử dụng SPSS
Hộp thoại Statistics có dạng:
48
24
8/7/2022
Sử dụng SPSS
• Quartiles: tứ phân vị
• Cut points for… equal groups: SPSS sẽ chia tổng số đơn vị thành k
nhóm theo yêu cầu, trong đó, mỗi nhóm sẽ có số đơn vị như nhau.
• Percentile(s): cho biết giá trị của các các mức phân vị.
49
Sử dụng SPSS
50
25
8/7/2022
Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C2: Chọn Analyze > Descriptive Statistics > Descriptives…
51
Sử dụng SPSS
52
26
8/7/2022
Sử dụng SPSS
Xác định giá trị của các mức độ trung tâm và tham số đo độ biến thiên
• C3: Chọn Analyze > Descriptive Statistics > Explore …
53
27