You are on page 1of 125

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KIÊN GIANG


KHOA KINH TẾ - DU LỊCH

Nguyễn Vương

Nguyễn Thị Quỳnh Như

TẬP BÀI GIẢNG

NGUYÊN LÝ THỐNG KÊ KINH TẾ


(Lưu hành nội bộ )

Chỉnh sửa lần 1

NĂM 2020
Nguyễn Vương

Nguyễn Thị Quỳnh Như

TẬP BÀI GIẢNG

NGUYÊN LÝ THỐNG KÊ KINH TẾ

(Tài liệu dùng cho hệ đại học)

NĂM 2020

LỜI NÓI ĐẦU


Nguyên lý thống kê kinh tế là môn học cơ sở của ngành khối kinh tế, trang bị
cho học viên kiến thức cơ bản về quá trình nghiên cứu thống kê - một công cụ sắc bén
của nhận thức và quản lý. Học viên sẽ được giới thiệu bắt đầu từ đối tượng nghiên
cứu, các khái niệm thường dùng trong thống kê đến các giai đoạn của một quá trình
nghiên cứu thống kê đầy đủ: cách thức tiến hành, nội dung và phương pháp thu thập
thông tin của điều tra thống kê, các phương pháp trình bày và tổng hợp dữ liệu thống
kê đã thu thập được, các phương pháp phân tích dữ liệu để phục vụ mục đích nghiên
cứu và dự báo thống kê các mức độ tuơng lai của hiện tượng. Nắm vững công cụ này
người học sẽ có một kiến thức cơ bản để vận dụng vào từng lĩnh vực cụ thể của đời
sống kinh tế, xã hội liên quan đến chuyên môn của mình.

Mục tiêu của môn học là:

Kiến thức: Hiểu rõ được quá trình nghiên cứu thống kê các hiện tượng kinh tế
xã hội. Nắm vững các phương pháp điều tra, tổng hợp, phân tích các hiện tượng kinh
tế xã hội, từ đó xác định được tính quy luật về mặt lượng của hiện tượng, phát hiện và
xác định các nhân tố ảnh hưởng và mức độ ảnh hưởng của chúng đến hiện tuợng
nghiên cứu.

Kỹ năng: Có khả năng độc lập tiến hành điều tra thống kê, tổng hợp và phân
tích các cơ sở dữ liệu (mặt lượng) đồng thời dự đoán các mức độ tương lai của hiện
tượng nghiên cứu phù hợp với chuyên ngành của mình.

Thái độ, chuyên cần: Nghiêm túc trong học tập, nghiên cứu, nâng cao ý thức
trong việc hình thành và đam mê khám phá các vấn đề tiềm ẩn trong lĩnh vực kinh tế
xã hội nói chung và chuyên ngành học nói riêng.

Kiên Giang, ngày … tháng … năm 2020

Tác giả

iii
MỤC LỤC

LỜI NÓI ĐẦU ...........................................................................................................................


iii
MỤC LỤC .................................................................................................................................
iv
Chương 1 NHỮNG VẤN ĐỀ CHUNG VỀ THỐNG KÊ ..........................................................
1
1.1. Thống kê học là gì? .........................................................................................................
1
1.2. Đối tượng, chức năng, nhiệm vụ của thống kê học ........................................................ 2
1.2.1. Đối tượng ................................................................................................................. 2
1.2.2. Chức năng ................................................................................................................ 2
1.3. Một số khái niệm thường dùng trong thống kê ............................................................... 2
1.3.1. Tổng thể thống kê .................................................................................................... 2
1.3.2. Đơn vị tổng thể ........................................................................................................ 3
1.3.3. Mẫu .......................................................................................................................... 3
1.3.4. Tiêu thức thống kê ................................................................................................... 3
1.3.5. Chỉ tiêu thống kê ......................................................................................................
4
1.3.6. Tham số tổng thể ......................................................................................................
4
1.3.7. Tham số mẫu ............................................................................................................
4
1.4. Các loại thang đo ............................................................................................................. 5
1.4.1. Khái niệm ................................................................................................................
5
1.4.2. Các loại thang đo ......................................................................................................
5 CÂU HỎI ÔN
TẬP .................................................................................................................... 6
Chương 2 QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ .............................................................
7
2.1. Điều tra thống kê ............................................................................................................ 7
2.1.1. Khái niệm................................................................................................................. 7
2.1.2. Các loại điều tra thống kê ........................................................................................ 7
2.2. Tổng hợp thống kê ..........................................................................................................
8
2.2.1. Khái niệm................................................................................................................. 8
2.2.2. Phương pháp phân tổ thống kê ................................................................................ 9
2.2.3. Các bước tiến hành phân tổ ................................................................................... 10

iv
2.3. Phân tích và dự báo thống kê ........................................................................................
14
2.3.1. Khái niệm............................................................................................................... 14
2.3.2. Phương pháp sử dụng ............................................................................................ 15
2.4. Bảng thống kê (Statistical table) ...................................................................................
15
2.4.1. Khái niệm............................................................................................................... 15
2.4.2. Cấu thành bảng thống kê ....................................................................................... 15
2.4.3. Các yêu cầu và qui ước xây dựng bảng thống kê .................................................. 16
BÀI TẬP ...................................................................................................................................
17
Chương 3 CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ XÃ HỘI ....................................
20
3.1. Số tuyệt đối ...................................................................................................................
20
3.1.1. Khái niệm............................................................................................................... 20
3.1.2. Các loại số tuyệt đối .............................................................................................. 20
3.2. Số tương đối ..................................................................................................................
20
3.2.1. Khái niệm............................................................................................................... 20
3.2.2. Các loại số tương đối ............................................................................................. 21
3.3. Số bình quân - Số đo độ tập trung (Measures of central tendency) ..............................
23
3.3.1. Khái niệm............................................................................................................... 23
3.3.2. Các loại số bình quân cộng .................................................................................... 24
3.3.3. Số bình quân điều hòa............................................................................................ 27
3.3.4. Số bình quân nhân (Geometric mean) ................................................................... 28
3.4. Số trung vị - Me (Median) ............................................................................................
29
3.5. Mốt – Mo (Mode) ......................................................................................................... 31
3.6. Chỉ tiêu đánh giá độ biến thiên của tiêu thức ............................................................... 32
BÀI TẬP ...................................................................................................................................
31
CHƯƠNG 4 DÃY SỐ THỜI GIAN ........................................................................................
45
4.1. Khái niệm ......................................................................................................................
45
4.2. Phân loại ....................................................................................................................... 45
4.3. Các chỉ tiêu phân tích dãy số thời gian .........................................................................
46

v
4.3.1. Mức độ bình quân theo thời gian ...........................................................................
46
4.3.2. Lượng tăng (giảm) tuyệt đối .................................................................................. 47
4.3.3. Tốc độ phát triển (lần,%) ....................................................................................... 47
4.3.4. Tốc độ tăng (giảm)................................................................................................. 48
4.3.5. Giá trị tuyệt đối của 1% tăng (giảm) ..................................................................... 48
4.4. Các phương pháp dự báo trên dãy số thời gian ............................................................ 48
4.4.1. Dự báo dựa vào mức độ tăng (giảm) tuyệt đối bình quân ..................................... 49
4.4.2. Dự đoán dựa vào tốc độ phát triển bình quân ........................................................
49
4.4.3. Dự đoán dựa vào phương trình hồi quy .................................................................
49
4.4.4. Tính chất mùa vụ trong dự báo chuỗi thời gian .....................................................
54
BÀI TẬP ...................................................................................................................................
56
CHƯƠNG 5 ƯỚC LƯỢNG KHOẢNG TIN CẬY VÀ KIỂM ĐỊNH GIẢ THIẾT ...............
66
5.1. Ước lượng khoảng tin cậy ............................................................................................ 66
5.1.1. Ước lượng trung bình tổng thể .............................................................................. 66
5.1.2. Ước lượng tỷ lệ tổng thể ........................................................................................ 68
5.1.3. Ước lượng phương sai tổng thể ............................................................................. 68
5.1.4. Ước lượng cỡ mẫu (Estimating the sample size) ..................................................
69
5.2. Kiểm định giả thiết ....................................................................................................... 69
5.2.1. Một số khái niệm ................................................................................................... 69
5.2.2 Kiểm định tham số ...................................................................................................
71
5.2.3. Kiểm định phi tham số ...........................................................................................
77 BÀI
TẬP ..................................................................
................................................................. 79

CHƯƠNG 6 TƯƠNG QUAN VÀ HỒI QUI TUYẾN TÍNH .................................................


82
6.1. Hệ số tương quan ..........................................................................................................
82
6.2. Mô hình hồi qui tuyến tính đơn giản ............................................................................ 83
6.2.1. Mô hình hồi qui tuyến tính một chiều (tuyến tính đơn giản) .................................
83

vi
6.2.2. Phương trình hồi qui tuyến tính mẫu ..................................................................... 85
6.2.3. Khoảng tin cậy của các hệ số hồi qui .................................................................... 86

6.2.4. Kiểm định tham số hồi qui tổng thể () ............................................................... 87
6.2.5. Phân tích phương sai hồi qui ................................................................................. 87
6.3. Mở rộng mô hình hồi qui 2 biến ...................................................................................
88
6.4. Hồi qui tuyến tính bội ...................................................................................................
88
6.4.1. Mô hình hồi bội ..................................................................................................... 88
6.4.2. Phương trình hồi qui bội của mẫu ......................................................................... 88
6.4.3. Khoảng tin cậy của các hệ số hồi qui .................................................................... 89

6.4.4. Kiểm định từng tham số hồi qui tổng thể (i ) .......................................................
89
6.4.5. Phân tích phương sai hồi qui ................................................................................. 89
BÀI TẬP ...................................................................................................................................
93
CHƯƠNG 7 CHỈ SỐ ................................................................................................................
96
7.1. Khái niệm ......................................................................................................................
96
7.2. Đặc điểm chỉ số ............................................................................................................ 97
7.3. Các loại chỉ số ...............................................................................................................
97
7.4. Phương pháp tính chỉ số ............................................................................................... 97
7.4.1. Chỉ số cá thể (i) ......................................................................................................
97
7.4.2. Chỉ số chung (I) ..................................................................................................... 97
7.5. Hệ thống chỉ số ............................................................................................................. 99
7.5.1. Khái niệm............................................................................................................... 99
7.5.2. Ý nghĩa – tác dụng ................................................................................................. 99
7.5.3. Hệ thống chỉ số của các chỉ tiêu có liên hệ với nhau .............................................
99
BÀI TẬP .................................................................................................................................
100
TÀI LIỆU THAM KHẢO ......................................................................................................
110

vii
viii
Chương 1 NHỮNG VẤN ĐỀ CHUNG VỀ THỐNG KÊ
Nội dung chương này sẽ giúp người học tìm hiểu được các khái niệm cơ bản về
thống kê học, tìm hiểu những ứng dụng của thống kê trong kinh tế, xã hội, trong đời
sống,.. Qua chương này người học sẽ hình dung được công việc của người làm thống
kê là như thế nào, từ đó phân loại được một số loại thống kê thường gặp.

1.1. Thống kê học là gì?


Thống kê được hiểu là các con số được ghi chép để phản ánh các hiện tượng kinh
tế xã hội trong điều kiện thời gian và địa điểm nhất định. Là một hệ thống các phương
pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng của đối
tượng nghiên cứu nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định.
Thống kê học là một ngành khoa học xã hội nghiên cứu hệ thống các phương
pháp thu thập, xử lý và phân tích con số của những hiện tượng số lớn nhằm tìm ra bản
chất, tính qui luật vốn có của chúng trong những điều kiện thời gian và địa điểm cụ
thể.
Thống kê thường được phân thành 2 lĩnh vực:
▪ Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan
đến việc thu thập số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác
nhau để phản ánh một cách tổng quát đối tượng nghiên cứu.
Ví dụ: Số lượng sinh viên trong một lớp; thống kê số lượng nam, nữ của một trường;
thống kê số sinh viên xuất sắc trong học kỳ 1 năm học 2020-2021 của trường Đại
học Kiên Giang.
▪ Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp
ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng
nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả
quan sát mẫu.
Ví dụ:

- Tổng sản phẩm quốc gia trong một năm nhất định, tổng số dân của nước
ta ở một thời điểm nào đó. (những con số được ghi chép để phản ánh)

- Để đánh giá về thực trạng dân số Việt Nam ta phải thu thập, tính toán để
có được số liệu về dân số, về giới tính, nghề nghiệp, mức sống, trình độ văn hóa,…
của dân cư (hệ thống các phương pháp ghi chép, thu thập, phân tích, …để tìm hiểu
hay phản ánh bản chất, tính qui luật của các hiện tượng đó).

1.2. Đối tượng, chức năng, nhiệm vụ của thống kê học


1.2.1. Đối tượng

1
Đối tượng nghiên cứu của thống kê học là mặt lượng trong mối liên hệ mật
thiết với mặt chất của các hiện tượng và quá trình kinh tế xã hội số lớn trong điều kiện
thời gian và địa điểm cụ thể. Cụ thể như:
- Các hiện tượng về quá trình sản xuất của cải vật chất của xã hội từ khâu
sản xuất đến khâu phân phối.
- Các hiện tượng về dân số: Số dân, cấu thành dân cư.
- Các hiện tượng về đời sống vật chất và văn hóa của nhân dân: mức sống,
trình độ văn hóa, BHXH,…
- Các hiện tượng về sinh hoạt chính trị, xã hội như: cơ cấu cơ quan nhà
nước, đoàn thể…
1.2.2. Chức năng
- Phản ánh (ghi chép): ghi chép số liệu.
- Phân tích, dự báo: hệ thống của phương pháp thống kê.
1.2.3. Nhiệm vụ của thống kê
- Phản ánh trung thực về mặt lượng của các hiện tượng kinh tế xã hội phục
vụ tốt cho sự lãnh đạo và quản lí các hoạt động đó.
- Cung cấp số liệu cần thiết cho việc xây dựng các chiến lược kế hoạch và
chương trình phát triển của doanh nghiệp: ngành, địa phương, kiểm tra và đánh giá
việc thực hiện kế hoạch qua từng thời kỳ.
1.3. Một số khái niệm thường dùng trong thống kê
1.3.1. Tổng thể thống kê
Tổng thể thống kê là tập hợp các đơn vị cá biệt về sự vật, hiện tượng trên cơ sở
một đặc điểm chung nào đó cần được quan sát, phân tích mặt lượng của chúng. Các
đơn vị, phần tử tạo nên hiện tượng được gọi là các đơn vị tổng thể. Người ta có thể
chia tổng thể thành các tổng thể nhỏ hơn tùy thuộc vào mục tiêu nghiên
Như vậy muốn xác định được một tổng thể thống kê, ta cần phải xác định được
tất cả các đơn vị tổng thể của nó. Thực chất của việc xác định tổng thể thống kê là việc
xác định các đơn vị tổng thể.
Trong nhiều trường hợp, các đơn vị của tổng thể được biểu hiện một cách rõ
ràng, dễ xác định. Ta gọi nó là tổng thể bộ lộ. Ngược lại, một tổng thể mà các đơn vị
của nó không được nhận biết một cách trực tiếp, ranh giới của tổng thể không rõ ràng
được gọi là tổng thể tiềm ẩn.
Đối với tổng thể tiềm ẩn, việc tìm được đầy đủ, chính xác gặp nhiều khó khăn.
Việc nhầm lẫn, bỏ sót các đơn trong tổng thể dễ xảy ra. Ví dụ như tổng thể là những
những mê nhạc cổ điển,…

2
Ví dụ: - Tập thể lớp A là một tổng thể.
- Toàn bộ các trường THCN ở Việt Nam vào một thời gian xác định.
- Dân số Việt Nam vào một thời điểm nào đó.
1.3.2. Đơn vị tổng thể
Là đơn vị cá biệt cấu thành tổng thể
Ví dụ: - Trong tổng thể dân số Việt Nam thì đơn vị tổng thể là mỗi người dân có
quốc tịch Việt Nam.
- Tập thể lớp: đơn vị tổng thể là mỗi học sinh/ sinh viên.
- Tập thể giảng viên: đơn vị tổng thể là mỗi giảng viên.
1.3.3. Mẫu
Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra để
quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của
mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của tổng thể thì chưa chắc thuộc
mẫu. Điều này tưởng chừng là đơn giản, tuy nhiên trong một số trường hợp việc xác
định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta
nghiên cứu là tổng thể tiềm ẩn.
Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu
phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta chỉ cố gắng
hạn chế tối đa sự sai biệt này mà thôi chứ không thể khắc phục được hoàn toàn.
Mỗi đơn vị của mẫu gọi là một quan sát (Observations).
1.3.4. Tiêu thức thống kê
Các đơn vị tổng thể thường có nhiều đặc điểm khác nhau, tuy nhiên trong thống
kê người ta chỉ chọn một số đặc điểm để nghiên cứu, các đặc điểm này được gọi là tiêu
thức thống kê. Như vậy, tiêu thức thống kê là khái niệm chỉ các đặc điểm của đơn vị
tổng thể. Mỗi tiêu thức thống kê đều có các giá trị biểu hiện của nó, dựa vào sự biểu
hiện của nó người ta chia ra làm hai loại:
• Tiêu thức thuộc tính: là tiêu thức phản ánh loại hoặc tính chất của đơn vị. Ví
dụ: Giới tính (nam hay nữ), dân tộc, tôn giáo, loại hình doanh nghiệp (Nhà nước,
Tư nhân, Cổ phần, TNHH,…).
• Tiêu thức số lượng: là đặc trưng của đơn vị tổng thể được thể hiện bằng con số.
Ví dụ, năng suất của một loại cây trồng, độ tuổi, số công nhân, số học sinh, số sản
phẩm của từng đơn vị được nghiên cứu…
Tiêu thức số lượng được chia làm 2 loại:
- Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể
đếm được. Hay lượng biến rời rạc là lượng biến mà các giá trị có thể có của nó
nằm rải rác trên trục số (ví dụ: số nhân khẩu).

3
- Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó
trong một khoảng nào đó. Hay nói cách khác lượng biến liên tục là lượng biến
mà các giá trị có thể có của nó lấp đầy một khoảng trên trục số (ví dụ: năng
suất lao động, % hoàn thành kế hoạch về chỉ tiêu nào đó…)
1.3.5. Chỉ tiêu thống kê
Là một khái niệm dùng để biểu hiện một cách tổng hợp đặc điểm về mặt lượng
trong sự thống nhất với mặt chất của hiện tượng nghiên cứu trong thời gian và địa
điểm cụ thể. Chỉ tiêu thống kê có 2 mặt:
Ví dụ:
- Tỷ lệ học sinh khá học kỳ 1/2019 - 2020 của lớp … là 80%.
- Tổng số học sinh trường ĐHKG đến tháng 6/2019 là 4.500 sinh viên.
Chỉ tiêu thống kê có 2 mặt:
- Khái niệm: Nêu lên nội dung, giới hạn về thực thể không gian và thời gian
của chỉ tiêu.
- Con số: Nêu lên mức độ của chỉ tiêu.
Ví dụ: Doanh thu của doanh nghiệp A năm 2018 là 500 triệu đồng
Trong đó: Con số: 500 triệu đồng là con số, doanh thu của doanh nghiệp A năm
2018 là khái niệm.
➢ Căn cứ vào nội dung của chỉ tiêu, chỉ tiêu thống kê được chia làm 2 loại:
- Chỉ tiêu khối lượng: Là chỉ tiêu biểu hiện quy mô, độ lớn của hiện tượng
nghiên cứu.
Ví dụ: Số lượng học viên Trung học chuyên nghiệp, số công nhân, số lượng sản
phẩm, tổng thu nhập quốc dân…
- Chỉ tiêu chất lượng: là chỉ tiêu biểu hiện trình độ phổ biến, quan hệ so
sánh.
Ví dụ: giá thành đơn vị sản phẩm, năng suất lao động, tiền lương một công
nhân... ➢ Căn cứ vào hình thức biểu hiện có 2 loại:
- Chỉ tiêu hiện vâ ̣t: là chỉ tiêu biểu hiện bằng đơn vị tự nhiên như cái, con,
chiếc… hay đơn vị đo lường: kg, met, lít, tấn, tạ…
- Chỉ tiêu giá trị: được biểu hiện bằng đơn vị tiền tệ như đồng, USD,
GBP, JPY,
DEM…
1.3.6. Tham số tổng thể
Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng
nghiên cứu. Trong xác suất thống kê toán chúng ta đã biết các tham số tổng thể như
trung bình tổng thể (µ), tỷ lệ tổng thể (p), phương sai tổng thể (2 ). Ngoài ra, trong quá

4
trình nghiên cứu sâu môn thống kê chúng ta còn có thêm nhiều tham số tổng thể nữa
như tương quan tổng thể (), hồi qui tuyến tính tổng thể,…

1.3.7. Tham số mẫu


Tham số mẫu là giá trị tính toán được của một mẫu và dùng để suy rộng cho tham
số tổng thể. Đó là cách giải thích mang tính chất thông thường, còn đối với xác suất
thống kê thì tham số mẫu là ước lượng điểm của tham số tổng thể, trong trường hợp
chúng ta chưa biết tham số tổng thể chúng ta có thể sử dụng tham số mẫu để ước lượng
tham số tổng thể. Chúng ta có thể liệt kê vài tham số mẫu như sau: trung bình mẫu (𝑥̅),
tỷ lệ mẫu (pˆ), phương sai mẫu (S2), hệ số tương quan mẫu (r),…
1.4. Các loại thang đo
Đứng trên quan điểm của nhà nghiên cứu, chúng ta cần xác định các phương
pháp phân tích thích hợp dựa vào mục đích nghiên cứu và bản chất của dữ liệu. Do
vậy, đầu tiên chúng ta tìm hiểu bản chất của dữ liệu thông qua khảo sát các cấp độ
đo lường khác nhau vì mỗi cấp độ sẽ chỉ cho phép một số phương pháp nhất định
mà thôi.
1.4.1. Khái niệm
- Số đo: là việc gán những dữ kiện lượng hoá hay những ký hiệu cho những
hiện tượng quan sát. Chẳng hạn như những đặc điểm của khách hàng về sự chấp
nhận, thái độ, thị hiếu hoặc những đặc điểm có liên quan khác đối với một sản
phẩm mà họ tiêu dùng.
- Thang đo: là tạo ra một thang điểm để đánh giá đặc điểm của đối tượng
nghiên cứu thể hiện qua sự đánh giá, nhận xét.
1.4.2. Các loại thang đo
a) Thang đo danh nghĩa (Nominal scale):
Là loại thang đo sử dụng cho dữ liệu thuộc tính mà các biểu hiện của dữ liệu
không có sự hơn kèm, khác biệt về thứ bậc. Các con số không có mối quan hệ hơn
kém, không thực hiện được các phép tính đại số. Các con số chỉ mang tính chất mã
hoá. Ví dụ, tiêu thức giới tính ta có thể đánh số 1 là nam, 2 là nữ.
b) Thang đo thứ bậc (Ordinal scale):
Là loại thang đo dùng cho các dữ liệu thuộc tính. Tuy nhiên trường hợp này
biểu hiện của dữ liệu có sự so sánh. Ví dụ, trình độ thành thạo của công nhân được
phân chia ra các bậc thợ từ 1 đến 7. Phân loại giảng viên trong các trường đại học:
Giáo sư, P. Giáo sư, Giảng viên chính, Giảng viên. Thang đo này cũng không thực
hiện được các phép tính đại số.
c) Thang đo khoảng (Interval scale):
Là loại thang đo dùng cho các dữ liệu số lượng. Là loại thang đo cũng có thể
dùng để xếp hạng các đối tượng nghiên cứu nhưng khoảng cách bằng nhau trên
thang đo đại diện cho khoảng cách bằng nhau trong đặc điểm của đối tượng. Với
5
thang đo này ta có thể thực hiện các phép tính đại số trừ phép chia không có ý
nghĩa. Ví dụ như điểm môn học của sinh viên. Sinh viên A có điểm thi là 8 điểm,
sinh viên B có điểm là 4 thì không thể nói rằng sinh viên A giỏi gấp hai lần sinh
viên B.
d) Thang đo tỷ lệ (Ratio scale):
Là loại thang đo cũng có thể dùng dữ liệu số lượng. Trong các loại thang đo
đây là loại thang đo cao nhất. Ngoài đặc tính của thang đo khoảng, phép chia có thể
thực hiện được. Ví dụ, thu nhập trung bình 1 tháng của ông A là 2 triệu đồng và thu
nhập của bà B là 4 triệu đồng, ta có thể nói rằng thu nhập trung bình trong một
tháng của bà B gấp đôi thu nhập của ông A.
Tuỳ theo thang đo chúng ta có thể có một số phương pháp phân tích phù hợp, ta
có thể tóm tắt như sau:
Bảng 1.1. Phương pháp phân tích thống kê thích hợp với các thang đo
Đo lường độ Đo lường độ Đo lường tính
Loại thang đo Kiểm định
tâ ̣p trung phân tán tương quan

Hệ số ngẫu Kiểm định


1. Thang biểu danh Mốt Không có
nhiên 2

Dãy tương Kiểm định


2. Thang thứ tự Trung vị Sô phần trăm
quan dấu

Hệ số tương Kiểm định


3. Thang khoảng Trung bình Độ lệch chuẩn
quan t, F
Sử dụng tất
Trung bình Hệ số biến Tất cả các
4. Thang tỷ lệ cả các phép
tỷ lệ thiên phép trên
trên

CÂU HỎI ÔN TẬP

Câu 1: Thống kê học là gì? Thống kê có ý nghĩa gì?


Câu 2: Phân biệt dữ liệu sơ cấp, dữ liệu thứ cấp?
Câu 3: Trình vày và phân biệt các loại thang đo?
Câu 4: Nêu một vài ví dụ thực tế có sử dụng thống kê?
Chương 2 QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ
Chương này sẽ giúp người học đi sâu vào tìm hiểu các vấn đề của thống kê, xác
định được các giai đoạn của quá trình nghiên cứu thống kê và mỗi giai đoạn sẽ làm
những nhiệm vụ cụ thể này, đây là một trong những phần quan trọng đưa người học
tiếp cận gần hơn với các nội dung của thống kê.
6
2.1. Điều tra thống kê
2.1.1. Khái niệm

Điều tra thống kê là hình thức thu thập số liệu được tiến hành theo phương án
quy định cụ thể cho từng cuộc điều tra. Trong phương án điều tra quy định rõ mục
đích, nội dung, đối tượng, phạm vi, phương pháp và kế hoạch tiến hành điều tra. Điều
tra thống kê được áp dụng ngày càng rộng rãi trong điều kiện nền kinh tế thị trường có
nhiều thành phần kinh tế.
Điều tra thống kê giúp thu thập các tài liệu ban đầu về các đơn vị tổng thể dùng
làm căn cứ cho các khâu tiếp theo của quá trình nghiên cứu thống kê.
2.1.2. Các loại điều tra thống kê

Điều tra thống kê được phân thành điều tra toàn bộ và điều tra không toàn bộ.
Điều tra toàn bộ nhằm tiến hành thu thập số liệu ở tất cả các đơn vị của tổng thể. Trong
khi đó điều tra không toàn bộ chỉ tiến hành thu thập số liệu của một bộ phận các đơn vị
trong tổng thể. Trong điều tra không toàn bộ còn chia ra điều tra trọng điểm, điều tra
chuyên đề và điều tra chọn mẫu.
Điều tra trọng điểm và điều tra chuyên đề khác với điều tra chọn mẫu ở chỗ kết
quả của nó không dùng để suy rộng cho tổng thể. Kết quả của điều tra chọn mẫu được
dùng để mô tả đặc điểm của tổng thể.
2.1.2.1. Căn cứ vào tính chất liên tục, không liên tục của viê ̣c ghi chép số liê ̣u

Có 2 loại điều tra:

- Điều tra thường xuyên: Liên tục, theo sát với quá trình phát sinh, phát triển của
hiện tượng.

Ví dụ:

+ Một cty ghi chép số người đi làm, số hàng hóa mua vào, số hàng hóa đã tiêu
thụ…
+ Số học viên vắng học, có đi học.
- Điều tra không thường xuyên:
+ Định kỳ: 1 năm kiểm kê 1 lần.
+ Không định kỳ.
Ví dụ: các cuộc điều tra dân số, điều tra vật tư hàng hóa tồn kho tại một thời điểm
nhất định…
2.1.2.2. Căn cứ vào phạm vi của đối tượng điều tra
- Điều tra toàn bộ

7
Thu thập số liệu của tất cả các đơn vị từ tổng thể chung (không bỏ sót bất kỳ một đơn
vị nào).

Ví dụ: Tổng điều tra dân số năm 2010; điều tra tồn kho vật tư hàng hóa ở các
doanh nghiệp nhà nước năm 2017.
- Điều tra không toàn bộ

Thu thập tài liệu của một số đơn vị được chọn ra từ tổng thể chung, các đơn vị được
chọn phải thỏa mãn một số yêu cầu nhất định. - Điều tra chọn mẫu

Chỉ điều tra một số đơn vị được chọn ra từ tổng thể nghiên cứu theo phương pháp
được gọi là mẫu;

Ví dụ: Điều tra ngân sách của một số gia đình, điều tra thăm dò dư luận, điều tra
giá cả thị trường.
- Điều tra trọng điểm
Căn cứ vào những nội dung quan trọng (trọng yếu) để điều tra, chỉ điều tra ở bộ phận
chủ yếu của tổng thể nghiên cứu (chiếm tỷ trọng lớn nhất trong toàn bộ tổng thể); Kết
quả điều tra không dùng để suy rộng cho toàn tông thể; Thích hợp với những tổng thể
có các bộ phân tương đối tâp trung, chiếm tỷ trọng lớn trong tổng thể.

Ví dụ: Để nắm tình hình sản xuất cao su ở nước ta, phải điều tra khu vực có diện
tích trồng cao su chiếm tỷ trọng lớn. - Điều tra chuyên đề

Là điều tra thu thập thông tin nhằm nghiên cứu một chuyên đề nào đó; Thường dùng
nghiên cứu những điển hình (tốt, xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm; Kết
quả điều tra không dùng để suy rộng hoặc làm căn cứ đánh giá tình hình cơ bản của
hiện tượng mà chỉ rút ra kết luận về bản thân các đơn vị điều tra.
2.2. Tổng hợp thống kê
2.2.1. Khái niệm
Là tiến hành tập trung chỉnh lý và hệ thống hóa tài liệu thu thập được qua điều tra
thống kê. Phương pháp dùng để tổng hợp là phương pháp phân tổ thống kê.
Ý nghĩa
- Khái quát hóa hiện tượng.
- Chuẩn bị tài liệu cho báo cáo và phân tích thống kê.
2.2.2. Phương pháp phân tổ thống kê
2.2.2.1. Khái niê ̣m
Phân tổ thống kê là việc sắp xếp phân chia tổng thể thành các tổ hay tiểu tổ căn
cứ vào một hay nhiều tiêu thức sao cho các đơn vị trong cùng một tổ thì giống nhau về
tính chất, ở khác tổ thì khác nhau về tính chất. Nói cách khác phân tổ thống kê/phân
8
lớp thống kê là căn cứ vào một hay một số tiêu thức để chia các đơn vị tổng thể ra
thành nhiều tổ (lớp, nhóm) có tính chất khác nhau.
Ví dụ 2.1: Căn cứ vào tiêu thức tiền lương người ta phân số công nhân của một
doanh nghiệp thành các tổ như sau.
Tiền lương Số công nhân
(triệu/ người) (người)
<1 1.500
1 – 1,5 1.000
1,5 – 2 300
>2 200
Tổng cộng 3.000
Ví dụ 2.2: Phân tổ số công nhân trong doanh nghiệp theo số con có trong gia
đình.
Số con trong gia đình Số công nhân
(người) (người)
0 800
1 1.000
2 600
3 400
4 150
5 20
6 30
Tổng cộng 3.000
2.2.2.2. Một số khái niê ̣m thường dùng trong phân tổ
a) Tổng thể phân tổ: Một cách tổng quát tổng thể phải được phân chia một cách
trọn vẹn, tức là một đơn vị của tổng thể chỉ thuộc một tổ duy nhất và một đơn
vị thuộc một tổ nào đó phải thuộc tổng thể.
b) Tiêu thức phân tổ: căn cứ vào tiêu thức đã chọn, các tổ sẽ được phân chia
dựa theo các tiêu thức. Các tiêu thức phân tổ thường găp như tiêu thức thuộc
tính, tiêu thức số lượng.
c) Lượng biến (xi): là các trị số của tiêu thức số lượng. Có 2 loại lượng biến:
- Lượng biến liên tục: nhận trị số bất kỳ (số nguyên và thập phân).
- Lượng biến rời rạc: chỉ nhận những trị số nguyên.
d) Tần số (fi): là số lần xuất hiện của lượng biến xi trong tổng thể.
e) Giới hạn của tổ:
+ Giới hạn dưới (ximin): trị số nhỏ nhất của một tổ.
+ Giới hạn trên (ximax): trị số lớn nhất của một tổ.

9
f) Khoảng cách tổ:

hi = xi max − xi min Với

hi là khảng cách của tổ thứ i.

g) Tổ mở: là tổ thiếu giới hạn dưới hoặc giới hạn trên


Qui ước: khoảng cách của tổ mở bằng khoảng cách của tổ liền sau hay liền trước
nó.
h) Trị số giữa: (xi’)

x
i' xi min +xi max =

2
Ví dụ: Số liệu ở bảng trên

xi' = =1,5
2.2.3. Các bước tiến hành phân tổ Bước
1: Chọn tiêu thức phân tổ

Khái niệm: Tiêu thức phân tổ là tiêu thức được chọn làm căn cứ để tiến hành
phân tổ thống kê.
Ý nghĩa: Tiêu thức phân tổ phản ánh đúng bản chất của hiện tượng mà mục đích
nghiên cứu đề ra. Sở dĩ như vậy là vì mỗi đơn vị tổng thể như chúng ta biết gồm nhiều
tiêu thức nào cũng có thể dùng để phân tổ được, xong mỗi tiêu thức có ý nghĩa khác
nhau.

Ví dụ: Tổng thể dân số, có thể:

- Phân tổ theo giới tính: giới tính là tiêu thức phân tổ.
- Phân theo độ tuổi: độ tuổi là tiêu thức phân tổ.
- Phân theo nghề nghiệp: nghề nghiệp là tiêu thức phân tổ

Nhưng cùng một nguồn tài liệu nếu chọn tiêu thức phân tổ khác nhau có thể đưa
đến kết luận khác nhau, hoặc chọn tiêu thức phân tổ không đúng theo mục đích nghiên
cứu sẽ dẫn đến nhận xét đánh giá khác nhau về hiện tượng nghiên cứu.
* Những nguyên tắc để xác định đúng tiêu thức phân tổ:
- Thứ nhất: Phải dựa trên cơ sở phân tích lí luận kinh tế - xã hội một cách sâu sắc
để chọn ra tiêu thức phản ánh bản chất, phù hợp với mục đích nghiên cứu.
Tiêu thức bản chất là tiêu thức nêu rõ bản chất của hiện tượng, phản ánh đặc
trưng cơ bản của hiện tượng trong điêu kiện thời gian và địa điểm cụ thể.
10
Ví dụ: Điểm thi là tiêu thức phản ánh bản chất kết quả học của sinh viên, chứ thời
gian tự học chỉ phản ánh một phần nguyên nhân của kết quả học.
Bản chất của hiện tượng có thể được phản ánh qua nhiều tiêu thức khác nhau, vì
vậy tuỳ mục đích nghiên cứu mà dùng lí luận kinh tế - xã hội để chọn ra tiêu thức bản
chất nhất.
- Thứ hai: Phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu.
Cùng một hiện tượng nhưng ở các điều kiện lịch sử khác nhau thì tiêu thức phân
tổ cũng mang ý nghĩa khác nhau. Nếu chỉ dùng một tiêu thức phân tổ chung cho mọi
trường hợp thì tiêu thức đó trong điều kiện lịch sử này có thể giúp ta nghiên cứu chính
xác, nhưng ở điều kiện lịch sử khác lại không có tác dụng.
Quay lại với thí dụ về kết quả học tập của sinh viên: Khi sinh viên còn đang học
tại trường thì tiêu thức phản ánh đúng đắn nhất kết quả học tập là điểm thi trung bình;
khi sinh viên đã làm việc thì điểm thi lại không phản ánh đúng bản chất của kết quả
làm việc.

- Thứ ba: Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên
cứu có thể lựa chọn 1 hay nhiều tiêu thức phân tổ.
+ Phân tổ tài liệu theo 1 tiêu thức gọi là phân tổ giản đơn, cách phân tổ này
thường dùng nghiên cứu các hiện tượng đơn giản và với 1 mục đích yêu cầu nhất định.

Thí dụ: Phân tổ sinh viên theo giới tính: nam, nữ.

+ Phân tổ tài liệu theo từ 2 tiêu thức trở lên kết hợp với nhau gọi là phân tổ kết
hợp. Cách phân tổ này thường dùng nghiên cứu các hiện tượng phức tạp và thoả mãn
nhu cầu mục đích nghiên cứu.

Ví dụ: Phân tổ sinh viên theo điểm thi trung bình và giới tính.
Phân tổ kết hợp tuy có nhiều ưu điểm, song cũng không nên kết hợp quá nhiều
tiêu thức dễ làm cho việc phân tổ trở nên phức tạp, dẫn đến có những sai sót làm giảm
mức độ chính xác của tài liệu.

Bước 2: Xác định số tổ (n) và khoảng cách tổ

Việc xác định số tổ cần thiết (bao nhiêu tổ) và ranh giới giữa các tổ phụ thuộc
vào tiêu thức phân tổ là tiêu thức số lượng hay tiêu thức chất lượng (thuộc tính).

1) Đối với tiêu thức thuộc tính: các tổ được hình thành là do sự khác nhau về
thuộc tính, tính chất hay loại hình. Khi phân tổ theo tiêu thức thuộc tính thì số tổ được
hình thành theo 2 xu hướng:

11
- Đơn giản: có một số trường hợp, việc xác định số tổ và ranh giới giữa các tổ rất
đơn giản và rất dễ dàng vì số tổ ít và ranh giới hình thành một cách đương nhiên.
- Phức tạp: Ví dụ phân tổ lao động theo tiêu thức nghề nghiệp, có rất nhiều
ngành nghề như làm bánh kẹo, dệt, thêu, gạch, làm ruộng... mỗi nghề nghiệp sẽ là một
tổ thì sẽ có quá nhiều tổ, hơn nữa giữa các loại hình chưa chắc chắn đã khác nhau về
chất. Trong trường hợp này người ta sẽ ghép một số loại hình nhỏ vào cùng một tổ
theo nguyên tắc: “Các loại hình đó phải giống nhau về tính chất nào đó hay ý nghĩa về
kinh tế”.
Số tổ (n) = số loại hình của tiêu thức

2) Đối với tiêu thức số lượng: Cơ sở để xác định số tổ và phạm vi mỗi tổ là sự


khác nhau về lượng biến của tiêu thức phân tổ. Tức là dựa vào biểu hiện khác nhau của
lượng biến mà sắp xếp các đơn vị vào các tổ khác nhau về tính chất.

Dựa trên cơ sở này số tổ và ranh giới giữa các tổ được xác định như sau: Nếu
lượng biến của tiêu thức phân tổ ít, có một số các trị số xác định, khi đó ứng với mỗi
trị số lượng biến của tiêu thức phân tổ ta lập 1 tổ.
a) Trường hợp 1: Phân bổ có khoảng cách tổ đều:
Ví dụ: 0,5 – 1; 1 – 1,5; 1,5 – 2….
i) Nếu lượng biến liên tục và số tổ (n) xác định trước:

h=
xmax
−xmin n
Trong đó:
▪ h: khoảng cách tổ;
▪ n: số tổ;
▪ xmax: giới hạn trên (là lượng biến lớn nhất của tổ, nếu vượt quá giới hạn
trên thì tính chất của hiện tượng thay đổi và chuyển sang tổ khác);
▪ xmin: giới hạn dưới (là lượng biến nhỏ nhất để làm cho đó được hình
thành); ▪ Quy ước:
• Khi thành lập tổ thì giới hạn trên của tổ trước trùng với giới hạn
dưới của tổ sau.
• Lượng biến biến tại giới hạn trùng của 2 tổ thì được xếp vào tổ
sau.

12
Ví dụ 2.3: Có số liệu về năng suất lao động của 30 nhân viên bán hàng thuộc
công ty bách hóa bán lẻ. Hãy phân tổ số lao động trên thành 7 tổ, có khoảng cách theo
tiêu thức năng suất lao động. (trình bày bằng bảng thống kê)
Đvt: triệu đồng /người
28,7 31,0 33,0 35,0 29,0 33,9 30,2 32,4 34,8 32,9
(1) (2) (3) (4) (1) (3) (1) (2) (4) (3)
33,7 29,4 31,8 36,9 28,8 34,3 28,9 33,1 38,9 34,6
(2) (1) (2) (5) (1) (3) (1) (3) (6) (3)
29,8 32,1 33,8 35,2 34,9 36,6 37,2 36,7 30,4 42,7
(1) (2) (3) (4) (4) (4) (5) (5) (1) (7)
Ta có: h= 42,7−28,7 = 14 = 2 (người) 7 7

Việc phân tổ sẽ được thực hiện dưới bảng sau:


Năng suất lao động Số nhân viên
Tổ
(triệu đồng/ người) (người)
1 28,7 – 30,7 8
2 30,7 – 32,7 5
3 32,7 – 34,7 7
4 34,7 – 36,7 5
5 36,7 – 38,7 3
6 38,7 – 40,7 1
7 40,7 – 42,7 1
Tổng cộng 30
ii) Nếu lượng biến (xi) rời rạc, n biết trước:
h= (xmax −xmin )−(n−1)

n
Quy ước: Giới hạn dưới của tổ sau sẽ lớn hơn giới hạn trên của tổ trước 1 đơn vị.
Ví dụ 2.4: Có tài liệu về số lao động của 16 doanh nghiệp ngành thương mại trên địa
bàn TP Rạch Giá với lượng biến rời rạc được xác định như sau: (đvt: người)
300 300 500 500 675 670 636 765
760 575 790 915 1.103 800 910 900
Hãy phân tổ theo tiêu thức số lao động biết n = 4. Các tổ có khoảng cách đều.

h= =200 (lao động/ người)


Phân tổ được thực hiện như sau:
Số công nhân
Tổ Số doanh nghiệp
(người)
1 300 – 500 4

13
2 501 – 701 4
3 702 -902 5
4 903 - 1103 3
Tổng cộng 16
b) Trường hợp 2: Phân tổ có khoảng cách tổ không đều:
Việc xác định số tổ và khoảng cách tổ thực hiện tùy thuộc vào mục đích nghiên
cứu.
Ví dụ: Phân tổ theo tiêu thức độ tuổi

Bước 3: Lâ ̣p bảng tổng hợp thống kê


Lượng biến Tần số Tần số tích lũy Tần suất
Tần suất tích lũy
(xi) (fi) (si) (di)
X1 f1 f1/∑fi
X2 f2 f2/∑fi
… … …
Xn fn fn/∑fi
Tổng số ∑fi 100
- Về hình thức: bảng thống kê gồm các hàng, cột, tiêu đề, các con số,…
Các hàng cột thể hiện quy mô của bảng thống kê. Tiêu đề phản ánh nội dung, ý
nghĩa cảu bảng và từng chi tiết trong bảng.
- Về nội dung: một bảng tổng hợp thống kê có các yếu tố sau:
- Lượng biến (xi): là các trị số biểu hiện cụ thể mức độ của tiêu thức số
lượng.
- Tần số (fi): là số đơn vị tổng thể được phân phối vào mỗi tổ, nó là số lần
xuất hiện của lượng biến xi trong tổng thể nghiên cứu.
- Tần suất (di): là tần số được biểu hiện bằng số tương đối (%), chỉ tiêu
này phản ánh số đơn vị mỗi tổ chiếm bao nhiêu % trong toàn bộ tổng thể.
- Tần số tích lũy (si): là tổng các tần số khi ta cộng dồn từ trên xuống.
Bước 4: Sắp xếp các đơn vị theo từng tổ vào bảng tổng hợp thống kê
Ứng dụng Excel: hàm đếm ô theo nhiều điều kiện
COUNTIFS(criteria_range_1, criteria_1, [criteria_range_2, criteria_2],…).
2.3. Phân tích và dự báo thống kê
14
2.3.1. Khái niệm
Là việc nêu lên bản chất tính qui luật của hiện tượng thông qua sự việc bằng số
lượng và tính toán mức độ đó trong tương lai. Mục đích của phân tích thống kê là sử
dụng số liệu thu thập từ mẫu như trung bình và tỷ lệ mẫu để ước lượng giá trị thực của
tổng thể.
- Cơ sở để đề ra các quyết định và các chiến lược trong quản lý.
- Là mục đích cuối cùng của nghiệp vụ thống kê.

2.3.2. Phương pháp sử dụng


- Phương pháp sử dụng là phương pháp số tuyệt đối, số tương đối, số bình
quân.
- Các phương pháp thống kê biến động của hiện tượng như phương pháp
so sánh, phương pháp dãy số thời gian.
- Phương pháp chỉ số
- Các phương pháp thống kê mối liên hệ giữa các hiện tượng; phương pháp
hệ thống chỉ số, phương pháp hệ thống chỉ số, phương pháp hồi qui tương quan.
2.4. Bảng thống kê (Statistical table)
Sau khi tổng hợp các tài liệu điều tra thống kê, muốn phát huy tác dụng của nó
đối với phân tích thống kê, cần thiết phải trình bày kết quả tổng hợp theo một hình
thức thuận lợi nhất cho việc sử dụng sau này.
2.4.1. Khái niệm
Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ
thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng
nghiên cứu. Đặc điểm chung của tất cả các bảng thống kê là bao giờ cũng có những
con số của từng bộ phận và có mối liên hệ mật thiết với nhau.
2.4.2. Cấu thành bảng thống kê

a) Về hình thức

Bảng thống kê gồm các hàng, cột, các tiêu đề, mục tiêu và các con số. Các
hàng, cột thể hiện qui mô của bảng, số hàng, số cột càng nhiều thì bảng thống kê
càng lớn và càng phức tạp.
Tiêu đề của bảng thống kê phản ánh nội dung, ý nghĩa của bảng và của từng
chi tiết trong bảng. Trước hết ta có tiêu đề chung, sau đó là các tiêu đề nhỏ (tiêu
mục) là tên riêng của mỗi hàng, cột phản ánh ý nghĩa của cột đó.

b) Phần nội dung


15
Bảng thống kê gồm 2 phần: Phần chủ đề và phần giải thích.

- Phần chủ đề nói lên tổng thể được trình bày trong bảng thống kê, tổng thể
này được phân thành những đơn vị, bộ phận. Nó giải đáp câu hỏi: đối tượng nghiên
cứu là những đơn vị nào, những loại hình gì. Có khi phần chủ đề phản ánh các địa
phương hoặc các thời gian nghiên cứu khác nhau của một hiện tượng.

- Phần giải thích gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên
cứu, tức là giải thích phần chủ đề của bảng.
Phần chủ đề thường được đặt bên trái của bảng thống kê, còn phần giải thích
được đặt ở phía trên của bảng. Cũng có trường hợp ta thay đổi vị trí.
Bảng 2.1. Bảng tổng hợp thống kê
Đơn vị tính: …

Phần giải thích Các chỉ tiêu giải thích (tên cột)
Phần chủ đề
(1) (2) (3) (4) (5)

Tên chủ đề

2.4.3. Các yêu cầu và qui ước xây dựng bảng thống kê
- Qui mô của bảng thống kê
Không nên quá lớn, tức là quá nhiều hàng, cột và nhiều phân tổ kết hợp. Một
bảng thống kê ngắn, gọn một cách hợp lý sẽ tạo điều kiện dễ dàng cho việc phân tích.
Nếu thấy cần thiết nên xây dựng hai, ba,... bảng thống kê nhỏ thay cho một bảng thống
kê quá lớn.
- Số hiệu bảng

Nhằm giúp cho người đọc dễ dàng xác định vị trí của bảng khi tham khảo, đặc
biệt là đối với các tài liệu nghiên cứu người ta thường lập mục lục biểu bảng để người
đọc dễ tham khảo và người trình bày dễ dàng hơn. Nếu số biểu bảng không nhiều thì
chúng ta chỉ cần đánh số theo thứ tự xuất hiện của biểu bảng, nếu tài liệu được chia
thành nhiều chương và số liệu biểu bảng nhiều thì ta có thể đánh số theo chương và
theo số thứ tự xuất hiện của biểu bảng trong chương.
- Tên bảng

Yêu cầu ngắn gọn, đầy đủ, rõ ràng, đặt trên đầu bảng và phải chứa đựng nội
dung, thời gian, không gian mà số liệu được biểu hiện trong bảng. Tuy nhiên yêu cầu
này chỉ mang tính chất tương đối không có tiêu chuẩn rõ ràng nhưng thông thường
người ta cố gắng trình bày trong một hàng hoặc tối đa là hai hàng.
- Đơn vị tính:

16
+ Đơn vị tính dùng chung cho toàn bộ số liệu trong bảng thống kê, trường hợp
này đơn vị tính được ghi bên góc phải của bảng.

+ Đơn vị tính theo từng chỉ tiêu trong cột, trong trường hợp này đơn vị tính sẽ
được đặt dưới chỉ tiêu của cột.

+ Đơn vị tính theo từng chỉ tiêu trong hàng, trong trường hợp này đơn vị tính
sẽ được đặt sau chỉ tiêu theo mỗi hàng hoặc tạo thêm một cột ghi đơn vị tính.
- Cách ghi số liệu trong bảng:
+ Số liệu trong từng hàng (cột) có đơn vị tính phải nhận cùng một số lẻ, số liệu
ở các hàng (cột) khác nhau không nhất thiết có cùng số lẻ với hàng (cột) tương
ứng.
+ Một số ký hiệu qui ước:
• Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-”

• Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm
“...”

• Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có
liên quan đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa.
- Phần ghi chú ở cuối bảng: được dùng để giải thích rõ các nội dung chỉ tiêu
trong bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác. Đối với
các tài liệu khoa học, việc ghi rõ nguồn số liệu được coi như là bắt buộc không thể
thiếu trong biểu bảng.
- Tổng hợp bằng đồ thị: Đồ thị thống kê có thể biểu thị:
+ Kết cấu của hiện tượng theo tiêu thức nào đó và sự biến đổi của kết cấu.

+ Sự phát triển của hiện tượng theo thời gian.

+ So sánh các mức độ của hiện tượng.

+ Mối liên hệ giữa các hiện tượng.

+ Trình độ phổ biến của hiện tượng.

+ Tình hình thực hiện kế hoạch.


Trong công tác thống kê thường dùng các loại đồ thị: Biểu đồ hình cột, biểu đồ
tượng hình, biểu đồ diện tích (hình vuông, hình tròn, hình chữ nhật), đồ thị đường gấp
khúc và biểu đồ hình mạng nhện,...

17
BÀI TẬP
Bài 1. Cho doanh số của 30 cửa hàng trong tháng 1/2020 như sau: (đvt: triệu đồng)
12,1 18,8 22,1 44,6 23,1 49,5 29,8 32,6 42,1 52,8
18,2 14,3 22,6 54,6 64,5 68,3 18,7 45,6 59,5 63,5
14,8 20,5 46,8 47,9 61,8 62,2 69,9 18,9 26,9 72,1
Cho n = 6, hãy phân tổ theo tiêu thức doanh số bán hàng, có khoảng cách tổ đều. Trình
bày bằng bảng thống kê?
Bài 2. Cho doanh số bán hàng hoá của 28 quầy hàng thuộc công ty SATIMEX như
sau:
Đvt: triệu đồng
Doanh Doanh Doanh Doanh
Quầy Tổ Quầy Tổ Quầy Tổ Quầy Tổ
số số số số
1 114,0 8 78,5 15 114,5 22 96,4
2 116,0 9 79,6 16 98,3 23 95,0
3 118,2 10 108,1 17 77,6 24 94,0
4 105,4 11 82,2 18 100,6 25 99,2
5 106,7 12 91,6 19 75,5 26 92,4
6 107,9 13 94,4 20 78,8 27 99,6
7 120,5 14 93,8 21 105,4 28 76,3
Yêu cầu: Cho n = 5, hãy phân tổ theo doanh số bán hàng, có khoảng cách tổ đều.
Trình bày bằng bảng thống kê?
Bài 3. Cho năng suất lao động của 28 công nhân của nhà máy sản xuất đường Minh
Tân theo tháng như sau:
Đvt: Tấn/tháng
Nhân Năng Nhân Năng Nhân Năng Nhân Năng
viên suất viên suất viên suất viên suất
1 45,0 8 75,0 15 61,5 22 64,0
2 49,0 9 46,0 16 68,5 23 65,0
3 20,5 10 30,5 17 72,0 24 62,0
4 28,0 11 56,5 18 15,0 25 47,0
5 29,5 12 58,5 19 36,0 26 43,5
6 26,5 13 59,0 20 52,5 27 36,0
7 40,5 14 68,0 21 54,0 28 24,0
Yêu cầu: Với n = 6, hãy phân tổ theo năng suất lao động của nhân viên, có khoảng
cách tổ đều. Trình bày kết quả bằng bảng thống kê?
Bài 4. Cho tài liệu về năng suất lúa (tạ/ha) của 50 hộ nông dân ở địa phương X năm
2020 như sau:
3,5 4,1 3,2 4,4 3,3 4,1 3,8 4,4 4,3 4,3
3,0 3,5 3,5 4,3 4,8 4,6 4,8 4,9 3,9 4,9
18
4,6 4,2 4,1 5,1 3,6 4,2 4,4 3,4 4,6 3,4
3,6 4,7 4,2 4,1 3,7 4,7 4,9 3,8 4,1 3,9
4,0 4,4 4,8 4,2 4,6 5,2 4,3 4,1 5,5 4,3
Yêu cầu: Phân tổ theo khoảng cách đều với n = 5, trình bày bằng bảng thống kê?
Bài 5. Có tài liệu sau của 20 cửa hàng bán hàng thuộc công ty SAVIMEX trong quý I
năm 2020:
Số Số NS bán
NS bán hàng
Cửa Số lao lượng Cửa Số lao lượng hàng
Bq 1 CN
hàng động SP bán hàng động SP bán Bq 1 CN
(tấn) (tấn/người) (tấn) (tấn/người)
1 25 23.000 920 11 24 20.640 860
2 20 18.600 930 12 13 10.400 800
3 15 13.650 910 13 17 13.960 820
4 10 7.800 780 14 23 20.700 900
5 18 16.200 900 15 8 7.360 920
6 14 12.740 910 16 16 14.500 910
7 14 12.180 870 17 7 6.580 940
8 9 7.470 830 18 6 4.860 810
9 20 19.000 950 19 15 13.500 900
10 10 7.500 750 20 9 8.190 910
Yêu cầu:
1) Hãy phân tổ số công nhân trên thành 4 nhóm có khoảng cách đều căn cứ vào
năng suất bán hàng bình quân của 1 công nhân.
2) Căn cứ theo tiêu thức số lượng sản phẩm bán, hãy phân tổ 20 cửa hàng trên
thành 5 tổ có khoảng cách tổ đều.
Bài 6: Có tài liệu về năng suất lúa (tạ/ha) của 50 hộ nông dân ở một địa phương được
ghi nhận như sau:
35 41 32 44 33 41 38 44 43 42
30 35 35 43 48 46 48 49 39 49
46 42 41 50 36 42 44 34 46 34
36 47 42 41 37 47 49 38 41 39
40 44 48 42 46 50 43 41 50 43
Yêu cầu: Hãy phân tổ tài liệu trên thành các tổ có khoảng cách tổ đều, qua đó lập bảng
phân phối tần số, tính tần số tích lũy, tần suất, tần suất tích lũy?

19
Chương 3 CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ XÃ
HỘI
Trong đời sống, để bắt gặp các con số thể hiện các thông tin về các vấn đề kinh
tế, xã hội là điều rất bình thường. Chương này sẽ giúp người học phân biệt được các
loại số, mỗi loại số thể hiện các giá trị và ý nghĩa khác nhau, từ đó có thể nhận biết
được các mức độ khác nhau của từng số liệu khi chúng được thể hiện.

3.1. Số tuyệt đối


3.1.1. Khái niệm
Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc quá
trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể.
Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng thể hay
của từng bộ phận trong tổng thể (số doanh nghiệp, số nhân khẩu, số học sinh đi học, số
lượng cán bộ khoa học,...) hoặc tổng các trị số theo một tiêu thức nào đó (tiền lương
của công nhân, giá trị sản xuất công nghiệp, tổng sản phẩm trong nước (GDP),...).
Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ không thể thiếu
được trong việc xây dựng chiến lược phát triển kinh tế, tính toán các mặt cân đối,
nghiên cứu các mối quan hệ kinh tế - xã hội, là cơ sở để tính toán các chỉ tiêu tương
đối và bình quân.
3.1.2. Các loại số tuyệt đối

Căn cứ vào khoảng thời gian tính, Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và
số tuyệt đối thời điểm.

- Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một thời
kỳ nhất định.
Ví dụ: Giá trị sản xuất công nghiệp trong 1 tháng, quý hoặc năm; Sản lượng lương
thực năm 2005, năm 2006, năm 2007,...

- Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng ở một thời
điểm nhất định

Ví dụ: dân số của một địa phương nào đó có đến 0 giờ ngày 01/04/2005; giá trị tài
sản cố định có đến 31/12/2007; lao động làm việc của doanh nghiệp vào thời điểm
1/7/2007, Số dư tiền gửi ngân hàng của doanh nghiệp lúc 17h00 ngày 15/03/2019
là 25 triệu đồng.

3.2. Số tương đối


3.2.1. Khái niệm

20
Số tương đối là chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ tiêu thống kê cùng
loại nhưng khác nhau về thời gian hoặc không gian hoặc giữa hai chỉ tiêu khác loại
nhưng có quan hệ với nhau. Trong hai chỉ tiêu để so sánh của số tương đối, sẽ có một
số được chọn làm gốc (chuẩn) để so sánh.
Số tương đối có thể được biểu hiện bằng số lần, số phần trăm (%) hoặc phần
nghìn (‰), hay bằng các đơn vị kép (người/km 2, người/1.000 người; đồng/1.000
đồng,...).
Trong công tác thống kê, số tương đối được sử dụng rộng rãi để phản ánh những
đặc điểm về kết cấu, quan hệ tỷ lệ, tốc độ phát triển, mức độ hoàn thành kế hoạch, mức
độ phổ biến của hiện tượng kinh tế - xã hội được nghiên cứu trong điều kiện thời gian
và không gian nhất định.
Số tương đối phải được vận dụng kết hợp với số tuyệt đối. Số tương đối thường
là kết quả của việc so sánh giữa hai số tuyệt đối. Số tương đối tính ra có thể rất khác
nhau, tuỳ thuộc vào việc lựa chọn gốc so sánh. Có khi số tương đối có giá trị rất lớn
nhưng ý nghĩa của nó không đáng kể vì trị số tuyệt đối tương ứng của nó lại rất nhỏ.
Ngược lại, có số tương đối tính ra khá nhỏ nhưng lại mang ý nghĩa quan trọng vì trị số
tuyệt đối tương ứng của nó có quy mô đáng kể.
Ví dụ: 1% dân số Việt Nam tăng lên trong những năm 1960 đồng nghĩa với dân
số tăng thêm 300 nghìn người, nhưng 1% dân số tăng lên trong những năm 2000 lại
đồng nghĩa với dân số tăng thêm 800 nghìn người.
Căn cứ vào nội dung mà số tương đối phản ánh, có thể phân biệt: số tương đối
động thái, số tương đối kế hoạch, số tương đối kết cấu, số tương đối cường độ, và số
tương đối không gian.

3.2.2. Các loại số tương đối

3.2.2.1. Số tương đối động thái (tốc độ phát triển)

Số tương đối động thái là chỉ tiêu phản ánh biến động theo thời gian về mức độ
của chỉ tiêu kinh tế - xã hội. Số tương đối này tính được bằng cách so sánh hai mức độ
của chỉ tiêu được nghiên cứu ở hai thời gian khác nhau. Mức độ của thời kỳ được tiến
hành nghiên cứu thường gọi là mức độ của kỳ báo cáo, còn mức độ của một thời kỳ
nào đó được dùng làm cơ sở so sánh thường gọi là mức độ kỳ gốc.

y1 *100% (%) hoặc (lần)


t=
y0

▪ y0: mức độ hiện tượng kỳ gốc.


▪ t: tốc độ phát triển
▪ y1: mức độ hiện tượng ở mức độ nghiên cứu hoặc báo cáo.
21
Trong hai mức độ đó, mức độ tử số (y1) là mức độ cần nghiên cứu (hay còn gọi là
mức độ kỳ báo cáo), mức độ ở mẫu số (y 0) là mức độ kỳ gốc (hay mức độ dùng làm cơ
sở so sánh).

- Nếu y0 cố định qua các kỳ nghiên cứu ta có kỳ gốc cố định: dùng để so


sánh
một chỉ tiêu nào đó ở hai thời kỳ tương đối xa nhau. Thông thường người ta chọn năm
gốc là năm đầu tiên của dãy số.

- Nếu y0 thay đổi theo kỳ nghiên cứu ta có kỳ gốc liên hoàn: dùng để nói
lên sự biến động của hiện tượng liên tiếp nhau qua các kỳ nghiên cứu.
Số tương đối động thái thường phản ánh tốc độ phát triển của các sự kiện nào đó
tại các mốc thời gian được xác định.

Ví dụ như xác định tốc độ phát triển internet ở Việt Nam từ năm 2000 đến nay.

3.2.2.2. Số tương đối kế hoạch


1) Số tương đối nhiê ̣m vụ kế hoạch (tNK): là so sánh giữa mức độ đạt kế
hoạch với mức độ hiện tượng ở kỳ gốc.

yk (lần, %)
tNK =
y0

yk: mức độ của hiện tượng theo kế hoạch


2) Số tương đối hoàn thành kế hoạch (tHK): là so sánh giữa mức độ thực tế
đạt được với mức độ theo kế hoạch đề ra.

y1 (lần; %) tHK
=
yk

3) Mối liên hê ̣ giữa t, tNK, và tHK: t = tHK *tNK

Ví dụ 3.1: Có tài liệu về giá trị sản xuất của công ty X.


ĐVT: triệu đồng
Giá trị sản xuất y y y
2019 2020 tNK = k tHK = 1 t = 1
Phân xưởng
Thực tế y0 Kế hoạch yk Thực tế y1 y0 yk y0
(%) (%) (%)
A 4.300 4.500 6.150
B 10.600 12.000 14.200
C 5.000 5.500 4.300
D 1.200 1.300 1.300
22
Cty X 21.100 23.300 25.950 ? ? ?
Yêu cầu:
1. Tính số tương đối nhiệm vụ kế hoạch cho từng phân xưởng và chung công ty?
2. Tính số tương đối hoàn thành kế hoạch cho từng phân xưởng và chung công
ty?
3. Tính số tương đối động thái cho từng phân xưởng và chung công ty?

3.2.2.3. Số tương đối kết cấu (tỷ trọng)


Số tương đối kết cấu là chỉ tiêu phản ánh tỷ trọng của mỗi bộ phận chiếm trong
tổng thể, tính được bằng cách đem so sánh mức độ tuyệt đối của từng bộ phận với mức
độ tuyệt đối của toàn bộ tổng thể.

Số tương đối kết cấu thường được biểu hiện bằng số phần trăm.
Ví dụ: Tỷ trọng của GDP theo từng ngành trong tổng GDP của nền kinh tế quốc
dân; tỷ trọng dân số của từng giới nam hoặc nữ trong tổng số dân,...
Công thức thể hiện như sau:
ybf
d=
ytt
ybf: Số tuyệt đối bộ phận;
ybf: Số tuyệt đối tổng thể;
d: tỷ trọng.

3.2.2.4. Số tương đối cường độ


Số tương đối cường độ là chỉ tiêu biểu hiện trình độ phổ biến của một hiện tượng
trong các điều kiện thời gian và không gian cụ thể.
Số tương đối cường độ tính được bằng cách so sánh mức độ của hai chỉ tiêu khác
nhau nhưng có quan hệ với nhau. Số tương đối cường độ biểu hiện bằng đơn vị kép, do
đơn vị tính ở tử số và ở mẫu số hợp thành.
Số tương đối cường độ được tính toán và sử dụng rất phổ biến trong công tác
thống kê. Các số tương đối trong số liệu thống kê thường gặp như mật độ dân số bằng
tổng số dân (người) chia cho diện tích tự nhiên (km2) với đơn vị tính là người /km2;
GDP bình quân đầu người bằng tổng GDP (nghìn đồng) chia cho dân số trung bình
(người) với đơn vị tính là 1000đ/người; số bác sĩ tính bình quân cho một vạn dân bằng

23
tổng số bác sĩ chia cho tổng số dân tính bằng vạn người với đơn vị tính là người
/10.000 người,...
3.2.2.5. Số tương không gian

Là so sánh hai mức độ của một chỉ tiêu nhưng khác nhau về không gian (địa
điểm).

3.3. Số bình quân - Số đo độ tâ ̣p trung (Measures of central tendency)


3.3.1. Khái niệm

- Số bình quân là chỉ tiêu biểu hiện mức độ điển hình của một tổng thể gồm nhiều
đơn vị cùng loại được xác định theo một tiêu thức nào đó. Số bình quân được sử dụng
phổ biến trong thống kê để nêu lên đặc điểm chung nhất, phổ biến nhất của hiện tượng
kinh tế - xã hội trong các điều kiện thời gian và không gian cụ thể.
Ví dụ: Tiền lương bình quân một công nhân trong doanh nghiệp là mức lương
phổ biến nhất, đại diện cho các mức lương khác nhau của công nhân trong doanh
nghiệp; thu nhập bình quân đầu người của một địa bàn là mức thu nhập phổ biến nhất,
đại diện cho các mức thu nhập khác nhau của mọi người trong địa bàn đó.

- Số bình quân còn dùng để so sánh đặc điểm của những hiện tượng không có
cùng một quy mô hay làm căn cứ để đánh giá trình độ đồng đều của các đơn vị tổng
thể.

- Để tính được số trung bình chính xác và có ý nghĩa, điều kiện chủ yếu là nó phải
được tính cho những đơn vị cùng chung một tính chất (thường gọi là tổng thể đồng
chất). Muốn vậy, phải dựa trên cơ sở phân tổ thống kê một cách khoa học và chính
xác. Đồng thời phải vận dụng kết hợp giữa số bình quân tổ với số bình quân chung.

- Có nhiều loại số bình quân khác nhau. Trong thống kê kinh tế - xã hội thường
dùng các loại sau: Số trung bình số học, số trung bình điều hoà, số trung bình hình học
(số trung bình nhân), mốt và trung vị.
Xét theo vai trò đóng góp khác nhau của các thành phần tham gia bình quân hoá,
số bình quân chung được chia thành số bình quân giản đơn và số bình quân gia quyền.

+ Số trung bình giản đơn: Được tính trên cơ sở các thành phần tham gia bình
quân hoá có vai trò về qui mô (tần số) đóng góp như nhau.

+ Số trung bình gia quyền (trung bình có trọng số): Được tính trên cơ sở các
thành phần tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp khác nhau.
3.3.2. Các loại số bình quân cộng
3.3.2.1. Số bình quân cộng giản đơn (Mean) Công
thức:
24
n

x x= i

i=1 n
Trong đó:

x : Số bình quân. xi
: Các lượng biến
n: tổng số đơn vị tổng thể/ số quan sát.
Ví dụ 3.2: Có tình hình tiền lương 1 tổ xí nghiệp gồm 4 công nhân:
(ĐVT: 1.000đ)
Công nhân Tiền lương
(1.000 đ/người)
1 500
2 600
3 700
4 800
Yêu cầu: Tính tiền lương bình quân 1 công nhân?
Hướng dẫn:
Xác định công thức kinh tế:
Tổng mức tiền lương
Tiền lương bình quân 1
=
công nhân Tổng số công nhân

Suy ra:

TLbq = Tổng TL/Tổng số CN = =650 (1.000 đ/người)


3.3.2.2. Số bình quân cộng gia quyền (Weighted mean) Công
thức:
n

x f i i

x = i=1n

f i

i=1

Trong đó:
fi : quyền số là số lần xuất hiện lượng biến
xi trong tổng thể.

25
Ví dụ 3.3: Có tài liệu về mức thu nhập của các hộ theo tháng
Thu nhâ ̣p hàng tháng
Số hộ
(1.000 đồng)
5.000 3
5.250 8
5.400 9
5.450 10
5.600 12
6.000 30
6.200 15
6.300 7
6.500 6
Tổng 100
Ta lập bảng tổng thu nhập hàng tháng của các hộ:
Thu nhâ ̣p hàng tháng
Số hộ (fi) xifi
(1.000 đồng) (xi)
5.000 3 15.000
5.250 8 42.000
5.400 9 48.600
5.450 10 54.500
5.600 12 67.200
6.000 30 180.000
6.200 15 93.000
6.300 7 44.100
6.500 6 39.000
Tổng 100 583.400
Hãy nhận xét sơ bộ về kết quả tính được?
Ví dụ 3.4: Có số liệu thu nhập hàng tháng của nhân viên một công ty như sau:
Thu nhâ ̣p hàng tháng
Số nhân viên
(ngàn đồng)
500-520 8
520-540 12
540-560 20
560-580 56
580-600 18
600-620 16
Trên 620 10
Tổng 140
Trường hợp 1: Đối với lượng biến có khoảng cách tổ

26
- Trường hợp dãy số được phân tổ thì lượng biến x i là trị số giữa của các tổ. Nếu
dãy số có tổ mở thì lấy khoảng cách tổ của tổ gần tổ mở nhất để tính giới hạn trên của
tổ mở từ đó xác định được giá trị xi.
- Đối với tổ không có giới hạn trên: giới hạn dưới của tổ mở cộng với khoảng
cách tổ của tổ trước đó mở rồi chia hai.

- Đối với tổ không có giới hạn dưới: giới hạn trên của tổ mở trừ khoảng cách tổ
của tổ sau đó mở rồi chia hai. Tùy theo tính chất của nội dung nghiên cứu mà có thể
chọn giá trị xi phù hợp.
Từ bảng trên ta có bảng sau:
Thu nhập hàng tuần (ngàn đồng) xi fi xifi
500-520 510 8 4.080
520-540 530 12 6.360
540-560 550 20 11.000
560-580 570 56 31.920
580-600 590 18 10.620
600-620 610 16 9.760
Trên 620 630 10 6.300
Tổng 140 80.040
Tuy nhiên, việc ước lượng các giá trị x i có chính xác hay không còn phụ thuộc
vào phân phối của từng tổ. Nếu phân phối của từng tổ có tính chất đối xứng thì việc
ước lượng xi có thể chấp nhận được, tuy nhiên đối với các trường hợp phân phối của tổ
lệch trái hoặc lệch phải thì kết quả đó khó có thể chấp nhận được. Do đó, trong quá
trình tính toán với sự hỗ trợ của các phần mềm máy tính ta nên sử dụng số liệu điều tra
và tính với công thức trung bình đơn giản để đảm bảo tính chính xác.

Chú ý: Nếu không có tài liệu về fi nhưng có số liệu về tỷ trọng của fi trong tổng
thể.

fi
di = (lần, %) f i

Số bình quân cộng gia quyền có dạng:


n

x=xidi
i=1

3.3.3. Số bình quân điều hòa


3.3.3.1. Số bình quân điều hòa gia quyền
27
x = MM ii

 xi
M i : trọng số là tổng các lượng biến (M i = xi fi )

Ví dụ 3.5: Có số liệu về tiền lương bình quân của những lao động làm việc tại cơ sở
sản xuất Mai Anh năm 2018 như sau:
PX TLbq (1000 đ/người) Tổng TL (1000 đ) M
( xi ) (M i ) fi = i

xi
A 500 5000 ?
B 600 8000 ?
C 700 10000 ?
D 850 20000 ?
Tổng 43000 ?
Tính tiền lương bình quân 1 công nhân trong doanh nghiệp?

+ +M3 + M4
x=TongTL = MM M11+ M22 + + = 703,206 (1000 đ/người)

CN M3 M4 x1 x2 xi
x4
Lưu ý: Khi M1 = M 2 = M3 = M 4 thì:

x = MM +MM + MM + MM
+ + +
x1 x2 xi x4

3.3.3.2. Số bình quân điều hòa giản đơn

Và M1 = M 2 = ....= M n thì số bình quân điều hòa gia quyền có dạng số bình quân
điều hòa giản đơn, công thức tính như sau:
n
x= n 1


x
i=1 i

28
Ví dụ 3.6: Số liệu về tiền lương bình quân tại công ty MQ được ghi nhận như sau:
TLbq 1 người Tổng TL khoán cho
Phòng
( xi ) từng phòng (M i )
1 800.000 10.000.000
2 1.200.000 10.000.000
3 1.500.000 10.000.000
Tổng tiền lương bình quân 1 công nhân trong DN:

x=
1 1 1
3
=1.090.909 đ/người
+ +
800.000 1.200.000 1.500.000
3.3.4. Số bình quân nhân (Geometric mean) 3.3.4.1.
Số bình quân nhân giản đơn
n

x= n xi
i=1
n

 : ký hiệu tích; xi =x1x2...xn ; áp dụng khi các lượng biến xi có quan hệ tích số.
Ví dụ 3.7: Hãy tính tốc độ phát triển sản lượng hàng hóa tiêu thụ (1.000 tấn) của
một công ty qua các năm như sau:
Năm 2001 2002 2003 2004 2005 2006 2007
Sản lượng hàng hóa (1.000 tấn) 240,0 259,2 282,5 299,5 323,4 355,8 387,8
Tốc độ phát triển liên hoàn (lần) - 1,08 1,09 1,06 1,08 1,10 1,09
Giữa các tốc độ phát triển liên hoàn có mối quan hệ nhân, do đó ta áp dụng
công thức trung bình nhân:

x= 6 xx x x x x1
456 = 1.6158= 1,08 lần
6
3

3.3.4.2. Số bình quân nhân gia quyền


Khi các biến xi có tần số fi khác nhau, ta có số bình quân gia quyền:
n

x = f (xi ) f
i i

i=1

Ví dụ 3.8: Có tình hình biến động doanh thu:

29
Tốc độ phát triển bình quân một năm giai đoạn (2005 – 2010): 115%
Tốc độ phát triển bình quân một năm giai đoạn (2010 – 2015): 120%
Tốc độ phát triển bình quân một năm giai đoạn (2015 – 2019): 105% Tốc
độ phát triển năm 2020 so với 2010 là : 130%
Tính tốc độ phát triển bình quân 1 năm giai đoạn (2005 – 2020)?

Hướng dẫn:
Ta có: xi : 115% 120% 105% 130%
fi : 5 5 4 1
Tốc độ
phát triển bình quân 1 năm (2005 – 2020) x=151,155 *1,25
*1,054 *1,31 =1,148 = 114,8%

Có nhận xét gì về tốc độ phát triển này?


3.4. Số trung vị - Me (Median)
Trong một số trường hợp đặc biệt, nếu dữ liệu có sự biến động lớn hay có sự
chênh lệch bất thường thì số trung bình tỏ ra không đại diện cho tổng thể vì các giá trị
quá nhỏ hay quá lớn sẽ làm lệch kết quả của số trung bình. Số trung vị là một giá trị
bình quân có vẻ đại diện tốt hơn cho số trung bình trong trường hợp này, bởi vì nó sẽ
chia tổng thể ra thành hai nhóm có số quan sát bằng nhau: một nhóm có giá trị nhỏ
hơn, một nhóm có giá trị lớn hơn.
* Định nghĩa: Số trung vị là lượng biến đứng ở vị trí giữa trong dãy số đã được sắp
xếp theo thứ tự tăng dần hay giảm dần.

* Phương pháp xác định số trung vị:

Bước 1. Trước tiên ta sắp xếp lượng biến theo thứ tự tăng dần.

Bước 2. Tính số trung vị.

* Từ tài liê ̣u không phân tổ:

+ Trường hợp n lẻ: n = 2k+1, nghĩa là dãy số lượng biến x1, x2,… xk, xk+1,… xn.
Số trung vị sẽ là lượng của đơn vị đứng ở vị trí k+1. Số trung vị được ký hiệu là
Me.

Me = x(k+1)

30
+ Trường hợp n chẵn, tức là n = 2k số trung vị rơi vào giữa hai lượng biến x k và
xk+1. Trường hợp này qui ước số trung vị là trung bình cộng của hai lượng biến
đó.
Me = (xk + xk+1)/2
Ví dụ 3.9: Thu nhập hàng hàng tháng của số công nhân sau: 500, 520, 530, 550,
560, 570, 590, 600, 610, 670.

Số trung vị là: Me = (560+570)/2 = 565.

Ứng dụng: Trong Excel người ta dùng hàm MEDIAN để tính số trung vị *

Đối với dãy số lượng biến có phân tổ:

- Trường hợp không có khoảng cách tổ: Ta xác định tổ chứa số trung vị như
sau:

+ Trước hết ta tính (fi/2) và đem so sánh với tần số tích lũy của tổ. Giá trị (fi/2)
thuộc tổ nào thì tổ đó chứa số trung vị.
Ví dụ 3.10: Có tài liệu phân tổ 130 sinh viên thuộc ngành Quản trị kinh doanh
năm 2020 như sau:
TT Tuổi Số người Si
1 18 12 12
2 20 20 32
3 21 30 62
4 22 50 112
5 23 18 130
Cộng x fi = 130
Yêu cầu: Hãy tìm số trung vị về độ tuổi của số sinh viên trên?

Theo số liệu trên ta thấy fi/2 = 130/2 = 65 thuộc tổ 4. Vậy Me = x4 = 22


- Trường hợp có khoảng cách tổ: Ta xác định tổ chứa số trung vị như sau:

+ Trước hết ta tính (fi)/2 và đem so sánh với tần số tích lũy (S i) của tổ. Giá trị
(fi)/2 thuộc tổ nào thì tổ đó là tổ chứa số trung vị.
+ Tính số trung vị theo công thức:

 fi/2 – SMe-1
Me = x Me(min) + hMe

Trong đó: fMe


▪ xMe(min): Giới hạn dưới của tổ chứa số trung vị

31
▪ hMe: Trị số khoảng cách tổ chứa số trung vị
▪ fMe: Tần số của tổ chứa số trung vị
▪ SMe-1: Tần số tích lũy trước tổ chứa số trung vị
Ví dụ 3.11: Khảo sát tuổi thọ 258 bóng đèn do một nhà máy sản xuất ta có:
Tổ Tuổi thọ (giờ) Số bóng Tần số tích
Ghi chú
(xi) (fi) lũy (Si)
1 1.000–1.100 4 4
2 1.100-1.200 10 14
3 1.200-1.300 16 30
4 1.300-1.400 20 50
5 1.400-1.500 36 86
6 1.500-1.600 48 134 Tổ chứa số trung vị
7 1.600-1.700 42 176
8 1.700-1.800 32 208
9 1.800-1.900 26 234
10 1.900-2.000 16 250
11 2.000-2.100 8 258
Cộng 258 x
Yêu cầu: Tính Me?

Theo số liệu trên ta thấy (fi)/2 = 258/2 = 129 thuộc tổ 6. Ta có


▪ xMe(min) = 1.500 ▪ h Me = 100
▪ f Me = 48 ▪ S Me-1 = 86

f / 2 S −i Me 1−

Vậy Me = XMe(min) +hMe 


fMe

=1.500+100 =1.589,58 1.590 giờ


3.5. Mốt – Mo (Mode)
* Định nghĩa: Mode là lượng biến có tần số xuất hiện lớn nhất trong tổng thể. Số
Mo là giá trị thể hiện tính phổ biến của hiện tượng, tức là dữ liệu tập trung nhiều ở một
khoảng giá trị nào đó. Trong thực tế người ta có thể sử dụng giá trị này trong sản xuất
giày, quần áo may sẵn,… * Phương pháp xác định M0:

Ta phân biệt 2 trường hợp:

- Trường hợp tài liệu phân tổ không có khoảng cách tổ: (Phân tổ thuộc
tính) thì đại lượng là Mo lượng biến có tần số lớn nhất.
32
- Trường hợp tài liệu phân tổ có khoảng cách tổ: trước hết ta xác định tổ
chứa Mo, tổ chứa Mo là tổ có tần số lớn nhất, sau đó trị số gần đúng của Mốt được
xác định theo công thức sau:
Công thức:
fMo + fMo-1

M0 = xMo (min) + kM - (fMo - fMo-1) + (fMo - fMo+1)

Trong đó:
▪ xMo(min): Giới hạn dưới của tổ chứa Mốt
▪ fMo: Tần số của tổ chứa Mốt
▪ fMo-1: Tần số của tổ đứng trước tổ chứa Mốt
▪ fMo+1: Tần số của tổ đứng sau tổ chứa Mốt
▪ kMo: Trị số khoảng cách tổ chứa Mốt

Chúng ta đã nghiên cứu các số đo tập trung biểu thị khuynh hướng tập trung của
tổng thể, tức là nghiên cứu đại lượng mang tính chất đại diện cho tổng thể. Không có
một số đo duy nhất nào có thể mô tả một cách đầy đủ cho một tổng thể. Tùy theo mục
đích nghiên cứu ta cần xem xét để vận dụng các số đo cho phù hợp. Tuy nhiên, trong
thực tế số trung bình được sử dụng rộng rãi vì dựa vào số trung bình người ta phát triển
nhiều cơ sở suy luận để xây dựng các lý thuyết và tính các số đo khác.

3.6. Chỉ tiêu đánh giá độ biến thiên của tiêu thức
3.6.1. Khoảng biến thiên

a. Khái niệm: là chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của
tiêu thức nghiên cứu trong tổng thể.
b. Công thức tính
R = xmax – xmin
Trong đó
- Xmax: lượng biến lớn nhất trong tổng thể
- Xmin: lượng biến nhỏ nhất trong tổng thể
c. Hạn chế
Khoảng biến thiên chỉ dựa vào 2 giá trị lớn nhất (x max) và lượng biến nhỏ nhất
(xmin) trong tổng thể, không quan tâm đến các lượng biến còn lại trong tổng thể →
Chưa phản ánh một cách đầy đủ độ phân tán của tất cả các quan sát.
3.6.2. Chênh lệch tuyệt đối bình quân

33
a. Khái niệm
Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng biến và số bình
quân của các lượng biến đó

b. Công thức tính


- Đối với tổng thể giản đơn

- Đối với lượng biến có tần số:

c. Đặc điểm
- Nếu tất cả các kết quả quan sát trong một tổ nằm gần sát số bình
quân, độ lệch bình quân sẽ nhỏ và ngược lại. Vì vậy, độ lệch bình quân cho
chúng ta biết mức độ phân tán hay biến thiên của các kết quả quan sát so với
số bình quân tổng.
- Độ lệch tuyệt đối bình quân càng nhỏ → tổng thể càng đồng đều
→ độ biến thiên lượng biến càng ít → tính đại biểu của số bình quân càng
lớn và ngược lại.
d. Ưu điểm – Nhược điểm
- Ưu điểm: Thể hiện biến thiên của lượng biến chặt chẽ, đầy đủ hơn
vì nó xét tới sự chênh lệch của tất cả các lượng biến so với số bình quân. -
Nhược điểm: Bỏ qua sự khác nhau thực tế về dấu. 3.6.3. Phương sai

a. Khái niệm
Là số bình quân cộng của bình phương các độ lệch giữa các lượng biến với số
bình quân cộng của các lượng biến đó.

b. Ý nghĩa

Phương sai càng nhỏ thì tổng thể càng hội tụ và đồng đều, số trung bình càng có
tính đại diện cao và ngược lại.

c. Công thức tính Phương sai tổng thể

(
σ2 = xi −μ )2
34
N

2
2x

σ= ( i −μ) fi
fi

Trong đó:

- : lượng biến bình quân của tổng thể

- 2: phương sai của tổng thể


3.6.4. Hệ số biến thiên
Hệ số biến thiên là chỉ tiêu tương đối phản ánh mối quan hệ so sánh giữa độ lệch
chuẩn với số bình quân số học.
=
Công thức: v
x
Trong đó:
V - Hệ số biến thiên;
 - Độ lệch chuẩn;
𝑥̅ - Mức độ bình quân
Hệ số biến thiên cũng dùng để đánh giá độ biến thiên của tiêu thức và tính chất
đồng đều của tổng thể. Hệ số này biểu hiện bằng số tương đối nên còn có thể được
dùng để so sánh cả những chỉ tiêu cùng loại nhưng ở các quy mô khác nhau như so
sánh độ đồng đều về thu nhập bình quân của hộ gia đình ở khu vực nông thôn (có thu
nhập thấp và số hộ ít hơn) với thu nhập bình quân của hộ gia đình ở thành thị (có mức
thu nhập cao hơn và số hộ nhiều hơn), đặc biệt để so sánh được những chỉ tiêu của các
hiện tượng khác nhau và có đơn vị đo lường khác nhau như so sánh hệ số biến thiên về
bậc thợ với hệ số biến thiên về tiền lương bình quân, hệ số biến thiên về năng suất lao
động bình quân, so sánh hệ số biến thiên về chỉ tiêu thu nhập của hộ gia đình với hệ số
biến thiên về chi tiêu của hộ gia đình,...
Hệ số biến thiên còn có thể tính theo độ lệch tuyệt đối bình quân, nhưng hệ số
biến thiên tính theo độ lệch chuẩn thường được sử dụng rộng rãi hơn, tuy phần tính
toán có phức tạp hơn phải sử dụng độ lệch tuyệt đối trung bình.
Hệ số biến thiên tính theo độ lệch tuyệt đối bình quân có công thức tính:
d
v=
35
x
Trong đó: 𝑑̅ - Độ lệch tuyệt đối bình quân.

BÀI TẬP
Bài 1:
Hãy tính các số liệu còn thiếu trong bảng sau:
% hoàn thành
Kế hoạch Thực tế kế hoạch
Sản phẩm (yk) (y1) Thk
Than đá (1.000 tấn) 2.000 2.440 122%
Xi măng (1.000 tấn) 600 ? 130
Điện năng (triệu Kw/h) ? 460 115
Bài 2:
Tốc tăng độ về doanh số của DNTN Ngọc Bích năm 2020 so với 2019 tăng 15%.
Biết doanh số bán ra năm 2019 là 500 triệu.
Yêu cầu: Tính doanh bán ra năm 2020? Bài
3:
DNTN Long Nhẫn đề ra nhiệm vụ KH về doanh số bán ra năm 2019 tăng 20% so
với năm 2018. Biết doanh số bán ra năm 2018 là 900 triệu đồng
Yêu cầu: Tính doanh bán ra theo kế hoạch năm 2019? Bài
4:
Thống kê kết quả học tập năm 2015 – 2020 của Trường X tại Kiên Giang như sau:
Tổng số HS HS giỏi HS khá HS trung bình HS yếu
3.500 200 1.300 1.900 100
Yêu cầu: Tính tỷ trọng từng loại học sinh theo học lực. Bài
5:
Doanh số bán của Công ty YTOCO trong năm 2019 là 900 triệu đồng. Mục tiêu
của công ty năm 2020 sẽ tăng doanh số 8% so với năm 2019. Năm 2020 doanh số bán
thực tế của công ty là 980 triệu đồng.
Yêu cầu:
1. Tính tỷ lệ % hoàn thành kế hoạch năm 2020?
2. Tính tốc độ phát triển của năm 2020 so với năm 2019?
Bài 6:
Thống kê về tuổi của tập thể giáo viên Trường TH XYZ tại Kiên Giang có số liệu như
sau:
36
Độ tuổi (xi) 20-25 25-30 30-35 35-40
Số người (fi) 70 20 25 20
Yêu cầu:
Hãy tính tuổi bình quân của tập thể giáo viên của trường?
Bài 7:
Doanh số bán hàng của 100 cửa hàng thống kê trên địa bàn Rạch Giá thể hiện ở bảng
sau:
Doanh số (triệu đồng) Trị số giữa Số cửa hàng x’i. fi
(xi) (x’i) (fi)
<15 15
15-20 20
20-25 30
25-40 25
>=40 10
fi =? xifi =?
Yêu cầu: Hãy tính doanh số bình quân của các cửa hàng trên?

Bài 8: Công ty Hồng Lạc có 3 xí nghiệp với tình hình sản xuất tháng 01/2005 thể hiện
ở bảng sau:
Số Mức lương Năng suất lao Khối Giá thành đơn
Xí tháng
nhân động lượng SP vị sản phẩm
nghiệp
viên (1.000đ) (Tấn/người) (tấn) (1.000đ/tấn)
I 120 700 18 2.160 180
II 80 800 19 1.520 190
III 70 900 20 1.400 200
Công ty 270 X X 5.080 X
Yêu cầu:
1. Mức lương tháng bình quân?
2. Tính năng suất lao động bình quân?
3. Giá thành bình quân một tấn sản phẩm ở đơn vị trên?
Bài 9:
Thống kê DNTN Long Nhẫn có số liệu về tốc độ phát triển về doanh thu trong 7 năm
như sau:
- 2 năm đầu có tốc độ phát triển 120%
- 2 năm sau có tốc độ phát triển 105%
- 3 năm cuối có tốc độ phát triển 102%

37
Yêu cầu: Tính tốc độ phát triển bình quân về doanh thu một năm trong giai đoạn trên.
Bài 10: Số liệu về năng suất lao động, số sản phẩm trên ca sản xuất của công nhân ở 2
phân xưởng như sau:
Số sản phẩm / ca Số công nhân
sản xuất Phân xưởng A Phân xưởng B
<40 2 0
40 – 42 0 9
43 – 45 25 14
46 – 48 13 25
49 – 51 5 2
52 – 54 3 0
>54 2 0
Tổng cộng 50 50
Yêu cầu:
1. Xác định năng suất lao động trung bình của công nhân ở từng phân xưởng?
2. Năng suất lao động trung bình chung cho cả 2 phân xưởng?

Bài 11:
Có số liệu chỉ tiêu giá trị sản xuất của 3 xí nghiệp thuộc Công ty Hòa Lạc như sau:
(đơn vị tính: triệu đồng)
Tên xí nghiệp Thực hiện quý I Kế hoạch quý II Thực hiện quý II
Số I 900 1.000 1.000
Số II 1.300 1.500 1.800
Số III 1.600 2.500 2.075
Yêu cầu:
1. Kết cấu (tỷ trọng) giá trị sản xuất theo kế hoạch của mỗi xí nghiệp?
2. Tỷ lệ (%) hoàn thành kế hoạch quý II của mỗi xí nghiệp và chung cho công ty?
3. Tốc độ phát triển của chỉ tiêu giá trị sản xuất của mỗi XN và chung 3 XN?
4. Nếu XN số 3 hoàn thành đúng kế hoạch quý II thì tỷ lệ % hoàn thành kế hoạch
của công ty sẽ là bao nhiêu?
Bài 12: Có số liệu về tình hình hoạt động của các cửa hàng thuộc một công ty như sau:
Doanh số bán (triệu đồng)
Cửa hàng Thực hiện 2012 Kế hoạch 2013 Thực hiện 2013
A 3.000 3.300 3.500
B 5.000 5.400 4.600
38
C 2.000 2.140 2.200
Hãy xác định các chỉ tiêu sau cho từng cửa hàng và chung công ty:

1. Số tương đối nhiệm vụ kế hoạch 2013?


2. Tỷ lệ % hoàn thành kế hoạch doanh thu năm 2013
3. Tốc độ phát triển doanh thu
4. Tỷ trọng doanh thu theo mức thực hiện năm 2012 và 2013?
5. Nếu cửa hàng B hoàn thành đúng kế hoạch thì tỷ lệ % hoàn thành kế hoạch của
công ty sẽ là bao nhiêu?
Bài 13:
Ba công ty X, Y, Z có sản phẩm cùng loại đang tham gia trên thị trường. Năm
2015 so 2014, sản phẩm tiêu thụ của Công ty X và công ty Z tăng lần lượt là 3% và
9%, tốc độ tăng chung của cả 3 công ty là 7,5%.

Yêu cầu:

1) Không cần tính toán, Anh (chị) có thể xác định chiều hướng thay đổi (tăng,
giảm) của thị phần (tỷ lệ thị phần chiếm được) của công ty X và Z qua hai năm
hay không? Hãy giải thích một cách ngắn gọn.
2) Giả sử trên thị trường chỉ có 3 công ty, hãy xác định thị phần của từng công ty
X và Z qua 2 năm 2014, 2015, biết rằng qua 2 năm, thị phần của công ty Y
không đổi và bằng 10%.
3) Giả sử trong năm 2014 thị phần của công ty X bằng 1/3 thị trường của công ty
Z (thị phần của công ty Y như ở trên là 10%). Năm 2015 so 2014, nếu tốc độ
tăng chung về sản phẩm tiêu thụ của cả 3 công ty là 10% thị phần công ty Y là
13%, thị phần công ty Z bằng 2 lần thị phần công ty X, thì tốc độ tăng về sản
phẩm tiêu thụ của từng công ty sẽ là bao nhiêu?
Bài 14:
Có tài liệu về tiền lương của một tổng thể gồm 7 nhân viên quản lý thuộc một công ty
xăng dầu trong tháng 02/2016 như sau: 5,6; 6,5; 6,8; 7,6; 7,8; 8,2; 8,5 (triệu đồng)
Một mẫu gồm 4 nhân viên được chọn ngẫu nhiên từ 7 nhân viên trên, số liệu về tiền
lương như sau: 5,6; 7,6; 7,8; 8,2 (triệu đồng)

Yêu cầu:

1) Tính tiền lương trung bình, Mo, Me, độ lệch tuyệt đối bình quân, phương sai và
độ lệch chuẩn về tiền lương của tổng thể
2) Tính tiền lương trung bình, Mo, Me, độ lệch tuyệt đối bình quân, phương sai
hiệu chỉnh và độ lệch chuẩn về tiền lương của mẫu.
Bài 15:
39
Số liệu về năng suất lao động (sản phẩm/ ca sản xuất) của công nhân ở 2 phân xưởng
như sau:
Số công nhân
Số sản phẩm/ca sản xuất
Phân xưởng A Phân xưởng B
30 2 0
40 – 42 5 9
43 – 45 25 14
46 – 48 13 25
49 – 51 5 2
58 3 0
65 7 0
Yêu cầu:
1) Xác định năng suất trung bình của công nhân ở từng phân xưởng và chung cho
cả 2 phân xưởng?
2) Bằng các chỉ tiêu thống kê, hãy đánh giá sự đồng đều về năng suất lao động cho
từng phân xưởng. Nhận xét một cách ngắn gọn.
Bài 16:

Nhà máy B chuyên sản xuất loại sản phẩm X. Năm 2015, nhà máy phấn đấu hạ
giá thành sản phẩm 2,5% và nâng cao sản lượng lên 10% so với năm 2014. Kết thúc
năm 2015 nhà máy hoàn thành vượt mức kế hoạch hạ giá thành 2% và vượt mức kế
hoạch sản lượng 6%.

Yêu cầu: Xác định biến động giá thành và biến động sản lượng năm 2015 so 2014?
Bài 17: Có tài liệu về tiền lương của công nhân trong công ty liên doanh YSIMAN
trong năm 2019 và 2020 như sau:
Tiền lương bình quân 1 công
Kết cấu công nhân (%) nhân trong 1 năm
Bậc thợ
(USD/năm)
Năm 2019 Năm 2020 Năm 2019 Năm 2020
1 20 20 38.000 38.000
2 10 30 42.000 42.900
3 20 20 50.000 50.200
4 30 20 65.000 65.800
5 20 10 78.000 79.600
Yêu cầu:
1) Tính biến động tiền lương bình quân 1 công nhân trong 1 năm của công nhân
công ty YSIMAN năm 2020 so 2019?
2) Tính số số trung vị, Mod?
3) Tính hệ số biến thiên tiền lương bình quân 1 công nhân trong 1 năm? Nhận xét?
Bài 18:
40
Công ty X có 2 xí nghiệp cùng sản xuất loại sản phẩm K. Số liệu về tình hình
sản xuất của 2 xí nghiệp trong 3 năm như sau:
Thực tế 2015 so Kế hoạch 2016 so % hoàn thành kế
Xí nghiệp
2014 (%) thực tế 2015 (%) hoạch 2016
A 110 112 105
B 115 118 100
Năm 2014, xí nghiệp A sản xuất được 6 triệu sản phẩm, xí nghiệp B sản xuất được cao
hơn xí nghiệp A 20%.
Yêu cầu: Xác định % hoàn thành kế hoạch chung cả hai xí nghiệp của công ty trên
trong năm 2016. Bài 19:
Có tài liệu về năng suất lao động của một mẫu gồm 50 công nhân trong một xí nghiệp
như sau:
Năng suất lao động Số công nhân
(kg/người) (người)
<34 3
34 – 38 6
38 – 42 9
42 – 46 12
46 – 50 8
50 – 54 7
>= 54 5
Yêu cầu:
1) Tính năng suất lao động trung bình của công nhân trong xí nghiệp? 2)
Tính Mo, Me?
3) Tính độ lệch tuyệt đối trung bình, phương sai, độ lệch chuẩn về năng suất lao
động?
4) Tính hệ số biến thiên?
Bài 20:
Có hai tổ công nhân cùng sản xuất một loại sản phẩm trong 8 giờ. Tổ 1 có 15
công nhân. Tổ 2 có 18 công nhân. Thời gian hao phí trung bình để công nhân hoàn
thành một sản phẩm của tổ 1 là 15 phút, tổ 2 là 12 phút. Hãy tính thời gian hao phí
trung bình để hoàn thành một sản phẩm của công nhân cả 2 tổ?
Bài 21:
Hai doanh nghiệp cùng sản xuất loại sản phẩm X. Tài liệu về tình hình sản xuất
loại sản phẩm này của 2 doanh nghiệp trong năm 2015 như sau:
Doanh nghiệp A Doanh nghiệp B
Giá thành đơn Chi phí sản Giá thành đơn Tỷ trọng sản
Quý
vị sản phẩm xuất (triệu vị sản phẩm lượng sản
(1.000đ) đồng) (1.000đ) phẩm (%)

41
I 20 1.000 19 16
II 21 1.386 20 35
III 19 1.387 18 30
IV 17 1.394 19 19
Yêu cầu:
1) Hãy tính và so sánh giá thành bình quân 1 đơn vị sản phẩm năm 2015 giữa 2
doanh nghiệp trên? Nhận xét?
2) Hãy tính hệ số biến thiên về giá thành đơn vị sản phẩm của từng doanh nghiệp
và cho nhận xét? Biết thêm rằng sản lượng sản phẩm cả năm của doanh nghiệp
B là 300.000 sản phẩm.
Bài 22: Khảo sát năng suất lúa trên diện tích 100ha trồng lúa của một tỉnh, người ta
thu được số liệu sau:
Năng suất lúa
5,1 5,4 5,5 5,6 5,8 6,2 6,4
(tấn/ha)
Số ha 10 20 30 15 10 10 5
1) Tính năng suất lúa trung bình 1 ha của lúa tỉnh trên? 2)
Tính Me?
3) Tính độ lệch tuyệt đối trung bình, phương sai, độ lệch chuẩn về năng suất lúa?
4) Tính hệ số biến thiên?
Bài 23: Khảo sát 258 bóng đèn do một nhà máy sản xuất ta có:
Tuổi thọ (giờ) Số bóng
1.000–1.100 4
1.100-1.200 10
1.200-1.300 16
1.300-1.400 20
1.400-1.500 36
1.500-1.600 48
1.600-1.700 42
1.700-1.800 32
1.800-1.900 26
1.900-2.000 16
2.000-2.100 8
1) Tính tuổi thọ trung bình của số bóng đèn trên của nhà máy? 2)
Tính Mo, Me?
3) Tính độ lệch tuyệt đối trung bình, phương sai, độ lệch chuẩn về tuổi thọ bóng
đèn.
4) Tính hệ số biến thiên?
Bài 24: Đo đường kính của 100 chi tiết do một máy sản xuất, kết quả cho như sau:
Đường kính Số chi tiết
(mm)
19,80-19,85 3

42
19,85-19,90 5
19,90-19,95 16
19,95-20,00 28
20,00-20,05 23
20,05-20,10 14
20,10-20,15 7
20,15-20,20 4
Tổng 100
Theo quy định, những chi tiết có đường kính lớn hơn 19,90 mm đến 20,10 mm là
những chi tiết đạt tiêu chuẩn. Hãy tính:
1) Tính đường kính trung bình của chi tiết sản phẩm nhà máy trên? 2)
Tính Mo, Me?
3) Tính độ lệch tuyệt đối trung bình, phương sai, độ lệch chuẩn 4)
Tính hệ số biến thiên?
Bài 25: Bưu điện thành phố Rạch Giá nghiên cứu về việc sử dụng điện thoại cố định
nhằm tính toán giá cước hợp lý. Một mẫu ngẫu nhiên gồm 100 hộ gia đình được chọn.
Số liệu được cho trong bảng sau:
Cước trả hàng
Số hộ
tháng (1.000đ)
<60 10
60-80 15
80-100 22
100-120 27
120-140 12
140-160 9
>=160 5
Yêu cầu:
1) Tính tiền cước trung bình của 1 hộ gia đình trên? 2)
Tính Mo, Me?
3) Tính độ lệch tuyệt đối trung bình, phương sai, độ lệch chuẩn. 4)
Tính hệ số biến thiên?
Bài 26: Có tình hình sản xuất của một xí nghiệp trong quý 1 năm 2016 như sau:
Chỉ tiêu Tháng 1 Tháng 2 Tháng 3 Tháng 4
Giá trị sản xuất thực tế (triệu đồng) 1.200 1.300 1.400
Tỷ lệ % hoàn thành kế hoạch 102 104 106
Số công nhân ngày đầu tháng (người) 120 124 124 126
Số CN bq
NSLĐ bq
Yêu cầu:
1) Giá trị sản xuất thực tế trung bình 1 tháng trong quý 1-2016?
2) Số công nhân trung bình mỗi tháng và quý 1?
3) Năng suất lao động trung bình 1 công nhân mỗi tháng?
43
4) Năng suất lao động bình quân của công nhân một tháng trong quý 1? 5) Tỷ lệ %
hoàn thành kế hoạch GTSX trong quý 1?
Bài 27: Ba công ty Hưng Long, Thuận Yến và Hùng Phát có sản phẩm cùng loại đang
tham gia thị trường. Năm 2015 so 2013, sản phẩm tiêu thụ của công ty Hưng Long và
công ty Hùng Phát tăng lần lượt là 4% và 14%, tốc độ tăng chung của cả 3 công ty là
12%.
1) Không cần tính toán, Anh (chị) hãy xác định chiều hướng thay đổi (tăng, giảm
hoặc không đổi) về thị phần của công ty Hưng Long và Công ty Hùng Phát.
2) Giả sử trên thị trường chỉ có 3 công ty, hãy xác định thị phần của từng công ty
Hưng Long và Hùng Phát ở 2 năm 2013 và 2015. Biết qua hai năm tỷ lệ thị
phần của công ty Thuận Yến không thay đổi là 10%.
3) Giả sử năm 2013 thị phần công ty Hưng Long bằng 1/4 công ty Hùng Phát (thị
phần của công ty Thuận Yến như đã biết ở trên là 10%). Năm 2016 so với 2013
nếu tốc độ tăng chung về sản phẩm tiêu thụ của cả 3 công ty là 15%, thị phần
công ty Thuận Yến là 15%, thị phần công ty Hùng Phát bằng 1,5 lần thị phần
công ty Hưng Long, thì tốc độ tăng về sản phẩm tiêu thụ của từng công ty Hưng
Long, Thuận Yến và Hùng Phát sẽ là bao nhiêu?
Bài 28: Tốc độ phát triển doanh thu của 2 xí nghiệp như sau (%):
Năm 2003 so với Năm 2004 so với Năm 2005 so với
Xí nghiệp
năm 2002 năm 2003 năm 2004
A 104 105 112
B 108 117 105
Hãy tính:
1) Tốc độ phát triển doanh thu năm 2005 so với năm 2003 của xí nghiệp A?
2) Tốc độ tăng bình quân hàng năm về doanh thu của xí nghiệp B trong thời kỳ
2002-2005?
3) Tốc độ phát triển doanh thu năm 2005 so với năm 2002 tính chung cho cả hai xí
nghiệp. Biết rằng doanh thu của xí nghiệp A năm 2003 là 57 tỷ đồng, xí nghiệp
B là 84 tỷ đồng?
Bài 29: Có tài liệu về tình hình thực hiện kế hoạch mức lưu chuyển hàng hoá
(MLCHH) của các cửa hàng thực phẩm khu vực X như sau:

Quý I Quý II
Kế hoạch % hoàn thành Thực tế % hoàn thành
Cửa hàng
MLCHH kế hoạch MLCHH (tr.đ) kế hoạch
(tr.đ
Thịt, cá 21.000 100,3 23.000 96,4
Rau, quả 16.000 96,5 16.500 113,1
Bánh kẹo 7.200 97,0 11.000 107,0
Rượu bia 2.400 111,6 3.000 102,2
Hãy tính tỷ lệ % hoàn thành kế hoạch bình quân về MLCHH của các cửa hàng
trên:
44
1) Trong quý I và quý II
2) Trong 6 tháng đầu năm
Bài 30: Có tài liệu về tình hình sản xuất của một xí nghiệp như sau:
Chỉ tiêu Tháng 1 Tháng 2 Tháng 3
Giá trị sản lượng kế hoạch (tỉ đ) 86,9 97,3 105,7
Tỷ lệ % hoàn thành kế hoạch 116,0 98,0 101,4
Số CN ngày đầu tháng(người) 320 340 360
Biết thêm số công nhân có mặt vào ngày 1 tháng 4 là 366 người Hãy tính:
1. Năng suất lao động bình quân của công nhân trong quý I
2. Tỷ lệ % hoàn thành kế hoạch bình quân giá trị tổng sản lượng quý I.

Bài 31: Tốc độ phát triển về giá trị tổng sản lượng của 2 doanh nghiệp như sau (%):
Năm 2013 so Năm 2014 so với Năm 2015 so với
Doanh nghiệp
với năm 2012 năm 2013 năm 2014
A 102,8 110,0 118,0
B 107,2 115,2 120,3
Hãy tính:
1. Tốc độ phát triển năm 2015 so với năm 2012 của mỗi doanh nghiệp?
2. Tốc độ phát triển bình quân hàng năm của mỗi doanh nghiệp trong thời
gian trên?
3. Tốc độ phát triển năm 2015 so với năm 2012 tính chung cho cả hai xí
nghiệp. Biết rằng giá trị tổng sản lượng của doanh nghiệp A năm 2013
là 88.000 triệu đồng và của doanh nghiệp B là 115.000 triệu đồng?
Bài 32: Có tài liệu về tình hình sản xuất của công ty Dệt trong 2 tháng đầu năm 2015
như sau:
- Tổng quỹ lương công ty: tháng 1 là 724,8 triệu đồng; tháng 2 là: 750,2
triệu đồng.
- Số công nhân ngày đầu tháng 1 là 600 người.
- Biến động công nhân trong tháng như sau:
o Ngày 05/01 giảm 1 người o
Ngày 15/01 tăng 7 người o
Ngày 24/01 tăng 4 người o
Ngày 18/02 giảm 3 người o
Ngày 24/02 giảm 13 người
Khối lượng sản phẩm tháng 2 so tháng 1 tăng 6,04% tương ứng tăng 36,482 mét (quy
ra mét chuẩn) Yêu cầu:
1) So sánh tiền lương bình quân 1 công nhân tháng 2 so tháng 1?
2) So sánh năng suất lao động bình quân 1 công nhân tháng 2 so tháng 1?

45
CHƯƠNG 4 DÃY SỐ THỜI GIAN
Dự báo là một trong những vấn đề quan trọng và là nhiệm vụ của các nhà thống
kê. Dựa vào kết quả trong quá khứ hay còn gọi là, các nhà nghiên cứu dùng các
phương pháp đặc thù của thống kê để phân tích dữ liệu và đưa và dự báo.
4.1. Khái niệm
Phương pháp dự báo dựa vào dãy số thời gian là chúng ta quan sát hiện tượng
biến đổi qua thời gian rồi tìm ra qui luật và dùng qui luật đó để suy luận, phương này
gọi là phương pháp dự báo dựa vào ngoại suy. Trong thực tế có rất nhiều hiện tượng
phụ thuộc vào thời gian như: Lượng tiêu thụ lương thực thực phẩm phụ thuộc vào độ
tuổi, chu kỳ sống của sản phẩm,... với lý luận như vậy ta có thể xem thời gian như là
một biến độc lập tác động đến hiện tượng nghiên cứu. Có thể hiểu dãy số thời gian như
sau:
- Khái niệm: dãy số thời gian là dãy các trị số của chỉ tiêu thống kê được
sắp xếp theo thứ tự thời gian.
- Dạng tổng quát
ti t1 t2 .... tn

yi y1 y2 .... yn
+ Kết cấu dãy số thời gian bao gồm: thời gian và chỉ tiêu
+ Thời gian: tuần, ngày, tháng, quý, năm…
+ Độ dài giữa 2 thời gian liền nhau được gọi là khoảng cách thời gian.
+ Chỉ tiêu: số tuyệt đối hoặc số tương đối.
+ Trị số của chỉ tiêu gọi là mức độ của dãy số.
Ví dụ: Có số liệu sau:
Tháng
1 2 3 4
Chỉ tiêu
Doanh số bán (triệu đồng) 200 250 350 300
Số CN ngày đầu tháng (người) 102 130 120 100
4.2. Phân loại
Căn cứ vào đặc điểm thời gian người ta thường chia dãy số thời gian thành hai
loại:

-Dãy số thời kỳ: là dãy số biểu hiện sự thay đổi của hiện tượng qua từng thời kỳ
nhất định. Ví dụ, giá trị hàng xuất khẩu của một quốc gia vào các năm từ 2010 đến
2015.

-Dãy số thời điểm: là dãy số biểu hiện mặt lượng của hiện tượng vào một thời
điểm nhất định. Ví dụ, tổng giá trị tài sản của doanh nghiệp vào các thời điểm cuối
năm 31/12/20xx.
46
4.3. Các chỉ tiêu phân tích dãy số thời gian
4.3.1. Mức độ bình quân theo thời gian
Chỉ tiêu này phản ánh mức độ đại diện của hiện tượng trong suốt thời gian nghiên
cứu. Tùy theo dãy số thời kỳ hay dãy số thời điểm mà ta có các công thức tính khác
nhau:
4.3.1.1. Đối với dãy số thời kỳ

Công thức tính mức độ bình quân theo thời gian:

y = yi
n
Ví dụ: Doanh thu bán bình quân 1 năm:
y=

= 275 (đvt)
4.3.1.2. Đối với dãy số thời điểm
-Trường hợp 1: Nếu chỉ có số liệu đầu kỳ và cuối kỳ:
ydk +yck y=
2

-Trường hợp 2: Nếu có số liệu thống kê tại nhiều thời điểm trong kỳ và khoảng
cách các thời điểm bằng nhau:
y1 y
+y2 +...+ n

y= 2 2
n−1
Ví dụ: Số công nhân bình quân 1 tháng trong quí I:
102 100
+130+120+

2 2
y= =117 (người)
4−1
-Trường hợp 3: Nếu có số liệu thống kê tại nhiều thời điểm trong kỳ và khoảng
cách thời điểm không bằng nhau:

yt
n i i
yi : mức độ tại thời điểm i

47
y =i=1 ti : độ dài thời gian có mức độ

t i

Ví dụ 4.1: Có số liệu về tình hình công nhân trong doanh nghiệp A tháng 04/2018 như
sau:
Ngày yi ti
Ngày 01/4 số CN 500 người 500 9
10/4 bổ sung 5 người 505 5
15/4 nhận 5 người 510 6
21/4 thôi việc 2 người 508 10
Tổng 30
Số công nhân bình quân tháng 4:
n

 yiti
i 1
= = 500*9 + 505*5 + 510*6 + 508*10 = 505,5 (người) y =

t i 9 + 5 + 6 +10

4.3.2. Lượng tăng (giảm) tuyệt đối


Chỉ tiêu này phản ánh sự thay đổi về mức độ tuyệt đối giữa hai thời kỳ nghiên cứu.
Tùy theo mục tiêu nghiên cứu ta có chỉ tiêu về mức độ tăng, giảm tuyệt đối sau đây:

-Lượng tăng giảm tuyệt đối định gốc: là hiệu số giữa thời kỳ nghiên cứu (y i) và
mức độ của thời kỳ nào đó được chọn làm gốc (y1)

i = yi − y1 (i = 2,n)

-Lượng tăng, giảm tuyệt đối liên thoàn: là hiệu số giữa mức độ của thời kỳ
nghiên cứu (yi) và mức độ thời kỳ đứng liền trước (yi-1)

i = yi − yi−1 (i = 2,n)

-Mối liên hệ giữa ,:


n

 =i i
i=2

-Lượng tăng (giảm) tuyệt đối bình quân (): là số bình quân cộng của các lượng
tăng, giảm tuyệt đối liên hoàn. Nó phản ánh mức độ đặc trưng tăng, giảm trong thời
gian nghiên cứu.
48
n

= i=2 = n = yn −y1 n−1 n−1


n−1

4 100 33,333 (trđ/tháng)


Ví dụ 4.2: = = =
3 3
Tháng y1 y2 y3 y4
Doanh số 200 250 350 300
i - 50 150 100
- 50 100 -50
i
Ti ti - 125 175 150
- 125 140 85,71
Ai - 25 75 50
ai - 25 40 -14,29
Nêu nhận xét về kết quả trên?
4.3.3. Tốc độ phát triển (lần,%)

yi (i = 2
,n) * Định gốc: Ti =
y1
yi
(i = 2,n) * Liên hoàn: ti
=
yi−1

* Mối liên hệ giữa T,t: Ti =ti

y2 * y3 * y4 = y4
T4 = t2 *t3 *t4 =
y1 y2 y3 y1
n

hay Tn =ti
2

Tốc độ phát triển bình quân ( t ): là số bình quân nhân của các tốc độ phát triển
liên hoàn.
n
y
n −1
T n = n −1 n
y1
49
t = n−12 ti =

4.3.4. Tốc độ tăng (giảm)


* Định gốc: Ai = Ti −1 (%)
* Liên hoàn: ai = ti −100 (%)
* Tốc độ tăng (giảm) bình quân ( a )
a = t −100
4.3.5. Giá trị tuyệt đối của 1% tăng (giảm)


gi = i
(i = 2 ,n)
ai
hoặc: gi = 0,01yi −1


CM: g0 = ai = yi −yiy−i−1yi*−1100 = 100yi−1 = 0,01yi−1
i

yi−1
g3 = 0,01y2 = 2,5

4.4. Các phương pháp dự báo trên dãy số thời gian
Dự báo là xác định mức độ có thể xảy ra trong tương lai của hiện tượng. Biết
được tương lai của hiện tượng sẽ giúp các nhà quản trị chủ động, cũng như có những
quyết định đúng trong kinh doanh. Hoạt động trong nền kinh tế thị trường cùng với sự
phát triển mạnh mẽ của tiến bộ khoa học kỹ thuật khiến cho công tác dự báo gặp nhiều
khó khăn: biến động bất thường, thiếu thông tin, thông tin không đánh tin cậy, hoặc
không có thông tin.
Có nhiều phương pháp dự báo khác nhau. Tuy vậy, nội dung cơ bản của dự báo
thống kê là dựa trên các giá trị quá khứ (đã biết) chính là dãy y 1, y2, y3, y4, ...yn. Dựa
vào dãy số thời gian sẽ phân tích các yếu tố ảnh hưởng đến sự biến động của hiện
tượng, thừa nhận rằng những yếu tố đã và đang tác động đến hiện tượng sẽ vẫn còn
tiếp tục tác động đến hiện tượng trong tương lai, xây dựng mô hình dự đoán các giá trị
tương lai chưa biết yn+1, yn+2,…., yn+L.
4.4.1. Dự báo dựa vào mức độ tăng (giảm) tuyệt đối bình quân
Phương pháp này thường được sử dụng khi hiện tượng biến động với một
lượng tuyệt đối tương đối đều, nghĩa là các lượng tăng giảm tuyệt đối từng kỳ xấp
xỉ bằng nhau. Mô hình dự báo:

50
yn L+ = +y Ln.

Trong đó: L: tầm xa dự báo (tính từ năm thứ n)

Yn: mức độ cuối cùng trong dãy số (thời điểm n)

: lượng tăng, giảm tuyệt đối bình quân

yn+L mức độ dự đoán ở thời điểm n+L

4.4.2. Dự đoán dựa vào tốc độ phát triển bình quân

Phương pháp này được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ bằng
nhau. Tức là hiện tượng biến động với một nhịp độ tương đối ổn định. Mô hình dự
báo:

yn+L = yn.(t)L

Trong đó: L: tầm xa dự báo (tính từ năm thứ n)

Yn: mức độ cuối cùng trong dãy số

yn+L mức độ dự đoán ở thời điểm n+L

t : lượng tăng, giảm tuyệt đối bình quân

Căn cứ vào tài liệu ví dụ 4.3 hãy dự báo doanh thu tháng 5 và tháng 10 của doanh
nghiệp trong thời gian tới?
Ta có:

1
t = 4− 1,5 =1,1447 lần

Dự báo doanh thu tháng 5 (L=1)

yˆ5 = y4t = 300 x 1,14471 = 343,41 triệu đồng Dự báo


doanh thu tháng 10 (L=6)
L

yˆ10 = y4t = 300 x 1,1447 6 = 674,949 triệu đồng


4.4.3. Dự đoán dựa vào phương trình hồi quy

51
Phân tích hồi qui tuyến tính là một mô hình dự báo thiết lập mối quan hệ giữa
biến phụ thuộc với hai hay nhiều biến độc lập. Trong phần này, chúng ta chỉ xét đến
một biến độc lập duy nhất. Nếu số liệu là một chuỗi theo thời gian thì biến độc lập là
giai đoạn thời gian và biến phụ thuộc thông thường là doanh số bán ra hay bất kỳ chỉ
tiêu nào khác mà ta muốn dự báo.
Mô hình này có công thức: Y = ax + b

a = nn  xyx −−( xx) y


2 2 b=  nx  2 x2y−
−( xx)2 xy

hoặc: b = −y ax

Trong đó: y - Biến phụ thuộc cần dự báo; x


- Biến độc lập; a - Độ dốc của
đường xu hướng; b - Tung độ
gốc; n - Số lượng quan sát.
Trong trường hợp biến độc lập x được trình bày thông qua từng giai đoạn theo
thời gian và chúng phải cách đều nhau (như: x = 0. Vì vậy 2002, 2003, 2004...) thì ta
có thể điều chỉnh lại để sao cho việc tính toán sẽ trở nên đơn giản và dễ dàng hơn
nhiều.

Nếu có một số lẻ lượng mốc thời gian: chẳng hạn x = 0  là 5, thì giá trị của x
được ấn định như sau: -2, -1, 0, 1, 2 và như thế giá trị của x được sử dụng cho dự báo
trong năm tới là +3.

Nếu có một số chẵn lượng mốc thời gian: chẳng hạn x = 0 và  là 6 thì giá trị
của x được ấn định là: -5, -3, -1, 1, 3, 5. Như thế giá trị của x được dùng cho dự báo
trong năm tới là +7.

Ví dụ 4.3: Một hãng sản xuất loại động cơ điện tử cho các van khởi động trong
ngành công nghiệp, nhà máy hoạt động gần hết công suất suốt một năm nay. Ông J,
người quản lý nhà máy nghĩ rằng sự tăng trưởng trong doanh số bán ra vẫn còn tiếp tục
và ông ta muốn xây dựng một dự báo dài hạn để hoạch định nhu cầu về máy móc thiết
bị trong 3 năm tới. Số lượng bán ra trong 10 năm qua được ghi lại như sau:
Năm Số lượng bán Năm Số lượng bán

1 1.000 6 2.000

2 1.300 7 2.200

52
3 1.800 8 2.600

4 2.000 9 2.900

5 2.000 10 3.200
Kết quả bài toán:
Ta xây dựng bảng tính để thiết lập các giá trị:
Lượng bán Thời gian
Năm x2 xy
(y) (x)

1 1.000 -9 81 -9.000

2 1.300 -7 49 -9.100

3 1.800 -5 25 -9.000

4 2.000 -3 9 -6.000

5 2.000 -1 1 -2.000

6 2.000 1 1 2.000

7 2.200 3 9 6.600

8 2.600 5 25 13.000

9 2.900 7 49 20.300

10 3.200 9 81 28.800

Tổng 21.000 0 330 35.600

a = nn  xyx2−−( x x)2y = xyx2 = 35.600330 =107,8

b= −y ax = = 2.100

Dùng phương trình hồi qui tuyến tính để dự báo hàng bán ra trong tương lai:

Y = ax + b = 107,8x + 2.100

Để dự báo cho hàng bán ra trong 3 năm tới ta thay giá trị của x lần lượt là 11, 13,
15 vào phương trình.

Y11 = 107,8 . 11 + 2.100 = 3.285  3.290 đơn vị

53
Y12 = 107,8 . 13 + 2.100 = 3.501  3.500 đơn vị

Y13 = 107,8 . 15 + 2.100 = 3.717  3.720 đơn vị

Trường hợp biến độc lập không phải là biến thời gian, hồi qui tuyến tính là một
nhóm các mô hình dự báo được gọi là mô hình nhân quả. Mô hình này đưa ra các dự
báo sau khi thiết lập và đo lường các biến phụ thuộc với một hay nhiều biến độc lập.
Ví dụ 4.4: Ông B, nhà tổng quản lý của công ty kỹ nghệ chính xác nghĩ rằng các
dịch vụ kỹ nghệ của công ty ông ta được cung ứng cho các công ty xây dựng thì có
quan hệ trực tiếp đến số hợp đồng xây dựng trong vùng của ông ta. Ông B yêu cầu kỹ
sư dưới quyền, tiến hành phân tích hồi qui tuyến tính dựa trên các số liệu quá khứ và
vạch ra kế hoạch như sau:

- Xây dựng một phương trình hồi qui cho dự báo mức độ nhu cầu về dịch vụ của
công ty ông.

- Sử dụng phương trình hồi qui để dự báo mức độ nhu cầu trong 4 quí tới. Ước
lượng trị giá hợp đồng 4 quí tới là 260, 290, 300 và 270 (ĐVT: 10 Triệu đồng).
- Xác định mức độ chặt chẽ, các mối liên hệ giữa nhu cầu và hợp đồng xây dựng
được đưa ra.
Biết số liệu từng quí trong 2 năm qua cho trong bảng:(đơn vị: 10 Triệu đồng)
Trị giá hợp
Nhu cầu của
Năm Quý đồng thực
công ty
hiện
1 8 150
2 10 170
1
3 15 190
4 9 170
1 12 180
2 13 190
2
3 12 200
4 16 220
Kết quả bài toán: Xây dựng phương trình hồi qui.
Trị giá
Thời Nhu cầu
hợp đồng x2 xy y2
gian (y)
(x)

1 8 150 22.500 1.200 64

2 10 170 28.900 1.700 100

3 15 190 36.100 2.850 225

4 9 170 28.900 1.530 81


54
5 12 180 32.400 2.160 144

6 13 190 36.100 2.470 169

7 12 200 40.000 2.400 144

8 16 220 48.400 3.520 256

Tổng 95 1.470 273.300 17.830 1.183


Sử dụng công thức ta tính toán được hệ số a = 0,1173; b = -9,671

Phương trình hồi qui tìm được là: Y = 0,1173x − 9,671


Dự báo nhu cầu cho 4 quí tới: Ông A dự báo nhu cầu của công ty bằng cách sử
dụng phương trình trên cho 4 quí tới như sau:

Y1 = (0,1173 x 260) - 9,671 = 20,827;

Y2 = (0,1173 x 290) - 9,671 = 24,346;

Y3 = (0,1173 x 300)- 9,671 = 25,519;

Y4 = (0,1173 x 270) - 9,671 = 22,000.

Dự báo tổng cộng cho năm tới là:

Y = Y1+ Y2 +Y3 +Y4 = 20,827+ 24,346+25,519+22,000 = 930 triệu đồng

Đánh giá mức độ chặt chẽ mối liên hệ của nhu cầu với số lượng hợp đồng xây dựng:

n xy−
y

r = n   x −( 2

y −(y) 
2 2

8 17.830 −1.470 95


=
8273.300−14.702 8 1.183 −952
r = 0,894 ; r2 = 0,799;

trong đó r là hệ số tương quan và r2 là hệ số xác định.

55
Rõ ràng là số lượng hợp đồng xây dựng có ảnh hưởng khoảng 80% (r 2 = 0,799)
của biến số được quan sát về nhu cầu hàng quí của công ty.
Hệ số tương quan r giải thích tầm quan trọng tương đối của mối quan hệ giữa y
và x. Nếu r âm chỉ ra rằng giá trị của y và x có khuynh hướng đi ngược chiều nhau,
nếu r dương cho thấy giá trị của y và x đi cùng chiều nhau.

Dưới đây là vài giá trị của r:

-r = -1. Quan hệ ngược chiều hoàn toàn, khi y tăng lên thì x giảm xuống
và ngược lại.
-r = +1. Quan hệ cùng chiều hoàn toàn, khi y tăng lên thì x cũng tăng và
ngược lại.
-r = 0. Không có mối quan hệ giữa x và y.

4.4.4. Tính chất mùa vụ trong dự báo chuỗi thời gian
Loại mùa vụ thông thường là sự lên xuống xảy ra trong vòng một năm và có xu
hướng lặp lại hàng năm. Những vụ mùa này xảy ra có thể do điều kiện thời tiết, địa lý
hoặc do tập quán của người tiêu dùng khác nhau...
Cách thức xây dựng dự báo với phân tích hồi qui tuyến tính khi vụ mùa hiện
diện trong chuỗi số theo thời gian. Ta thực hiện các bước:

-Chọn lựa chuỗi số liệu quá khứ đại diện.

-Xây dựng chỉ số mùa vụ cho từng giai đoạn thời gian.
Yi
Ii =
Y0 Với yi : Số bình quân

của các thời kỳ cùng tên y0 : Số bình quân chung của tất

cả các thời kỳ trong dãy số.

Ii : Chỉ số mùa vụ kỳ thứ i.

-Sử dụng các chỉ số mùa vụ để hóa giải tính chất mùa vụ của số liệu.

-Phân tích hồi qui tuyến tính dựa trên số liệu đã phi mùa vụ.

-Sử dụng phương trình hồi qui để dự báo cho tương lai.

-Sử dụng chỉ số mùa vụ để tái ứng dụng tính chất mùa vụ cho dự báo.

Ví dụ 4.5: Ông J nhà quản lý nhà máy động cơ đặc biệt đang cố gắng lập kế
hoạch tiền mặt và nhu cầu nguyên vật liệu cho từng quí của năm tới. Số liệu về lượng

56
hàng bán ra trong vòng 3 năm qua phản ánh khá tốt kiểu sản lượng mùa vụ và có thể
giống như trong tương lai. Số liệu cụ thể như sau:

Bước 1: Xác định dãy số liệu:


Số lượng bán hàng quí (1.000 đơn vị)
Năm
Q1 Q2 Q3 Q4
1 520 730 820 530
2 590 810 900 600
3 650 900 1.000 650
Bước 2: Tính toán các chỉ số mùa:
Năm Quí 1 Quí 2 Quí 3 Quí 4 Cả năm

1 520 730 820 530 2.600

2 590 810 900 600 2.900

3 650 900 1.000 650 3.200

Tổng 1.760 2.440 2.720 1.780 8.700

Trung bình quý 586,67 813,33 906,67 593,33 725

Chỉ số mùa vụ 0,809 1,122 1,251 0,818 1,0


Bước 3: Hóa giải tính chất mùa vụ của số liệu bằng cách chia giá trị của từng quí
cho chỉ số mùa vụ tương ứng. Chẳng hạn: 520/0,809 = 642,8; 730/1,122 = 605,6 ...
Ta được bảng số liệu như sau:
Số liệu hàng quí đã phi mùa vụ

Năm Quý 1 Quý 2 Quý 3 Quý 4


1 642,8 650,6 655,5 647,9
2 729,2 721,9 719,4 733,5
3 803,5 802,1 799,4 794,6
Bước 4: Chúng ta phân tích hồi qui trên cơ sở số liệu phi mùa vụ (12 quý) và xác
định phương trình hồi qui.
Quý X y x2 xy

Q1I 1 642,8 1 642,8

Q1II 2 650,6 4 1.301,2

Q1III 3 655,5 9 1.966,5

Q1IV 4 647,9 16 2.591,6

Q2I 5 729,3 25 3.646,5

57
Q2II 6 721,9 36 4.331,4

Q2III 7 719,4 49 5.035,8

Q2IV 8 733,5 64 5.868,0

Q3I 9 803,5 81 7.231,5

Q3II 10 802,1 100 8.021,0

Q3III 11 799,4 121 8.793,4

Q3IV 12 794,6 144 9.535,2

Tổng 78 8.700,5 650 58.964,9


Xác định được hệ số a = 16,864 và b = 615,421.
Phương trình có dạng: y = 16,864x + 615,421
Bước 5: Bây giờ chúng ta thay thế giá trị của x cho 4 quí tới bằng 13, 14, 15, 16
vào phương trình. Đây là dự báo phi mùa vụ trong 4 quí tới.
Y4I = (16,864 x 13) + 615,421= 834,661

Y4II = (16,864 x 14) + 615,421= 851,527

Y4III = (16,864 x 15) + 615,421= 868,391

Y4IV = (16,864 x 16) + 615,421= 885,256


Bước 6: Ta sử dụng chỉ số mùa vụ để mùa vụ hóa các số liệu.
Chỉ số mùa vụ Dự báo phi mùa vụ Dự báo mùa vụ hóa
Quí (Yi) (Ymv)
(I)
1 0,809 834,6621 675
2 1,122 851,5268 955
3 1,251 868,3915 1086
4 0,818 885,2562 724

BÀI TẬP

Bài 1:
Thống kê doanh thu của doanh nghiệp Dosoco qua các năm:
Năm 2015 2016 2017 2018 2019 2020
Doanh thu(triệu đồng) 420 450 520 540 620 640
Yêu cầu:
Tính các chỉ tiêu phân tích dãy số thời gian. Bài
2:
58
Có số liệu thống kê về tình hình sản xuất Ximăng của nhà máy Z qua các năm như
sau:
Năm 2015 2016 2017 2018 2019 2020
Sản lượng (1.000 tấn) 1.000 900 1.500 1.600 1.850 2.000
Yêu cầu: Tính các chỉ tiêu sau:
1) Lượng tăng (giảm) tuyệt đối liên hoàn, định gốc
2) Tốc độ phát triển liên hoàn, định gốc
3) Tốc độ tăng (giảm) liên hoàn, định gốc
4) Giá trị tuyệt đối 1% tăng (giảm)
Bài 3: Giá trị hàng tồn kho của công ty METOCO năm 2020 như sau:
Thời điểm (ngày) 1-1 1-2 1-3 1-4
Giá trị hàng tồn kho (triệu đồng) 450 480 540 580
Yêu cầu: Hãy tính giá trị hàng tồn kho bình quân của công ty trong các khoảng thời
gian sau:
1) Từng
tháng
2) Quí
I/2015 Bài 4:
Có số liệu về lợi nhuận của một doanh nghiệp từ năm 2010 – 2014:
Năm 2010 2011 2012 2013 2014
Lợi nhuận (tr. đồng) 400 550 720 860 950
Căn cứ vào số liệu trên hãy tính:
1) Tốc độ phát triển liên hoàn?
2) Tốc độ phát triển định gốc? (chọn năm 2010 làm gốc).
Bài 5: Có số liệu về số công nhân của DN X tháng 04/2014 như sau:
Ngày 01/04 có 400 công nhân
Ngày 10/04 bổ sung 5 công nhân
Ngày 15/04 nhận thêm 5 công nhân
Ngày 21/04 cho thôi việc 2 công nhân và từ đó đến hết tháng 4 số công nhân
không thay đổi.
Yêu cầu: tính số lao động bình quân trong tháng 4.
Bài 6: Có số liệu về số công nhân của DN Y tháng 04/2015 như sau:
Ngày 01/4 có 500 công nhân
Ngày 10/4 bổ sung 10 công nhân
Ngày 15/4 nhận thêm 8 công nhân

59
Ngày 21/4 cho thôi việc 4 công nhân và từ đó đến hết tháng 4 số công nhân
không thay đổi. Yêu cầu: Tính số lao động bình quân trong tháng 4.

Bài 7: Thống kê doanh thu của doanh nghiệp YTECO qua các năm:
Năm 2015 2016 2017 2018 2019 2020
Doanh thu(tr. đồng) 520 550 620 640 720 740
Yêu cầu: Tính các chỉ tiêu kinh tế phân tích dãy số thời gian.
Bài 8:
Có tình hình biến động về số công nhân trong danh sách của doanh nghiệp Vương
Hùng trong năm 2020 mhư sau:
Ngày 01-01 có 246 CN
Ngày 14-01 bổ sung 3 CN
Ngày 28-02 bổ sung 7 CN
Ngày 16-04 bổ sung 5 CN
Ngày 17-08 cho thôi việc 2 CN
Ngày 21-10 bổ sung 3CN
Từ đó đến hết năm, số CN không đổi. Biết thêm rằng trong năm này tháng 2 có
29 ngày.
Yêu cầu: Tính số CN bình quân của DN trên trong năm.
Bài 9: Có số liệu về số số sản phẩm sản xuất cùa một công ty qua các năm như sau:
Năm 2015 2016 2017 2018 2019 2020
Số sản phẩm 20 23 25 29 35 40
Yêu cầu:
1. Tính các số tương đối động thái liên hoàn (tốc độ phát triển lien hoàn). tốc độ phát
triển định gốc.
2. Tính tốc độ phát triển trung bình hàng năm (số trung bình nhân).

Bài 10: Tại công ty A: ngày 01/06 số công nhân là 312 người
- Ngày 07/06: nhận vào thêm 10 công nhân
- Ngày 12/06: cho nghỉ việc 2 công nhân
- Ngày 22/06: nhận vào thêm 8 công nhân
- Ngày 28/06: cho nghỉ việc 2 công nhân, từ đó đến cuối tháng không có biến
động về số lao động.
Yêu cầu:
Tính số công nhân trung bình trong tháng 6 của công ty.
Bài 11: Có số liệu giá trị hàng hóa tồn kho của công ty (2KT) quí I năm 2015 như sau:
Thời điểm 1-1 1-2 1-3 1-4
Giá trị hàng tồn kho (triệu đồng) 1.150 1.480 1.540 1.580
Yêu cầu: Hãy tính giá trị hàng hoá tồn kho bình quân của công ty vào các thời điểm:
1. Từng tháng
2. Quí I/2015
60
Bài 12: Doanh thu bán sản phẩm thuốc Ho của doanh nghiệp X qua các năm như sau:
Năm 2015 2016 2017 2018
Số sản phẩm (Hộp) 3000 2500 3500 3600
Yêu cầu: Tính các chỉ tiêu sau:
1. Lượng tăng (giảm) tuyệt đối liên hoàn, định gốc?
2. Tốc độ phát triển liên hoàn, định gốc?
3. Tốc độ tăng (giảm) liên hoàn, định gốc?
4. Giá trị tuyệt đối 1% tăng (giảm)?
Bài 13: Có số liệu về giá trị xuất khẩu một doanh nghiệp qua các năm như sau:
Giá trị Lượng tăng, Giá trị tuyệt
Tốc độ Tốc độ
xuất khẩu giảm tuyệt đối phát triển tăng, giảm đối 1% tăng,
(triệu liên hoàn liên hoàn liên hoàn giảm
Năm USD) (triệu USD) (%) (%) (triệu USD)
2017 33 +3
2018 +15
2019
2020 46 0,42
Yêu cầu:
1. Điền các số liệu còn thiếu vào các ô trống trong bảng?
2. Dự báo giá trị xuất khẩu của doanh nghiệp năm 2021?
Bài 14: Có tài liệu về tình hình xuất khẩu của một doanh nghiệp qua các năm như sau:
Năm 2015 2016 2017 2018
Giá trị sản xuất (triệu USD)
Lượng tăng, giảm tuyệt đối liên hoàn (triệu USD) 6,3
Tốc độ phát triển liên hoàn (%) 125 135
Tốc độ tăng, giảm liên hoàn (%) 10
Giá trị tuyệt đối 1% tăng, giảm (triệu USD) 0,2
Yêu cầu:
1. Điền các số liệu còn thiếu vào các ô trống trong bảng?
2. Dự báo giá trị xuất khẩu của doanh nghiệp năm 2019,
2020? Bài 15:
Số liệu về doanh số bán (tỷ đồng) của một doanh nghiệp như sau:
Năm 2013 2014 2015 2016 2017 2018 2019 2020
Doanh số 30 33,496 36,19 39,53 41,75 40,817 41,547 44,126
Yêu cầu:
1. Xác định giá bán của công ty qua các năm?
61
2. Hãy xây dựng phương trình đường thẳng mô tả biến động doanh số bán qua các
năm theo dạng đường thẳng với ∑t=0. Từ đây, có thể nói gì về mức tăng, giảm
trung bình hàng năm của doanh số trong thời kỳ 2013 – 2020?
3. Dùng phương trình trên dự báo doanh số của năm 2021?
4. Với cách đánh số thứ tự thời gian từ 1 đến 8, hãy xây dựng phương trình đường
thẳng mô tả biến động doanh số. Dự báo doanh số bán năm 2021?
5. Hãy dự báo doanh số bán của năm 2021 bằng lượng tăng, giảm tuyệt đối liên
hoàn? Bài 16:
Có số liệu về doanh số của một công ty trong giai đoạn 2017 – 2020 như sau (tỷ đồng):
Năm Quý Doanh số Năm Quý Doanh số
Q1 2,1 Q1 3,5
Q2 1,9 Q2 2,8
2017 2019
Q3 1,7 Q3 2,4
Q4 2,3 Q4 3,4
Q1 3,2 Q1 3,8
Q2 2,5 Q2 3,1
2018 2020
Q3 2,1 Q3 2,9
Q4 3,5 Q4 3,7

Yêu cầu:
1. Phân tích biến động các thành phần của dãy số thời gian? Dự báo doanh số bán
từng quý năm 2021 theo mô hình hồi quy tuyến tính?
2. Hãy dự báo doanh số của công ty trong quý 3 năm 2021 dựa trên mô hình
nhân? Bài 17:
Giá trị sản xuất của một địa phương năm 2010 là 46.300 tỷ đồng. Kế hoạch, năm 2016,
chỉ tiêu này phải đạt gấp đôi năm 2010. Kết thúc năm 2014, giá trị sản xuất đạt 65.300
tỷ đồng.
Căn cứ vào số liệu trên hãy tính:
1. Tốc độ phát triển trung bình hằng năm giai đoạn (2010 – 2014)?
2. Để đạt được mục tiêu vào năm 2016 thì trong thời gian còn lại (2014 –
2016) tốc độ phát triển trung bình hằng năm là bao nhiêu? Bài 18:
Sản lượng lúa thu hoạch của tỉnh A qua các năm như sau:
Năm 2014 2015 2016 2017 2018 2019 2020
Sản lượng (tấn) 800 913 960 1.030 1.150 1.190 1.260
Yêu cầu: Hãy dự báo sản lượng lúa của tỉnh A trong năm 2021, 2022 theo phương
pháp sau:
1. Lượng tăng, giảm tuyệt đối trung bình?
2. Hàm xu thế tuyến tính?

Bài 19:
62
Doanh số của một công ty xây dựng Trường Phát trong 12 tháng của năm 2019 được
trình bày trong bảng sau:
Tháng 1 2 3 4 5 6 7 8 9 10 11 12
Doanh số (tỷ đồng) 7,5 9,5 12,5 8,5 9 26,5 18,5 9,5 9 12,5 19,5 11,5
Yêu cầu:
1. Giả sử có thể mô tả biến động của doanh số công ty theo dạng đường thẳng.
Hãy ước lượng đường thẳng thích hợp nhất bằng cách dùng ∑x=0. Từ đây, có
thể nói gì về mức tăng, giảm trung bình hàng tháng trong năm 2019?
2. Dùng đường thẳng ở câu 1, hãy dự báo doanh số của công ty trong tháng 1 năm
2020?
3. Cô Hương, một nhân viên phụ trách kinh doanh, với cách đánh số thứ tự từ 1
đến 12, cũng xây dựng được một đường thẳng mô tả biến động của doanh số?
Hãy tìm phương trình mà cô Hương đã xây dựng? Và dự báo cho tháng 1 năm
2020? Bài 20:
Doanh thu tiêu thụ theo giá so sánh của công ty thương mại X giai đoạn (2010 – 2014)
như sau:
- Năm 2011 so với 2010 tăng 5%
- Năm 2012 so với 2010 tăng 13,4%
- Năm 2013 so với 2010 tăng 24,7%
- Năm 2014 so với 2010 tăng 39,7% Yêu cầu:
1. Xác định tốc độ phát triển liên hoàn, tốc độ phát triển bình quân năm về doanh
thu tiêu thụ của công ty giai đoạn (2010 – 2014)?
2. Năm 2010 doanh thu tiêu thụ của công ty là 8 tỷ đồng. Hãy dự báo doanh thu
tiêu thụ của công ty năm
Nhiệt Doanh số Nhiệt độ Doanh số 2015, 2016 bằng tốc độ
độ bán ra (o F) bán ra phát triển bình quân? Bài
o
( F) (1.000USD) (1.000USD) 21:
81 135 82 140 Khu A thấy doanh số nước giải
75 130 66 110 khác bán ra phụ thuộc vào
59 100 91 155 nhiệt độ trung bình trong ngày
80 138 93 158 như sau:
79 125 65 115
58 95 78 125 Ngày mai khí tượng dự báo
69 118 73 120 nhiệt độ sẽ là 95oF vậy các
89 150 quán giải khát ở khu A có thể
bán được bao nhiêu chai nước
giải khát

Bài 22: Cty TNHH Thanh Duy buôn bán máy điện toán có doanh số bán máy PC trong
năm qua chia theo từng tháng như sau:

63
Tháng Nhu cầu Tháng Nhu cầu Hãy dùng phương pháp bình quân bé
thực thực nhất. để dự báo số máy bán ra cho tháng
1 37 7 43 giêng năm nay (tháng 13)
2 40 8 47
3 41 9 56
4 37 10 52
5 45 11 55
6 50 12 54

Bài 23: Doanh số bán café tại quán Thảo My phụ thuộc vào nhiệt độ trung bình trong
ngày như sau
Nhiệt độ Doanh số Nhiệt độ Doanh số (x Ngày mai dự báo nhiệt độ là
(oC) (x 1.000đ) (oC) 1.000đ)
31oC, vậy doanh số của quán là bao
31 2.546 32 2.916
nhiêu.
30 2.431 34 3.549
29 2.104 30 2.615
31 2.687 29 2.105
28 1.963 30 2.467

Bài 24: Bưu điện quận 5 nhận thấy số thư nhận được hàng ngày biến đổi theo ngày
trong tuần. Họ theo dõi trong
Tuần 1 Tuần 2 Tuần 3 3 tuần tiếp và thu được kết
Ngày
(1.000 cái) (1.000 cái) (1.000 cái) quả như sau:
Thứ hai 26 29 25 Nếu trưởng chi nhánh ước
Thứ ba 34 36 32 lượng trong tuần tới sẽ có độ
Thứ tư 42 39 38
280.000 thư phải chuyển, hãy
Thứ năm 51 58 54
dự báo số thư phải chuyển
Thứ sáu 85 90 79
trong từng ngày?
Thứ bảy 16 19 20
Chủ Nhật 10 12 14

Bài 25:
Bưu điện quận 8 nhận thấy số thư nhận được hàng ngày biến đổi theo ngày trong tuần.
Họ theo dõi trong 3 tuần tiếp và thu được kết quả như sau:
64
Ngày Tuần 1 Tuần 2 Tuần 3 Nếu trưởng chi nhánh ước
(1.000 cái) (1.000 cái) (1.000 cái) lượng trong tuần tới sẽ có độ
Thứ hai
280.000 26 24 22 thư phải chuyển, hãy
Thứ ba 34 39 35 dự báo số thư phải chuyển
Thứ tư 42 40 41 trong từng ngày
Thứ năm 51 54 46
Thứ sáu 85 80 69
Thứ bảy 16 19 19
Chủ Nhật 10 11 9

Bài 26:
Doanh số của Công ty thiết kế và sửa chữa nhà cửa XYZ phụ thuộc vào thu nhập hàng
tháng của người dân trong
Thu nhập Doanh số Thu nhập Doanh số vùng như sau
(100 usd) (1.000 usd) (100 usd) (1.000 usd) Nếu thu nhập tháng sau là
4.0 25.2 6.2 32.0 4.500 USD, vậy doanh số
5.0 26.4 5.4 26.1 của Công ty là bao nhiêu?
4.6 25.8 5.2 27.0
5.2 26.8 4.2 24.6
7.1 41.2 4.1 21.0

Bài 27:
Số lượng máy giặt trong năm qua được bán
Tháng Nhu cầu Tháng Nhu cầu như sau
1 87 7 94 Hãy dùng phương pháp bình quân bé nhất
2 83 8 102 để dự báo số máy giặt bán ra cho tháng
3 76 9 65 giêng năm nay (tháng 13)
4 91 10 84
5 80 11 104
6 82 12 95

Bài 28:
Số chai bia được bán ra hàng ngày của quán nhậu NK phụ thuộc vào số lượng khách
của quán như sau
Lượng Số chai Lượng Số chai bia Nếu ngày báo có khoảng 250
khách bia khách khách thì số bia bán được là bao
243 1.248 168 641 nhiêu.
165 762 194 1.543
189 951 124 529
248 1.365 135 687
197 1.045 187 65 1.096
Bài 29:
Cty Sao Việt có số lượng du khách thống kê trong 3 năm qua như sau. Nếu phòng kinh
doanh của Cty dự báo lượng du khách của năm thứ 4 là 46.248 người thì lượng du
khách của mỗi tháng là bao nhiêu?
Tháng Năm 1 Năm 2 Năm 3
1 3.451 3.230 3.649
2 4.802 5.107 5.524
3 2.198 1.982 2.014
4 1.576 1.813 1.762
5 1.314 1.840 1.872
6 2.249 2.305 2.507
7 4.492 4.653 5.600
8 5.204 6.718 6.973
9 2.144 2.280 2.501
10 1.950 1.584 1.672
11 1.123 1.079 1.205
12 3.704 3.515 4.002
Tổng 34.207 36.106 39.291

Bài 30:
Công ty Mai Linh có số lần khách hàng thuê xe trong 12 tháng qua như sau:
Tháng Số lượng Tháng Số lượng Hãy dùng phương pháp bình quân bé nhất
1 144 7 156 để dự báo số lần thuê xe ra cho tháng giêng
2 154 8 164 năm na (tháng 13)
3 146 9 167
4 158 10 162
5 150 11 169
6 158 12 172

Bài 31:
Có tài liệu về tình hình doanh số bán hàng của doanh nghiệp X như sau (%):

66
Tốc độ tăng (+) giảm (-) doanh số so với năm trước (%)
Năm
Bộ phận A Bộ phận B Bộ phận C
2012 -11,5 +3,3 +5,0
2013 +12,0 +12,0 +12,8
2014 +10,0 +11,0 -9,0
2015 -7,0 -3,8 +6,0

1. Tính tốc độ tăng doanh số năm 2015 so với năm 2011 mỗi bộ phận
2. Tính lượng tuyệt đối tăng doanh số bán hàng của mỗi bộ phận năm 2015
so với năm 2012. Biết rằng năm 2011 doanh số bán hàng của các bộ
phận lần lượt là: 9.700; 9.900 và 12.400 triệu đồng.
Bài 32: Tình hình biến động về doanh số bán lẻ của một Công ty bách hoá như sau:
Năm 2011 so với năm 2010 tăng 15%
Năm 2012 so với năm 2011 tăng 10%
Năm 2013 so với năm 2012 tăng 11%
Năm 2014 so với năm 2013 tăng 17%
Năm 2015 so với năm 2014 tăng 12%
Yêu cầu:
1. Xây dựng dãy số thời gian nói lên biến động về doanh số bán (biết doanh số
bán của năm 2010 là 100 tỷ đồng)
2. Tính tốc độ tăng bình quân hàng năm về doanh số bán lẻ của Công ty thời kỳ
2010-2015.
Bài 33: Có tài liệu về biến động nguyên vật liệu sản phẩm của 2 phân xưởng như sau:

Tốc độ tăng (+) giảm (-) nguyên vâ ̣t liệu so với năm


Năm trước (%)
Phân xưởng A Phân xưởng B
2010 -11 +5
2011 +14 +13
2012 +16 +11
2013 -7 -8

1) Tính tốc độ tăng nguyên vật liệu năm 2013 so với năm 2010 của phân xưởng A?
2) Hãy tính lượng tuyệt đối tăng nguyên vật liệu của mỗi phân xưởng năm 2013 so với
năm 2010? Biết thêm rằng năm 2009 nguyên vật liệu của 2 phân xưởng lần lượt là: 83
và 95 tấn. Bài 34:
Phương trình tương quan tuyến tính ước lượng mối quan hệ giữa mức trang bị vốn sản
xuất (vốn cố định) và giá thành đơn vị sản phẩm của 21 xí nghiệp thuộc Công ty X
như

sau: yx = 26,06−0,015x

67
Anh (chị) hãy giải thích ý nghĩa các tham số trong phương trình trên và ý nghĩa
hệ số tương quan r = - 73,6 %?
Bài 35:
Để nghiên cứu tình hình sản xuất lúa vụ mùa của các hợp tác xã nông nghiệp thuộc
huyện N, người ta đã chọn ra 6 hợp tác xã để điều tra thực tế, kết quả điều tra như sau:

Năng suất thu Sản lượng thu Lượng phân bón cho
HTX
hoạch (tạ/ha) hoạch (tạ) 1 ha (tấn/ha)
A 44 4.840 2,2
B 46 4.140 2,4
C 39 5.850 1,5
D 47 3.760 2,4
E 42 4.410 2,0
G 40 5.600 1,8
Yêu cầu:
1) Tính năng suất thu hoạch trung bình một ha của các hợp tác xã được điều tra.
2) Xác định phương trình biểu thị mối liên hệ tương quan giữa năng suất thu
hoạch và lượng phân bón trên 1 ha của số hợp tác xã được điều tra.

Bài 36: Kết quả điều tra 6 trang trại trồng cà phê ở một địa phương về mối quan hệ
giữa thu nhập trên 1 ha và vốn đầu tư cho việc chăm sóc cây trồng tính trung bình cho
một ha như sau:
Vốn đầu tư cho 1 ha (Triệu đồng/Ha) 3,5 5 7 10 12 16
Thu nhập trên 1 ha cà phê (Triệu đồng / 4 6 8,5 12 14 18
Ha)
Yêu cầu:
1) Xác định phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa vốn đầu tư
và thu nhập tính trên 1 ha cà phê của số trang trại được điều tra. Giải thích ý
nghĩa các tham số của mô hình hồi quy trên.
2) Đánh giá mức độ chặt chẽ của mối liên hệ này.
Bài 37: Để nghiên cứu tình hình sản xuất lúa vụ mùa của 40 hợp tác xã nông nghiệp
thuộc huyện N, người ta đã chọn ra 6 hợp tác xã để điều tra thực tế bằng phương pháp
ngẫu nhiên đơn thuần không hoàn lại. Kết quả điều tra như sau:
Năng suất thu Sản lượng thu hoạch Lượng phân bón
HTX
hoạch (tạ/ha) (tạ) cho 1 ha (tấn/ha)
A 44 4.840 2,2
B 46 4.140 2,4
C 39 5.850 1,5
D 47 3.760 2,4
E 42 4.410 2,0
G 40 5.600 1,8
Yêu cầu:
68
1. Xác định phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa năng suất
thu hoạch và lượng phân bón tính trên 1 ha của huyện trên được điều tra. Giải
thích ý nghĩa các tham số của mô hình hồi quy trên.
2. Đánh giá mức độ chặt chẽ của mối liên hệ này.
Bài 38: Có tài liệu về giá tri sản xuất tính theo giá so sánh năm 1996 và năng suất lao
động (NSLĐ) trung bình một công nhân của xí nghiệp N qua các năm như sau:
Chỉ tiêu 2010 2011 2012 2013 2014 2015
NSLĐ (triệu đồng/ CN) 12 12,6 14 13,5 15 18
Giá trị sản xuất (triệu đồng) 2400 2500 3000 2800 3300 4300
Yêu cầu:
1) Tính số công nhân trung bình hàng năm của xí nghiệp trong thời kỳ này.
2) Xây dựng hàm xu thế tuyến tính về giá trị sản xuất của xí nghiệp.
3) Dựa vào hàm xu thế tuyến tính, dự đoán giá trị sản xuất của xí nghiệp năm
2016.
CHƯƠNG 5
ƯỚC LƯỢNG KHOẢNG TIN CẬY VÀ KIỂM ĐỊNH GIẢ
THIẾT
Nội dung chương này sẽ làm rõ hơn các vấn đề của thống kê, hiểu được mức độ
tin cậy của số liệu được thực hiện như thế nào.

5.1. Ước lượng khoảng tin câ ̣y


Vấn đề ước lượng ở đây nói riêng và thống kê nói chung được chúng ta xem xét
toàn diện theo quan điểm của xác suất, có nghĩa là ta xem xét khả năng xảy ra cao nhất
chứ không xem xét trong từng trường hợp cụ thể đây là một vấn đề có thể không chính
xác lắm nhưng nó cũng gây ra sự hiểu nhầm ít nhiều trong việc đánh giá tính hiệu quả
của thống kê. Với quan điểm trên, các nhà toán học đưa ra khái niệm ước lượng
khoảng như sau:

Gọi là đặc trưng của tổng thể cần ước lượng. Giả sử dựa vào mẫu quan sát, ta
tìm được 2 biến ngẫu nhiên A, B sao cho:

P(A<<B)=1 - 
Trong đó, 1 -  là độ tin cậy
Giả sử a, b là giá trị cụ thể của A, B. Khoảng (a,b) được gọi là khoảng ước lượng với
độ tin cậy (1 - )100% của , hay nói ngắn gọn là khoảng tin cậy (1 - ).100% của .
5.1.1. Ước lượng trung bình tổng thể

69
Để thực hiện ta chọn một mẫu ngẫu nhiên n quan sát x 1, x2,... xn từ tổng thể X có
2
trung bình là , phương sai , trung bình mẫu là x , phương sai mẫu S2, độ tin cậy
1−. Ta ước lượng trung bình tổng thể như sau:

2
* Khi đã biết phương sai
Điều kiện tổng thể có phân phối chuẩn hoặc có cỡ mẫu lớn (n  30)

x−z/2  + x z/2
n n

với z có phân phối chuẩn tắc. Từ công thức trên ta nhận thấy:
(1). Nếu độ tin cậy và độ lệch chuẩn cố định, kích thước mẫu càng lớn thì khoảng
ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao.
(2). Nếu độ tin cậy và kích thước mẫu cố định, độ lệch chuẩn càng lớn thì khoảng
ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.
(3). Nếu độ lệch chuẩn và kích thước mẫu cố định, độ tin cậy càng cao thì khoảng
ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.
Ví dụ 5.1: Để xác định trọng lượng trung bình của các bao bột mì được đóng
bằng máy tự động, người ta chọn ngẫu nhiên 15 bao và tính được trọng lượng trung
bình 39,8kg. Tìm khoảng tin cậy 99% của trọng lượng trung bình các bao bột mì. Giả
sử trọng lượng bao đường có phân phối chuẩn và phương sai là 0,144.

Gọi  là trọng lượng trung bình một bao đường.


Ta có: n=15; x = 39,8, 2 = 0,144, =1% => Z0,5% =2,575.
0,144 0,144
39,8−2,575 39,8+2,575
15 15
39,55 <  < 40,05
Kết luận, với độ tin cậy 99%, trọng lượng trung bình của mỗi bao bột mì được
ước lượng trong khoảng từ 39,55kg đến 40,05kg.

2
* Khi chưa biết phương sai :
a) Trường hợp có cỡ mẫu lớn (n  30)

70
Trong trường hợp này chúng ta áp dụng như trường hợp 1 nhưng chúng ta dùng
phương sai của mẫu thay cho phương sai của tổng thể để ước lượng, chúng ta không
cần điều kiện về phân phối chuẩn của tổng thể.

z S/2 x z S/2 x−   +
n n
b) Trường hợp có cỡ mẫu nhỏ (n < 30):
Trong trường hợp này ta sử dụng phân phối Student để ước lượng và điều kiện
tổng thể phải có phân phối chuẩn.
s s
x−tn−1,/2  + x tn−1,/2 nn

Với tn-1 có phân phối Student với n-1 bậc tự do.


Ví dụ 5.2: Một công ty điện thoại muốn ước lượng thời gian trung bình của một
cuộc điện thoại đường dài vào ngày cuối tuần. Mẫu ngẫu nhiên 20 cuộc gọi đường dài
vào ngày cuối tuần cho thấy thời gian trung bình là 14,8 phút, độ lệch chuẩn 5,6 phút.
Ước lượng thời gian trung bình của một cuộc gọi đường dài vào ngày cuối tuần, với độ
tin cậy 95%.

Gọi  là thời gian trung bình của một cuộc gọi đường dài vào ngày cuối tuần. Ta

có: n=20; x =14,8; S=5,6; tn-1, Z/2 = t19, 0,025 = 2,093


Áp dụng công thức:
5,6 5,6
14,8 − 2,093  14,8 + 2,093
20 20

12,1792 <  < 17,4208


Vậy, với độ tin cậy 95%, thời gian trung bình của một cuộc điện đàm đường dài
vào cuối tuần được ước lượng trong khoảng từ 12,1792 đến 17,4208 phút.
5.1.2. Ước lượng tỷ lệ tổng thể
Trong nhiều trường hợp ta có thể quan tâm đến tỷ lệ các đơn vị có một tính chất
nào đó trong tổng thể. Chẳng hạn, tỷ lệ khách hàng sử dụng một loại sản phẩm nào đó
hoặc tỷ lệ phế phẩm trong sản xuất,... Khi đó, ta thực hiện ước lượng cho tỷ lệ p của
tổng thể.

Giả sử có mẫu ngẫu nhiên n quan sát và pˆ là tỷ lệ các quan sát có tính chất A nào
đó. Với mẫu lớn (n40), khoảng tin cậy (1−)100% của tỷ lệ p các quan sát có tính
chất A của tổng thể được xác định bởi:
   
 p(1− p) p(1− p)
n 71 n
p z− /2  +p p z/2

Ví dụ 5.3: Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản
phẩm nội địa đối với mặt hàng bánh kẹo. Kết quả điều tra 100 khách hàng cho thấy có
34 người dùng sản phẩm nội địa. Tìm khoảng tin cậy 95% cho tỷ lệ khách hàng sử
dụng bánh kẹo nội địa.

Gọi p là thị phần của sản phẩm nội địa đối với mặt hàng bánh kẹo.

Ta có: n=100, pˆ =0,34; z/2 =z0,025 =1,96


Áp dụng công thức ta có:

0,34(1−0,34) 0,34(1−0,34)
0,34 1,− 96 p 0,34+1,96
100 100
0,2472 < p < 0,4328
Vậy, Khoảng tin cậy 95% cho tỷ lệ khách hàng sử dụng bánh kẹo nội địa là
khoảng từ 24,72% đến 43,28%.
5.1.3. Ước lượng phương sai tổng thể
Để xem xét độ đồng đều của dữ liệu hoặc chất lượng của sản phẩm, trong một
số trường hợp ta có thể sử dụng ước lượng phương sai của tổng thể để xem xét. Để
thực hiện bài toán này ta thực hiện như sau:

Chọn một mẫu ngẫu nhiên n quan sát có phân phối chuẩn, với độ tin cậy 1-α ta
có ước lượng phương sai:

(n−2 1)S2 2  (n2−1)S 2

n−1; / 2 n− −1;1 /2

Ví dụ 5.4: Một nhà sản xuất quan tâm đến biến thiên của tỷ lệ tạp chất trong một
loại hương liệu được cung cấp. Chọn ngẫu nhiên 15 mẫu hương liệu cho thấy độ lệch
chuẩn về tỷ lệ tạp chất là 2,36%. Với khoảng tin cậy 95%, ước lượng độ lệch chuẩn về
tỷ lệ tạp chất.

Gọi  là độ lệch chuẩn về tỷ lệ tạp chất.


Ta có: n = 15, S=2,36%, α=5% => 2 14;2,5% = 26,119, 2 14;97,5% = 5,629

(15 1)2,36 − 2
 2 (15 1)2,36− 2

26,119 5,629

2,99 < 2 < 13,85 => 1,73 <  < 3,72


72
Vậy, với độ tin cậy 95%, độ lệch chuẩn về tuỷ lệ tạp chất được ước lượng trong
khoảng từ 1,73 – 3,72%.
5.1.4. Ước lượng cỡ mẫu (Estimating the sample size)
Để tăng độ chính xác của ước lượng, theo như chúng ta đã nghiên cứu những
phương pháp để ước lượng khoảng tin cậy, thì chỉ có một hướng để đạt được đó là cần
xác định cỡ mẫu có kích thước tối thiểu.
a) Cỡ mẫu trong ước lượng khoảng tin câ ̣y của trung bình tổng thể

z/2S x z/2S
Xuất phát từ công thức: x−   +
n n

Giả sử một mẫu ngẫu nhiên gồm n quan sát từ một tổng thể có phương sai ta có.
Một khoảng tin cậy (1- )100% của trung bình tổng thể là , gọi  là một nửa chiều

z/2  . Từ đây ta dễ dàng suy ra: 2

2 rộng của khoảng tin cậy =n z= /2 2 n 

b) Cỡ mẫu trong ước lượng khoảng tin câ ̣y của tỷ lệ tổng thể


   
 p(1− p) p(1− p)
Xuất phát từ công thức: p z− n /2   +p n
p z/2

Giả sử rằng một mẫu ngẫu nhiên gồm n quan sát, một khoảng tin cậy (1- )100%
cho tỷ lệ tổng thể p cho bởi công thức trên. Gọi  là một nửa chiều rộng của khoảng
− p)
tin cậy =z/2 p(1 , từ đó ta xác định kích thước mẫu tối thiểu như sau: n
 

)
n z= 2/2 p(1−2 p

  

Tất nhiên ta chưa thể biết p , song p(1−p) không vượt quá 0,25. Do đó, ta có công thức:
2 0,25 n
z= /2 2

5.2. Kiểm định giả thiết


5.2.1. Một số khái niệm
a) Các loại giả thuyết trong thống kê * Giả thuyết H0 (null hypothesis):

73
Gọi  là một đặc trưng chưa biết của tổng thể (giá trị trung bình, phương sai, tỷ
lệ). Ta hình thành giả thuyết H0 về  so với giá trị 0 cụ thể nào đó.
* Giả thuyết H1 (alternative hypothesis):
Giả thuyết H1 là kết quả ngược lại của giả thuyết H 0, nếu giả thuyết H0 đúng thì
giả thuyết H1 sai và ngược lại. Trong thống kê H 0 được kiểm định dựa trên cơ sở “đối
chứng” H1, H1 là giả thuyết thể hiện các tình huống không nằm trong H0.
- Kiểm định dạng hai đuôi (two-tailed):

H0 : = 0
H1 :  0

- Kiểm định dạng một đuôi (one-tailed):

 H0 :  0
 Một đuôi phải
H1 :  0

H0 :  0 Một đuôi trái


H1 :  0

b) Các loại sai lầm trong kiểm định giả thuyết


1) Sai lầm loại 1: Giả thuyết H0 đúng nhưng qua kiểm định ta lại kết
luận giả thuyết sai, và do vậy bác bỏ giả thuyết H 0 ở mức ý nghĩa  nào đó. Có
nghĩa là ta bác bỏ giả thuyết đúng.
2) Sai lầm loại 2: Giả thuyết H0 sai nhưng qua kiểm định, ta lại kết luận
giả thuyết đúng, và do vậy chấp nhận giả thuyết H 0 ở mức ý nghĩa nào đó. Có
nghĩa là ta chấp nhận một giả thuyết sai.
Tùy theo qua điểm và tính chất mà người ta cho sai lầm loại 1 hoặc loại 2 là
nghiêm trọng hơn. Tuy nhiên, thông thường thì người ta sẽ cho rằng sai lầm loại 1
là nghiêm trọng hơn mà thống kê cần tránh.
c) Qui trình tổng quát trong kiểm định giả thuyết
Mục đích chúng ta trong việc giới thiệu về phương thức kiểm định giả thuyết
tổng quát là nhằm đi tìm hiểu nội dung cơ bản trong phép suy diễn thống kê. Để đạt
đến quyết định cuối cùng, một phương thức có hệ thống sẽ được lập ra với các bước
như sau:
Bước 1: Xây dựng giả thuyết. Ta bắt đầu kiểm định giả thuyết với một giả
định về một vài tham số tổng thể và sử dụng dữ liệu mẫu để kiểm tra tính logic của
giả định đó. Nói cách khác, ta bắt đầu bằng cách giả định có một giá trị tổng thể nào

74
đó và kết luận bằng quyết định bác bỏ hay không bác bỏ giả định đó theo các số
liệu mẫu. Việc thiết lập giả thuyết tùy thuộc vào bản chất của tình huống có định
hướng hay không định hướng. Nếu tình huống không có định hướng sai biệt, thì giả
thuyết là 2 đuôi, nếu có tính định hướng thì ta có giả thuyết 1 đuôi. Để xác định giả
thuyết 1 đuôi phải hay 1 đuôi trái chúng ta dựa vào nguyên tắc tránh sai lầm loại 1.

Tuy nhiên cần nhớ rằng sự thất bại trong việc loại H 0 không đồng nghĩa với
việc bạn đã chứng minh được H 0 đúng, mà chỉ là bạn không đủ bằng chứng thống
kê để loại bỏ mà thôi.
Bước 2: Chọn mức ý nghĩa mong muốn. Khả năng phạm sai lầm loại 1 như
ta đã trình bày được gọi là mức ý nghĩa và được ký hiệu là . Trên thực tế, có 3
mức ý nghĩa thường dùng nhất là 0,1, 0,05 và 0,01 tương ứng với độ tin cậy là 0,90,
0,95, 0,99. Việc lựa chọn  là bao nhiêu phụ thuộc vào tính chủ quan của người
nghiên cứu chấp nhận rủi ro ở mức nào. Có một ý có tính chất kinh nghiệm để
chúng ta tham khảo:

- Nếu nội dung nghiên cứu đòi hỏi độ chính xác cao thì nên chọn mức  nhỏ,
thông thường là 1%.

- Nếu nội dung nghiên cứu số liệu biến động lớn, thu thập thông tin khó chính xác
thì ta nên chọn  lớn, tuy nhiên ta không nên tăng quá lớn sẽ làm tăng khả năng bị
sai lầm loại 2 và thông thường theo sự thống nhất chung của các nhà thống kê mức ý
nghĩa tối đa là 10%.
- Nếu không quan tâm quá nhiều đến mức ý nghĩa thì ta nên chọn theo mức thông
thường là 5%.
Bước 3: Tính trị số thông kê hay giá trị thực tế của kiểm định. Trong bước
này, dựa vào các lý thuyết thống kê mà chúng ta lựa chọn công thức phù hợp để qui
phân phối mẫu về phân phối nào đó. Một số phân phối thường gặp là phân phối
chuẩn, phân phối Student, phân phối Chi bình phương, phân phối Fisher,... Giá trị
thực tế của kiểm định là cơ sở để quyết định chấp nhận hay bác bỏ giả thuyết
không.
Bước 4: Rút ra kết luâ ̣n liên quan đến giả thuyết không. Tương ứng với
mức ý nghĩa  và phân phối được xác định ở Bước 3 ta tìm được giá trị lý thuyết
của kiểm định, thông thường là ta tra bảng hoặc sử dụng phần mềm máy tính để tìm
được ( Z, tdf ,, Fv1, 2,v ,....). Sau đó chúng ta so sánh giữa giá trị thực tế và giá trị lý
thuyết của kiểm định để có kết luận phù hợp với giả thuyết không.

Bước 5: Kết luâ ̣n. Tùy thuộc vào nội dung nghiên cứu chúng ta sẽ đưa ra kết
luận phù hợp với mục đích và yêu cầu của vấn đề đặt ra.
5.2.2 Kiểm định tham số

75
a) Kiểm định trung bình tổng thể
Để thực hiện kiểm định này giả sử ta có một mẫu ngẫu nhiên n quan sát x1, x2,...
2
xn từ tổng thể X có trung bình là , phương sai , trung bình mẫu là x , phương sai
mẫu S2, mức ý nghĩa kiểm định  và giá trị cho trước là 0 .
Kiểm định giả thuyết được thực hiện như sau:
* Trường hợp đã biết phương sai tổng thể:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0 :  0 H0 :  0 H0 : = 0
  
H1 :  0 H1 :  0 H1 :  0
2. Giá trị kiểm định x

z= n −0

3. Quyết định bác bỏ H0 khi: Z  Z Z −Z Z  Z/2;Z −Z/2


Điều kiện áp dụng cho trường hợp này là tổng thể X có phân phối chuẩn hoặc có
cỡ mẫu n30, các bước kiểm định như sau:
Đối với trường hợp này ta sử dụng phân phối chuẩn để thực hiện kiểm định
giả thuyết thống kê, ta có thể gọi tắt là kiểm định Z và nguyên tắc này đều giống
nhau chỉ có giá trị kiểm định là khác nhau. Để khỏi phải nhớ nhiều ta có nguyên tắc
bác bỏ H0 trong kiểm định Z như sau:
Bác bỏ giả thuyết H0 1 đuôi nếu: Z  Z

Bác bỏ giả thuyết H0 2 đuôi nếu: Z  Z/2

Ví dụ 5.5: Một nghiên cứu được thực hiện để xác định mức độ hài lòng của
khách hàng sau khi công ty điện thoại, cải tiến một số dịch vụ khách hàng. Trước khi
thay đổi, mức độ hài lòng của khách hàng tính trung bình là 77 điểm, theo thang điểm
từ 0 đến 100. 20 khách hàng được chọn ngẫu nhiên để gởi bảng điều tra xin ý kiến sau
khi các thay đổi được thực hiện, mức độ hài lòng trung bình tính được là 80. Có thể kết
luận khách hàng đã được làm hài lòng ở mức độ cao hơn hay không với mức ý nghĩa
1%. Cho biết tổng thể có phân phối chuẩn với độ lệch chuẩn là 8.

Gọi  là điểm trung bình về mức độ hài lòng của khách hàng.

Ta có: n=20, x =80, 0 =77, =8, =1%.

H0 :  =0 77 (1).
Đặt giả thuyết: 

76
H1 :  =0 77

−0 −
x 80 77 1,68
= 8
 n 20 =
(2). Giá trị kiểm định: z=
(3). Quyết định: Z =1,68  Z1% = 2,33. Chấp nhận giả thuyết H0.

(4). Kết luận: Với mức ý nghĩa  = 1% số liệu của mẫu không đủ bằng
chứng để bác bỏ giả thuyết H0, nghĩa là mức độ hài lòng của khách hàng không tăng
lên.
* Trường hợp chưa biết phương sai tổng thể:

+ n30: Trường hợp này ta không có phương sai tổng thể thì sử dụng phương sai
của mẫu để tính giá trị thực tế của kiểm định. Ngoài ra, dựa vào định lý giới hạn trung
tâm trong trường hợp này ta không nhất thiết tổng thể phải có phân phối chuẩn.

x−0
Sx
Ta có kiểm định Z, với z= n

+ n30: Điều kiện tổng thể phải có phân phối chuẩn. Ta có dạng tổng quát
kiểm định như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0 :  0 H0 :  0 H0 : = 0
  
H1 :  0 H1 :  0 H1 :  0
2. Giá trị kiểm định x
Sx
t= n −0

3. Quyết định bác bỏ H0 khi: t  tn−1, t −tn−1, t tn−1,/2;t −tn−1,/2


Tương tự như đối với kiểm định Z, ta có thể gọi trong trường hợp này là kiểm
định Student và ta có thể tóm tắt nguyên tắc bác bỏ H0 như sau:

Bác bỏ giả thuyết H0 1 đuôi nếu: ttn−1,

Bác bỏ giả thuyết H0 2 đuôi nếu: ttn−1,/2


Ví dụ 5.6: Một loại đèn chiếu được nhà sản xuất cho biết có tuổi thọ trung bình
thấp nhất là 65 giờ. Kết quả kiểm tra từ mẫu ngẫn nhiên 21 đèn cho thấy tuổi thọ trung
bình là 62,5 giờ, với độ lệch chuẩn là 3. Với = 0,01, có thể kết luận gì về lời tuyên bố
của nhà sản xuất? Cho biết tuổi thọ của bóng đèn có phân phối chuẩn.
77
Gọi  là tuổi thọ trung bình của bóng đèn.

Ta có: n=21, x =62,5, =65, S=3, =1%.

(1). Đặt giả thuyết: H0 : 65

H1 : 65

−0 −
x 62,5 65 3,82

Sx = 3
(2). Giá trị kiểm định: t = n 21 =−

(3). Quyết định: t= 3,82  2,528 = t20, 0,01 => Giả thuyết H0 bị bác bỏ.

(4). Kết luận: Với =1%, ta kết luận rằng lời tuyên bố của nhà sản xuất là sai.
b) Kiểm định tỷ lệ p tổng thể

Giả sử ta có mẫu ngẫn nhiên n quan sát. Gọi p, pˆ lần lượt là tỷ lệ các đơn vị có
tính chất nào đó mà ta quan tâm của tổng thể và của mẫu, p 0 là số tỷ lệ cho trước. Điều
kiện cỡ mẫu n  40.
Trong trường hợp này ta có kiểm định phân phối chuẩn:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0 : p  p0 H0 : p  p0 H0 : p= p0
  
H1 : p  p0 H1 : p  p0 H p1 :  p0
2. Giá trị kiểm định pˆ
z= x − p0
P0 (1− p0 )
n
3. Quyết định bác bỏ H0 khi: Z  Z Z −Z Z  Z/2;Z −Z/2
Ví dụ 5.7: Giả sử sản phẩm của một công ty sản xuất vỏ xe ô tô đã chiếm được thị
phần 42%. Hiện tại, trước mắt cạnh tranh của đối thủ và những điều kiện thay đổi của
môi trường kinh doanh, ban lãnh đạo muốn kiểm tra lại xem thị phần của công ty có
còn là 42% hay không. Chọn một mẫu ngẫu nhiên 550 ô tô trên đường, kết quả cho
thấy có 219 xe sử dụng vỏ xe của công ty. Có thể kết luận gì, ở mức ý nghĩa = 0,1?
Gọi p là tỷ lệ xe sử dụng vỏ xe của công ty. Ta có: n = 550, pˆ = 210/550 = 0,398,

 H0 : p 0,42
p0=0,42, = 10%.Đặt giả thuyết: 

H1 : p 0,42

78
− −
(1). Giá trị kiểm định: z = pˆx p0 = 219/ 550 0,42 =−1,037 P0(1−
p0) 0,42(1−0,42) n 550

(2). Quyết định: Z =1,037 1,28 =Z0,1. Chấp nhận giả thuyết H0.

(3). Kết luận: Ở mức ý nghĩa 10%, ta có thể nói rằng hiện tại công ty chiếm ít nhất
42% thị trường về vỏ xe ô tô.
c) Kiểm định phương sai
Chọn một mẫu ngẫu nhiên n quan sát được chọn ngẫu nhiên từ tổng thể phân
phối chuẩn. Gọi S2 là phương sai của mẫu, kiểm định giả thuyết về phương sai của
tổng thể được thực hiện như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0 : 2  0 H0 : 2  0 H0 : 2 = 0
 2  2  2

H1 :  0 H1 :  0 H1 :  0


2. Giá trị kiểm định (n
n2−1 = −1)2 S2
0
3. Quyết định bác bỏ H0 khi:  n2−1  n2−  n2−1  n2−1,/2
 n2−1  n2−1, −1,1 

 n2−1  n2− −1,1 /2


Ví dụ 5.8: Bộ phận giám sát chất lượng quan tâm đến đường kính một loại chi
tiết sản phẩm. Quá trình sản xuất còn được xem là tốt và chi tiết sản phẩm sản xuất ra
được chấp nhận nếu phương sai của đường kính tối đa không quá 1, nếu phương sai
vượt quá 1, phải xem xét lại máy móc và sửa chữa. Với mẫu ngẫu nhiên 31 chiết tiết,
phương sai đường kính tính được là 1,62. Ở mức ý nghĩa =0,05, ta có thể kết luận
như thế nào về quá trình sản xuất?

2
Gọi là phương sai của đường kính sản phẩm. Ta có, n=31, S2=1,62, 02 =1, 
=5%

H0 : 2  0
(1). Đặt giả thuyết: H1 : 2  0


(n
(2). Giá trị kiểm định: 302 = −1)2 S2 = (31 1).1,62−1 = 48,6

0

79
(3). Quyết định: 302 = 48,6  43,77 =302 ,0,05 , bác bỏ giải thuyết H0.

(4). Kết luận: Ở mức ý nghĩa 5%, ta cần phải xem xét, sửa chửa máy móc.
d) Giá trị p của kiểm định (probability Value: p – value)
Trong ví dụ 5.5, ta có nhận xét như sau:
=1%: Z =1,677  Z1% = 2,33=> chấp nhận H0
=10%: Z =1,677  Z10% =1,28=> bác bỏ H0
Như vậy với mỗi mức ý nghĩa khác nhau chúng ta có thể kết luận khác nhau
và theo khuynh hướng nếu mức ý nghĩa càng tăng thì khả năng bác bỏ giả thuyết H 0
càng tăng, từ đó xuất hiện giá trị p là giá trị trung gian giữa 2 miền của  thành
miền chấp nhận và miền bác bỏ H0.
0 1% p 10% 

Chấp nhâ ̣n H0 Bác bỏ H0

Định nghĩa: Giá trị p của kiểm định là một số sao cho với mọi  p thì giả
thuyết H0 bị bác bỏ.
Giá trị p đóng vai trò rất quan trọng trong kiểm định bởi vì nó tiện dụng hơn
khi quyết định về giả thuyết và cho chúng ta được giá trị tới hạn mà giả thuyết còn
có thể chấp nhận được.
Về mặt tính toán thì chúng ta không thể tính toán bằng phương pháp thủ công
được mà hiện nay các máy tính xử lý thống kê đều cho chúng ta kết quả này một
cách dễ dàng. Chúng ta có thể tìm giá trị p trong trường hợp kiểm định Z bằng cách
tra bảng:

- Trường hợp kiểm định 1 đuôi: p = 0,5 -  (|Z|) - Trường hợp kiểm định 2

đuôi: p = 2(0,5 - (|Z|))


Có hai nhận xét quan trọng đối với giá trị p:

- Nếu p quá nhỏ (p 0): Giả thuyết H0 sẽ bị bác bỏ hoàn toàn.


- Nếu p quá lớn (p>10%): Giả thuyết H0 sẽ được chấp nhận hoàn toàn.
Trong trường hợp p quá lớn hoặc quá nhỏ chúng ra kết luận kiểm định thống
kê có thể không cần đề cập đến mức ý nghĩa.
e) Kiểm định sự khác nhau của 2 phương sai tổng thể
Chọn 2 mẫu ngẫu nhiên độc lập có n X, nY quan sát từ 2 tổng thể X,Y có phân
phối chuẩn. Giả sử Sx2 > Sy2 ta có giả thuyết:

80
H0 : x2 = y2

Giả thuyết: H0 2 2

 : x  y

Bác bỏ giả thuyết F = SSxy22 Fnx−1;ny−1;

Việc giả sử Sx2 > Sy2 điều này không làm mất tính tổng quát của bài toán, khi đó
ta sẽ chọn X là tổng thể có phương sai lớn.
Ví dụ 5.9: Một công ty chuyên cung cấp dịch vụ điện thoại di động muốn khảo
sát có sự khác biệt trong biến động hóa đơn điện thoại trung bình hàng tháng của
khách hàng là nhà kinh doanh nam hay nữ hay không. Họ tiến hành thu thập một mẫu
ngẫu nhiên 20 khách hàng nam và một mẫu ngẫu nhiên 10 khách hàng nữ. Tính toán
các tham số độ lệch chuẩn mẫu như sau: Khách hàng nam 146.000đ; Khách hàng nữ
164.000đ. Có kết luận gì với mức ý nghĩa 5%.
Gọi x2 , y2 là phương sai về biến động chi phí điện thoại của nữ, nam.

Ta có: nx=10, ny=20, Sx=164.000đ, Sy=146.000đ, =5%.

H0 : x2 = y2
(1) Giả thuyết:  2 2

H:

 0  x  y
164.0002
(2) Giá trị kiểm định: F= 146.000 2 =1,26

(3) Quyết định: F = 1,26 < F9,19,5%=2,42 => Chấp nhận H0

(4) Kết luận: Với =5%, không đủ bằng chứng để chứng minh rằng chi tiêu điện

thoại của nam và nữa khác nhau.


5.2.3. Kiểm định phi tham số
Ở phần trước, chúng ta đã nói đến kiểm định giả thuyết về các đặc trưng - trung
bình, tỷ lệ, phương sai - của tổng thể và thường giả định tổng thể phân phối chuẩn.
Trong phần này, cũng với giả thuyết H 0 về tham số tổng thể, chúng ta sẽ đề cập đến
các kiểm định mà phần lớn không gắn liền tới tham số nào đó của mẫu, và vì vậy,
chúng được gọi là kiểm định phi tham số. Kiểm định phi tham số thường không yêu
cầu điều kiện giả định phân phối chuẩn của tổng thể, do đó có nhiều ứng dụng hơn.
Tuy nhiên, phương pháp kiểm định phi tham số khó mở rộng và kém chính xác hơn so
với kiểm định tham số.

81
a. Kiểm định Willcoxon (Kiểm định T)
Kiểm định Wilcoxon được áp dụng trong trường hợp chúng ta kiểm định về sự
bằng nhau của hai trung bình tổng thể đối với mẫu phối hợp từng cặp.

Trước khi đi vào phương pháp giải quyết ta định nghĩa hạng (rank) của phần tử.
Giả sử ta có một dãy các số thực được xếp theo thứ tự tăng dần, trong dãy này
không có giá trị nào bằng nhau: x1 < x2 < ... < xn
Khi đó rank(x1) = 1, rank(x2) = 2, ..., rank(xn) = n
Trong trường hợp các phần tử có giá trị bằng nhau thì hạng của nó là hạng trung
bình của các hạng liên tiếp.
* Trường hợp mẫu nhỏ (n  20):

Chọn ngẫu nhiên n cặp quan sát (x i, yi) từ hai tổng thể X, Y. Với mức ý nghĩa 
ta có các bước kiểm định sau:

H0 : x − =y0

1) Đặt giả thuyết: 

H1 : x − y  0
2) Giá trị kiểm định:

- Tính các chênh lệch giữa các cặp di = xi – yi.

- Xếp hạng giá trị tuyệt đối các chênh lệch |di| theo thứ tự tăng dần, các giá bằng
nhau sẽ nhận hạng trung bình, bỏ qua trường hợp chênh lệch bằng 0.

- Gọi n+ là số các di  0.

- Tìm tổng các hạng được xếp của di mang dấu dương T+ =rank d( i ) .
di 0

- Tìm tổng các hạng được xếp của di mang dấu âm T− =rank d( i ) .
di 0

- Kiểm định T = min(T+, T-).

3) Qui tắc quyết định: Ở mức ý nghĩa , bác bỏ H0 nếu T<Tn+,, với Tn+, là giá trị
của kiểm định Wilcoxon, n+ là số cặp quan sát có di ≠ 0.
* Trường hợp mẫu lớn (n >20):

82
Nếu n lớn thì phân phối Wilcoxon gần như phân phối chuẩn, lúc này trung bình
và phương sai được tính như sau:

Giá trị kiểm định: Z = T −T


T

n n( +1)
Trung bình: T =
4

Phương sai: T2 = n


n( +1)
(2n+1) 24

b. Kiểm định Mann - Whitney (Kiểm định U)


Cũng như kiểm định T, nhưng kiểm định U xem xét trường hợp các mẫu độc lập.
Chọn 2 mẫu ngẫu nhiên độc lập có n 1, n2 quan sát từ hai tổng thể có trung bình là
1, 2 . Với mức ý nghĩa , các bước kiểm định:

(1). Đặt giả thuyết: H0 : 1 − 2 = 0


H1 : 1 − 2  0

(2). Giá trị kiểm định


- Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng dần.
Những giá trị bằng nhau sẽ nhận hạng trung bình hai hạng liên
tiếp.
- Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất. Ký hiệu: R 1
- Giá trị kiểm định:

U1 =n n1. 2 +n n1( 1 +1) −R1 U2 = n n1. 2 −U1


2
U = min(U U1,2)

Khi cỡ mẫu lớn (n1, n2  10) phân phối U được xem là phân phối chuẩn

U −U
Giá trị kiểm định: Z =
U

83
U =nn12 U2 =nn n n1
1)
2 12
c. Kiểm định Kruskal – Wallis
Đây là trường hợp mở rộng của kiểm định Mann – Whitney, chúng ta sẽ thực
hiện bài toán kiểm định về sự bằng nhau của k trung bình tổng thể.
Chọn k mẫu ngẫu nhiên độc lập có n1,..., nk quan sát, gọi n = ni . Xếp hạng tất
cả các quan sát theo thứ tự tăng dần, những giá trị bằng nhau sẽ nhận hàng trung
bình. Gọi R1,..., Rk là tổng hạng của từng mẫu.

H0 :  1 = 2 =... k

1) Đặt giả thuyết: H1 :  i j (i  j)


2) Giá trị kiểm định: W = 12 =k Rnii2 − +3(n 1) n n( +1) i 1
3) Quyết định bác bỏ H0 :W k2−1,

BÀI TẬP

Bài 1. Trọng lượng của một sản phẩm theo qui định là 6kg. Sau một thời gian sản xuất,
người ta tiến hành kiểm tra 121 sản phẩm và tính được trung bình mẫu là 5,975kg và
phương sai mẫu hiệu chỉnh 5,7596kg 2. Sản xuất được xem là bình thường nếu các sản
phẩm có trọng lượng trung bình bằng trọng lượng qui định. Với mức ý nghĩa 5%, hãy
kết luận về tình hình sản xuất.
Bài 2. Trọng lượng của một sản phẩm có phân phối chuẩn với trọng lượng trung bình
là 500g. Sau một thời gian sản xuất, người ta nghi ngờ trọng lượng trung bình của loại
sản phẩm này có xu hướng giảm nên tiến hành kiểm tra 25 sản phẩm và thu được kết
quả sau:
Trọng lượng (g) 480 485 490 495 500 510
Số sản phẩm 2 3 8 5 3 4
Với mức ý nghĩa 3%, hãy kết luận điều nghi ngờ trên có đúng hay không.
Bài 3. Năng suất lúa trung bình của những vụ trước là 5,5 tấn/ha. Vụ lúa năm nay
người ta áp dụng một phương pháp kỹ thuật mới cho toàn bộ diện tính trồng lúa trong
vùng. Điều tra năng suất 100ha lúa, ta có bảng số liệu sau:
Năng suất (tạ/ha) 40-45 45- 50- 55- 60- 65- 70- 75-
50 55 60 65 70 75 80

84
Diện tích (ha) 7 12 18 27 20 8 5 3
Với mức ý nghĩa 1%, hãy kết luận xem phương pháp kỹ thuật mới có làm tăng năng
suất lúa trung bình của vùng này hay không?
Bài 4. Một công ty dự định mở một siêu thị tại một khu dân cư. Để đánh giá khả năng
mua hàng của dân cư trong khu vực, người ta tiến hành điều tra về thu nhập của 100 họ
trong khu vực và có bảng số liệu sau:
Thu nhập bình quân 150 200 250 300 350
(ngàn/người/tháng)
Số hộ 2 3 8 5 3
Theo bộ phận tiếp thị thì siêu thị chỉ hoạt động có hiệu quả tại khu vực này khu thu
nhập bình quân hàng tháng của các hộ tối thiểu là vào khoảng 250 ngàn/người/tháng.
Vậy theo kết quả điều tra trên, công ty có nên quyết định mở siêu thị tại khu vực này
hay không với mức ý nghĩa 5%?

Bài 5. Để nghiên cứu nhu cầu của một loại hàng, người ta tiến hành khảo sát nhu cầu
của mặt hàng này ở 400 hộ. Kết quả như sau:
Nhu cầu (kg/tháng) 0 0-1 1-2 2-3 3-4 4-5 5-6 6-7
Số hộ 10 35 86 132 78 31 18 10
Giả sử khu vực đó có 4000 hộ. Nếu cho rằng nhu cầu trung bình về mặt hàng này của
toàn khu vực là 14 tấn/tháng thì có chấp nhận được không với mức ý nghĩa 2%? Bài 6.
Trọng lượng của một loại gà công nghiệp ở một trại chăn nuôi có phân phối chuẩn.
Trọng lượng trung bình khi xuất chuồng năm trước là 2,7kg/con. Năm nay, người ta sử
dụng một loại thức ăn mới. Cân thử 25 con khi xuất chuồng người ta tính được trung
bình mẫu là 3,2 kg và phương sai mẫu hiệu chỉnh là 0,25 kg2.

a) Với mức ý nghĩa 5%, hãy kết luận xem loại thức ăn mới có thực sự làm tăng
trọng lượng trung bình của đàn gà hay không?
b) Nếu trại chăn nuôi báo cáo trọng lượng trung bình khi xuất chuồng là 3,3kh/con
thì có chấp nhận được không với mức ý nghĩa 5%?
Bài 7. Chiều cao trung bình của 100 nam sinh khoa kinh tế của một trường đại học là
1,68m với độ lệch mẫu hiệu chỉnh là 6cm. Trong khi kiểm tra 120 nam sinh ở một
khoa khác thì chiều cao trung bình là 1,64m với độ lệch mẫu hiệu chỉnh là 5cm. Với
mức ý nghĩa 1% có thể kết luận rằng nam sinh khoa kinh tế thực sự cao hơn nam sinh
khoa khác hay không?

Bài 8. Một hợp tác xã trồng thử hai giống lúa, mỗi giống trên 30 thửa ruộng và được
chăm sóc như nhau. Cuối vụ thu hoạch ta được số liệu như sau:
Năng suất trung bình Độ lệch mẫu hiệu chỉnh
(tạ/ha)
Giống lúa 1 45 2,5

85
Giống lúa 2 46,5 4,0

a) Với mức ý nghĩa 2%, có thể xem năng suất của hai giống lúa trên là như nhau
hay không?
b) Với mức ý nghĩa 2% có thể xem năng suất của giống lúa 2 cao hơn giống lúa 1
không?
Bài 9. Một máy sản xuất tự động, lúc đầu tỉ lệ sản phẩn loại A là 45%. Sau khi áo dụng
một phương pháp sản xuất mới, người ta lấy ra 400 sản phẩm để kiểm tra thì thấy có
215 sản phẩm loại A. Với mức ý nghĩa 5%, hãy kết luận xem phương pháp mới có
thực sự là tăng tỉ lệ sản phẩm loại A hay không?
Bài 10. Thống kê 10650 trẻ sơ sinh ở một địa phương người ta thấy có 5410 bé trai.
a) Với mức ý nghĩa 3%, hỏi có sự khác biệt về tỉ lệ sinh bé trai và bé gái hay
không?
b) Với mức ý nghĩa 1%, hỏi tỉ lệ sinh bé trai có thực sự cao hơn tỉ lệ sinh bé gái
không?
Bài 11. Bệnh A có thể chữa bằng hai loại thuốc H và K. Công ty sản xuất thuốc H
tuyên bố tỉ lệ bệnh nhân khỏi bệnh do dùng thuốc của họ là 85%. Người ta dùng thử
thuốc H chữa cho 250 bệnh nhân thì thấy có 210 người khỏi bệnh. Dùng thử thuốc K
cho 200 bệnh nhân thì thấy có 175 người khỏi bệnh.
a) Với mức ý nghĩa 1% có thể kết luận thuốc K có khả năng chữa khỏi bệnh A tốt
hơn thuốc H hay không?
b) Xét xem hiệu quả chữa bệnh của thuốc H có đúng như công ty quảng cáo với
mức ý nghĩa %% hay không?
Bài 12. Để khảo sát chỉ tiêu X của một lại sản phảm, người ta quan một mẫu có kết quả
sau:
X(cm) 11-15 15-19 19-23 23-27 27-31 31-35 35-39

Số SP 8 9 20 16 16 13 18
Những sản phẩm có chỉ tiêu X từ 19cm trở xuống được gọi là những sản phẩm loại B.
a) Giả sử trung bình tiêu chuẩn của chỉ tiêu X là 29cm. Hãy cho nhận xét về tình
hình sản xuất với mức ý nghĩa 2%.
b) Bằng phương pháp sản xuất mới, sau một thời gian người ta thấy giá trị trung
bình của chỉ tiêu X của nhũng sản phẩm loại B là 16cm. Hãy cho kết luận về
phương pháp sản xuất mới với mức ý nghĩa 1% (giả sử X có phân phối chuẩn).
c) Một tài liệu thống kê cũ cho rằng tủ lệ những sản phẩm loại B là 12%. Hãy
nhận định về tài liệu này với mức ý nghĩa 5%.
CHƯƠNG 6 TƯƠNG QUAN VÀ HỒI QUI TUYẾN TÍNH

Trong chương này ta sẽ nói đến việc nghiên cứu mối liên hệ giữa hai hay
nhiều biến ngẫu nhiên với hai phương pháp tương quan và hồi qui. Từ mô hình hồi
86
qui để nhận biết được sự tác động qua lại giữa các biến để xem xét sự biến động tốt
hay xấu đến biến cần nghiên cứu, từ đó đề xuất các biện pháp nâng cao hiệu quả và
khác phục hậu quả.

6.1. Hệ số tương quan


Hệ số đo lường mức độ tuyến tính giữa hai biến không phân biệt biến nào là phụ
thuộc biến nào là độc lập.

Giả sử X, Y là 2 biến ngẫu nhiên hệ số tương quan tổng thể xy là khái niệm
dùng để thể hiện cường độ và chiều hướng của mối liên hệ tuyến tính giữa X và Y
nếu nó thỏa mãn 5 điều kiện sau:
1) −1xy 1;

2)  0: Giữa X và Y có mối liên hệ nghịch, nghĩa là nếu X tăng thì Y giảm


và ngược lại;
3)  0 : Giữa X và Y có mối liên hệ thuận, nghĩa là nếu X tăng thì Y tăng
và ngược lại;
4) = 0 : Giữa X và Y không có mối liên hệ tuyến tính;
5)  : càng lớn thì mối liên hệ giữa X và Y càng chặt chẽ;

Trong thực tế ta không biết chính xác được hệ số tương quan tổng thể mà phải
ước lượng từ dữ liệu mẫu thu thập được.

Gọi (xi,yi) là mẫu n cặp quan sát thu thập ngẫu nhiên từ X và Y. Hệ số tương
quan tổng thể xy được ước lượng từ hệ số tương quan mẫu r xy - còn được gọi là hệ số
tương quan Pearson, được xác định bởi công thức sau:
2

y=(xi −x)(yi −y)


r=n i=1 n

(x −x) (y −y)


i
2
i
2

i=1 i=2

Kiểm định giả thuyết về mối liên hê ̣ tương quan


Giả sử có mẫu n cặp quan sát chọn ngẫu nhiên từ X và Y có phân phối chuẩn.
Kiểm định giả thuyết về hệ số tương quan của tổng thể =0 tức là không có mối liên
hệ giữa các biến X và Y.

Các dạng kiểm định như sau:

87
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết 0 0 0
H0 : H0 : H0 :=
  

H1 : 0 H1 : 0 H1 : 0


2. Giá trị kiểm định r
t (1− r )
( n − 2)
=
2

t  tn−2, 2;t −tn−2, 2


3. Quyết định bác bỏ H0 khi: t  tn−2, t −tn−2,

Hệ số tương quan có một vài ứng dụng quan trọng trong việc kiểm định mô hình
hồi qui tuyến tính, do đó chúng ta cũng cần quan tâm đúng mức khi đi sâu vào lĩnh vực
kinh tế lượng.

6.2. Mô hình hồi qui tuyến tính đơn giản


Như phần tương quan tuyến tính dùng để đo lường mức độ liên hệ tuyến tính
giữa hai biến ngẫu nhiên X và Y nhưng trong đó X và Y có tính đối xứng (tức là X phụ
thuộc vào Y thì Y cũng phụ thuộc vào X). Trong phần này ta cũng nghiên cứu mối liên
hệ tuyến tính giữa X và Y, trong đó X ảnh hưởng đến Y và Y được xem là phụ thuộc
vào X. Mối liên hệ giữa X và Y đã được xác định bằng một qui luật khách quan đã có.
Mục tiêu của phân tích hồi qui là mô hình hoá mối liên hệ bằng một mô hình toán học
nhằm thể hiện một cách tốt nhất mối liên hệ giữa X và Y.

Để bắt đầu, chúng ta hãy tìm hiểu các khái niệm cơ bản.
6.2.1. Mô hình hồi qui tuyến tính một chiều (tuyến tính đơn giản)
Ví dụ 6.1: Tìm hiểu mối liên hệ giữa chi tiêu (Y) và thu nhập sau khi trừ thuế của
hộ gia đình (X):

88
Với số liệu trên ta có nhận xét, tương ứng với mỗi mức thu nhập các hộ gia đình
sẽ có phản ứng khác nhau với mức thu nhập đó. Việc tìm ra mối liên hệ đó quả là khó
khăn, người ta đã đưa ra khái niệm kỳ vọng có điều kiện để xây dựng mối liên hệ này.
Tức là người ta xây dựng nên mối liên hệ giữa thu nhập ảnh hưởng như thế nào đến
mức chi tiêu trung bình.
Nếu ta biểu diễn các điểm (X, E(Y/Xi) lên hệ toạ độ, ta có đồ thị sau:
200
180
160
140
120
E(Y/Xi)
100
80
60
40
20
0
80 100 120 140 160 180 200 220 240 260
Với kết quả trên chúng ta nhận thấy rằng trung bình có điều kiện của Y sẽ phụ
thuộc vào các giá trị của X, do đó ta có thể biểu diễn như sau: E(Y/Xi) = f(Xi)
Hàm số này được gọi là hàm hồi qui tổng thể. Như vậy hồi qui là thể hiện mối
quan hệ trung bình của Y phụ thuộc vào X.
• Một vài khái niệm cần chú ý:
- Nếu f(Xi) là một hàm tuyến tính thì ta gọi là Hàm hồi qui tuyến tính:
E Y( / Xi ) = f X( i ) = + Xi hoặc

Y = f X( i )+ = +U  Xi +Ui

Nếu f là hàm 1 biến thì ta gọi là hàm Hồi qui tuyến tính đơn giản, nếu f là hàm
nhiều biến thì ta gọi là hàm Hồi qui tuyến tính bội.
- X, Y: được gọi là biến. Trong đó:
X được gọi là biến giải thích (độc lập).

Y: biến được giải thích (phụ thuộc).

- , được gọi là tham số của hồi qui. Trong đó:

89
: được gọi là tham số tự do hay tham số chặn.
: được gọi là tham số của biến.
Ui: là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên (nhiễu). Thành phần yếu
tố ngẫu nhiên có thể bao gồm:
▪ Các biến giải thích bị bỏ sót hay là các yếu tố khác mà ta chưa
xem xét.
▪ Sai số khi đo lường biến phụ thuộc.
▪ Tính ngẫu nhiên vốn có của biến phụ thuộc.
X, Y không có mối quan hệ hàm số mà là mối quan hệ nhân quả và thống kê,
trong đó X là nguyên nhân và Y là kết quả.

X, Y không có mối quan hệ hàm số mà là mối quan hệ thống kê, có nghĩa là


tương ứng với mỗi giá trị của X ta có ngẫu nhiên giá trị của Y.
Hồi qui tuyến tính được hiểu là hồi qui tuyến tính theo tham số, ta đang xem xét
trường hợp đặc biệt vừa tuyến tính với biến, vừa tuyến tính với tham số.
6.2.2. Phương trình hồi qui tuyến tính mẫu
Để mô toán học hoá mối liên hệ giữa X và Y tức là ta phải tìm được giá trị của
tham số hồi qui, và ta cũng chỉ có thể thực hiện được điều này thông qua các quan sát
mẫu.

Giả sử (xi, yi) là mẫu n cặp quan sát thu thập ngẫu nhiên từ X và Y. Ta mong
muốn tìm giá trị a, b để ước lượng cho các tham số , . Nói cách khác, ta mong muốn
tìm một đường thẳng y = a + bx “thích hợp” nhất đối với các giá trị (x i, yi). Đường
thẳng yˆ = +a bxđược xem là “thích hợp” nhất khi tổng bình phương các chênh lệch
ˆ
giữa giá trị thực tế yi với y i là nhỏ nhất. Sau đây là phương pháp bình phương bé nhất:
n n n

f a b( , ) = e i
2
= (yi − yˆi )2 =(yi − −abxi )2 → min
i=1 i=1 i=1

Từ điều kiện trên, ta xác định các hệ số a, b như sau:

 f a b(a, ) = 0

f a b( , ) = 0

 b
90
Giải hệ phương trình ta tìm được a, b:
n n

(x −x)(y −y) xy n − . .x y


i i ii

b= i=1 n = n
i=1
2 2 2

 
( xi − x ) ( xn − .x )
i
i =1 i =1

a= −y bx

Đường thẳng y a bxˆ = + i được gọi là đường hồi quy tuyến tính mẫu.

• Một số tính chất của phương pháp bình phương bé nhất:


(1) a, b được xác định là duy nhất tương ứng với mẫu.

(2) a, b là ước lượng điểm của , .


• yˆ = +a bxi có các tính chất sau:

(1) Đi qua trung bình mẫu (x, y),

(2) Trung bình của yˆi bằng trung bình của quan sát.

(3) Trung bình của các phần dư bằng 0:ei =0. Các phần dư không tương

quan với yˆi : y eˆi i = 0

(4) Các phần dư không tương quan với Xi :xei i = 0

• Với kết quả bình phương bé nhất chúng ta chỉ mới ước lượng điểm của
tham số hồi qui, chúng ta không biết được chất lượng của các ương lượng này
như thế nào, chất lượng ước lượng phụ thuộc vào nhiều nội dung như: + Dạng
hàm của mô hình hồi qui được lựa chọn.
+ Phụ thuộc vào Xi và Ui.

+ Phụ thuộc vào kích thước mẫu.


6.2.3. Khoảng tin câ ̣y của các hệ số hồi qui

- Ước lượng khoảng của  với độ tin cậy (1−)100% là:

b t− n−2, / 2 b S   + b tn−2, / 2Sb Trong

đó:

91
Sb2 = n Se2 =n Se2

(x − x)  x
i
2
i
2
−nx2
i=1 i=1

2  i=1 ei2 SEE


S
e = =
n−2 n−2

- Ước lượng khoảng của  với độ tin cậy (1−)100% là:


a t− n−2, / 2Sa   + a tn−2, / 2Sa Trong
đó:

2 Se2.(1n+n x ni2x−2 x2 )
Sa =
i=1

6.2.4. Kiểm định tham số hồi qui tổng thể ()


Kiểm định về mối quan hệ giữa X và Y. Trường hợp = 0 thì X và Y không có
mối quan hệ nào, trường hợp  0(  0) giữa X và Y có mối quan hệ thuận
(nghịch).
Ở mức ý nghĩa , giả thuyết H0 kiểm định ở các trường hợp sau:
0 0 0
H0 : H0 : H0 :=
Giả thuyết   

H1 : 0 H1 : 0 H1 : 0

Giá trị kiểm định b


t=
sb

Bác bỏ H0 t  tn−2, t −tn−2, t  tn−2,/2;t −tn−2,/2


6.2.5. Phân tích phương sai hồi qui
a) Hê ̣ số xác định: R2 là hệ số nhằm xác định mức độ quan hệ giữa X và Y có quan
hệ hay không, hoặc bao nhiêu phần trăm sự biến thiên của Y có thể giải thích bởi
sự phụ thuộc tuyến tính của Y vào X.
Giá trị thực tế yi = a + bxi + ei

Giá trị dự đoán theo phương trình hồi qui: y a bxˆ = + i  yi = +y eˆi

92
Vậy ei là sự khác biệt giữa giá trị thực tế với giá trị dự đoán của phương trình hồi
qui tuyến tính. Như vậy, ei thể hiện phần biến thiên của Y không thể giải thích bởi mối
liên hệ tuyến tính giữa Y và X.

Ta có: (yi − y)2 =(yˆi − y)2 +ei2 hay SST = SSR + SSE
* SSR càng lớn thì mô hình hồi qui tuyến tính càng có độ tin cậy cao trong việc
giải thích sự biến động của Y.

2
SSR
1 SSE là phần trăm biến động của Y được giải
* Hệ số xác định R = =−
SST SST
thích bởi mối quan hệ tuyến tính của Y vào X.
b) Phân tích phương sai:
Kiểm định giả thuyết về mối quan hệ tuyến tính giữa X và Y, tức là giả thuyết
H0: có sự tồn tại mối liên hệ tuyến tính giữa X và Y.
Bảng 6.1. ANOVA trong phân tích hồi qui tuyến đơn giản
Tổng độ lệch Giá trị kiểm
Biến thiên Bâ ̣c tự do Phương sai
bình phương định
SSR MSR
Hồi qui SSR 1 MSE= F=
1 MSE
SSE
Sai số SSE n-2 MSE=
n−2

Tổng cộng SST n-1

Qui tắc bác bỏ giả thuyết H0: F > F1,n-2,(trong đó F1,n-2 có phân phối F).

6.3. Mở rộng mô hình hồi qui 2 biến


Mô hình tuyến tính logarit:
Trong sản xuất, người ta thường xem xét lượng đầu ra phụ thuộc vào các yếu tố
đầu vào và người ta thường dùng mô hình hồi qui mũ như sau:
Y =X e U

Ta có thể viết lại như sau: lnY = ln + ln X +U


Nếu đặt Y* = lnYi, * = ln , X * = ln Xi khi đó ta có thể viết lại dưới dạng tuyến tính đơn
giản: Y * = + * X * +U . Mô hình này được gọi tên là log – log hoặc log kép. Với hệ số
co giản chính là.
93
6.4. Hồi qui tuyến tính bội
6.4.1. Mô hình hồi bội

Giả sử Y phụ thuộc vào k biến độc lập X1....Xk. Nếu giá trị của k biến độc lập
X1....Xk mô hình hồi qui bội dưới dạng tuyến tính sau:

Y = +  1X1 + 2 X2 + +... k X k +U

j : được gọi là các hệ số hồi qui riêng, thể hiện mức độ biến thiên Y khi biến X j
thay đổi một đơn vị, các biến còn lại không đổi.

U: là sai số. Tương tự như đối với hồi qui đơn giản.
6.4.2. Phương trình hồi qui bội của mẫu

Gọi các hệ số a, b1,.... bk ước lượng cho , 1,...,k được xác định bởi phương
pháp bình phương bé nhất:
n

f =(yi − −ab x1 1i − −... b xkki )2 → min


i=1

Từ điều kiện trên ta có hệ:


  =f / a0


  =f / b1
...

  =f / bK0

Giải hệ phương trình ta sẽ tìm được nghiệm (a, b1,..., bk)

Phương trình yˆ = a + b1 1x + ... + b xk k được gọi là phương trình hồi qui bội của
mẫu.
Chúng ta cũng có thể tìm được nghiệm (a, b1,..., bk) bằng phương pháp ma trận,
tuy nhiên dù phương pháp nào đi nữa thì việc tìm nghiệm bằng phương pháp thủ công
là rất phức tạp. Với công nghệ máy tính phát triển, các phần mền thống kê được phát
triển thì việc tìm nghiệm trở nên dễ dàng hơn. Chính vì vậy, chúng ta không nên quá
quan tâm đến việc tìm nghiệp bằng phương pháp thủ công như thế nào.

Tương tự như đối với hồi qui tuyến tính đơn giản, phương pháp bình
phương bé nhất phải thoả mãn 5 điều kiện, ngoài ra còn phải thoả mãn thêm điều
kiện:

- U có phân phối chuẩn N(0,2 ) ; - Các biến Xj độc lập với nhau.
94
6.4.3. Khoảng tin câ ̣y của các hệ số hồi qui Mô
hình hồi qui bội có dạng:

Y = +  1X1 + 2 X2 + +... k X k +U

Tương tự như đối với hồi qui đơn giản, ước lượng khoảng của các hệ số như sau:

- Ước lượng khoảng của i với độ tin cậy (1−)100%là:

bi −tn k− −1,/2Sbi   +i


tn k− −1,/2Sbi

- Ước lượng khoảng của  với độ tin cậy (1−)100% là:

a−tn k− −1,/2Sa   + a tn k− −1,/2Sa

6.4.4. Kiểm định từng tham số hồi qui tổng thể (i )

Tương tự như đối với kiểm định của hồi qui đơn giản.

Trường hợp i =0 thì Xi và Y không có mối quan hệ nào, trường hợp i >0 (i <0)
giữa Xi và Y có mối quan hệ thuận (nghịch).

Ở mức ý nghĩa , giả thuyết H0 kiểm định ở các trường hợp sau:
0 0 0
H0 :i  H0 :i  H0 :i =
Giả thuyết   
H1 :i  0 H1 :i  0 H1 :i  0
b
Giá trị kiểm
t=
định
sb
t t
t  tn k− −1, t −tn k− −1,
t  n k− −1,/2;t − n k− −1,/2
Bác bỏ H0
Đây là một phương pháp xây dựng mô hình hồi qui, được gọi là phương pháp
loại biến dần. Chúng ta sẽ loại từng biến một dựa vào giá trị p kiểm định lớn ra trước.
6.4.5. Phân tích phương sai hồi qui
a) Hê ̣ số xác định:

Tương tự như đối với Hồi qui đơn giản, ta có


SSR 1 SSE
2

* Hệ số xác định R = =−
SST SST

95
Nhưng ở đây, hệ số R2 là nói lên tính chặt chẽ giữa biến phụ thuộc Y và các biến
độc lập Xi, tức là nó thể hiện phần trăm biến thiên của Y có thể được giải thích bởi sự
biến thiên của tất cả các biến Xi.
Đối với người nghiên cứu thì họ mong muốn hệ số R 2 càng lớn càng tốt, tuy
nhiên R2 là một hàm không giảm theo số lượng biến đưa vào. Điều này có thể dẫn đến
một trò chơi về số R2 bằng cách đưa vào mô hình càng nhiều biến để có hệ số R 2 lớn.
Để khắc phục nhược điểm này, người ta đưa ra hệ số xác định điều chỉnh đánh giá
mức độ phụ thuộc của Y vào các biến X chính xác hơn.
* Hệ số xác định đã điều chỉnh:

R2 = SSR n k/ ( − −1) = − −1 (1 R2)(


n−1 ) SST n/ ( −1) n k− −1

Xét về mặt ý nghĩa thì giữa R 2 và R2 là như nhau, thông thường thì hai hệ số này
chênh lệch nhau không nhiều. Trong một số trường hợp số lượng biến X tương đối lớn
so với n, khi đó ta nên dùng hệ số xác định có điều chỉnh để đo lường mức độ thích
hợp của mô hình hồi qui bội.

Đây cũng là một phương pháp xây dựng mô hình hồi qui, được gọi là phương
pháp đưa biến vào dần. Chúng ta sẽ đưa lần lượt các biến có trị tuyệt đối hệ số tương
quan ry,xi lớn vào trước, nếu R2 tăng lên thì ta chấp nhận biến, còn ngược lại thì ta loại
ra và kết thúc quá trình.
b) Phân tích ANOVA hồi qui bôị :

Đặt giả thuyết: H0 : 1 = = =2... k

H1: Không phải tất cả i = 0

Bảng 6.2. ANOVA trong phân tích hồi qui tuyến tính bội:
Tổng độ
Giá trị kiểm
Biến thiên lệch bình Bâ ̣c tự do Phương sai
định
phương
SSR MSR
Hồi qui SSR k MSR= F=
k MSE
SSE
Sai số SSE n-(k+1) MSE=
n k− +( 1)

Tổng cộng SST n-1

Qui tắc bác bỏ giả thuyết H0 : F  Fk n k, − −1,, trong đó Fk n k, − −1 có phân phối F.


96
* Trong trường hợp ta đã có hệ số xác định R2 giá trị kiểm định được tính bởi
công thức sau:
n k− −1 R2
.
F=k 1− 2

R
Ví dụ 6.2: Tốc độ phát triển nền kinh tế (Y) phụ thuộc vào tốc độ phát triển của
nông nghiệp (X1), tốc độ tăng trưởng của kim ngạch xuất khẩu (X 2) và tỷ lệ lạm phát
(X3) được thu thập ở 48 nước dưới đây:
Y NN XK LP Y NN XK LP
1,3 3,4 -2,7 13,0 4,1 2,3 8,7 9,5
1,0 1,4 -6,0 10,5 -5,0 1,2 -2,0 1,1
0,4 0,1 -3,6 15,9 2,1 2,7 5,6 11,2
4,9 1,8 13,6 3,2 7,7 3,0 2,0 8,9
9,8 5,6 27,3 5,4 9,3 3,3 6,2 7,5
-2,1 2,2 2,6 5,2 -1,7 2,0 -1,7 18,2
2,0 2,3 -9,5 8,7 5,8 4,7 -0,2 2,1
5,8 3,0 4,4 1,4 3,9 -3,9 -2,5 3,4
5,2 2,9 9,2 3,0 5,6 3,9 6,4 13,9
-1,1 -2,3 -6,3 14,9 6,9 1,3 11,6 6,4
0,2 0,3 12,0 20,3 -4,6 0,8 -9,8 21,5
1,1 1,4 -7,2 19,8 -2,6 1,7 -6,6 6,7
-12,0 4,8 -5,5 8,6 1,1 3,9 3,8 7,7
-1,6 -0,4 -2,5 11,3 4,6 3,0 -3,5 8,6
0,5 1,9 1,6 19,0 -0,6 2,5 2,0 11,5
2,2 -3,5 4,7 1,9 8,2 1,9 3,8 7,8
8,0 3,1 10,9 37,3 4,1 0,9 1,3 5,6
6,5 3,3 -0,6 8,9 12,6 7,9 11,7 3,8
0,2 0,1 8,4 29,5 4,1 2,8 -0,9 9,9
7,8 5,3 10,4 8,1 0,6 2,8 -2,1 23,3
2,5 2,3 4,9 22,6 2,0 0,5 -3,1 33,5
-0,2 3,1 7,9 20,2 0,0 0,4 6,9 32,6
6,1 10,3 -19,0 -1,3 -2,6 -1,3 3,4 7,7
2,9 -0,6 5,4 7,5 -3,4 7,9 -7,9 45,4

97
Kết quả xử lý của Excel như sau:

Regression Statistics

Multiple R 0,6088296 R Square 0,3706735


Adjusted R Square 0,3277648
Standard Error 3,6899289 Observations 48

R2 = 0,37 có nghĩa là 37% sự biến thiên của tốc độ phát triển kinh tế có thể được
giải thích từ mối liên hệ tuyến tính giữa tốc độ phát triển kinh tế với tốc độ biến thiên
của nông nghiệp, xuất khẩu và lạm phát.
ANOVA
df SS MS F Significance F

Regression 3 352,8613631 117,6205 8,63867 0,000127635


Residual 44 599,0853036 13,61558 Total 47
951,9466667

Với giá trị p = 0,0001 là rất nhỏ, ta có thể bác bỏ giả thuyết H 0, có nghĩa là có tồn
tại mối liên hệ tuyến tính giữa tốc độ phát triển kinh tế với ít nhất một trong các yếu tố:
nông nghiệp, xuất khẩu và lạm phát.
Standard t Stat P-value Lower Upper
Coeffi-
cients Error 95% 95%
Intercept 2,033019 0,993121 2,0471 0,046649 0,031514 4,034525
NN 0,500738 0,205653 2,434859 0,019021 0,086269 0,915206
XK 0,268085 0,068954 3,887867 0,000337 0,129117 0,407054
LP -0,10474 0,053080 -1,97337 0,054755 -0,21172 0,002229
Phương trình hồi qui bội:
yˆ = 2,033 + 0,5007xi + 0,268x2 − 0,1047x3

Từ phương trình hồi qui bội ta có nhận xét:

- Nếu tốc độ tăng trưởng của xuất khẩu và lạm phát không đổi, 1% tăng trưởng
nông nghiệp sẽ làm tăng 0,5007% tăng trưởng của nền kinh tế.

- Nếu tốc độ tăng trưởng của nông nghiệp và lạm phát không đổi, 1% tăng trưởng
xuất khẩu sẽ làm tăng 0,268% tăng trưởng của nền kinh tế.

98
- Nếu tốc độ tăng trưởng của nông nghiệp và xuất khẩu không đổi, tỷ lệ lạm phát
tăng 1% sẽ làm cho nền kinh tế giảm 0,1047%.
- Nếu tốc độ tăng trưởng của nông nghiệp, xuất khẩu, lạm phát bằng 0 thì nền nền
kinh tế tăng trưởng 2,033%.

Tóm lại, hồi qui tuyến tính là một nội dung rất rộng và sâu, được ứng dụng trong
nhiều lĩnh vực. Tuy nhiên để hiểu một cách đầy đủ thì trong phạm vi của môn học
không thể trình bày đầy đủ được mà sự mở rộng này thuộc phạm vi của một môn học
khác đó là Kinh tế lượng. Chính vì vậy, ở đây chỉ giớii thiệu mang tính chất nhập môn
không đi sâu về mặt lý thuyết và kỹ thuật.

BÀI TẬP

Bài 1. Theo dõi mức lãi suất (Y) và tỷ lệ lạm phát (X) ở một số nước ta có số liệu sau:
Y 17,5 15,6 9,8 5,3 7,9 10 19,2 13,1

X 14,2 11,7 6,4 2,1 4,8 8,1 15,4 9,8


a) Tính hệ sô tương qua mẫu
b) Xây dựng phương trình hồi quy mẫu
c) Ước lượng sai số hồi quy
d) Dự báo giá trị của mức lãi suất nếu tỷ lệ lạm phát là 22,5.

Bài 2. Điều tra mức thu nhập (X) và chỉ tiêu (Y) cho những nhu yếu phẩm của cá nhân
ta có bảng số liệu sau (đơn vị: triệu đồng)

Y 0,5 0,8 1,0


X

1,5 4 3 0

2,0 6 2 1

2,5 2 5 2

3,0 1 1 4
a) Tính hệ số tương qua mẫu
b) Xây dựng phương trình hồi quy mẫu
c) Ước lượng sai số hồi quy
d) Dự báo giá trị của Y khi mức thu nhập X là 4,0 triệu đồng.

99
Bài 3. Giả sử có số lệu thống kê về lãi suất ngân hàng và tổng vốn đầu tư trên địa bàn
tỉnh A qua 5 năm liên tiếp như sau:
Lãi suất ngân hàng (%) 10 13 15 18 20

Tổng vốn đầu tư (tỉ đồng) 50 48 40 37 35


a) Hãy ước lượng hàm hồi quy tuyến tính của tổng đầu tư theo lãi suất ngân hàng
và nêu ý nghĩa của các hệ số hồi quy tìm được.
b) Tính hệ số xác định mô hình và giải thích ý nghĩa
c) Tìm khoảng tin cậy của hệ số hồi quy tổng thể 2 với độ tin cậy 95%.
d) Dự báo giá trị trung bình cảu tổng vốn đầu tư khi lãi suất ngân hàng là 13%, với
độ tin cậy 95%. Giải thích kết quả tìm được.
e) Với mức ý nghĩa 5%, hãy cho biết lãi suất ngân hàng có ảnh hưởng đến tổng
vốn đầu tư không?
f) Viết hàm hồi quy khi đơn vị tính của tổng vốn đầu tư là triệu đồng.
Bài 4. Khảo sát sự liên hệ giữa sản lượng (Y: đơn vị tấn/ha) theo phân bón hóa học
(X2: đơn vị tấn/ha) và thuốc trừ sâu (X3: đơn vị lít/ha) bằng cách dựa vào kết quả của
mô hình hồi qui bội được cho như sau:

a. Viết hàm SRF. Giải thích ý nghĩa các hệ số hồi quy.


b. Phân hóa học có ảnh hưởng đến sản lượng hay không? Kết luận với mức ý
nghĩa 5%.

c. Mô hình trên có phù hợp hay không? Kết luận với mức ý nghĩa 5%.
d. Mô hình trên có xảy ra hiện tượng tự tương quan hay không?
100
e. Dự báo (điểm) giá trị trung bình của sản lượng khi phân hóa học là 20 tấn/ha
và thuốc trừ sâu 16 lít/ha.
Bài 5. Người ta cho rằng chi tiêu cho mặt hàng A (Y: ngàn đồng/tháng) không chỉ phụ
thuộc vào thu nhập của người tiêu dùng (X: triệu đồng/tháng) mà còn phụ thuộc vào
giới tính của người đó (D=1 nếu là nam; D=0 nếu là nữ). Với số liệu của một mẫu có
kích thước n=20 người ta đã ước lượng mô hình sau:

Y = 96,458+38,92X −8,415D−6,525XD se =
(33,328) (11,312) (4,207) (1,812)
a. Hãy nêu ý nghĩa của các hệ số hồi quy.
b. Hãy ước lượng các hệ số hồi quy, với độ tin cậy 95%.
c. Chi tiêu về loại hàng A của nam và nữ có giống nhau hay không? Kết luận với
mức ý nghĩa 1%.

101
CHƯƠNG 7
CHỈ SỐ
Để giải thích sự thay đổi của các hiện tượng, sự việc đang nghiên cứu, các nhà
thống kê sử dụng chỉ số để tìm hiểu các nguyên ngân dẫn đến biến động. Phương pháp
này thường được sử dụng cho các vấn đề kinh tế, xã hội khi có sự biến động đáng kể
của các hiện tượng.

7.1. Khái niệm


Chỉ số là phương pháp thống kê được dùng để phân tích biến động của hiện
tượng qua thời gian hoặc không gian và tìm kiếm các nguyên nhân ảnh hưởng đến hiện
tượng nghiên cứu.
Chỉ số là một số tương đối đặc biệt nghiên cứu sự biến động của hiện tượng qua
thời gian, không gian và kế hoạch.

Chỉ số = số tương đối đặc biệt

+ Số tương đối động thái → chỉ số phát triển;

+ Số tương đối kế hoạch → chỉ số kế hoạch (CS nhiệm vụ KH và CS hoàn thành


KH);

+ Số tương đối kết cấu;

+ Số tương đối không gian → chỉ số không gian;

+ Số tương đối cường độ.

Ví dụ 7.1: Có tài liệu thống kê về tình hình bán hàng của một doanh nghiệp như sau:

Đơn vị Giá bán lẻ (1.000đ) Lượng hàng hoá tiêu thụ
Tên hàng
tính Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Gạo Kg 15 20 1.000 1.400
Nước mắm Lít 40 50 2.000 1.600
Vải Mét 100 80 5.000 5.500
Yêu cầu:
a) Lượng bán ra của từng mặt hàng kỳ báo cáo so với kỳ gốc tăng hay giảm?
b) Giá bán ra của từng mặt hàng kỳ báo cáo so với kỳ gốc tăng hay giảm?

c) Lượng bán ra chung của 3 mặt hàng kỳ báo cáo so với kỳ gốc tăng hay giảm?

102
7.2. Đặc điểm chỉ số
- Chỉ số khi nghiên cứu sự biến động của những hiện tượng phức tạp bao gồm
những phần tử không trực tiếp cộng được, phương pháp chỉ số biến đổi chúng thành
những phần tử cộng được.

- Khi nghiên cứu biến động của một nhân tố phương pháp chỉ số giả định các
nhân tố khác còn lại không đổi.

7.3. Các loại chỉ số


a) Căn cứ vào phạm vi tính toán:

- Chỉ số cá thể (i): phản ánh biến động của từng đơn vị (phần tử cá biệt)
trong tổng thể nghiên cứu qua thời gian hoặc không gian khác nhau.

Ví dụ: chỉ số biến động giá cả của từng mặt hàng trên thị trường,…

- Chỉ số chung (I): phản ánh biến động của tất cả các đơn vị (các phần tử)
của tổng thể nghiên cứu.

- Ví dụ: chỉ số biến động giá cả thị trường của tất cả các mặt hàng thiết

yếu,… b) Căn cứ vào tính chất của chỉ tiêu nghiên cứu:

- Chỉ số của chỉ tiêu số lượng: Số lượng SP (q), số công nhân (T), diện tích
đất,...

- Chỉ số của chỉ tiêu chất lượng: đơn giá (p), giá thành (Z), năng suất lao
động
(w), tiền lương (f)

7.4. Phương pháp tính chỉ số


7.4.1. Chỉ số cá thể (i)

Gọi: 0: kỳ gốc (tháng trước, quí trước, năm trước)

1: kỳ báo cáo (tháng này, quí này, năm này)

* Chỉ số các thể về giá (ip)

p1 *100
ip =
p0
Lượng tăng (giảm) tuyệt đối:  = −p
p0
* Chỉ số các thể về số lượng (iq) q1 *100

103
iq =
q0
Lượng tăng (giảm) tuyệt đối:  = −q
q0

7.4.2. Chỉ số chung (I)


* Chỉ số chung về giá (Ip):

I p =  p1q1 *100

 pq 0 1

Tổng doanh thu tăng (giảm) do giá bán tăng (giảm):

M p = p1q1 − p0q1
Ví dụ 7.2: Chỉ số chung về giá của 3 mặt hàng:

Đơn vị Giá bán lẻ (1.000đ) Lượng hàng hoá tiêu thụ
Tên hàng
tính Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Gạo Kg 5 6 1.000 1.400
Nước mắm Lít 4 3 2.000 1.600
Vải Mét 20 18 500 550
Yêu cầu:

a) Giá bán ra chung của 3 mặt hàng kỳ báo cáo so với kỳ gốc tăng hay giảm?

b) Lượng bán ra chung của 3 mặt hàng kỳ báo cáo so với kỳ gốc tăng hay giảm?

Ip = 6*1400+3*1600+18*550 *100 = 95%


5*1400 + 4*1600 + 20*550
Lượng: M p = 23100−24400=−1300 (1.000đ)

Nhận xét: Giá bán ra chung của 3 mặt hàng tháng 2 so với tháng 1 giảm 5% làm cho
doanh thu tiêu thụ hàng hóa giảm 1.300.000 đồng.
* Chỉ số chung về sản lượng (Iq):

Iq =  p0q1 *100

 pq 0 0

Tổng doanh thu tăng (giảm) do lượng bán tăng (giảm):

M q = p0q1 − p0q0

104
- Đại lượng giống nhau ở tử và mẫu trong chỉ số gọi là quyền số.
- Nếu quyền số là chỉ tiêu chất lượng được lấy ở kỳ gốc. Nếu quyền số là
chỉ tiêu số lượng được lấy ở kỳ báo cáo.
Ví dụ 7.3: Tính chỉ số chung về lượng bán ra của 3 mặt hàng

Iq = *100=106%

Lượng: p = 24400 − 23000 =1400 (1.000 đồng) Nhận xét: Sản lượng tiêu
thụ tính chung cho 3 mặt hàng tháng 2 so với tháng 1 tăng 6% làm cho doanh thu tiêu
thụ tăng 1400 (ngàn đồng).

 p q − p q = 23100 − 23000 =100 (1.000 đồng)


1 1 0 0

* Chỉ số chung về doanh thu:

I M =  p1q1

 pq 0 0

Lượng tăng (giảm) tuyệt đối:

 p q − p q
1 1 0 0

Ví dụ 7.4: Chỉ số chung về mức tiêu thụ hàng hóa:

 pq 23100
IM = 1 1
= =1,004 =100,4% (tăng 0,4%)

 pq 0 0 23000
23100 – 23000 = 100 (1.000 đồng)
Doanh thu ở kỳ gốc tăng 0,4% hay 100 nghìn đồng.
7.5. Hệ thống chỉ số
7.5.1. Khái niệm
- Phản ánh mối quan hệ giữa các chỉ số.
- Cơ sở để thành lập hệ thống chỉ số là dựa vào phương trình kinh tế.
Ví dụ 7.5: Từ kết quả ví dụ trên, DT = Giá bán * số lượng
IM = IP * Iq
1,004 = 0,95 * 1,06
Tổng tiền lương = Tiền lương bq 1 CN * số CN
IF = If * IT
7.5.2. Ý nghĩa – tác dụng

105
- Phân tích biến động của một nhân tố do ảnh hưởng của một nhân tố khác
có liên quan.
- Tính một chỉ số chưa biết khi đã biết số liệu về các chỉ số còn lại trong hệ
thống chỉ số.
7.5.3. Hệ thống chỉ số của các chỉ tiêu có liên hệ với nhau
Công thức kinh tế: DT = Giá bán * số lượng
- Hệ thống chỉ số phân tích biến động doanh thu do biến động của giá bán
và số lượng bán:
IM = IP * Iq

 pq = pq * pq
1 0 1 1 0 1

 pq  pq  pq
0 0 0 1 0 0

- Chênh lệch tuyệt đối:

p q −p q =(p q −p q )+(p q −p q )


1 1 0 0 1 1 0 1 0 1 0 0

(1) (2) + (3)


- Ảnh hưởng tăng (giảm) tương đối:
(1) (2) (3)
= +
 pq  pq  pq
0 0 0 0 0 0

Ví dụ 7.6: Phân tích biến động DT do biến động của p, q (Ví dụ trên)

Đơn vị Giá bán lẻ (1.000đ) Lượng hàng hoá tiêu thụ
Tên hàng
tính Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Gạo Kg 5 6 1.000 1.400
Nước mắm Lít 4 3 2.000 1.600
Vải Mét 20 18 500 550
- Xây dựng hệ thống chỉ số:

 p q =  p q *  p q = 23100 = 23100 * 24400


1 1 1 1 0 1

 pq  pq  pq
0 0 0 1 0 0 23000 24400 23000

1,0043 = 0,9467 *1,0609


- Chênh lệch tuyệt đối (đvt: 1.000 đồng):

106
23100− 23000 = (23100− 24400)+ (24400−
23000)
100 = −( 1300)+1400
(1) (2) (3)
- Ảnh hưởng tăng (giảm) tương đối:

= +
0,0043 = (−0,0565) + 0,0608
0,43% =−5,65% + 6,08%
Nhận xét: DT kỳ báo cáo so với kỳ gốc tăng 0,43% hay tăng 100 (1.000 đồng) do
ảnh hưởng của 2 nhân tố sau:

- Do giá bán của 3 mặt hàng kỳ báo cáo so với kỳ gốc giảm 5,65% làm cho
doanh thu giảm 5,65% hay giảm 1.300 (1.000đ)
- Do số lượng bán kỳ báo cáo so với kỳ gốc tăng 6,08% làm cho DT tăng
6,08% hay tăng 1.400 (1.000đ).

BÀI TẬP

Bài 1: Thống kê về giá bán lẻ và lượng hàng hoá tiêu thụ một số mặt hàng chủ yếu tại
TP.Rạch Giá như sau:
Giá bán lẻ (1.000đ) Lượng hàng hoá tiêu thụ
Tên hàng Đơn vị tính
Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Áo Cái 120 110 14.000 16.000
Quần Cái 150 160 12.000 14.000
Nón Cái 50 40 9.000 10.000

Yêu cầu:
1. Tính chỉ số đơn về giá cả và lượng hàng hoá tiêu thụ từng mặt hàng 2.
Tính chỉ số chung về giá cả và lượng hàng hoá tiêu dùng?
3. Phân tích biến động doanh thu do ảnh hưởng của giá bán và lượng bán?

Bài 2:
Thống kê về giá bán lẻ và lượng hàng hoá tiêu thụ một số mặt hàng chủ yếu tại Cửa
hàng 2KT như sau:
Giá bán lẻ (1.000đ) Lượng hàng hoá tiêu thụ
Tên hàng Đơn vị tính
Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Sách bài tập Cuốn 20 25 1.400 1.600
Sách giáo trình Cuốn 30 28 1.200 1.400
Viết Cây 3 4 900 1.000
107
Yêu cầu:
1. Tính chỉ số đơn về giá cả và lượng hàng hoá tiêu thụ từng mặt hàng
2. Tính chỉ số chung về giá cả và lượng hàng hoá tiêu dùng? Số tiền tiết kiệm (hay
chi thêm) của người mua hàng do sự thay đổi giá cả và lượng hàng mua vào 3.
Phân tích biến động doanh thu do ảnh hưởng của giá bán và lượng bán
Bài 3: Thống kê về giá bán lẻ và lượng hàng hoá tiêu thụ một số mặt hàng chủ yếu tại
TP. Rạch Giá như sau:
Giá bán lẻ (1000đ) Lượng hàng hoá tiêu thụ
Tên hàng Đơn vị tính
Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Áo Cái 120 110 14.000 16.000
Quần Cái 150 160 12.000 14.000
Nón Cái 50 40 9.000 10.000
Yêu cầu:
1. Tính chỉ số đơn về giá cả và lượng hàng hoá tiêu thụ từng mặt hàng
2. Tính chỉ số chung về giá cả và lượng hàng hoá tiêu dùng? Số tiền tiết
kiệm (hay chi thêm) của người mua hàng do sự thay đổi giá cả và lượng hàng mua
vào 3. Phân tích biến động doanh thu do ảnh hưởng của giá bán và lượng bán Bài
4:
Một nhà máy may có 3 phân xưởng may. Tài liệu về mức tiền lương và số công nhân
may của các phân xưởng qua 2 thời kỳ như sau:
Mức lương (1.000đ/người) Số công nhân (người)
Phân xưởng
Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo
Số 1 3.000 3.300 120 160
Số 2 3.600 3.800 150 140
Số 3 4.200 4.000 110 130
Yêu cầu:
1. Hãy sử dụng phương pháp hệ thống chỉ số phân tích biến động Tổng mức tiền
lương của công nhân may cả nhà máy qua 2 thời kỳ? (có sử dụng chỉ tiêu mức
lương bình quân 1 công nhân)
2. Phân tích biến động tiền lương bình quân 1 công nhân của nhà máy do ảnh
hưởng của 2 nhân tố: tiền lương bình quân 1 công nhân và kết cấu công nhân?

Bài 5:
Có số liệu về tình hình sản xuất của 1 doanh nghiệp 2 quý đầu năm 2015 như sau:
Chi phí sản xuất (triệu đồng) Tỷ lệ tăng, giảm khối lượng
Tên sản phẩm
Quý 1 Quý 2 sản phẩm quý 2 so quý 1
A 1.062,60 1.133,25 +5,5%
B 475,10 552,60 +3,7%
C 687,30 650,40 -1,5%
Yêu cầu:
1. Tính chỉ số khối lượng sản phẩm chung cho cả 3 loại sản phẩm?
2. Phân tính biến động Tổng chi phí sản xuất do ảnh hưởng của 2 nhân
tố: giá thành và khối lượng sản phẩm tiêu thụ? Bài 6:
108
Tài liệu về một thị trường như sau:
Năm 2014 Năm 2015
Tên
Giá thành Sản lượng Giá thành Sản lượng
hàng
(1.000đ (cái) (1.000đ (cái)
A 100 200 95 600
B 110 350 105 200
C 110 450 105 200
Yêu cầu:
1. Tính tốc độ tăng của sản lượng từng mặt hàng qua 2 năm
2. Tính chỉ số chung về giá thành
3. Phân tích các nhân tố ảnh hưởng đến sự biến động của giá
thành bình quân năm 2015 so với năm 2014. Bài 7:
Tài liệu về tình hình sản xuất tại 1 DNTN như sau:

Giá thành đơn vị sản phẩm


Tên Chi phí sản xuất kỳ
(nghìn đồng)
hàng nghiên cứu (nghìn đồng)
Kỳ gốc Kỳ nghiên cứu
A 280.000 6,00 5,60
B 155.600 7,20 6,30
C 740.000 9,50 7,08
D 97.900 7,00 6,07

Cho biết thêm: Tổng chi phí sản xuất (chung cho cả 4 sản phẩm) kỳ gốc là
997.000 nghìn đồng. Hãy tính:
1. Chỉ số chung về giá thành?
2. Chỉ số chung về khối lượng sản phẩm?
3. Phân tích các nhân tố ảnh hưởng đến sự biến động tổng cho phí qua 2 kỳ?
Bài 8: Tài liệu về một thị trường như sau:

Mức tiêu thụ hàng hoá (tr.đ) Tỷ lệ giảm giá hàng so


Tên hàng
Kỳ gốc Kỳ nghiên cứu với kỳ gốc (%)
AB 48.000 49.050 -2,5
49.300 50.488 -3,6
C 37.700 36.940 -5,3
Yêu cầu:
1. Tính các chỉ số chung theo thứ tự sau: Ip, Ipq, I q
2. Tính các chỉ số chung theo thứ tự sau: Ip, I q, Ipq
3. Phân tích các nhân tố ảnh hưởng đến sự biến động tổng mức tiêu thụ
hàng hoá?
Bài 9: Tài liệu về một thị trường như sau:
Chi phí sản xuất (triệu đồng) Tỷ lệ giảm sản lượng
Tên hàng T1 T2 tháng 2 so với tháng 1
(%)
109
A 36.000 37.050 -2,5
B 39.300 40.488 -3,6
Yêu cầu:
1. Tính các chỉ số chung theo thứ tự sau: Iq, Izq, Iz
2. Tính các chỉ số chung theo thứ tự sau: Izq, Iz, Iq.
3. Phân tích các nhân tố ảnh hưởng đến sự biến động tổng chi phí sản xuất.

Bài 10: Có số liệu thu thập được từ 3 xã như sau:

Năm 2014 Năm 2015


Tên xã Năng suất lúa Diện tích Năng suất lúa Diện tích
(tạ/ha) (ha) (tạ/ha) (ha)
A 40 100 39 150
B 35 110 37 120
C 31 120 34 130
1. Tính các chỉ số chung về năng suất và diện tích?
2. Phân tích các nhân tố ảnh hưởng đến biến động năng suất lúa bình quân
qua 2 năm.

Bài 11: Tài liệu về một xí nghiệp như sau:


Số lượng sản phẩm sản
Loại sản Giá thành một tấn (triệu đồng)
xuất (tấn)
xuất Năm 2014 Năm 2015 Năm 2014 Năm 2015
Loại I 15 12 50 150
Loại II 10 8 150 100
Bài 12: Có số liệu về tình hình sản xuất của một xí nghiệp trong 6 tháng đầu năm 2016
như sau:
Quý I Quý II
Phân
Năng suất % hoàn thành Số lao Giá tri sản % hoàn thành Số lao
xưởng
lao động kế hoạch về động xuất kế kế hoạch về động
thực tế giá trị sản trung hoạch giá trị sản trung bình
(Triệu đồng) xuất bình xuất
(Triệu đồng)
A 4,1 108 400 1.710 105 450
B 5,0 110 120 780 98 150
C 4.5 95 480 2.070 104 460
Yêu cầu:
1. Tính năng suất lao động (NSLĐ) bình quân một lao động trong quí I và giá trị
sản xuất (GTSX) bình quân 1 lao động trong quý II?
2. Xác định tỷ lệ % hoàn thành kế hoạch bình quân về GTSX của xí nghiệp trong
quí II năm 2016.

110
3. Phân tích sự biến động của NSLĐ trung bình một lao động giữa hai quí do ảnh
hưởng biến động của bản thân NSLĐ và sự thay đổi về kết cấu lao động giữa
các phân xưởng.
Bài 13: Có tài liệu về tình hình thu hoạch lúa trong năm vừa qua ở ba hợp tác xã như
sau:
Vụ Chiêm Vụ Mùa
Hợp tác xã Năng suất Sản lượng Diện tích gieo Năng suất
(Tạ/Ha) (Tấn) trồng (Ha) (Tạ/Ha)
Quyết Thắng 44 2288 530 43
Đông Cường 48 2688 550 46
Nam Cường 46 1150 220 48
Yêu cầu:
1. Tính năng suất lúa trung bình vụ chiêm của cả ba hợp tác xã.
2. Xác định tốc độ tăng về diện tích gieo trồng và về sản lượng thu hoạch vụ mùa
so với vụ chiêm của cả ba hợp tác xã.
3. Phân tích sự biến động của năng suất thu hoạch trung bình vụ mùa so với vụ
chiêm do ảnh hưởng của hai nhân tố: Năng suất thu hoạch của từng hợp tác xã
và kết cấu diện tích gieo trồng.
Bài 14: Có số liệu thu thập được từ 3 xã như sau:
Năm 2014 Năm 2015
Tên xã Năng suất lúa Diện tích Năng suất lúa Diện tích
(tạ/ha) (ha) (tạ/ha) (ha)
A 40 100 39 150
B 35 110 37 120
C 31 120 34 130
1. Tính các chỉ số chung về năng suất và diện tích?
2. Phân tích các nhân tố ảnh hưởng đến biến động sản lượng
lúa của các xã qua 2 năm. Bài 15:
Có tài liệu về chi phí sản xuất trong tháng 12/2015 của một xí nghiệp như sau:
Các khoản chi phí Kế hoạch Thực tế
Nguyên, nhiên, vật liệu 1.000 1.400
Khấu hao TSCĐ 100 130
Tiền lương 600 900
Quản lý xí nghiệp 300 450
Cộng 2.000 2.880
Biết thêm rằng, sản lượng kế hoạch là 200 tấn, và thực hiện là 300 tấn.
Yêu cầu:
1. Tính số tương đối hoàn thành kế hoạch về giá thành giảm giá thành đơn vị sản
phẩm của xí nghiệp?
2. Chỉ rõ các nguyên nhân chính đã làm cho giá thành thực tế đơn vị sản phẩm
giảm so với kế hoạch? Bài 16:

111
Có số liệu về tình hình sản xuất của một công ty như sau: Tổng chi phí sản xuất của 4
sản phẩm A, B, C, D năm 2015 so 2014 tăng 40%; mức tăng tuyệt đối là 400 triệu
đồng.
Chỉ số giá thành chung của 4 sản phẩm trên là: 106%.
Yêu cầu:
1. Xác định tổng chi phí sản xuất năm 2015 và 2016?
2. Phân tích sự thay đổi tổng chi phí sản xuất năm 2016 so 2015 do ảnh
hưởng của các nhân tố liên quan. Cho nhận xét?
Bài 17:
Nhà máy B chuyên sản xuất loại sản phẩm X. Năm 2015, nhà máy phấn đấu hạ giá
thành sản phẩm là 2,5% và nâng cao sản lượng lên 10% so với năm 2014. Kết thúc
năm 2015, nhà máy hoàn thành vượt mức kế hoạch hạ giá thành 2% và vượt mức sản
lượng 6%.
Yêu cầu:
1. Xác định biến động giá thành và biến
động sản lượng năm 2015 so 2014?
2. Chi phí sản xuất năm 2015 so với
2014? Bài 18:
Có số liệu về tình tình sản xuất của một công ty trong quý III và IV năm 2015 như sau:
Chi phí sản xuất thực tế Tỷ lệ tăng, giảm giá
Tên sản phẩm trong quý IV (triệu thành đơn vị sản phẩm
đồng) quý IV so quý III
A 2.881,0 - 1,2
B 1.400,0 + 1,5
C 2.121,6 - 2,0
Biết rằng tổng chi phí sản xuất của 3 loại sản phẩm trên của công ty trong quý III là
6.156,34 triệu đồng. Yêu cầu:

1. Xác định biến động giá thành chung của 3 loại sản phẩm của công ty
trên?
2. Phân tích biến động tổng chi phí sản xuất của 3 loại sản phẩm trên quý
IV so quý III do ảnh hưởng của các nhân tố liên quan và cho nhận xét?

Bài 19:
Có tài liệu về tình hình tiêu thụ hàng hóa của một công ty kinh doanh qua 2 năm 2015
và 2016 như sau:
Tốc độ tăng, giảm khối
Doanh số bán
Tên sản lượng sản phẩm tiêu
năm 2015
phẩm thụ năm 2016 so 2015
(triệu đồng)
(%)
A 630,0 + 5,0
B 724,5 + 3,0
C 891,0 - 2,0
112
Tổng doanh số bán của 3 mặt hàng trên trong năm 2016 là: 2.290,5 triệu đồng.

Yêu cầu:
1. Tính chỉ số chung về khối lượng hàng hóa tiêu thụ của cả 3 loại hàng trên của
công ty?
2. Tính chỉ số chung về giá bán chung 3 loại mặt hàng trên?
3. Phân tích các nhân tố ảnh hưởng đến sự biến động tổng doanh thu bán 3 mặt
hàng trên của công ty? Nhận xét?

113
CÂU HỎI TRẮC NGHIỆM

Câu 1: Chỉ số thống kê được dùng để:


a. Phân tích biến động của hiện tượng qua thời gian.
b. Phân tích biến động của hiện tượng qua không gian.
c. Phân tích vai trò của các nhân tố đối với biến động của hiện tượng phức tạp. d.
Cả a, b, c đều đúng.
Câu 2: Tài liệu về năng suất lao động của công nhân trong một tổ sản xuất:
Mức NSLĐ (sản phẩm / người) 10 11 13 14 15
Số công nhân (người) 4 6 5 4 3
Năng suất lao động bình quân của công nhân trong tồ là (lấy 2 số lẻ) là: (sản phẩm/
người)
a. 12,36 b. 13,16 c. 12,60 d. 12,37
Câu 3: Theo khái niệm số tương đối và khái niệm chỉ số, trong các chỉ tiêu sau chỉ tiêu
nào được xem là chỉ số:
a. Số tương đối không gian. c. Số tương đối cường độ.
b. Số tương đối kết cấu. d. Cả a, b và c đều đúng.
Câu 4: Trong các chỉ tiêu sau, chỉ tiêu nào là chỉ tiêu chất lượng:
a. Số lao động bình quân của một công nhân trong kỳ.
b. Số lượng sản phẩm sản xuất ra trong doanh nghiệp.
c. Tổng số nguyên liệu đã tiêu hao cho sản xuất của doanh nghiệp.
d. Năng suất lao động bình quân của một công nhân.
Câu 5: Giá 1 kg hạt điều tháng 4 là 8.000đ. Tháng 5 giá hạt điều cao hơn tháng 4 là
15%. Tháng 6 giá hạt điều thấp hơn tháng 5 là 4%.
Giá 1 kg hạt điều tháng 6 là:
a. 11.520đ b. 8.832đ c. 9.568đ d. 9.200đ
Câu 6: Tại doanh nghiệp A ngày 01/04 số dư tiền mặt là: 150 triệu đồng.
• Ngày 10/4 xuất trả tiền mua nguyên liệu 48 triệu đồng.
• Ngày 15/4 thu tiền từ khách hàng 72 triệu đồng.
• Ngày 22/4 trả tiền mua nhiên liệu 10 triệu đồng.
• Ngày 25/4 thu tiền từ khách hàng 31 triệu đồng.
Như vậy, số dư tiền mặt bình quân tháng 4 của doanh nghiệp là (đơn vị tính là triệu
đồng)
a. 153,13 b. 195,0 c. 157,0 d. 158,0
Câu 7: Khi phân tổ thống kê theo tiêu thức số lượng, ta căn cứ vào:
a. Mục đích nghiên cứu. c. Cả a và b đều đúng.
b. Số lượng các trị số lượng biến theo tiêu thức nghiên cứu. d. Cả a và b đều sai.
Câu 8: Khi nghiên cứu một hiện tượng, thống kê quan tâm:
a. Chỉ thuần tuý mặt lượng của hiện tượng.
b. Chỉ nghiên cứu mặt chất và qui luật phát triển của hiện tượng.

114
c. Nghiên cứu mặt lượng trong mối quan hệ với mặt chất của hiện tượng. d. cả a, b
và c đều sai.
Câu 9: Trong các chỉ tiêu sau đây, chỉ tiêu nào là chỉ tiêu khối lượng:
a. hao phí nguyên vật liệu để sản xuất một đơn vị sản phẩm.
b. năng suất lao động bình quân 1 công nhân.
c. Giá bán bình quân một đơn vị sản phẩm.
d. lượng nguyên vật liệu tiêu hao cho sản xuất sản phẩm của doanh nghiệp.
Câu 10: Có số liệu về tình hình giá trị TSCĐ của một công ty như sau:

Thời điểm 1/1 ½ 1/3 ¼ 1/5 1/6 1/7


Giá trị TSCĐ (triệu 2.000 2.400 2.030 1.800 2.060
1.970 1.900
đồng)
Giá trị TSCĐ trung bình của công ty trên trong 6 tháng đầu năm là (triệu đồng):
a. 2.035 b. 2.022,86 c. 2.043,33 d. 1.950

Câu 11: Với tài liệu câu 10, chỉ số biến động giá trị TSCĐ quý II so với quý I là (lấy 3
số lẻ):
a. tăng 92,891% b. giảm 9,331% c. giảm 7,109% d. tăng 90,669%

Câu 12: Để rút ra kết luận chung về hiện tượng nghiên cứu, ta dùng các loại điều tra
nào trong các loại điều tra sau đây:
a. điều tra chuyên đề b. điều tra chọn mẫu
c. điều tra trọng điểm d. không có loại nào trong 3 loại điều tra trên
Câu 13: Sản lượng thu hoạch được của một loại cây trồng tỉnh Y qua các năm như
sau:
Năm 1992 1993 1994 1995 1996 1997 1998
Sản lượng 855 912 960 1.080 1.104
1.179 1.204
(1.000tấn)
Tốc độ tăng (giảm) bình quân được tính theo công thức:
7

a. y7 −y1 b. y
1 i c. y7 −y1 d. 7 y7
7 7 −1 6 y1
Câu 14: Từ tài liệu câu 13, tốc độ tăng bình quân của chỉ tiêu trên trong thời kỳ
(19921998) là:

a. 5,87% b. 7,07% c. 5,83% d. 23,45%

Câu 15: Đối với số tuyệt đối thời kỳ của một chỉ tiêu thống kê, ta có thể:
a. cộng dồn theo thời gian c. cả a và b đều sai
b. cộng dồn theo không gian d. cả a và b đều đúng

115
Câu 16: Căn cứ vào phạm vi điều tra, điều tra thống kê được phân ra:
a. Điều tra chuyên môn và báo cáo thống kê định kỳ.
b. Điều tra thường xuyên và điều tra không thường xuyên.
c. Điều tra toàn bộ và điều tra không toàn bộ.
d. cả a, b , c đều đúng.

Câu 17: Doanh nghiệp A sản xuất loại sản phẩm Y. Kế hoạch năm 1998 doanh nghiệp
phấn đấu hạ giá thành đơn vị sản phẩm xuống 2% so với 1997. Thực tế năm 1998 so
với năm 1997, giá thành thấp hơn thực tế 2,5%. Như vậy, phần trăm thực hiện kế
hoạch giá thành là: (lấy 2 số lẻ)
a. 99,49 % b. 95,50 % c. 95,55 % d. 100,49 %
Câu 18: Với tài liệu câu số 18, năng suất lao động bình quân của một công nhân là
(lấy
2 số lẻ):
a. 13,05 b. 12,1 c. 12,75 d. 14,00

116
TÀI LIỆU THAM KHẢO

1. TS. Mai Văn Nam (2015). Giáo trình Nguyên lý thống kê kinh tế, NXB
Văn hóa Thông tin.
2. Hà Văn Sơn (2004). Giáo trình Nguyên lý thống kê kinh tế, Trường Đại
học Kinh tế Tp. Hồ Chí Minh, NXB Thống kê.
3. PGS.TS. Bùi Đức Triệu (2012). Giáo trình Thống kê kinh tế, Trường Đại
học Kinh tế quốc dân, NXB. ĐH Kinh tế quốc dân.
4. TS. Vũ Trọng Phong (2013). Bài giảng Thống kê doanh nghiệp, Học viên
Bưu chính Viễn thông.

117

You might also like