You are on page 1of 33

Baøi taäp moân

DÖÏ BAÙO TRONG KINH DOANH

CHƯƠNG 1 & 2

1. Hai kỹ thuật dự báo khác nhau (F1 và F2) được dùng để dự báo mức cầu về thùng nước đóng chai.
Mức cầu thực tế và hai tập dự báo là như sau:

Mức cầu dự báo


Thời kỳ Mức cầu F1 F2
1 68 66 66
2 75 68 68
3 70 72 70
4 74 71 72
5 69 72 74
6 72 70 76
7 80 71 78
8 78 74 80
a) Tính MAE cho mỗi tập dự báo. Dựa vào kết quả của bạn, dự báo nào xem ra chính xác hơn? Giải
thích.
b) Tính MSE cho mỗi tập dự báo. Dựa vào kết quả của bạn, dự báo nào xem ra chính xác hơn?
c) Trong thực hành, MAE hoặc MSE sẽ được sử dụng để đánh giá sai số dự báo. Nhân tố nào có thể
làm cho người quản lý chọn dùng tiêu chuẩn đánh giá này chứ không phải tiêu chuẩn đánh giá
khác?

2. Hai phương pháp dự báo dựa vào phán đoán và kinh nghiệm độc lập với nhau đã được chuẩn bị cho
mỗi tháng trong 10 tháng qua. Các mức dự báo và doanh số thực tế là như sau:

Tháng Doanh số Dự báo 1 Dự báo 2

1 770 771 769


2 789 785 787
3 794 790 792
4 780 784 798
5 768 770 774
6 772 768 770
7 760 761 759
8 775 771 775
9 786 784 788
10 790 788 788

a) Tính MSE và MAE cho mỗi dự báo. Phương pháp nào có vẻ như tốt hơn? Giải thích.
b) Tính tín hiệu theo dõi cho tháng thứ 10 cho mỗi dự báo. Nó cho thấy điều gì? (Dùng các giới hạn
hoạt động 4).
c) Tính các giới hạn kiểm soát 2s cho mỗi dự báo và nhận xét.

3. Một nhà quản trị sử dụng phương trình: yˆt  10  5t để dự báo mức cầu. Qua tám thời kỳ vừa qua,
mức cầu là như sau:
Thời kỳ t: 1 2 3 4 5 6 7 8
Mức cầu: 15 21 23 30 32 38 42 47
Dự báo này có thực hiện thoả đáng không? Giải thích.
2/35
CHƯƠNG 3 & 4

Ví dụ: Dữ liệu tỷ lệ thất nghiệp (%) theo quý trong lực lượng lao động tại một quốc gia trong hai năm
2017 và 2018 được trình bày ở bảng sau:

Thời gian Tỷ lệ thất nghiệp (%) Thời gian Tỷ lệ thất nghiệp (%)
Quý I, 2017 5,3 Quý I, 2018 5,7
II, 2017 5,3 II, 2018 5,7
III, 2017 5,7 III, 2018 5,6
IV, 2017 6,1 IV, 2018 5,5

a) Dự báo tỷ lệ thất nghiệp sử dụng mô hình thô đơn giản.


Ta ký hiệu t cho thời gian và Y cho tỷ lệ thất nghiệp như sau:

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5

Áp dụng mô hình Yˆt 1  Yt


Vậy, Ŷ1  Y0 (không tính được vì không có Y0 )
Yˆ2  Y1  5,3
Yˆ  Y  5,3
3 2

Yˆ4  Y3  5,7
Tính tương tự cho đến Yˆ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ  5,3 5,3 5,7 6,1 5,7 5,7 5,6

b) Dự báo tỷ lệ thất nghiệp sử dụng mô hình thô điều chỉnh xu hướng với p = 0,2.
Áp dụng mô hình Yˆ  Y  p(Y  Y )
t 1 t t t 1

Vậy, Yˆ1  Y0  p(Y0  Y1 ) (không tính được vì không có Y0 và Y1 )


Yˆ  Y  p(Y  Y ) (không tính được vì không có Y )
2 1 1 0 0

Yˆ3  Y2  p(Y2  Y1 )  5,3  0, 2(5,3  5,3)  5,3


Yˆ  Y  p(Y  Y )  5, 7  0, 2(5,7  5,3)  5,78
4 3 3 2

Tính tương tự cho đến Yˆ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ   5,30 5,78 6,18 5,62 5,70 5,58

c) Dự báo tỷ lệ thất nghiệp sử dụng mô hình thô điều chỉnh mùa vụ với s = 4.
Áp dụng mô hình Yˆ  Y , trong đó s là số mùa trong một chu kỳ hay chu kỳ biến động (s = 4 với
t 1 t 1 s

dữ liệu quý; s = 12 với dữ liệu năm)


Vậy, Yˆ đến Yˆ (không tính được vì không có dữ liệu thực tế)
1 4

Yˆ5  Y1  5,3 Yˆ6  Y2  5,3 Yˆ7  Y3  5, 7 Yˆ8  Y4  6,1


d) Dự báo tỷ lệ thất nghiệp sử dụng mô hình trung bình đơn giản.
3/35
Y  Y    Y1
Áp dụng mô hình Yˆt 1  t t 1
t
Vậy, Yˆ (không tính được)
1

Yˆ2  Y1  5,3
Y  Y 5,3  5,3
Yˆ3  1 2   5,3
2 2
Y  Y  Y 5,3  5,3  5,7
Yˆ4  1 2 3   5, 43
3 3
Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ  5,3 5,3 5,43 5,6 5,62 5,63 5,63

e) Dự báo tỷ lệ thất nghiệp sử dụng mô hình trung bình động (đơn giản) với hệ số trượt là 3 (quý).
Y Y Y
Áp dụng mô hình Yˆt 1  t t 1 t  2
3
ˆ
Vậy, Y đến Ŷ (không tính được vì không có đủ dữ liệu thực tế)
1 3

Y  Y  Y 5,7  5,3  5, 3
Yˆ4  3 2 1  5, 43
3 3
Y  Y  Y 6,1  5, 7  5,3
Yˆ5  4 3 2   5, 7
3 3
Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ    5,43 5,7 5,83 5,83 5,67

f) Dự báo tỷ lệ thất nghiệp sử dụng mô hình trung bình động 3 quý có trọng số với các trọng số là
0,15; 0,35; 0,50.
Áp dụng mô hình Yˆ  0,50(Y )  0,35(Y )  0,15(Y )
t 1 t t 1 t 2

Vậy, Yˆ1 đến Ŷ3 (không tính được vì không có đủ dữ liệu thực tế)
Yˆ4  0,50(Y3 )  0,35(Y2 )  0,15(Y1 )
 0,50(5, 7)  0,35(5,3)  0,15(5,3)  5,5
Yˆ5  0,50(Y4 )  0,35(Y3 )  0,15(Y2 )
 0,50(6,1)  0,35(5, 7)  0,15(5,3)  5,84
Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ    5,5 5,84 5,84 5,76 5,65

g) Dự báo tỷ lệ thất nghiệp sử dụng mô hình trung bình động 3 tháng có trọng số với các trọng số
là 1; 2; 3.

6    
Áp dụng mô hình Yˆt 1  3 Yt  2 Yt 1  1 Yt  2
6 6  
Vậy, Yˆ đến Ŷ (không tính được vì không có đủ dữ liệu thực tế)
1 3
4/35
 6 Y   2 6 Y   16 Y
Yˆ4  3 3 2 1

  3  5, 7   2  5,3   1  5,3  5,5


6 6 6
Yˆ   3  Y   2  (Y   1  Y
5 6 4 6 6 3 2

  3  6,1   2  5, 7   1  5,3  5,83


6 6 6
Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ    5,5 5,83 5,83 5,77 5,65

h) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ với hệ số mũ (  ) bằng 0,2.


Áp dụng mô hình Yˆ  Y  (1   )Yˆ
t 1 t t

Cho Yˆ1  Y1  5,3 (đề không cho giá trị dự báo ban đầu)
Vậy, Yˆ  Y  (1   )Yˆ  0, 2(5,3)  (1  0, 2)(5,3)  5,3
2 1 1

Yˆ3  Y2  (1   )Yˆ2  0, 2(5,3)  (1  0, 2)(5,3)  5,3


Yˆ   Y  (1   )Yˆ  0, 2(5,7)  (1  0, 2)(5,3)  5,38
4 3 3

Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ 5,3 5,3 5,3 5,38 5,52 5,56 5,59 5,59

i) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ với hệ số mũ (  ) bằng 0,2 và giá trị dự báo
cho quý III, 2017 bằng 5,4%.
Áp dụng mô hình Yˆ  Y  (1   )Yˆ
t 1 t t

Với Yˆ3  5, 4 (đề cho)


Vậy, Yˆ4   Y3  (1   )Yˆ3  0, 2(5,7)  (1  0, 2)(5, 4)  5, 46
Yˆ  Y  (1   )Yˆ  0, 2(6,1)  (1  0, 2)(5, 46)  5,59
5 4 4

Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ 5,4 5,46 5,59 5,61 5,63 5,62

j) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ với hệ số mũ (  ) bằng 0,2 và giá trị dự báo
cho quý III, 2017 bằng trung bình cộng của ba giá trị thực tế đầu tiên.
Áp dụng mô hình Yˆ  Y  (1   )Yˆ
t 1 t t

Y  Y  Y 5, 3  5,3  5, 7
Với Yˆ3  1 2 3   5, 43 (đề yêu cầu)
3 3
Vậy, Yˆ4  Y3  (1   )Yˆ3  0, 2(5,7)  (1  0, 2)(5, 43)  5, 48
Yˆ5  Y4  (1   )Yˆ4  0, 2(6,1)  (1  0, 2)(5, 48)  5,60
Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.
5/35
t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ 5,43 5,48 5,6 5,62 5,64 5,63

k) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ với hệ số mũ (  ) bằng 0,2 và giá trị dự báo
ĐẦU TIÊN lấy bằng trung bình cộng toàn bộ các giá trị thực tế.
Áp dụng mô hình Yˆ  Y  (1   )Yˆ
t 1 t t

Y  Y    Y8 5,3  5,3    5, 5
Với Yˆ1  1 2   5, 61 (đề yêu cầu)
8 8
Vậy, Yˆ  Y  (1   )Yˆ  0, 2(5,3)  (1  0, 2)(5, 61)  5,55
2 1 1

Yˆ3  Y2  (1   )Yˆ2  0, 2(5,3)  (1  0, 2)(5,55)  5,5


Tính tương tự cho đến Ŷ8 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
Yˆ 5,61 5,55 5,5 5,54 5,65 5,66 5,67 5,66

l) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ Holt với các hệ số mũ,  = 0,2;  = 0,3.
Chọn các giá trị ban đầu F1 = 5,3, T1 = 0.
Áp dụng mô hình (4.8), (4.9), (4.10) [SÁCH, trang 65]
Với  = 0,2;  = 0,3; F1 = 5,3; T1 = 0 (đề cho)
Đề không cho giá trị n nên ta chọn n = 1.

Vậy, [Theo (4.8)] Yˆ2  F1  T1  5,3  0  5, 3

[Theo (4.9)] F2   Y2  (1   )( F1  T1 )  0, 2(5,3)  (1  0, 2)(5,3  0)  5,3


[Theo (4.10)] T2   ( F2  F1 )  (1   )T1  0,3(5,3  5,3)  (1  0,3)(0)  0
Vậy, Yˆ3  F2  T2  5,3  0  5,3

F3   Y3  (1   )( F2  T2 )  0, 2(5,7)  (1  0, 2)(5,3  0)  5,38


T3   ( F3  F2 )  (1   )T2  0,3(5,38  5,3)  (1  0,3)(0)  0,024
Vậy, Yˆ  F  T  5,3  0  5,38  0,024  5, 40
4 3 3

Tính tương tự cho đến Ŷ9 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8 9
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
F 5,3 5,3 5,38 5,543 5,627 5,698 5,735 5,737
T 0 0 0,024 0,066 0,071 0,071 0,061 0,043
Yˆ 5,3 5,3 5,40 5,61 5,70 5,77 5,80 5,78

m) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ Holt với các hệ số mũ,  = 0,2;  = 0,3.
Chọn các giá trị ban đầu F0 = 5,48, T0 = 0,03.
Áp dụng mô hình (4.8), (4.9), (4.10) [SÁCH, trang 65]
Với  = 0,2;  = 0,3; F0 = 5,48; T0 = 0,03 (đề cho)
Đề không cho giá trị n nên ta chọn n = 1.

Vậy, [Theo (4.8)] Yˆ1  F0  T0  5, 48  0, 03  5,51


6/35
[Theo (4.9)] F1  Y1  (1   )( F0  T0 )  0, 2(5,3)  (1  0, 2)(5, 48  0,03)  5, 468
[Theo (4.10)] T1   ( F1  F0 )  (1   )T0  0,3(5, 47  5, 48)  (1  0,3)(0,03)  0,017

Vậy, [Theo (4.8)] Yˆ2  F1  T1  5, 468  0,017  5, 49

[Theo (4.9)] F2  Y2  (1   )( F1  T1 )  0, 2(5,3)  (1  0, 2)(5, 468  0,017)  5, 448


[Theo (4.10)] T2   ( F2  F1 )  (1   )T1  0,3(5, 448  5, 468)  (1  0,3)(0, 017)  0,006
Vậy, Yˆ3  F2  T2  5, 448  0,006  5, 45

F3  Y3  (1   )( F2  T2 )  0, 2(5,7)  (1  0, 2)(5, 448  0,006)  5,503


T3   ( F3  F2 )  (1   )T2  0,3(5,503  5, 448)  (1  0,3)(0, 006)  0,021
Vậy, Yˆ  F  T  5,503  0, 021  5,52
4 3 3

Tính tương tự cho đến Ŷ9 . Kết quả được trình bày trong bảng sau.

t 1 2 3 4 5 6 7 8 9
Y 5,3 5,3 5,7 6,1 5,7 5,7 5,6 5,5
F 5,468 5,448 5,503 5,639 5,696 5,742 5,756 5,738
T 0,017 0,006 0,021 0,056 0,056 0,053 0,041 0,023
Yˆ 5,51 5,49 5,45 5,52 5,70 5,75 5,80 5,80 5,76

n) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ Holt với các hệ số mũ,  = 0,2;  = 0,3.
Chọn các giá trị ban đầu F0 và T0 theo các hệ số của phương trình hồi quy tỷ lệ thất nghiệp theo
thời gian.
(1) Tìm các hệ số của phương trình hồi quy tỷ lệ thất nghiệp theo thời gian.
Kết quả là b0 = 5,48; b1 = 0,03. Do đó, theo đề cho ta lấy F0 = b0 = 5,48; T0 = b1 = 0,03.
(2) Làm giống câu m ở trên.

o) Đánh giá 2 mô hình dự báo ở câu a và câu b dựa trên tiêu chí MAE, MSE, MAPE, RMSE.
(1) Tính MAE
 Tính et  Yt  Yˆt với t = 3, 4, …,8

Thô đơn Thô điều chỉnh


giản xu hướng
t Y Yˆ e Yˆ e
1 5,3  
2 5,3 5,3 
3 5,7 5,3 0,4 5,30 0,4
4 6,1 5,7 0,4 5,78 0,32
5 5,7 6,1 0,4 6,18 0,48
6 5,7 5,7 0 5,62 0,08
7 5,6 5,7 0,1 5,70 0,1
8 5,5 5,6 0,1 5,58 0,08

8
 et
 Tính MAE  t 3

6
Mô hình thô đơn giản:
7/35
0, 4  0, 4  0, 4  0  0,1  0,1
MAE1   0, 2333
6
Mô hình thô điều chỉnh xu hướng:
0, 4  0, 32  0, 48  0, 08  0,1  0, 08
MAE2   0, 2433
6
Dựa trên tiêu chí MAE, mô hình thô đơn giản dường như tốt hơn vì có MAE nhỏ hơn.

(2) Tính MSE


 Tính et2  (Yt  Yˆt ) 2 với t = 3, 4, …,8

Thô đơn Thô điều chỉnh


giản xu hướng
t Y Yˆ e2 Yˆ e2
1 5,3  
2 5,3 5,3 
3 5,7 5,3 0,16 5,30 0,16
4 6,1 5,7 0,16 5,78 0,1024
5 5,7 6,1 0,16 6,18 0,2304
6 5,7 5,7 0 5,62 0,0064
7 5,6 5,7 0,01 5,70 0,01
8 5,5 5,6 0,01 5,58 0,0064
8
2
 et
 Tính MSE  t 3
6
Phương pháp thô đơn giản:
0,16  0,16  0,16  0  0, 01  0, 01
MSE1   0, 0833
6
Phương pháp thô điều chỉnh xu hướng:
0,16  0,1024  0, 2304  0, 0064  0, 01  0, 0064
MSE2   0, 0859
6
Dựa trên tiêu chí MSE, mô hình thô đơn giản dường như tốt hơn vì có MSE nhỏ hơn.

(3) Tính MAPE


et Yt  Yˆt
 Tính  với t = 3, 4, …,8
Yt Yt

Thô đơn Thô điều chỉnh


giản xu hướng
t Y Yˆ e Y Yˆ e Y
1 5,3  
2 5,3 5,3 
3 5,7 5,3 0,0702 5,30 0,0702
4 6,1 5,7 0,0656 5,78 0,0525
5 5,7 6,1 0,0702 6,18 0,0842
6 5,7 5,7 0 5,62 0,014
7 5,6 5,7 0,0179 5,70 0,0179
8 5,5 5,6 0,0182 5,58 0,0145
8/35
8et

t  3 Yt
 Tính MAPE  100%
6
Mô hình thô đơn giản đơn giản:
0, 0702  0, 0656  0, 0702  0  0, 0179  0, 0182
MAPE1  (100%)  4, 04%
6
Mô hình thô điều chỉnh xu hướng:
0, 0702  0, 0525  0, 0842  0, 014  0, 0179  0, 0145
MAPE2  (100%)  4, 22%
6
Dựa trên tiêu chí MAPE, mô hình thô đơn giản dường như tốt hơn vì có MAPE nhỏ hơn.

(4) Tính RMSE


 Tính et2  (Yt  Yˆt )2 với t = 3, 4, …,8

Thô đơn Thô điều chỉnh


giản xu hướng
t Y Yˆ e2 Yˆ e2
1 5,3  
2 5,3 5,3 
3 5,7 5,3 0,16 5,30 0,16
4 6,1 5,7 0,16 5,78 0,1024
5 5,7 6,1 0,16 6,18 0,2304
6 5,7 5,7 0 5,62 0,0064
7 5,6 5,7 0,01 5,70 0,01
8 5,5 5,6 0,01 5,58 0,0064

8
2
 et
 Tính RMSE  t 3

6
Phương pháp thô đơn giản:

0,16  0,16  0,16  0  0, 01  0, 01


RMSE1   0, 2887
6
Phương pháp thô điều chỉnh xu hướng:

0,16  0,1024  0, 2304  0, 0064  0, 01  0, 0064


RMSE2   0, 2931
6
Dựa trên tiêu chí RMSE, mô hình thô đơn giản dường như tốt hơn vì có RMSE nhỏ hơn.

p) Dự báo tỷ lệ thất nghiệp sử dụng mô hình hàm mũ với hệ số mũ (  ) bằng 0,3. Sử dụng tiêu chí
MSE để quyết định chọn  nào:  = 0,2 ở câu h hay  = 0,3 ở câu này? Dự báo tỷ lệ thất
nghiệp cho quý I năm 2019.
(1) Làm tương tự câu h
(2) Tính MSE ở câu h và MSE ở câu này. Chọn  cho MSE nhỏ hơn.
(3) Tính Ŷ9 sử dụng mô hình hàm mũ với  vừa chọn ở (2)

BÀI TẬP CHƯƠNG 3 & 4


1. Làm câu p ở trên
9/35
2. Vẽ trên cùng một mặt phẳng tọa độ, đồ thị cho dãy dữ liệu thực tế (đề cho) và đồ thị cho dãy dữ liệu
dự báo theo mô hình hàm mũ với hệ số mũ (  ) bằng 0,3. Nhận xét.
3. Làm các bài tập 3.1; 3.2; 3.4; 3.5; 4.1 và 4.2 trong SÁCH.

4. Sử dụng dữ liệu chuỗi thời gian sau đây:

Tháng Ba Tư Năm Sáu Bảy Tám


Mức cầu 2.200 2.240 1.790 4.270 3.530 4.990

a) Dự báo mức cầu sử dụng mô hình trung bình động ba thời đoạn.
b) Dự báo mức cầu sử dụng mô hình hàm mũ với  = 0,5. Giả sử dự báo cho tháng năm là 2.000.
c) Dự báo mức cầu sử dụng mô hình hàm mũ Holt với  = 0,5 và  = 0,3. Giả sử dự báo thành phần ổn
định (level) cho tháng năm là 2.000 và thành phần xu hướng cho tháng năm là 700.
d) Theo Anh/Chị, mô hình nào cho dự báo tốt nhất? Dự báo mức cầu cho tháng chín theo mô hình tốt
nhất.

Chæ daãn vaø ñaùp soá


a) Tính dự báo theo công thức sau:
Y Y Y
Yˆt 1  t t 1 t  2
3
với t = 1 (ứng với tháng ba); 2 (tháng tư); …
Y Y Y
Dự báo cho tháng sáu: Yˆ4  3 2 1
3
1790  2240  2200
  2077
3
Tương tự, ta tính dự báo cho các tháng bảy và tám. Kết quả được trình bày trong bảng sau.
b) Tính dự báo theo công thức sau:
Yˆt 1  Yt  (1   )Yˆt
Theo đề cho ta có:
 = 0,5 và Yˆ3  2000

Dự báo cho tháng sáu: Yˆ4  Y3  (1   )Yˆ3


 0, 5(1790)  (1  0, 5)2000  1895
Tương tự, ta tính dự báo cho các tháng bảy và tám. Kết quả được trình bày trong bảng sau.

Câu a) Câu b)
t Y MA(3) e e2 ES( = 0,5) e e2
1 2.200
2 2.240
3 1.790 2.000
4 4.270 2.077 2.193 4.810.711 1.895 2.375 5.640.625
5 3.530 2.767 763 582.678 3.083 448 200.256
6 4.990 3.197 1.793 3.216.044 3.306 1.684 2.835.014
1.583 2.869.811 1.502 2.891.965
MAE MSE MAE MSE
10/35
Câu c) San bằng mũ Holt
Ft   Yt  (1   )( Ft 1  Tt 1 )
Tt   ( Ft  Ft 1 )  (1   )Tt 1
Yˆt  n  Ft  nTt
Đề cho  = 0,5;  = 0,3; F3 = 2000; T3 = 700; n = 1 (theo mặc định).

Vậy Yˆ4  F3  T3  2000  700  2700

Tính F4   Y4  (1   )( F3  T3 )
 0, 5(4270)  (1  0, 5)(2000  700)  3485
T4   ( F4  F3 )  (1   )T3
 0,3(3485  2000)  (1  0,3)700  936

Vậy Yˆ5  F4  T4  3485  936  4421

Tính F5   Y5  (1   )( F4  T4 )
 0, 5(3530)  (1  0, 5)(3485  936)  3975
T5   ( F5  F4 )  (1   )T4
 0,3(3975  3485)  (1  0,3)936  802

Vậy Yˆ6  F5  T5  3975  802  4777


t Y F T Yˆ e e2
1 2.200
2 2.240
3 1.790 2000 700
4 4.270 3485 936 2700 1570 2464900
5 3.530 3975 802 4421 891 792990
6 4.990 4884 834 4777 213 45294
5717
891 1.101.062
MAE MSE
d) CÁCH 1: Tính MAE cho từng mô hình
MAE của mô hình bình quân di động ba thời đoạn = 1.583
MAE của mô hình san bằng mũ với  = 0,5 = 1.502
MAE của mô hình san bằng mũ Holt với  = 0,5 và  = 0,3 = 891
Moâ hình san baèng muõ Holt vôùi  = 0,5 vaø  = 0,3 döôøng nhö toát nhất vì coù MAE nhoûù nhaát.

CÁCH 2: Tính MSE cho từng mô hình


MSE của mô hình bình quân di động ba thời đoạn = 2.869.811

Moâ hình san baèng muõ Holt vôùi  = 0,5 vaø  = 0,3 döôøng nhö toát nhất vì coù MSE nhoûù nhaát.

CÁCH 3:
Cả hai mô hình bình quân di động ba thời đoạn và san bằng mũ với  = 0,5 đều thích hợp nhất với dữ
liệu dừng.
11/35
Mô hình san bằng mũ Holt với  = 0,5 và  = 0,3 thích hợp nhất với dữ liệu có tính xu hướng.
Vì döõ lieäu ñaõ cho coù tính xu höôùng tuyeán tính neân moâ hình san baèng muõ Holt vôùi  = 0,5 vaø  =
0,3 döôøng nhö toát nhất.

5. Một siêu thị lớn đã ghi chép doanh số (tỷ đồng) của mình trong giai đoạn 2004-2011 như sau:

Năm 2004 2005 2006 2007 2008 2009 2010 2011


Doanh số 2675 2809 3221 3776 x 4351 4874 5432

a) Điền giá trị bị khuyết cho năm 2008, được lấy bằng trung bình cộng của hai giá trị trong hai năm
ngay trước và sau năm 2008.
b) Tính dự báo doanh số sử dụng phương pháp trung bình động 3 mức độ.
c) Tính chỉ tiêu MSE của mô hình

Chæ daãn vaø ñaùp soá


a) x = (3776 + 4351)/2 = 4063,5

6. Có ghi chép về nhiệt độ không khí trung bình các tháng năm 2011 tại TP.HCM được trích từ Niên
giám Thống kê TP.HCM như sau:

Tháng 1 2 3 4 5 …
Nhiệt độ (0C) 26,9 27,6 28,3 29,1 29,5
Giá trị dự báo 27,6 27,32 27,4 27,8 28,3

Sử dụng phương pháp san bằng hàm mũ đơn giản để dự báo nhiệt độ không khí vào tháng 1 năm 2012,
người ta được giá trị dự báo như trên, hãy tìm trọng số dự báo đã dùng biết người dự báo chọn giá trị
dự báo đầu tiên bằng trung bình cộng của 3 tháng đầu năm 2011?

7. Một lò bánh mì thương mại đã ghi lại doanh số (theo tá) của ba sản phẩm, như được cho thấy dưới
đây:

Ngày Bánh nướng xốp Bánh sữa nhỏ Bánh nướng nhỏ
1 30 18 45
2 34 17 26
3 32 19 27
4 34 19 23
5 35 22 22
6 30 23 48
7 34 23 29
8 36 25 20
9 29 24 14
10 31 26 18
11 35 27 47
12 31 28 26
13 37 29 27
14 34 31 24
15 33 33 22

a) Dự đoán các đơn đặt hàng cho ngày tiếp theo cho mỗi sản phẩm sử dụng phương pháp thô thích
hợp.
b) Việc sử dụng số liệu doanh số thay vì mức cầu hàm ý điều gì?
12/35

8. Trưởng phòng đào tạo của một Trường đại học muốn dự báo số lượng sinh viên sẽ ghi danh học môn
quản trị vận hành (OM) ở học kỳ tới để xác định xem có bao nhiêu phần sẽ đưa vào chương trình đào
tạo. Ông đã thu thập được số liệu về ghi danh trong 8 học kỳ qua sau đây:

Học kỳ 1 2 3 4 5 6 7 8
Số sinh viên 400 450 350 420 500 575 490 650

a) Dự báo số sinh viên ghi danh cho các học kỳ từ 4 đến 9 theo phương pháp bình quân di động 3
học kỳ.
b) Dự báo số sinh viên ghi danh cho các học kỳ từ 4 đến 9 theo phương pháp bình san bằng mũ ( =
0,2).
c) So sánh hai dự báo dùng MAE. Dự báo nào có vẻ chính xác hơn?

9. Người quản lý đại lý Carpet City cần dự báo chính xác mức cầu về thảm Soft Shag (loại bán chạy
nhất của mình). Nếu người quản lý đặt mua không đủ thảm ở nhà máy thảm, khách hàng sẽ đi mua ở
một trong số nhiều đại lý cạnh tranh với Carpet City. Người quản lý đã thu thập được số liệu về nhu
cầu trong 8 tháng qua sau đây:

Tháng 1 2 3 4 5 6 7 8
Mức cầu 8 12 7 9 15 11 10 12

a) Hãy dự báo nhu cầu cho các tháng từ 4 đến 9 theo phương pháp bình quân di động 3 tháng.
13/35
b) Dự báo nhu cầu cho các tháng từ 4 đến 9 theo phương pháp bình quân di động 3 tháng có trọng
số. Chọn các trọng số là 0,55, 0,33, và 0,12 cho các tháng theo thứ tự, bắt đầu với tháng gần đây
nhất.
c) So sánh hai dự báo dùng MAE. Dự báo nào có vẻ chính xác hơn?

10. Tình hình tiêu thụ trong 6 tháng đầu năm của một công ty cho trong bảng sau:

Tháng 1 2 3 4 5 6
Doanh thu (triệu đồng) 450 495 518 563 584 612
a) Hãy lập dự báo cho tháng 7 theo
 Phương pháp bình quân di động giản đơn 3 tháng.
 Phương pháp bình quân di động 3 tháng có trọng số với các trọng số là 1, 2 và 3.
 Phương pháp san bằng mũ với   0,9.
b) So sánh và chọn kết quả tốt nhất.

11. Công ty NM có bán cái mở hộp. Doanh số hàng tháng trong một thời kỳ 7 tháng là như sau:
Tháng: 2 3 4 5 6 7 8
Doanh số (000 cái): 19 18 15 20 18 22 20
a) Vẽ đồ thị dữ liệu hàng tháng.
b) Dự báo doanh số tháng 9 sử dụng từng kỹ thuật sau:
(1) Phương trình xu hướng tuyến tính.
(2) Trung bình trượt 5 tháng.
(3) San bằng mũ với hằng số san bằng 0,20, giả sử dự báo cho tháng Ba là 19(000).
(4) Phương pháp thô.
(5) Trung bình trượt có trọng số với các trọng số là 0,60; 0,30; và 0,10.
c) Phương pháp nào dường như ít thích hợp nhất? Tại sao?

12. Giả sử có chuỗi thời gian cho trong bảng sau đây:
t y t y
1 430 6 514
2 446 7 532
3 464 8 548
4 480 9 570
5 498 10 591
a) Dùng phương pháp bình phương tối thiểu xác định đường hồi quy.
b) Dùng đường hồi quy dự báo y cho thời đoạn t = 11.
c) Dùng kỹ thuật san bằng mũ với  = 0,1 và giá trị dự báo cho thời điểm 2 là 430 để dự báo cho các
thời điểm từ 3 đến 11.
d) Dùng kỹ thuật san bằng mũ có điều chỉnh xu hướng với  =  = 0,2 và giá trị dự báo cho thời
điểm 2 cho xu hướng là 18 và cho biến ngẫu nhiên là 430 để dự báo cho các thời điểm từ 3 đến
11.
14/35
CHƯƠNG 5

Ví dụ 5.1
RA định kỳ tổ chức bán hạ giá đặc biệt kéo dài suốt một tuần. Như một phần của chiến dịch quảng cáo,
RA thực hiện một hoặc một số quảng cáo trên TV vào thời gian cuối tuần ngay trước đợt bán hạ giá. Dữ
liệu từ một mẫu gồm 5 đợt bán hạ giá gần đây được cho dưới đây.
Số lần quảng cáo trên TV 1 3 2 1 3
Số lượng xe ô tô bán được 14 24 18 17 27
a) Vẽ đồ thị phân tán mô tả mối liên hệ giữa hai biến trên đây.
b) Tính và giải thích ý nghĩa của hệ số tương quan tuyến tính.
c) Kiểm định ý nghĩa của mối liên hệ bằng cách sử dụng hệ số tương quan tuyến tính.
d) Viết phương trình hồi quy tuyến tính ước lượng mô tả mối liên hệ giữa hai biến trên đây. Giải thích ý
nghĩa của các hệ số trong phương trình.
e) Tính và giải thích ý nghĩa của hệ số xác định (hay đánh giá sự phù hợp của mô hình).
f) Hệ số góc của mô hình hồi quy tuyến tính có ý nghĩa thống kê hay không? (Chọn  = 5%)
g) Tìm khoảng tin cậy 95% (hay ước lượng khoảng với độ tin cậy 95%) cho hệ số góc của mô hình hồi
quy tuyến tính.
h) Dự báo khoảng với độ tin cậy 95% cho số lượng xe ô tô bán được trung bình khi có 3 lần quảng cáo
trên TV được tổ chức.
i) Dự báo khoảng với độ tin cậy 95% cho số lượng xe ô tô bán được trong một tuần đặc biệt khi có 3 lần
quảng cáo trên TV được tổ chức.
Giải:
a) x: số lần quảng cáo trên TV 30
(biểu diễn trên trục hoành) 20

y: số lượng xe ô tô bán được 10


0
(biểu diễn trên trục tung) 0 1 2 3 4

Mối liên hệ giữa số lượng xe ô tô bán được và số lần quảng cáo trên TV xấp xỉ tuyến tính và đồng
biến.
b) Ta lập bảng tính toán sau:

x y x2 y2 xy
1 14 1 196 14
3 24 9 576 72
2 18 4 324 36
1 17 1 289 17
3 27 9 729 81
Tổng: 10 100 24 2114 220

n  xy   x  y
r
 n  x  (  x) 2   n  y 2  (  y ) 2 
2

5(220)  (10)(100)
  0, 9366
5(24)  (10) 2  5(2114)  (100) 2 

Mối liên hệ tuyến tính giữa số lượng xe ô tô bán được và số lần quảng cáo trên TV là rất mạnh và
đồng biến.

c) Đặt giả thuyết, H0:  = 0; Ha:  ≠ 0.


15/35
r n2 0,9366 5  2
Tính giá trị kiểm định, t    4, 63
1 r 2
1  0,93662

Quy tắc kiểm định: Bác bỏ H0 nếu t  t /2; n 2

Với  = 5%; n = 5, tra bảng phân phối Student ta có t / 2; n 2  t0,025; 3  3,182.

Vì t = 4,63 > 3,182 nên ta bác bỏ H0 ở mức ý nghĩa 5%, nghĩa là mối liên hệ giữa số lượng xe ô
tô bán được và số lần quảng cáo trên TV có ý nghĩa thống kê.

d) Gọi x là số lần quảng cáo trên TV và y là số lượng xe ô tô bán được.1


Phương trình hồi quy tuyến tính ước lượng mô tả mối liên hệ giữa các biến có dạng:
ŷ  b0  b1 x
Hệ số góc của phương trình hồi quy tuyến tính ước lượng:
n  xy   x  y 5(220)  10(100)
b1   5
n  x 2  ( x) 2 5(24)  (10) 2
Tung độ gốc của phương trình hồi quy tuyến tính ước lượng
y x
b0 =  b1 = 100/5 – 5(10/5) = 10
n n
Vậy phương trình hồi quy tuyến tính ước lượng là
yˆ  10  5 x
Hệ số góc b1  5 cho biết khi số lần quảng cáo trên TV tăng thêm (hoặc giảm bớt) 1 lần thì số lượng
xe ô tô bán được sẽ tăng thêm (hay giảm bớt) trung bình khoảng 5 xe.
Tung độ gốc b0  10 cho biết khi số lần quảng cáo trên TV bằng 0, tức là công ty không có quảng cáo
trên TV trước đợt bán xôn, thì số lượng xe ô tô bán được trung bình khoảng 10 xe. Tuy nhiên, cách
diễn đạt này về tung độ gốc không hẳn đã hợp lý.
e)
  yi 
2
(100) 2
SST   y 2
i   2114 
 114
n 5
 x y   10(100) 
SSR  b1   xi yi  i i   5  220    100
 n   5 
SSR 100
r2    0,8772
SST 114
Mối liên hệ hồi quy là rất mạnh vì 88% phần biến thiên trong số xe ô tô đã bán được có thể được giải
thích bởi mối liên hệ tuyến tính giữa số lần quảng cáo trên TV và số xe ô tô bán được.

f) Đặt giả thuyết:


H 0 : 1  0
H a : 1  0
Tính giá trị của thống kê kiểm định:
SSE = SST – SSR = 114 – 100 = 14
(hay SSE   yi2  b1 xi yi  b0 y  2114  5(220)  10(100)  14 )

1
Vì ta thấy ở hai câu d và e số lần quảng cáo trên TV được cho là 3 (biến có giá trị cho trước là x) và số lượng xe là biến cần
dự báo (y).
16/35
SSE 14
se    2,16
n2 5 2
( xi )2 (10) 2
( xi  x )2   xi2   24  4
n 5
se 2,16
sb1    1, 08
(  x ) 2
(10) 2
 xi2  i
24 
n 5
b 5
t 1   4, 63
sb1 1, 08

Quy tắc bác bỏ: Bác bỏ H0 nếu t  t /2,n2 .


Tra bảng phân phối t với  = 0,05 và n – 2 = 5 – 2 = 3, ta có t0,025; 3 = 3,182.
Vì 4,63 > 3,182 nên ta bác bỏ H0 ở mức ý nghĩa 5% và kết luận với  = 0,05, 1  0 hay có ý
nghĩa thống kê.

g) Khoảng tin cậy 95% cho 1


b1  t 2;n2 sb1  5  3,182(1, 08)  5  3, 44
hay từ 1,56 đến 8,44

h) Dự báo điểm:
Nếu có 3 lần quảng cáo trên TV được tổ chức trước một đợt bán xôn (xp = 3), ta hy vọng số lượng xe
ô tô bán được trung bình sẽ là:
yˆ p  10  5(3)  25 xe
 xi 10
x  2
n 5
Với độ tin cậy 95% và n – 2 = 3, tra bảng phân phối t ta có t 2,n 2  t0,025, 3  3,182

Dự báo khoảng cho E ( y p )

1 (xp  x )
2
 1 (3  2) 2 
yˆ p  t 2,n  2 se   25  3,182(2,16)   
n  ( xi  x )2  5 4 
 
25 + 4,61 = từ 20,39 đến 29,61 xe
i) Dự báo khoảng cho y p

1 (xp  x )
2
 1 (3  2) 2 
yˆ p  t 2,n  2 se 1    25  3,182(2,16)  1   
n  ( xi  x ) 2  5 4 
 
25 + 8,28 = từ 16,72 đến 33,28 xe

Bài tập chương 5

5.1 Chủ một cửa hàng đồ ngũ kim nhỏ đã nhận thấy mẫu hình doanh số về ổ khoá cửa sổ dường như
giống với số vụ đột nhập được thông báo mỗi tuần trên báo. Dữ liệu này là:
Số vụ đột nhập: 00
Doanh số: 46 18 20 22 27 34 14 37 30
Số vụ đột nhập: 9 3 3 5 4 7 2 6 4
a) Vẽ đồ thị cho dữ liệu để xác định loại phương trình nào, tuyến tính hay phi tuyến, là thích hợp.
17/35
b) Tìm phương trình hồi quy cho dữ liệu.
c) Ước lượng doanh số nếu số vụ đột nhập là 5.

5.2 Một ứng dụng quan trọng của phân tích hồi quy trong kế toán là ước tính chi phí. Bằng cách thu thập
dữ liệu về khối lượng và chi phí và sử dụng phương pháp bình phương bé nhất để phát triển một phương
trình hồi quy ước lượng liên hệ khối lượng với chi phí, một kế toán viên có thể ước tính chi phí gắn liền
với một hoạt động sản xuất cụ thể. Hãy xét một mẫu dữ liệu gồm các khối lượng và tổng chi phí sản xuất
của một hoạt động sản xuất sau đây.

Khối lượng sản xuất (đơn vị) 400 450 550 600 700 750
Tổng chi phí ($) 4000 5000 5400 5900 6400 7000

a) Sử dụng dữ liệu này để phát triển một phương trình hồi quy tuyến tính ước lượng mà có thể được
sử dụng để dự báo tổng chi phí ứng với một khối lượng sản xuất nhất định. Giải thích ý nghĩa của
hệ số góc của phương trình.
b) Tính hệ số xác định và giải thích ý nghĩa của nó.
c) Sử dụng  = 0,05, kiểm định xem mối liên hệ giữa khối lượng sản xuất và tổng chi phí có ý nghĩa
thống kê hay không.
d) Theo kế hoạch sản xuất, công ty phải sản xuất 500 đơn vị trong tháng tới. Hãy xây dựng ước
lượng khoảng dự báo của tổng chi phí cho tháng tới với độ tin cậy 95%.

5.3 Hải và Mai đang dự định lập một quán bán kem ở công viên Gia Định. Sau 5 tháng hoạt động, lượng
kem bán được và số người đến công viên là:

Tháng 1 2 3 4 5
Lượng kem bán được tính theo ngàn 8 6 5 8 9
Số người đến công viên tính theo ngàn 18 16 12 20 24

a) Tìm phương trình hồi quy tuyến tính mô tả mối liên hệ giữa hai biến trên đây.
b) Giải thích ý nghĩa của hệ số góc của phương trình.
c) Tính và giải thích ý nghĩa của hệ số xác định.
d) Hệ số góc của mô hình hồi quy có ý nghĩa thống kê hay không? Kết luận với  = 5%.
e) Dùng phương trình vừa tìm được để dự đoán lượng kem bán được trong tháng tới nếu số người
đến công viên trong tháng tới dự kiến là 18.000 người với độ tin cậy 95%.

5.4 Bộ phận quản lý nhân sự của một công ty lớn muốn xem xét mối liên hệ tương quan giữa tuối tác của
nhân viên và số ngày nghỉ việc của họ. Số liệu sau đây ghi nhận trên một mẫu gồm 10 nhân viên trong
năm 2003:

Nhân viên A B C D Đ E G H L M
Tuổi 27 59 37 23 46 58 29 36 55 40
Số ngày nghỉ 15 6 10 18 9 7 14 11 5 8

Kết quả cho từ Excel như sau:

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,932449
R Square 0,869461
Adjusted R Square 0,853143
Standard Error 1,616298
Observations 10
18/35
ANOVA
df SS MS F Significance F
Regression 1 139,2006494 139,2006 53,2842 0,000084
Residual 8 20,89935065 2,612419
Total 9 160,1

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 22,62662 1,764326985 12,82451 0,000001 18,55808 26,69517
Tuổi -0,30065 0,041187084 -7,2996 0,000084 -0,39563 -0,20567

a) Viết phương trình hồi quy tuyến tính ước lượng, giải thích ý nghĩa của hệ số góc của phương
trình.
b) Hệ số góc của phương trình hồi quy tuyến tính có ý nghĩa thống kê hay không? Kết luận với  =
5%.
c) Giải thích ý nghĩa của hệ số xác định.
d) Với độ tin cậy bằng 95%, hãy dự đoán số ngày nghỉ việc trung bình của nhân viên có tuổi đời là
25.

5.5 Có số liệu về số trang của một cuốn sách (X) và giá bán của nó (Y – ngàn đồng) được cho trong bảng
dưới đây:
Tên sách A B C D E F
X 400 600 500 600 400 500
Y 44 47 48 48 43 46
a) Viết phương trình hồi quy tuyến tính ước lượng của Y theo X, giải thích ý nghĩa của hệ số góc
của phương trình.
b) Hệ số góc của phương trình hồi quy tuyến tính có ý nghĩa thống kê hay không? Kết luận với
 = 5%.
c) Giải thích ý nghĩa của hệ số xác định.
d) Với độ tin cậy bằng 95%, dự đoán giá bán trung bình của tất cả các cuốn sách 450 trang.
e) Với độ tin cậy bằng 95%, dự đoán giá bán của một cuốn sách 450 trang

Chỉ dẫn và đáp số


a) Viết phương trình hồi quy tuyến tính ước lượng của Y theo X, Yˆ  36  0,02 X
Ý nghĩa của hệ số góc của phương trình: Hệ số b1  0,02 chỉ ra rằng, xét các giá trị của X nằm trong
khoảng (400; 600), khi số trang của một cuốn sách tăng hay giảm 1 trang thì giá bán của nó tăng hay
giảm trung bình khoảng 0,02 nghìn đồng.
b) Đặt giả thuyết:
H 0 : 1  0; H a : 1  0
Tính giá trị của thống kê kiểm định:
SSE =
se =
( xi  x )2 
t = 3,33
Quy tắc bác bỏ: Bác bỏ H0 nếu t  t /2,n2 .

Ta bác bỏ giả thuyết không rằng 1  0 ; tức là hệ số góc của phương trình hồi quy tuyến tính có ý
nghĩa thống kê.
19/35
c) Hệ số xác định, r2 = 0,7273, nghĩa là mối liên hệ tuyến tính giữ số trang và giá bán của một cuốn sách
có thể giải thích đến 72,73% biến thiên trong giá bán.
d) Với độ tin cậy bằng 95%, hãy dự báo giá bán trung bình của tất cả các cuốn sách 450 trang.
Ta có:
400  600  500  600  400  500 3000
X    500
6 6
và   X i  X   40.000
2

Với Xp = 450 trang thì Yˆp = 36 + (0,02450) = 45 nghìn

1 Xp  X
2
1  450  500 
2

Vậy s yˆ p  se   1,224744871   0,5863


n   X i  X 2 6 40.000

Với độ tin cậy bằng 95%, t 2,n 2  t0,025,4  2,776

Dự báo khoảng 95% cho giá trung bình của tất cả các cuốn sách 450 trang, E (Yp )
Yˆ  t
p s
 2, n  2 Yˆp

45  (2,7760,5863)
hay 43,37 < E (Yp ) < 46,63
Vậy với độ tin cậy 95%, giá bán trung bình của tất cả các cuốn sách 450 trang sẽ nằm trong khoảng từ
43.370 đồng đến 46.630 đồng.
e) Với độ tin cậy 95%, cuốn sách dày 450 trang sẽ được bán với giá trong khoảng từ 41.230 đồng đến
48.770 đồng.

5.6 Một công ty điện tử ấn định tỉ lệ (%) tăng (+), giảm (-) về giá cả sản phẩm khác nhau ở 10 địa bàn kinh
doanh, và ghi nhận sự thay đổi doanh số (%) trong năm. Số liệu thu thập được tóm tắt như sau:
 X  2;  X  180;  Y  4,7;  Y  386, 29;  XY  246,9
2 2

a) Với số liệu trên, có thể nói rằng khi tăng giá thì doanh số sẽ giảm đi hay không? (Chọn  = 5%)
b) Tìm phương trình hồi qui thể hiện mối liên hệ giữa sự thay đổi doanh số với thay đổi về giá cả. Giải
thích ý nghĩa hệ số góc của phương trình.
c) Hệ số góc của phương trình hồi quy có ý nghĩa thống kê hay không? (Chọn  = 5%)

Chỉ dẫn và đáp số


a) Kiểm định ý nghĩa thống kê của hệ số tương quan tuyến tính
Tính hệ số tương quan mẫu
n XY   X  Y
r
 n  X 2    X 2   n Y 2    Y 2 
  
10( 246,9)  2(4, 7)
r
10(180)  (2) 2  10(386, 29)  (4,7) 2 
-2478,4
  0, 9436
1796 3840,81
Đặt giả thuyết: H 0 :   0; H a :   0
Tính giá trị của thống kê kiểm định
20/35
r -0,9436
t   8, 061
1 r2 1-(-0,9436)2
n2 10-2
Quy tắc bác bỏ: Bác bỏ H 0 nếu t  t ,n 2
Với   0, 05 , n - 2 = 8, tra bảng phân phối t, ta có t ,n 2  t0,05, 8  1,860 .
Vì t = -8,061 < -1,860 nên ta bác bỏ H 0 , nghĩa là ở mức ý nghĩa 0,05, có thể nói rằng khi tăng giá
thì doanh số sẽ giảm đi.
b) Yˆ  0, 7460  1,38 X
c) t = -47,14. Hệ số góc của phương trình hồi quy tuyến tính có ý nghĩa thống kê.

5.7 Làm bài tập 5.10; 5.12 trong SÁCH.


21/35
CHƯƠNG 6

Kết xuất từ Regression (nghĩa là hồi quy) của Excel

SUMMARY OUTPUT

Regression Statistics
Multiple R (r) 0,8692
R Square (r2) 0,7556
Adjusted R Square (Adj r2) 0,7268
Standard Error (se) 1,7385
Observations (n) 20

ANOVA
df SS MS = SS/df F = MSR/MSE Significance F
Regression k = 2 SSR = 158,82 MSR = 79,41 26,27 6,30057E-06
Residual n – k – 1 = 17 SSE = 51,38 MSE = 3,02
Total n – 1 = 19 SST = 210,2

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept b0 = 5,1654 sb0  5,9746 0,8646 0,3993 -7,4398 17,7706
X1 b1 = -0,5419 sb1  0,1974 -2,7450 0,0138 -0,9583 -0,1254
X2 b2 = 0,6685 sb2  0,2386 2,8016 0,0123 0,1651 1,1720

Bài tập chương 6

6.1 Một nghiên cứu được thực hiện dựa trên 30 hộ gia đình nhằm giải thích mức tiêu thụ một loại sản
phẩm (kg/tháng). Mô hình hồi quy tuyến tính của tổng thể như sau:
y   0  1 x1   2 x2  
trong đó:
y : mức sản phẩm tiêu thụ (kg/tháng)
x1 : thu nhập trung bình (triệu đồng tháng)
x2 : số người trong hộ
Các tham số của phương trình hồi quy tuyến tính mẫu xác định bằng phương pháp bình phương nhỏ nhất
như sau:
b0 = -0,029 b1 = 0,055 sb1 = 0,089
b2 = 1,19 sb2 = 0,024
Ngoài ra, kết quả phân tích phương sai với SST = 164 và SSE = 89,5.
Yêu cầu:
a) Giải thích các hệ số b1 và b2 .
b) Tính và giải thích ý nghĩa của hệ số xác định điều chỉnh.
c) Kết luận về sự phù hợp của các biến x1 , x2 và mô hình đã xây dựng. Chọn   0,05.
Giải:
a) Giải thích b1  0, 055 . Với điều kiện số người trong hộ không đổi, khi mức thu nhập trung bình tháng
của hộ tăng thêm/giảm bớt 1 triệu đồng thì mức sản phẩm tiêu thụ hàng tháng của hộ tăng thêm/giảm bớt
trung bình là 0,055 kg.
22/35
Giải thích b2  1,19 . Với điều kiện mức thu nhập trung bình tháng của hộ không đổi, khi số người trong hộ
tăng thêm/giảm bớt 1 người thì mức sản phẩm tiêu thụ hàng tháng của hộ tăng thêm/giảm bớt trung bình
là 1,19 kg.
SSE  n  1  89,5  30  1 
b) Adj r 2  1     1    0, 4138
SST  n  k  1  164  30  2  1 
Phương trình hồi quy ước lượng yˆ  0, 029  0, 055 x1  1,19 x2 có thể giải thích được khoảng 41,38% sự
biến thiên trong mức sản phẩm tiêu thụ hàng tháng của hộ.
c) Ta phải thực hiện kiểm định t cho các hệ số 1 và  2 để kết luận về sự phù hợp của các biến x1 ,
x2 và thực hiện kiểm định F để kết luận về sự phù hợp của mô hình đã xây dựng.
(1) Kiểm định t cho các hệ số 1 và  2
Đặt giả thuyết,
H 0 : 1  0; H 1 : 1  0 H 0 :  2  0; H1 :  2  0
Tính giá trị kiểm định,
b 0, 055 b2 1,19
t 1   0, 618 t   49, 58
sb1 0, 089 sb2 0,024
Quy tắc kiểm định: Bác bỏ H0 nếu t  t /2;n2
Với   0,05, n = 30 ta có: t /2;n  2  t0,025; 27  2,052.
Vì t = 0,618 < 2,052 nên ta không thể bác bỏ Vì t = 49,58 > 2,052 nên ta bác bỏ H0 ở mức ý
H0 ở mức ý nghĩa 5%, nghĩa là biến x1 không nghĩa 5%, nghĩa là biến x2 phù hợp.
phù hợp.

(2) Kiểm định F


Đặt giả thuyết, H 0 : 1   2  0; H1 :  j  0 ( j  1, 2)
Tính giá trị kiểm định,
SSR 164  89, 5
F k  2  11, 24
SSE 89,5
n  k  1 30  2  1
Quy tắc kiểm định: Bác bỏ H0 nếu F  F ;k ;n  k 1
Với   0,05, k = 2, và n = 30 ta có: F ;k ;n  k 1  F0,05; 2; 27  3,35.
Vì F = 11,24 > 3,35 nên ta bác bỏ H0 ở mức ý nghĩa 5%, nghĩa là mô hình phù hợp.

6.2 Dựa vào điểm kiểm tra môn Thống kê của 120 sinh viên, mô hình hồi quy tuyến tính được ước lượng
với các kết quả như sau:

SUMMARY OUTPUT
Regression Statistics
R Square 0,686
Standard Error 0,39362

Coefficients Standard Error


Intercept 2,178
X1 0,469 0,090
X2 0,269 0,056
X3 1,354 1,457
23/35
Y: điểm đạt được thực tế của sinh viên
X1: điểm mong muốn của sinh viên
X2: số giờ tự học môn này trong tuần
X3: giới tính (nam = 1; nữ = 0)

Yêu cầu:
a) Viết phương trình hồi quy ước lượng thể hiện mối liên hệ giữa các biến trên. Giải thích ý nghĩa các hệ
số hồi quy.
b) Giải thích ý nghĩa hệ số R2.
c) Kết luận về sự phù hợp của các biến Xi và mô hình đã xây dựng.
d) Dự đoán điểm cho một sinh viên nữ có 5 giờ tự học trong tuần, với mong muốn đạt điểm 9.
Giải:
a) Phương trình hồi quy ước lượng thể hiện mối liên hệ giữa các biến trên là
Yˆ  b0  b1 X 1  b2 X 2  b3 X 3
 2,178  0, 469 X 1  0, 269 X 2  1,354 X 3
Cách giải thích ý nghĩa của b1 và b2 tương tự bài trên.
Ý nghĩa của b3 = 1,354. Điểm kiểm tra môn Thống kê đạt được thực tế của sinh viên nam cao hơn
sinh viên nữ trung bình là 1,354 điểm.
b) R2 (R Square trong bảng trên) = 0,686. Phương trình hồi quy ước lượng ở câu a có thể giải thích được
khoảng 68,6% sự biến thiên trong điểm kiểm tra môn Thống kê đạt được thực tế của sinh viên.
c) Làm tương tự bài trên.
d) Dự đoán điểm là Yˆ  2,178  0, 469(9)  0, 269(5)  1,354(0)  7, 744.

6.3 Một nghiên cứu được thực hiện trên 20 quan sát để xem xét mối quan hệ giữa lượng khách đi xe buýt
(Y - triệu lượt người) với giá vé (X1 – ngàn đồng/vé) và giá xăng (X2 – ngàn đồng/lít). Một phần kết xuất
của hồi qui từ Excel như sau:
SST = 210,2; SSE = 51,38;
Coefficients Standard Error t Stat
Intercept 5,16544 5,97455 0,86457
X1 -0,54186 0,19739 -2,74505
X2 0,66854 0,23863 2,80164

a) Viết phương trình hồi quy bội của mẫu nhằm dự báo lượng khách đi xe buýt theo hai biến: giá vé
và giá xăng.
b) Giải thích ý nghĩa của các hệ số hồi quy của biến giá vé và biến giá xăng trong phương trình hồi
quy bội của mẫu.
c) Tính hệ số xác định điều chỉnh của mô hình, nêu ý nghĩa.
d) Kiểm định sự phù hợp của mô hình hồi qui tổng thể với mức ý nghĩa 5%.
e) Dự báo lượng khách đi xe buýt khi giá vé = 8.000 đồng/vé và giá xăng = 24.000 đồng/lít.

6.4 Một nghiên cứu được thực hiện để xem xét mối quan hệ giữa lượng khách đi xe buýt (Y - triệu lượt
người) với giá vé (X1 – ngàn đồng/vé) và giá xăng (X2 – ngàn đồng/lít). Dữ liệu thu thập được trên 10
quan sát như sau:

Quan sát Y X1 X2
1 12 12 19
2 10 8 17
3 16 6 21
24/35
4 12 14 17
5 14 8 20
6 12 8 19
7 14 10 20
8 18 4 23
9 20 4 22
10 16 6 20

a) Viết phương trình hồi quy bội của mẫu nhằm dự báo lượng khách đi xe buýt theo hai biến: giá vé
và giá xăng.
b) Giải thích ý nghĩa của các hệ số hồi quy của biến giá vé và biến giá xăng trong phương trình hồi
quy bội của mẫu.
c) Tính hệ số xác định điều chỉnh của mô hình, nêu ý nghĩa.
d) Kiểm định sự phù hợp của mô hình hồi qui tổng thể với mức ý nghĩa 1%.
e) Dự báo lượng khách đi xe buýt khi giá vé = 8.000 đồng/vé và giá xăng = 20.000 đồng/lít.

6.5 Một chuyên viên Phòng học vụ ghi nhận điểm thi học phần Ngôn ngữ Anh, số giờ ôn tập mỗi ngày
và số lần không đến lớp của 10 sinh viên Trường Đại học như sau:
Sinh viên 1 2 3 4 5 6 7 8 9 10
Điểm thi 85 75 85 80 70 75 85 80 85 90
Số giờ ôn tập mỗi ngày 5 2 3 4 1 2 4 3 5 4
Số lần không đến lớp 1 4 2 1 3 3 1 3 2 0
Dữ liệu trên được tóm tắt như sau:

y  x1  x2  yx1  yx 2  x1x 2  x12  x 22


810 33 20 2735 1565 55 125 54
a) Tìm phương trình hồi qui tuyến tính bội của mẫu nhằm dự báo điểm thi học phần Ngôn ngữ Anh
của sinh viên theo hai biến: Số giờ ôn tập mỗi ngày và số lần không đến lớp.
b) Xác định giá trị R2 của mô hình, nêu ý nghĩa?
c) Dự báo điểm thi của một sinh viên có 3 giờ ôn tập mỗi ngày và 4 lần không đến lớp.
Đáp án:
a) ŷ  76,585  2,519x1 1,949x 2.
b) r2 = 0,7746
c) 76 điểm
25/35
CHƯƠNG 7

Ví dụ 7.1 Doanh số một loại sản phẩm trong 3 năm gần đây của một công ty như sau:

Quý
Năm 1 2 3 4
1 98 94 99 104
2 108 100 106 104
3 118 109 102 116

Sử dụng kỹ thuật phân tích chuỗi thời gian để dự báo doanh số loại sản phẩm này của công ty trong năm
thứ 4.
Giải
(1) Vẽ đồ thị dữ liệu, nhận xét và chọn mô hình dự báo theo chuỗi thời gian
 Vẽ đồ thị dữ liệu

140
Doanh số (đơn vị sản phẩm)

120
100
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Quý

 Nhận xét: Dữ liệu có tính xu hướng, tính mùa với chu kỳ biến động là 4 và biên độ dao động thay
đổi.
 Do vậy, ta có thể áp dụng mô hình nhân Y = TSI

(2) Tính các chỉ số thời vụ (S)


 Tính CMA(4) vì chu kỳ biến động của thành phần mùa là 4.
98  94  99  104 94  99  104  108 118  109  102  116
 98, 75 ;  101, 25 ; …;  111, 25
4 4 4
 Tính CMA(2) dựa trên CMA(4)
98, 75  101, 25 101, 25  102, 75 108, 25  111, 25
 100, 00 ;  102, 00 ;…;  109, 75
2 2 2
 Tính SI = Y / CMA(2)
99/100 = 0,990; 104/102,00 = 1,020; …; 109/109,75 = 0,993
26/35

 Tính trung bình cộng các SI ở các quý cùng tên ( S )
(1,042 + 1,085) / 2 = 1,064; (0,957 + 0,993) / 2 = 0,975; …
 Tính S  S  AF vì  S  4, 026  4 (số mùa); AF = số mùa /  S

(3) Tìm phương trình xu hướng, T = f(t)


 Tính Tt = Yt / Sj
27/35

 Vẽ đồ thị T theo t

140
120
Thành phần xu hướng, T

100
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Quý

 Nhận xét: Đồ thị cho thấy T có xu hướng tuyến tính, nghĩa là T = f(t) = b0 + b1t
 Tìm phương trình này
Sử dụng Excel (hoặc có thể tính nhanh bằng máy tính tay), ta có được
Tˆ  b0  b1t  94,37  1,618t
28/35

(4) Tính dự báo doanh số loại sản phẩm này của công ty trong năm thứ 4

Ví dụ 7.2
Có số lượng khách du lịch (1.000 người) từng năm trong giai đoạn 2000 - 2004 của một công ty du lịch X
như sau.

Năm 2000 2001 2002 2003 2004


Số lượng khách 362 519 553 669 827

Hãy dự báo số khách du lịch tại công ty X cho các năm 2005 và 2006 theo ba phương pháp:
a) Lượng tăng giảm tuyệt đối trung bình
b) Tốc độ phát triển trung bình
c) Phương trình xu hướng tuyến tính
Giải
Năm 2000 2001 2002 2003 2004
t 1 2 3 4 5
Số lượng khách, Y 362 519 553 669 827
29/35
a) Lượng tăng giảm tuyệt đối trung bình hàng năm về số khách du lịch trong giai đoạn 2000 - 2004 của
một công ty du lịch X là
Y5  Y1 827  362
    116, 25
5 1 4
Dự báo số khách du lịch tại công ty X theo công thức
Yˆn L  Yn   m

 cho năm 2005 (m = 1): Ŷ  Y   ()   , ()  ,  ngàn người

 cho năm 2006 (m = 2): Ŷ  Y   ()   , ()  .,  ngàn người
b) Tốc độ phát triển trung bình hàng năm về số khách du lịch trong giai đoạn 2000 - 2004 của một công
ty du lịch X là
Y 827
t  51 5  4  1, 2294
Y1 362
Dự báo số khách du lịch tại công ty X theo công thức
Yˆn m  Yn ( t )m

 cho năm 2005 (m = 1): Ŷ  Y ( t )  (, )  .,  ngàn người

 cho năm 2006 (m = 2): Ŷ  Y ( t )   (, )   .,  ngàn người
c) Phương trình xu hướng tuyến tính
Đồ thị dữ liệu cho thấy một phương trình xu hướng tuyến tính là thích hợp.

900
800
700
Số khách du lịch

600
500
400
300
200
100
0
1999 2000 2001 2002 2003 2004
Năm

Ta lập bảng tính toán sau:

Năm t Y tY t2
2000 1 362 362 1
2001 2 519 1038 4
2002 3 553 1659 9
2003 4 669 2676 16
2004 5 827 4135 25
Tổng 15 2930 9870 55
30/35
Thế số vào các công thức tính b1 và b0 , ta có:
n n n
n  tiYi   ti  Yi 5(9870)  15(2930)
b1  i 1 i 1 i 1
  108
  5(55)  (15) 2
n n 2
n ti2   ti
i 1 i 1

n n
 Yi  ti
2930  15 
b0  i 1  b1 i 1   108    262
n n 5 5
Phương trình xu thế tuyến tính:
Yˆ  262  108t t

Dự báo số khách du lịch tại công ty X cho năm 2005 (t = 6)


Yˆ6  262  108(6)  910 ngàn người
Dự báo số khách du lịch tại công ty X cho năm 2006 (t = 7)
Yˆ7  262  108(7)  1018 ngàn người

1200
1000
Số khách du lịch

800
600
400
200
0
1999 2000 2001 2002 2003 2004 2005 2006
Năm

Bài tập chương 7

7.1 Doanh số đồ uống có cồn ở một cửa hàng bán rượu chai trong ba ngày liên tiếp là:

Ngày Buổi sáng Buổi chiều Buổi tối


1 204 450 939
2 261 459 1056
3 315 522 1113

a) Vẽ biểu đồ hiển thị chuỗi thời gian.


b) Tính các số bình quân di động tâm ba điểm cho chuỗi này. Xác định các chỉ số thời vụ cho mỗi
buổi trong ngày.
c) Ước lượng các giá trị của xu hướng trong ngày 4 sử dụng phân tích hồi quy.
d) Dự báo doanh số cho mỗi buổi của ngày 4.

Chỉ dẫn và đáp số


a)
31/35

1200
Toái
Toái
1000
Toái
800

Doanh soá 600


Chieàu
Chieàu Chieàu
400 Saùng
Saùn g
Saùn g 3
200 2
1
0
0 1 2 3 4 5 6 7 8 9 10

b)
Ngày Buổi t Y CMA(3) Y/CMA(3)
1 Sáng 1 204
Chiều 2 450 531 0,8475
Tối 3 939 550 1,7073
2 Sáng 4 261 553 0,4720
Chiều 5 459 592 0,7753
Tối 6 1056 610 1,7311
3 Sáng 7 315 631 0,4992
Chiều 8 522 650 0,8031
Tối 9 1113

Buổi
Ngày Sáng Chiều Tối Tổng
1 0,8475 1,7073
2 0,4720 0,7753 1,7311
3 0,4992 0,8031
Tổng 0,9712 2,4259 3,4384
Trung bình 0,4856 0,8086 1,7192 3,0134
Chỉ số mùa (SIj) 0,4834 0,8050 1,7116 3,0000

c)
Ngày Buổi t Y T = Y/SI tT t2
1 Sáng 1 204 422 1×422 = 422 12 = 1
Chiều 2 450 559 2×559 = 1118 22 = 4
Tối 3 939 549 3×549 = 1647 32 = 9
2 Sáng 4 261 540
Chiều 5 459 570
Tối 6 1056 617
3 Sáng 7 315 652
Chiều 8 522 648
Tối 9 1113 650
TỔNG 45 5207 27497 285

Hồi quy T theo t để tìm phương trình Tˆt  b0  b1t


n  tT   t  T 9(27497)  (45)(5207)
với b1    24, 37
n  t 2  ( t ) 2 9(285)  (45) 2
5207 45
b0   (24,37)  457
9 9
32/35
Vậy Tˆt  457  24,37t
Dự báo thành phần xu hướng của doanh số cho
 Buổi sáng, ngày 4 (t = 10), Tˆ  457  24,37(10)  700,70
10

 Buổi chiều, ngày 4 (t = 11), Tˆ11  457  24,37(11)  725, 07


 Buổi tối, ngày 4 (t = 12), Tˆ12  457  24,37(12)  749, 44

d) Dự báo doanh số cho mỗi buổi của ngày 4 theo công thức Yˆt ; j  Tˆt  SI j

 Buổi sáng, ngày 4, Yˆ10; S  Tˆ10 SI S  (700, 70)(0, 4834)  339


 Buổi chiều, ngày 4, Yˆ11;C  Tˆ11SI C  (725, 07)(0,8050)  584
 Buổi tối, ngày 4, Yˆ12; S  Tˆ12 SIT  (749, 44)(1,7116)  1283

7.2 Công ty A vận chuyển trái cây đóng hộp khắp nơi trên thế giới. Sử dụng những thông tin sau đây,
người quản lý muốn dự báo số chuyến hàng gửi trong bốn tháng đầu năm tới.

Tháng 1 2 3 4 5 6 7 8 9 10 11 12
Chỉ số thời vụ 1,2 1,3 1,3 1,1 0,8 0,7 0,8 0,6 0,7 1,0 1,1 1,4

Phương trình dự báo theo tháng cho thành phần xu hướng của số chuyến hàng gửi đang sử dụng là:
Tˆt  402  3t
trong đó
t  0 : tháng một năm rồi
Tt = thành phần xu hướng của số chuyến hàng gửi

7.3 Bảng dưới đây trình bày doanh số theo quý ở năm hiện hành của một công ty. Anh/Chị hãy dự báo
doanh số cho quý thứ nhất của năm tới. Các chỉ số thời vụ là SI1 = 1,10; SI2 = 0,99; SI3 = 0,90; và SI4 =
1,01.

Quý 1 2 3 4
Doanh số 88 99 108 141,4

7.4 Bảng dưới đây là doanh số quạt máy (cái) của một siêu thị được thu thập theo mùa trong ba năm.
Mùa Thu Đông Xuân Hạ
Năm 1 200 150 220 380
Năm 2 220 200 370 410
Năm 3 270 220 375 430
a) Vẽ đồ thị doanh số theo thời gian. Từ đồ thị hãy chọn mô hình (nhân tính hay cộng tính) thích hợp
với chuỗi thời gian này? Giải thích.
b) Dùng phương pháp trung bình động định tâm tính và giải thích các chỉ số mùa.
c) Dự báo doanh số quạt máy cho mùa hạ năm thứ tư.

7.5 Có số liệu về giá trị sản xuất (GO) của một doanh nghiệp như sau:

Năm 2008 2009 2010 2011 2012 2013


GO (tỷ đồng) 100 120 145 170 200 225
33/35
a) Tính lượng tăng/giảm tuyệt đối trung bình.
b) Tính tốc độ phát triển trung bình.
c) Để dự đoán GO trong năm 2014 thì nên dựa vào lượng tăng/giảm tuyệt đối trung bình hay tốc độ
phát triển trung bình? Mức dự báo là bao nhiêu?

7.6 Hãy ước lượng các chỉ số thời vụ cho dữ liệu sau:
Năm: 1 2 3 4
Quý: 1 2 3 4 1 2 3 4 1 2 3 4 1
Mức cầu: 14 18 35 46 28 36 60 71 45 54 84 88 58

7.7 Nhu cầu thực về một loại sản phẩm của Công ty A trong thời gian qua quan sát được như sau (Đơn vị
tính: sản phẩm):

Các quý
Năm
I II III IV
1 209 854 628 429
2 213 869 629 420
3 208 859 619 419
4 204 853 624 427

Hãy dự báo nhu cầu cho năm thứ 5 bằng phương pháp bình quân giản đơn và dự báo nhu cầu cho các quý
của năm thứ 5.

7.8 Làm bài tập 7.3 trong SÁCH.

You might also like