You are on page 1of 42

Chương 6: Phân tích và dự báo chuỗi thời gian.

Mục đích của chương này cung cấp phần mở đầu về phân tích chuỗi thời gian và
dự báo. Giả sử, chúng ta yêu cầu cung cấp dự báo hằng quý doanh số bán hàng của
một trong những sản phẩm của công ty chúng ta trong khoảng thời gian một năm
tới. Qúa trình sản xuất, mua nguyên liệu thô, chính sách kiểm kê và hạn ngạch bán
hàng tất cả sẽ bị ảnh hưởng bởi dự báo hàng quý mà chúng ta cung cấp. Vì vậy, sự
dự báo yếu kém có thể dẫn đến việc lập kế hoạch kém và làm tăng chi phí của công
ty. Chúng ta nên làm thế nào để cung cấp dự báo doanh số bán hàng hằng quý.

Sự phán đoán, trực giác và nhận thức tốt về tình trạng nền kinh tế có thể cho chúng
ta một ý tưởng hoặc ‘ cảm giác ’ về những gì có thể xảy ra trong tương lai, nhưng
chuyển đổi cảm giác đó thành một con số có thể được sử dụng để dự báo bán hàng
cho năm tiếp theo là thách thức. The QM in Action, Forecast Energy Needs trong
The Unility Industry, mô tả vai trò dự báo trong ngành công nghiệp tiện ích.

Phương pháp dự báo có thể được phân loại thành định tính và định lượng. Các
phương pháp phân tích định lượng thường liên quan đến việc sử dụng phán đoán
của các chuyên gia để phát triển các dự báo. Các phương thức dự báo đưa ra thích
hợp khi các dữ liệu lịch sử về biến được dự báo không khả dụng hoặc không áp
dụng. Các phương pháp dự báo định lượng có thể được sử dụng khi (1) thông tin
trong quá khứ của biến được dự báo là sẵn có, (2) thông tin có thể xác định được
số lượng, (3) nó là hợp lý khi giả định rằng quá khứ là phần mở đầu ( mô hình của
quá khứ sẽ tiếp tục trong tương lai ). Chúng ta sẽ dành sự tập trung vào các phương
pháp dự báo định lượng trong chương này.

Nếu dữ liệu lịch sử bị giới hạn trong các giá trị quá khứ của các biến được dự báo,
quy trình dự báo này được gọi là phương pháp chuỗi thời gian và dữ liệu lịch sử
được quy vào một chuỗi thời gian. Mục tiêu của phân tích chuỗi thời gian là khám
phá ra một thành phần dữ liệu lịch sử hoặc chuỗi thời gian và sau đó suy ra thành
phần đó trong tương lai; dự báo này được dựa trên các giá trị trong quá khứ của
biến và/ hoặc các lỗi dự báo trong quá khứ.

Trong phần 6.1 chúng ta thảo luận về các loại chuỗi thời gian mà một người dự báo
ngang, một xu hướng, một thành phần mùa, cả xu hướng và mùa và thành phần
chu kỳ. Để xây dựng mô hình dự báo định lượng, nó cũng cần thiết để đo lường độ
chính xác của dự báo. Các phép đo khác nhau về độ chính xác của dự báo, và lợi
thế, nhược điểm của chúng, là được thảo luận ở phần 6.2. Trong phần 6.3, chúng ta
xem xét về các trường hợp đơn giản nhất, đó là một thành phần ngang hoặc không
đổi. Đối với thành phần này, chúng ta phát triển trung bình trượt, trung bình trượt
có trọng số và mô hình làm tăng theo số mũ. Nhiều chuỗi thời gian có xu hướng,
và việc xem xét xu hướng này là quan trọng; trong phần 6.4 chúng tôi cung cấp các
mô hình hồi quy để tìm ra các tham số mô hình tốt nhất khi nó có xu hướng tuyến
tính. Cuối cùng, trong phần 6.5 chúng tôi cho thây sự kết hợp cả xu hướng và mùa
trong mô hình dự báo.

6.1: Thành phần ngang:


Chuỗi thời gian là một chuỗi của những quan sát trên một biến đo lường tại các
điểm liên tiếp theo thời gian hoặc trong các khoảng thời gian liên tiếp. Việc đo
lường có thể được thực hiện mỗi giờ, ngày, tuần, tháng, năm hoặc bất kì khoảng
thời gian nào khác. Thành phần của dữ liệu là một trong những nhân tố quan trọng
trong việc hiểu hành vi của chuỗi thời gian như thế nào trong quá khứ. Nếu hành vi
như vậy có thể được dự kiến sẽ tiếp tục trong tương lai, chúng ta có thể sử dụng nó
để hướng dẫn chúng ta lựa chọn một phương pháp dự báo thích hợp.

Để xác định thành phần cơ bản trong thành phần dữ liệu, bước hữu ích đầu tiên là
vẽ một đồ thị chuỗi thời gian. Một đồ thị chuỗi thời gian là một đồ thị trình bày về
mối quan hệ giữa thời gian và biến chuỗi thời gian. Thời gian được trình bày theo
trực ngang và biến chuỗi thời gian sẽ được trình bày theo trục dọc.Trước tiên
chúng ta hãy xem xét một số dữ liệu phổ biến có thể được xác định khi kiểm tra
một đồ thị chuỗi thời gian.

Thành phần ngang

Thành phần ngang tồn tại khi dữ liệu dao động ngẫu nhiên xung quanh một hằng
số theo thời gian. Để minh họa một chuỗi thời gian với thành phần nằm ngang,
xem xét dữ liệu 12 tuần ở bảng 6.1. Dữ liệu cho thấy số lượng gallons của lượng
xăng ( trong 1000s ) được bán bởi một nhà cung cấp xăng ở Bennington, Vermont,
trong 12 tuần qua. Gía trị trung bình cho chuỗi thời gian này là 19,25 hay 19,250
gallon mỗi tuần. Hình 6.1 cho thấy chuỗi thời gian trong dữ liệu này. Chú ý dữ liệu
dao động quanh giá trị trung 19,25. Mặc dù có sự biến động ngẫu nhiên, chúng ta
nói rằng dữ liệu này theo thành phần ngang.

Bảng 6.1: Chuỗi thời gian doanh số bán xăng

Week Sales( 1000s of gallons )

1 17

2 21

3 19

4 23

5 18

6 16

7 20

8 18

9 22

10 20

11 15

12 22
GASOLINE SALES TIME SERIES PLOT
25

20
sales( 1000s of gallons )

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12
week

Thuật ngữ cố định chuỗi thời gian được sử dụng để biểu thị một chuỗi thời gian
với các biến số không phụ thuộc vào thời gian:

1. Qúa trình tạo ra dữ liệu có nghĩa là không đổi.


2. Biến thiên của chuỗi thời gian là hằng số theo thời gian.

Một đồ thị chuỗi thời gian cho một chuổi thời gian ổn định sẽ luôn luôn thể hiện
một thành phần ngang với những biến động ngẫu nhiên. Tuy nhiên, chỉ quan sát
một thành phần ngang là không đủ thuyết phục để kết luận rằng chuỗi thời gian là
ổn định. Các văn bản nâng cao hơn về dự báo thảo luận các quy trình để xác định
xem một chuỗi thời gian có cố định hay không và cung cấp những phương thức để
chuyển đổi chuỗi thời gian không phải là một chuỗi cố định.

Những thay đổi trong điều kiện kinh doanh có thể thường xuyên dẫn đến một chuỗi
thời gian có thành phần ngang chuyển dộng sang một cấp độ mới. Ví dụ, giả sử
nhà phân phối xăng kí hợp đồng với cảnh sát Vermont Sate để cung cấp xăng cho
xe cảnh sát của tiểu bang ở miễn nam Vermont bắt đầu vào tuần thứ 13. Với hợp
đồng này, nhà phân phối tự nhiên dự kiến sẽ tăng doanh thu hằng tuần bắt đầu từ
tuần 13. Bảng 6.2 cho thấy số gallon xăng được bán cho chuỗi thời gian đầu và
mười tuần sau khi kí bản hợp đồng mới.Hình 6.2 cho thấy biểu đồ chuỗi thời gian
tương ứng. Lưu ý, mức tăng của chuỗi thời gian bắt đầu trong tuần 13.Một sự thay
đổi trong mức độ các chuỗi thời gian làm cho nó khó khăn hơn để lựa chọn một
phương pháp dự báo thích hợp.
Bảng 6.2: Chuỗi thời gian doanh số bán xăng sau hợp đồng với Vermont State
Police
Week Sales ( 1000s of gallons ) Week Sales ( 1000s of gallons )
1 17 12 22
2 21 13 31
3 19 14 34
4 23 15 31
5 18 16 33
6 16 17 28
7 20 18 32
8 18 19 30
9 22 20 29
10 20 21 34
11 15 22 33

Gasoline sales time series plot after obtaining the contract with the vermont
state police

40
Sales( 1000s of gallons )

35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223
week

Thành phần xu hướng


Mặc dù dữ liệu chuỗi thời gian thường biểu hiện dao động ngẫu nhiên, một chuỗi
thời gian cũng có thể cho thấy sự thay đổi dần dần hoặc chuyển động tương đối
cao hơn hoặc các giá trị thấp hơn trong mộtkhoảng thời gian dài. Nếu một chuỗi
thời gian biểu hiện hành vi này, chúng ta nói rằng một thành phần xu hướng tồn
tại. Một xu hướng luôn luôn là kết quả của các yếu tố dài hạn như tăng dân số,
nhân khẩu học hoặc cải tiến công nghệ và/hoặc thay đổi sở thích người tiêu dùng.
Để minh họa cho chuỗi thời gian với xu hướng tuyến tính, xem xét chuỗi thời gian
doanh số bán xe đạp của một nhà sản xuất cụ thể trong 10 năm qua, thể hiện ở
bảng 6.3 và đồ thị chuỗi thười gian tương ứng hình 6.3. Lưu ý rằng, 21600 xe đạp
được đã được bán trong năm thứ 1, 22900 được bán vào năm 2 và tiếp tục như vậy.
Trong 10 năm, năm gần đây nhất, đã có 31400 chiếc xe đạp được bán ra. Kiểm tra
trực quan đồ thị chuỗi thời gian cho thấy sự chuyển động lên xuống trong 10 năm
qua, nhưng chuỗi thời gian nhường như có xu hướng tăng hoặc tăng lên một cách
có hệ thống.

Bảng 6.3: Chuỗi thời gian doanh số bán xe đạp.


Year Sales ( 1000s )
1 21.6
2 22.9
3 25.5
4 21.9
5 23.9
6 27.5
7 31.5
8 29.7
9 28.6
10 31.4
Bicycle sales time series plot
35

30

25
Sales ( 1000s )

20

15

10

0
1 2 3 4 5 6 7 8 9 10
Year

Xu hướng cho chuỗi thời gian bán xe đạp dường như tuyến tính và tăng theo thời
gian, nhưng đôi khi một xu hướng có thể được miêu tả tốt hơn bằng loại thành
phần khác. Ví dụ, dữ liệu bảng 6.4 tương ứng với đồ thị chuỗi thời gian hình 6.4
cho thấy doanh thu bán hàng cho một loại thuốc cholesterol kể từ khi công ty giành
được sự chấp thuận FDA cho thuốc cách đây 10 năm. Chuỗi thời gian tăng lên một
cách phi tuyến tính, đó là tốc độ thay đổi doanh thu không tăng theo số lượng
không đổi từ năm này sang năm khác. Trên thực tế, doanh thu đường như đang
tăng theo kiểu mũ. Mối quan hệ theo cấp số nhân như thế này là thích hợp khi tỷ lệ
phần trăm thay đổi từ một giai đoạn sang giai đoạn tiếp theo là tương đối không
đổi.
Bảng 6.4: Chuỗi thời gian doanh thu thuốc Cholesterol ( triệu đô )

Year Sales( 1000s )

1 23.1

2 21.3

3 27.4
4 34.6

5 33.8

6 43.2

7 59.5

8 64.4

9 74.2

10 99.3

cholesterol drug revenue time series( $ millions )


120
100
80
Revenue

60
40
20
0
1 2 3 4 5 6 7 8 9 10
Year

Thành phần mùa

Xu hướng của một chuỗi thời gian có thể được xác định bằng cách phân tích các
biến động trong dữ liệu lịch sử qua nhiều năm. Các thành phần mùa được nhận biết
bằng cách quan sát thành phần định kì trong các khoảng thời gian liên tiếp. Ví dụ,
một nhà sản xuất bể bơi dự kiến hoạt động bán hàng thấp trong những tháng mùa
thu và mùa đông, với doanh thu cao nhất vào mùa xuân và mùa hè sẽ xảy ra mỗi
năm. Tuy nhiên, các nhà sản xuất thiết bị di chuyển tuyết và áo ... mong đợi mô
hình hằng năm ngược lại. Không có gì đáng ngạc nhiên, thành phần chuỗi thời gian
biểu diễn một mẫu lặp lại trong khoảng thời gian một năm do ảnh hưởng mùa được
gọi là thành phần mùa. Mặc dù chúng ta thường nghĩ đến chuyển động theo mùa
trong một chuỗi thời gian như xảy ra trong vòng một năm, dữ liệu chuỗi thời gian
cũng có thể thể hiện các thành phần theo mùa ít hơn một năm. Ví dụ, khối lượng
giao thông hằng ngày cho thấy hành vi theo mùa trong ngày, với mức đỉnh xảy ra
trong giờ cao điểm, dòng chảy vừa phải còn lại trong ngày và buổi tối sớm, và
dòng chảy nhẹ diễn ra từ nửa đêm đến sáng sớm. Một ví dụ khác về ngành công
nghiệp có doanh số thể hiện các thành phần theo mùa dễ dàng thấy rõ trong một
ngày là ngành công nghiệp nhà hàng.

Một ví dụ về mẫu theo mùa, hãy xem xét số lượng ô được bán ra ở một của hàng
bán vải trong 5 năm qua. Bảng 6.5 cho thấy chuỗi thời gian và hình 6.5 cho thấy
biểu đồ chuỗi thời gian tương ứng. Biểu đồ chuỗi thời gian không chỉ ra xu hướng
dài hạn trong bán hàng. Trên thực tế, trừ khi bạn xem xét cẩn thận dữ liệu, bạn có
thể giả định rằng dữ liệu tuân theo thành phần ngang với biến động ngẫu nhiên.
Tuy nhiên, việc kiểm tra chặt chẽ hơn về các biến động trong đồ thị chuỗi thời
gian cho thấy một mô hình có hệ thống trong dữ liệu xảy ra trong mỗi năm. Có
nghĩa là, quý đầu tiên và quý thứ 3 có doanh thu vừa phải, quý thứ hai có doanh số
cao nhất và quý thứ 4 có xu hướng doanh số thấp nhất. Do đó, chúng tôi sẽ kết luận
rằng thành phần theo mùa hằng quý tồn tại.

Bảng 6.5: Chuỗi thời gian doanh số bán ô.

Year Quarter Sales

1 1 125

2 153

3 106

4 88

2 1 118
2 161

3 133

4 102

3 1 138

2 144

3 113

4 80

4 1 109

2 137

3 125

4 109

5 1 130

2 165

3 128

4 96
Umbrella sales time series plot

200

150
Sales

100

50

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Time period

Thành phần xu hướng và mùa

Một số chuỗi thời gian bao gồm cả thành phần xu hướng và mùa. Ví dụ, bảng dự
liệu 6.6 và đồ thị chuỗi thời gian tương ứng hình 6.6 cho thấy doanh số bán tivi
hằng quý của một nhà sản xuất cụ thể trong bốn năm qua. Rõ ràng có sự tồn tại của
sự gia tăng xu hướng. Tuy nhiên, hình 6.6 cũng chỉ ra rằng, doanh số bán hàng
thấp nhất trong quý 2 mỗi năm và cao nhất ở quý 3 và 4. Do đó, chúng ta kết luận
rằng thành phần theo mùa cũng tồn tại cho doanh số bán tivi. Trong trường hợp,
chúng ta cần sử dụng phương pháp dự báo mà có thể giải quyết cả xu hướng và
mùa.

Bảng 6.6: Chuỗi thời gian doanh số bán tivi theo quý.

Year Quarter Sales ( 1000s )

1 1 4.8
2 4.1
3 6.0
4 6.5
2 1 5.8
2 5.2
3 6.8
4 7.4
3 1 6.0
2 5.6
3 7.5
4 7.8
4 1 6.3
2 5.9
3 8.0
4 8.4

Quarterly Television Set Time Series Plot.


10
Quarterly Television set

8
sales( 1000s )

6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Period

Thành phần chu kì

Một thành phần chu kì tồn tại nếu đồ thị chuỗi thời gian biểu diễn một chuỗi các
điểm xen kẽ và thấp hơn đường xu hướng kéo dài hơn một năm. Nhiều chuỗi thời
gian kinh tế thể hiện hành vi theo chu kì với các quan sát thường xuyên bên dưới
và phía trên đường xu hướng. Thường chu kì cấu thành một chuỗi thời gian là do
chu kì kinh doanh nhiều năm. Ví dụ, thời gian lạm phát vừa phải theo sau thời kì
lạm phát nhanh có thể dẫn đến chuỗi thời gian thay thế bên dưới và phía trên
đường xu hướng ngày càng tăng ( ví dụ, thời gian sử dụng cho chi phí nhà ở ). Chu
kì kinh doanh là vô cùng khó nếu không muốn nói là không thể dự báo. Kết quả là,
các hiệu ứng theo chu kì thường kết hợp với các hiệu ứng xu hướng dài hạn và
đuộc gọi là hiệu ứng chu kì xu hướng.Trong chương này chúng ta không xử lý biến
động mang tính chu kì có thể có trong chuỗi thời gian.

Lựa chọn một phương pháp dự báo

Thành phần cơ bản chuỗi thời gian là nhân tố quan trọng để lựa chọn một phương
pháp dự báo. Vì vậy, đồ thị chuỗi thời gian nên là một trong những công cụ phân
tích đầu tiên được sử dụng khi cố gắng xác định phương pháp dự báo sẽ nào sử
dụng. Nếu chúng ta thấy một thành phần ngang, thì chúng ta cần phải chọn một
phương thức dự báo thích hợp cho thành phần này. Tương tự như vậy, nếu chúng
ta quan sát trên một dữ liệu xu hướng, sau đó chúng ta cần sử dụng phương pháp
dự báo mà có khả năng giải quyết xu hướng. Trong 2 phần tiếp theo chúng ta sẽ
minh họa phương pháp cho việc đánh giá khả năng dự báo chính xác và xem xét
mô hình dự báo mà có thể được dùng trong trường hợp mà thành phần cơ bản là
ngang; nói cách khác không có xu hướng và hiệu ứng theo mùa nào có mặt. Sau đó
chúng ta xem xét phương pháp thích hợp khi xu hướng và/ hoặc mùa có mặt trong
dữ liệu. The QA in Action, Forecasting Demand cho một Broad Product Line Of
Office Products, mô tả các xem xét được thực hiện bởi ,MeadWestvaco khi dự báo
nhu cầu cho người tiêu dùng và văn phòng sản phẩm.

6.2 Mức độ chính xác của dự báo


Trong phần này chúng ta sẽ khởi đầu với việc phát triển các dự báo cho chuỗi thời
gian doanh số bán dầu hỏa ở bảng 6.1 bằng cách sử dụng phương pháp dự báo đơn
giản nhất, một phương pháp sử dụng lượng doanh số bán dầu ở tuần gần với hiện
tại nhất để làm dự báo cho tuần kế tiếp. Tỉ như, nhà phân phối bán ra 17.000
gallons dầu hỏa ở tuần một; giá trị này sẽ được sử dụng làm dự báo cho tuần hai.
Kế tiếp, chúng ta sử dụng 21, giá trị thực tế của tuần 2 để làm dự báo cho tuần 3,
và tương tự cho những kì kế tiếp. Những dự báo thu được từ các giá trị quá khứ
bằng cách sử dụng phương pháp này được biểu thị ở bảng 6.7 tại cột “Dự báo”.
Bởi vì tính đơn giản của nó, phương pháp này thường được ví như “phương pháp
giản đơn”.

Vậy độ chính xác của dự báo là bao nhiêu nếu chúng ta sử dụng phương pháp nêu
trên? Để trả lời câu hỏi đi, chúng tôi sẽ giới thiệu một vài thước đo để xác định độ
chính xác của dự báo. Những thước đo này sẽ quyết định rằng một phương pháp
dự báo chính xác đến mức nào, và liệu rằng nó có thể tái tạo được những giá trị
chuỗi thời gian đã tồn tại hay không. Từ việc lựa chọn một phương pháp xác đáng
nhất cho những giá trị sẵn có, chúng tôi hi vọng có thể mở rộng khả năng thu về
những dự báo chính xác hơn cho các giá trị tương lai.

Khái niệm then chốt sóng đôi cùng việc xác định mức độ chính xác của dự báo là
sai số dự báo. Nếu chúng ta lấy Yt và Ft lần lượt làm kí hiệu cho giá trị thực tế và
giá trị dự báo của chuỗi thời gian cho thời kì t, tương ứng, sai số dự báo cho thời kì
t sẽ là:

et = Yt – Ft

Như thế, sai số dự báo cho thời kì t chính là sự khác biệt giữa giá trị thực tế và giá
trị dự báo cho thời kì t.

Bảng 6.7: Ước tính dự báo và các thước đo độ chính xác của dự báo bằng cách
lấy những giá trị gần với hiện tại nhất làm dự báo cho kì kế tiếp

Thí dụ, vì trong thực tế nhà phân phối đã sản xuất 21.000 gallonss dầu hỏa ở tuần
2, còn dự báo được lập ra cho tuần 2 bằng cách lấy giá trị doanh thu bán được ở
tuần 1 là 17.000 gallons, sai số dự báo sẽ là:

Sai số dự báo trong tuần 2 = e2 = Y2 – F2 = 21 – 17 = 4


Việc sai số dự báo là giá trị dương cho thấy rằng ở tuần thứ hai phương pháp dự
báo đã đánh giá thấp giá trị thực tế của doanh số bán hàng. Tiếp theo, ta sử dụng
21, giá trị thực tế của doanh số bán hàng ở tuần 2 để làm dự báo cho tuần 3. Bởi vì
giá trị thực tế của lượng dầu hỏa bán đi của tuần 3 là 19, sai số dự báo là e 3 = 19 –
21 = -2. Ở trường hợp này, sai số dự báo âm đã phản ánh việc dự báo đã đánh giá
quá cao giá trị thực tế cho tuần 3. Thế nên, sai số dự báo có thể âm hoặc dương tùy
thuộc vào việc dự báo quá cao hay quá thấp. Một tóm lược đầy đủ cho những sai
số dự báo thu được từ phương pháp dự báo đơn giản này được chỉ ra ở bảng 6.7 tại
cột “Sai số dự báo”. Cần phải chú ý đến việc chúng ta đang sử dụng giá trị quá khứ
của chuỗi thời gian để hình thành dự báo cho thời kì t, thế nên chúng ta sẽ không
có dữ liệu đầy đủ để cung cấp dự báo cho tuần đầu tiên của chuỗi thời gian khi sử
dụng phương pháp dự báo giản đơn.

Một thước đo đơn giản cho việc xác định độ chính xác dự báo là lấy trung gian
hoặc trung bình của sai số dự báo. Nếu chúng ta có n thời kì trong chuỗi thời gian
và k là thứ tự của thời kì nằm đầu của chuỗi thời gian mà tại đó không thể nào áp
dụng phương pháp dự báo giản đơn, sai số dự báo trung bình ( MFE) sẽ là:
n

∑ et
(6.2)
t =k+1
MFE=
n−k

Bảng 6.7 chỉ ra rằng tổng của các sai số dự báo cho chuỗi thời gian doanh số bán
dầu hỏa là 5; cho nên, sai số dự báo trung gian hoặc trung bình sẽ bằng 5/11=0,45.
Bởi vì chúng ta không có đầy đủ dữ liệu để áp dụng phương pháp dự báo giản đơn
cho tuần đầu của chuỗi thời gian này, chúng ta phải điều chỉnh phép tính ở dạng tử
và mẫu số. Việc này là khá thông thường cho trong quá trình dự báo; chúng ta
thường sử dụng những thời kì quá khứ của chuỗi thời gian k để tạo ra dự báo, nên
thường không thể hình thành chữ báo cho thời kì k đầu tiên. Ở các ví dụ trên, tổng
của các con số nằm ở tử số lấy từ điểm giá trị đầu tiên của thời kì t, nơi chúng ta đã
tạo ra một dự báo ( nên chúng ta bắt đầu lấy tổng tại t=k+1), và mẫu số ( lấy thứ tự
của thời kì trong chuỗi thời gian tại điểm chúng ta có thể tạo ra dự báo) cũng sẽ
phản ánh vấn đề này. Trong ví dụ về việc bán dầu hỏa, mặc dù chuỗi thời gian bao
gồm 12 giá trị nhưng khi tính toán sai số trung bình chúng ta chỉ lấy tổng của 11
sai số dự báo ( chúng ta không thể lập dự báo cho tuần đầu tiên nếu sử dụng
phương pháp giản đơn). Những điều chỉnh đó cần phải được thực hiện để đo đạt
sai số dự báo trong trường hợp chúng ta không thể tạo ra các dự báo cho tất cả các
thời kì trong chuỗi thời gian.

Cũng cần phải lưu ý rằng, trong chuỗi thời gian doanh số bán dầu hỏa, sai số dự
báo trung bình là dương, điều đó thể hiện rằng phương pháp này thường dự báo
thuyên giảm, tức là, giá trị quan sát được ở thực tế thường có xu hướng lớn hơn giá
trị dự báo. Vì sai số dự báo âm và sai số dự báo dương có khuynh hướng bù trừ
cho nhau, sai số trung bình thường nhỏ; thế nên, giá trị trung bình không phải là
một thước đo quá hữu dụng để đo đạt độ chính xác của dự báo.

Sai số dự báo tuyệt đối, ký hiệu là MAE, là một thước đo độ chính xác của sự báo
sẽ giúp ta tránh đi vấn đề sai số dự báo âm và dương bù trừ cho nhau. Như tên gọi
của nó, MAE là trung bình các giá trị tuyệt đối của sai số dự báo:
n

∑ |et| (6.3)
t =k+1
MAE=
n−k

Thước đo này còn được gọi là sự chênh lệch tuyệt đối hay MAD. Bảng 6.7 chỉ ra
tổng các giá trị tuyệt đối của sai số dự báo là 41; thế nên:
41
MAE= Trung bình các giá trị tuyệt đối của sai số dự báo= 11 = 3.73

Một thước đo khác cũng giúp tránh đi vấn đề sai số âm và dương bù trừ cho nhau
thu được từ việc lấy trung bình tổng bình phương của sai số dự báo. Thước đo độ
chính xác của dự báo này được gọi là sai số bình phương trung bình, ký hiệu là
MSE
n

∑ e2t
MSE= t=k+ 1
n−k

Từ bảng 6.7, tổng của các sai số dự báo đã lấy bình phương là 179; suy ra,
179
MSE = Trung bình tổng các sai số dự báo đã lấy bình phương= 11 = 16.27

Độ lớn của MAE và MSE phụ thuộc vào sự sắp xếp của dữ liệu. Thế nên, rất khó
để so sánh giữa các khoảng thời gian khác nhau ( tỉ như khi so sánh giữa một
phương báo dự báo hằng tháng với một phương pháp dự báo hằng tuần) hoặc trong
việc dự báo xuyên suốt những chuỗi thời gian khác nhau ( so sánh giữa doanh số
bán xăng dầu và doanh số bán bộ lọc dầu). Để có thể so sánh những điều trên
chúng ta cần phải sử dụng thước đo sai số phần trăm hay sai số tương đối. Phần
trăm sai số trung bình tuyệt đối, ký hiệu là MAPE, là thước đo có thể làm điều đó.
Để tính được MAPE, đầu tiên ta phải tính được phần trăm sai số cho từng dự báo:

( ) et
Yt
100

Ví dụ, phần trăm sai số cho giá trị 17 ở tuần 2 sẽ được tính bằng cách chia sai số
dự báo ở tuần 2 cho giá trị thực tế ở tuần 2 rồi nhân với 100. Vậy ở tuần 2 phần
trăm sai số sẽ được tính như sau:
4
Phần trăm sai số tuần 2= 21 x 100 = 19,05%

Vì thế, sai số dự báo ở tuần 2 bằng 19,05% của giá trị thực tế quan sát được từ tuần
2. Một tóm lược đầy đủ cho phần trăm sai số sẽ được biểu thị ở bảng 6.7 tại cột
phần trăm sai số. Cột kế tiếp là giá trị tuyệt đối của phần trăm sai số. Cuối cùng,
chúng ta có MAPE được tính như sau:

|( ) |
n
et
∑ Yt
100
(6.5)
t =k+1
MAPE=
n−k

Bảng 6.7 cho thấy tổng các giá trị tuyệt đối của phần trăm sai số là 211,69; cho
nên:

MAPE = Trung bình các giá trị tuyệt đối của phần trăm sai số dự báo
211.69
= 11
= 19,24%

Tổng kết lại, từ việc sử dụng phương pháp giản đơn ( lấy giá trị quan sát gần nhất),
ta thu được các thước đo liên quan đến mức độ chính xác của phương pháp dự báo
là:

MAE= 3,73

MSE= 15,27
MAPE= 19,24%

Các thước đo mức độ chính xác của dự báo này chỉ có thể đo lường được việc một
phương pháp dự báo có thể chính xác đến mức nào dựa trên các giá trị quá khứ của
chuỗi thời gian. Giả sử như bây giờ chúng ta muốn dự đoán doanh số cho một
chuỗi thời gian tương lai, tỉ như tuần 13. Trong trường hợp này, dự báo cho tuần
13 sẽ là 22, giá trị thực tế lấy được từ tuần 12 của chuỗi thời gian. Đây có phải là
một ước tính chính xác cho doanh số của tuần 13 hay không? Thật đáng tiếc,
không có cách nào để đo độ chính xác của dự báo cho chuỗi thời gian tương lai.
Tuy nhiên, nếu chúng ta lựa chọn một phương pháp xác đáng cho các dữ liệu của
quá khứ và có lý do để tin rằng mô hình của quá khứ sẽ tiếp tục tồn tại trong tương
lai, ta sẽ thu được những dự báo chính xác sau cùng.

Trước khi khép lại bài học này, chúng tôi sẽ đề cập đến một phuông pháp dự báo
khác cho chuỗi thời gian doanh số bán dầu hỏa ở bảng 6.1. Giả sử chúng ta lấy
trung bình các giá trị dữ liệu quá khứ để dự đoán cho kì kế tiếp. Ta sẽ bắt đầu với
việc lập dự báo cho tuần 2. Vì chỉ có một giá trị quá khứ trước tuần 2, dự báo cho
tuần hai chỉ đơn giản là giá trị chuỗi thời gian ở tuần 1; từ đó, dự báo cho tuần 2 là
17.000 gallons dầu hỏa. Để tính toán dự báo cho tuần 3, chúng ta lấy trung bình giá
trị doanh số của tuần 1 và tuần 2, suy ra:
17+21
F3 = 2
= 19

Tương tự, dự báo cho tuần 4 sẽ là:


17+21+19
F4 = 3
= 19

Những dự báo thu được cho chuỗi thời gian doanh số bán dầu hỏa từ việc sử dụng
phương pháp này được thể hiện ở bảng 6.8 tại cột “Dự báo”. Sử dụng kết quả từ
bảng 6.8, chúng ta thu được các giá trị MAE, MSE, MAPE sau đây:
26.81
MAE = 11 = 2,44

89.07
MSE = 11 = 8,10
141.34
MAPE = 11
= 12,85%

Bây giờ chúng ta có thể so sánh độ chính xác giữa hai phương pháp dự báo trên
bằng cách đối chiếu các giá trị MAE, MSE và MAPE của từng phương pháp:

Phương pháp giản đơn Phương pháp lấy trung


bình các giá trị quá
khứ
MAE 3,73 2,44
MSE 16,27 8,10
MAPE 19,24% 12,85%

Bảng 6.8: Tính toán các dự báo và đo đạt độ chính xác của dự báo bằng cách
lấy trung bình các giá trị quá khứ làm dự báo cho kì kế tiếp

Đối với các thước đo này, phương pháp dự báo lấy trung bình các giá trị quá khứ
sẽ đưa ra kết quả chính xác hơn so với việc lấy các giá trị quan sát gần nhất làm dự
báo cho kì kế tiếp. Tóm lại, nếu chuỗi thời gian là ổn đinh, phương pháp lấy trung
bình các giá trị quá khứ sẽ đưa ra dự báo chính xác nhất.

Nhưng giả định rằng chuỗi thời gian là không ổn định. Ở bảng 6.1 chúng ta đã đề
cập rằng những thay đổi trong điều kiện kinh doanh thường sẽ dẫn tới một chuỗi
thời gian được biểu thị thành kiểu mẫu ngang chuyển sang một cấp độ khác.
Chúng ta sẽ bàn về việc tình huống nhà phân phối dầu hỏa kí hợp đồng với Cảnh
sát bang Vermont để phân phối xăng dầu cho các xe cảnh sát ở phía Nam Vermont.
Bảng 6.2 cho thấy lượng gallons dầu hỏa bán được ở chuỗi thời gian gốc và mười
tuần sau khi kí hợp đồng mới, và mô hình ở 6.2 là đồ thị của chuỗi thời gian này
sau khi kí hợp đồng. Cần chú ý rằng sự thay đổi cấp độ của tuần 13 theo sự biến
động của chuỗi thời gian. Nếu có sự chuyển biến sang một cấp độ khác như thế
này xảy ra, phương pháp trung bình thì cần vài thời kì để điều chỉnh cho phù hợp.
Còn phương pháp giản đơn hầu như khó có thể điều chỉnh để thích nghi với sự
thay đổi này bởi vì nó sử dụng các giá trị quan sát gần nhất để làm dự báo.

Các thước đo sự chính xác của dự báo là những nhân tố quan trọng để so sánh các
phương pháp dự báo khác nhau, nhưng chúng ta không nên quá phụ thuộc vào
chúng. Một đánh giá tốt và vốn kiến thức về điều kiện kinh doanh có thể ảnh
hưởng đến giá trị dự báo cũng cần phải được cân nhắc khi lựa chọn phương pháp
dự báo. Mức độ chính xác của dự báo quá khứ không phải là vấn đề duy nhất cần
phải cân nhắc, đặc biệt khi kiểu mẫu của chuỗi thời gian có xu hướng thay đổi
trong tương lai.

Trong phần kế tiếp chúng tôi sẽ giới thiệu những phương pháp phức tạp hơn để tạo
ra một dự báo cho một chuỗi thời gian biểu thị thành kiểu mẫu ngang. Sử dụng các
thước đo mức độ chính xác của dự báo ở đây, chúng ta sẽ có thể đánh giá rằng liệu
các phương pháp đó sẽ đưa ra dự báo chính xác hơn những phương pháp dự báo
đơn giản ở phần này không. Lợi thế của các phương pháp chúng tôi sẽ trình bày
tiếp theo là chúng thích nghi rất tốt khi xảy ra tình huống chuỗi thời gian chuyển
sang một cấp độ khác. Khả năng thích nghi với sự chuyển đổi sang một cấp độ
khác là một điều đáng cân nhắc khi lựa chọn phương pháp dự basom đặc biệt là
trong tình huống dự báo các thời kì ngắn hạn.

6.3 Trung bình trượt và làm trơn bằng hàm mũ


Trong phần này, chúng tôi thảo luận ba phương pháp dự báo phù hợp với chuỗi
thời gian có mẫu ngang: đường trung bình trượt, đường trung bình trượt có trọng
số và làm trơn theo hàm mũ. Những phương pháp này cũng có khả năng thích nghi
tốt với những thay đổi ở mức độ của một mẫu hình ngang như những gì chúng ta
đã thấy với chuỗi thời gian bán hàng xăng mở rộng (Bảng 6.2 và Hình 6.2). Tuy
nhiên, nếu không sửa đổi, chúng sẽ không thích hợp khi có các xu hướng đáng kể,
theo chu kỳ hoặc theo mùa. Bởi vì mục tiêu của mỗi phương pháp này là “làm
trơn” các dao động ngẫu nhiên trong chuỗi thời gian, chúng được gọi là các
phương pháp làm trơn. Những phương pháp này dễ sử dụng và thường cung cấp
mức độ chính xác cao cho các dự báo tầm ngắn, chẳng hạn như dự báo cho khoảng
thời gian tiếp theo

Trung bình trượt

Phương pháp trung bình trượt sử dụng mức trung bình của chuỗi nhất là dự báo
cho giai đoạn tiếp theo. Về mặt toán học, trung bình di chuyển của bậc k như sau:
t

Số trung bình trượt ∑


∑ Tổng k giá trị gần nhất = i=t−k=1
Yi
Y t −k+1 +…+Y t −1+Y t
¿ =
k k k

Trong đó:
F t+ 1=Dự báo ở kỳ t+1

Y i=Giá trị thực tế ở kỳ t

k= chỉ số dữ liệu chung cho kỳ dự báo

Từ trượt được dùng bởi vì mỗi lần một quan sát mới được thêm vào khi tính trung
bình, nó đã thay thế quan sát cũ nhất trong phương trình. Kết quả giá trị trung bình
sẽ thay đổi, khi thêm một quan sát mới

Để minh họa phương pháp trung bình trượt, chúng ta hãy quay trở lại 12 tuần đầu
của dữ liệu bán hàng dòng khí trong Bảng 6.1 và Hình 6.1. Mảng thời gian trong
Hình 6.1 chỉ ra rằng chuỗi thời gian bán xăng có mẫu nằm ngang. Do đó, các
phương pháp làm trơn của phần này được áp dụng.

Để sử dụng trung bình trượt để dự báo chuỗi thời gian, trước tiên, chúng tôi phải
chọn thứ tự k hoặc số giá trị chuỗi thời gian được bao gồm trong trung bình trượt.
Nếu chỉ có các giá trị gần đây lớn nhất của chuỗi thời gian được coi là có liên
quan, một giá trị nhỏ của k được ưu tiên. Nếu một số lượng lớn hơn các giá trị
trong quá khứ được coi là có liên quan, thì chúng tôi thường chọn tham gia giá trị
lớn hơn của k. Như đã đề cập trước đó, một chuỗi thời gian với một mô hình ngang
có thể chuyển sang một cấp độ mới theo thời gian. Một trung bình trượt sẽ thích
nghi với cấp độ mới của bộ truyện và tiếp tục cung cấp dự báo tốt trong k giai
đoạn. Vì vậy, một giá trị nhỏ hơn của k sẽ theo dõi sự thay đổi trong một chuỗi
thời gian nhanh hơn (cách tiếp cận ngây thơ được thảo luận trước đó thực sự là một
trung bình động cho k=1). Mặt khác, các giá trị lớn hơn của k sẽ hiệu quả hơn
trong việc làm trơn các dao động của biến tần. Do đó, sự phán xét quản lý dựa trên
sự hiểu biết về hành vi của một chuỗi thời gian là hữu ích trong việc lựa chọn một
giá trị thích hợp của k.

Để minh họa cách trung bình trượt có thể được sử dụng để dự báo doanh số bán
xăng, chúng tôi sẽ sử dụng trung bình trượt ba tuần (k3). Chúng tôi bắt đầu bằng
cách tính toán dự báo doanh thu trong tuần 4 sử dụng mức trung bình của các giá
trị chuỗi thời gian trong tuần từ 1 đến 3.

Ví dụ minh họa phương pháp trung bình trượt:

Bảng 6.1: Chuỗi thời gian lượng xăng bán được trong 12 tuần

Số lượng bán được (1000


Tuần gallon)
1 17
2 21
3 19
4 23
5 18
6 16
7 20
8 18
9 22
10 20
11 15
12 23
Dù có những dao động bất thường nhưng chuỗi thời gian dường như khá ổn định
theo thời gian .Vì vậy các phương pháp san bằng được áp dụng ở đây.

Để dùng phương pháp trung bình trượt dự báo doanh số xăng bán được,đầu tiên
chúng ta phải lựa chọn số lượng giá trị dữ liệu là bao nhiêu khi tính trung bình
trượt. Để minh họa, chúng tôi sẽ dự báo bằng cách tính trung bình trợt với 3 mức
độ
Bài giải:

 Kết quả trung bình trượt với 3 tuần lễ đầu tiên trong chuỗi thời gian doanh
số đầu bán được là:
17+21+19
Trung bình trượt ( tuần 1-3)¿ 3
=19

 Ta nhận thấy giá trị thực tế ở tuần 4 là 23, sai số dự báo ở tuần này là 23-
19= 4
Sai số dự báo là sự chênh lệch giữa giá trị quan sát của chuỗi thời gian và
giá trị dự báo
 Tính trung bình trượt cho 3 tuần lễ tiếp theo là:
21+ 19+23
Trung bình trượt (tuần 2-4)= =21
3

Do đó, dự báo doanh thu trong tuần thứ 5 là 21 và sai số liên quan đến dự báo này
là e5 =18-21= 3. Tóm tắt các dự báo trung bình động trong ba tuần cho chuỗi thời
gian bán xăng được trình bày trong Bảng 6.9. Hình 6.7 cho thấy âm mưu chuỗi
thời gian ban đầu và dự báo trung bình trượt trong ba tuần. Lưu ý cách biểu đồ của
dự báo trung bình trượt có xu hướng làm trơn các dao động ngẫu nhiên trong chuỗi
thời gian.

Bảng 6.9: Tóm tắt tính toán trung bình trượt 3 tuần

Dư báo Giá trị


bằng sai số
trung dự báo Sai số dự Phần Giá trị phần
Giá trị chuỗi bình Sai số tuyệt báo bình trăm sai trăm sai số
Tuần thời gian trượt dự báo đối phương số tuyệt đối
1 17
2 21
3 19
4 23 19 4 4 16 17.39 17.39
5 18 21 -3 3 9 -16.67 16.67
6 16 20 -4 4 16 -25 25
7 20 19 1 1 1 5 5
8 18 18 0 0 0 0 0
9 22 18 4 4 16 18.18 18.18
10 20 20 0 0 0 0 0
11 15 20 -5 5 25 -33.33 33.33
12 22 19 3 3 9 13.64 13.64
Tổng 0 24 92 -20.79 129.21

Sai số dự báo ở tuần 5 là 18-21=-3. Như vậy, sai số dự báo có thể dương hay âm
tùy thuộc vào giá trị dự báo là quá cao hay quá thấp

Để dự đoán doanh số trong tuần thứ 13, khoảng thời gian tiếp theo trong tương lai,
chúng tôi chỉ cần tính trung bình của các giá trị chuỗi thời gian trong tuần 10, 11
và 12

20+15+22
F 13=¿tuần 10 đến 12)= 3 =19

Như vậy, dự báo cho tuần thứ 13 là 19 hoặc 19.000 gallon xăng.

Mức độ chính xác của dự báo

Trong phần 6.2 chúng tôi đã thảo luận ba phương pháp dự báo chính xác: sai số
tuyệt đối trung bình (MAE); sai số bình phương bình phương (MSE); và sai số
phần trăm tuyệt đối trung bình (MAPE). Sử dụng các phép tính trung bình di
chuyển ba tuần trong Bảng 6.9, các giá trị cho ba biện pháp chính xác dự báo này

12

MAE = ∑
t =4
|e t|= 24 = 2.67
9
12−3
12

MSE = ∑
e2t
t =4 92 = 10.22
=
12−3 9
( )
12
et
MAPE =
∑¿ Yt
100∨¿ 129.21
= 9 = 14.36%
t =4
¿
12−3

Trong phần 6.2 chúng tôi đã chỉ ra rằng sử dụng quan sát gần đây nhất là dự báo
cho tuần tiếp theo (giá trị trung bình trượt k=1) dẫn đến giá trị MAE= 3.73, MSE=
16.27 và MAPE= 19.24%. Như vậy, trong mỗi trường hợp, phương pháp trung
bình trượt ba tuần đã cung cấp dự báo chính xác hơn so với việc chỉ sử dụng quan
sát gần đây nhất là dự báo. Cũng lưu ý cách các công thức cho MAE, MSE và
MAPE phản ánh việc sử dụng trung bình trượt ba tuần của chúng tôi khiến chúng
tôi không có đủ dữ liệu để tạo dự báo trong ba tuần đầu tiên trong chuỗi thời gian
của chúng tôi.

Để xác định xem trung bình trượt có thứ tự khác k có thể cung cấp dự đoán chính
xác hơn hay không, chúng tôi khuyên bạn nên sử dụng thử và sai để xác định giá
trị k giảm thiểu MSE. Đối với chuỗi thời gian bán xăng, có thể thấy rằng giá trị tối
thiểu của MSE tương ứng với mức trung bình trượt của lệnh k=6 với MSE= 6.79.
Nếu chúng tôi sẵn sàng giả định rằng thứ tự của trung bình trượt tốt nhất cho dữ
liệu lịch sử cũng sẽ là tốt nhất cho các giá trị tương lai của chuỗi thời gian, các dự
báo trung bình trượt chính xác nhất của doanh số bán xăng có thể đạt được của đơn
đặt hàng k= 6.

Trung bình trượt có trọng số

Trong phương pháp trung bình trượt, mỗi quan sát trong phép tính trung bình trượt
đều nhận được trọng số bằng nhau. Một biến thể, được gọi là trung bình trượt có
trọng số, liên quan đến việc chọn trọng số khác nhau cho mỗi giá trị dữ liệu trong
trung bình trượt và sau đó tính trung bình trọng số của các giá trị k gần đây nhất
theo dự báo
F t+ 1=w t Y t +w t−1 Y t−1+...+w t−k +1 Y t −k+1 (6.7)

F t+ 1=Dự báo ở kỳ t+1

Y t =Giá trị thực tế ở kỳ t

w t=¿Trọng số ứng với giá trị thực tế ở kỳ t

k= chỉ số chung được dùng trong dữ liệu chuỗi dự báo


Nói chung, quan sát gần đây nhất nhận được trọng lượng lớn nhất và trọng số giảm
theo độ tuổi tương đối của các giá trị dữ liệu. Chúng ta hãy sử dụng chuỗi thời gian
bán xăng trong Bảng 6.1 để minh họa tính toán trung bình di chuyển ba tuần có
trọng số. Chúng tôi sẽ chỉ định trọng lượng của wt=3/6 cho quan sát gần đây nhất,
trọng lượng từ wt -1= 2/6 đến trọng số thứ hai quan sát gần đây, và trọng lượng của
wt-2= 1/6 đến quan sát gần đây thứ ba. Sử dụng mức trung bình có trọng số này,
dự báo của chúng tôi cho tuần 4 được tính như sau:

Ví dụ: dùng chuỗi thời gian lượng xăng bán được trong bảng 6.1 để tính trung bình
trượt 3 tuần có trọng số. Ta nhận thấy
3
w t=
6

2
w t−1=
6

1
w t−2=
6

1 2 3
Dự báo cho tuần 4 = 6 (17)+ 6 (21)+ 6 (19)= 19.33

Độ chính xác của dự báo

Để sử dụng phương pháp trung bình di chuyển có trọng số, trước tiên chúng ta phải
chọn số lượng giá trị dữ liệu được bao gồm trong trung bình trượt có trọng số và
sau đó chọn trọng số cho mỗi giá trị dữ liệu này. Nói chung, nếu chúng ta tin rằng
quá khứ gần đây là một dự báo tốt hơn về tương lai hơn so với quá khứ xa xôi,
trọng lượng lớn hơn nên được trao cho các quan sát gần đây hơn. Tuy nhiên, khi
chuỗi thời gian có nhiều biến đổi, việc chọn khoảng trọng số bằng nhau cho các giá
trị dữ liệu có thể thích hợp hơn. Yêu cầu duy nhất trong việc chọn trọng số là
chúng không âm và tổng của chúng phải bằng 1. Để xác định liệu một kết hợp cụ
thể của số lượng giá trị dữ liệu và trọng số có dự báo chính xác hơn kết hợp khác
hay không, chúng tôi khuyên bạn nên sử dụng MSE làm thước đo dự đoán chính
xác. Tức là, nếu chúng ta giả định rằng sự kết hợp tốt nhất cho quá khứ cũng sẽ tốt
nhất cho tương lai, chúng ta sẽ sử dụng kết hợp số lượng giá trị dữ liệu và trọng số
mà MSE được tối thiểu hóa cho chuỗi thời gian lịch sử để dự đoán giá trị tiếp theo
trong chuỗi thời gian
Làm trơn bằng hàm mũ

Làm trơn bằng hàm mũ dùng trung bình gia trọng của giá trị chuỗi thời gian quá
khứ để dự báo, đó là trương hợp đặc biệt của phương pháp trung bình trượt gia
trọng trong đó chúng ta chỉ chọn một trọng số - trọng số từ quan sát gần nhất.Các
trọng số cho các giá trị khác được tính toán một cách tự động và sẽ nhỏ hơn khi
các quan sát càng lùi về quá khứ. Mô hình làm trơn bằng hàm mũ cơ bản như dưới
đây

Mô hình làm trơn bằng hàm mũ


F t+ 1=α Y t +(1−α )F t (6.8)

Trong đó
F t+ 1=Dự báo ở kỳ t+1

Y t =Giá trị thực tế ở kỳ t

F t=Dự báo ở kỳ t

α =Hệ số làm trơn (0≤ α ≤ 1¿

Phương trình (6.8) cho thấy giá trị dự báo cho giai đoạn t+1 là một trung bình gia
trọng giữa giá trị thực tế kỳ t và giá trị dự báo ở kỳ t, chú ý trong trường hợp trọng
số dùng cho giá trị thực tế là α thì trọng số dùng với giá trị dự báo ở giai đoạn t sẽ
là 1-α . Chúng ta có thể chứng minh rằng các giá trị dự báo làm trơn bằng hàm mũ
cho bất kỳ khoảng thời gian nào cũng là số trung bình trượt của tất cả các giá trị
thực tế của chuỗi thời gian với một chuỗi thời gian bao gồm ba giai đoạn của dữ
liệu: Y 1 ,Y 2 , Y 3

Để bắt đầu tính toán chúng ta đặt F 1 bằng với giá trị thực tế của chuỗi thời gian ở
giai đoạn 1, nghĩa là F 1=Y 1. Giá trị dự báo cho giai đoạn 2 là:

F 2=α Y t +(1−α )F t ¿ α Y 1+(1−α )Y 1=Y 1

Như vậy, dự báo làm trơn bằng hàm mũ ở giai đoạn 2 thì bằng với giá trị thực tế
của chuỗi thời gian ở giai đoạn 1

Dự báo ở giai đoạn 3 là:


F 3=α Y 2 +(1−α )F 2¿ α Y 2+(1−α )Y 1

Cuối cùng, thay thế biểu thức F 3 vào biểu thức F 4, chúng ta được

Dự báo ở giai đoạn 4 là

F 4=α Y 3 + ( 1−α ) F 3¿ α Y 3+ (1−α ) [ α Y 2+ ( 1−α ) Y 1 ]

2
¿ α Y 3+ α ( 1−α ) Y 2+ ( 1−α ) Y 1

Bây giờ chúng ta thấy rằng F4 là giá trị trung bình có trọng số của ba giá trị chuỗi
thời gian đầu tiên. Tổng các hệ số, hoặc trọng số, cho Y1, Y2 và Y3 bằng 1. Một
đối số tương tự có thể được thực hiện để cho thấy rằng, nói chung, bất kỳ dự báo
nào Ft + 1 là giá trị trung bình của tất cả các giá trị chuỗi thời gian trước đó.

Mặc dù thực tế rằng làm trơn theo hàm mũ cung cấp một dự báo là một trung bình
của tất cả các quan sát trong quá khứ, tất cả các dữ liệu trong quá khứ không cần
phải được giữ lại để tính toán dự báo cho giai đoạn tiếp theo. Trong thực tế,
phương trình (6.8) cho thấy rằng khi giá trị cho hằng số làm trơn được chọn, chỉ
cần hai mẩu thông tin để tính dự báo cho khoảng thời gian t +1: Yt, giá trị thực của
chuỗi thời gian trong khoảng thời gian t; và Ft, dự báo thời gian t.

Để minh họa phương pháp làm trơn theo hàm mũ để dự báo, chúng ta hãy xem xét
lại chuỗi thời gian bán xăng trong Bảng 6.1 và Hình 6.1. Như đã chỉ ra ở trên, để
khởi tạo các phép tính, chúng ta thiết lập dự báo làm trơn theo hàm mũ cho giai
đoạn 2 bằng giá trị thực của chuỗi thời gian trong giai đoạn 1. Như vậy, với Y1=
17, chúng ta đặt F2=17 để bắt đầu các thỏa thuận. Đề cập đến dữ liệu chuỗi thời
gian trong Bảng 6.1, chúng tôi tìm thấy một giá trị chuỗi thời gian thực trong giai
đoạn 2 của Y2= 21. Như vậy, trong giai đoạn 2 chúng tôi có lỗi dự báo của e2= 21
- 17= 4.

Tiếp tục với các tính toán làm trơn theo hàm mũ, sử dụng hằng số làm mịn là 0,2,
chúng tôi có được dự báo sau cho giai đoạn 3.
F 3=0 , 2Y 2+ 0 ,8 F 2= 0,2(21)+0,8(17)= 17,8
Giá trị thực tế của giai đoạn 3 là Y 3=19

Ta có giá trị dự báo ở kỳ 4


F 4=0 ,2 Y 3 +0 , 8 F3 = 0,2(19)+0,8(17,8)= 18,04

Tiếp tục tính toán làm trơn theo hàm mũ, chúng tôi thu được các giá trị dự báo
hàng tuần được trình bày trong Bảng 6.10. Lưu ý rằng chúng tôi đã không hiển thị
báo cáo làm trơn mũ hoặc sai số dự báo cho tuần 1 do không có dự báo nào (chúng
tôi đã sử dụng doanh số thực tế cho tuần 1 làm doanh số dự báo cho tuần 2 để khởi
tạo quy trình làm trơn theo hàm mũ). Trong tuần thứ 12, chúng tôi có Y12= 22 và
F12=18,48. Chúng ta có thể sử dụng thông tin này để đưa ra dự báo cho tuần thứ
13.

Bảng 6.10 Tóm tắt dự báo làm trơn bằng hàm số mũ và sai số dự báo cho
lượng xăng bán với hệ số làm trơn α =0.2

Dự báo
làm
trơn
Tuần Chuỗi giá trị
bằng
hàm Sai số dự Sai số dự báo bình
mũ báo phương
1 17
2 21 17 4 16
3 19 17.8 1.2 1.44
4 23 18.04 4.96 24,6
5 18 19.03 -1.03 1.06
6 16 18.83 -2.83 8.01
7 20 18.26 1.74 3.03
8 18 18.61 -0.61 0.37
9 22 18.49 3.51 12.32
10 20 19.19 0.81 0.66
11 15 19.35 -4.35 18.92
12 22 18.48 3.52 12.39
Tổng 10.92 98.8

Dùng mô hình làm trơn hàm số mũ ta có


F 13=0 , 2Y 3 +0 , 8 F 3= 0,2(22)+0,8(18,48)= 19,18
Với kết quả này, công ty có thể lập kế hoạch và ra quyết định phù hợp
Hình 6.8 là đồ thị giá trị thực tế và dự báo( up hình)
Độ chính xác của dự báo
Trong các phép tính làm trơn theo hàm mũ, chúng tôi đã sử dụng hằng số làm trơn
là 0,2. Mặc dù bất kỳ giá trị nào trong khoảng từ 0 đến 1 đều có thể chấp nhận
được, một số giá trị sẽ mang lại dự đoán chính xác hơn các giá trị khác. Thông tin
chi tiết về lựa chọn một giá trị tốt cho có thể thu được bằng cách viết lại mô hình
làm mịn theo hàm mũ cơ bản như sau.

Mô hình làm trơn bằng hàm mũ


F t+ 1=α Y t +(1−α)F t
F t+ 1=α Y t + F t −α F t
F t+ 1=Ft + α ( Y t −F t ) =Ft + α e t

Do đó, dự báo mới Ft + 1 bằng với dự báo trước đó của Ft cộng với một điều
chỉnh, đó là hằng số làm trơn thời gian sai số dự báo gần đây nhất, et= Yt - Ft. Tức
là, dự báo trong giai đoạn t+ 1 thu được bằng cách điều chỉnh dự báo trong giai
đoạn t bằng một phần nhỏ của sai số dự báo từ giai đoạn t. Nếu chuỗi thời gian
chứa biến thiên ngẫu nhiên đáng kể, một giá trị nhỏ của hằng số làm trơn được ưu
tiên. Lý do cho sự lựa chọn này là nếu phần lớn các sai số dự báo là do sự thay đổi
ngẫu nhiên, chúng tôi không muốn phản ứng quá mức và điều chỉnh dự báo quá
nhanh. Đối với một chuỗi thời gian với sự biến thiên ngẫu nhiên tương đối ít, một
sai số dự báo có nhiều khả năng thể hiện sự thay đổi thực sự ở cấp độ của chuỗi.
Do đó, các giá trị lớn hơn của hằng số làm trơn cung cấp lợi thế của việc nhanh
chóng điều chỉnh dự báo thành các thay đổi trong chuỗi thời gian; điều này cho
phép các dự báo phản ứng nhanh hơn với các điều kiện thay đổi.
Tiêu chí chúng tôi sẽ sử dụng để xác định giá trị mong muốn cho hằng số làm trơn
giống như tiêu chí chúng tôi đã đề xuất để xác định thứ tự hoặc số lượng dữ liệu
chuỗi để bao gồm trong phép tính trung bình trượt. Tức là, chúng tôi chọn giá trị để
giảm thiểu MSE. Một bản tóm tắt các tính toán MSE cho dự báo làm trơn theo hàm
mũ của doanh số bán xăng với 0,2 được trình bày trong Bảng 6.10. Lưu ý rằng có
một cụm từ ít bình phương hơn so với số khoảng thời gian; điều này là bởi vì
chúng tôi không có giá trị trong quá khứ mà để thực hiện một dự báo cho thời kỳ 1.
Giá trị của tổng các lỗi dự báo bình phương là 98,80; do đó MSE= 98,80 / 11=
8,98. Một giá trị khác có mang lại kết quả tốt hơn về mặt giá trị MSE thấp hơn
không? Thử nghiệm và lỗi thường được sử dụng để xác định nếu hằng số làm trơn
khác nhau có thể cung cấp dự báo chính xác hơn, nhưng chúng ta có thể tránh thử
và sai và xác định giá trị của việc giảm thiểu MSE thông qua việc sử dụng tối ưu
hóa phi tuyến như được thảo luận trong Chương 12 (xem Bài tập 12.19) .

6.4 Dự phóng xu hướng :


Trong phần này, chúng tôi trình bày các phương pháp dự báo phù hợp với chuỗi
thời gian trưng bày các mẫu xu hướng. ở đây chúng tôi cho thấy phân tích hồi quy
hpw có thể được sử dụng để dự báo một chuỗi thời gian với một xu hướng tuyến
tính. Trong phần 6.1, chúng tôi đã sử dụng chuỗi thời gian bán xe đạp trong bảng
6.3 và hình 6.3 để minh họa một chuỗi thời gian với một mẫu xu hướng. Bây giờ
chúng ta sử dụng chuỗi thời gian này để minh họa cách phân tích hồi quy có thể
được sử dụng để dự báo chuỗi thời gian với xu hướng tuyến tính. Dữ liệu cho
chuỗi thời gian xe đạp được lặp lại trong bảng 6.11 và linh hoạt 6.9
Mặc dù cốt truyện thời gian trong hình 6.9 cho thấy một số chuyển động lên xuống
trong 10 năm qua, chúng ta có thể đồng ý rằng đường xu hướng tuyến tính thể hiện
trong hình 6.10 cung cấp một xấp xỉ xấp xỉ của chuyển động dài trong chuỗi.
Chúng ta có thể sử dụng phân tích hồi quy để phát triển một đường xu hướng tuyến
tính cho chuỗi thời gian bán xe đạp.
Trong phân tích hồi quy, chúng tôi sử dụng các giá trị kown của các biến để ước
tính mối quan hệ giữa một biến (được gọi là biến phụ thuộc) và một hoặc nhiều
biến khác có liên quan
VD: xem xét chuỗi thời gian doanh số bán xe đạp của một nhà sản xuất cụ thể
trong 10 năm.
Bảng 6.11: chuỗi thời gian doanh số bán xe đạp
Year Sales(1000s)
1 21.6
2 22.9
3 25.5
4 21.9
5 23.9
6 27.5
7 31.5
8 29.7
9 28.6
10 31.4

Thành phần xu hướng nên phản ánh sự tăng dần – trong trường hợp này giá trị của
chuỗi thời gian là tăng .
Hình 6.9 chuỗi thời gian lượng xe đạp bán được
Hình 6.10 đường xu hướng tuyến tính cho lượng xe đạp bán được

Hình 6.10 cung cấp một mô tả hợp lí cho sự biến động dài hạn của dãy số

Chúng ta sẽ dùng phân tích hồi quy để ước lượng mối liên hệ giữa thời gian và
doanh số bán

Phương trình hồi quy ước lượng mô tả một mối quan hệ tuyến tính giữa biến độc
lập x và biến phụ thuộc y:

Y=b0+b1x

Trong dự báo , biến phụ thuộc là thời gian, chúng ta sẽ dùng t trpng phương trình
thay cho x và Ft thay cho y

Phương trình xu thế tuyến tính

Ft=b0+b1t

Trong đó :

t : thời gian

Ft: giá trị của chuỗi thời gian ở kỳ t

b0: tung độ gốc của đường xu hướng

b1:độ dốc của đường xu hướng


Trong phương trình biến thời gian bắt đầu tại t = 1 tương ứng với quan sát chuỗi
thời gian đầu tiên (năm 1 cho chuỗi thời gian bán xe đạp) và tiếp tục cho đến t = n
tương ứng với quan sát chuỗi thời gian gần đây nhất (năm thứ 10 cho chuỗi thời
gian bán xe đạp ) do đó, đối với chuỗi thời gian bán xe đạp t = 1 tương ứng với giá
trị chuỗi thời gian cũ nhất và t = 10 tương ứng với năm gần đây nhất. phép tính có
thể được sử dụng để chỉ ra rằng các phương trình đưa ra dưới đây cho b0 và b1
mang lại dòng giảm thiểu MSE. các phương trình tính toán các giá trị của b0 và b1

t Yt tYt t2
1 21.6 21.6 1
2 22.9 45.8 4
3 25.5 76.5 9
4 21.9 87.6 16
5 23.9 119,5 25
6 27.5 165 36
7 31.5 220.5 49
8 29.7 237.6 64
9 28.6 257.4 81
10 31.4 314 100
Tổng 55 264.5 1545.5 385
55
t= =5.5
10

264.5
Y = = 26.45
10

1545.5−(55)(264.5)/10
b1 = = 1.1
385−552 /10

b0 = 26.45 – 1.1(5.5)=20.4
Do vậy, F t=20.4 +1.1 t là biểu thức thành phần xu hướng tuyến tính của chuỗi thời
gian doanh số xe đạp.

Hệ số 1.1 cho biết trong 10 năm qua khi thời gian tăng thêm 1 năm thì doanh số sẽ
tăng trung bình 1.100 đơn vị

Giả sử rằng xu hướng 10 năm qua của doanh số là một chỉ báo tốt cho tương lai
phương trình trên có thể được dùng để dự phóng thành phần xu hướng của chuỗi
thời gian

VD : thế t=11 vào phương trình ta sẽ có dự phóng xu hướng cho năm kế tiếp

T11 =20.4 +1.1(11)=32.5


=>chúng ta dự báo doanh số cho năm tới là 32500 chiếc xe đạp

6.5 Tính thời vụ:


Tính thời vụ không theo xu hướng
Chuỗi thời gian không chỉ ra bất kỳ xu hướng dài hạn nào trong bán hàng. Dữ liệu
tuân theo mô hình ngang với biến động ngẫu nhiên và có thể sử dụng tính năng
làm trơn theo hàm mũ để dự báo doanh số. Tuy nhiên, việc kiểm tra chặt chẽ hơn
về cốt lõi của chuỗi thời gian cho thấy biến động trong mô hình. Nghĩa là, quý đầu
tiên và quý thứ ba có doanh thu vừa phải, quý thứ hai là doanh số bán hàng cao
nhất, và quý IV có xu hướng là quý thấp nhất về khối lượng bán hàng. Do đó,
chúng tôi kết luận rằng sự có mặt của mô hình theo mùa vào mỗi quý

Có thể lập mô hình chuỗi thời gian bằng mẫu theo mùa bằng cách xử lý phần này
dưới dạng biến phân loại. Các biến phân loại là dữ liệu được sử dụng để phân loại
các quan sát của dữ liệu. Khi một biến phân loại có mức k, thì biến giả k-1 (gọi là
biến 0-1) là bắt buộc.

3 biến đó được trình bày như sau :

Qtr1 = 1 if period t is a quarter 1


0 otherwise

Qtr2t = 1 if period t is a quarter 2


0 otherwise

Qtr3t = 1 if period t is a quarter 3


0 otherwise
Sử dụng Ft để biểu thị giá trị dự báo của doanh số bán hàng cho thời gian t, tổng
quát từ phương trình liên quan đến số lượng ô bán cho quý doanh số bán hàng :
Ft=b0+b1Qtr1t+b2Qtr2t+b3Qtr3t
Period Year Quarter Qtr1 Qtr2 Qtr3 Sales
1 1 1 1 0 0 125
2 2 0 1 0 153
3 3 0 0 1 106
4 4 0 0 0 88
5 2 1 1 0 0 118
6 2 0 1 0 161
7 3 0 0 1 133
8 4 0 0 0 102
9 3 1 1 0 0 138
10 2 0 1 0 144
11 3 0 0 1 113
12 4 0 0 0 80
13 4 1 1 0 0 109
14 2 0 1 0 137
15 3 0 0 1 125
16 4 0 0 0 109
17 5 1 1 0 0 130
18 2 0 1 0 165
19 3 0 0 1 128
20 4 0 0 0 96
Sử dụng dữ liệu ở bảng 6.14 và phân tích hồi quy chúng ta có phương trình sau:
Ft=95+29Qtr1t+ 57Qtr2t + 26Qtr3t
chúng ta có thể sử dụng phương trình để dự báo doanh thu hàng quý cho năm tới
quý 1 : sales= 95+29(1)+57(0)+26(0)=124
quý 2 : sales= 95+29(0)+57(1)+26(0)=152
quý 3 : sales= 95+29(0)+57(0)+26(1)=121
quý 3 : sales= 95+29(0)+57(0)+26(0)=95
Tính thời vụ với xu hướng
Tuy nhiên, chuỗi thời gian cũng có xu hướng tuyến tính hướng lên sẽ cần được
tính toán để phát triển các dự báo chính xác về doanh thu hàng quý. Điều này có
thể dễ dàng thực hiện bằng cách kết hợp phương pháp giả biến để xử lý theo mùa
với cách tiếp cận mà chúng ta đã thảo luận trong phần 6.4 để xử lý một xu hướng
tuyến tính.
Dạng tổng quát của phương trình hồi quy để mô hình hóa cả các hiệu ứng theo mùa
hàng quý và xu hướng tuyến tính trong chuỗi thời gian truyền hình là:
Ft = b0 + b1Qtr1t + b2Qtr2t + b3Qtr3t + b4t

Trong đó:

Ft : dự báo doanh thu trong kỳ t

Qtr1t : 1 nếu khoảng thời gian t tương ứng với quý đầu tiên của năm, 0 ,trường hợp
khác.

Qtr2t :1 nếu khoảng thời gian t tương ứng với quý hai của năm,0, trường hợp khác.

Qtr3t : 1 nếu khoảng thời gian t tương ứng với quý ba của năm, 0 ,trường hợp
khác.

t : khoảng thời gian.


Period Year Quarter Qtr1 Qtr2 Qtr3 Sales(1000s)
1 1 1 1 0 0 4.8
2 2 0 1 0 4.1
3 3 0 0 1 6.0
4 4 0 0 0 6.5
5 2 1 1 0 0 5.8
6 2 0 1 0 5.2
7 3 0 0 1 6.8
8 4 0 0 0 7.4
9 3 1 1 0 0 6.0
10 2 0 1 0 5.6
11 3 0 0 1 7.5
12 4 0 0 0 7.8
13 4 1 1 0 0 6.3
14 2 0 1 0 5.9
15 3 0 0 1 8.0
16 4 0 0 0 8.4
Bảng 6.16 cho thấy thời gian bán TV đã được sửa đổi bao gồm các giá trị được mã
hóa của các biến giả và khoảng thời gian t. sử dụng dữ liệu trong bảng 6.16 với mô
hình hồi quy bao gồm cả các thành phần theo mùa và xu hướng, chúng ta có được
phương trình sau đây để giảm thiểu tổng số bình phương sai số của chúng ta:

Ft = 6.07-1.36Qtr1t-2.03Qtr2t-0.304Qtr3t+0.146t
bây giờ chúng tôi có thể sử dụng phương trình để dự báo doanh thu hàng quý cho
năm tiếp theo. năm tới là năm thứ 5 cho loạt phim truyền hình bán thời gian, tức là
khoảng thời gian 17 18 19 20. dự báo cho khoảng thời gian 17 (quý 1 năm thứ 5)

F17=6.07-1.36(1)-2.03(0)-0.304(0)+0.146(17)=7.19

dự báo cho khoảng thời gian 18 (quý 2 năm thứ 5)

F18=6.07-1.36(0)-2.03(1)-0.304(0)+0.146(18)=6.67

dự báo cho khoảng thời gian 19 (quý 3 năm thứ 5)

F19=6.07-1.36(0)-2.03(0)-0.304(1)+0.146(19)=8.54

dự báo cho khoảng thời gian 20 (quý 4 năm thứ 5)

F20=6.07-1.36(0)-2.03(0)-0.304(0)+0.146(20)=8.99

do đó, kế toán cho các hiệu ứng theo mùa và xu hướng tuyến tính trong bán hàng
truyền hình, ước tính doanh thu hàng quý trong năm thứ 5 là 7190, 6670,8540 và
8990.

Các biến giả trong phương trình thực sự cung cấp bốn phương trình, một cho mỗi
quý. nếu không, nếu khoảng thời gian t tương ứng với quý 1, ước tính doanh thu
hàng quý là

Qúy 1 : doanh thu =6.07-1.36(1)-2.03(0)-0.304(0)+0.146t=4.71+0.146t

tương tự, nếu khoảng thời gian t tương ứng với quý 2 3 và 4, ước tính doanh thu
hàng quý là:

quý 1: doanh thu = 6.07-1.36(0)-2.03(1)-0.304(0)+0.146t=4.04+0.146t

quý 2: doanh thu = 6.07-1.36(0)-2.03(0)-0.304(1)+0.146t=5.77+0.146t

quý 3: doanh thu = 6.07-1.36(0)-2.03(0)-0.304(0)+0.146t=6.07+0.146t

độ dốc của đường xu hướng cho mỗi phương trình dự báo hàng quý là 0,164, cho
thấy mức tăng trưởng ổn định trong doanh thu khoảng 146 bộ mỗi quý. sự khác
biệt duy nhất trong bốn phương trình là chúng có các chặn khác nhau.

Mô hình dựa trên dữ liệu hàng tháng


trong ví dụ về bộ truyền hình trước đó, chúng tôi đã chỉ ra cách các biến giả có thể
được sử dụng để tính toán các hiệu ứng theo mùa hàng quý trong chuỗi thời gian.
vì có bốn cấp độ cho mùa biến phân loại, cần phải có biến giả. Tuy nhiên, nhiều
doanh nghiệp sử dụng dự báo hàng tháng thay vì hàng quý. đối với dữ liệu hàng
tháng, mùa là biến phân loại với 12 cấp và do đó, cần 12-1 = 11 biến giả, ví dụ: 11
biến giả có thể được mã hóa như sau:

tháng 1 = 1 nếu là tháng 1

0 nếu là trường hợp khác

Tháng 2 = 1 nếu là tháng 2

0 nếu là trường hợp khác

Tháng 11 = 1 nếu là tháng 11

0 nếu là trường hợp khác

ngoài thay đổi này, phương pháp xử lý thời vụ vẫn giữ nguyên.

You might also like