Professional Documents
Culture Documents
ii
MỤC LỤC
LỜI CẢM ƠN .............................................................................................................................ii
MỤC LỤC .................................................................................................................................iii
DANH SÁCH HÌNH ẢNH ........................................................................................................ v
DANH SÁCH BẢNG BIỂU ...................................................................................................... v
CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI ...................................................................................... vi
1.1. Mục đích ..................................................................................................................... vi
1.2. Nhiệm vụ ..................................................................................................................... vi
1.3. Bố cục ......................................................................................................................... vi
1.4. Phạm vi báo cáo .......................................................................................................... vi
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN........................................ 1
2.1. Cơ sở lý thuyết ............................................................................................................. 1
2.1.1. Kỹ thuật EDA ....................................................................................................... 1
2.1.2. Phương pháp dự báo ............................................................................................. 1
2.2. Phương pháp luận ........................................................................................................ 2
CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ ..................................................................................... 3
3.1. Vấn đề .......................................................................................................................... 3
3.2. Công cụ ........................................................................................................................ 3
3.3. Thu thập dữ liệu ........................................................................................................... 3
3.3.1. Cách thức thu thập dữ liệu .................................................................................... 3
3.3.2. Điều chỉnh dữ liệu ................................................................................................ 3
CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ ................................................... 5
4.1. Thống kê mô tả ............................................................................................................ 5
4.1.1. Các thông số của thống kê mô tả .......................................................................... 5
4.1.2. Nhận xét các thông số của thống kê mô tả ........................................................... 5
4.1.3. Dạng dữ liệu ......................................................................................................... 7
4.2. Hệ số biến thiên ........................................................................................................... 9
4.3. Phân tích khoảng tin cậy .............................................................................................. 9
4.4. Phân tích hệ số tương quan ........................................................................................ 10
4.4.1. Ma trận tương quan ............................................................................................ 10
4.4.2. Kiểm định hệ số tương quan ............................................................................... 11
iii
CHƯƠNG 5. TRẢ LỜI CÂU HỎI ....................................................................................... 12
5.1. Câu 2A ....................................................................................................................... 12
5.2. Câu 2B ....................................................................................................................... 12
5.3. Câu 3C ....................................................................................................................... 12
5.4. Câu 3D ....................................................................................................................... 13
5.5. Câu 3E ........................................................................................................................ 13
5.6. Câu 3F ........................................................................................................................ 15
TÀI LIỆU THAM KHẢO
PHỤ LỤC A. DỮ LIỆU THU THẬP
PHỤ LỤC B. KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
PHỤ LỤC C. KẾT QUẢ THỰC HIỆN DỰ BÁO BẰNG MINITAB
iv
DANH SÁCH HÌNH ẢNH
Hình 2.1 Phương pháp luận thực hiện báo cáo ........................................................................... 2
Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan ............................................................................... 3
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5 ................ 4
Hình 4.1 Các thông số của thống kê mô tả ................................................................................. 5
Hình 4.2 Summary Report for Netherlands ................................................................................ 5
Hình 4.3 Biểu đồ chuỗi thời gian................................................................................................ 7
Hình 4.4 ACF của dữ liệu nước Bỉ ............................................................................................. 7
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania ......... 8
Hình 4.6 Kết quả phân tích sau khi thực hiện sai phân .............................................................. 8
Hình 4.7 Kết quả CV của các dữ liệu ......................................................................................... 9
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab.................................................... 10
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy .......................................................... 13
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt ............................................................. 13
Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các
năm ........................................................................................................................................... 13
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển ............. 14
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển .................... 14
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt ............... 14
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt ....................... 14
Hình 5.8 Kết quả kiểm định Turkey ......................................................................................... 15
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức .......................................... 17
Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức ........................................ 17
v
CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI
1.1. Mục đích
Phân tích dữ liệu đang không ngừng phát triển và dần trở thành xu hướng của thời đại
mới. Phân tích dữ liệu không chỉ đơn thuần dừng lại ở việc hiểu được bản chất của dữ liệu, mà
từ đó còn hỗ trợ ra quyết định. Kỹ năng phân tích dữ liệu hiện nay được áp dụng trong chương
trình giảng dạy của các trường đại học ở nhiều lĩnh vực khác nhau. Môn học Kỹ thuật dự báo
cung cấp cho sinh viên các kiến thức cơ bản trong lĩnh vực thống kê và dự báo, tạo điều kiện
cho sinh viên tiếp cận với kỹ năng phân tích dữ liệu.
Mục đích của báo cáo là tìm hiểu và phân tích dữ liệu về chỉ số vận tải container thông
qua 2 phương thức: đường sắt và đường thuỷ của các nước Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ,
Hungary, Lithuania và Romania từ năm 1970 đến 2019. Thông qua quá trình phân tích dữ liệu,
nhóm có cơ hội áp dụng các kiến thức từ môn học Kỹ thuật dự báo để phân tích một vấn đề cụ
thể trong thực tế, đồng thời tìm hiểu về đặc tính của phương thức vận tải hàng hoá bằng
container của các nước trên, góp phần hoàn thiện kiến thức của nhóm trong lĩnh vực Logistics
quốc tế.
1.2. Nhiệm vụ
Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:
− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải container)
của 5 nước có giao thương nhiều nhất với Việt Nam.
− Áp dụng Kỹ thuật EDA để phân tích và tìm ra các đặc trưng cơ bản của dữ liệu, bao
gồm: các đặc trưng cơ bản của thống kê mô tả (trung bình, trung vị, phương sai, độ lệch
chuẩn,...), các tứ phân vị, khoảng tin cậy cho trung bình và độ lệch chuẩn, mức biến
động, sự tương quan, từ đó rút ra được đặc tính của dữ liệu.
− Từ đặc tính của dữ liệu, đưa ra mô hình dự báo phù hợp cho chỉ số vận tải container của
các nước.
1.3. Bố cục
Bố cục bài báo cáo gồm 5 chương, cụ thể:
− Chương 1: Giới thiệu đề tài
− Chương 2: Cơ sở lý thuyết và Phương pháp luận
− Chương 3: Giới thiệu vấn đề
− Chương 4: Thống kê mô tả
− Chương 5: Trả lời câu hỏi
1.4. Phạm vi báo cáo
− Chỉ tiến hành dự báo đối với dữ liệu có data pattern là stationary, trend và seasonal.
− Các phương pháp dự báo sử dụng bao gồm: Naïve, Simple averages, Moving averages,
Exponential smoothing, Growth curves, Linear exponential smoothing, Quadratic
exponential smoothing, Holt’s method.
vi
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN
2.1. Cơ sở lý thuyết
2.1.1. Kỹ thuật EDA
Exploratory Data Analysis (EDA) là một phương pháp phân tích dữ liệu chủ yếu sử
dụng các kỹ thuật về biểu đồ, hình vẽ. Kỹ thuật này bao gồm việc thực hiện xem xét, nghiên
cứu các dữ liệu, biểu đồ khác nhau cũng như thực hiện những phương pháp thống kê mô tả để
tìm ra kết quả cần thiết cho câu hỏi được đặt ra, đồng thời giúp chúng ta có cơ sở để chọn mô
hình trong các bước tiếp theo.
Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm một
vài kỹ thuật sau:
− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots, ...
− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots,
box plots, ...
− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của con
người.
2.1.2. Phương pháp dự báo
Bảng 2.1 Lựa chọn phương pháp dự báo
Pattern of
Method Time horizon Type of Model
Data
Naïve ST, T, S S TS
Simple averages ST S TS
Moving averages ST S TS
Exponential smoothing ST S TS
Growth curves T I, L TS
Linear exponential smoothing T S TS
Quadratic exponential smoothing T S TS
Holt’s method T S TS
Trong đó
Pattern of the data: ST, stationary; T, trending; S, seasonal.
Time horizon: S, short term; I, intermediate term; L, long term.
Type of model: TS, time series.
1
2.2. Phương pháp luận
2
CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ
3.1. Vấn đề
Trong hoạt phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc nắm bắt tối
đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách cụ thể gồm: các số liệu
quá khứ của lĩnh vực dự báo, diễn biến tình hình hiện trạng cũng như động thái phát triển của
lĩnh vực dự báo và đánh giá một cách đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn
định tính.
Bài báo cáo tập trung phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu bằng cách
sử dụng kỹ thuật EDA và phương pháp chuỗi thời gian. Phân tích dữ liệu khai phá là kỹ thuật
để xác định các mối quan hệ và xu hướng, các quan sát có ảnh hưởng, từ đó giúp dễ dàng mô
tả và tóm tắt bộ dữ liệu nhằm giúp cho nhà phân tích có cái nhìn trực quan và tận dụng tốt nhất
dữ liệu có được. Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sát của một
biến duy nhất theo biến số độc lập là thời gian. Trong đó bộ dữ liệu được chọn là chỉ số vận tải
hàng hóa bằng container của 5 nước mà Việt Nam xuất khẩu hàng hóa đến nhiều nhất, bao gồm
hai loại hình vận tải container là đường sắt và đường thủy, đơn vị đo lường là TEU (Đơn vị
tương đương 20 feet). Dữ liệu được lấy từ Bộ cơ sở dữ liệu OECD, truy cập bằng đường dẫn
sau: https://www.oecd-ilibrary.org/transport.
3.2. Công cụ
− Kỹ thuật EDA bao gồm:
▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị.
▪ Các thông số đo lường sự phân tán: Khoảng biến thiên, Tứ phân vị, IQR, Phương
sai, Độ lệch chuẩn.
▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan.
▪ Hệ số biến thiên (CV), Khoảng tứ phân vị, Biểu đồ Box Plot, Hệ số tương quan
Pearson.
− Phần mềm Minitab 18.
3.3. Thu thập dữ liệu
3.3.1. Cách thức thu thập dữ liệu
Dữ liệu là chỉ số xuất khẩu container của 5 nước đường sắt bao gồm Hà Lan, Hungary,
Romania, Đức, Lithuania và 5 nước đường biển bao gồm Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ.
Các dữ liệu này được thu thập từ trang thông tin điện tử OECD iLibrary.
3.3.2. Điều chỉnh dữ liệu
Sau khi thu thập dữ liệu về chỉ số vận tải container của các nước để tính toán, có một
vài nước không có dữ liệu ở một vài năm thời đoạn. Do đó, nhóm tiến hành sử dụng phương
pháp trung bình dịch chuyển (MA) để làm đầy dữ liệu thô.
Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003.
3
Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu cho
giai đoạn 1995 – 2003 cho Hà Lan.
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5
Dựa vào các loại sai số MAD, MSE, MAPE khi lần lượt dự báo dữ liệu, sử dụng lần lượt
3, 4 và 5 thời đoạn. Ta thấy khi số thời đoạn dự báo càng tăng thì các giá trị sai số của dự báo
cũng tăng, do đó ta sử dụng phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn (k =
3) để dự báo dữ liệu cho các năm còn thiếu.
Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A.
4
CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ
4.1. Thống kê mô tả
4.1.1. Các thông số của thống kê mô tả
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive
Statistics...) của phần mềm Minitab để tính toán các thông số của thống kê mô tả, thu được kết
quả như hình 4.1 dưới đây.
Mean
Median
5
container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn
giá trị trung bình 2 857 355 TEU.
Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ 8687
TEU đến 736 798 TEU. Khoảng IQR trải từ 132 127 đến 441 856 TEU. Trung vị (Median) của
dữ liệu bé hơn giá trị trung bình (Mean) (2 204 713 < 266 232), cho thấy chỉ số vận tải container
qua đường sắt của Hungary có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá
trị trung bình 266 232 TEU.
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88
000TEU đến 1 686 000 TEU. Khoảng IQR trải từ 200 044 đến 930 458 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ số vận tải
container qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé
hơn giá trị trung bình 517 214 TEU.
Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10
554 TEU đến 305 686 TEU. Khoảng IQR trải từ 38 670 đến 187 983 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (103 125 <123 127), cho thấy chỉ số vận tải
container qua đường sắt của Lithuania có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị
bé hơn giá trị trung bình 123 127TEU.
Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54
995 TEU đến 2 468 750 TEU. Khoảng IQR trải từ 108 364 đến 1 436 772 TEU. Trung vị
(Median) của dữ liệu bé hơn giá trị trung bình (Mean) (220 074 < 750 837), cho thấy chỉ số vận
tải container qua đường sắt của Romania có xu hướng lệch phải, tức là đa phần dữ liệu có giá
trị bé hơn giá trị trung bình 750 837 TEU.
❖ Đối với các nhóm nước xuất khẩu container bằng đường biển:
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000
TEU đến 1 686 000 TEU. Khoảng IQR trải từ 200 044 đến 930 458 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ số vận tải
container qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé
hơn giá trị trung bình 517 214 TEU.
Đức: Ta thấy chỉ số xuất khẩu container qua đường biển của Đức có giá trị từ 279 376 TEU
đến 15 905 000 TEU. Khoảng IQR phân bố từ 1 771 453 TEU đến 13 272 393. Trung vị của
dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường
biển của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình
6 803 993 TEU.
Ý: Ta thấy chỉ số xuất khẩu container qua đường biển của Ý có giá trị từ 49 937 TEU đến
12 758 529 TEU. Khoảng IQR phân bố từ 792 015 TEU đến 7 943 429. Trung vị của dữ liệu
bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường biển
của Ý có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4 557
328 TEU.
Tây Ban Nha: Ta thấy chỉ số xuất khẩu container qua đường biển của Tây Ban Nha có giá
trị từ 137,483 TEU đến 17,435,718 TEU. Khoảng IQR phân bố từ 1 335 867 TEU đến 17 435
718. Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải
6
container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn
giá trị trung bình 6 374 367 TEU.
Bỉ: Ta thấy chỉ số xuất khẩu container qua đường biển của Bỉ có giá trị từ 316 354 TEU
đến 11 527 000 TEU. Khoảng IQR phân bố từ 1 033 084 TEU đến 8 658 750. Trung vị của dữ
liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường
biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4
533 168 TEU.
4.1.3. Dạng dữ liệu
Xác định độ lệch của chuỗi dữ liệu: dựa vào dữ liệu thu được ở trên cùng biểu đồ
Histogram (phụ lục B), đối với cả 10 dữ liệu, độ lệch đều dương và giá trị trung bình lớn hơn
các giá trị trung vị nên phân bố của cả năm nước đều có xu hướng lệch phải.
Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat
→ Time Series → Time Series Plot) để xác định hình dạng có thể có của chuỗi dữ liệu. Ví dụ
đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3.
Time Series Plot of Belgium
12000000
10000000
8000000
Belgium
6000000
4000000
2000000
0
1 5 10 15 20 25 30 35 40 45 50
Index
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5 6 7 8 9 10 11 12 13
Lag
0.8
250000
0.6
0.4 200000
Autocorrelation
Lithuania
0.2
0.0 150000
-0.2
100000
-0.4
-0.6
50000
-0.8
-1.0
0
1 2 3 4 5 6 7 1 5 10 15 20 25 30 35 40 45 50
Lag Index
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania
Phân tích autocorrelation cho thấy dữ liệu của Lithuania có tính xu hướng, tuy nhiên
biểu đồ time series lại không biểu hiện tính xu hướng, do đó chỉ có thể kết luận dữ liệu của
Lithuania mang tính không ổn định (non-stationary). Do đó tiến hành sai phân dữ liệu để loại
bỏ tính không ổn định này.
Autocorrelation Function for C9 Time Series Plot of C9
(with 5% significance limits for the autocorrelations) 50000
1.0
0.8
0
0.6
0.4
Autocorrelation
0.2 -50000
C9
0.0
-0.2
-0.4 -100000
-0.6
-0.8
-150000
-1.0
1 2 3 4 5 6 7 8 9 10 11 12 1 5 10 15 20 25 30 35 40 45 50
Lag Index
Hình 4.6 Kết quả phân tích sau khi thực hiện sai phân
Kết quả của việc sai phân trên sẽ làm cơ sở để lựa chọn phương pháp dự báo thích hợp.
Tương tự với việc phân tích sai phân cho Romania.
8
4.2. Hệ số biến thiên
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive
Statistics...) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình
4.7.
9
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab
Khoảng tin cậy 95% cho giá trị trung bình (Mean) của chỉ số Transportation cho vận
tải container qua đường sắt của Hà Lan: (370 251; 664 177) TEU cho biết khi lấy ngẫu nhiên
dữ liệu vận tải của các năm thì 95% giá trị trung bình của của chỉ số vận tải sẽ nằm trong khoảng
tin cậy.
Khoảng tin cậy 95% cho giá trị độ lệch chuẩn của chỉ số Transportation cho vận tải
container qua đường sắt của Hà Lan: (426 674 ; 639 202) TEU cho biết khi lấy ngẫu nhiên dữ
liệu vận tải của các năm thì 95% giá trị độ lệch chuẩn của của chỉ số vận tải sẽ nằm trong khoảng
tin cậy.
4.4. Phân tích hệ số tương quan
4.4.1. Ma trận tương quan
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt
Nước Đức Hungary Lithuania Hà Lan Romania
Đức 1 0.903 -0.430 0.939 -0.639
Hungary 0.903 1 -0.252 0.889 -0.427
Lithuania -0.430 -0.252 1 -0.225 0.912
Hà Lan 0.939 0.889 -0.225 1 -0.490
Romania -0.639 -0.427 0.912 -0.490 1
Ở nhóm 3 nước Đức, Hungary và Hà Lan có sự tương đồng về tăng trưởng cho chỉ số
Transportation về vận tải container theo đường sắt (tăng trưởng theo hàm bậc 2 có tính xu
hướng) nên hệ số tương quan của 3 nước này có giá trị cao ( thấp nhất là 0.882)
Mặt khác, 2 nước Lithuania và Romania có đặc tính dữ liệu tăng dần đều theo hàm xu
hướng từ 1970, nhưng lại giảm đột ngột giai đoạn 1987, 1988 nên hệ số tương quan giữa 2 nước
này có giá trị cao, xấp xỉ 0.912.
Nhưng hệ số tương quan của 2 nước Lithuania và Romania so với Đức, Hà Lan và
Hungary cho ta thấy sự khác nhau về xu hướng tăng trưởng chỉ số vận tải. Giữa 2 nhóm nước
này có ít sự tương quan trong vận tải container bằng đường sắt hơn. Giá trị Coefficient có giá
trị âm cho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều thì chỉ số vận tải
10
của 2 nước còn lại sau khi giảm đột ngột giai đoạn 1987, 1988 thì vẫn tiếp tục tăng trưởng lại,
nhưng với giá trị thấp hơn rất nhiều so với trước khi giảm.
Bảng 4.3. Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển
Nước Hà Lan Đức Ý Tây Ban Nha Bỉ
Hà Lan 1 0.983 0.966 0.991 0.988
Đức 0.983 1 0.958 0.984 0.991
Ý 0.966 0.958 1 0.981 0.966
Tây Ban Nha 0.991 0.984 0.981 1 0.992
Bỉ 0.988 0.991 0.966 0.992 1
Tương tự đối với nhóm các nước đường biển, ma trận về hệ số tương quan trình bày ở
bảng 4.3 của 5 nước cho ta thấy hệ số tương quan của nhóm 5 nước này rất cao, giá trị thấp
nhất lên đến 0.967. Chỉ số Transportation cho vận tải container bằng đường biển của 5 nước có
mối liên hệ vô cùng chặt chẽ. Điều này phù hợp đặc tính xu hướng của dữ liệu vận tải của 5
nước này, (tăng dần theo thời gian, từ 1970 đến 2019, theo hàm xu hướng bậc 2), đã được trình
bày ở phần trên.
4.4.2. Kiểm định hệ số tương quan
Các giá trị p-value được xuất ra từ phần mềm thống kê Minitab, sử dụng độ tin cậy 95%.
Kết quả kiểm định bằng minitab được trình bày ở phần phụ lục B.
Đối với nhóm các nước đường sắt:
Đối với các nước ở nhóm 3 nước Hà Lan, Đức và Hungary, và giữa 2 nước Lithuania
và Romania giá trị p-value đều tiến về giá trị 0, điều này chứng tỏ các hệ số tương quan trình
bày đều có ý nghĩa thống kê.
Đối với hệ số tương quan giữa các nước thuộc 2 nhóm khác nhau như đã phân tích ở
trên (Hungary và Romania, Hà Lan và Lithuania), trị thống kê p-value có giá trị lần lượt 0.002
và 0.008 nhưng vẫn bé hơn 0.05, xem như các hệ số tương quan này vẫn có giá trị thống kê.
Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077
> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại.
Đối với nhóm các nước đường biển:
Giá trị kiểm định p-value của từng hệ số tương quan được xuất ra từ phần mềm Minitab
đều tiến về giá trị 0 cho từng cặp dữ liệu, điều này chứng tỏ các hệ số tương quan trình bày ở
bảng 4.3 đều có ý nghĩa thống kê.
11
CHƯƠNG 5. TRẢ LỜI CÂU HỎI
5.1. Câu 2A
Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông
qua phân tích EDA ở câu 1?
− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm.
− Chỉ số vận tải container qua cả đường sắt và đường biển của các nước có phân bố không
đồng đều, có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung
bình, tuy nhiên không bị chênh lệch quá nhiều so với giá trị trung bình.
− Đối với các nhóm nước xuất khẩu container bằng đường sắt: Giá trị xuất khẩu trung
bình của nước Đức là lớn nhất (2,875,355 TEU), giá trị xuất khẩu trung bình của nước
Lithuania là bé nhất (123127 TEU).
− Đối với các nhóm nước xuất khẩu container bằng đường biển: Giá trị xuất khẩu trung
bình của nước Đức là lớn nhất (6,803,993 TEU), giá trị xuất khẩu trung bình của nước
Bỉ là thấp nhất (4,533,168 TEU).
− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều
hơn đáng kể so với đường sắt.
5.2. Câu 2B
Chuỗi dữ liệu sử dụng của các đối tượng nghiên cứu có tuân theo phân bố Normal không?
Tại sao?
Dựa vào giá trị p – value của kiểm định Anderson – Darling Normality Test được thực
hiện trên Minitab 18 ta thu được kết quả dưới bảng sau.
Bảng 5.1 Kết quả kiểm định phân bố Normal
Dữ liệu Giá trị kiểm định Nhận xét
Netherlands p < 0.05 Không tuân theo phân bố Normal
Germany p < 0.05 Không tuân theo phân bố Normal
Đường biển Italy p < 0.05 Không tuân theo phân bố Normal
Spain p < 0.05 Không tuân theo phân bố Normal
Belgium p < 0.05 Không tuân theo phân bố Normal
Germany p < 0.05 Không tuân theo phân bố Normal
Hungary p < 0.05 Không tuân theo phân bố Normal
Đường sắt Lithuania p < 0.05 Không tuân theo phân bố Normal
Netherlands p < 0.05 Không tuân theo phân bố Normal
Romania p < 0.05 Không tuân theo phân bố Normal
5.3. Câu 3C
Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy
không?
− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được.
− Do dữ liệu trong mẫu phải ngẫu nhiên, tuy nhiên đối với dữ liệu của một số nước không
đầy đủ nên phải dùng phương pháp dự báo để tính toán → Dữ liệu mất đi tính ngẫu
nhiên và độc lập.
12
5.4. Câu 3D
Chủ đề mà nhóm quan tâm (interest topics) của Đức có cùng giá trị với Hà Lan? (thí dụ:
Goods transport value của Đức có bằng Goods transport value của Hà Lan hay không?)
Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean).
Tiến hành trên Minitab 18, chọn Stat → Paired t for the mean. Trong đó 𝜇1 là giá trị trung bình
của Đức, 𝜇2 là giá trị trung bình của Hà Lan, difference = 𝜇1 − 𝜇2 . Ta thu được kết quả sau:
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt
Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn
hơn Hà Lan.
Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các
năm
5.5. Câu 3E
Có sự khác nhau giữa các bộ dữ liệu được phân tích từ các nước hay không? (One-way
ANOVA và Tukey test, Interval Plots và Boxplot of Data )
13
Đường biển
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển
8000000
15000000
7000000
6000000
Data
Data
10000000
5000000
5000000
4000000
3000000
0
Netherlands Germany Italy Spain Belgium
Netherlands Germany Italy Spain Belgium
The pooled standard deviation is used to calculate the intervals.
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển
Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container
bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium.
Đường sắt
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt
Interval Plot of Germany (Rai, Hungary, ... Boxplot of Germany (Rai, Hungary, ...
95% CI for the Mean 8000000
3500000
7000000
3000000
6000000
2500000
5000000
2000000
Data
4000000
Data
1500000
3000000
1000000
2000000
500000
1000000
0
0
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
The pooled standard deviation is used to calculate the intervals.
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt
Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước. Tiến hành
kiểm định sâu ANOVA (Turkey Test).
14
Hình 5.8 Kết quả kiểm định Turkey
Dựa vào kết quả kiểm định Turkey cho thấy đối với các cặp Hungary – Đức, Lithuania
– Đức, Hà Lan – Đức, Romania – Đức, Romania – Lithuania với p-value < 0.05 nên các cặp
nước này có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container. Đối với các cặp
nước còn lại có p-value > 0.05 nên sẽ không có sự khác biệt.
5.6. Câu 3F
Có thể tiến hành dự báo cho năm tiếp theo dựa vào dữ liệu thu thập được từ các đối tượng
nghiên cứu đã chọn? Nếu được, hãy tiến hành tính toán giá trị dự báo. Nếu không, hãy đưa
ra lập luận giải thích.
Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng sau.
Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian
Data Time Type of Phương pháp dự báo đề
Dữ liệu
pattern horizon model xuất
Hà Lan Trend Short time TS − Linear exponential
Đức Trend Short time TS smoothing
− Quadratic exponential
Đường Ý Trend Short time TS
Tây Ban Nha Trend Short time TS smoothing
biển
− Exponential trend
Bỉ Trend Short time TS models
− Holt’s method
Đường Đức Trend Short time TS
sắt Hungary Trend Short time TS
15
− Linear exponential
smoothing
− Quadratic exponential
Hà Lan Trend Short time TS smoothing
− Exponential trend
models
− Holt’s method
Non Không tiến hành dự báo
Lithuania Short time TS
stationary với dữ liệu non stationary
Non Không tiến hành dự báo
Romania Short time TS
stationary với dữ liệu non stationary
Bảng 5.3 So sánh sai số của các phương án lựa chọn
Netherlands MAD MSE MAPE
Linear exponential smoothing 181930 43836000000 60.7662
Quadratic exponential smoothing 63596 8118874742 19
Exponential trend models 73977.7 12695900000 16.76677
Holt’s method 647730 15047700000 15.11001
Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo. →
Sử dụng phương pháp Holt’s method.
Tiến hành phân tích đánh giá các nước còn lại, ta được kết quả dự báo dưới bảng 5.4 sau. Kết
quả dự báo dữ liệu của các nước bằng Minitab được trình bày ở phụ lục C.
Bảng 5.4 Kết quả dự báo
Dữ liệu Phương pháp dự báo Giá trị dự báo
Hà Lan Holt’s method 16,067,404
Đức Holt’s method 15,229,009
Đường biển Ý Holt’s method 11,511,375
Tây Ban Nha Holt’s method 17,584,252
Bỉ Exponential trend models 19,002,833
Đức Holt’s Method 7,323,485
Đường sắt Hungary Holt’s Method 389,454
Hà Lan Holt’s Method 1,754,952
Đánh giá sự phù hợp của phương pháp dự báo được thực hiện qua việc kiểm tra hệ số tương
quan residual có ngẫu nhiên hay không.
Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau.
Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:
16
Autocorrelation Function for RESI1
(with 5% significance limits for the autocorrelations)
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5
Lag
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức
Do LBQ <𝑋 2 0.05 (5) = 11.07 nên residual là ngẫu nhiên → Dự báo bằng phương pháp Holt’s
method là phù hợp đối với dữ liệu này.
Trường hợp khác, đối với nước Bỉ của vận tải đường biển, ta có kết quả sau:
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5
Lag
Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức
Do LBQ > 𝑋 2 0.05 (5) = 11.07 nên residual là tương quan → Dự báo bằng phương pháp
Exponential trend models chưa phù hợp trong trường hợp này mặc dù giá trị sai số tốt →
Chuyển sang phương pháp Holt’s method để dự báo, cho ra kết quả phù hợp.
Kết luận: Dự báo bằng phương pháp Holt’s Method là phù hợp để dự báo cho các nước Hà Lan,
Đức, Ý, Tây Ban Nha đối với vận tải biển và nước Đức, Hà Lan của vận tải sắt.
17
TÀI LIỆU THAM KHẢO
[1] John E. Hanke, Dean W. Wichern, 2008. Business Forecasting, 9th edition . Published by
Pearson Education Limited 2014.
[2] Nguyễn Vạng Phúc Nguyên, 2020. Bài giảng môn Kỹ thuật dự báo. Thành phố Hồ Chí
Minh, NXB Đại học Quốc gia Thành phố Hồ Chí Minh.
PHỤ LỤC A. DỮ LIỆU THU THẬP
Bảng A1. Dữ liệu xuất khẩu container bằng đường sắt của các nước
Năm Hà Lan Đức Hungary Lithuania Romania
1970 88,000 365,243 21,101 129,808 489,300
1971 88,000 464,536 8,687 136,312 575,450
1972 111,109 558,902 18,440 147,962 717,400
1973 143,215 671,179 26,781 154,615 888,160
1974 145,000 659,831 40,572 152,579 922,504
1975 118,000 573,509 49,231 151,806 768,352
1976 147,382 700,490 64,747 183,269 1,223,755
1977 118,477 745,854 81,961 175,325 1,361,086
1978 172,010 833,802 93,265 203,478 1,518,888
1979 198,988 954,112 112,200 192,548 1,621,307
1980 213,590 1,021,001 126,473 187,911 1,697,609
1981 209,725 1,063,903 155,818 188,198 1,817,091
1982 195,207 992,101 162,875 203,694 1,851,800
1983 191,420 989,595 193,377 229,811 1,981,000
1984 230,892 1,100,009 204,622 270,044 2,043,600
1985 237,277 1,198,081 208,182 290,506 2,059,200
1986 218,929 1,241,112 229,383 305,686 2,187,900
1987 216,591 1,330,597 231,257 298,734 2,468,750
1988 228,189 1,460,073 229,956 292,846 2,386,900
1989 211,773 1,621,264 211,561 280,719 2,360,000
1990 213,745 1,681,125 173,566 251,166 1,409,400
1991 206,320 1,794,174 153,559 89,392 1,127,869
1992 201,100 1,717,257 149,989 34,486 429,194
1993 195,598 1,636,645 118,470 60,566 217,276
1994 236,067 1,888,608 142,007 28,394 146,313
1995 210,922 2,844,800 134,012 19,368 98,641
1996 214,196 2,840,538 230,555 30,067 132,131
1997 220,395 2,524,649 258,742 19,140 93,698
1998 215,171 2,736,662 145,239 17,491 91,110
1999 216,587 2,700,616 135,970 10,991 106,490
A1
2000 217,384 2,653,976 154,816 10,554 153,540
2001 216,381 2,697,085 176,569 12,758 108,589
2002 216,784 2,683,892 204,803 15,923 112,483
2003 216,850 2,678,318 334,186 14,292 124,291
2004 631,808 3,915,508 389,522 30,770 186,826
2005 700,083 4,212,328 467,366 40,065 217,318
2006 681,993 4,833,220 469,928 58,444 249,461
2007 968,534 5,603,297 439,827 95,214 190,240
2008 1,077,777 6,023,299 447,944 101,711 230,829
2009 1,026,295 5,078,291 452,273 70,247 145,065
2010 921,108 5,614,553 568,685 78,188 196,328
2011 939,808 5,921,037 520,752 102,297 125,372
2012 1,539,810 6,228,484 386,746 104,171 91,465
2013 1,300,000 6,456,060 519,480 103,952 61,474
2014 1,406,000 6,272,430 448,166 90,745 54,995
2015 1,441,000 5,979,035 651,093 69,964 99,737
2016 1,600,000 6,205,543 736,798 67,601 95,561
2017 1,377,000 5,983,721 721,233 92,751 102,468
2018 1,686,000 6,678,868 707,524 114,941 102,879
2019 1,653,000 7,138,556 401,290 144,838 100,777
Bảng A2. Dữ liệu xuất khẩu container bằng đường biển của các nước
Năm Hà Lan Đức Ý Tây Ban Nha Bỉ
1970 947,347 279,376 * * 363,491
1971 985,910 370,508 56,960 137,483 316,354
1972 1,035,165 521,167 86,830 187,580 383,900
1973 1,004,317 704,169 49,937 329,535 483,391
1974 1,072,051 776,646 86,822 448,433 580,041
1975 1,126,024 788,502 78,334 535,856 527,618
1976 1,296,614 908,311 95,430 642,855 564,329
1977 1,398,876 1,000,105 123,693 809,855 688,446
1978 1,665,079 1,198,352 99,152 856,126 762,515
1979 1,850,411 1,378,878 111,459 978,122 871,103
A2
1980 2,038,556 1,543,128 206,246 1,075,625 915,207
1981 2,218,853 1,781,315 379,789 1,185,947 1,033,627
1982 2,295,805 1,741,868 644,323 1,241,006 1,031,453
1983 2,388,889 1,817,698 1,460,336 1,430,727 1,239,557
1984 2,647,014 2,146,402 1,698,655 1,682,126 1,456,538
1985 2,779,680 2,265,887 1,635,583 1,858,614 1,470,859
1986 2,980,268 2,354,816 1,598,191 1,845,819 1,534,503
1987 2,952,353 2,635,566 1,668,467 2,170,043 1,654,975
1988 3,280,679 2,933,532 1,863,178 2,221,100 1,718,003
1989 3,615,501 3,196,430 1,806,139 2,284,921 1,772,388
1990 3,696,000 3,406,837 1,917,477 2,433,027 1,893,115
1991 3,803,508 3,694,285 1,991,586 2,703,211 2,074,827
1992 4,134,427 3,825,171 2,207,998 2,829,969 2,370,490
1993 4,197,034 4,124,436 2,435,806 2,836,899 2,376,603
1994 4,534,897 4,522,041 2,672,231 3,351,109 2,827,038
1995 4,691,438 4,681,361 3,041,562 3,935,099 2,863,383
1996 5,068,000 4,897,480 3,701,621 4,373,065 3,207,723
1997 5,638,479 5,246,129 4,998,673 4,941,756 3,627,955
1998 6,074,040 5,486,496 5,870,177 5,835,627 4,052,889
1999 6,309,484 6,200,000 5,744,339 6,402,312 5,022,102
2000 6,354,662 7,172,675 5,917,239 6,925,765 5,724,074
2001 6,168,205 7,913,021 6,327,906 7,444,671 5,691,239
2002 6,622,178 8,699,356 7,213,048 8,157,488 6,314,930
2003 7,250,936 9,568,885 7,934,287 8,985,277 6,767,345
2004 8,384,123 10,822,400 7,952,570 9,968,913 7,241,354
2005 9,378,669 12,100,830 7,769,604 11,034,160 7,872,963
2006 10,103,160 13,801,570 7,842,333 11,969,810 8,424,693
2007 11,301,690 15,257,000 8,483,074 13,187,295 9,841,397
2008 11,206,050 15,667,000 7,896,531 13,314,317 10,478,990
2009 9,955,769 11,915,000 6,605,651 11,719,125 8,490,000
2010 11,242,400 13,096,000 8,644,600 12,505,803 9,601,000
2011 12,133,125 15,271,000 8,645,200 13,849,935 9,511,000
2012 12,133,471 15,325,000 9,398,353 13,999,337 9,165,000
A3
2013 11,818,300 15,552,000 9,491,151 13,709,523 9,188,000
2014 12,621,088 15,905,000 10,104,971 14,066,730 9,726,000
2015 12,543,230 15,181,000 10,180,380 14,252,380 9,776,000
2016 12,727,674 15,205,000 11,336,766 15,130,479 10,083,000
2017 14,047,511 15,129,000 10,730,533 15,924,830 10,331,000
2018 14,865,101 15,130,000 12,758,529 17,198,589 11,219,000
2019 15,574,369 15,061,029 10,659,573 17,435,718 11,527,000
A4
PHỤ LỤC B. KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
B.1. Graphical Summary
Summary Report for Netherlands Summary Report for Germany
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 6.53 A-Squared 2.73
P-Value <0.005 P-Value <0.005
Mean 508630 Mean 2875355
StDev 510025 StDev 2162680
Variance 2.60126E+11 Variance 4.67718E+12
Skewness 1.22425 Skewness 0.64367
Kurtosis -0.04701 Kurtosis -1.12949
N 50 N 50
Minimum 88000 Minimum 365243
1st Quartile 198141 1st Quartile 1013776
Median 216687 Median 2206628
3rd Quartile 925783 3rd Quartile 5209543
Maximum 1686000 Maximum 7138556
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 400000 800000 1200000 1600000 363682 653577 0 1600000 3200000 4800000 6400000 2260729 3489982
95% Confidence Interval for Median 95% Confidence Interval for Median
212994 232591 1417571 2770761
95% Confidence Interval for StDev 95% Confidence Interval for StDev
426042 635560 1806560 2694987
Mean Mean
Median Median
200000 300000 400000 500000 600000 700000 1500000 2000000 2500000 3000000 3500000
Mean Mean
Median Median
Mean Mean
Median Median
200000 400000 600000 800000 1000000 3000000 4000000 5000000 6000000 7000000
B1
Summary Report for Germany_1 Summary Report for Italy
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 2.96 A-Squared 1.94
P-Value <0.005 P-Value <0.005
Mean 6803993 Mean 4612325
StDev 5716329 StDev 3894391
Variance 3.26764E+13 Variance 1.51663E+13
Skewness 0.51075 Skewness 0.38082
Kurtosis -1.40583 Kurtosis -1.29749
N 50 N 49
Minimum 279376 Minimum 49937
1st Quartile 1771453 1st Quartile 1316864
Median 4601701 Median 3041562
3rd Quartile 13272393 3rd Quartile 7943429
Maximum 15905000 Maximum 12758529
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 4000000 8000000 12000000 16000000 5179430 8428556 0 3000000 6000000 9000000 12000000 3493726 5730925
95% Confidence Interval for Median 95% Confidence Interval for Median
2835721 8171145 1818370 6546095
95% Confidence Interval for StDev 95% Confidence Interval for StDev
4775044 7123308 3247615 4865257
Mean Mean
Median Median
3000000 4000000 5000000 6000000 7000000 8000000 9000000 2000000 3000000 4000000 5000000 6000000 7000000
Mean Mean
Median Median
2000000 3000000 4000000 5000000 6000000 7000000 8000000 2000000 3000000 4000000 5000000 6000000
1600000 7000000
1400000
6000000
1200000
5000000
Netherlands
Germany
1000000
4000000
800000
3000000
600000
2000000
400000
200000 1000000
0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index
250000
600000
500000 200000
Lithuania
Hungary
400000
150000
300000
100000
200000
100000 50000
0
0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index
B2
Time Series Plot of Romania Time Series Plot of Netherlands_1
2500000 16000000
14000000
2000000
12000000
Netherlands_1
10000000
1500000
Romania
8000000
1000000
6000000
4000000
500000
2000000
0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index
14000000 12000000
12000000 10000000
10000000
Germany_1
8000000
Italy
8000000
6000000
6000000
4000000
4000000
2000000
2000000
0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index
10000000
15000000
8000000
Belgium
Spain
10000000 6000000
4000000
5000000
2000000
0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
Autocorrelation
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag
B3
Autocorrelation Function for Hungary Autocorrelation Function for Lithuania
(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
Autocorrelation
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
Autocorrelation
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
Autocorrelation
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
Autocorrelation
Autocorrelation
0.2 0.2
0.0 0.0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1.0 -1.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag
B.4. Correlation
B4
B5
PHỤ LỤC C. KẾT QUẢ THỰC HIỆN DỰ BÁO BẰNG MINITAB
C.1. Levence Test
C1
C.2. Forecast Error
Đối với các nước đường sắt
− Hà Lan
− Hungary
C2
− Đức
C3
− Đức
− Ý
C4
− Tây Ban Nha
− Bỉ
C5
C.3. Forecasting Implement
Đối với các nước đường sắt
− Hà Lan
− Đức
− Hungary
C6
− Đức
− Ý
− Bỉ
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5
Lag
− Hungary
C7
Autocorrelation Function for RESI2
(with 5% significance limits for the autocorrelations)
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5
Lag
− Hà Lan
Autocorrelation Function for RESI3
(with 5% significance limits for the autocorrelations)
1.0
0.8
0.6
0.4
Autocorrelation
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 2 3 4 5
Lag
− Hà Lan
C8
− Ý
− Bỉ
C9