You are on page 1of 43

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA


KHOA CƠ KHÍ
BỘ MÔN KỸ THUẬT HỆ THỐNG CÔNG NGHIỆP
--------------oOo--------------

BÁO CÁO BÀI TẬP LỚN 1


MÔN HỌC KỸ THUẬT DỰ BÁO

GOODS TRANSPORT: CONTAINER TRANSPORT

GVHD: TS. Nguyễn Vạng Phúc Nguyên


Nhóm: 8
SVTH: Nguyễn Anh Nhật Minh MSSV: 1810327
Nguyễn Thành Minh MSSV: 1810329
Nguyễn Hoàng Yến Nhi MSSV: 1810399
Ngô Trần Thu Thảo MSSV: 1811229
Ngô Minh Vũ MSSV: 1514105

Tp. Hồ Chí Minh, tháng 11/2020


ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA CƠ KHÍ
BỘ MÔN KỸ THUẬT HỆ THỐNG CÔNG NGHIỆP
--------------oOo--------------

BÁO CÁO BÀI TẬP LỚN 1


MÔN KỸ THUẬT DỰ BÁO

GOODS TRANSPORT: CONTAINER TRANSPORT

GVHD: TS. Nguyễn Vạng Phúc Nguyên


Nhóm: 8
SVTH: Nguyễn Anh Nhật Minh MSSV: 1810327
Nguyễn Thành Minh MSSV: 1810329
Nguyễn Hoàng Yến Nhi MSSV: 1810399
Ngô Trần Thu Thảo MSSV: 1811229
Ngô Minh Vũ MSSV: 1514105

Tp. Hồ Chí Minh, tháng 11/2020


i
LỜI CẢM ƠN
Trong quá trình nghiên cứu, tìm hiểu và hoàn thiện báo cáo với đề tài Goods Transport:
Container Transport, nhóm đã nhận được nhiều sự động viên, giúp đỡ cũng như hỗ trợ về mặt
kiến thức chuyên môn từ quý thầy cô, anh chị khóa trên cũng như các bạn cùng khóa.
Nhóm xin gửi lời cảm ơn chân thành nhất đến quý thầy cô trong bộ môn Kỹ Thuật Hệ
Thống Công Nghiệp trực thuộc khoa Cơ Khí, đặc biệt là thầy Nguyễn Vạng Phúc Nguyên –
người trực tiếp giảng dạy môn Kỹ thuật dự báo đã tạo điều kiện để nhóm có thể tìm hiểu và
hoàn thành báo cáo một cách trọn vẹn nhất.
Bước đầu đi vào thực tế, tìm hiểu những khía cạnh thực tế trong các môn học chuyên
ngành, kiến thức của nhóm còn hạn chế và nhiều bỡ ngỡ. Vì vậy, quá trình hoàn thành báo cáo
không thể tránh khỏi những sai sót nhất định, nhóm mong nhận được những ý kiến, đóng góp
của quý thầy cô và các bạn cùng lớp để từng thành viên có thể hoàn thiện kiến thức của bản
thân trong lĩnh vực này hơn và áp dụng tốt vào công việc sau này.
Nhóm xin chân thành cảm ơn.
Ngày 19 tháng 11 năm 2020
Sinh viên thực hiện

Nguyễn Hoàng Yến Nhi


Nguyễn Thành Minh
Nguyễn Anh Nhật Minh
Ngô Trần Thu Thảo
Ngô Minh Vũ

ii
MỤC LỤC
LỜI CẢM ƠN .............................................................................................................................ii
MỤC LỤC .................................................................................................................................iii
DANH SÁCH HÌNH ẢNH ........................................................................................................ v
DANH SÁCH BẢNG BIỂU ...................................................................................................... v
CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI ...................................................................................... vi
1.1. Mục đích ..................................................................................................................... vi
1.2. Nhiệm vụ ..................................................................................................................... vi
1.3. Bố cục ......................................................................................................................... vi
1.4. Phạm vi báo cáo .......................................................................................................... vi
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN........................................ 1
2.1. Cơ sở lý thuyết ............................................................................................................. 1
2.1.1. Kỹ thuật EDA ....................................................................................................... 1
2.1.2. Phương pháp dự báo ............................................................................................. 1
2.2. Phương pháp luận ........................................................................................................ 2
CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ ..................................................................................... 3
3.1. Vấn đề .......................................................................................................................... 3
3.2. Công cụ ........................................................................................................................ 3
3.3. Thu thập dữ liệu ........................................................................................................... 3
3.3.1. Cách thức thu thập dữ liệu .................................................................................... 3
3.3.2. Điều chỉnh dữ liệu ................................................................................................ 3
CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ ................................................... 5
4.1. Thống kê mô tả ............................................................................................................ 5
4.1.1. Các thông số của thống kê mô tả .......................................................................... 5
4.1.2. Nhận xét các thông số của thống kê mô tả ........................................................... 5
4.1.3. Dạng dữ liệu ......................................................................................................... 7
4.2. Hệ số biến thiên ........................................................................................................... 9
4.3. Phân tích khoảng tin cậy .............................................................................................. 9
4.4. Phân tích hệ số tương quan ........................................................................................ 10
4.4.1. Ma trận tương quan ............................................................................................ 10
4.4.2. Kiểm định hệ số tương quan ............................................................................... 11

iii
CHƯƠNG 5. TRẢ LỜI CÂU HỎI ....................................................................................... 12
5.1. Câu 2A ....................................................................................................................... 12
5.2. Câu 2B ....................................................................................................................... 12
5.3. Câu 3C ....................................................................................................................... 12
5.4. Câu 3D ....................................................................................................................... 13
5.5. Câu 3E ........................................................................................................................ 13
5.6. Câu 3F ........................................................................................................................ 15
TÀI LIỆU THAM KHẢO
PHỤ LỤC A. DỮ LIỆU THU THẬP
PHỤ LỤC B. KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
PHỤ LỤC C. KẾT QUẢ THỰC HIỆN DỰ BÁO BẰNG MINITAB

iv
DANH SÁCH HÌNH ẢNH
Hình 2.1 Phương pháp luận thực hiện báo cáo ........................................................................... 2
Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan ............................................................................... 3
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5 ................ 4
Hình 4.1 Các thông số của thống kê mô tả ................................................................................. 5
Hình 4.2 Summary Report for Netherlands ................................................................................ 5
Hình 4.3 Biểu đồ chuỗi thời gian................................................................................................ 7
Hình 4.4 ACF của dữ liệu nước Bỉ ............................................................................................. 7
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania ......... 8
Hình 4.6 Kết quả phân tích sau khi thực hiện sai phân .............................................................. 8
Hình 4.7 Kết quả CV của các dữ liệu ......................................................................................... 9
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab.................................................... 10
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy .......................................................... 13
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt ............................................................. 13
Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các
năm ........................................................................................................................................... 13
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển ............. 14
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển .................... 14
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt ............... 14
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt ....................... 14
Hình 5.8 Kết quả kiểm định Turkey ......................................................................................... 15
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức .......................................... 17
Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức ........................................ 17

DANH SÁCH BẢNG BIỂU


Bảng 2.1 Lựa chọn phương pháp dự báo .................................................................................... 1
Bảng 4.1 Data pattern của các nước ........................................................................................... 8
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt .................. 10
Bảng 4.3. Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển .............. 11
Bảng 5.1 Kết quả kiểm định phân bố Normal .......................................................................... 12
Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian ................................................................... 15
Bảng 5.3 So sánh sai số của các phương án lựa chọn .............................................................. 16
Bảng 5.4 Kết quả dự báo .......................................................................................................... 16

v
CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI
1.1. Mục đích
Phân tích dữ liệu đang không ngừng phát triển và dần trở thành xu hướng của thời đại
mới. Phân tích dữ liệu không chỉ đơn thuần dừng lại ở việc hiểu được bản chất của dữ liệu, mà
từ đó còn hỗ trợ ra quyết định. Kỹ năng phân tích dữ liệu hiện nay được áp dụng trong chương
trình giảng dạy của các trường đại học ở nhiều lĩnh vực khác nhau. Môn học Kỹ thuật dự báo
cung cấp cho sinh viên các kiến thức cơ bản trong lĩnh vực thống kê và dự báo, tạo điều kiện
cho sinh viên tiếp cận với kỹ năng phân tích dữ liệu.
Mục đích của báo cáo là tìm hiểu và phân tích dữ liệu về chỉ số vận tải container thông
qua 2 phương thức: đường sắt và đường thuỷ của các nước Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ,
Hungary, Lithuania và Romania từ năm 1970 đến 2019. Thông qua quá trình phân tích dữ liệu,
nhóm có cơ hội áp dụng các kiến thức từ môn học Kỹ thuật dự báo để phân tích một vấn đề cụ
thể trong thực tế, đồng thời tìm hiểu về đặc tính của phương thức vận tải hàng hoá bằng
container của các nước trên, góp phần hoàn thiện kiến thức của nhóm trong lĩnh vực Logistics
quốc tế.
1.2. Nhiệm vụ
Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:
− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải container)
của 5 nước có giao thương nhiều nhất với Việt Nam.
− Áp dụng Kỹ thuật EDA để phân tích và tìm ra các đặc trưng cơ bản của dữ liệu, bao
gồm: các đặc trưng cơ bản của thống kê mô tả (trung bình, trung vị, phương sai, độ lệch
chuẩn,...), các tứ phân vị, khoảng tin cậy cho trung bình và độ lệch chuẩn, mức biến
động, sự tương quan, từ đó rút ra được đặc tính của dữ liệu.
− Từ đặc tính của dữ liệu, đưa ra mô hình dự báo phù hợp cho chỉ số vận tải container của
các nước.
1.3. Bố cục
Bố cục bài báo cáo gồm 5 chương, cụ thể:
− Chương 1: Giới thiệu đề tài
− Chương 2: Cơ sở lý thuyết và Phương pháp luận
− Chương 3: Giới thiệu vấn đề
− Chương 4: Thống kê mô tả
− Chương 5: Trả lời câu hỏi
1.4. Phạm vi báo cáo
− Chỉ tiến hành dự báo đối với dữ liệu có data pattern là stationary, trend và seasonal.
− Các phương pháp dự báo sử dụng bao gồm: Naïve, Simple averages, Moving averages,
Exponential smoothing, Growth curves, Linear exponential smoothing, Quadratic
exponential smoothing, Holt’s method.

vi
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN
2.1. Cơ sở lý thuyết
2.1.1. Kỹ thuật EDA
Exploratory Data Analysis (EDA) là một phương pháp phân tích dữ liệu chủ yếu sử
dụng các kỹ thuật về biểu đồ, hình vẽ. Kỹ thuật này bao gồm việc thực hiện xem xét, nghiên
cứu các dữ liệu, biểu đồ khác nhau cũng như thực hiện những phương pháp thống kê mô tả để
tìm ra kết quả cần thiết cho câu hỏi được đặt ra, đồng thời giúp chúng ta có cơ sở để chọn mô
hình trong các bước tiếp theo.
Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm một
vài kỹ thuật sau:
− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots, ...
− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots,
box plots, ...
− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của con
người.
2.1.2. Phương pháp dự báo
Bảng 2.1 Lựa chọn phương pháp dự báo
Pattern of
Method Time horizon Type of Model
Data
Naïve ST, T, S S TS
Simple averages ST S TS
Moving averages ST S TS
Exponential smoothing ST S TS
Growth curves T I, L TS
Linear exponential smoothing T S TS
Quadratic exponential smoothing T S TS
Holt’s method T S TS
Trong đó
Pattern of the data: ST, stationary; T, trending; S, seasonal.
Time horizon: S, short term; I, intermediate term; L, long term.
Type of model: TS, time series.

1
2.2. Phương pháp luận

Hình 2.1 Phương pháp luận thực hiện báo cáo

2
CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ
3.1. Vấn đề
Trong hoạt phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc nắm bắt tối
đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách cụ thể gồm: các số liệu
quá khứ của lĩnh vực dự báo, diễn biến tình hình hiện trạng cũng như động thái phát triển của
lĩnh vực dự báo và đánh giá một cách đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn
định tính.
Bài báo cáo tập trung phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu bằng cách
sử dụng kỹ thuật EDA và phương pháp chuỗi thời gian. Phân tích dữ liệu khai phá là kỹ thuật
để xác định các mối quan hệ và xu hướng, các quan sát có ảnh hưởng, từ đó giúp dễ dàng mô
tả và tóm tắt bộ dữ liệu nhằm giúp cho nhà phân tích có cái nhìn trực quan và tận dụng tốt nhất
dữ liệu có được. Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sát của một
biến duy nhất theo biến số độc lập là thời gian. Trong đó bộ dữ liệu được chọn là chỉ số vận tải
hàng hóa bằng container của 5 nước mà Việt Nam xuất khẩu hàng hóa đến nhiều nhất, bao gồm
hai loại hình vận tải container là đường sắt và đường thủy, đơn vị đo lường là TEU (Đơn vị
tương đương 20 feet). Dữ liệu được lấy từ Bộ cơ sở dữ liệu OECD, truy cập bằng đường dẫn
sau: https://www.oecd-ilibrary.org/transport.
3.2. Công cụ
− Kỹ thuật EDA bao gồm:
▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị.
▪ Các thông số đo lường sự phân tán: Khoảng biến thiên, Tứ phân vị, IQR, Phương
sai, Độ lệch chuẩn.
▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan.
▪ Hệ số biến thiên (CV), Khoảng tứ phân vị, Biểu đồ Box Plot, Hệ số tương quan
Pearson.
− Phần mềm Minitab 18.
3.3. Thu thập dữ liệu
3.3.1. Cách thức thu thập dữ liệu
Dữ liệu là chỉ số xuất khẩu container của 5 nước đường sắt bao gồm Hà Lan, Hungary,
Romania, Đức, Lithuania và 5 nước đường biển bao gồm Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ.
Các dữ liệu này được thu thập từ trang thông tin điện tử OECD iLibrary.
3.3.2. Điều chỉnh dữ liệu
Sau khi thu thập dữ liệu về chỉ số vận tải container của các nước để tính toán, có một
vài nước không có dữ liệu ở một vài năm thời đoạn. Do đó, nhóm tiến hành sử dụng phương
pháp trung bình dịch chuyển (MA) để làm đầy dữ liệu thô.
Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003.

Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan

3
Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu cho
giai đoạn 1995 – 2003 cho Hà Lan.

Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5
Dựa vào các loại sai số MAD, MSE, MAPE khi lần lượt dự báo dữ liệu, sử dụng lần lượt
3, 4 và 5 thời đoạn. Ta thấy khi số thời đoạn dự báo càng tăng thì các giá trị sai số của dự báo
cũng tăng, do đó ta sử dụng phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn (k =
3) để dự báo dữ liệu cho các năm còn thiếu.
Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A.

4
CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ
4.1. Thống kê mô tả
4.1.1. Các thông số của thống kê mô tả
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive
Statistics...) của phần mềm Minitab để tính toán các thông số của thống kê mô tả, thu được kết
quả như hình 4.1 dưới đây.

Hình 4.1 Các thông số của thống kê mô tả


Ngoài ra, nhóm tiến hành khai thác biểu đồ Histogram và biểu đồ Boxplot của dữ liệu
bằng công cụ công cụ Graphical Summary (Stat → Basic Statistics → Graphical Summary) để
tính toán các thông số cơ bản của thống kê mô tả và vẽ các biểu đồ Histogram, Box Plot cho
từng nước. Hình 4.2 minh họa cho dữ liệu của nước Hà Lan, kết quả của tất cả các nước được
trình bày ở phần phụ lục B.
Summary Report for Netherlands
Anderson-Darling Normality Test
A-Squared 6.53
P-Value <0.005
Mean 508630
StDev 510025
Variance 2.60126E+11
Skewness 1.22425
Kurtosis -0.04701
N 50
Minimum 88000
1st Quartile 198141
Median 216687
3rd Quartile 925783
Maximum 1686000
95% Confidence Interval for Mean
0 400000 800000 1200000 1600000 363682 653577
95% Confidence Interval for Median
212994 232591
95% Confidence Interval for StDev
426042 635560

95% Confidence Intervals

Mean

Median

200000 300000 400000 500000 600000 700000

Hình 4.2 Summary Report for Netherlands


4.1.2. Nhận xét các thông số của thống kê mô tả
❖ Đối với các nhóm nước xuất khẩu container bằng đường sắt:
Đức: Ta thấy chỉ số xuất khẩu container qua đường sắt của Đức có giá trị từ 365 243 TEU
đến 7 138 556 TEU. Khoảng IQR trải từ 1 013 776 đến 5 209 543 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (2 206 628 < 2 857 355), cho thấy chỉ số vận tải

5
container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn
giá trị trung bình 2 857 355 TEU.
Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ 8687
TEU đến 736 798 TEU. Khoảng IQR trải từ 132 127 đến 441 856 TEU. Trung vị (Median) của
dữ liệu bé hơn giá trị trung bình (Mean) (2 204 713 < 266 232), cho thấy chỉ số vận tải container
qua đường sắt của Hungary có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá
trị trung bình 266 232 TEU.
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88
000TEU đến 1 686 000 TEU. Khoảng IQR trải từ 200 044 đến 930 458 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ số vận tải
container qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé
hơn giá trị trung bình 517 214 TEU.
Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10
554 TEU đến 305 686 TEU. Khoảng IQR trải từ 38 670 đến 187 983 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (103 125 <123 127), cho thấy chỉ số vận tải
container qua đường sắt của Lithuania có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị
bé hơn giá trị trung bình 123 127TEU.
Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54
995 TEU đến 2 468 750 TEU. Khoảng IQR trải từ 108 364 đến 1 436 772 TEU. Trung vị
(Median) của dữ liệu bé hơn giá trị trung bình (Mean) (220 074 < 750 837), cho thấy chỉ số vận
tải container qua đường sắt của Romania có xu hướng lệch phải, tức là đa phần dữ liệu có giá
trị bé hơn giá trị trung bình 750 837 TEU.
❖ Đối với các nhóm nước xuất khẩu container bằng đường biển:
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000
TEU đến 1 686 000 TEU. Khoảng IQR trải từ 200 044 đến 930 458 TEU. Trung vị (Median)
của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ số vận tải
container qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé
hơn giá trị trung bình 517 214 TEU.
Đức: Ta thấy chỉ số xuất khẩu container qua đường biển của Đức có giá trị từ 279 376 TEU
đến 15 905 000 TEU. Khoảng IQR phân bố từ 1 771 453 TEU đến 13 272 393. Trung vị của
dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường
biển của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình
6 803 993 TEU.
Ý: Ta thấy chỉ số xuất khẩu container qua đường biển của Ý có giá trị từ 49 937 TEU đến
12 758 529 TEU. Khoảng IQR phân bố từ 792 015 TEU đến 7 943 429. Trung vị của dữ liệu
bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường biển
của Ý có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4 557
328 TEU.
Tây Ban Nha: Ta thấy chỉ số xuất khẩu container qua đường biển của Tây Ban Nha có giá
trị từ 137,483 TEU đến 17,435,718 TEU. Khoảng IQR phân bố từ 1 335 867 TEU đến 17 435
718. Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải

6
container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn
giá trị trung bình 6 374 367 TEU.
Bỉ: Ta thấy chỉ số xuất khẩu container qua đường biển của Bỉ có giá trị từ 316 354 TEU
đến 11 527 000 TEU. Khoảng IQR phân bố từ 1 033 084 TEU đến 8 658 750. Trung vị của dữ
liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường
biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4
533 168 TEU.
4.1.3. Dạng dữ liệu
Xác định độ lệch của chuỗi dữ liệu: dựa vào dữ liệu thu được ở trên cùng biểu đồ
Histogram (phụ lục B), đối với cả 10 dữ liệu, độ lệch đều dương và giá trị trung bình lớn hơn
các giá trị trung vị nên phân bố của cả năm nước đều có xu hướng lệch phải.
Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat
→ Time Series → Time Series Plot) để xác định hình dạng có thể có của chuỗi dữ liệu. Ví dụ
đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3.
Time Series Plot of Belgium
12000000

10000000

8000000
Belgium

6000000

4000000

2000000

0
1 5 10 15 20 25 30 35 40 45 50
Index

Hình 4.3 Biểu đồ chuỗi thời gian


Nhìn vào Time Series Plot, ta thấy chuỗi dữ liệu có khả năng có tính xu hướng. Tuy
nhiên cần phải sử dụng công cụ Autocorrelation trong Minitab (Stat → Time Series →
AutoCorrelation) để vẽ biểu đồ ACF mới xác định được chính xác. Ví dụ ACF của nước Bỉ
trong hình 4.4.
Autocorrelation Function for Belgium
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5 6 7 8 9 10 11 12 13
Lag

Hình 4.4 ACF của dữ liệu nước Bỉ


Dựa vào biểu đồ trên, ta thấy hệ số tự tương quan tại các lag đầu tiên đều lớn đáng kể
so với 0 và sau đó giảm dần về 0. Do đó dữ liệu xuất khẩu container của nước Bỉ có tính xu
7
hướng. Thực hiện tương tự với dữ liệu các nước khác, ta thu được kết quả được tổng hợp trong
bảng 4.1.
Bảng 4.1 Data pattern của các nước
Dữ liệu Độ lệch Data Pattern
Hà Lan Lệch phải Trend
Đức Lệch phải Trend
Đường biển Ý Lệch phải Trend
Tây Ban Nha Lệch phải Trend
Bỉ Lệch phải Trend
Đức Lệch phải Trend
Hungary Lệch phải Trend
Đường sắt Hà Lan Lệch phải Trend
Lithuania Lệch phải Non-stationary
Romania Lệch phải Non-stationary
Phân tích dạng dữ liệu của Lithuania:
Autocorrelation Function for Lithuania Time Series Plot of Lithuania
(with 5% significance limits for the autocorrelations)
300000
1.0

0.8
250000
0.6

0.4 200000
Autocorrelation

Lithuania

0.2

0.0 150000

-0.2
100000
-0.4

-0.6
50000
-0.8

-1.0
0
1 2 3 4 5 6 7 1 5 10 15 20 25 30 35 40 45 50
Lag Index

Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania
Phân tích autocorrelation cho thấy dữ liệu của Lithuania có tính xu hướng, tuy nhiên
biểu đồ time series lại không biểu hiện tính xu hướng, do đó chỉ có thể kết luận dữ liệu của
Lithuania mang tính không ổn định (non-stationary). Do đó tiến hành sai phân dữ liệu để loại
bỏ tính không ổn định này.
Autocorrelation Function for C9 Time Series Plot of C9
(with 5% significance limits for the autocorrelations) 50000

1.0

0.8
0
0.6

0.4
Autocorrelation

0.2 -50000
C9

0.0

-0.2

-0.4 -100000

-0.6

-0.8
-150000
-1.0

1 2 3 4 5 6 7 8 9 10 11 12 1 5 10 15 20 25 30 35 40 45 50
Lag Index

Hình 4.6 Kết quả phân tích sau khi thực hiện sai phân
Kết quả của việc sai phân trên sẽ làm cơ sở để lựa chọn phương pháp dự báo thích hợp.
Tương tự với việc phân tích sai phân cho Romania.

8
4.2. Hệ số biến thiên
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive
Statistics...) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình
4.7.

Hình 4.7 Kết quả CV của các dữ liệu


Đường biển: Nhìn chung, tất cả các chỉ số CV của các nước đều bé hơn 1, cho ta thấy
mức biến động của chỉ số TEU của các nước đều ở mức thấp. Chỉ số TEU của Hà Lan có mức
biến động thấp nhất trong nhóm 5 nước (73.12 %), cho thấy đặc tính dữ liệu về vận tải container
qua đường biển của Hà Lan ổn định và ít biến động hơn các nước còn lại và chỉ số TEU của
Tây Ban Nha có mức biến động lớn nhất (90.76%), cho thấy đặc tính dữ liệu về vận tải container
qua đường biển của Tây Ban Nha không ổn định và biến động nhiều nhất so với các nước còn
lại.
Đường sắt: Chỉ số CV của 3 nước: Đức, Hungary, Lithuania, đều bé hơn 1, cho ta thấy
mức biến động của chỉ số TEU của các nước đều ở mức thấp. Giá trị CV cho chỉ số TEU của
Romania và Hà Lan là 106.28% và 100.27%, cho thấy chỉ số này của Romania và Hà Lan biến
động mạnh. Chỉ số TEU của Lithuania có mức biến động thấp nhất trong nhóm 5 nước (72.51
%), cho thấy đặc tính dữ liệu về vận tải container qua đường sắt của Lithuania ổn định và ít
biến động hơn các nước còn lại và chỉ số TEU của Romania có mức biến động lớn nhất
(106.28%), cho thấy đặc tính dữ liệu về vận tải container qua đường sắt của Romania không ổn
định và biến động nhiều nhất so với các nước còn lại.
4.3. Phân tích khoảng tin cậy
Khoảng tin cậy là một phạm vi các giá trị có khả năng chứa một tham số tổng thể không
xác định. Mức độ tin cậy đề cập đến tỉ lệ phần trăm của xác suất hay độ chắc chắn khoảng tin
cậy sẽ chứa tham số tổng thể thực tế khi lấy ra một mẫu ngẫu nhiên nhiều lần. Khoảng tin cậy
về giá trị trung bình hay giá trị độ lệch chuẩn đều có ý nghĩa như vậy với dữ liệu vận tải
container của các nước.
Ví dụ với dữ liệu chỉ số xuất khẩu container theo đường sắt của Hà Lan:
Sử dụng Minitab để tính toán khoảng tin cậy (trích từ mục thống kê mô tả), ta được kết quả như
sau.

9
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab
Khoảng tin cậy 95% cho giá trị trung bình (Mean) của chỉ số Transportation cho vận
tải container qua đường sắt của Hà Lan: (370 251; 664 177) TEU cho biết khi lấy ngẫu nhiên
dữ liệu vận tải của các năm thì 95% giá trị trung bình của của chỉ số vận tải sẽ nằm trong khoảng
tin cậy.
Khoảng tin cậy 95% cho giá trị độ lệch chuẩn của chỉ số Transportation cho vận tải
container qua đường sắt của Hà Lan: (426 674 ; 639 202) TEU cho biết khi lấy ngẫu nhiên dữ
liệu vận tải của các năm thì 95% giá trị độ lệch chuẩn của của chỉ số vận tải sẽ nằm trong khoảng
tin cậy.
4.4. Phân tích hệ số tương quan
4.4.1. Ma trận tương quan
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt
Nước Đức Hungary Lithuania Hà Lan Romania
Đức 1 0.903 -0.430 0.939 -0.639
Hungary 0.903 1 -0.252 0.889 -0.427
Lithuania -0.430 -0.252 1 -0.225 0.912
Hà Lan 0.939 0.889 -0.225 1 -0.490
Romania -0.639 -0.427 0.912 -0.490 1
Ở nhóm 3 nước Đức, Hungary và Hà Lan có sự tương đồng về tăng trưởng cho chỉ số
Transportation về vận tải container theo đường sắt (tăng trưởng theo hàm bậc 2 có tính xu
hướng) nên hệ số tương quan của 3 nước này có giá trị cao ( thấp nhất là 0.882)
Mặt khác, 2 nước Lithuania và Romania có đặc tính dữ liệu tăng dần đều theo hàm xu
hướng từ 1970, nhưng lại giảm đột ngột giai đoạn 1987, 1988 nên hệ số tương quan giữa 2 nước
này có giá trị cao, xấp xỉ 0.912.
Nhưng hệ số tương quan của 2 nước Lithuania và Romania so với Đức, Hà Lan và
Hungary cho ta thấy sự khác nhau về xu hướng tăng trưởng chỉ số vận tải. Giữa 2 nhóm nước
này có ít sự tương quan trong vận tải container bằng đường sắt hơn. Giá trị Coefficient có giá
trị âm cho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều thì chỉ số vận tải

10
của 2 nước còn lại sau khi giảm đột ngột giai đoạn 1987, 1988 thì vẫn tiếp tục tăng trưởng lại,
nhưng với giá trị thấp hơn rất nhiều so với trước khi giảm.
Bảng 4.3. Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển
Nước Hà Lan Đức Ý Tây Ban Nha Bỉ
Hà Lan 1 0.983 0.966 0.991 0.988
Đức 0.983 1 0.958 0.984 0.991
Ý 0.966 0.958 1 0.981 0.966
Tây Ban Nha 0.991 0.984 0.981 1 0.992
Bỉ 0.988 0.991 0.966 0.992 1
Tương tự đối với nhóm các nước đường biển, ma trận về hệ số tương quan trình bày ở
bảng 4.3 của 5 nước cho ta thấy hệ số tương quan của nhóm 5 nước này rất cao, giá trị thấp
nhất lên đến 0.967. Chỉ số Transportation cho vận tải container bằng đường biển của 5 nước có
mối liên hệ vô cùng chặt chẽ. Điều này phù hợp đặc tính xu hướng của dữ liệu vận tải của 5
nước này, (tăng dần theo thời gian, từ 1970 đến 2019, theo hàm xu hướng bậc 2), đã được trình
bày ở phần trên.
4.4.2. Kiểm định hệ số tương quan
Các giá trị p-value được xuất ra từ phần mềm thống kê Minitab, sử dụng độ tin cậy 95%.
Kết quả kiểm định bằng minitab được trình bày ở phần phụ lục B.
Đối với nhóm các nước đường sắt:
Đối với các nước ở nhóm 3 nước Hà Lan, Đức và Hungary, và giữa 2 nước Lithuania
và Romania giá trị p-value đều tiến về giá trị 0, điều này chứng tỏ các hệ số tương quan trình
bày đều có ý nghĩa thống kê.
Đối với hệ số tương quan giữa các nước thuộc 2 nhóm khác nhau như đã phân tích ở
trên (Hungary và Romania, Hà Lan và Lithuania), trị thống kê p-value có giá trị lần lượt 0.002
và 0.008 nhưng vẫn bé hơn 0.05, xem như các hệ số tương quan này vẫn có giá trị thống kê.
Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077
> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại.
Đối với nhóm các nước đường biển:
Giá trị kiểm định p-value của từng hệ số tương quan được xuất ra từ phần mềm Minitab
đều tiến về giá trị 0 cho từng cặp dữ liệu, điều này chứng tỏ các hệ số tương quan trình bày ở
bảng 4.3 đều có ý nghĩa thống kê.

11
CHƯƠNG 5. TRẢ LỜI CÂU HỎI
5.1. Câu 2A
Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông
qua phân tích EDA ở câu 1?
− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm.
− Chỉ số vận tải container qua cả đường sắt và đường biển của các nước có phân bố không
đồng đều, có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung
bình, tuy nhiên không bị chênh lệch quá nhiều so với giá trị trung bình.
− Đối với các nhóm nước xuất khẩu container bằng đường sắt: Giá trị xuất khẩu trung
bình của nước Đức là lớn nhất (2,875,355 TEU), giá trị xuất khẩu trung bình của nước
Lithuania là bé nhất (123127 TEU).
− Đối với các nhóm nước xuất khẩu container bằng đường biển: Giá trị xuất khẩu trung
bình của nước Đức là lớn nhất (6,803,993 TEU), giá trị xuất khẩu trung bình của nước
Bỉ là thấp nhất (4,533,168 TEU).
− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều
hơn đáng kể so với đường sắt.
5.2. Câu 2B
Chuỗi dữ liệu sử dụng của các đối tượng nghiên cứu có tuân theo phân bố Normal không?
Tại sao?
Dựa vào giá trị p – value của kiểm định Anderson – Darling Normality Test được thực
hiện trên Minitab 18 ta thu được kết quả dưới bảng sau.
Bảng 5.1 Kết quả kiểm định phân bố Normal
Dữ liệu Giá trị kiểm định Nhận xét
Netherlands p < 0.05 Không tuân theo phân bố Normal
Germany p < 0.05 Không tuân theo phân bố Normal
Đường biển Italy p < 0.05 Không tuân theo phân bố Normal
Spain p < 0.05 Không tuân theo phân bố Normal
Belgium p < 0.05 Không tuân theo phân bố Normal
Germany p < 0.05 Không tuân theo phân bố Normal
Hungary p < 0.05 Không tuân theo phân bố Normal
Đường sắt Lithuania p < 0.05 Không tuân theo phân bố Normal
Netherlands p < 0.05 Không tuân theo phân bố Normal
Romania p < 0.05 Không tuân theo phân bố Normal
5.3. Câu 3C
Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy
không?
− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được.
− Do dữ liệu trong mẫu phải ngẫu nhiên, tuy nhiên đối với dữ liệu của một số nước không
đầy đủ nên phải dùng phương pháp dự báo để tính toán → Dữ liệu mất đi tính ngẫu
nhiên và độc lập.

12
5.4. Câu 3D
Chủ đề mà nhóm quan tâm (interest topics) của Đức có cùng giá trị với Hà Lan? (thí dụ:
Goods transport value của Đức có bằng Goods transport value của Hà Lan hay không?)
Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean).
Tiến hành trên Minitab 18, chọn Stat → Paired t for the mean. Trong đó 𝜇1 là giá trị trung bình
của Đức, 𝜇2 là giá trị trung bình của Hà Lan, difference = 𝜇1 − 𝜇2 . Ta thu được kết quả sau:

Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy

Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt
Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn
hơn Hà Lan.

Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các
năm

5.5. Câu 3E
Có sự khác nhau giữa các bộ dữ liệu được phân tích từ các nước hay không? (One-way
ANOVA và Tukey test, Interval Plots và Boxplot of Data )
13
Đường biển

Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển

Interval Plot of Netherlands, Germany, ... Boxplot of Netherlands, Germany, ...


95% CI for the Mean 20000000

8000000

15000000
7000000

6000000

Data
Data

10000000

5000000

5000000
4000000

3000000
0
Netherlands Germany Italy Spain Belgium
Netherlands Germany Italy Spain Belgium
The pooled standard deviation is used to calculate the intervals.

Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển
Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container
bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium.
Đường sắt

Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt

Interval Plot of Germany (Rai, Hungary, ... Boxplot of Germany (Rai, Hungary, ...
95% CI for the Mean 8000000
3500000
7000000
3000000
6000000
2500000
5000000
2000000
Data

4000000
Data

1500000

3000000
1000000

2000000
500000

1000000
0

0
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
The pooled standard deviation is used to calculate the intervals.

Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt
Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước. Tiến hành
kiểm định sâu ANOVA (Turkey Test).
14
Hình 5.8 Kết quả kiểm định Turkey
Dựa vào kết quả kiểm định Turkey cho thấy đối với các cặp Hungary – Đức, Lithuania
– Đức, Hà Lan – Đức, Romania – Đức, Romania – Lithuania với p-value < 0.05 nên các cặp
nước này có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container. Đối với các cặp
nước còn lại có p-value > 0.05 nên sẽ không có sự khác biệt.
5.6. Câu 3F
Có thể tiến hành dự báo cho năm tiếp theo dựa vào dữ liệu thu thập được từ các đối tượng
nghiên cứu đã chọn? Nếu được, hãy tiến hành tính toán giá trị dự báo. Nếu không, hãy đưa
ra lập luận giải thích.
Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng sau.
Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian
Data Time Type of Phương pháp dự báo đề
Dữ liệu
pattern horizon model xuất
Hà Lan Trend Short time TS − Linear exponential
Đức Trend Short time TS smoothing
− Quadratic exponential
Đường Ý Trend Short time TS
Tây Ban Nha Trend Short time TS smoothing
biển
− Exponential trend
Bỉ Trend Short time TS models
− Holt’s method
Đường Đức Trend Short time TS
sắt Hungary Trend Short time TS

15
− Linear exponential
smoothing
− Quadratic exponential
Hà Lan Trend Short time TS smoothing
− Exponential trend
models
− Holt’s method
Non Không tiến hành dự báo
Lithuania Short time TS
stationary với dữ liệu non stationary
Non Không tiến hành dự báo
Romania Short time TS
stationary với dữ liệu non stationary
Bảng 5.3 So sánh sai số của các phương án lựa chọn
Netherlands MAD MSE MAPE
Linear exponential smoothing 181930 43836000000 60.7662
Quadratic exponential smoothing 63596 8118874742 19
Exponential trend models 73977.7 12695900000 16.76677
Holt’s method 647730 15047700000 15.11001
Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo. →
Sử dụng phương pháp Holt’s method.
Tiến hành phân tích đánh giá các nước còn lại, ta được kết quả dự báo dưới bảng 5.4 sau. Kết
quả dự báo dữ liệu của các nước bằng Minitab được trình bày ở phụ lục C.
Bảng 5.4 Kết quả dự báo
Dữ liệu Phương pháp dự báo Giá trị dự báo
Hà Lan Holt’s method 16,067,404
Đức Holt’s method 15,229,009
Đường biển Ý Holt’s method 11,511,375
Tây Ban Nha Holt’s method 17,584,252
Bỉ Exponential trend models 19,002,833
Đức Holt’s Method 7,323,485
Đường sắt Hungary Holt’s Method 389,454
Hà Lan Holt’s Method 1,754,952
Đánh giá sự phù hợp của phương pháp dự báo được thực hiện qua việc kiểm tra hệ số tương
quan residual có ngẫu nhiên hay không.
Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau.
Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:

16
Autocorrelation Function for RESI1
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5
Lag

Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức

Do LBQ <𝑋 2 0.05 (5) = 11.07 nên residual là ngẫu nhiên → Dự báo bằng phương pháp Holt’s
method là phù hợp đối với dữ liệu này.
Trường hợp khác, đối với nước Bỉ của vận tải đường biển, ta có kết quả sau:

Autocorrelation Function for RESI4


(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5
Lag

Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức

Do LBQ > 𝑋 2 0.05 (5) = 11.07 nên residual là tương quan → Dự báo bằng phương pháp
Exponential trend models chưa phù hợp trong trường hợp này mặc dù giá trị sai số tốt →
Chuyển sang phương pháp Holt’s method để dự báo, cho ra kết quả phù hợp.
Kết luận: Dự báo bằng phương pháp Holt’s Method là phù hợp để dự báo cho các nước Hà Lan,
Đức, Ý, Tây Ban Nha đối với vận tải biển và nước Đức, Hà Lan của vận tải sắt.

17
TÀI LIỆU THAM KHẢO
[1] John E. Hanke, Dean W. Wichern, 2008. Business Forecasting, 9th edition . Published by
Pearson Education Limited 2014.
[2] Nguyễn Vạng Phúc Nguyên, 2020. Bài giảng môn Kỹ thuật dự báo. Thành phố Hồ Chí
Minh, NXB Đại học Quốc gia Thành phố Hồ Chí Minh.
PHỤ LỤC A. DỮ LIỆU THU THẬP
Bảng A1. Dữ liệu xuất khẩu container bằng đường sắt của các nước
Năm Hà Lan Đức Hungary Lithuania Romania
1970 88,000 365,243 21,101 129,808 489,300
1971 88,000 464,536 8,687 136,312 575,450
1972 111,109 558,902 18,440 147,962 717,400
1973 143,215 671,179 26,781 154,615 888,160
1974 145,000 659,831 40,572 152,579 922,504
1975 118,000 573,509 49,231 151,806 768,352
1976 147,382 700,490 64,747 183,269 1,223,755
1977 118,477 745,854 81,961 175,325 1,361,086
1978 172,010 833,802 93,265 203,478 1,518,888
1979 198,988 954,112 112,200 192,548 1,621,307
1980 213,590 1,021,001 126,473 187,911 1,697,609
1981 209,725 1,063,903 155,818 188,198 1,817,091
1982 195,207 992,101 162,875 203,694 1,851,800
1983 191,420 989,595 193,377 229,811 1,981,000
1984 230,892 1,100,009 204,622 270,044 2,043,600
1985 237,277 1,198,081 208,182 290,506 2,059,200
1986 218,929 1,241,112 229,383 305,686 2,187,900
1987 216,591 1,330,597 231,257 298,734 2,468,750
1988 228,189 1,460,073 229,956 292,846 2,386,900
1989 211,773 1,621,264 211,561 280,719 2,360,000
1990 213,745 1,681,125 173,566 251,166 1,409,400
1991 206,320 1,794,174 153,559 89,392 1,127,869
1992 201,100 1,717,257 149,989 34,486 429,194
1993 195,598 1,636,645 118,470 60,566 217,276
1994 236,067 1,888,608 142,007 28,394 146,313
1995 210,922 2,844,800 134,012 19,368 98,641
1996 214,196 2,840,538 230,555 30,067 132,131
1997 220,395 2,524,649 258,742 19,140 93,698
1998 215,171 2,736,662 145,239 17,491 91,110
1999 216,587 2,700,616 135,970 10,991 106,490

A1
2000 217,384 2,653,976 154,816 10,554 153,540
2001 216,381 2,697,085 176,569 12,758 108,589
2002 216,784 2,683,892 204,803 15,923 112,483
2003 216,850 2,678,318 334,186 14,292 124,291
2004 631,808 3,915,508 389,522 30,770 186,826
2005 700,083 4,212,328 467,366 40,065 217,318
2006 681,993 4,833,220 469,928 58,444 249,461
2007 968,534 5,603,297 439,827 95,214 190,240
2008 1,077,777 6,023,299 447,944 101,711 230,829
2009 1,026,295 5,078,291 452,273 70,247 145,065
2010 921,108 5,614,553 568,685 78,188 196,328
2011 939,808 5,921,037 520,752 102,297 125,372
2012 1,539,810 6,228,484 386,746 104,171 91,465
2013 1,300,000 6,456,060 519,480 103,952 61,474
2014 1,406,000 6,272,430 448,166 90,745 54,995
2015 1,441,000 5,979,035 651,093 69,964 99,737
2016 1,600,000 6,205,543 736,798 67,601 95,561
2017 1,377,000 5,983,721 721,233 92,751 102,468
2018 1,686,000 6,678,868 707,524 114,941 102,879
2019 1,653,000 7,138,556 401,290 144,838 100,777

Bảng A2. Dữ liệu xuất khẩu container bằng đường biển của các nước
Năm Hà Lan Đức Ý Tây Ban Nha Bỉ
1970 947,347 279,376 * * 363,491
1971 985,910 370,508 56,960 137,483 316,354
1972 1,035,165 521,167 86,830 187,580 383,900
1973 1,004,317 704,169 49,937 329,535 483,391
1974 1,072,051 776,646 86,822 448,433 580,041
1975 1,126,024 788,502 78,334 535,856 527,618
1976 1,296,614 908,311 95,430 642,855 564,329
1977 1,398,876 1,000,105 123,693 809,855 688,446
1978 1,665,079 1,198,352 99,152 856,126 762,515
1979 1,850,411 1,378,878 111,459 978,122 871,103

A2
1980 2,038,556 1,543,128 206,246 1,075,625 915,207
1981 2,218,853 1,781,315 379,789 1,185,947 1,033,627
1982 2,295,805 1,741,868 644,323 1,241,006 1,031,453
1983 2,388,889 1,817,698 1,460,336 1,430,727 1,239,557
1984 2,647,014 2,146,402 1,698,655 1,682,126 1,456,538
1985 2,779,680 2,265,887 1,635,583 1,858,614 1,470,859
1986 2,980,268 2,354,816 1,598,191 1,845,819 1,534,503
1987 2,952,353 2,635,566 1,668,467 2,170,043 1,654,975
1988 3,280,679 2,933,532 1,863,178 2,221,100 1,718,003
1989 3,615,501 3,196,430 1,806,139 2,284,921 1,772,388
1990 3,696,000 3,406,837 1,917,477 2,433,027 1,893,115
1991 3,803,508 3,694,285 1,991,586 2,703,211 2,074,827
1992 4,134,427 3,825,171 2,207,998 2,829,969 2,370,490
1993 4,197,034 4,124,436 2,435,806 2,836,899 2,376,603
1994 4,534,897 4,522,041 2,672,231 3,351,109 2,827,038
1995 4,691,438 4,681,361 3,041,562 3,935,099 2,863,383
1996 5,068,000 4,897,480 3,701,621 4,373,065 3,207,723
1997 5,638,479 5,246,129 4,998,673 4,941,756 3,627,955
1998 6,074,040 5,486,496 5,870,177 5,835,627 4,052,889
1999 6,309,484 6,200,000 5,744,339 6,402,312 5,022,102
2000 6,354,662 7,172,675 5,917,239 6,925,765 5,724,074
2001 6,168,205 7,913,021 6,327,906 7,444,671 5,691,239
2002 6,622,178 8,699,356 7,213,048 8,157,488 6,314,930
2003 7,250,936 9,568,885 7,934,287 8,985,277 6,767,345
2004 8,384,123 10,822,400 7,952,570 9,968,913 7,241,354
2005 9,378,669 12,100,830 7,769,604 11,034,160 7,872,963
2006 10,103,160 13,801,570 7,842,333 11,969,810 8,424,693
2007 11,301,690 15,257,000 8,483,074 13,187,295 9,841,397
2008 11,206,050 15,667,000 7,896,531 13,314,317 10,478,990
2009 9,955,769 11,915,000 6,605,651 11,719,125 8,490,000
2010 11,242,400 13,096,000 8,644,600 12,505,803 9,601,000
2011 12,133,125 15,271,000 8,645,200 13,849,935 9,511,000
2012 12,133,471 15,325,000 9,398,353 13,999,337 9,165,000

A3
2013 11,818,300 15,552,000 9,491,151 13,709,523 9,188,000
2014 12,621,088 15,905,000 10,104,971 14,066,730 9,726,000
2015 12,543,230 15,181,000 10,180,380 14,252,380 9,776,000
2016 12,727,674 15,205,000 11,336,766 15,130,479 10,083,000
2017 14,047,511 15,129,000 10,730,533 15,924,830 10,331,000
2018 14,865,101 15,130,000 12,758,529 17,198,589 11,219,000
2019 15,574,369 15,061,029 10,659,573 17,435,718 11,527,000

A4
PHỤ LỤC B. KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
B.1. Graphical Summary
Summary Report for Netherlands Summary Report for Germany
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 6.53 A-Squared 2.73
P-Value <0.005 P-Value <0.005
Mean 508630 Mean 2875355
StDev 510025 StDev 2162680
Variance 2.60126E+11 Variance 4.67718E+12
Skewness 1.22425 Skewness 0.64367
Kurtosis -0.04701 Kurtosis -1.12949
N 50 N 50
Minimum 88000 Minimum 365243
1st Quartile 198141 1st Quartile 1013776
Median 216687 Median 2206628
3rd Quartile 925783 3rd Quartile 5209543
Maximum 1686000 Maximum 7138556
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 400000 800000 1200000 1600000 363682 653577 0 1600000 3200000 4800000 6400000 2260729 3489982
95% Confidence Interval for Median 95% Confidence Interval for Median
212994 232591 1417571 2770761
95% Confidence Interval for StDev 95% Confidence Interval for StDev
426042 635560 1806560 2694987

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

200000 300000 400000 500000 600000 700000 1500000 2000000 2500000 3000000 3500000

Summary Report for Hungary Summary Report for Lithuania


Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 1.82 A-Squared 1.00
P-Value <0.005 P-Value 0.011
Mean 266232 Mean 123127
StDev 198820 StDev 89275
Variance 39529336241 Variance 7970041222
Skewness 0.862247 Skewness 0.561727
Kurtosis -0.182665 Kurtosis -0.714461
N 50 N 50
Minimum 8687 Minimum 10554
1st Quartile 132127 1st Quartile 38670
Median 204713 Median 103125
3rd Quartile 441856 3rd Quartile 187983
Maximum 736798 Maximum 305686
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 200000 400000 600000 209728 322736 97755 148498
0 60000 120000 180000 240000 300000
95% Confidence Interval for Median 95% Confidence Interval for Median
154403 240279 75581 149224
95% Confidence Interval for StDev 95% Confidence Interval for StDev
166081 247756 74575 111249

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

150000 200000 250000 300000 80000 100000 120000 140000 160000

Summary Report for Romania Summary Report for Netherlands_1


Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 4.34 A-Squared 1.87
P-Value <0.005 P-Value <0.005
Mean 750837 Mean 6083168
StDev 802048 StDev 4447781
Variance 6.43281E+11 Variance 1.97828E+13
Skewness 0.887013 Skewness 0.603633
Kurtosis -0.750524 Kurtosis -0.994679
N 50 N 50
Minimum 54995 Minimum 947347
1st Quartile 108064 1st Quartile 2276567
Median 224074 Median 4613168
3rd Quartile 1436772 3rd Quartile 10378883
Maximum 2468750 Maximum 15574369
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 600000 1200000 1800000 2400000 522898 978777 4819123 7347214
3000000 6000000 9000000 12000000 15000000
95% Confidence Interval for Median 95% Confidence Interval for Median
145903 807680 3182065 6442477
95% Confidence Interval for StDev 95% Confidence Interval for StDev
669978 999458 3715383 5542528

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

200000 400000 600000 800000 1000000 3000000 4000000 5000000 6000000 7000000

B1
Summary Report for Germany_1 Summary Report for Italy
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 2.96 A-Squared 1.94
P-Value <0.005 P-Value <0.005
Mean 6803993 Mean 4612325
StDev 5716329 StDev 3894391
Variance 3.26764E+13 Variance 1.51663E+13
Skewness 0.51075 Skewness 0.38082
Kurtosis -1.40583 Kurtosis -1.29749
N 50 N 49
Minimum 279376 Minimum 49937
1st Quartile 1771453 1st Quartile 1316864
Median 4601701 Median 3041562
3rd Quartile 13272393 3rd Quartile 7943429
Maximum 15905000 Maximum 12758529
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 4000000 8000000 12000000 16000000 5179430 8428556 0 3000000 6000000 9000000 12000000 3493726 5730925
95% Confidence Interval for Median 95% Confidence Interval for Median
2835721 8171145 1818370 6546095
95% Confidence Interval for StDev 95% Confidence Interval for StDev
4775044 7123308 3247615 4865257

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

3000000 4000000 5000000 6000000 7000000 8000000 9000000 2000000 3000000 4000000 5000000 6000000 7000000

Summary Report for Spain Summary Report for Belgium


Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 2.60 A-Squared 2.82
P-Value <0.005 P-Value <0.005
Mean 6374367 Mean 4533168
StDev 5658284 StDev 3832268
Variance 3.20162E+13 Variance 1.46863E+13
Skewness 0.55777 Skewness 0.48425
Kurtosis -1.25220 Kurtosis -1.41630
N 49 N 50
Minimum 137483 Minimum 316354
1st Quartile 1335867 1st Quartile 1033084
Median 3935099 Median 2845211
3rd Quartile 12237807 3rd Quartile 8658750
Maximum 17435718 Maximum 11527000
95% Confidence Interval for Mean 95% Confidence Interval for Mean
0 4000000 8000000 12000000 16000000 4749118 7999616 0 2000000 4000000 6000000 8000000 10000000 12000000 3444050 5622287
95% Confidence Interval for Median 95% Confidence Interval for Median
2234785 8004640 1697313 5918030
95% Confidence Interval for StDev 95% Confidence Interval for StDev
4718563 7068886 3201224 4775517

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

2000000 3000000 4000000 5000000 6000000 7000000 8000000 2000000 3000000 4000000 5000000 6000000

B.2. Time Series Plot


Time Series Plot of Netherlands Time Series Plot of Germany
1800000 8000000

1600000 7000000

1400000
6000000

1200000
5000000
Netherlands

Germany

1000000
4000000
800000
3000000
600000
2000000
400000

200000 1000000

0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index

Time Series Plot of Hungary Time Series Plot of Lithuania


800000
300000
700000

250000
600000

500000 200000
Lithuania
Hungary

400000
150000

300000
100000
200000

100000 50000

0
0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index

B2
Time Series Plot of Romania Time Series Plot of Netherlands_1
2500000 16000000

14000000

2000000
12000000

Netherlands_1
10000000
1500000
Romania

8000000

1000000
6000000

4000000
500000

2000000

0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index

Time Series Plot of Germany_1 Time Series Plot of Italy


14000000
16000000

14000000 12000000

12000000 10000000

10000000
Germany_1

8000000

Italy
8000000
6000000
6000000
4000000
4000000

2000000
2000000

0 0

1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index

Time Series Plot of Spain Time Series Plot of Belgium


20000000 12000000

10000000

15000000

8000000
Belgium
Spain

10000000 6000000

4000000
5000000

2000000

0 0
1 5 10 15 20 25 30 35 40 45 50 1 5 10 15 20 25 30 35 40 45 50
Index Index

B.3. Autocorrelation Function


Autocorrelation Function for Netherlands Autocorrelation Function for Germany
(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)

1.0 1.0

0.8 0.8
0.6 0.6

0.4 0.4
Autocorrelation

Autocorrelation

0.2 0.2

0.0 0.0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1.0 -1.0

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag

B3
Autocorrelation Function for Hungary Autocorrelation Function for Lithuania
(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)

1.0 1.0

0.8 0.8

0.6 0.6

0.4 0.4
Autocorrelation

Autocorrelation
0.2 0.2

0.0 0.0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1.0 -1.0

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag

Autocorrelation Function for Romania Autocorrelation Function for Netherlands_1


(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)

1.0 1.0

0.8 0.8

0.6 0.6

0.4 0.4
Autocorrelation

Autocorrelation
0.2 0.2

0.0 0.0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1.0 -1.0

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag

Autocorrelation Function for Germany_1 Autocorrelation Function for Italy


(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)

1.0 1.0

0.8 0.8

0.6 0.6

0.4 0.4
Autocorrelation

Autocorrelation

0.2 0.2

0.0 0.0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1.0 -1.0

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag

Autocorrelation Function for Spain Autocorrelation Function for Belgium


(with 5% significance limits for the autocorrelations) (with 5% significance limits for the autocorrelations)

1.0 1.0

0.8 0.8

0.6 0.6

0.4 0.4
Autocorrelation

Autocorrelation

0.2 0.2

0.0 0.0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1.0 -1.0

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
Lag Lag

B.4. Correlation

B4
B5
PHỤ LỤC C. KẾT QUẢ THỰC HIỆN DỰ BÁO BẰNG MINITAB
C.1. Levence Test

C1
C.2. Forecast Error
Đối với các nước đường sắt
− Hà Lan

− Hungary

C2
− Đức

Đối với các nước đường biển


− Hà Lan

C3
− Đức

− Ý

C4
− Tây Ban Nha

− Bỉ

C5
C.3. Forecasting Implement
Đối với các nước đường sắt
− Hà Lan

− Đức

− Hungary

Đối với các nước đường biển


− Hà Lan

C6
− Đức

− Ý

− Tây Ban Nha

− Bỉ

C.4. LBQ Test


Đối với các nước đường sắt
− Đức
Autocorrelation Function for RESI1
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5
Lag

− Hungary

C7
Autocorrelation Function for RESI2
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5
Lag

− Hà Lan
Autocorrelation Function for RESI3
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4
Autocorrelation

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 2 3 4 5
Lag

Đối với các nước đường biển


− Đức

− Hà Lan

C8
− Ý

− Tây Ban Nha

− Bỉ

C9

You might also like