You are on page 1of 3

1

Môn Kỹ thuật dự báo

HK1 2021-2022

Bài tập lớn 1

Ở vai trò nhà phân tích chiến lược, nhóm bạn hãy tiến hành phân tích dữ liệu thực (real
data) chọn lựa từ các chủ đề (TOPIC) từ dữ liệu tham khảo (Gửi qua email).

Chọn một bộ dữ liệu để phân tích chuỗi thời gian (Yt) và ít nhất một bộ dữ liệu khác mà
nhóm muốn phân tích tương quan (X1t hoặc X1t, X2t hoặc X1t, X2t, X3t), trong đó X1t, X2t, X3t là các
biến độc lập. Thí dụ: Bộ dữ liệu 1, bộ dữ liệu chính (Yt): Doanh số của máy tính của các doanh
nghiệp TMĐT (ngàn cái/tháng). Bộ dữ liệu 2 X1t: Chỉ số tiêu dùng. Cần chọn thời điểm thu thập
dữ liệu ít nhất là theo tháng hoặc theo quý. KHÔNG chọn dữ liệu thu thập theo năm.

Nhà đầu tư sẽ lắng nghe ý kiến tư vấn của nhóm về lĩnh vực họ quan tâm (TOPICs như
trên). Họ sẽ đầu tư vào lĩnh vực nếu thị trường có triển vọng phát triển. Thí dụ, nhà đầu tư một số
thời trang chống nắng muốn biết thông tin về ngày nắng ở một vài địa điểm ở Việt Nam. Hoặc nhà
đầu tư quan tâm về năng suất của lao động Việt Nam theo ngành nghề cụ thể.

1. Hãy phân tích các chỉ số thông kê mô tả cho chuỗi dữ liệu Yt

a. Descriptive statistics, gồm box-plot, histogram, scatter diagram


b. Các khoảng tứ phân vị mô tả điều gì về đặc tính phân tán của dữ liệu? Giải thích CIs cho
giá trị trung bình và giá trị độ lệch chuẩn. Như vậy, nhóm sẽ đưa ra nhận xét tóm gọn về
dữ liệu này như thế nào cho khách hàng?
c. Dữ liệu có tuân theo phân bố Normal không? Tại sao? Độ lệch chuẩn của dữ liệu là nhỏ
hay lớn so với giá trị trung bình?

2. Nhận xét tính tương quan dữ liệu (Y vs. X(1, 2, …i) ). Tính hệ số tương quan. Khớp dữ liệu với
phương trình hồi qui đơn giản. Giá trị tương quan nói lên điều gì về phương trình hồi qui? Ta có
thể sử dụng phương trình để dự báo cho các giá trị tương lai? Tại sao?

Gợi ý: Dùng Trend Analysis và phân tích r, r2, std và Residuals Analysis.

3. Khớp dữ liệu nhóm thu thập Y, X(1, 2, …i) vào một số phân bố tiêu biểu với alpha = 0.05. Nhận
xét phân bố phù hợp cho dữ liệu mà nhóm thu thập.

TS Nguyễn VP Nguyên Page 1|3


2

Gợi ý: Dựa vào bảng Goodness of Fit Test. Lưu ý, dữ liệu không tuân theo phân bố Normal nếu p-value nhỏ
hơn 0.05. Như vậy, nên chọn p-value lớn nhất. Hơn nữa, khi phân tích trực quan bằng probability plot của
dữ liệu cho một phân bố cụ thể, nếu các điểm dữ liệu phân bố dọc theo đường thẳng thì phân bố này phù hợp
để mô tả dữ liệu ta quan tâm. Tạm thời bỏ qua các chỉ số AD, hoặc các thông tin khác. Một phân bố gọi là
có độ phù hợp tốt (a good fit) nếu: a) các điểm dữ liệu rải đều (một cách tương đối theo một đường thẳng),
b) Giá trị p-value của bộ test độ phù hợp (goodness of fit) lớn hơn hoặc bằng 0.05.

4. Phân tích đặc tính của của chuỗi thời gian Y (components of a time series)

a. Phân tích mô hình chuỗi thời gian (data patterns) bằng hệ số và biểu đồ tự tương quan.
Chuỗi dữ liệu có các đặc tính nào của chuỗi thời gian (ổn định, xu hướng, mùa, chu kỳ
hoặc kết hợp)?
b. Hãy đề xuất ba phương pháp để tiến hành tính toán dự báo dựa vào các phân tích trên. Giải
thích lý do chọn. Phương pháp nào tốt nhất dùng để dự báo loại dữ liệu nhóm đang làm
việc dựa vào so sánh bộ chỉ số sai số dự báo (forecast errors)? Nhà đầu tư trong cuộc họp
đề cập đến dự báo dữ liệu bằng trung bình di động 3 thời đoạn. Theo nhóm, phương pháp
này có phù hợp?
Gợi ý: Phân tích forecast errors để đo lường độ chính xác, phân tích ACF để đo lường mức
độ phù hợp.
c. Tiến hành tính toán dự báo cho ba năm liên tiếp dựa vào phương pháp dự báo được chọn.
Có thể kiểm tra các giá trị dự báo này nằm trong khoảng tin cậy nào hay không?

TS Nguyễn VP Nguyên Page 2|3


3

Đại diện nhóm nộp bài báo cáo bằng file ZIP lên BKEL gồm các file WORD báo cáo và
file Minitab Project. Riêng Video Clip nộp theo đường link riêng. Cụ thể như sau:

(1) Bài thuyết minh file WORD báo cáo (“NhomX_Forecasting_Project1.docx”, X=STT
nhóm). (Trình bày theo format báo cáo đã cung cấp “Template for Assignment
MiniProject Submission”). Các nhóm nộp trên file Word gồm các phần như sau:
1. Trang bìa: tên đề tài, môn học, nhóm, thành viên nhóm
2. Mục lục
3. Tiến hành trình bày theo câu hỏi 1 đến câu hỏi 4 a, b, c.
4. Tài liệu tham khảo
(2) File Minitab Project “NhomX.mpj” minh chứng (gồm spreadsheet dữ liệu, kết quả
phân tích, graphs), X=thứ tự nhóm
(3) Bài trình bày báo cáo bằng một Video Clip (presentation)
1. Nộp đường link Video Clip từ Youtube hoặc các cloud providers khác có chức
năng play video trực tiếp: https://forms.gle/zDSDwPUdMxa5rper5
2. Độ dài khoảng 5-7 phút một nhóm
3. Xác định đối tượng nghe/khán giả để xây dựng outline phù hợp và tinh gọn phù
hợp, ngược lại với file Thuyết Minh WORD phải đầy đủ và trình bày đúng những
gì được yêu cầu. Nếu trình bày cho giảng viên và SV IE, dùng ngôn ngữ chuyên
ngành. Nếu trình bày cho các đối tượng khác, dùng ngôn ngữ dễ tiếp cận (lay
language!). Nếu trình bày cho đối tác là một khách hàng cần tư vấn thì trình bày
cái người ta quan tâm!
4. Nội dung trình bày được sắp xếp trong file PPT
5. Thời gian thực hiện: 2 tuần thực hiện. Max là 3 tuần.
6. Tất cả thành viên phải trình bày, thay phiên nhau.
7. Lố 1 phút trừ 5 điểm.

TS Nguyễn VP Nguyên Page 3|3

You might also like