You are on page 1of 42

TRƯỜNG ĐẠI HỌC VĂN LANG

KHOA QUẢN TRỊ KINH DOANH

BÁO CÁO CUỐI KÌ


MÔN HỌC: BÁN HÀNG & QUẢN TRỊ BÁN HÀNG

PHÂN TÍCH KẾ HOẠCH BÁN HÀNG NẾN THƠM

Giảng viên bộ môn: Ths. Phạm Ngọc Bảo


Duy Nhóm sinh viên thực hiện:
1. Võ Minh Thư 71802312
2. Đặng Thị Phương Thảo 71802294
3. Nguyễn Việt Hoài 71802220
4. Trà Thị Anh Thư 71802312
5. Lưu Hoài Tín 71802319

Thành phố Hồ Chí Minh, tháng 11 năm 2022

DANH SÁCH THÀNH VIÊN NHÓM

T r a n g 1 | 42
Mức độ
Họ và tên MSSV Công việc Chữ ký
hoàn thành
Tổng hợp
Võ Minh Thư 71802312 Chương 2+4 100%
Chạy mô hình

Chương 2+5
Đặng Thị Phương Thảo 71802294 100%
Chạy mô hình

Chương 5
Nguyễn Việt Hoài 71802220 PPT 100%
Chạy mô hình

Chương 1+3
Trà Thị Anh Thư 71802310 100%
Chạy mô hình

Chương 3+4
Lưu Hoài Tín 71802319 100%
Chạy mô hình

LỜI CẢM ƠN

T r a n g 2 | 42
Trên thực tế không có sự thành công nào mà không gắn liền với những sự hỗ trợ, giúp đỡ
dù ít hay nhiều, dù trực tiếp hay gián tiếp của người khác. Trong suốt qúa trình thực hiện
đề tài nghiên cứu “Dự báo giá vàng” em đã nhận được rất nhiều sự quan tâm, giúp đỡ của
quý thầy cô, gia đình và bạn bè. Với lòng biết ơn sâu sắc nhất, em xin gởi đến quý thầy
cô ở Khoa Quản Trị Kinh Doanh – Trường Đại Học Văn Lang với tri thức và tâm huyết
của mình để truyền đạt vốn kiến thức quý báu cho chúng em trong môn học này.
Em xin chân thành cảm ơn thầy đã tận tâm hướng dẫn chúng em qua từng buổi học trên
lớp cũng như những buổi nói chuyện, thảo luận về đề tài. Nếu không có những lời hướng
dẫn, dạy bảo của thầy thì em nghĩ bài báo cáo này của nhóm em rất khó có thể hoàn thiện
được. Một lần nữa, em xin chân thành cảm ơn thầy. Bài báo cáo được thực hiện trong
khoảng thời gian 3 tuần. Bước đầu đi vào thực tế, tìm hiểu lĩnh vực phân tích kinh doanh,
kiến thức của chúng em còn nhiều hạn chế và còn nhiều bỡ ngỡ. Do vây, không tránh
được những thiếu sót là điều chắc chắn, em rất mong nhận được ý kiến đóng góp quý báu
của quý thầy và các bạn học cùng lớp để kiến thức của em trong lĩnh vực này được hoàn
thiện hơn.
Một lần nữa nhóm tác giả xin chân thành cảm ơn!

CÔNG TRÌNH NGHIÊN CỨU ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI
HỌC VĂN LANG

Nhóm cam kết đây là công trình nghiên cứu riêng do chính nhóm thực hiện và được sự
hướng dẫn khoa học trực tiếp từ giảng viên bộ môn. Các số liệu, kết quả được nêu bài
báo cao hoàn toàn trung thực, được trích dẫn, kế thừa và phát triển từ các tài liệu, công
trình nghiên cứu, tạp chí, các trang web có nguồn gốc rõ ràng và đáng tin cậy.

Những số liệu trong biểu đồ hỗ trợ việc phân tích, đánh giá được trình bày trong bài báo
cáo được nhóm xây dựng nên hoặc thu thập từ các nguồn khác nhau và có thêm chú
thích rõ nguồn ở phần tài liệu tham khảo.

Nhóm xin cam đoan nếu có bất kỳ sự đánh cắp ý tưởng nào sẽ hoàn toàn chịu mọi trách
nhiệm. Khoa Quản Trị Kinh Doanh - Trường Đại học Văn Lang không có liên quan đến
những vi phạm tác quyền, bản quyền do nhóm gây ra trong quá trình thực hiện nghiên
cứu này (nếu có).

LỜI CẢM ƠN....................................................................................................................3


T r a n g 3 | 42
CÔNG TRÌNH NGHIÊN CỨU ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC VĂN
LANG................................................................................................................................ 3
CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU....................................................................6
1.1. Lý do chọn đề tài.................................................................................................6
1.2 Mục tiêu nghiên cứu...........................................................................................7
1.3 Câu hỏi nghiên cứu.............................................................................................8
1.4 Đối tượng nghiên cứu.........................................................................................9
1.5 Phạm vi nghiên cứu............................................................................................9
1.6 Phương pháp nghiên cứu...................................................................................9
1.7 Ý nghĩa của nghiên cứu......................................................................................9
1.7.1 Ý nghĩa lý thuyết.................................................................................................9
1.7.2 Ý nghĩa thực tiễn.................................................................................................9
1.8 Bố cục nghiên cứu.............................................................................................10
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT.................................................................................11
2. Các yếu tố ảnh hưởng đến giá vàng.................................................................11
2.1 Khái niệm về “tiền tệ”......................................................................................11
2.2 Vai trò của vàng................................................................................................12
2.3 Vì sao vàng có được vai trò tiền tệ?.................................................................12
2.4 Khái niệm “Lạm phát”.....................................................................................13
2.5 Khái niệm “Sự dao động của tiền tệ”..............................................................13
2.6 Khái niệm “Lãi suất”........................................................................................13
2.7 Khái niệm “Cung và cầu”................................................................................14
2.8 Đơn vị đo lường và cách niêm yết giá vàng.....................................................15
2.9 Khái niệm “Azure Machine Learning”...........................................................15
3. Phương pháp dự báo giá vàng bằng máy học (Azure Machine Learning)...16
3.1 Mô hình ARIMA...............................................................................................16
3.2 Cây quyết định (Decision Tree).......................................................................18
3.3 Thuật toán Naive Bayes Classifiers.................................................................19
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU..............................................................21
3.1 Thiết kế nghiên cứu..........................................................................................21
3.2 Quy trình nghiên cứu.......................................................................................21
T r a n g 4 | 42
3.3 Giả thuyết nghiên cứu......................................................................................22
3.3.1 Giá dầu thô........................................................................................................22
3.3.2 USD so với INR.................................................................................................23
3.3.3 Sensex.................................................................................................................23
3.3.4 CPI..................................................................................................................... 24
3.4 Nghiên cứu sơ bộ...............................................................................................26
3.5 Nghiên cứu định lượng.....................................................................................26
3.5.1 Làm sạch dữ liệu...............................................................................................26
3.5.2 Mô tả dữ liệu.....................................................................................................26
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU........................................................................28
1.1 Dữ liệu ghi nhận nguồn investing....................................................................28
1.2 Thảo luận...........................................................................................................30
1.3 Xây dựng mô hình Decision Tree....................................................................31
4.3 Triển khai Web service và thử nghiệm...........................................................36
CHƯƠNG 5: KẾT LUẬN................................................................................................40
5.1 Kết luận nghiên cứu..........................................................................................40
5.2 Hạn chế nghiên cứu..........................................................................................40
5.3 Hướng nghiên cứu trong tương lai..................................................................40
TÀI LIỆU THAM KHẢO................................................................................................41

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU


T r a n g 5 | 42
1.1. Lý do chọn đề tài
Vàng tiếp tục thu hút sự quan tâm không chỉ với tư cách là một kim loại được lựa chọn
làm đồ trang sức mà còn là một phương tiện lưu trữ giá trị và thường là một phần nên có
trong danh mục đầu tư đa dạng vì nó có xu hướng trở thành một công cụ phòng ngừa
lạm phát hiệu quả và là nơi trú ẩn an toàn khi các nền kinh tế đang trải qua giai đoạn khó
khăn.

Vàng được xem là tài sản dùng để cất trữ giá trị và là cơ sở của hệ thống tiền tệ, chính vì
lẽ đó mà vàng trở thành một công cụ tiết kiệm cá nhân và được các ngân hàng Trung
Ương của mỗi quốc gia đều dự trữ một lượng lớn để đảm bảo cho việc phát hành tiền tệ.
Giá vàng trong nước luôn biến động và chịu ảnh hưởng từ sự điều chỉnh trên thị trường
thế giới. Bên cạnh đó, cất giữ vàng khiến người dân an tâm hơn bởi tính bền vững theo
thời gian cả (từ thế kỷ này sang thế kỷ khác, từ chế độ này sang chế độ khác – vàng vẫn
luôn là vàng) về giá trị (theo thực tế có xu hướng tăng theo thời gian) lẫn vật chất (kim
loại, khó bị phá hủy); dễ dàng đổi thành tiền khi chi tiêu hoặc để làm chuẩn khi tiến
hành mua bán các tài sản lớn cụ thể là nhà cửa, đất đai, ...Và thực tế hiện nay, không ít
các nhà đầu tư đều dành ra một khoản trong danh mục đầu tư của mình để đầu tư vào thị
trường vàng với các lý do sau:
 Vàng là một công cụ đầu tư chống lạm phát hiệu quả: trường hợp chỉ số lạm phát
quá cao, đồng tiền trong nước mất giá, các loại hình đầu tư khác không đủ tạo lòng
tin ở nhà đầu tư thì vàng sẽ là công cụ giữ được giá trị tốt nhất.
 Vàng có tính thanh khoản cao, có thể chuyển đổi thành tiền một cách nhanh
chóng.
 Trường hợp tình hình chính trị bất ổn, vàng là loại tài sản tích trữ tin cậy duy nhất
bởi giá trị đồng tiền có thể thay đổi theo diễn biến chính trị, trong khi vàng luôn
giữ được giá trị của mình dưới bất kì hoàn cảnh nào.
 Do việc dự trữ vàng ngày càng tăng của ngân hàng Trung ương các quốc gia trên
thế giới: tại nhiều quốc gia trên thế giới, các ngân hàng trung ương đã và đang đưa
vàng vào danh mục dự trữ của mình thay thế một phần cho việc dự trữ đô la Mỹ
truyền thống trước đây. Do việc khai thác vàng ngày càng hạn chế bởi số lượng
vàng trong các mỏ vàng ngày càng giảm khiến giá vàng luôn đi theo chiều hướng
tăng dài hạn. Tuy nhiên, do chi phi cơ hội để các nhà đầu tư khi nắm giữ vàng
không phải là nhỏ.

Do đó, các nhà đầu tư thường do dự khi đưa ra quyết định do sự biến động khó lường của
giá vàng. Chính vì lẽ đó nhóm quyết định chọn đề tài “Dự báo giá vàng” dựa trên Azure
Machine Learning Studio nhằm hỗ trợ cho việc ra quyết định đầu tư vào loại kim loại quý
này.

T r a n g 6 | 42
1.2 Mục tiêu nghiên cứu
Sự quan tâm của các nhà đầu tư phương Tây đối với vàng đã khiến tỷ giá của nó tăng từ
mức tối thiểu $1160 vào mùa hè năm 2018, lên mức đỉnh kỷ lục gần $2073 vào tháng 8
năm nay. Trong thời gian này, kim loại quý đã trở thành một trong những tài sản tài
chính hấp dẫn nhất hành tinh. Năm nay, nền kinh tế suy thoái do đại dịch và lợi suất trái
phiếu âm đã thúc đẩy tăng trưởng vốn ETF vàng kỷ lục 60 tỷ USD. Con số này cao gấp
đôi so với năm 2009, vào thời kỳ đỉnh điểm của cuộc khủng hoảng tài chính.

Đại dịch đã thuyết phục các nhà đầu tư rằng vàng nên là một phần trong danh mục đầu
tư của họ. Kim loại quý này đã trở thành hàng rào hàng đầu chống lại sự biến động trên
thị trường chứng khoán và lãi suất âm. Kết quả là vàng nghiễm nhiên biến thành một
trong những tài sản hấp dẫn nhất vào năm 2020.

Các nhà đầu tư lớn đã mua vàng như một tấm chắn bảo vệ khỏi tình trạng giảm phát có
thể xảy ra ở một số quốc gia, gây ra bởi tăng trưởng kinh tế chậm và lạm phát gia tăng ở
các quốc gia khác khi các chính phủ tiếp tục bơm thanh khoản vào nền kinh tế. Ví dụ,
ngân hàng Mỹ JPMorgan đã kiếm được khoảng 1 tỷ đô la trong năm nay từ hoạt động
kinh doanh kim loại quý (chủ yếu là vàng). Theo dự báo của công ty tư vấn Coalition,
trong năm nay, doanh thu từ hoạt động kinh doanh kim loại quý của 50 ngân hàng đầu tư
lớn nhất sẽ tăng gấp đôi và đạt mức đỉnh trong 9 năm là 2,5 tỷ USD.

Ngay cả ông Warren Buffett cũng thay đổi quan điểm về vàng. Trước đây, vị này xem
kim loại quý là tài sản vô dụng. Năm nay, công ty Berkshire Hathaway Inc. của ông đã
mua lại 20,9 triệu cổ phiếu của một trong những công ty khai thác vàng lớn nhất thế giới
- Barrick Gold Corp. (Canada).

Tuy nhiên, nhu cầu tại các quốc gia tiêu thụ vàng chính là Ấn Độ và Trung Quốc, vẫn
chưa đạt mức ngang bằng trong năm nay. Mọi người đã bán số tiền tiết kiệm bằng vàng
hoặc cầm cố khi kim loại quý này tăng lên mức đỉnh kỷ lục trong các đồng nội tệ. Giá
thành cao của kim loại vàng quý và tình trạng hỗn loạn kinh tế do đại dịch gây ra đã làm
tê liệt nhu cầu của người tiêu dùng. Do đó, trong nửa đầu năm, lượng mua trang sức đã
giảm 46% so với cùng kỳ năm ngoái. Nguyên nhân là do thời gian cách ly và giảm thu
nhập của người dân.

Các nhà đầu tư sẽ tiếp tục lấp đầy khoảng trống về nhu cầu. Năm nay, các quỹ giao dịch
hối đoái sẽ tích lũy 1205 tấn kim loại quý trong kho dự trữ của họ, cao gấp ba lần so với
năm 2019. Con số này có thể đạt 1.362 tấn vào năm tới.

Các ngân hàng trung ương đã mua kim loại quý hàng quý kể từ đầu năm 2011. Trong
quý 3 năm nay, họ đã bán ròng, giảm 12,1 tấn dự trữ. Tuy nhiên, CBR vẫn được mua
ròng hàng năm do nhu cầu trong ba quý đầu năm là 220,6 tấn. Rất có thể, họ sẽ duy trì
tình trạng này vào năm 2020, mặc dù lượng mua sẽ ít hơn trong hai năm trước đó. Nga
T r a n g 7 | 42
đã ngừng việc mua và Trung Quốc đã không báo cáo tăng dự trữ kể từ tháng 9 năm
2019.

Giá vàng đã tăng 17% trong nửa đầu năm 2020 và 10% nữa trong tháng 7, đạt mức đỉnh
kỷ lục $2073/ounce vào ngày 6 tháng 8. Kể từ đó, một ounce vàng đã giảm xuống còn
$1.844 trong bối cảnh tin tức về vắc-xin vi rút corona xuất hiện. Tuy nhiên, sự hào hứng
về vắc-xin hãy còn quá sớm. Đại dịch không rời khỏi chương trình nghị sự. Tuy nhiên,
lợi suất năm nay của kim loại quý này nằm trong khoảng 16-30%. Lưu ý rằng nhiều dự
báo cho năm 2020 đã giả định sự tăng trưởng của báo giá kim loại quý lên $1600-
$1700/ounce trong trường hợp bất ổn địa chính trị và kinh tế gia tăng.

Sự phục hồi kinh tế từ đại dịch COVID-19 đã tiếp tục, và kỳ vọng lạm phát ngày càng
tăng trong tháng 4 và tháng 5 năm 2021 dẫn đến giá thấp hơn. Nhìn chung, từ tháng 1
đến tháng 3 năm 2021, chúng ta có thể thấy giá vàng đã giảm do số liệu việc làm của
Mỹ tăng lên. Vàng đã giảm từ 4,7% xuống $1.774,80/ounce vào ngày 16 tháng 6, tức
mức đáy kể từ cuối tháng 4. Sự phục hồi đến sau khi tuyên bố từ Ủy ban Thị trường Mở
Liên bang nghe có vẻ lạc quan về sự phục hồi nền kinh tế Mỹ.

Tháng 7 đã mang đến sự tăng trưởng ổn định do lợi suất của Mỹ giảm mạnh. Giá vàng
đã không thay đổi nhiều trong tháng 8; tuy nhiên, đã có một sự sụt giảm đáng kể xuất
hiện từ ngày 6-9 tháng 8, nguyên nhân là do dữ liệu việc làm của Mỹ tăng mạnh. Sự
phục hồi diễn ra khá nhanh. Xu hướng giảm bắt đầu vào đầu mùa thu năm 2021, và giá
đã giảm xuống $1.726,11/ounce vào ngày 29 tháng 9 do sản lượng của Mỹ cao hơn. Sau
đó, giá vàng đã tăng trong một tháng rưỡi và đạt $1.866,96 vào ngày 18 tháng 11. Một
động lực chính của đà tăng này là các nhà đầu tư đổ xô vào vàng như một hàng rào
chống lại lạm phát.

Nhóm áp dụng phân tích từ phần mềm Azure Machine Learning để hiểu rõ hơn giá vàng.
Mục tiêu chính của bài nghiên cứu như sau:
o Đầu tiên, nhóm xác định, phân tích các yếu tố ảnh hưởng đến sử biến động của giá
vàng.
o Thứ hai, nhóm sẽ xây dựng mô hình dự đoán thông qua việc sử dụng phần mềm
Azure Machine Learning Studio.
o Từ các mô hình được đề xuất, tiến hành đánh giá và chọn ra mô hình tối ưu, thích
hợp nhất để dự đoán và kiểm tra mẫu thử dựa trên mô hình được chọn.
o Cuối cùng, từ những dự đoán của mô hình nhóm đưa ra những lợi ích mà vàng
mang lại khi lạm phát tăng cao.

1.3 Câu hỏi nghiên cứu


Để việc nghiên cứu đúng mục tiêu, nhóm phải trả lời được các câu hỏi được đặt ra như
sau:
o Tình hình biến động giá vàng trong giai đoạn 2000 – 2020 chịu tác động của các

T r a n g 8 | 42
nhân tố nào?
o Vàng chịu ảnh hưởng bỡi những nhân tố nào?
o Mô hình nào là phù hợp nhất dự báo giá vàng?
1.4 Đối tượng nghiên cứu
Giá vàng trong nước có mối liên hệ mật thiết với giá vàng Thế giới do phần lớn vàng
kinh doanh trên thị trường chủ yếu là từ nhập khẩu nên giá cả trong nước luôn chịu sự
chi phối của biến động giá vàng thế giới. Tuy nhiên, có một số thời điểm, giá vàng trong
nước lại không theo giá thế giới. Đối tượng nghiên cứu của để tài là dự đoán biến động
của giá vàng.
1.5 Phạm vi nghiên cứu
Phạm vi về không gian: Sử dụng nguồn dữ liệu được tổng hợp từ nhiều nguồn khác nhau
như: sách, báo, đài, tivi, tạp chí, mạng internet. Dữ liệu giá dầu thô, lãi suất (tỷ lệ repo),
giá tiền Ấn Độ tính bằng đô la, Sensex (BSE), tỷ lệ lạm phát và chỉ số đô la Mỹ sẽ theo
mối quan hệ trực tiếp hoặc gián tiếp với giá vàng được thu thập từ nền tảng Kaggle.com.
Phạm vi về thời gian: trong khoảng thời gian tháng 11 năm 2022.

1.6 Phương pháp nghiên cứu

Phương pháp thống kê – mô tả: thu thập các dữ liệu trong quá khứ từ năm 2000 đến
tháng 08/2020. Từ đó, dùng phương pháp thống kê – mô tả nhằm xác định các
đặc điểm về xu hướng và xu thế biến động của giá vàng thế giới cũng như giá vàng
trong nước. Phương pháp phân tích kinh tế lượng:
 Phương pháp dự báo chuỗi thời gian (cụ thể là mô hình ARIMA, và một số các
mô hình khác có liên quan: các mô hình này được cho là phương pháp chủ yếu,
được sử dụng khá phổ biến trong việc dự báo các biến có độ nhạy cao như lãi
suất, chứng khoán, giá dầu, ...)
 Phương pháp hồi quy: nhằm xác định các yếu tố thực sự tác động đến sự thay đổi
của giá vàng.
Phương pháp nghiên cứu lý luận: Với việc khai thác, tìm hiểu những nghiên cứu liên
quan đến giá vàng đã có, nhóm phân tích dựa vào phần mềm phân tích dữ liệu Azure
Machine Learning Studio.

1.7 Ý nghĩa của nghiên cứu


1.7.1 Ý nghĩa lý thuyết
Bài báo cáo này giúp chúng ta biết rằng giá dầu thô, lãi suất (tỷ lệ repo), giá tiền Ấn Độ
tính bằng đô la, Sensex (BSE), tỷ lệ lạm phát và chỉ số đô la Mỹ sẽ theo mối quan hệ
trực tiếp hoặc gián tiếp với giá vàng.
1.7.2 Ý nghĩa thực tiễn
Vàng không chỉ là vật trang sứ quý giá, một loại hàng hóa đặc biệt mà còn được xem là
chuẩn mực giá trị cho các loại tiền tệ trên thế giới. Mặc dù giá trị của vàng trường tồn
cùng thời gian nhưng với bản chất cố hữu là tính biến động nên giá vàng lại dễ dàng
T r a n g 9 | 42
biến động và chịu ảnh hưởng từ nhiều yếu tố tác động bên ngoài.
Việc hiểu biết đầy đủ về thị trường vàng cũng như nắm được các yếu tố ảnh hưởng đến
biến động giá vàng, từ đó dự đoán được xu hướng giá vàng trong tương lai là vô cùng
quan trọng, quyết định thành bại của nhà đầu tư trong thị trường đặc thù này. Bên cạnh
đó, giúp các nhà đầu tư có thêm kiến thức để có những quyết định đầu tư đúng đắn trong
thị trường tiềm năng nhưng cũng đầy rủi ro này.
1.8 Bố cục nghiên cứu
Bài nghiên cứu này gồm 5 chương:
Chương 1: Tổng quan nghiên cứu
Chương 2: Cơ sở lý thuyết
Chương 3: Phương pháp nghiên cứu
Chương 4: Kết quả nghiên cứu
Chương 5: Kết luận và đề xuất

T r a n g 10 | 42
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

Trong chương 2, nhóm đề cập tới lý thuyết mà bài nghiên cứu dựa trên, cơ sở lý thuyết
bao gồm những yếu tố tác động lên kết quả nghiên cứu cũng như công cụ để phân tích
nó.

Dự báo đóng một vai trò quan trọng trong kinh tế lượng và cũng giúp xác định các chính
sách của chính phủ một cách tối ưu. Quyết định kinh doanh phụ thuộc vào giá của các
mặt hàng đó có thể tạo ra lợi ích từ một dự đoán khả thi. Chúng ta sẽ có một cái nhìn
ngắn gọn về các giá trị bình phương sai số trung bình của mô hình hồi quy, điều này sẽ
hướng dẫn chúng ta về khả năng dự đoán của mô hình dự đoán. Dữ liệu trải rộng theo
thời gian và có sẵn từ ngày 1 tháng 10 năm 2000 đến ngày 1 tháng 8 năm 2020.

Mô hình dự đoán được phát triển cho giá vàng ở Ấn Độ phụ thuộc vào 5 biến bằng cách
sử dụng các diễn giải thống kê từ các biến này. Các biến độc lập được thực hiện là giá
dầu thô, USD so với INR, Sensex, CPI và Lãi suất. Mô hình vượt qua các khía cạnh
khác nhau như bình phương R được điều chỉnh, thử nghiệm T và Durbin Watson với các
giá trị ưa thích cao.

Dữ liệu được lấy trong một khoảng thời gian dài và không có giá trị nào bị thiếu, thuận
lợi cho mô hình hồi quy. Chúng ta có thể quan sát thấy mối quan hệ chặt chẽ giữa giá
vàng và USD với giá trị INR, CPI và Sensex. Trong tương lai, nhiều biến hơn có thể là
một phần của mô hình này.

2. Các yếu tố ảnh hưởng đến giá vàng

2.1 Khái niệm về “tiền tệ”


Tiền tệ là phương thức thanh toán chung của thị trường. Pháp luật và các nhà nước quy
định tiền đóng vai trò như vật ngang giá chung, được sử dụng nhằm mục đích trao đổi,
mua bán hàng hóa và dịch vụ.

Hiểu đơn giản thì, tiền tệ là phương tiện thanh toán, lưu thông, thực hiện vai trò môi giới
trong quá trình trao đổi hàng hóa, giúp nền kinh tế vận hành. Sự gia đời của tiền tệ gắn
liền với sự xuất hiện của trao đổi hàng hóa, sản xuất kinh doanh. Lịch sử phát triển của
tiền trong 5.000 năm, với nhiều hình thái đa dạng.

Các hình thái của tiền tệ hiện nay: Tiền giấy hoặc tiền kim loại do nhà nước phát hành
và được chấp nhận thanh toán. Giá trị tiền tệ được đảm bảo bởi các tài sản có giá trị
khác như: Vàng, kim loại quý, ngoại tệ, trái phiếu…
T r a n g 11 | 42
Giá trị của tiền tệ không phải là giá trị tự thân, mà là những gì mà tiền tệ có thể trao đổi
được như: Loại và số lượng hàng hóa, dịch vụ mua/ trao đổi được bằng một đơn vị tiền
tệ. Các chức năng của tiền tệ phải kể đến như:

 Thước đo giá trị.


 Phương tiện trao đổi.
 Phương tiện thanh toán.
 Chức năng tiền tệ thế giới.
2.2 Vai trò của vàng
Vàng (Gold) là một loại hàng hóa được giao dịch trong thị trường. Vàng còn là một loại
tài sản có tính thanh khoản cao, được chấp nhận như một loại tiền đặc biệt tại tất cả các
nước trên thế giới.

Vàng là kim loại quý trong ngành trang sức, điêu khắc và trang trí kể từ khi được xuất
hiện trong lịch sử. Nó xuất hiện dưới dạng quặng vàng hoặc dạng hạt nằm trong đá,
mạch và mỏ sa khoáng và là một trong những kim loại được đúc tiền và hình thành nên
cơ sở cho hệ thống bản vị vàng Bretton Woods trước khi nó sụp đổ vào năm 1971. Cho
đến nay, vàng vẫn là kim loại duy nhất được con người sử dụng lâu dài từ thời tiền sử
đến nay, có 2 vai trò cụ thể:

Vàng đóng vai trò là nguyên liệu để sản xuất thành hàng hóa, được mua – bán và có giá
trị sử dụng.

 Là kim loại dễ dát mỏng và dễ uốn nhất được biết: chỉ 1 gram vàng có thể dát
mỏng thành 1 tấm 1m2, hoặc 1 ounce vàng có thể dát mỏng đến 300 feet vuông.
 Có tính dẫn nhiệt, dẫn điện tốt và phản ánh tia hồng ngoại rất mạnh.
 Không bị ảnh hưởng bởi không khí, hơi ẩm và thuốc thử ăn mòn mạnh nhất,
ngoại trừ một số chất đặc biệt như thủy ngân, …
 Vàng tạo ra hợp chất với nhiều kim loại khác. Các hợp chất này được tạo ra để
đảm bảo độ cứng và các đặc tính luyện kim khác, để kiểm soát điểm tan chảy
hoặc để tạo ra màu sắc đẹp
 Vàng nguyên chất có màu vàng nhạt sáng đẹp.

Do những lý do đó mà vàng rát được ưa chuộng và rất phù hợp được sử dụng để làm
trang sức và được sử dụng trong nhiều ngành hiện đại như nha khoa và điện tử.

Vàng đóng vai trò là một loại tiền tệ đặc biệt với đầy đủ các chức năng của tiền: Thước
đo giá trị, phương tiện lưu thông, phương tiện thanh toán, phương tiện cất trữ và tiền tệ
quốc tế.
2.3 Vì sao vàng có được vai trò tiền tệ?
Trong lịch sử kinh tế, tiền vàng đã từng đóng vai trò như tiền tệ là vật ngang giá chung
T r a n g 12 | 42
gian trong thời gian dài. Vàng không phải là kim loại quý hiếm nhất trên thế giới, nhưng
xuất hiện sớm trong lịch sử và được chấp nhận có vai trò như tiền tệ thanh toán, trao đổi
hàng hóa. 
Với sự phát triển của tiền tệ, vàng cũng không còn được sử dụng để trao đổi mua bán.
Tuy nhiên, vàng vật chất vẫn có vai trò và ảnh hưởng lớn đến nền kinh tế.
Vậy, vì sao vàng có được vai trò tiền tệ trong thời gian lịch sử dài? Dưới đây là một số
lý do giải thích cho điều này:
 Giá trị thẩm mỹ của đẹp, có sức hút lớn với nhiều người dùng làm đồ trang sức.
Mặc dù vàng không phải là kim loại hiếm nhưng giá trị thẩm mỹ cao, được nhiều
người yêu thích, ưa chuộng nên chúng trở nên quý giá và có giá trị để trao đổi.
 Giá trị cao nhờ đặc tính đồng nhất, độ tinh khiết cao, không ăn mòn và luôn ổn
định trong mọi điều kiện, khó bị làm giả… Chính là những yếu tố vàng có thể
bảo toàn giá trị, trở thành thước đo giá trị hàng hóa khác.

2.4 Khái niệm “Lạm phát”


Lạm phát có tác động đến giá trị của vàng, nhưng không nhiều như mọi người nghĩ. Hầu
hết các nhà đầu tư vàng mới vào nghề đều tin rằng nếu lạm phát tăng ở Mỹ thì giá vàng
cũng sẽ tăng vì phải trả nhiều USD lạm phát hơn cho mỗi ounce. Tuy nhiên, về dài hạn,
không có sự tương quan chặt chẽ giữa lạm phát và giá vàng. Điều này có thể nhìn thấy
từ biểu đồ dưới đây về động thái lạm phát ở Mỹ và giá vàng.

hình

Sự thiếu tương quan chặt chẽ này có thể được giải thích bởi hai lý do:
 Vàng không phải là hàng hóa. Nghĩa là, nó không được tiêu thụ bởi ngành công
nghiệp, như dầu mỏ hoặc kim loại đen, và do đó phản ứng với sức mua của tiền tệ
không giống với các hàng hóa khác
 Trong các thời kỳ phát triển kinh tế và thị trường chứng khoán, vàng phải “cạnh
tranh” về khả năng sinh lời và thu hút sự chú ý của các chủ đầu tư. Hơn nữa,
trong những giai đoạn như vậy, lạm phát thường ở mức cao.

2.5 Khái niệm “Sự dao động của tiền tệ”


Vàng, cùng với đồng đô la Mỹ, đang mất đi chức năng tiền tệ dự trữ, là một công cụ trú
ẩn an toàn trên thị trường. Do đó, nếu tỷ giá hối đoái của một trong các loại tiền tệ (ví
dụ: đồng đô la) giảm giá so với các loại tiền tệ dự trữ khác, trong khi sức mua của việc
mua vàng bằng các loại tiền tệ khác được bảo toàn, thì hệ quả hợp lý là vàng sẽ tăng giá
so với tiền tệ mất giá. Biểu đồ cho thấy mối quan hệ nghịch đảo trong dài hạn giữa chỉ
số đồng đô la Mỹ (đường màu trắng) và động thái của giá vàng (đường màu vàng).

2.6 Khái niệm “Lãi suất”


Vàng nhạy cảm với lãi suất vì nó không tạo ra thu nhập hiện tại. Do đó, nó rất nhạy cảm
với các lựa chọn thay thế trên thị trường chứng khoán mang lại thu nhập tiềm năng,
T r a n g 13 | 42
chẳng hạn như trái phiếu hoặc thậm chí cổ phiếu trả cổ tức. Có một mối tương quan
nghịch đáng chú ý, mặc dù không hoàn hảo. Khi lợi suất trái phiếu chính phủ Mỹ tăng,
khả năng cao là xu hướng vàng sẽ đi ngang hoặc thậm chí là giảm xuống, trong khi lợi
suất giảm có xu hướng dẫn đến chuyển động rất tích cực của giá vàng.

Ví dụ: để chống lại cuộc suy thoái vào đầu những năm 2000, Fed đã hạ lãi suất xuống
rất thấp, buộc các nhà đầu tư dài hạn phải rút khỏi trái phiếu lợi suất thấp và đa dạng hóa
danh mục đầu tư của họ với vàng. Điều này đã hỗ trợ tốt cho giá vàng vốn đang tăng lên.
Vào ngày 26 tháng 1 năm 2022, Fed đã cung cấp gợi ý về việc tăng lãi suất, dẫn đến sự
giảm mạnh từ $1.847,61 xuống $1.791,03 vào ngày 26-28 tháng 1.
2.7 Khái niệm “Cung và cầu”
Cung và cầu là những yếu tố khó nhất để đánh giá tác động đến giá của kim loại. Các
chủ đầu tư vàng lớn, bao gồm các ngân hàng trung ương, IMF và các quỹ hàng đầu, gây
tác động đáng kể đến thị trường. Hành động của những nhân tố này có thể thay đổi
mạnh mẽ nhu cầu về vàng trang sức và các công cụ đầu tư.

Dữ liệu dưới đây cho thấy rằng Trung Quốc và Ấn Độ (với tốc độ tăng trưởng kinh tế
mạnh mẽ) đã trở thành hai nguồn thu mua vàng lớn trong hai thập kỷ qua để đầu tư và
tạo dự trữ, do đó, đã cung cấp thêm một động lực kích thích tăng giá.

Dự trữ vàng của Ngân hàng trung ương Trung Quốc

T r a n g 14 | 42
Dự trữ vàng của Ngân hàng trung ương Ấn Độ
2.8 Đơn vị đo lường và cách niêm yết giá vàng
Tên thị trường thế giới, vàng thường được tính theo đơn vị là ounce hay troy ounce. 1
ounce tương đương 31.103476 gram. Thường được niêm yết như sau:
 Đơn vị yết giá (thông thường): USD/ounce
 1 ounce = 1 troy ounce = 0.83 lượng
 1 lượng = 1.20556 ounce
Trong ngành kim hoàn ở Việt Nam, khối lượng của vàng được tính theo đơn vị là cây
(lượng hay lạng) hoặc là chỉ. Một cây vàng nặng 37,50 gram. Một chỉ bằng 1/10 cây
vàng. Được niêm yết như sau:
 Đơn vị yết giá: VND/lượng
 Công thức quy đổi giá vàng từ đơn vị tính USD/Oz thành đơn vị tính
VND/lượng:

PVN = (PTG+ phí vận chuyển ) * 1.20556 * (1 + Thuế NK) * Tỷ giá + phí
gia công.

 PVN: Giá vàng thành phẩm khi nhập khẩu về Việt Nam (VND/lượng)
 PTG: Giá vàng thế giới (USD/oz)
 Phí vận chuyển: Phí vận chuyển về đến Việt Nam (USD/oz)
 Tỷ giá: Tỷ giá quy đổi giữa USD và VND
 Thuế NK: Thuế nhập khẩu vàng do chính phủ Việt Nam quy định (%)
 Phí gia công: Phí gia công vàng nguyên liệu thành vàng thành phẩm
(VND/lượng)
Đây là công thức đơn giản để quy đổi giá vàng tính theo USD/oz thành giá vàng tính
theo đồng/lượng, điều nảy cho thấy: giá vàng trong nước dao động và chịu ảnh hưởng
bởi giá vàng thế giới. Tuy nhiên, công thức trên chỉ tính đến giá vàng thế giới có tác
động đến giá vàng trong nước mà chưa tính đến cung cầu của thị trường vàng trong
nước và một số yếu tố chi phối khác nên công thức trên chỉ có thể dùng để tính giá vàng
T r a n g 15 | 42
quy đổi – một cách tính để hỗ trợ cho việc tính toán giá vàng trong nước dựa theo giá
vàng thế giới.
2.9 Khái niệm “Azure Machine Learning”
Azure Machine Learning Studio là một dịch vụ tiên đoán dựa trên ứng dụng web qua
Internet cung cấp một trải nghiệm tinh gọn cho các nhà khoa học dữ liệu từ tất cả các
cấp độ kỹ năng. Có tính năng dễ sử dụng, kéo và thả giao diện để xây dựng các mô hình
Machine Learning. Đi kèm với một bộ thư viện đầy đủ tính năng bao gồm các thuật toán
với độ chính xác cao nhất và đã được thực nghiệm trong các dịch vụ toàn cầu của
Microsoft như Bing. Và được xây dựng để hỗ trợ cho R và Python có nghĩa là bạn có thể
tự do thay đổi và tùy chỉnh model của bạn. Xây dựng và đào tạo model dễ dàng hoạt
động như là một dịch vụ web có thể chạy trên một loạt các ngôn ngữ lập trình, hoặc chia
sẻ nó với cộng đồng bằng cách đặt nó vào trong Cortana Intelligence Gallery. Azure
machine learning cung cấp các dịch vụ chính như:
o Automated machine learning: Tạo nhanh các model từ dữ liệu.
o Azure Machine Learning designer: Giúp trực quan hóa giao diện khi khởi tạo
model
o Lưu trữ và xử lý dữ liệu: Tương tự như google colad- Azure marchine learning
workspace cho phép chúng ta có thể lưu trữ, tạo máy ảo, thuê máy để train các
model. Máy mạnh hay yếu tùy thuộc vào số tiền bạn thuê.
o Notebook & Pipelines: Nơi mà các Data Scientist, Software Engineers, có thể viết
code, train, deploy và quản lý các tasks.

Có rất nhiều loại model khác nhau, phục vụ từng mục đích khác nhau, nhưng thông
thường thì nó sẽ được chia thành 3 dạng dự đoán chính là: Regression (Hồi quy),
Classification (Phân loại) , Clustering (phân cụm)

 Regression : Hệ thống AI trả về kết quả là các SỐ LIỆU (label) dựa trên các
feature. Ví dụ dự đoán giá nhà đất của thành phố: sẽ dựa vào các yếu tố như diện
tích, số phòng ngủ, vị trí cách trung tâm, từ đó sẽ trả về kết quả giá nhà sẽ như thế
nào. Tổng quát hóa thì y = f(x) . Hàm f(x) sẽ là model của chúng ta. Và regression
là một dạng học có giám sát (supervised learning).
 Classification : Tương tự như regression, classification của là một dạng học có
giám sát nhưng kết quả trả về ở đây có dạng là 0 or 1. Ví dụ các bài toán quên
thuộc như nhận diện đối tượng có khả năng vay hay không, nhận diện có đeo khẩu
trang hay không.
 Clustering: Đây là một dạng học không giám sát unsupervised learning. Chúng trả
về kết quả dựa trên dữ liệu thành các nhóm với nhau dựa trên yếu tố tương đồng.
Ví dụ: Phân nhóm các loại hoa dựa trên các yếu tố tương đồng.

3. Phương pháp dự báo giá vàng bằng máy học (Azure Machine Learning)

T r a n g 16 | 42
3.1 Mô hình ARIMA
Năm 1976 George Box và Gwilym Jenkins là những người đầu tiên giới thiệu các mô
hình ARIMA (Autoregressive Integrated Moving Average s Tự hồi qui tích hợp Trung
bình trượt) nhằm khai thác các thông tin sẵn có tích hợp trong bản thân một biến số để
tìm hiểu sự biến thiên của biến số đó.
ARIMA model là viết tắt của cụm từ Autoregressive Intergrated Moving Average. Mô
hình sẽ biểu diễn phương trình hồi qui tuyến tính đa biến (multiple linear regression) của
các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê) là 2 thành phần chính:

 Auto regression: Kí hiệu là AR. Đây là thành phần tự hồi qui bao gồm tợp hợp
các độ trễ của biến hiện tại. Độ trễ bậc p chính là giá trị lùi về quá khứ p bước
thời gian của chuỗi. Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham
số trễ p. Cụ thể, quá trình AR(p) của chuỗi xt được biểu diễn như bên dưới:

 Moving average: Qúa trình trung bình trượt được hiểu là quá trình dịch chuyển
hoặc thay đổi giá trị trung bình của chuổi theo thời gian. Do chuỗi của chúng ta
được giả định là dừng nên quá trình thay đổi trung bình dường như là một chuỗi
nhiễu trắng. Qúa trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữa
các phần tử ngẫu nhiên ϵt (stochastic term). Chuỗi này phải là một chuỗi nhiễu
trắng thỏa mãn các tính chất:

Vế (1) có nghĩa rằng kì vọng của chuỗi bằng 0 để đảm bảo chuỗi dừng không có sự thay
đổi về trung bình theo thời gian. Vế (2) là phương sai của chuỗi không đổi. Do kì vọng
và phương sai không đổi nên chúng ta gọi phân phối của nhiễu trắng là phân phối xác
định (identical distribution) và được kí hiệu là ϵt∼WN(0,σ2). Nhiễu trắng là một thành
phần ngẫu nhiên thể hiện cho yếu tố không thể dự báo của model và không có tính qui
luật. Qúa trình trung bình trượt được biểu diễn theo nhiễu trắng như sau:

T r a n g 17 | 42
Qúa trình này có thể được biểu diễn theo dịch chuyển trễ - backshift operator B như sau:

Như vậy bạn đọc đã hình dung ra moving average là gì rồi chứ? Về mặt ý tưởng thì đó
chính là quá trình hồi qui tuyến tính của giá trị hiện tại theo các giá trị hiện tại và quá
khứ của sai số nhiễu trắng (white noise error term) đại diện cho các yếu tố shock ngẫu
nhiên, những sự thay đổi không lường trước và giải thích bởi mô hình.
Intergrated: Là quá trình đồng tích hợp hoặc lấy sai phân. Yêu cầu chung của các thuật
toán trong time series là chuỗi phải đảm bảo tính dừng. Hầu hết các chuỗi đều tăng hoặc
giảm theo thời gian. Do đó yếu tố tương quan giữa chúng chưa chắc là thực sự mà là do
chúng cùng tương quan theo thời gian. Khi biến đổi sang chuỗi dừng, các nhân tố ảnh
hưởng thời gian được loại bỏ và chuỗi sẽ dễ dự báo hơn. Để tạo thành chuỗi dừng, một
phương pháp đơn giản nhất là chúng ta sẽ lấy sai phân. Một số chuỗi tài chính còn qui
đổi sang logarit hoặc lợi suất. Bậc của sai phân để tạo thành chuỗi dừng còn gọi là bậc
của quá trình đồng tích hợp (order of intergration). Qúa trình sai phân bậc d của chuỗi
được thực hiện như sau:

Thông thường chuỗi sẽ dừng sau quá trình đồng tích hợp I(0) hoặc I(1). Rất ít chuỗi
chúng ta phải lấy tới sai phân bậc 2. Một số trường hợp chúng ta sẽ cần biến đổi logarit
hoặc căn bậc 2 để tạo thành chuỗi dừng. Phương trình hồi qui ARIMA(p, d, q) có thể
được biểu diễn dưới dạng:

Trong đó Δxt là giá trị sai phân bậc d và ϵt là các chuỗi nhiễu trắng.

Như vậy về tổng quát thì ARIMA là mô hình kết hợp của 2 quá trình tự hồi qui và trung
bình trượt. Dữ liệu trong quá khứ sẽ được sử dụng để dự báo dữ liệu trong tương lai.
Trước khi huấn luyện mô hình, cần chuyển hóa chuỗi sang chuỗi dừng bằng cách lấy sai
phân bậc 1 hoặc logarit. Ngoài ra mô hình cũng cần tuân thủ điều kiện ngặt về sai số
không có hiện tượng tự tương quan và phần dư là nhiễu trắng. Đó là lý thuyết của kinh
tế lượng. Còn theo trường phái machine learning thì tôi chỉ cần quan tâm đến làm sao để
lựa chọn một mô hình có sai số dự báo là nhỏ nhất.

T r a n g 18 | 42
3.2 Cây quyết định (Decision Tree)
Cây quyết định được sử dụng để chia liên tiếp một tập dữ liệu lớn thành các tập con nhỏ
bằng cách áp dụng một chuỗi các thuật toán. Với mỗi phép chia liên tiếp, các tập con thu
được trong tập kết quả sẽ ngày càng giống nhau.

Cây quyết định là cấu trúc biểu diễn dưới dạng cây. Trong đó, mỗi nút trong (internal
node) biểu diễn một thuộc tính, nhánh (branch) biểu diễn giá trị có thể có của thuộc tính,
mỗi lá (leaf node) biểu diễn các lớp quyết định và đỉnh trên cùng của cây gọi là gốc
(root). Cây quyết định có thể được dùng để phân lớp bằng cách xuất phát từ gốc của cây
và di chuyển theo các nhánh cho đến khi gặp nút lá.

Theo nguồn wikipedia trong lĩnh vực máy học, cây quyết định là một kiểu mô hình dự
báo (predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tới
các kết luận về giá trị mục tiêu của sự vật/hiện tượng. Mỗi một nút trong (internal node)
tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể
cho biến đó. Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, cho trước các giá
trị của các biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó. Kỹ thuật học máy
dùng trong cây quyết định được gọi là học bằng cây quyết định, hay chỉ gọi với cái tên
ngắn gọn là cây quyết định.

Học bằng cây quyết định cũng là một phương pháp thông dụng trong khai phá dữ liệu.
Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại
còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây quyết
định có thể được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm
tra giá trị thuộc tính. Quá trình này được lặp lại một cách đệ quy cho mỗi tập con dẫn
xuất. Quá trình đệ quy hoàn thành khi không thể tiếp tục thực hiện việc chia tách được
nữa, hay khi một phân loại đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất.
Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụng một số cây quyết định để có
thể cải thiện tỉ lệ phân loại.

Cây quyết định cũng là một phương tiện có tính mô tả dành cho việc tính toán các  xác
suất có điều kiện.

Cây quyết định có thể được mô tả như là sự kết hợp của các kỹ thuật toán học và tính
toán nhằm hỗ trợ việc mô tả, phân loại và tổng quát hóa một tập dữ liệu cho trước.

Dữ liệu được cho dưới dạng các bản ghi có dạng:

(x, y) = (x1, x2, x3..., xk, y)

Biến phụ thuộc (dependant variable) y là biến mà chúng ta cần tìm hiểu, phân loại hay
tổng quát hóa. x1, x2, x3... là các biến sẽ giúp ta thực hiện công việc đó.

T r a n g 19 | 42
3.3 Thuật toán Naive Bayes Classifiers

Naive Bayes Classifiers (NBC) là một trong những thuật toán tiêu biểu cho bài toán phân
lớp dựa trên lý thuyết xác suất áp dụng định lý Bayes. Định lý Bayes cho phép chúng ta
có thể tính toán một xác suất chưa biết dựa vào các xác suất có điều kiện khác. Với công
thức tổng quát tính xác suất của biến cố A với điều kiện biến cố Bk xảy ra trước (hay
được gọi là xác suất hậu nghiệm):
Với P(A) > 0 và {𝐵1,𝐵2 , …, 𝐵𝑛} là một hệ đầy đủ các biến cố thỏa mãn tổng xác suất
của hệ bằng 1 (∑ 𝑃(𝐵𝑘 𝑛 𝑘=1 ) = 1) và từng đôi một xung khắc (𝑃(𝐵𝑖 ∩ 𝐵𝑗) = 0). Khi đó
ta có:

Bộ phân lớp Naive bayes hoạt động như sau:


 Gọi D là tập dữ liệu huấn luyện, trong đó mỗi phần tử dữ liệu A chứa n giá trị
thuộc tính B1, B2,...,Bn được biểu diễn bằng một vector n thành phần
{x1,x2,...,xn}
 Giả sử có m lớp C1, C2,..,Cm. Cho một phần tử dữ liệu A, bộ phân lớp sẽ gán
nhãn cho A là lớp có xác suất hậu nghiệm lớn nhất. Cụ thể, bộ phân lớp Bayes sẽ
dự đoán A thuộc vào lớp Ci nếu và chỉ nếu:

Giá trị này sẽ tính dựa trên định lý Bayes.


 Để tìm xác suất lớn nhất, ta nhận thấy các giá trị P(A) là giống nhau với mọi lớp
nên không cần tính. Do đó ta chỉ cần tìm giá trị lớn nhất của P(A|Ci) * P(Ci). Chú
ý rằng P(Ci) được ước lượng bằng |Di |/|D|, trong đó Di là tập các phần tử dữ liệu
thuộc lớp Ci. Nếu xác suất tiền nghiệm P(Ci) cũng không xác định được thì ta coi
chúng bằng nhau P(C1) = P(C2) = ... = P(Cm), khi đó ta chỉ cần tìm giá trị P(A|
Ci) lớn nhất.
 Khi số lượng các thuộc tính mô tả dữ liệu là lớn thì chi phí tính toán P(A|Ci) là
rất lớn, do đó có thể giảm độ phức tạp của thuật toán Naive Bayes nếu giả thiết
các thuộc tính độc lập nhau. Khi đó ta có thể tính:

NBC có thể hoạt động với các vector đặc trưng mà một phần là liên tục (sử dụng
Gaussian Naive Bayes), phần còn lại ở dạng rời rạc (sử dụng Multinomial hoặc
Bernoulli). Trong phần thực nghiệm, tác giả sử dụng MultinomialNB để xây dựng mô
hình. Mỗi văn bản được biểu diễn bởi một vector có độ dài d chính là số từ trong từ điển.
Giá trị của thành phần thứ i trong mỗi vector chính là số lần từ thứ i xuất hiện trong văn
bản đó. Khi đó, P(xi|Cj) tỉ lệ với tần suất từ thứ i (hay thuộc tính thứ i cho trường hợp
tổng quát) xuất hiện trong các văn bản của lớp Cj. Giá trị này có thể được tính bằng cách
T r a n g 20 | 42
Trong đó:
 Nci là tổng số lần từ thứ i xuất hiện trong các văn bản của lớp Cj, nó được tính
bằng tổng của tất cả các thành phần thứ i của các vector thuộc tính ứng với lớp Cj
 Nc là tổng số từ (kể cả lặp) xuất hiện trong lớp Cj. Nói cách khác, nó bằng tổng
độ dài của toàn bộ các văn bản thuộc vào lớp Cj.
Cách tính này có một hạn chế là nếu có một từ mới chưa bao giờ xuất hiện trong lớp Cj
thì biểu thức (1) sẽ bằng 0, điều này dẫn P(A|Ci) = 0 bất kể các giá trị còn lại có lớn thế
nào. Việc này sẽ dẫn đến kết quả không chính xác. Để giải quyết việc này, một kỹ thuật
được gọi là Laplace smoothing được áp dụng như trong biểu thức:

Với α là một số dương, thường bằng 1, để tránh trường hợp tử số bằng 0. Mẫu số được
cộng với dα để đảm bảo tổng xác suất ∑ 𝑃(𝑥𝑖 |𝐶𝑗) = 1 𝑑 𝑖=1 ( theo nguồn Wei Zhang,
Feng Gao, 2011)
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Thiết kế nghiên cứu
Trong quá trình thực hiện đề tài “Dự đoán giá vàng” để có cái nhìn chính xác và tổng
quát nhóm đã áp dụng các biện pháp nghiên cứu:
 Tham khảo tài liệu: Dựa trên cơ sở kiến thức đã được học tập qua bộ môn phân
tích kinh doanh doanh, nhóm đã chủ động tìm thêm các kiến thức từ sách, báo,
đài, tivi, tạp chí, mạng internet,… để hiểu rõ vàng chịu ảnh hưởng bỡi các các
yếu tố nào.
 Phương pháp phân tích so sánh: Dựa trên nguồn dữ liệu giá vàng trong giai
đoạn 2000 – 2020 nhóm tiến hành so sánh để có được diễn biến của giá vàng
qua các năm.
 Sử dụng mô hình ARIMA để dự báo giá vàng dựa trên dữ liệu quá khứ.
ARIMA - Autoregressive integrated moving average (Tự hồi quy tích hợp
trung bình trượt) áp dụng vào việc phân tích và dự báo chuỗi thời gian.
Bên cạnh đó, nhòm còn sử dụng phần mềm Microsoft Excel xử lý nguồn dữ liệu thô
đầu vào, Microsoft Azure để phân tích và dự đoán dữ liệu, Microsoft Power BI tạo biểu
đồ.
 Nghiên cứu sơ bộ: Nghiên cứu các lý thuyết có liên quan đến đề tài “Dự báo giá
vàng”.
 Nghiên cứu định lượng dựa trên thu thập tập dữ liệu có sẵn. Sau đó, tổng hợp và
phân tích dữ liệu mối liên hệ giữa các biến, đưa ra giả thuyết cho mô hình,

T r a n g 21 | 42
chạy thử mô hình nghiên cứu.
3.2 Quy trình nghiên cứu
Trên cơ sở lý thuyết nền tảng, nhóm xây dựng mô hình với về các nhân tố liên quan đến
dự đoán giá vàng :
Dự báo giá vàng

Giá dầu thô

USD so với INR

Sensex

CPI và Lãi suất


3.3 Giả thuyết nghiên cứu
3.3.1 Giá dầu thô
Dầu là đầu vào quan trọng cho sản xuất, khi giá dầu thay đổi, toàn bộ nền kinh tế thế
giới bị ảnh hưởng, ảnh hưởng trực tiếp tới sự ổn định của nhiều quốc gia. Khi kinh tế thế
giới trên đà suy thoái thì giá cả của tất cả hàng hóa có xu hướng giảm mạnh, trong đó có
giá dầu thô. Việc này là kết quả vì cuộc khủng hoảng tài chính dẫn đến nhu cầu tiêu thụ
hàng hóa gần như bị chựng lại ở mức thấp, thất nghiệp trầm trọng kéo theo mức thu
nhập bình quân không cao và lòng tin tiêu dùng bị giảm sút mạnh.

Dữ liệu lịch sử giá dầu thô

Đầu tiên là sự suy yếu của nền kinh tế, thất nghiệp, sau đó là sự điều chỉnh, can thiệp
của Cục Dự trữ Liên bang Mỹ, Ngân hàng Trung ương châu Âu và ngân hàng trung
T r a n g 22 | 42
ương các nước lớn, cùng lúc đó niềm tin tiêu dùng giảm và tất yếu kéo theo hàng hóa sẽ
giảm giá. Các công ty cũng gặp rắc rối về sản xuất khi giá hàng hóa giảm và tín dụng
hạn hẹp cho vay từ các ngân hàng dẫn đến sản xuất trì trệ. Trên cơ sở đó, giá dầu thô,
nguyên nhiên liệu đầu vào chính trong sản xuất giảm là tất yếu do nhu cầu sản xuất
giảm. Khi nền kinh tế suy yếu, giá dầu ở mức thấp, mối lo ngại về tài sản đầu tư sụt
giảm và đầu cơ tăng thì giá vàng lại ở mức cao so với giá dầu.

Do dầu có vai trò quan trọng như vậy, nên nhiều quốc gia, nhiều tổ chức đầu cơ vào dầu
thông qua hợp đồng tương lai và quyền chọn. Khi kinh tế phát triển không ổn định, nhà
đầu tư tăng cường đầu tư vào vàng và dầu để bảo vệ tài sản của mình.

Trên phương diện đầu cơ này, có thể nói, dầu và vàng là 2 hàng hoá bổ sung cho nhau,
giá cả của chúng có xu hướng biến động cùng chiều.

Tuy nhiên, khác với vàng, vai trò của dầu với tư cách là hàng hoá cũng rất lớn, lớn hơn
cả vai trò là hàng hoá để đầu cơ. Trong tình hình suy thoái hiện nay, nhu cầu về dầu với
tư cách là một hàng hóa (nhiên liệu) bị giảm sút quá mạnh do hoạt động sản xuất – kinh
doanh bị thu hẹp.

Trong khi đó, các nước sản xuất dầu vẫn phải sản xuất, vì họ phụ thuộc nặng vào nguồn
thu từ dầu và quy trình sản xuất dầu khá phức tạp, không thể dừng lại trong một sớm
một chiều. Điều này làm cho giá dầu giảm.

Tóm lại, khi kinh tế phát triển bình thường thì giá dầu và vàng có xu hướng biến động
cùng chiều. Nhưng khi kinh tế bị suy thoái nghiêm trọng dẫn tới nhu cầu về dầu với tư
cách đầu vào cho sản xuất bị giảm sút quá mạnh, thì giá dầu có thể thoát ly khỏi giá
vàng.
3.3.2 USD so với INR
Trong tháng 7 vừa qua, đồng ruppe đã có ít nhất hai lần phá vỡ ngưỡng 80 INR/USD và
chỉ phục hồi trở lại sau khi NHTW Ấn Độ (RBI) ra tay can thiệp. Theo đó đồng tiền này
giao dịch ở mức khoảng 79,06 INR/USD vào giữa tuần trước. Mặc dù vậy tính chung
đồng rupee của Ấn Độ đã để mất hơn 5% giá trị so với đồng bạc xanh kể từ đầu năm.

T r a n g 23 | 42
Dữ liệu lịch sử USD/INR
Trong một tuyên bố bằng văn bản trước Quốc hội Ấn Độ vào cuối tháng 7, Bộ trưởng
Tài chính Nirmala Sitharaman cho biết, các yếu tố bên ngoài như cuộc xung đột Nga -
Ukraine, giá dầu thô tăng vọt và điều kiện tài chính toàn cầu thắt chặt là một số nguyên
nhân chính khiến đồng rupee của Ấn Độ suy yếu.

Là nước nhập khẩu dầu lớn thứ ba thế giới và chủ yếu thanh toán bằng USD nên việc giá
dầu tăng cao đã tiêu tốn một lượng không nhỏ ngoại tệ của Ấn Độ. Theo các nhà phân
tích của Nomura, chỉ cần giá dầu tăng thêm 1 USD thì hóa đơn nhập khẩu của Ấn Độ
tăng thêm 2,1 tỷ USD.

Trong khi điều kiện tài chính toàn cầu bị thắt chặt và việc tăng nhanh lãi suất của Fed
đang khiến dòng vốn có xu hướng chảy ra. Theo một ghi chú gần đây của Nomura, tính
đến tháng 7 chứng khoán Ấn Độ đã chứng kiến 28,9 tỷ USD dòng vốn nước ngoài chảy
ra ròng, nhiều thứ hai trong số các nền kinh tế châu Á.

3.3.3 Sensex
Sensex, còn được gọi là chỉ số S&P BSE Sensex, là chỉ số chuẩn của Sàn giao dịch
chứng khoán Bombay (BSE) ở Ấn Độ. Sensex bao gồm 30 cổ phiếu lớn nhất và được
giao dịch tích cực nhất trên BSE, cung cấp thước đo chính xác về nền kinh tế của Ấn
Độ.

Được sử dụng lần đầu tiên vào năm 1986, Sensex là chỉ số chứng khoán lâu đời nhất ở
Ấn Độ. Các nhà phân tích và nhà đầu tư sử dụng Sensex để quan sát sự tăng trưởng
chung, sự phát triển của các ngành công nghiệp cụ thể, và sự bùng nổ của nền kinh tế Ấn
Độ.

Hiện nay, Ấn Độ đang được xếp vào một trong những quốc gia có tốc độ tăng trưởng
GDP – tổng sản phẩm quốc nội cao nhất, chính vì vậy Ấn Độ cũng là quốc gia có sự
tăng trưởng chỉ số chứng khoán tham chiếu nhanh nhất thế giới.

T r a n g 24 | 42
3.3.4 CPI
Theo wikipedia chỉ số giá tiêu dùng (hay được viết tắt là CPI, từ các chữ tiếng Anh
consumer price index) là chỉ số tính theo phần trăm để phản ánh mức thay đổi tương đối
của giá hàng tiêu dùng theo thời gian. Sở dĩ chỉ là thay đổi tương đối vì chỉ số này chỉ
dựa vào một giỏ hàng hóa đại diện cho toàn bộ hàng tiêu dùng.

Đây là chỉ tiêu được sử dụng phổ biến nhất để đo lường mức giá và sự thay đổi của mức
giá chính là lạm phát (một chỉ tiêu khác để phản ánh mức giá chung là Chỉ số giảm phát
tổng sản phẩm trong nước hay Chỉ số điều chỉnh GDP).

Để tính toán chỉ số giá tiêu dùng người ta tính số bình quân gia quyền theo công thức
Laspeyres của giá cả của kỳ báo cáo (kỳ t) so với kỳ cơ sở. Để làm được điều đó phải
tiến hành như sau:

 Cố định giỏ hàng hóa: thông qua điều tra, người ta sẽ xác định lượng hàng hoá,
dịch vụ tiêu biểu mà một người tiêu dùng điển hình mua.
 Xác định giá cả: thống kê giá cả của mỗi mặt hàng trong giỏ hàng hoá tại mỗi
thời điểm.
 Tính chi phí (bằng tiền) để mua giỏ hàng hoá bằng cách dùng số lượng nhân với
giá cả của từng loại hàng hoá rồi cộng lại.
 Lựa chọn thời kỳ gốc để làm cơ sở so sánh rồi tính chỉ số giá tiêu dùng bằng
công thức sau:

Thời kỳ gốc sẽ được thay đổi trong vòng 5 đến 7 năm tùy ở từng nước.
CPI được dùng để tính chỉ số lạm phát theo thời kỳ. Chẳng hạn, tính chỉ số lạm phát CPI
năm 2011 so với năm 2010 theo công thức sau:

Trên thực tế người ta có thể xác định quyền số trong tính toán chỉ số giá tiêu dùng bằng
cách điều tra để tính toán tỷ trọng chi tiêu của từng nhóm hàng hoá, dịch vụ so với tổng
giá trị chi tiêu. Sau đó quyền số này được dùng để tính chỉ số giá tiêu dùng cho các thời
kỳ sau. CPI thường được tính hàng tháng và hàng năm. CPI còn được tính toán cho từng
nhóm hàng hóa hoặc một số nhóm hàng hóa tùy theo mục đích sử dụng. Ngoài CPI
người ta cũng tính toán chỉ số giá bán buôn là mức giá của giỏ hàng hóa do các doanh
nghiệp mua vào, khác với CPI là giá do người tiêu dùng mua vào (giá bán lẻ). Lưu ý chỉ
số giá tiêu dùng năm gốc luôn bằng 1.
T r a n g 25 | 42
3.3.5 Lãi suất
Nguồn từ wikipedia lãi suất là tỷ lệ mà theo đó tiền lãi được người vay trả cho việc sử
dụng tiền mà họ vay từ một người cho vay. Cụ thể, lãi suất (I/m) là phần trăm tiền gốc
(P) phải trả cho một số lượng nhất định của thời gian (m) mỗi thời kỳ (thường được tính
theo năm). Ví dụ, một công ty nhỏ vay vốn từ một ngân hàng để mua tài sản mới cho
doanh nghiệp của mình, và ngược lại người cho vay nhận được tiền lãi theo lãi suất quy
định cho việc trì hoãn sử dụng các khoản tiền và thay vào đó bằng việc cho vay nó cho
người vay. Lãi suất thường được thể hiện như một tỷ lệ phần trăm của tiền gốc trong
một khoảng thời gian một năm.

Các mục tiêu lãi suất là một công cụ quan trọng của chính sách tiền tệ và được tính tới
khi xử lý các biến số như đầu tư, lạm phát và thất nghiệp. Các ngân hàng trung ương
hoặc các ngân hàng dự trữ của các nước nói chung có xu hướng giảm lãi suất khi họ
muốn tăng cường đầu tư và tiêu dùng trong nền kinh tế của đất nước. Tuy nhiên, một lãi
suất thấp như là một chính sách kinh tế vĩ mô có thể là rủi ro và có thể dẫn đến việc tạo
ra một bong bóng kinh tế, trong đó một lượng lớn các đầu tư được đổ vào thị trường bất
động sản và thị trường chứng khoán.

Điều này đã xảy ra tại Nhật Bản vào cuối những năm 1980 và đầu những năm 1990, sinh
ra các khoản nợ lớn không được thanh toán cho các ngân hàng Nhật Bản và sự phá sản
của các ngân hàng này và gây ra đình lạm trong nền kinh tế Nhật Bản (Nhật Bản là nền
kinh tế lớn thứ hai thế giới vào thời điểm đó), với xuất khẩu trở thành trụ cột cuối cùng
cho sự phát triển của nền kinh tế Nhật Bản trong suốt phần còn lại của những năm 1990
và đầu những năm 2000. Kịch bản tương tự đã sinh ra từ việc hạ lãi suất của Hoa Kỳ kể
từ cuối những năm 1990 đến nay (xem khủng hoảng tài chính toàn cầu 2007-2012) về
căn bản bởi quyết định của Hệ thống Dự trữ Liên bang.

Dưới thời Margaret Thatcher, nền kinh tế của Vương quốc Anh duy trì tăng trưởng ổn
định bằng cách không cho phép Ngân hàng Anh giảm lãi suất. Như thế, trong các nền
kinh tế phát triển, các điều chỉnh lãi suất đã được thực hiện để giữ lạm phát trong phạm
vi mục tiêu vì sức khỏe của các hoạt động kinh tế, hoặc thiết lập giới hạn trên của lãi
suất đồng thời với tăng trưởng kinh tế để bảo vệ đà kinh tế.

3.4 Nghiên cứu sơ bộ


Để có cái nhìn tổng quan về đề tài nhóm đã tiến hành nghiên cứu sơ bộ. Nhằm hiểu
được sơ lược bản chất vấn đề chính xác hơn khi thực hiện nghiên cứu chuyên sâu.
Trong bài nghiên cứu này, nhóm tiến hành nghiên cứu sơ bộ bằng cách ghi nhận sự
thay đổi giá dầu, biến động của USD/INR, Sensex, lãi suất và CPI từng ngày 1/11/2022
đến ngày 16/11/2022.
3.5 Nghiên cứu định lượng
T r a n g 26 | 42
Trên cơ sở nghiên cứu sơ bộ, nhóm tiến hành phân tích chuyên sâu về đề tài.
Phương pháp quyết định chọn để nghiên cứu chuyên sâu là nghiên cứu định lượng.
Phương pháp định lượng đòi hỏi một tập dữ liệu lớn, rõ ràng, dễ hiểu để đạt được kết
quả muốn nghiên cứu, để từ đó tập trung vào các cơ sở lập. Sau khi tổng hợp và chọn
lọc dữ liệu để phân tích, nhóm tiến hành chạy thử các mô hình nghiên cứu, các giả
thuyết thử nghiệm của tác giả khác và bài báo nghiên cứu trước khác có liên quan.
3.5.1 Làm sạch dữ liệu
Khi đã thực hiện hoàn tất các bước đầu tiên của nghiên cứu, sau đó nhóm tiến hành
phân loại dữ liệu để hực hiện các phương pháp học máy.
 Loại bỏ trùng lặp hoặc không liên quan
Dựa trên bộ dữ liệu mẫu từ kaggle.com nhóm tiến hành chọn lọc và loại bỏ những
dữ liệu trùng lặp hoặc có có liên quan đến đề tài.
 Xử lý các dữ liệu bị thiếu
Với những dòng dữ liệu bị thiết hoặc chưa đầy đủ các trường nhóm tiến hành tham
khảo nguồn dữ liệu khác hoặc sẽ loại bỏ nếu không tìm thấy.
3.5.2 Mô tả dữ liệu
Biến Dạng Miêu tả Giá trị của biến
Date Categorical Ngày dữ liệu

Gold_Price Categorical
Giá vàng

Crude_Oil
Categorical Giá dầu thô

Interest_Rate
Categorical Lãi suất
USD_INR
Categorical Đồng USD/INR
Sensex
Categorical Chỉ số chứng khoán
CPI
Categorical Chỉ số tiêu dùng
USD_Index
Categorical Chỉ số đồng USD

Trong bài nghiên cứu này, nhóm muốn làm rõ các yếu tố trên có ảnh hưởng như thế

T r a n g 27 | 42
nào đến giá vàng, do đó cần phải xác định biến độc lập và biến phụ thuộc để phân tích.

Kết quả của nghiên cứu này chính là mối liên hệ giữa giá dầu thô, lãi suất,
USD/INR, chỉ số chứng khoảng, chỉ số tiêu dùng, chỉ số đồng USD với giá vàng.

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU


1.1 Dữ liệu ghi nhận nguồn investing
1.1.1 Diễn biến giá vàng

T r a n g 28 | 42
1.1.2 Diễn biến giá dầu thô

1.1.3 Diễn biến lãi suất

1.1.4 Diễn biến USD/INR

T r a n g 29 | 42
1.1.5 Diễn biến chỉ số chứng khoán Sensex

1.1.6 Diễn biến chỉ số tiêu dùng CPI

1.1.7 Diễn biến chỉ số đồng USD

T r a n g 30 | 42
1.2 Thảo luận
Phát hiện chính là: Dựa trên dữ liệu thu thập được từ ngày 1/11/2022 đến 16/11/2022
nhóm em nhận thấy rằng giá vàng tại thị trường Ấn Độ ổn định gần mức cao nhất trong
3 tháng vào ngày thứ Tư (16/11).

Kết quả: Quá trình nghiên cứu cho thấy giá dầu thô, lãi suất ngân hàng, USD/INR, chỉ
số chứng khoán, chỉ số CPI và chỉ số đồng USD có mối quan hệ mật thiết với nhau:
o Giá dầu thô từ ngày 13 - 16 có xu hướng giảm dần nhờ đường ống dẫn dầu
Druzhba từ Nga đã hoạt động trở lại sau thời gian ngắn bị gián đoạn. Thị trường sau
đó đã phục hồi phần nào đà giảm sau khi dự trữ dầu thô tại Mỹ giảm mạnh hơn dự
báo do hoạt động lọc dầu diễn ra mạnh mẽ. Cơ quan Thông tin Năng lượng Mỹ
(EIA) cho biết dự trữ dầu thô nội địa sụt 5.4 triệu thùng trong tuần trước, cao hơn
rất nhiều so với dự báo giảm 440,000 thùng.

Tại Trung Quốc, số ca nhiễm Covid-19 tăng vọt đã gây áp lực lên tâm lý thị trường
sau khi nới lỏng hạn chế trong tuần này. Trong khi đó, Iraq lên kế hoạch gia tăng
công suất sản xuất lên khoảng 7 triệu thùng/ngày trong năm 2027. Cơ quan Năng
lượng Quốc tế (IEA) dự báo tăng trưởng nhu cầu giảm xuống từ 2.1 triệu
thùng/ngày trong năm nay xuống còn 1.6 triệu thùng/ngày trong năm 2023.
o Lãi suất ngân hàng tại Ấn Độ liên tăng để hỗ trợ cho nền kinh tế. RBI đã tăng lãi
suất cho vay chủ chốt thêm 50 điểm cơ bản lên 5,9%. Như vậy, lãi suất cho vay chủ
chốt đã tăng gần 2 điểm phần trăm kể từ khi Ấn Độ thực hiện kế hoạch thắt chặt tiền
tệ hồi tháng Năm. Ấn Độ đã phục hồi mạnh mẽ từ đại dịch COVID-19 nhưng hiện
đang phải vật lộn với những "cơn gió ngược" tác động đến nền kinh tế toàn cầu. Các
đợt tăng lãi suất dồn dập của các ngân hàng trung ương hàng đầu trên thế giới đã tạo
ra "cú sốc lớn thứ 3" đối với kinh tế thế giới, sau đại dịch COVID-19 và xung đột
Nga-Ukraine. Ấn Độ vừa vực dậy nền kinh tế sau đại dịch COVID-19 và nằm trong
số những nước có tốc độ tăng trưởng nhanh nhất.
T r a n g 31 | 42
o USD / INR là tỷ giá quy định cụ thể có thể chuyển đổi bao nhiêu INR (Rupee Ấn
Độ) thành một USD (Đô la Mỹ), do đó, tiền tệ cơ sở là USD và tiền tệ giá là INR.
Nếu tỷ lệ này giảm, điều đó có nghĩa là INR tăng giá so với USD và nếu tỷ lệ này
tăng thì có nghĩa là tỷ giá này mất giá so với USD. Tỉ giá USD/INR vẫn ổn định ở
mức 81K trong phiên giao dịch từ ngày 11 - 15.
o Chỉ số chứng khoán Sensex đang có xu hướng tăng liên tiếp. Mức tăng này lớn nhất
trong số các chỉ số chính ở những nước có thị trường chứng khoán trị giá ít nhất 1
nghìn tỷ USD. Trong khi đó, MSCI Emerging Markets Index đã giảm tới 23% trong
năm nay, còn MSCI All-Country World Index mất 18%. Sự trở lại của nhà đầu tư
ngoại đã thúc đẩy đà tăng của TTCK nước này. Chỉ số S&P BSE Sensex tiến sát
mức tăng cao nhất mọi thời đại ở phiên thứ Sáu tuần trước, khi các tài sản rủi ro đều
tăng giá nhờ lạm phát Mỹ hạ nhiệt. Xu hướng đầu tư nhỏ lẻ bùng nổ chưa từng có,
nhu cầu trong nước mạnh mẽ đã giúp Ấn Độ là một trong những thị trường tăng
mạnh nhất thế giới. Ngoài ra, sự ổn định về chính trị cũng là yếu tố giúp Ấn Độ nổi
trội hơn so với các thị trường mới nổi khác. 
o Chỉ số tiêu dùng CPI của Ấn Độ có xu hướng tăng được ghi nhận vào ngày 14/11.
CPI đo lường những thay đổi trong giá cả hàng hóa và dịch vụ từ khía cạnh người
tiêu dùng. Đây là cách thức chính để đo lường sự thay đổi trong xu hướng thu mua
và lạm phát. Tác động lên tiền tệ có thể đi theo hai hướng, CPI tăng có thể dẫn đến
tăng lãi suất và tăng đồng nội tệ, mặt khác, trong kỳ suy thoái, CPI tăng lại có thể
dẫn đến sự suy thoái sâu hơn và do đó đồng nội tệ bị xuống giá.
o Chỉ số đồng USD từ ngày 11 – 15 có xu hướng giảm nhẹ, dấu hiệu cho thấy lạm
phát cơ bản đang hạ nhiệt, điều này có nghĩa là đã đến lúc Cục Dự trữ liên bang Mỹ
(Fed) giảm tốc độ tăng lãi suất.

1.3 Xây dựng mô hình Decision Tree


Dự đoán giá vàng bằng mô hình Decision Tree, đầu tiên nhóm truy cập vào website
https://studio.azureml.net. Sau khi đăng ký thành công và tiến hành đăng nhập, nhóm
thực hiện như sau:
Bước 1: Dựa trên bộ dữ liệu giá vàng từ kaggle với 239 mẫu và 7 biến qua các nút
(New → Dataset → From Local File → “File name” ).

T r a n g 32 | 42
Bước 2: Chọn Experiments để tạo một thí nghiệm mới. Sau đó, chọn Saved
Datasets và bấm vào My Datasets (Dữ liệu của tôi), kéo thả dữ liệu vừa tải lên đã nói ở

T r a n g 33 | 42
trên.

Bước 3: Chọn Filter Based Feature Selection kết nối trực tiếp với dữ liệu vừa kéo
thả vào để dự đoán các cột đã chọn xem cột nào có ảnh hưởng. Tại Feature Information
chọn Multual Information (thông tin lẫn nhau), Selected Columns chọn “Gold_Price”
để đo lường sự ảnh hưởng của các biến.

T r a n g 34 | 42
Dựa vào kết quả nhóm nhận thấy biến có tác động mạnh nhất là: CPI.
Bước 4: Chọn Edit Metadata kết nối với Select Columns in Dataset. Launch column
selector ở bảng Properties bên phải và ở cột này nhóm sẽ chọn Date, Gold_Price,
Crude_Oil, Interest_Rate, USD_INR, Sensex, CPI, USD_index. Chỉnh Categorical to
“Make categorical”.

T r a n g 35 | 42
Bước 5: Thêm Split Data vào mô hình và kết nối kết quả từ Edit Metadata vào Split
Data, tách dữ liệu ngẫu nhiên chọn ra 60% dữ liệu để học, 40% còn lại để chạy thử
nghiệm.

T r a n g 36 | 42
Bước 6: Thêm Train model, Score model, Evaluate model vào mô hình, kết nối
từng mô hình lần lượt là Two-Class Bayes Point và Two-Class Boosted vào Train
model, nối 1 đầu của Train model vào Score model. Kéo Score model vào Evaluate
model để tiến hành đánh giá và bấm Run.

4.3 Triển khai Web service và thử nghiệm


Sau khi thiết lập mô hình hoàn tất bấm Run để chạy mô hình Two-Class Bayes Point.
Sau đó, bấm vào Set up Web Service ở bên dưới và chọn Predictive Web Service

T r a n g 37 | 42
[Recommended] nhóm nhận được giao diện như sau:

Sau khi chạy mô hình xong, bấm vào Deloy Web Service sau đó bấm chọn Test Preview
như hình bên dưới:

Sau đây là mẫu test dự báo của nhóm:

T r a n g 38 | 42
Đầu tiên nhóm nhập vào các giá trị các biến muốn dự báo

T r a n g 39 | 42
T r a n g 40 | 42
CHƯƠNG 5: KẾT LUẬN
5.1 Kết luận nghiên cứu
Dựa trên dữ liệu phân tích các yếu tố ảnh hưởng đến giá vàng, cũng như chạy mô hình
bằng Azure Machine Learning giúp nhóm hiểu rõ hơn những tác động làm cho giá vàng
thay đổi. Những biến động của giá dầu thô, lãi suất (tỷ lệ repo), giá tiền Ấn Độ tính bằng
đô la, Sensex (BSE), tỷ lệ lạm phát và chỉ số đô la Mỹ đều có ảnh hưởng trực tiếp đến
tăng/giảm giá vàng.
Trong bối cảnh hiện tại, khi mà Cục Dự trữ liên bang Mỹ (Fed) liên tiếp nâng lãi suất
nênn về trong ngắn hạn đồng USD sẽ mạnh lên. Đây sẽ là áp lực lớn đối với thị trường
kim loại quý. Tuy nhiên về dài hạn, triển vọng vàng tăng giá vẫn rất cao. Chính vì thế
giá vàng thế giới gần như phụ thuộc hoàn toàn vào giá trị đồng USD. Từ nay đến cuối
năm 2023, việc tăng - giảm giá USD và vàng còn nhiều yếu tố tác động, nhà đầu tư cần
thận trọng và theo sát.
Trong thời gian tới dự báo Mỹ sẽ còn tăng lãi suất USD, giá trị đồng USD có thể sẽ lên
cao nữa. Việc tăng lãi suất này sẽ khiến nền sản xuất của Mỹ gặp khó khăn do  chi phí
vốn cao, chi phí tiêu dùng của người dân cũng lớn. Từ đó kinh tế Mỹ sẽ tăng trưởng
chậm lại, thậm chí trì trệ do đã bơm quá nhiều tiền vào nền kinh tế. Về lâu dài đồng
USD sẽ giảm, khi đó giá vàng sẽ tăng.
Đối với các nhà đầu tư mua trái phiếu, cần quan tâm đến chất lượng tài sản, sức khoẻ tài
chính của doanh nghiệp, đặc biệt là tài sản đảm bảo của  trái phiếu. Ngoài ra, những nhà
đầu tư mới cần nắm được kế hoạch đền bù của doanh nghiệp khi xảy ra hoàn cảnh xấu.
Tại thời điểm này khi giá vàng thế giới phụ thuộc nhiều yếu tố địa chính trị, kinh tế... có
nhiều biến động lớn, nhà đầu tư, doanh nghiệp nên thận trọng và chú ý đến cắt giảm chi
phí để đảm bảo sức khỏe tài chính.
5.2 Hạn chế nghiên cứu
Dữ liệu nhóm sử dụng chỉ là mẫu không đủ lớn và cũ so với biến động của giá vàng. Do
đó có thể mang ý chủ quan của nhóm. Cộng với thời gian nghiên cứu có hạn và kiến
thức còn hạn chế nên nghiên cứu vẫn chưa tìm hiểu sâu vào được hết tất cả các biến
trong dữ liệu.
5.3 Hướng nghiên cứu trong tương lai
Đề tài này là cơ sở để thực hiện các nghiên cứu chuyên sâu về đầu tư vàng, chứng
khoán, dữ trữ dầu thô. Đồng thời giúp biết những tác động qua lại giữa các yếu tố ảnh
hưởng đến giá vàng trong tương lai. Từ đó doanh nghiệp có thể tận dụng để phục vụ cho
đầu tư trước những thay đổi của thị trường.

T r a n g 41 | 42
TÀI LIỆU THAM KHẢO

1. Bouma, J., Wagenet, R. J., Hoosbeek, M. R., Hutson, J. L. (1993). Using expert
systems and simulation modelling for land evaluation at farm level: a case study
from New York State. Soil Use Management, 9(4): 131-139.
2. Han, J., Kamper, M. (2006). Data Mining: Concepts and Techniques, Second
Edition. Morgan Kaufmann Publishers, Elsevier Inc, 772 pages.
3. Nguyễn Trọng Hoài, 2009. Dự báo và phân tích dữ liệu trong kinh tế và tài chính,
giáo trình Trường Đại Học Kinh Tế TPHCM. NXB Thống Kê, trang 339 – 536.
4. Bài viết Nghiên cứu tình huống. Giá vàng: nhân tố ảnh hưởng và dự báo. Chương
trình giảng dạy kinh tế Fullbright – Niên khóa 2007 - 2008.
5. Đặng Thị Tường Vân, 2008. Luận văn thạc sĩ kinh tế “Các giải pháp phát triển kinh
doanh vàng tại Việt Nam”.

T r a n g 42 | 42

You might also like