Professional Documents
Culture Documents
NHÓM 11
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ KHOA HỌC DỮ LIỆU
Commerce: lựa chọn khách hàng mục tiêu, giới thiệu sản phẩm, phân
1
tích từ đánh giá,…
2 Sản xuất: dự báo rủi ro, điều phối hệ thống, các đơn vị tự động hóa,
quy trình được định sẵn, báo lỗi,…
3 Ngân hàng: Fraud detection, thẩm định cho vay, vòng đời khách hàng,…
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ KHOA HỌC DỮ LIỆU
Ứng dụng:
Y tế: phân tích hình ảnh y khoa, điều chế thuốc, di truyền học, trợ lý sức
4
khỏe,…
Giao thông vận tải: lái xe an toàn, trải nghiệm lái xe nâng cấp, hệ
5
thống vận hành xe, an toàn giao thông,…
Tài chính: phân khúc khách hàng, quyết định chiến lược, thương mại
6
thuật toán, phân tích rủi ro,…
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
GIỚI THIỆU ĐỀ TÀI
Lý do chọn đề tài: TTCK có tác động mạnh mẽ đến nền kinh tế thị trường, đặc biệt
đối với 3 chủ thể: chính phủ, doanh nghiệp và nhà đầu tư.
Đối với chính phủ: TTCK Đối với các doanh Đối với nhà đầu tư: TTCK
có vai trò quan trọng trong
nghiệp: TTCK là một giải cung cấp cho các nhà đầu tư
việc huy động và sử dụng một nguồn đầu tư đa dạng và
pháp huy động nguồn
nguồn vốn hiệu quả. Thúc tối thiểu hóa các rủi ro trong
vốn kinh doanh hiệu quả
đẩy quá trình cổ phần hoá đầu tư => giúp NĐT tìm
thông qua việc bán trái
đối với các doanh nghiệp được doanh nghiệp phù hợp
phiếu hoặc cổ phiếu cho
quốc doanh. để góp vốn đầu tư.
các nhà đầu tư.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
MỤC TIÊU CỦA ĐỀ TÀI
Tìm ra sự tương quan giữa các nhóm cổ phiếu của ngành Thép và
VLXD với nhau, giúp đánh giá được mức độ mạnh yếu hay việc dự báo
giá trong tương lai, nhằm mục đích giúp các nhà đầu tư có thể xây
dựng cho mình danh mục một cách hiệu quả nhất.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
MẪU DỮ LIỆU PHÂN TÍCH
STT Ngành Thép Ngành Vật liệu xây dựng
1 HPG VCS
2 HSG VGC
3 NKG HT1
4 POM DHA
5 VGS CLH
6 TLH VIT
7 HMC ACE
8 VCA BCC
9 KKC BTS
10 SMC ACC
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ
KINH TẾ VĨ MÔ VÀ
TỔNG QUAN NGÀNH
Thế giới
❑ Giai đoạn 3 (2019-2020): Trong bối cảnh dịch COVID –19 bùng nổ và
lan rộng toàn cầu khiến bức tranh kinh tế năm 2020 vô cùng thảm
khốc và u ám.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ NỀN KINH TẾ VĨ MÔ GIAI ĐOẠN 2016 - 2020
Việt Nam
❑ Năm 2016-2019 Theo NHTG, Việt Nam nằm trong top 10 quốc gia tăng trưởng cao nhất
( GDP 6,8%)
❑ Năm 2020 Việt Nam là một trong số ít quốc gia đạt mức tăng trưởng GDP dương (2,91%)
❑ The Economist đã xếp Việt Nam trong top 16 nền kinh tế mới nổi thành công nhất thế
giới.
❑ Nhập khẩu được cải thiện, chuyển từ thâm hụt sang thặng dư, tổng kim ngạch xuất khẩu
tăng 1,7 lần, năm 2020 kim ngạch xuất nhập khẩu vẫn đạt 527 tỷ USD (190% GDP)
❑ Năng lực cạnh tranh toàn cầu của ngành công nghiệp tăng từ vị trí 58 năm 2015 lên thứ
42 vào năm 2019
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ NGÀNH THÉP
❑ Đặc điểm ngành thép: được xây dựng từ năm 1963, ngành công nghiệp chủ đạo nền kinh tế, yếu
tố quan trọng trong ngành xây dựng.
❑ Tình hình chung ngành thép tại Việt Nam:
⮚ Sản lượng phôi thép liên tục tăng năm 2016 đạt 7,8 triệu tấn và năm 2020 đạt 19,9 triệu.
⮚ Chỉ đáp ứng nhu cầu xây dựng, còn thép trong lĩnh vực chế tạo, chế biến, cơ khí, công nghiệp hỗ trợ
vẫn chưa đáp ứng được.
⮚ Giai đoạn 2016 – 2020, kim ngạch xuất khẩu sản phẩm từ sắt thép của Việt Nam có sự bứt phá mạnh.
⮚ Xuất khẩu sản phẩm từ sắt thép của Việt Nam sang hầu hết các thị trường chính ghi nhận mức tăng
trưởng cao, chủ yếu là xuất sang Mỹ
⮚ Từ 2016-2020, tỷ trọng xuất khẩu mặt hàng sang tăng lên 20,41%; Nhật Bản tăng 15,82%; Hàn Quốc
tăng 5,07%; Đức tăng 4,30% năm 2020.
⮚ Ngành thép luôn đối mặt từ nhiều áp lực cạnh tranh.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
TỔNG QUAN VỀ NGÀNH XÂY DỰNG
❑ Đặc điểm ngành: là ngành thâm dụng vốn, phụ thuộc lớn vào nền kinh tế, có mối quan hệ mật thiết với ngành bất
động sản.
❑ Tình hình chung ngành VLXD:
⮚ Ngành VLXD luôn phát triển tại Việt Nam trong những năm gần đây.
⮚ Sự cải tiến công nghệ và nhu cầu chất lượng cuộc sống tăng cao nên con người càng quan tâm đến vấn đề đến vấn
đề sức khỏe, mẫu mã phải phải đa dạng, cải tiến mới, chất lượng.
⮚ Những năm gần đây thì hầu như ngành đã đáp ứng được các như cầu của thị trường.
⮚ Dự báo ngành sẽ tăng trưởng vượt bậc trên 10%/ năm.
⮚ Hầu hết các sản phẩm vật liệu xây dựng trong nước đang gặp khó khăn trước sức ép cạnh tranh gay gắt với các sản
phẩm nhập khẩu.
⮚ Thị trường xuất khẩu gốm sứ xây dựng đã mở rộng ra nhiều nước trên thế giới từ khu vực ASEAN đến Hàn Quốc,
Đức, Ý, Mỹ, Nga, Cuba, Nhật và nhiều vùng lãnh thổ khác. Tổng sản lượng xi măng Việt Nam đã đứng hàng thứ 3
trên thế giới.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
PHƯƠNG PHÁP NGHIÊN CỨU
VÀ KẾT QUẢ NGHIÊN CỨU
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Tương tác giữa 10 cổ phiếu ngành Vật liệu xây dựng:
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Tương tác giữa 10 cổ phiếu ngành Thép:
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Tương tác giữa 5 cổ phiếu ngành Thép và 5 cổ phiếu ngành Xây dựng
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Kết quả trên thể hiện hệ số tương quan của mô hình, nếu hệ số Pearson (Pearson correlation coefficient,
r) càng gần 1 hay -1 thì tương quan sẽ càng mạnh. Hệ số được xem là có ý nghĩa khi giá trị p ≤ 0,05.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Kết quả nghiên cứu thu được:
Các ngành có sự tương tác lẫn nhau giữa các cổ phiếu trong ngành và các cổ phiếu của ngành khác.
Ngành Thép có sự tương tác khá cao giữa các cổ phiếu (10/14 cặp chiếm tỷ lệ 71,43%)
Tương tác giữa 2 ngành Thép - Vật liệu xây dựng có 3 cặp (3/14, chiếm tỷ lệ 21,43%).
Có thể kết luận rằng có sự tương tác giữa các cổ phiếu cùng ngày và khác ngành trong điều kiện khảo
sát 5 năm.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Tổng quan đề tài Cơ sở lý thuyết và Kết quả nghiên cứu Kết luận & Kiến nghị
mô hình nghiên cứu
ỨNG DỤNG TƯƠNG QUAN PEARSON
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Orange là một công cụ khá trực quan để nghiên cứu về các thuật toán
machine learning và thực hành data mining. Thuật toán phân lớp giúp thực
1 hiện việc xác định giá cổ phiếu theo Tốt, Trung bình, Yếu, nhằm mục đích
giúp nhà đầu tư lựa chọn các cổ phiếu có sức mạnh tài chính tốt
Phân tích sử dụng các chỉ số tài chính như ROA, ROE, tỉ số thanh toán nhanh,
2
vòng quay vốn chủ sở hữu, Tổng nợ,… của 10 cổ phiếu cần phân tích
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Các bước thực hiện nghiên cứu:
Bước 1: Chọn 10 cổ phiếu cần nghiên cứu, và 6 mã cổ phiếu để training máy
Bước 2: Xây dựng mô hình bằng Orange mục đích là cho máy học các chỉ số của các
mã chứng khoán ở 3 loại.
Bước 3: Đánh giá kết quả bằng test and score và confusion matrix để tìm mô hình phù
hợp
Bước 4: Sau khi máy tính đã học được những đặc điểm trên của các cổ phiếu. Tiến
hành dùng chỉ số của máy trong Quý 2/2021 để phân lớp các cổ phiếu.
Bước 5: Đánh giá bằng cách so sánh với thực tế
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Các bước thực hiện nghiên cứu:
Bước 1: Chọn 10 cổ phiếu cần nghiên cứu, và 6 mã cổ phiếu để training máy
Bước 2: Xây dựng mô hình bằng Orange mục đích là cho máy học các chỉ số của các
mã chứng khoán ở 3 loại.
Bước 3: Đánh giá kết quả bằng test and score và confusion matrix để tìm mô hình phù
hợp
Bước 4: Sau khi máy tính đã học được những đặc điểm trên của các cổ phiếu. Tiến
hành dùng chỉ số của máy trong Quý 2/2021 để phân lớp các cổ phiếu.
Bước 5: Đánh giá bằng cách so sánh với thực tế
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Chọn 6 cổ phiếu ngành Thép để training
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Xây dựng một workflow
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Đánh giá bằng Test and Score và confusion matrix
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Dùng chỉ số của cổ phiếu quý 2/2021 để phân lớp cổ phiếu nên đầu tư 2021
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
So sánh với thực tế
MÃ CK ROA ROE Hệ số khả năng Vòng quay vốn Tỷ số Loại
thanh toán nhanh chủ sở hữu tổng nợ
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Với độ chính xác là 9/10, SVM cũng coi như là một phương pháp có thể dùng để dự báo các
mã cổ phiếu tốt nên mua trong năm 2021.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Chọn 6 cổ phiếu ngành VLXD để training
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Xây dựng một workflow
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Đánh giá bằng Test and Score và confusion matrix
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Dùng chỉ số của cổ phiếu quý 2/2021 để phân lớp cổ phiếu nên đầu tư 2021
Tổng quan đề tài Cơ sở lý thuyết và Kết quả nghiên cứu Kết luận & Kiến nghị
mô hình nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
So sánh với thực tế
MÃ CK ROA ROE Hệ số khả năng Vòng quay vốn Tỷ số tổng Loại
thanh toán nhanh chủ sở hữu nợ
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
ỨNG DỤNG PHÂN LỚP ORANGE
Với độ chính xác là 10/10, SVM cũng coi như là một phương pháp có thể dùng để dự báo các
mã cổ phiếu tốt nên mua trong năm 2021.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
LTSM
1 Định nghĩa : Mạng bộ nhớ dài-ngắn (Long Short Term
Memory networks), thường được gọi là LSTM -là một dạng
đặc biệt của RNN, nó có khả năng học được các phụ thuộc
xa, được giới thiệu bởi Hochreiter & Schmidhuber (1997)
2 Cấu tạo LTSM:
Cổng quên: quyết định xem thông tin cũ nào được giữ lại.
Cổng đầu vào:quyết định thông tin mới nào được sử dụng
Cổng kết quả : quyết định xem ta muốn đầu ra là gì
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
KẾT QUẢ THU ĐƯỢC
Dự báo giá cổ phiếu trong 365 ngày gần nhất dựa trên dữ liệu quá khứ
với giá trị dự báo gần như gần sát với giá trị thực tế
DEMO TRÊN
PYTHON
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
KẾT QUẢ THU ĐƯỢC
DEMO TRÊN
PYTHON
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
KẾT LUẬN VÀ
KIẾN NGHỊ
Kết luận
Kiến nghị
KẾT LUẬN
Sau quá trình nghiên cứu bằng 3 phương pháp, nhóm đã thực hiện và đạt một số kết quả như sau
Đã xác định được sự tác động lẫn nhau giữa các cổ phiếu trong cùng ngành khác ngành, xác
định được cổ phiều nào tác động lên cổ phiếu nào. Tính ra được hệ số tương quan và so sánh
với thực tế tăng trưởng của các cổ phiếu
Xác định được tính mạnh yếu của cổ phiếu qua việc phân lớp trên Orange, nhằm xác định đúng
sức mạnh tài chính của cổ phiếu. Tăng tính chính xác cho quyết định đầu tư dài hạn
Từ những kết quả trên, áp dụng Python vào mô hình để dự báo được giá cổ phiếu trong tương
lai, xác định giá và so sánh với thực tế
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
KẾT LUẬN
Sau quá trình nghiên cứu bằng 3 phương pháp, nhóm đã thực hiện và đạt một số kết quả như sau
Đã xác định được sự tác động lẫn nhau giữa các cổ phiếu trong cùng ngành khác ngành, xác
định được cổ phiều nào tác động lên cổ phiếu nào. Tính ra được hệ số tương quan và so sánh
với thực tế tăng trưởng của các cổ phiếu
Xác định được tính mạnh yếu của cổ phiếu qua việc phân lớp trên Orange, nhằm xác định đúng
sức mạnh tài chính của cổ phiếu. Tăng tính chính xác cho quyết định đầu tư dài hạn
Từ những kết quả trên, áp dụng Python vào mô hình để dự báo được giá cổ phiếu trong tương
lai, xác định giá và so sánh với thực tế
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
KIẾN NGHỊ
Sử dụng phương pháp tương quan để xác định các cổ phiếu có cùng hướng tăng trưởng,
để phân bổ vốn đầu tư hợp lý, có thể đầu tư song song các cổ phiếu để giảm rủi ro, tăng
lợi nhuận của nhà đầu tư.
Sử dụng phương pháp phân lớp Orange để xác định cổ phiếu mạnh yếu, xác định sức
mạnh tài chính để có hướng đầu tư hợp lý, đầu tư vào các công ty mạnh, mức tăng
trưởng tốt.
Sử dụng phương pháp dự báo giá Python để dự báo được các cổ phiếu có sức tăng
trưởng lớn, từ đó lựa chọn các cổ hiếu đó để đầu tư.
Mục đích của các phương pháp là tăng hiệu quả trong đầu tư chứng khoán, giúp nhà đầu
tư đối ưu hóa lợi nhuận của mình.
Giới thiệu & Tổng quan KTVM & Phương pháp nghiên cứu & Kết luận & Kiến nghị
Tổng quan đề tài Tổng quan ngành Kết quả nghiên cứu
Cảm ơn thầy và
các bạn đã chú ý
lắng nghe!
NH02 Slide No.27