Professional Documents
Culture Documents
Môn học trang bị trang bị cho sinh viên các kiến thức về khoa học dữ liệu ứng
dụng trong tài chính sử dụng ngôn ngữ lập trình Python và các công cụ trong hệ sinh
1
thái ứng dụng khoa học dữ liệu vào lĩnh vực tài chính. Cụ thể, các sinh viên sẽ được
học lý thuyết và thực hành các cộng cụ về xử lý, thống kê và trực quan hoá dữ liệu như
Matplotlib, Numpy, Numba, Pandas, SciPy, Scikit-Learn, StatsModels, và nhiều công
cụ hiện đại khác được cập nhật liên tục theo sự phát triển công nghệ trong lĩnh vực
khoa học dữ liệu. Sinh viên cũng được học và thực hành với các giải thuật học máy cơ
bản, bao gồm các kiến thức và giải thuật học có giám sát, học không có giám sát ứng
dụng vào phân loại, thu giảm chiều và gom cụm dữ liệu. Hơn nữa, các kỹ thuật tinh
chỉnh tham số và các độ đo hiệu quả của các giải thuật học cũng được giới thiệu cho
sinh viên.
Học xong môn học này, sinh viên có thể vận dụng các kiến thức khoa học dữ
liệu và học máy cơ bản vào phân tích dữ liệu tài chính thuộc nhiều mảng tài chính –
ngân hàng khác nhau, ví dụ như FinTech, quản lý tài sản, tài chính doanh nghiệp, . . .
và sử dụng kiến thức đã học cho các môn học tiếp theo trong chương trình đào tạo.
CO2 Người học vận dụng Thể hiện tính chủ động, tích cực trong
các kiến thức về khoa học tập nghiên cứu và quản lý các
PLO4
học dữ liệu và học nguồn lực cá nhân, đáp ứng yêu cầu
máy đã học một cách học tập suốt đời.
hệ thống để giải quyết Khả năng vận dụng kiến thức nền tảng PLO6
2
các vấn đề chuyên và chuyên sâu một cách hệ thống để
môn trong lĩnh vực tài giải quyết các vấn đề chuyên môn
chính - ngân hàng trong lĩnh vực tài chính.
Khả năng tham gia xây dựng và phát
triển giải pháp ứng dụng trong lĩnh vực PLO7
tài chính ngân hàng
11.2. Chuẩn đầu ra của môn học (CĐR MH) và sự đóng góp vào chuẩn đầu ra của
chương trình đào tạo (CĐR CTĐT)
Mức độ Mục tiêu
theo thang môn học CĐR
CĐR MH Nội dung CĐR MH
đo của CTĐT
CĐR MH
(a) (b) (c) (d) (e)
Ứng dụng Pandas vào xử 3
lý dữ liệu, biến đổi dữ liệu
thô thành dạng có thể sử PLO2,
CO1,CO2
CLO1 dụng thống kê, dự đoán PLO3,
(dự báo), phân loại, thu PLO4
giảm chiều hoặc gom
cụm.
Ứng dụng được các công 3
cụ như Matlibplot PLO2,
CLO2 Seaborn, . . . vào trực PLO3,
CO1, CO2
quan hoá dữ liệu bằng các PLO4
biểu đồ khác nhau.
Ứng dụng được các mô 3
hình thống kê và học máy
sử dụng Statsmodels và CO1, CO2 PLO2,
sciKit-learn vào phân tích
CLO3 PLO3,
dữ liệu; PCA, t-SNE,
PLO4
UMAP, k-means vào thu
giảm chiều dữ liệu và gom
cụm dữ liệu.
CLO4 Ứng dụng các kiến thức 3 PLO4,
3
về khoa học dữ liệu và CO1, CO2
học máy vào mô hình hoá
PLO6
các bài toán tài chính thực
tế.
Xây dựng các giải pháp 4
trực quan hoá, phân loại, PLO3,
CLO5 dự báo, gom cụm dữ liệu CO1, CO2 PLO6,
ứng dụng trong lĩnh vực PLO7
tài chính ngân hàng.
Mã CĐR CTĐT
PLO2 PLO3 PLO4 PLO6 PLO7
Mã CĐR MH
CLO1 3 3 3
CLO2 3 3 3
CLO3 3 3 3
CLO4 3 3
CLO5 4 4 4
Triết lí đào tạo “Lấy người học làm trung tâm” được áp dụng. Do đó chiến
lược tương tác được vận dụng; theo đó, hoạt động giảng dạy của giảng viên luôn
định hướng vào: khuyến khích sinh viên quan tâm khoa học dữ liệu; thúc đẩy
việc thu nhận kiến thức, hình thành các khuôn mẫu ứng xử. Môi trường giảng
dạy hướng đến việc động viên kịp thời, tạo động lực tích cực, khuyến khích tinh
thần cá nhân và thảo luận cởi mở. Kết quả học tập mong đợi dự kiến đạt được
thông qua phương pháp giảng dạy theo định hướng kết hợp lý thuyết, thực hành,
bài tập nhóm và bài tập cá nhân.
Phương pháp giảng dạy tích cực được thực hiện. Giảng viên chủ yếu đóng vai
trò là người truyền bá tri thức khoa học, tổ chức, cố vấn, hỗ trợ người học khám phá,
làm chủ tri thức, phát triển khả năng giải quyết vấn đề liên quan đến toán kinh tế.
Giảng viên giải thích, phân tích các khái niệm, định lí, bản chất khoa học của toán kinh
tế; trả lời các câu hỏi của sinh viên; nêu các vấn đề để sinh viên tự học, tự nghiên cứu,
4
khám phá và làm chủ tri thức liên quan. Giảng viên áp dụng phương pháp giảng dạy
theo nhóm: tổ chức hình thức học tập theo nhóm (hình thức học tập hợp tác) để tăng
cường phối hợp học tập cá thể với học tập hợp tác nhằm giúp sinh viên thực hiện và
nâng cao năng lực tranh luận, thảo luận về tri thức khoa học, củng cố năng lực làm
việc nhóm, tạo cơ hội trải nghiệm. Bên cạnh đó, giảng viên cũng có thể áp dụng
phương pháp giảng dạy học phát hiện và giải quyết vấn đề nhằm phát triển năng lực tư
duy, khả năng nhận biết và giải quyết vấn đề liên quan đến toán kinh tế.
Sinh viên cần phát huy tính tích cực, tự giác, chủ động trong quá trình học tập tại
giảng đường và ở nhà nhằm nắm vững các tri thức căn bản, hình thành và phát triển
năng lực tự học (sử dụng giáo trình, tài liệu tham khảo; lắng nghe, ghi chép, tìm kiếm
thông tin, thảo luận, hỏi đáp...), trên cơ sở đó trau dồi các phẩm chất linh hoạt, độc lập,
sáng tạo, độc đáo trong tư duy, chiếm lĩnh và làm chủ tri thức liên quan đến toán kinh
tế. Sinh viên cần bố trí thời gian tự học ở nhà hợp lý để chuẩn bị bài học, tự nghiên
cứu sâu để khám phá và làm chủ tri thức về toán kinh tế. Sinh viên cần có kỹ năng làm
việc nhóm, phát huy tinh thần tương trợ, có thái độ nghiêm túc, trách nhiệm cao để
tham gia các hoạt động nhằm hoàn thành các nhiệm vụ của nhóm học tập.
Quy định về hình thức giảng dạy: Giảng viên có thể chủ động lựa chọn hình thức
giảng dạy là trực tuyến (online) kết hợp trực tiếp (offline), đảm bảo tổng thời gian
giảng dạy trực tuyến không vượt quá 30% thời gian giảng dạy của cả môn học.
13. Yêu cầu môn học
- Sinh viên chỉ được đánh giá đạt học phần khi: (1) có điểm quá trình, (2) có
điểm thi kết thúc học phần (trường hợp sinh viên nhận điểm 0 do vắng thi không được
ghi nhận là có điểm thi), (3) có tổng điểm học phần từ 4 trở lên.
- Tùy số lượng sinh viên mà giảng viên quyết định số lượng thành viên các
nhóm học tập.
- Sinh viên tham dự lớp học phần phải tuân thủ quy tắc ứng xử của Nhà
Trường; sinh viên phải đến lớp đúng giờ, đảm bảo thời gian học trên lớp, có thái độ
nghiêm túc và chủ động, tích cực trong học tập, nghiên cứu.
- Sinh viên phải có ý thức chuẩn bị giáo trình, học liệu, máy tính cá nhân (khi
cần thiết) để phục vụ quá trình học tập.
14. Học liệu của môn học
14.1. Giáo trình
5
[1] VanderPlas, J. (2016). Python data science handbook: Essential tools for
working with data. O'Reilly Media, Inc.
14.2. Tài liệu tham khảo
[2]. McKinney, W. (2017). Python for data analysis: Data wrangling with
Pandas, NumPy, and Ipython (second edition). O'Reilly Media, Inc.
[3] De Prado, M.L. (2018). Advances in financial machine learning. John Wiley
& Sons.
B. PHƯƠNG THỨC ĐÁNH GIÁ MÔN HỌC
1. Các thành phần đánh giá môn học
Thành phần đánh
Phương thức đánh giá Các CĐR MH Trọng số
giá
A.1.1. Chuyên cần 10%
CLO1, CLO2,
A.2. Đánh giá cuối kỳ A.2.1. Thi cuối kỳ 50%
CLO3, CLO4
Thang điểm
Trọng
Tiêu chí đánh giá Từ 0 Từ 4,0 Từ 5,5 Từ 7,0 Từ 8,5
số
đến 3,9 đến 5,4 đến 6,9 đến 8,4 đến 10
Hiện Hiện
Hiện Hiện Hiện
Tần suất hiện diện của diện diện
diện diện diện
sinh viên giảng giảng
giảng giảng giảng
đường đường
40% đường đường đường
dưới trên 60%
trên 50% trên 70% trên 80%
40% số số buổi
số buổi số buổi số buổi
buổi học
học học học
học
Sự tham gia vào quá 60% không tham gia tham gia chủ chủ động
trình học tập tại giảng tham thụ động chủ động động tham gia
đường gia vào vào quá vào quá tham gia rất tích
quá trình trình tích cực cực vào
trình thảo thảo luận vào quá quá trình
thảo luận về về nội trình thảo luận
luận về nội dung dung bài thảo về nội
nội bài học học luận về dung bài
dung trong trong nội dung học trong
8
bài học suốt học bài học
trong suốt học phần trong suốt thời
suốt học phần suốt học học phần
phần phần
Thang điểm
Trọng
Tiêu chí đánh giá Từ 0 đến Từ 4,0 Từ 5,5 Từ 7,0 Từ 8,5
số
3,9 đến 5,4 đến 6,9 đến 8,4 đến 10
Chương
Chương Chương Chương
Có nộp trình
trình trình trình chạy
Lập trình chương trình kết quả chạy
100% chạy chạy đúng tất
không báo lỗi làm bài đúng 2/3
không có đúng 1/3 cả test
tập số test
lỗi số test case
case
Thang điểm
Trọng
Tiêu chí đánh giá Từ 0 Từ 4,0 Từ 5,5 Từ 7,0 Từ 8,5
số
đến 3,9 đến 5,4 đến 6,9 đến 8,4 đến 10
Lập luận
Lập luận Có lời
dẫn ra lời
Có lập dẫn ra lời giải
giải
luận để giải vận hoàn
tương đối
dẫn ra lời dụng kiến chỉnh
thuyết
Có nộp giải thức môn hoặc
phục
kết quả Hoặc học chương
Kết quả của bài tập 100% Hoặc
làm bài chương Hoặc trình
tập chương chạy
trình chương
trình đúng
chạy trình chạy
chạy với tất
không có đúng 1/3
đúng 2/3 cả các
lỗi số test
số test test case
case
case
9
Bài tập lớn:
Thang điểm
Tiêu chí đánh giá Trọng số Từ 0 Từ 4,0 Từ 5,5 Từ 7,0 Từ 8,5
đến 3,9 đến 5,4 đến 6,9 đến 8,4 đến 10
Chươn
Chương
Chương Chương g trình
Có nộp trình
trình trình chạy chạy
kết quả chạy
Phần lập trình 50% chạy đúng 2/3 đúng
làm bài đúng
không có số test tất cả
tập 1/3 số
lỗi case test
test
case
Trình
Sử
bày lý
Có sử Sử dụng dụng
luận
Không dụng đúng lý chính
khoa
sử dụng nhưng luận khoa xác, rất
học liên
Cơ sở lý luận của báo lý luận chưa học liên thuyết
20% quan,
cáo khoa đúng lý quan, có phục về
nhưng
học liên luận sức lý luận
chưa đủ
quan khoa học thuyết khoa
sức
liên quan phục học liên
thuyết
quan
phục
Hành Hành
Hành văn lủng văn
văn tối củng lủng
Hành
nghĩa ở khiến củng Hành văn
văn rõ
các cho nhưng tốt, đôi
Văn phong khoa học 10% ràng,
phần người người khi có lỗi
mạch
nội đọc khó đọc vẫn diễn đạt
lạc
dung có thể có thể
chính hiểu nội hiểu nội
dung dung
Hình thức của báo cáo 10% Không Có lỗi: Có lỗi: Có lỗi: Định
định không Không thiếu dạng
dạng căn lề, định đánh số đúng
theo bất không dạng trang; tất cả
10
toàn
thống văn
thiếu bìa
nhất định bản,
hoặc trình các tiêu
cứ tiêu dạng không
bày bìa chí yêu
chí nào đoạn thống
sai quy cầu
văn, sai nhất
định
khổ giấy font
chữ
A.2. Thi cuối kì: Đánh giá tương tự như phần A.1.3 (Bài tập lớn)
11
C. NỘI DUNG CHI TIẾT GIẢNG DẠY
Thời
Phương pháp đánh
lượng Nội dung giảng dạy chi tiết CĐR MH Hoạt động dạy và học Học liệu
giá
(tiết)
10 CHƯƠNG 1. XỬ LÝ DỮ LIỆU VỚI CLO1, Trực tiếp (offline) hay trực A.1.1 Chương 3 [1],
PANDAS CLO4, truyến (online) Chương 5 [2]
A.1.2
1.1. Giới thiệu CLO5 GIẢNG VIÊN: A.1.3
1.2. Cấu trúc dữ liệu trong pandas
- Giới thiệu môn học (chú ý: A.2.1
1.3. Dữ liệu chuỗi
giáo trình, công bố lịch kiểm
1.4. Làm việc với khung dữ liệu tra giữa kỳ, giao đề tài bài
1.5. Các hàm cơ bản trong pandas tiểu luận nhóm).
1.6. Thống kê dùng pandas - Giảng bài, vấn đáp về các
1.7. Xử lý dữ liệu khuyết khái niệm cơ bản.
1.8. Đánh chỉ mục - Tổ chức thảo luận nhóm về
1.9. Thao tác dữ liệu “xử lý dữ liệu cho các trường
1.10. Trộn và gọp dữ liệu hợp dữ liệu thu thập không
1.11. Làm sạch và chuyển đổi dữ liệu đầy đủ”.
1.12. Thu gom và nhóm dữ liệu - Giao sinh viên chuẩn bị bài
Chương 2.
1.13. Một số tác vụ trong pandas
- Giao bài tập về nhà
1.14. Tổng kết
SINH VIÊN:
- Nghe giảng, tham gia thảo
luận, phát biếu ý kiến xây
12
dựng bài.
- Trả lời câu hỏi của giảng
viên.
10 CHƯƠNG 2. TRỰC QUAN HOÁ DỮ CLO2, Trực tiếp (offline) hay trực A.1.1 Chương 4 [1],
LIỆU CLO4, truyến (online) Chương 9 [2]
A.1.2
2.1. Giới thiệu matplotlib CLO5 GIẢNG VIÊN: A.1.3
2.2. Vẽ biểu đồ với matplotlib (line, curve, - Kiểm tra bài cũ.
bar, scatter, pie, histogram, boxplot, …)
A.2.1
- Giảng bài mới.
2.3. Trực quan hoá dùng seaborn - Tổ chức thảo luận toàn thể
2.4. Trực quan hoá dùng các hàm trong lớp về ý nghĩa của các biểu
pandas đồ.
2.5 Trực quan hoá với plotly và một số - Giao sinh viên chuẩn bị bài
công cụ khác Chương 3.
2.6. Vẽ biểu đồ địa lý - Giải đáp các câu hỏi của sinh
viên.
2.7 Tổng kết
- Hướng dẫn sinh viên tự học,
tự nghiên cứu (mục 2.2.4).
- Giao bài tập về nhà và bài tập
lớn
- Hướng dẫn làm bài tập lớn
SINH VIÊN:
- Nghe giảng, tham gia thảo
luận, phát biếu ý kiến xây
13
dựng bài.
- Trả lời câu hỏi của giảng
viên.
- Dặn dò sinh viên chuẩn bị
kiểm tra giữa kỳ
20 CHƯƠNG 3. HỌC MÁY CƠ BẢN CLO3, Trực tiếp (offline) hay trực A.1.1 Chương 5 [1], [3]
3.1. Giới thiệu học máy CLO4, truyến (online) A.1.3
CLO5
3.2. Mô hình tuyến tính GIẢNG VIÊN: A.2.1
3.2.1 Hồi qui tuyến tính - Kiểm tra bài cũ;
- Giảng bài mới,
3.2.2. Giải thuật học giảm độ dốc (gradient
- Tổ chức thảo luận về các khái
descent)
niệm Hàm nhiều biến, đạo
3.2.3. Hồi qui logistic
hàm riêng, tối ưu không ràng
3.3. Quá khớp (overfitting) buộc, tối ưu có ràng buộc.
3.4. Chỉnh hoá - Giao sinh viên chuẩn bị bài
3.5. Học cây quyết định Chương 4.
- Nhận xét kết quả làm bài tập
3.6. Học nhóm (bagging và boosting)
về nàh
3.7. Máy véc-tơ hỗ trợ - Hương dẫn làm bài tập lớn
3.8. K-láng giềng gần SINH VIÊN:
3.9.Gom cụm dữ liệu - Nghe giảng, tham gia thảo
3.10. Thu giảm chiều dữ liệu luận, phát biếu ý kiến xây
dựng bài.
- Trả lời câu hỏi của giảng
14
viên.
- Thực hiện/tham gia buổi báo
cáo bài tiểu luận nhóm;
hỏi/đáp các vấn đề cần giảng
viên/nhóm báo cáo giải đáp.
- Chuẩn bị các nội dung về học
phần cần được giải đáp ở
buổi cuối.
20 CHƯƠNG 4. XỬ LÝ DỮ LIỆU CHUỖI CLO1, Trực tiếp (offline) hay trực A.1.1 Chương 11 [2],
THỜI GIAN
CLO2, truyến (online) A.1.3 [3]
4.1. Giới thiệu (dữ liệu) chuỗi thời gian
CLO3, GIẢNG VIÊN: A.2.1
4.2. Trực quan hoá chuỗi thời gian
CLO4, - Kiểm tra bài cũ.
4.3. Xử lí dữ liệu từ tập tin
CLO5, - Giảng bài mới.
4.4. Tiền xử lý chuỗi thời gian - Hướng dẫn sinh viên ôn tập.
4.5. Tạo đối tượng dữ liệu chuỗi thời gian - Thông báo một phần điểm
với Python quá trình
4.6. Dự đoán dựa trên dự liệu tài chính - Hướng dẫn làm bài tập lớn
dùng các mô hình học học máy SINH VIÊN:
4.6.1. k-NN - Nghe giảng, tham gia thảo
4.6.2. ARIMA luận, phát biếu ý kiến xây
dựng bài.
4.6.3. Xgboost
- Trả lời câu hỏi của giảng
4.6.4. Các mô hình học khác
viên.
- Xem điểm, đề nghị điều
chỉnh sai sót (nếu có) và xác
15
nhận điểm.
- Trao đổi với giảng viên, cả
lớp về các nội dung trong học
phần còn cần được giải đáp.
Môn học được giảng dạy trực tuyến tối đa không quá 30% tổng thời lượng chương trình.
16
TRƯỞNG BỘ MÔN NGƯỜI BIÊN SOẠN
HIỆU TRƯỞNG
17