You are on page 1of 7

ĐẠI HỌC UEH

TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ


KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH
BỘ MÔN CÔNG NGHỆ THÔNG TIN

ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ


Đề tài: ÁP DỤNG MÔ HÌNH MÁY HỌC DỰ ĐOÁN
KHÁCH HÀNG TRUNG THÀNH RỜI NGÂN HÀNG

GVHD: TS.GVC Nguyễn Quốc Hùng

Học viên thực hiện:


NGUYỄN QUANG TRƯỜNG

TP. Hồ Chí Minh, Tháng 07/2022

Lời mở đầu.
1. Tính cấp thiết của đề tài
Khách hàng là tài sản quý giá nhất của một tổ chức, do đó việc giữ chân khách
hàng dường như là một yêu cầu cơ bản, thiết yếu và có tầm quan trọng đối với bất
kỳ một tổ chức nào.
Các ngân hàng cũng không nằm ngoài quy luật này. Môi trường cạnh tranh
của các dịch vụ ngân hàng điện từ được cung cấp bởi các ngân hàng khác nhau làm
tăng sự cần thiết của việc giữ chân khách hàng, trong khi cố gắng tăng thị phần của
mình vào việc thu hút khách hàng mới. Điều đó cho thấy rằng việc cải thiện tỷ lệ
giữ chân lên 5% có thể làm tăng lợi nhuận của ngân hàng lên đến 85% (Theo
nghiên cứu của Nie và công sự, năm 2011).
Ngoài ra việc thu hút khách hàng mới sẽ khiến công ty mất thêm chi phí thay
vì giữ chân những khách hàng cũ, những người có khả năng tạo ra nhiều lợi nhuận
hơn. (Theo nghiên cứu của Verbeke và cộng sự, năm 2011).
Theo Accenture, hàng năm tỷ lệ khách hàng rời bỏ doanh nghiệp trong ngành
ngân hàng vào khoảng 20-25% trong năm đầu tiên, một nửa trong số đó không
vượt quá 90 ngày đầu sau khi mở tài khoản. Và theo Ernst&Young, hơn một nửa số
khách hàng đã mở hoặc đóng ít nhất một sản phẩm ngân hàng trong năm qua và
gần như nhiều hơn 40% dự định làm như vậy trong năm tới. Mỗi khách hàng này
đại diện cho một cơ hội kinh doanh mới cho một ngân hàng cạnh tranh hoặc tổ
chức tín dụng.
Khách hàng rời bỏ doanh nghiệp (Customer Churn) xảy ra khi khách hàng
không tiếp tục sử dụng những sản phẩm hay dịch vụ mà doanh nghiệp cung cấp.
Trong lĩnh vực tài chính – ngân hàng, khách hàng được xem là Customer Churn khi
khách hàng không thực hiện giao dịch trong một khoảng thời gian nhất định và số
dư tài khoản hiện tại của khách hàng thấp hơn ngưỡng số dư tối thiểu hoặc tài
khoản ngân hàng của khách hàng đã được đóng. Thực tế, tại các ngân hàng Việt
Nam, khách hàng rời bỏ được xác định khi số lượng giao dịch của khách hàng
trong một năm là không và số dư tài khoản thanh toán của khách hàng thấp hơn
ngưỡng 50.000 VNĐ hoặc tài khoản đã được đóng.
Khi khách hàng rời bỏ sẽ ảnh hưởng trực tiếp tới doanh thu và lợi nhuận của
doanh nghiệp. Mặt khác, chi phí để duy trì một khách hàng hiện hữu thấp hơn
nhiều so với chi phí tìm kiếm một khách hàng mới (theo Buckinx & Van den Poel
(2005) và Coussement and Van den Poel (2008)). Vậy nên, hiểu rõ và giữ chân
khách hàng là việc quan trọng luôn được các doanh nghiệp quan tâm.
Hiện nay, phân tích và dự đoán tỷ lệ khách hàng rời bỏ doanh nghiệp được
2
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
rất nhiều nhà nghiên cứu quan tâm và được xử lý thông qua các mô hình như:
Random Forest, Logistic regression, Decision Tree…Nhưng trong mỗi mô hình
được sử dụng này đều có các lỗ hổng như Random Forest rất dễ bị ngưng hoạt
động nếu vượt quá hạn mức (overfitting), Mô hình Decision Tree phụ thuộc rất lớn
vào dữ liệu của bạn, với một sự thay đổi nhỏ trong bộ dữ liệu, cấu trúc mô hình
Decision Tree có thể thay đổi hoàn toàn, Logistic Regression là nó yêu cầu các
điểm dữ liệu được tạo ra một cách độc lập với nhau,… . Ngân hàng cũng như các
công ty tài chính luôn có một nguồn dữ liệu khách hàng rất lớn dẫn đến việc phải
có một mô hình có thể đáp ứng hoạt động được trên nguồn dữ liệu lớn này.
2. Mục tiêu nghiên cứu
− Xác định khách hàng các lý do ảnh hưởng tới quyết định rời bỏ của khách
hàng để lên phương án giảm tỷ lệ khách hàng rời bỏ.
− Ước lượng giá trị khách hàng có thể đem lại giá trị để phân bổ nguồn lực
phù hợp.
− Đưa ra các chiến lược marketing phù hợp cho từng khách hàng.

3. Đối tượng nghiên cứu


− Khách hàng đang là đã và đang có quan hệ với doanh nghiệp.
− Các công cụ triển khai xây dựng mô hình khách hàng trung thành rời bỏ
4. Phương pháp nghiên cứu
− Nghiên cứu tổng quan, lý thuyết: Dựa trên việc nghiên cứu phân tích các
công trình nghiên cứu liên quan, từ đó đánh giá ưu nhược điểm của các
hướng tiếp cận và đề xuất phương pháp phù hợp với ứng dụng cụ thể.
− Nghiên cứu thực nghiệm: Các phương pháp đề xuất, sau khi đã được phân
tích đánh giá định tính sẽ được cài đặt thử nghiệm và đánh giá trên các bộ
dữ liệu thực.
− Đánh giá thử nghiệm: Trước tiên sẽ được tiến hành một cách độc lập trên
từng mô đun, sau đó sẽ kết hợp và triển khai hệ thống hoàn chỉnh.

5. Phạm vi nghiên cứu


− Các dữ liệu thực tế khách hàng cá nhân trích tự hệ thống của một ngàn
hàng thương mại cổ phần tại Việt Nam với mẫu khoảng 5,000 khách
hàng.
− Thời gian từ tháng 01/2018 đến 12/2020

3
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
6. Ý nghĩa khoa học hoặc thực tiễn
− Ý nghĩa lý thuyết: Luận văn khi hoàn thành không chỉ là hệ thống hoá các
kiến thức về phương pháp trong lĩnh vực học máy mà còn là tài liệu để
tham khảo trong việc xây dựng các mô hình khác liên quan tới các bài
toán phân loại trong Ngân hàng (Dự báo khách hàng vỡ nợ, dự báo khách
hàng có hành vi gian lận,…) .
− Ý nghĩa thực tiễn: giúp cho doanh nghiệp nguyên nhân khách hàng trung
thành rời bỏ, xác định giá phân nhóm khách hàng cần tập trung vào mang
lại giá trị, ước lượng lượng rủi do dòng tiền cho các tổ chức tài chính.

4
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
DỰ KIẾN NỘI DUNG LUẬN VĂN

Chương 1: TỔNG QUAN NGHIÊN CỨU


1.1. Các nghiên cứu liên quan trong và ngoài nước
1.1.1. Các nghiên cứu ở nước ngoài
1.1.2. Các nghiên cứu ở Việt Nam
1.1.3. Các nghiên cứu liên quan xây dựng hệ thống quan hệ khách
hàng trong Ngân hàng.
1.2. Phân tích và đánh giá các nghiên cứu
1.2.1. Ưu điểm
1.2.2. Nhược điểm
1.2.3. Khoảng trống công nghệ và đề xuất các hướng triển khai
1.3Khách hàng trung thành rời bỏ
1.3.1. Định nghĩa khách hàng trung thành
1.3.2. Cơ sở lý thuyết xác đinh khách hàng trung thành rời bỏ
1.3.3. Dự đoán, chỉ số khách hàng trung thành rời bỏ
1.3.4. Xác suất ngừng hoạt động dựa trên lựa chọn của khách hàng
1.3.5. Chi phí quản lý dựa trên lựa chọn của khách hàng
1.4 Giới thiệu qua thông tin về đề tài

Chương 2: CƠ SỞ LÝ THUYẾT

2.1 Học máy


2.1.1. Tìm hiểu học thuyết Graph
2.1.2. Lựa chọn các thuộc tính cho mô hình máy học
2.1.3. Dự đoán khách hàng trung thành rời bỏ với các kỹ thuật phân
loại
2.2. Mô số giải thuật học máy điển hìn
2.2.1. Logistic Regression
2.2.2. Random Forest
2.2.3. XGB
2.2.4. Decision tree
2.2.5. KNN
2.3 Môi trường thực hiên (google colab, Anoconda, sql, oracle,..)

5
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
Chương 3: ĐỀ XUẤT MÔ HÌNH DỮ BÁO KHÁCH HÀNG TRUNG
THÀNH RỜI BỎ NGÂN HÀNG
3.1.Đề xuất mô hình
Hình vẽ quy trình (giải tích các thành phần trong hình vẽ)
3.2.Mô tả dữ liệu
3.2.1 Thu thập dữ liệu (raw)
3.2.2 Phương định nghĩa biến
3.2.3 Tiền xử lý dữ liệu
3.2.4 Xác định mối quan hệ giữa biến phụ thuộc và biến độc lập
3.2.5 Kết quả xử lý dữ liệu

Chương 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ


4.1.Chuẩn bị dữ liệu học và đánh giá
4.2.Đánh giá mô hình
4.3.Lựa chọn mô hình tốt cho bài toán khách hàng rời bỏ ngân hàng
4.4.Hiện thực hóa Mô hình

KẾT LUẬN VÀ KHUYẾN NGHỊ

TÀI LIỆU THAM KHẢO

PHỤ LỤC

6
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
KẾ HOẠCH THỰC HIỆN LUẬN VĂN
Thời gian Công việc thực hiện Kết quả đạt được
Nghiên cứu bài báo, đánh
Từ ngày 08/06/2022 giá ưu nhược điểm, xác
Chương 2
Đến ngày 30/06/2022 định khoảng trống nghiên
cứu
Từ ngày 01/07/2022
Chạy thử mô hình Chương 3
Đến ngày 31/07/2022
Đánh giá kết quả nghiên
Từ ngày 01/08/2022
cứu Chương 4
Đến ngày 15/08/2022
Kết luận và khuyến nghị
Từ ngày 16/08/2022 Báo cáo các nội dung thực
Báo cáo tiến độ lần 1
Đến ngày 01/09/2022 hiện
Từ ngày 01/09/2022
Chỉnh sửa theo góp ý Luận văn sơ bộ
Đến ngày 01/10/2022
Từ ngày 01/10/2022 Báo các nội dung đã chỉnh
Báo cáo tiến độ lần 2
Đến ngày 07/10/2022 sửa
Từ ngày 07/10/2022
Hoàn thiện luận văn
Đến ngày 20/10/2022
Từ ngày 21/10/2022 Luận văn chính thức và kết
Báo cáo hội đồng
Đến ngày 21/10/2022 quả bảo vệ

TP.Hồ Chí Minh, ngày tháng năm 2022


Ngày … tháng … năm 2022 Ngày … tháng … năm 2022 Ngày … tháng … năm 2022
Xác nhận của Khoa CNTTKD Hướng dẫn khoa học Học viên thực hiện

7
ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ

You might also like