You are on page 1of 28

1

TỔNG QUAN ĐỀ TÀI


Cơ sở hình thành đề tài

Khách hàng là tài sản quý giá nhất của một tổ chức, do đó việc giữ chân khách
hàng dường như là một yêu cầu cơ bản, thiết yếu và có tầm quan trọng đối với bất kỳ
một tổ chức nào.
Các ngân hàng cũng không nằm ngoài quy luật này. Môi trường cạnh tranh của
các dịch vụ ngân hàng điện từ được cung cấp bởi các ngân hàng khác nhau làm tăng
sự cần thiết của việc giữ chân khách hàng, trong khi cố gắng tăng thị phần của mình
vào việc thu hút khách hàng mới. Điều đó cho thấy rằng việc cải thiện tỷ lệ giữ chân
lên 5% có thể làm tăng lợi nhuận của ngân hàng lên đến 85% (Theo nghiên cứu của
Nie và công sự, năm 2011).
Tầm quan trọng của việc hiểu được sự rời bỏ của khách hàng đã được nhấn mạnh trong một số
nghiên cứu gần đây. Tỷ lệ duy trì tăng 1% cho thấy giá trị công ty tăng trung bình 5% [1]. Việc giảm tỷ lệ
rời bỏ 5 điểm phần trăm đã được chứng minh là giúp tăng gấp đôi lợi nhuận trong một số ngành [2]/Do
đó, một vấn đề quản lý quan trọng là làm thế nào để giảm tỷ lệ rời bỏ, đặc biệt là trong các ngành có tỷ lệ
hàng năm khá. Để làm được điều này, các nhà quản lý cần có khả năng dự đoán sự rời bỏ của khách hàng
và thiết lập mối liên hệ giữa sự rời bỏ của khách hàng và các yếu tố dưới sự kiểm soát của họ.
Một hướng để cải thiện dự đoán rời bỏ nằm ở việc lập mô hình tính không đồng nhất không quan
sát được trong tỷ lệ rời bỏ bằng cách sử dụng các mô hình thời lượng hoặc rủi ro . Mặc dù đây là một
bước quan trọng, nhưng sự khác biệt về tỷ lệ rời bỏ giữa các khách hàng khó có thể được nắm bắt hoàn
toàn bởi sự khác biệt về tỷ lệ rời bỏ cơ sở. Chúng tôi cũng mong đợi sự khác biệt tồn tại trong cách khách
hàng phản ứng với những thay đổi trong các trình điều khiển rời bỏ khác nhau. Do đó, mục tiêu chính
trong nghiên cứu của chúng tôi là cải thiện dự đoán về sự rời bỏ của khách hàng bằng cách kết hợp tính
không đồng nhất không chỉ trong chức năng rời cơ sở mà còn trong các tham số phản hồi.

Thách thức đầu tiên đối với các mô hình dự đoán rời bỏ khách hàng truyền thống
là chúng không hoàn toàn phù hợp với mục tiêu kinh doanh của họ, vì chúng chỉ dự
đoán kết quả chung, tức là liệu khách hàng có rời bỏ hay không. Tuy nhiên, các mô

2
hình ước tính tác động ròng tập trung vào việc liệu khách hàng có ý định rời bỏ VÀ sẽ
được giữ lại khi được nhắm mục tiêu với chiến dịch hay không. Mục tiêu kinh doanh
thực sự là giảm sự rời bỏ của khách hàng. Nên loại trừ những khách hàng sắp rời bỏ
nhưng không thể giữ chân được khỏi chiến dịch, vì việc nhắm mục tiêu vào họ sẽ gây
lãng phí nguồn lực khan hiếm. Hơn nữa, đã có báo cáo rằng những nỗ lực duy trì cũng
có thể khiến khách hàng rời bỏ [11]. Chẳng hạn, ưu đãi duy trì có thể nhắc nhở khách
hàng về việc sắp hết hạn hợp đồng và kết quả là gây ra sự xáo trộn. Như đã lưu ý
trong Radcliffe và Simpson [12], rủi ro rời bỏ có mối tương quan cao với sự không hài
lòng của khách hàng và mục tiêu đến lượt nó trở thành mục tiêu ngăn chặn việc khách
hàng không hài lòng thực sự rời bỏ. Bất kỳ nỗ lực nào được thực hiện để liên hệ và
giữ chân một khách hàng không hài lòng thực sự có thể khiến khách hàng rời bỏ và do
đó góp phần tạo ra tác động ròng tiêu cực cho chiến dịch. Những khách hàng như vậy
chắc chắn sẽ bị loại khỏi chiến dịch duy trì và được phân biệt là những người sẽ
không rời bỏ bất kể họ có được nhắm mục tiêu hay không. Lưu ý rằng các phương
pháp cổ điển chỉ phân biệt những khách hàng sắp rời bỏ với những người không rời
bỏ, trong khi mô hình nâng cao phân biệt những khách hàng mà việc nhắm mục tiêu
của họ sẽ mang lại lợi ích cho công ty với những khách hàng khác. Nhắm mục tiêu
khách hàng theo quy định của mô hình nâng cao sẽ không chỉ giảm tỷ lệ rời bỏ mà
còn làm như vậy với chi phí tài nguyên thấp hơn, giải quyết hiệu quả vấn đề đầu tiên
này liên quan đến các kỹ thuật truyền thống.

Trong hơn một thập kỷ rưỡi qua, số lượng khách hàng của các ngân hàng và
công ty tài chính ngày càng tăng và điều này khiến các ngân hàng ý thức được chất
lượng dịch vụ mà họ cung cấp. Hiện tượng, được gọi là 'churn', tức là sự chuyển đổi
lòng trung thành từ nhà cung cấp dịch vụ này sang nhà cung cấp dịch vụ khác xảy ra
do các lý do như sự sẵn có của công nghệ mới nhất, nhân viên ngân hàng thân thiện
với khách hàng, lãi suất thấp, vị trí địa lý gần, dịch vụ đa dạng được cung cấp, v.v. Do
đó, có một nhu cầu cấp thiết là phát triển các mô hình có thể dự đoán khách hàng

3
'trung thành' hiện tại nào sẽ rời bỏ hoặc tiêu hao trong tương lai gần.
Các tổ chức dịch vụ cần chủ động tìm hiểu mức độ hài lòng hiện tại của khách
hàng trước khi họ từ bỏ [6]. Nghiên cứu chỉ ra rằng khách hàng của ngân hàng trực
tuyến ít quan tâm đến giá hơn so với khách hàng của ngân hàng truyền thống và ít có
khả năng rời bỏ hơn [7]. Nhắm mục tiêu khách hàng trên cơ sở hành vi mua hàng
(đang thay đổi) của họ có thể giúp tổ chức kinh doanh tốt hơn và các chương trình
phần thưởng cho lòng trung thành giúp tổ chức xây dựng mối quan hệ bền chặt hơn
với khách hàng [8].

Sự mất cân bằng trong lớp mang lại những thách thức đáng kể cho việc dự đoán
sự rời bỏ của khách hàng. Nhiều giải pháp đã được phát triển để giải quyết vấn đề
này. Trong bài báo này, chúng tôi so sánh toàn diện hiệu suất của các kỹ thuật tiên
tiến nhất để đối phó với sự mất cân bằng giai cấp trong bối cảnh dự đoán khuấy đảo.
Tiêu chí lợi nhuận tối đa dự kiến được phát triển gần đây được sử dụng như một trong
những biện pháp đo lường hiệu suất chính để cung cấp thêm thông tin chi tiết từ góc
độ lợi ích chi phí. Kết quả thực nghiệm cho thấy thước đo đánh giá được áp dụng có
tác động lớn đến hiệu suất của các kỹ thuật. Việc khám phá chuyên sâu về các kiểu
phản ứng đối với các biện pháp khác nhau được thực hiện bằng cách so sánh nội bộ
gia đình trong từng nhóm giải pháp và so sánh toàn cầu giữa các kỹ thuật đại diện từ
các nhóm khác nhau. Kết quả cũng chỉ ra rằng có nhiều không gian để cải thiện hiệu
suất của các giải pháp về mặt đo lường dựa trên lợi nhuận. Nghiên cứu của chúng tôi

4
cung cấp những hiểu biết có giá trị cho các học giả và chuyên gia, đồng thời nó cũng
cung cấp cơ sở để phát triển các phương pháp mới nhằm giải quyết sự mất cân bằng
giai cấp trong dự đoán rời bỏ.
Dự đoán rời bỏ khách hàng là một vấn đề quan trọng trong quản lý quan hệ
khách hàng. Trong môi trường kinh doanh ngày càng cạnh tranh ngày nay, khách
hàng có thể dễ dàng chuyển đổi giữa các đối thủ cạnh tranh. Một số nghiên cứu đã chỉ
ra rằng có được một
khách hàng mới thường đắt gấp 5 đến 6 lần so với việc giữ chân một khách hàng
hiện có [3]. Trong khi đó, khách hàng dài hạn có xu hướng ít nhạy cảm hơn với các
hoạt động tiếp thị cạnh tranh và tạo ra lợi nhuận cao hơn. Do đó, các công ty đang
chuyển trọng tâm từ việc thu hút khách hàng mới sang duy trì cơ sở khách hàng hiện
tại của họ. Dự đoán churn chính xác giúp các công ty nhắm mục tiêu đúng khách hàng
để giữ chân và do đó nó đã được công nhận là ưu tiên tiếp thị. Do đó, chúng tôi đã
chứng kiến các ứng dụng khác nhau của kỹ thuật khai thác dữ liệu trong lĩnh vực này.

Nhiều công ty thường xuyên phải đối mặt với vấn đề mất khách hàng vì không
dự đoán được những khách hàng nào sẽ rời đi đúng lúc. Động cơ chính của nghiên
cứu này là cung cấp cho các công ty viễn thông một cách dễ dàng và hiệu quả để dự
đoán những khách hàng nào sẽ rời bỏ họ. Các công ty phải đối mặt với việc dự đoán
khách hàng bị trì hoãn cố gắng có được những khách hàng mới trở nên rất tốn kém về
thời gian và tiền bạc. Dự đoán rời bỏ khách hàng khiến việc giữ chân khách hàng trở
nên rất dễ dàng và hiệu quả đối với công ty, giúp các công ty cứu được khách hàng.
Đối với công ty viễn thông Mất khách hàng có nghĩa là chuyển khách hàng của họ
sang đối thủ cạnh tranh và dẫn đến một khoản lỗ rất lớn. Do đó, bằng cách dự đoán
khách hàng, công ty có thể đưa ra các kế hoạch hiệu quả hơn cho khách hàng để ngăn
họ rời bỏ.

5
Ngoài ra, việc giữ chân khách hàng được coi là quan trọng hơn so với trước đây.
Khảo sát này tìm cách xác định các đặc điểm chung của khách hàng rời bỏ để xây
dựng mô hình dự đoán khách hàng rời bỏ.

6
Dự đoán rời bỏ khách hàng là nhiệm vụ kinh điển của máy học, mức độ liên
quan của nhiệm vụ này tiếp tục tăng lên. Điều này là do thực tế là các công ty kinh
doanh thu thập thêm dữ liệu về khách hàng và hành vi của họ hàng năm. Một mô hình
dự đoán liệu tình trạng rời bỏ khách hàng có xảy ra trong tương lai hay không cho
phép doanh nghiệp xây dựng chính sách giá được cá nhân hóa tối ưu để giữ chân
khách hàng. Các phương pháp hiện có để giải quyết vấn đề dự đoán rời bỏ cho các
khu vực khác nhau được phân tích. Một chiến lược xác định khoảng thời gian rời bỏ
khách hàng được đề xuất và biến thể ghi nhãn dữ liệu tối ưu được chọn, cho phép
chuyển đổi vấn đề thành một vấn đề phân loại nhị phân điển hình. Một bộ dữ liệu từ
hệ thống Prozorro đã được chọn để áp dụng thực tế các phương pháp. Các phương
pháp cây tập hợp (Rừng ngẫu nhiên, XGBoost, LightGBM) đã được chọn làm thuật
toán học tập. Dự đoán rời bỏ khách hàng là một trong nhiều ứng dụng trong thế giới
ngày nay. Kiến thức về toán học và các thuật toán học máy, cùng với khả năng xây
dựng một tuyên bố vấn đề chính xác – là những kỹ năng chính của một chuyên gia
nghiên cứu về vấn đề đó.
Vấn đề dự đoán churn là một trong những vấn đề phổ biến nhất trong thực tế
Khoa học dữ liệu (ứng dụng thống kê và học máy cho các vấn đề kinh doanh). Một
cách diễn đạt phổ biến trong ngành nhấn mạnh rõ ràng tính cấp bách của vấn đề như
sau: “Tìm kiếm một khách hàng mới đắt gấp 5 lần so với việc giữ một khách hàng
hiện có”. Nhiệm vụ khá phổ biến, có nhiều tùy chọn để xây dựng một tuyên bố vấn đề
tùy thuộc vào ngành: nhà khai thác di động, ngân hàng, trạm xăng, cửa hàng trực

7
tuyến, v.v.
Vấn đề được giải quyết trong một số giai đoạn. Bước đầu tiên - tiền xử lý dữ liệu
và kỹ thuật tính năng. Chúng tôi xử lý đầu vào để tạo biến mục tiêu nhị phân – cho dù
có khuấy đảo hay không. Dựa trên dữ liệu bảng đầu vào, chúng tôi đã tạo các tính
năng bổ sung ảnh hưởng đến tỷ lệ rời bỏ. Giai đoạn này yêu cầu phân tích chi tiết dữ
liệu miền và hiểu rõ vấn đề kinh doanh. Bước tiếp theo là xây dựng mô hình, áp dụng
các thuật toán máy học vào dữ liệu đã xử lý để tìm ra các mẫu phi tuyến tính giữa các
đặc trưng. Bước cuối cùng là xác thực mô hình trên dữ liệu mới chưa từng thấy và xây
dựng biểu đồ về tầm quan trọng của tính năng để hiểu tính năng nào có ảnh hưởng
mạnh mẽ đến tỷ lệ rời bỏ của khách hàng.
Vấn đề dự đoán churn có thể được xây dựng như điển hình
vấn đề phân loại nhị phân [4] và được giải quyết bằng các thuật toán được giám
sát. Trong phần công việc liên quan, chúng tôi đã phân tích vấn đề dự đoán rời bỏ có
thể được áp dụng trong lĩnh vực kinh doanh nào và nó được giải quyết bằng những
cách tiếp cận và phương pháp nào. Trong phần tiền xử lý dữ liệu và kỹ thuật tính
năng, một chiến lược xác định khoảng thời gian rời bỏ khách hàng được đề xuất và
biến thể ghi nhãn dữ liệu tối ưu được chọn để chuyển đổi vấn đề thành nhiệm vụ phân
loại nhị phân. Phần kết quả trình bày kết quả giải bài toán dự đoán rời bỏ khách hàng
dựa trên dữ liệu thực tế từ hệ thống mua sắm công Prozorro. Thời gian churn tối ưu là
90 ngày. Các thuật toán học máy dựa trên các ý tưởng tăng cường và đóng bao được
sử dụng. AUC ROC được chọn làm thước đo hiệu suất. Các tính năng chính ảnh
hưởng đến sự rời bỏ của khách hàng được xác định.

Nghiên cứu dự đoán churn tương đối hạn chế trong lĩnh vực ngân hàng bán lẻ.
Quá trình chuyển đổi kỹ thuật số do đại dịch gây ra đã tạo ra nhu cầu cấp thiết về phân
tích hành vi rời bỏ của khách hàng trong lĩnh vực ngân hàng, đặc biệt đối với phân
khúc khách hàng trẻ hơn [5]. Sự chuyển đổi kỹ thuật số bắt buộc trong các dịch vụ
bán lẻ là một đặc điểm khác biệt của “trạng thái bình thường mới” do đại dịch

8
COVID-19 đang diễn ra đối với ngành ngân hàng tạo ra [6]. Điều đó có nghĩa là ý
định của khách hàng ngày nay chủ yếu được thúc đẩy bởi động cơ bảo vệ, gây ra sự
thay đổi mạnh mẽ trong hoạt động tương tác với ngân hàng của họ bằng cách hành xử
kỹ thuật số [7].

Nhu cầu của khách hàng là yếu tố quan trọng nhất trong sự hình thành của mỗi
thị trường và doanh nghiệp. Nó thu hút các công ty để đáp ứng nhu cầu của họ bằng
cách phát triển các sản phẩm và dịch vụ mới. Mặc dù nó có thể tạo ra sự thu hút thích
hợp đối với khách hàng của công ty, nhưng một công ty cần phải hiểu rõ về hành vi
năng động của khách hàng của họ. Dựa trên sự hiểu biết này, họ có thể đưa ra kế
hoạch phù hợp để giữ chân khách hàng. Trong ngân hàng, khách hàng là thành phần
chủ yếu của hoạt động kinh doanh ngân hàng. Tất cả các chiến lược và kế hoạch của
họ được tổ chức để thu hút khách hàng mới, giữ chân khách hàng hiện tại và cuối
cùng là
nâng cao sự hài lòng của khách hàng. Trong khi đó, khách hàng rời đi là một
trong những vấn đề quan trọng nhất đối với doanh nghiệp này. Nó tước đi của một
ngân hàng các khoản thu nhập khác nhau và thu nhập từ phí. Và quan trọng hơn, tiền
gửi của khách hàng là nguồn thu nhập chính của một ngân hàng trong hệ thống ngân
hàng Hồi giáo. Nó có thể dẫn đến việc rút một phần tiền gửi của ngân hàng. Khi xem
xét việc mất đi hai nguồn thu nhập này, cùng với khả năng gia tăng rủi ro về uy tín, có
thể dẫn ngân hàng đến bờ vực phá sản. Nghiên cứu hiện tại cung cấp một mô hình dự
đoán rời bỏ khách hàng cho các khách hàng bán lẻ của một ngân hàng thương mại ở
Iran. Bằng cách áp dụng các kỹ thuật phân tích dữ liệu tiên tiến về dữ liệu giao dịch
và hoạt động của khách hàng ngân hàng, việc phân loại khách hàng phù hợp được thể
hiện dưới dạng tỷ lệ rời bỏ. Do đó, bằng cách thực hiện các chiến lược phù hợp cho
từng danh mục, nó có thể được phát triển để giảm lượng khách hàng rời bỏ. Trong
nghiên cứu này, một ngân hàng tư nhân ở Iran đã được sử dụng để dự đoán dữ liệu
ngân hàng của khách hàng. Kết quả cho thấy các công việc liên quan đến dịch vụ thực

9
phẩm bao gồm nhà hàng và nhà bán lẻ thức ăn nhanh, cũng như các dịch vụ kỹ thuật,
có tỷ lệ rời bỏ cao nhất trong ngân hàng. Sau họ, các trung tâm thể thao, cũng như hộ
gia đình, nằm trong hàng ngũ tiếp theo của các dịch vụ ngân hàng. Trái ngược với các
trung tâm tư vấn, trường mẫu giáo và các tổ chức chính phủ lần lượt là những khách
hàng doanh nghiệp có rủi ro thấp nhất của ngân hàng. Ngoài ra, ở nhóm khách hàng
cá nhân, nhóm khách hàng từ 30-40 tuổi có tỷ lệ rời bỏ dịch vụ của ngân hàng cao
nhất.

10
Giữ chân khách hàng là một trong những khía cạnh chính của quản lý quan hệ
khách hàng (CRM) và được coi là cốt lõi của CRM. Khách hàng rời bỏ là một trong
những khái niệm liên quan đến việc giữ chân khách hàng, chú ý đến việc khách hàng
từ chối tiếp tục làm việc với một công ty. Khách hàng rời bỏ là một vấn đề quan trọng
đối với tất cả các tổ chức vì ngày nay chi phí thu hút khách hàng mới cao hơn nhiều
so với chi phí duy trì khách hàng hiện tại. Mặt khác, trong những năm gần đây, các
chiến lược tiếp thị đã chuyển từ định hướng sản xuất sang định hướng khách hàng và
nhiều tổ chức đã tập trung vào quản lý quan hệ khách hàng.

Việc phát hiện sự rời bỏ cụ thể trong lĩnh vực ngân hàng có thêm những thách thức. Đầu tiên, các
ngân hàng lớn thường có hàng chục triệu khách hàng trong danh mục đầu tư của họ. Các chiến lược cố
gắng giảm tỷ lệ rời bỏ liên quan đến sự can thiệp của con người không phát triển tốt. Thứ hai, họ không
có khả năng thích ứng đủ nhanh với những thay đổi trong nhu cầu của khách hàng. Thứ ba, mặc dù các
ngân hàng phân khúc khách hàng theo các nhà quản lý địa phương, nhưng vẫn khó phát hiện các mẫu
khách hàng theo cách thủ công, đặc biệt nếu họ quản lý một số lượng lớn khách hàng. Các tính năng này
tạo ra nhu cầu về các phương pháp tự động có khả năng phát hiện trước các kiểu hành vi không tầm
thường của khách hàng có thể gợi ý trước khả năng rời bỏ trong các tập dữ liệu khổng lồ này. Những đặc
điểm này thúc đẩy việc sử dụng các kỹ thuật học máy, cung cấp các phương pháp học có giám sát đã
được chứng minh là tìm hiểu các mẫu không tầm thường trong dữ liệu (không có sự can thiệp của con
người) và khái quát hóa tốt cho dữ liệu chưa từng thấy trước đây.
Bài viết này điều tra hành vi của tập dữ liệu đại diện gồm 500.000 khách hàng
của một tổ chức tài chính Brazil, nhằm mục đích tạo ra một mô hình dự đoán rời bỏ
chủ tài khoản thông qua học máy, có khả năng xác định các biến có tiềm năng dự

11
đoán quan trọng hơn về xu hướng rời bỏ của khách hàng. Chúng tôi mong muốn phát
triển một mô hình xác định những khách hàng có nhiều khả năng sẽ rời đi với sự tiến
bộ cần thiết. Bằng cách này, các tổ chức sẽ có đủ thời gian để thực hiện các hành động
duy trì nhằm giữ chân những khách hàng này.
Bài báo này đóng góp vào tài liệu thực nghiệm về dự đoán rời bỏ khách hàng
theo nhiều cách. Đầu tiên, nó phân tích toàn diện nhiều thuật toán phân loại học có
giám sát nổi tiếng trong một cuộc đua ngựa. Ngược lại, tài liệu thực nghiệm thường sử
dụng các thuật toán cụ thể để giải quyết vấn đề, chẳng hạn như cây quyết định [8, 37],
k-hàng xóm gần nhất [18, 63], mạng đàn hồi [42], hồi quy logistic [34, 38], Máy vectơ
hỗ trợ (SVM) [19, 64] và rừng ngẫu nhiên [39, 57]. Thay vào đó, chúng tôi chọn kiểm
tra tất cả các thuật toán này trong một thiết lập thực nghiệm chung, cho phép so sánh
công bằng các bộ phân loại.1 Thứ hai, tập dữ liệu của chúng tôi là duy nhất và đại
diện cho một ngân hàng lớn của Brazil. Hầu hết các nghiên cứu thực nghiệm đều sử
dụng bộ dữ liệu nhân tạo hoặc dữ liệu hạn chế từ một ngân hàng cụ thể, làm ảnh
hưởng đến các kết luận thực nghiệm. Hạn chế theo kinh nghiệm này thường xuất phát
từ dữ liệu ngân hàng cấp khách hàng là riêng tư và được bảo vệ hợp pháp. Thứ ba,
chúng tôi tận dụng sự sẵn có của một số lượng lớn thuộc tính trong tập dữ liệu không
chỉ để có được dự đoán chính xác về khả năng rời bỏ của khách hàng mà còn để hiểu
thuộc tính nào có khả năng dự đoán cao nhất khi xác định khả năng xảy ra khả năng
rời bỏ khách hàng. Phân tích này có thể cung cấp thông tin sâu sắc về hành vi của
khách hàng có thể được sử dụng để phát triển các chính sách nhằm giảm thiểu sự rời
bỏ của khách hàng.
Brazil hiện là nền kinh tế lớn thứ tám thế giới và hệ thống ngân hàng của nước
này, mặc dù vẫn còn tập trung, nhưng được coi là một trong những hệ thống vững
chắc nhất thế giới. Bất chấp sự tập trung này, Báo cáo ngân hàng từ Ngân hàng Trung
ương Brazil chỉ ra rằng hệ sinh thái fintech đang phát triển mạnh, với tốc độ tăng
trưởng cao và khối lượng lớn các yêu cầu hiến pháp mới nhận được và đang được
phân tích [5]. Ngoài ra, các giới thiệu gần đây từ các cơ quan quản lý thể hiện sự sẵn

12
sàng khuyến khích cạnh tranh hơn nữa để khách hàng có mức độ tự do và thoải mái
hơn trong việc lựa chọn tổ chức sẽ cung cấp các dịch vụ tài chính tốt nhất. Các ví dụ
khác về hướng này bao gồm Ngân hàng mở và sự xuất hiện của các quy tắc tạo điều
kiện thuận lợi cho tính di động của các ứng dụng, tín dụng lương và các khoản vay
giữa các tổ chức tài chính. Bối cảnh thúc đẩy cạnh tranh này làm nổi bật tầm quan
trọng của việc thúc đẩy các nghiên cứu về sự rời bỏ của khách hàng, đặc biệt là giữa
các ngân hàng truyền thống lớn của Brazil, nơi có trung gian tài chính là nguồn doanh
thu chính của họ. Điều này làm cho các tổ chức tài chính này dễ bị mất khách hàng và
nhấn mạnh tầm quan trọng của việc hiểu các động lực chính khiến khách hàng rời bỏ.
Ngăn chặn tình trạng rời bỏ tổ chức đã trở thành một trong những mục tiêu quan
trọng nhất đối với các tổ chức do sự cạnh tranh ngày càng tăng đối với khách hàng và
khó khăn trong việc bù đắp tổn thất doanh thu do sự ra đi của những khách hàng có
lợi nhuận [27, 28]. Tuy nhiên, như đã thảo luận, việc giữ chân khách hàng hiện tại
hiện là một trong những thách thức lớn nhất của các tổ chức tài chính trong một thị
trường bão hòa và cạnh tranh, nơi khách hàng ngày càng có khả năng chuyển sang các
nhà cung cấp dịch vụ khác [33]. Trong bối cảnh này, việc phát triển các mô hình
thống kê chính xác và hiệu suất cao cho phép xác định trước những khách hàng có xu
hướng rời bỏ trở thành điều kiện thiết yếu để duy trì khả năng cạnh tranh của các công
ty này.
Bên cạnh đó, những tiến bộ trong công nghệ, toàn cầu hóa và sự xuất hiện của
fintech đã làm tăng sự cạnh tranh trên thị trường để bán các sản phẩm và dịch vụ tài
chính lên mức chưa từng thấy trước đây. Tương tự như vậy, sự phổ biến của công
nghệ di động và mạng xã hội, cũng như kết quả là người tiêu dùng mở rộng khả năng
tiếp cận thông tin, đã rút ngắn khoảng cách, hỗ trợ nâng cao hiểu biết về tài chính của
khách hàng, mở rộng khả năng giao tiếp của họ với các chủ thể khác ở bất kỳ đâu trên
thế giới. thế giới, và do đó làm cho họ dễ tiếp thu hơn với những thay đổi. Bằng cách
trở thành những người tham gia tích cực hơn trong mối quan hệ của họ với các công
ty cung cấp sản phẩm và dịch vụ ở bất kỳ đâu trên toàn cầu, chính những người tiêu

13
dùng này đã tăng kỳ vọng về chất lượng sản phẩm và dịch vụ mà họ tiêu dùng và
giảm lòng trung thành của họ đối với các công ty mà họ hiện đang giao dịch [50]. Do
đó, đây là một kịch bản tiềm ẩn rủi ro đối với sự thống trị lâu nay của các công ty
hàng đầu trong lĩnh vực tài chính, các ngân hàng truyền thống lớn, đặc biệt là các
ngân hàng
không thích ứng được với cuộc cách mạng này [22]. Sự thay đổi này trong hành
vi của khách hàng, những người ít thụ động hơn trong hoạt động kinh tế, kết hợp với
khả năng mất khách hàng vào tay các công ty đối thủ ngày càng tăng, tạo ra một
“cuộc chiến” thực sự trong tranh chấp khách hàng giữa các tổ chức tài chính

Các mô hình dự đoán rời bỏ khách hàng bằng cách sử dụng phân loại học máy đã
được phát triển chủ yếu bằng cách đào tạo và thử nghiệm trên một phần dữ liệu một
lần. Chúng tôi huấn luyện các mô hình trên nhiều lát cắt dữ liệu theo thời gian và gọi
phương pháp này là đa lát cắt. Kết quả của chúng tôi cho thấy rằng với cùng một
khung thời gian dữ liệu, tính năng đa lát cắt cải thiện đáng kể hiệu suất dự đoán rời bỏ
so với đào tạo trên toàn bộ tập dữ liệu dưới dạng một lát cắt. Chúng tôi chứng minh

14
rằng bên cạnh kích thước tập huấn luyện tăng lên, sự cải thiện còn được thúc đẩy bằng
cách huấn luyện trên các mẫu từ các khoảng thời gian khác nhau. Đối với dữ liệu từ
một nhà bán buôn tiện lợi, chúng tôi cho thấy rằng tính năng đa lát cắt giải quyết tình
trạng hiếm gặp của các mẫu bị khuấy và nguy cơ khớp quá mức với tình huống đặc
biệt trong một lát cắt thời gian đào tạo. Multi-slicing làm cho một mô hình trở nên
tổng quát hơn, điều này đặc biệt phù hợp bất cứ khi nào các điều kiện thay đổi hoặc
dao động theo thời gian. Chúng tôi cũng thảo luận về cách chọn số lát cắt thời gian.

15
Các tổ chức cạnh tranh phụ thuộc vào khách hàng, chẳng hạn như các tổ chức
trong ngành ngân hàng, là một trong những ngành bị ảnh hưởng nhiều nhất bởi nền
kinh tế thị trường tự do, cho phép các nhà cung cấp dịch vụ cạnh tranh với nhau để
thu hút sự chú ý của khách hàng [1]. Cho rằng khách hàng là tài sản quý giá nhất có
ảnh hưởng trực tiếp đến doanh thu của ngành ngân hàng, sự rời bỏ của khách hàng là
một mối quan tâm lớn đối với các tổ chức dịch vụ [2]. Do đó, một yêu cầu cơ bản
quan trọng là các ngân hàng phải có kiến thức tốt về dữ liệu của khách hàng, tìm ra
các yếu tố làm tăng sự rời bỏ của khách hàng và thực hiện các hành động cần thiết để
giảm thiểu nó [2,3]. Sự tiến bộ của công nghệ trong vài thập kỷ qua đã giúp các ngân
hàng và nhiều tổ chức dịch vụ khác có thể thu thập và lưu trữ dữ liệu về khách hàng
của họ và phân loại họ thành các loại khách hàng rời bỏ hoặc không. Bản thân dữ liệu
không có nhiều giá trị nếu chúng không được nghiên cứu để tiết lộ thông tin chứa
trong chúng. Để tìm thông tin có giá trị từ dữ liệu, một quá trình gọi là khai thác dữ
liệu được áp dụng [4]. Học máy, một tập hợp con của khai thác dữ liệu, cho phép các
tổ chức nghiên cứu hành vi của khách hàng, bao gồm cả việc rời bỏ [5]. Theo [6] và
[7], rời bỏ mô tả trạng thái trong đó khách hàng hủy đăng ký hoặc rời bỏ tổ chức để
đến với đối thủ cạnh tranh, do đó dẫn đến tổn thất về doanh thu và lợi nhuận. Các nhà
nghiên cứu và các tổ chức phụ thuộc vào khách hàng đã xác định nhu cầu nghiên cứu
các mẫu và xu hướng trong dữ liệu và rút ra kết luận từ chúng, dự đoán liệu khách
hàng có phải là người rời bỏ tiềm năng hay không [8]. Kiến thức quan trọng này cho
phép các ngân hàng duy trì sự liên quan và giữ chân khách hàng bằng cách áp dụng
các chương trình khách hàng thân thiết làm tăng sự hài lòng của khách hàng [9].
Do tầm quan trọng của khách hàng và chi phí thu hút khách hàng mới cao hơn so
với việc duy trì khách hàng hiện tại, các ngân hàng và các ngành phụ thuộc vào khách
hàng khác phải có khả năng tự động hóa quá trình dự đoán hành vi của khách hàng
bằng cách sử dụng dữ liệu của khách hàng trong cơ sở dữ liệu của họ. Khách hàng rời
bỏ đặt ra mối quan tâm nghiêm trọng đối với các ngân hàng vì nó gây ra tổn thất

16
doanh thu cho ngành. Vì lý do này, các ngân hàng rất muốn xác định những khách
hàng có khả năng hủy đăng ký dịch vụ của họ cao nhất. Dự đoán rời bỏ cho phép sử
dụng hồ sơ giao dịch của khách hàng để xác định khả năng khách hàng từ bỏ dịch vụ.
Khách hàng rời bỏ trong lĩnh vực ngân hàng mô tả một khách hàng bị mất đã hủy
đăng ký dịch vụ ngân hàng và đăng ký một ngân hàng khác. Khách hàng khuấy động
xảy ra vì nhiều lý do. Chẳng hạn, các tác giả trong [7] đã lưu ý rằng nếu một tài khoản
tại ngân hàng được tạo cho một mục đích cụ thể, thì khách hàng có khả năng sẽ đóng
tài khoản đó sau khi đạt được mục đích đó. Khách hàng rời bỏ cũng xảy ra nếu khách
hàng không hài lòng với dịch vụ của ngân hàng hoặc đang di chuyển hoặc chuyển đến
một địa điểm khác. Các ngân hàng và các tổ chức tài chính khác thường xuyên kiểm
tra các giao dịch của khách hàng để phát hiện các dấu hiệu cảnh báo phổ biến trong
hành vi của khách hàng trước khi xảy ra sự xáo trộn. Những hành vi như vậy, theo
[13], bao gồm giảm khối lượng giao dịch và trạng thái không hoạt động của tài khoản.
Quản lý rời bỏ đã trở thành một phần của quản lý quan hệ khách hàng (CRM) vì thách
thức nghiêm trọng của việc khách hàng rời bỏ trong lĩnh vực ngân hàng [7]. Quản lý
rời bỏ nhấn mạnh sự cần thiết của các ngân hàng để thực hiện các bước để ngăn chặn
hoặc giảm thiểu sự rời bỏ của khách hàng thông qua một số chương trình giữ chân
khách hàng [14]. Điều này cũng giúp thiết lập mối quan hệ lâu dài với khách hàng và
tối đa hóa giá trị cơ sở khách hàng của họ [15].
đầu tư hoặc vốn cho đối thủ cạnh tranh [16]. Bằng cách thường xuyên kiểm tra
trạng thái giao dịch của khách hàng, các ngân hàng tạo ra một lượng dữ liệu khổng lồ,
khiến họ khó tính toán và thu thập kiến thức có ý nghĩa từ đó bằng các phương pháp
thống kê truyền thống [17,18]. Điều này đòi hỏi phải phát triển các thuật toán mạnh
mẽ sử dụng kỹ thuật học máy để khám phá các mẫu ẩn và dự đoán hành vi cũng như
khả năng khách hàng hủy đăng ký dịch vụ của tổ chức [4]. Một loạt các nghiên cứu đã
lưu ý rằng việc có được khách hàng mới tốn kém hơn chi phí để giữ chân những
khách hàng hiện có [7,16]. Theo [19], việc chuyển đổi một khách hàng mới thành một
khách hàng có lợi nhuận đắt gấp 16 lần so với việc giữ lại một khách hàng có giá trị.

17
Một lần nữa, việc giảm tỷ lệ rời đi 5% có khả năng làm tăng lợi nhuận lên 25–85%.
Do đó, việc dự đoán khả năng rời bỏ một khách hàng có giá trị và thực hiện các bước
để ngăn chặn điều đó xảy ra sẽ rẻ hơn so với việc đầu tư vào các chiến dịch tiếp thị
hoàn toàn mới để có được khách hàng mới [20].
Các phương pháp khai thác dữ liệu như kỹ thuật học máy hiện đang được sử
dụng để dự đoán sự rời bỏ của khách hàng trong các tổ chức cạnh tranh và để khám
phá các mẫu ẩn mà trước đây quá phức tạp và tốn thời gian để khám phá ngay từ cái
nhìn đầu tiên [4,9]. Khi các thuật toán máy học được đào tạo với dữ liệu hợp lệ về các
giao dịch của khách hàng, kiến thức hữu ích trong dữ liệu được phát hiện và các thách
thức trong ngân hàng được giải quyết bằng cách tìm một số mẫu thông thường, quan
hệ nhân quả và mối tương quan với thông tin kinh doanh. Khả năng khách hàng hủy
đăng ký dịch vụ của một tổ chức cũng có thể được dự đoán. Điều này rất quan trọng
vì nó giúp ban lãnh đạo ngân hàng xác định những khách hàng có nguy cơ rời bỏ và
phân tích xem họ có đáng để giữ lại hay không. Như đã được chứng minh bởi một số
nghiên cứu, các mô hình rời bỏ máy học rất quan trọng để triển khai các kỹ thuật
CRM trong ngân hàng và nhiều ngành khác nhằm nâng cao tỷ lệ giữ chân khách hàng
[8,15,21].

Trước đây, tỷ lệ khách hàng rời bỏ trong những ngày đầu được sử dụng để xác
định trạng thái của khách hàng trong CRM. CRM là một phương pháp quản lý kinh
doanh lần đầu tiên xuất hiện như một cách để tăng hiệu quả trong các lĩnh vực bán lẻ,
tiếp thị, bán hàng, dịch vụ khách hàng và chuỗi cung ứng, đồng thời tăng hiệu quả và
các chức năng giá trị khách hàng của tổ chức [2]. Kể từ đó, theo quan điểm kiến trúc,
CRM đã phát triển và được chia thành CRM hoạt động và CRM phân tích. CRM phân
tích tập trung vào việc phát triển cơ sở dữ liệu và tài nguyên chứa các đặc điểm và thái
độ của khách hàng [24], [25], [30]. CRM phân tích ban đầu được sử dụng để tạo các

18
chiến lược tiếp thị phù hợp bằng cách sử dụng dữ liệu về trạng thái khách hàng và
hành vi của khách hàng, và đặc biệt, nó đã được sử dụng để đáp ứng nhu cầu cá nhân
và duy nhất của khách hàng [26]. Kể từ thời điểm này, các công nghệ liên quan đến
quản lý tri thức và CNTT đã được sử dụng và các công ty bắt đầu áp dụng các công
nghệ chuyên dụng để thu hút, duy trì, rời bỏ và lựa chọn khách hàng [27], và kể từ khi
các công nghệ của lĩnh vực CNTT được triển khai trong CRM, các công ty khác nhau
bắt đầu sử dụng các công nghệ như vậy trong các lĩnh vực kinh doanh bao gồm kho
dữ liệu, trang web, viễn thông và ngân hàng [28]. Như đã mô tả trước đó, với các
nghiên cứu về CRM cho rằng việc tăng tỷ lệ duy trì của một số lượng nhỏ khách hàng
hiện tại sẽ hiệu quả hơn so với việc có được khách hàng mới, phân tích churn đã trở
thành một trong những kỹ thuật quản lý khách hàng cá nhân hóa quan trọng [20], [28],
[59]. Đã có phiếu điều tra đã thu thập và tóm tắt các kỹ thuật phân tích churn trong
lĩnh vực viễn thông [6]–[9]. Tuy nhiên, những nghiên cứu này được giới hạn trong
lĩnh vực viễn thông và dữ liệu nhật ký được sử dụng để phân tích rời bỏ không bao
gồm các tính năng chuỗi thời gian, khả năng duy trì và tồn tại cũng như các tính năng
KPI (Chỉ báo hiệu suất chính). Ngoài ra còn có các bài báo được áp dụng cho các dịch
vụ sử dụng các kỹ thuật phân tích rời rạc dựa trên mô hình học sâu khác nhau về mặt
khoa học máy tính [10], [11]. Tuy nhiên, những nghiên cứu này chỉ giới hạn trong
thuật toán học sâu và thiếu các mô hình và mô tả tham số cơ bản. Ngoài ra còn có một
số tài liệu khảo sát về khuấy đảo, tuy nhiên chúng không bao gồm các kỹ thuật học
sâu mới nhất mà chỉ đề cập đến khuấy đảo trong các lĩnh vực công nghiệp cụ thể [12],
[13]. Xu hướng xây dựng các mô hình dự đoán rời bỏ đang thay đổi và hiệu suất đang
được cải thiện nhanh chóng. Tuy nhiên, do các nghiên cứu trước đây rời rạc nên các
nhà nghiên cứu gặp nhiều khó khăn khi triển khai nghiên cứu mới về sự rời bỏ. Để
giải quyết những vấn đề này, bài khảo sát này mô tả sự khác biệt trong định nghĩa của
thuật toán dự đoán rời bỏ trong các lĩnh vực quản trị kinh doanh, tiếp thị, CNTT, viễn
thông, xuất bản báo chí, bảo hiểm và tâm lý học, đồng thời so sánh sự khác biệt về tổn
thất rời bỏ và kỹ thuật tính năng . Ngoài ra, chúng tôi phân loại và giải thích các

19
trường hợp của các mô hình dự đoán rời bỏ dựa trên điều này. Nghiên cứu của chúng
tôi cung cấp thông tin phân loại cho các công nghệ chi tiết hơn về churn trong phạm
vi rộng hơn so với các tài liệu khảo sát trước đây. Nghiên cứu của chúng tôi có thể
làm giảm sự nhầm lẫn về các tiêu chí rời bỏ đang được phân mảnh và sử dụng trên
nhiều lĩnh vực công nghiệp/học thuật, đồng thời có thể giúp ích thiết thực trong việc
áp dụng chúng vào các mô hình dự đoán. Cụ thể, bài báo này trình bày một mô hình
học sâu trong số các kỹ thuật học máy được thiết kế để giải quyết tình trạng rời bỏ
khách hàng không theo hợp đồng, mới xuất hiện gần đây cùng với sự tiến bộ của các
ngành công nghiệp.

Churn đã được định nghĩa theo nhiều cách khác nhau trong nhiều ngành công
nghiệp. Trong chương này, chúng tôi mô tả hai loại điển hình. Như đã thấy trong
Bảng 1, các bài báo điển hình với các tiêu chí khác nhau để xác định thời gian rời bỏ
được tóm tắt. Nói chung, định nghĩa từ điển về khuấy đảo được gọi là thời gian không
hoạt động kéo dài [14]. Tuy nhiên, tiêu chí ‘không hoạt động’ và ‘kéo dài’ là khác
nhau tùy theo từng lĩnh vực nghiên cứu. Sự không nhất quán như vậy thường xảy ra
do ngày càng có nhiều dịch vụ hiện đại áp dụng các điều khoản đăng ký lỏng lẻo do
cạnh tranh. Trước đây, việc khách hàng rời bỏ đã xảy ra rõ ràng thông qua việc hủy
hợp đồng, tuy nhiên, trong các dịch vụ hiện đại bao gồm Internet và dịch vụ bán lẻ,
việc khách hàng rời bỏ thường xuyên xảy ra do chi phí đầu tư của khách hàng thấp
[19]–[21], [96]. Những khách hàng rời bỏ hợp đồng này xảy ra do chi phí chuyển đổi
dịch vụ thấp [31]. Vì vậy, chúng ta có thể chia các tiêu chí của sự rời bỏ thành sự rời
bỏ theo hợp đồng và sự rời bỏ không theo hợp đồng. Mô tả của từng churn như sau.
Tiêu chí đầu tiên là chu kỳ hợp đồng. Sự rời bỏ hợp đồng đề cập đến việc khách hàng
không gia hạn hợp đồng ngay cả khi đã đến ngày gia hạn hợp đồng [15], [16]. Sự rời
bỏ này có nghĩa là một khách hàng mất hứng thú với khu vực dịch vụ có liên quan và
thay đổi vị trí của họ sang trạng thái không thể vào lại nữa. Nó thường xuất hiện trong
các sự cố gián đoạn xảy ra khi khách hàng đóng tài khoản ngân hàng của họ hoặc khi

20
chuyển nhà điều hành nhà cung cấp dịch vụ của họ từ dịch vụ này sang dịch vụ khác.
Ngoài ra, sự xáo trộn hợp đồng thường được tìm thấy trong một dịch vụ có tỷ lệ cố
định, chẳng hạn như dịch vụ phát trực tuyến nhạc và phim.

Khách hàng rời bỏ, khả năng các khách hàng hiện tại sẽ chấm dứt mối quan hệ
của họ với một công ty, là một trong những vấn đề nghiêm trọng nhất mà bất kỳ công
ty nào, bất kể ngành nào cũng phải đối mặt. Sự rời bỏ của khách hàng thường là do
các giai đoạn quản lý yếu kém khiến mối quan hệ với khách hàng xấu đi hoặc do hành
động của các công ty cạnh tranh, chẳng hạn như cung cấp cho khách hàng các sản
phẩm hoặc dịch vụ hấp dẫn hơn. Để giải quyết vấn đề này, nhiều mô hình phân tích để
dự đoán sự rời bỏ của khách hàng đã được phát triển.
Trong các mô hình này, biến mục tiêu được dự đoán thường là chính khách hàng
rời bỏ công ty, nghĩa là biến nhị phân nhận giá trị 1 khi khách hàng rời công ty và 0
nếu không. Tuy nhiên, một chiến thuật khác là dự đoán chỉ số Net Promoter Score
(NPS, xem [1]). Chỉ số này là một nhãn hiệu thương mại được đăng ký bởi Frederick
Reichheld, Bain & Company, và Satmetrix, và được giới thiệu bởi chính Reichheld
vào năm 2003 trong bài báo “‘Con số duy nhất mà bạn cần để tăng trưởng” [2]. NPS
của một công ty chủ yếu thu được thông qua khảo sát khách hàng, thường yêu cầu
định giá bằng số, từ 0 đến 10, liên quan đến câu hỏi ''Bạn có khả năng giới thiệu sản
phẩm/dịch vụ của công ty cho người thân hoặc bạn bè như thế nào ?''.

21
Ngoài ra việc thu hút khách hàng mới sẽ khiến công ty mất thêm chi phí thay vì
giữ chân những khách hàng cũ, những người có khả năng tạo ra nhiều lợi nhuận hơn.
(Theo nghiên cứu của Verbeke và cộng sự, năm 2011).
Theo Accenture, hàng năm tỷ lệ khách hàng rời bỏ doanh nghiệp trong ngành
ngân hàng vào khoảng 20-25% trong năm đầu tiên, một nửa trong số đó không vượt
quá 90 ngày đầu sau khi mở tài khoản. Và theo Ernst&Young, hơn một nửa số khách
hàng đã mở hoặc đóng ít nhất một sản phẩm ngân hàng trong năm qua và gần như
nhiều hơn 40% dự định làm như vậy trong năm tới. Mỗi khách hàng này đại diện cho
một cơ hội kinh doanh mới cho một ngân hàng cạnh tranh hoặc tổ chức tín dụng.
Khách hàng rời bỏ doanh nghiệp (Customer Churn) xảy ra khi khách hàng không
tiếp tục sử dụng những sản phẩm hay dịch vụ mà doanh nghiệp cung cấp. Trong lĩnh
vực tài chính – ngân hàng, khách hàng được xem là Customer Churn khi khách hàng
không thực hiện giao dịch trong một khoảng thời gian nhất định và số dư tài khoản
hiện tại của khách hàng thấp hơn ngưỡng số dư tối thiểu hoặc tài khoản ngân hàng của
khách hàng đã được đóng. Thực tế, tại các ngân hàng Việt Nam, khách hàng rời bỏ
được xác định khi số lượng giao dịch của khách hàng trong một năm là không và số
dư tài khoản thanh toán của khách hàng thấp hơn ngưỡng 50.000 VNĐ hoặc tài khoản
đã được đóng.
Khi khách hàng rời bỏ sẽ ảnh hưởng trực tiếp tới doanh thu và lợi nhuận của
doanh nghiệp. Mặt khác, chi phí để duy trì một khách hàng hiện hữu thấp hơn nhiều
so với chi phí tìm kiếm một khách hàng mới (theo Buckinx & Van den Poel (2005) và
Coussement and Van den Poel (2008)). Vậy nên, hiểu rõ và giữ chân khách hàng là
việc quan trọng luôn được các doanh nghiệp quan tâm.
Hiện nay, phân tích và dự đoán tỷ lệ khách hàng rời bỏ doanh nghiệp được rất
nhiều nhà nghiên cứu quan tâm và được xử lý thông qua các mô hình như: Random
Forest, Logistic regression, Decision Tree, XGBoot,…Nhưng trong mỗi mô hình được

22
sử dụng này đều có các lỗ hổng như Random Forest rất dễ bị ngưng hoạt động nếu
vượt quá hạn mức (overfitting), Mô hình Decision Tree phụ thuộc rất lớn vào dữ liệu
của bạn, với một sự thay đổi nhỏ trong bộ dữ liệu, cấu trúc mô hình Decision Tree có
thể thay đổi hoàn toàn, Logistic Regression là nó yêu cầu các điểm dữ liệu được tạo ra
một cách độc lập với nhau,… . Ngân hàng cũng như các công ty tài chính luôn có một
nguồn dữ liệu khách hàng rất lớn dẫn đến việc phải có một mô hình có thể đáp ứng
hoạt động được trên nguồn dữ liệu lớn này.

Mục tiêu nghiên cứu

− Xác định khách hàng các lý do ảnh hưởng tới quyết định rời bỏ của khách
hàng để lên phương án giảm tỷ lệ khách hàng rời bỏ.
− Ước lượng giá trị khách hàng có thể đem lại giá trị để phân bổ nguồn lực
phù hợp.
− Đưa ra các chiến lược marketing phù hợp cho từng khách hàng.

− Giữ chân được khách hàng hiện tại có khả năng rời bỏ trong tương lai.

− Tập tận dụng hiểu quả nguồn lực ngân hàng.

− Phát triển được các sản phẩm phù hợp với khách hàng hơn.

− Tính toán ước lượng được dòng tiền trong ngân hàng

− Tuân thủ thông tư 07/2019/TT-NHNN của ngân hàng nhà nước.

Đề tài ‘’ÁP DỤNG MÔ HÌNH MÁY HỌC DỰ ĐOÁN KHÁCH HÀNG TRUNG


THÀNH RỜI NGÂN HÀNG” là quy trình tạo ra mô hình mấy học dựa trên thông tin
hành vi và thông tin khách hàng để dự doán khách hàng rời bỏ ngân hàng trong tương lai.
Thông qua mô hình này có thể giúp Ngân hàng:

23
● Giữ chân được khách hàng hiện tại có khả năng rời bỏ trong tương lai.

● Tập tận dụng hiểu quả nguồn lực ngân hàng.

● Phát triển được các sản phẩm phù hợp với khách hàng hơn.

● Tính toán ước lượng được dòng tiền trong ngân hàng

● Tuân thủ thông tư 07/2019/TT-NHNN của ngân hàng nhà nước.

− Giữ chân khách hàng làm giảm nhu cầu tìm kiếm khách hàng mới, cho phép các tổ
chức tập trung vào việc củng cố mối quan hệ với khách hàng hiện tại.
− Khách hàng lớn tuổi, quen thuộc với công ty hơn, có xu hướng mua hàng nhiều
hơn và khi hài lòng, họ có thể thực hành tiếp thị giới thiệu.
− Phục vụ và duy trì khách hàng lâu dài ít tốn kém hơn do kiến thức thu được tăng
lên trong vòng đời tiêu dùng của họ.
− Khách hàng dài hạn thường ít tiếp nhận các nỗ lực tiếp thị cạnh tranh hơn.

− Mất khách hàng là chi phí cơ hội vì nó làm giảm doanh số bán hàng và buộc phải
có được khách hàng mới để bù đắp tổn thất.

Đối tượng nghiên cứu

− Khách hàng đang là đã và đang có quan hệ với doanh nghiệp.

− Các công cụ triển khai xây dựng mô hình khách hàng trung thành rời bỏ

Phạm vi nghiên cứu

− Các dữ liệu thực tế khách hàng cá nhân trích tự hệ thống của một ngàn hàng
thương mại cổ phần tại Việt Nam với mẫu khoảng 5,000 khách hàng.

24
− Thời gian từ tháng 01/2018 đến 12/2020

Phương pháp nghiên cứu

− Nghiên cứu tổng quan, lý thuyết: Dựa trên việc nghiên cứu phân tích các
công trình nghiên cứu liên quan, từ đó đánh giá ưu nhược điểm của các
hướng tiếp cận và đề xuất phương pháp phù hợp với ứng dụng cụ thể.
− Nghiên cứu thực nghiệm: Các phương pháp đề xuất, sau khi đã được phân
tích đánh giá định tính sẽ được cài đặt thử nghiệm và đánh giá trên các bộ dữ
liệu thực.
− Đánh giá thử nghiệm: Trước tiên sẽ được tiến hành một cách độc lập trên
từng mô đun, sau đó sẽ kết hợp và triển khai hệ thống hoàn chỉnh.

Ý nghĩa khoa học hoặc thực tiễn

− Ý nghĩa lý thuyết: Luận văn khi hoàn thành không chỉ là hệ thống hoá các
kiến thức về phương pháp trong lĩnh vực học máy mà còn là tài liệu để tham
khảo trong việc xây dựng các mô hình khác liên quan tới các bài toán phân
loại trong Ngân hàng (Dự báo khách hàng vỡ nợ, dự báo khách hàng có
hành vi gian lận,…) .
− Ý nghĩa thực tiễn: giúp cho doanh nghiệp nguyên nhân khách hàng trung
thành rời bỏ, xác định giá phân nhóm khách hàng cần tập trung vào mang lại
giá trị, ước lượng lượng rủi ro dòng tiền cho các tổ chức tài chính.

Kết cấu luận văn

25
TỔNG QUAN TÌNH HÌNH NGIÊM CỨU VÀ CƠ SỞ LÝ THUYẾT

Tình hình nghiêm cứu liên quan

Các nghiên cứu liên quan trong và ngoài nước

Cơ sở lý thuyết

Khách hàng trung thành rời bỏ

Định nghĩa khách hàng trung thành

Cơ sở lý thuyết xác định khách hàng trung thành rời bỏ

Dự đoán khách hàng trung thành rời bỏ

Một số giải thuật học máy điển hình

Logistic Regression

Random Forest

XGBoot

Decision tree

Môi trường thực hiện (google colab, oracle,..)

MÔ HÌNH THỰC NGIỆM


Quy trình thuật nghiệm

Sơ đồ thực hiện

Diễn giải quy trình

Mô tả dữ liệu 

1.1. Thu thập dữ liệu (raw)

1.2.    Phương định nghĩa tiêu chí ( biến) 

1.3.   Tiền xử lý dữ liệu

1.4. Xác định mối quan hệ giữa biến phụ thuộc và biến độc lập

Kết quả sau khi tiền xử lý dữ liệu và phân tích đơn biến

26
THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ

Trình bày kết quả thực nghiệm

Tóm tắt kết quả

KẾT LUẬN VÀ HƯƠNG PHÁT TRIÊN

Tổng kết quả trình nghieemn cuws

Hạn chế và hương phát triển

DANH MỤC TÀ LIỆU THAM KHẢO

PHUC LỤC

[1] Gupta, S., Lehmann, D. R., & Stuart, J. A. (2004). Valuing customers. Journal of marketing research, 41(1), 7-
18.

[2] Reichheld, F. F. (1996). Learning from customer defections. Harvard business review, 74(2), 56-67.

[3] Mark R. Colgate &  Peter J. Danaher  Journal of the Academy of Marketing


Science volume 28, pages375–387 (2000)

27
[4] Sharkadi M.M., Robotyshyn M.V., Malyar M.M., “Machine learning models and methods for
prediction problems” // Scientific bulletin UzNU “Mathematics and informatics”. – 2020. - №1(36). pp.
112-122.

[5] Senanu, B.; Narteh, B. Banking sector reforms and customer switching intentions: Evidence from the
Ghanaian banking industry. J. Financ. Serv. Mark. 2022. ahead-of-print.

[6] Ajmal, M.M.; Khan, M.; Shad, M.K.; AlKatheeri, H.; Jabeen, F. Socio-economic and technological
new normal in supply chain management: Lessons from COVID-19 pandemic. IJLM 2021. ahead-of-
print.

[7] Caimi, G.; Anderson, J.; Hoppe, F. COVID-19: Building a Digital Bridge to the New Normal. 2020.
Available online: https: //bit.ly/39ImmDR (accessed on 2 April 2022).

28

You might also like