You are on page 1of 32

Chương 1: TỔNG QUAN ĐỀ TÀI........................................................

1
1.1. Cơ sở hình thành đề tài................................................................................1
1.2. Mục tiêu nghiên cứu.....................................................................................8
1.3. Đối tượng nghiên cứu...................................................................................9
1.4. Phạm vi nghiên cứu......................................................................................9
1.5. Phương pháp nghiên cứu.............................................................................9
1.6. Ý nghĩa khoa học hoặc thực tiễn.................................................................9
1.7. Kết cấu luận văn.........................................................................................10
Chương 2: TỔNG QUAN NGIÊM CỨU VÀ CƠ SỞ LÝ THUYẾT
................................................................................................................11
2.1. Tình hình nghiêm cứu liên quan...............................................................11
2.1.1. Các nghiên cứu liên quan......................................................................................................11
2.1.2. Phân tích và đánh giá các nghiên cứu..................................................................................11
2.2. Cơ sở lý thuyết............................................................................................11
2.2.1. Khách hàng trung thành rời bỏ............................................................................................11
a. Định nghĩa khách hàng trung thành..........................................................................................11
b. Cơ sở lý thuyết xác định khách hàng trung thành rời bỏ...........................................................16
c. Dự đoán khách hàng trung thành rời bỏ....................................................................................29
2.2.2. Máy học và giải thuật học máy điển hình............................................................................29
a. Máy học.....................................................................................................................................29
b. Các giải thuật............................................................................................................................29
2.3. Môi trường thực hiện.................................................................................29
Chương 3: ĐỀ XUẤT MÔ HÌNH........................................................29
3.1. Quy trình thực nghiệm...............................................................................29
3.1.1. Sơ đồ thực hiện.......................................................................................................................29
3.1.2. Diễn giải quy trình.................................................................................................................29
3.2. Mô tả dữ liệu...............................................................................................29
3.2.1. Thu thập dữ liệu.....................................................................................................................29
3.2.2. Phương định nghĩa tiêu chí...................................................................................................29
3.2.3. Tiền xử lý dữ liệu...................................................................................................................29
3.2.4. Xác định mối quan hệ giữa biến phụ thuộc và biến độc lập...............................................29
3.3. Xây dựng mô hình......................................................................................29
Chương 4: ĐÁNH GIÁ KẾT QUẢ VÀ BÀN LUẬN.........................29
4.1. Phương pháp lựa chọn và Đánh giá mô hình.........................................30
4.2. Lựa chọn mô hình tốt cho bài toán dự đón khách hàng rời bỏ ngân
hàng.....................................................................................................................30
4.3. Hiện thực hóa Mô hình..............................................................................30
Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.......................30
5.1. Tổng quả kết quả nghiêm cứu...................................................................30
5.2. Hướng phát triển........................................................................................30
TÀI LIỆU THAM KHẢO....................................................................30
PHỤ LỤC..............................................................................................30
Chương 1: TỔNG QUAN ĐỀ TÀI

1.1. Cơ sở hình thành đề tài


Khách hàng luôn là tài sản quý giá nhất đối với bất kỳ tổ chức nào, trong môi
trường kinh doanh ngày càng cạnh tranh ngày nay, khách hàng có thể dễ dàng chuyển
đổi giữa các đối thủ cạnh tranh, do đó việc giữ chân khách hàng dường như là một yêu
cầu cơ bản, thiết yếu và có tầm quan trọng đối với bất kỳ một tổ chức nào. Nhiều công
ty gặp phải vấn đề nghiêm trọng về việc khách hàng bỏ đi, do sự cạnh tranh khốc liệt do
thị trường bão hòa, điều kiện thị trường năng động và liên tục đưa ra các dịch vụ cạnh
tranh mới. Các ngân hàng cũng không nằm ngoài quy luật này. Với Số lượng khách
hàng của các ngân hàng và công ty tài chính ngày càng tăng, các ngân hàng lớn
thường có hàng chục triệu khách hàng trong danh mục kinh doanh của họ và điều này
khiến các ngân hàng ý thức được chất lượng dịch vụ mà họ cung cấp. Hiện tượng rời
đi của khách hàng, được gọi là 'churn', tức là sự chuyển đổi lòng trung thành từ nhà
cung cấp dịch vụ này sang nhà cung cấp dịch vụ khác xảy ra do các lý do như sự sẵn
có của công nghệ mới nhất, nhân viên ngân hàng thân thiện với khách hàng, lãi suất
thấp, vị trí địa lý gần, dịch vụ đa dạng được cung cấp, v.v. Môi trường cạnh tranh của
các dịch vụ ngân hàng thương mại được cung cấp bởi các ngân hàng khác nhau làm
tăng sự cần thiết của việc giữ chân khách hàng, trong khi cố gắng tăng thị phần của
mình vào việc thu hút khách hàng mới. Tầm quan trọng của việc hiểu được sự rời bỏ
của khách hàng đã được nhấn mạnh trong một số nghiên cứu gần đây. Tỷ lệ duy trì
tăng 1% cho thấy giá trị công ty tăng trung bình 5% [1]. Việc giảm tỷ lệ rời bỏ 5 phần
trăm đã được chứng minh là giúp tăng gấp đôi lợi nhuận trong một số ngành [2].
Nhu cầu sử dụng sản phẩm dịch vụ của khách hàng là yếu tố quan trọng nhất
trong sự hình thành của bất cứ thị trường và doanh nghiệp nào. Nó thu hút các công ty
để đáp ứng nhu cầu của họ bằng cách phát triển các sản phẩm và dịch vụ mới. Một số
Trang 1
nghiên cứu đã chỉ ra rằng có được một khách hàng mới thường đắt gấp 5 đến 6 lần so
với việc giữ chân một khách hàng hiện có [3]. Do tầm quan trọng của khách hàng và
chi phí thu hút khách hàng mới cao hơn so với việc duy trì khách hàng hiện tại, các
ngân hàng và các ngành phụ thuộc vào khách hàng khác phải có khả năng tự động hóa
quá trình dự đoán hành vi của khách hàng bằng cách sử dụng dữ liệu của khách hàng
trong cơ sở dữ liệu của họ. Trong khi đó, khách hàng rời đi là một trong những vấn đề
quan trọng nhất đối với Ngân hàng. Nó tước đi của một ngân hàng các khoản thu nhập
khác nhau và thu nhập từ phí ( tiền gửi không kỳ hạn, phí chuyển tiền,…). Và quan
trọng hơn, tiền gửi của khách hàng là nguồn thu nhập chính của một ngân hàng trong
hệ thống ngân hàng. Nó có thể dẫn đến việc rút một phần tiền gửi của ngân hàng. Khi
xem xét việc mất đi hai nguồn thu nhập này, cùng với khả năng gia tăng rủi ro về uy
tín, có thể dẫn ngân hàng đến bờ vực phá sản. Khi khách hàng rời bỏ sẽ ảnh hưởng
trực tiếp tới doanh thu và lợi nhuận của Ngân hàng. Mặt khác, chi phí để duy trì một
khách hàng hiện hữu thấp hơn nhiều so với chi phí tìm kiếm một khách hàng mới.
Vậy nên, hiểu rõ và giữ chân khách hàng là việc quan trọng luôn được các doanh
nghiệp quan tâm. Khách hàng rời bỏ trong lĩnh vực ngân hàng mô tả một khách hàng
bị mất đã hủy đăng ký dịch vụ ngân hàng và đăng ký một ngân hàng khác. Các ngân
hàng và các tổ chức tài chính khác thường xuyên kiểm tra các giao dịch của khách
hàng để phát hiện các dấu hiệu cảnh báo phổ biến trong hành vi của khách hàng trước
khi xảy ra churn. Quản lý rời bỏ đã trở thành một phần của quản lý quan hệ khách
hàng (CRM) vì thách thức nghiêm trọng của việc khách hàng rời bỏ trong lĩnh vực
ngân hàng. Quản lý rời bỏ nhấn mạnh sự cần thiết của các ngân hàng để thực hiện các
bước để ngăn chặn hoặc giảm thiểu sự rời bỏ của khách hàng thông qua một số
chương trình giữ chân khách hàng. Điều này cũng giúp thiết lập mối quan hệ lâu dài
với khách hàng và tối đa hóa giá trị cơ sở khách hàng của họ. Khách hàng rời bỏ đặt
ra mối quan tâm nghiêm trọng đối với các ngân hàng vì nó gây ra tổn thất doanh thu
cho ngành. Vì lý do này, các ngân hàng rất muốn xác định những khách hàng có khả
Trang 2
năng hủy đăng ký dịch vụ của họ cao nhất. Dự đoán rời bỏ cho phép sử dụng hồ sơ
giao dịch của khách hàng để xác định khả năng khách hàng từ bỏ dịch vụ trước khi
khách hàng thật sự rời bỏ. Nhắm mục tiêu khách hàng trên cơ sở hành vi mua hàng
(đang thay đổi) của họ có thể giúp tổ chức kinh doanh tốt hơn và các chương trình
phần thưởng cho lòng trung thành giúp tổ chức xây dựng mối quan hệ bền chặt hơn
với khách hàng.
Mặc dù nó có thể tạo ra sự thu hút thích hợp đối với khách hàng của Ngân hàng,
nhưng Ngân hàng cần phải hiểu rõ về hành vi năng động của khách hàng. Dựa trên sự
hiểu biết này, chúng ta có thể đưa ra kế hoạch phù hợp để giữ chân khách hàng. Trong
ngân hàng, khách hàng là thành phần chủ yếu của hoạt động kinh doanh ngân hàng.
Tất cả các chiến lược và kế hoạch của họ được tổ chức để thu hút khách hàng mới, giữ
chân khách hàng hiện tại và cuối cùng là nâng cao sự hài lòng của khách hàng. Nhiều
Ngân hàng đã chuyển từ chiến lược lấy ưu đãi làm trung tâm, được thiết kế để bán càng
nhiều ưu đãi càng tốt, sang phương pháp duy trì hướng đến khách hàng nhằm tìm cách
giảm tỷ lệ rời bỏ một cách rõ ràng.
Một trong những điều khó khăn nhất trong việc ngăn chặn tình trạng rời bỏ Ngân
hàng là đó không phải là công việc của riêng ai, theo nghĩa là không một người nào hoặc
bộ phận công việc nào có thể làm việc đó một mình. Rất khó để chống lại tình trạng rời
bỏ vì các bộ phận khác nhau của doanh nghiệp chịu trách nhiệm giảm tỷ lệ rời bỏ theo
những cách khác nhau. Tất cả các nhóm này đều có các công cụ và phương pháp khác
nhau và chúng có thể không phù hợp với tình huống và chiến lược. Ngoài ra, mọi phương
pháp để giảm tỷ lệ rời bỏ đều yêu cầu doanh nghiệp nhắm mục tiêu can thiệp vào những
khách hàng có nhiều khả năng phản hồi nhất. Do đó, để chống lại tình trạng rời bỏ sản
phẩm, các doanh nghiệp cần có một tập hợp các sự kiện hoặc quy tắc được chia sẻ để
hiểu khách hàng và mức độ tương tác của họ với sản phẩm. Xem xét các chiến lược để
giảm tỷ lệ rời bỏ được mô tả trong phần trước: cải tiến sản phẩm, chiến dịch tương tác, hỗ
trợ và thành công của khách hàng, bán hàng và định giá. Những chức năng đó bao trùm

Trang 3
hơn một nửa các phòng ban trong một tổ chức điển hình. Điều đó có nghĩa là việc giảm tỷ
lệ churn sẽ gặp phải các vấn đề về giao tiếp và phối hợp có bộ phân trong Ngaanh ngàng.
Nếu không được kiểm soát, các nhóm khác nhau sẽ có xu hướng đưa ra các phương pháp
tiếp cận không phối hợp để giảm tình trạng churn. Ví dụ, sẽ phản tác dụng nếu nhóm sản
phẩm và tiếp thị quyết định tập trung vào việc thúc đẩy việc sử dụng các tính năng hoặc
nội dung khác nhau. Và những cách tiếp cận đó có thể dựa trên thông tin hạn chế hoặc
thiếu sót. Vì họ không phải là chuyên gia dữ liệu, nên không có gì đảm bảo rằng các lựa
chọn do các nhóm độc lập đưa ra sẽ được dữ liệu định hướng chính xác. Ngoài ra, trong
một tình huống điển hình, người cung cấp dữ liệu không thể tự mình làm bất cứ điều gì
để giảm tỷ lệ rời bỏ. Việc giảm tỷ lệ rời bỏ phụ thuộc vào các hành động được thực hiện
bởi các chuyên gia trong các bộ phận khác nhau của doanh nghiệp, chứ không phải bởi
một cá nhân quản lý dữ liệu. Những người phụ trách dữ liệu thường không có trách
nhiệm trực tiếp đối với kết quả kinh doanh cụ thể (chẳng hạn như doanh thu), trong khi
những người ở các vai trò khác đó thường làm. Theo quan điểm của người làm dữ liệu,
Ngân hàng là người dùng cuối của kết quả phân tích dữ liệu.Cách tốt nhất để biến dữ liệu
thành vũ khí trong cuộc chiến chống lại sự rời bỏ là sử dụng dữ liệu để tạo ra các phép đo
khách hàng hiệu quả và đưa các phép đo đó đến tay những người chống lại sự rời bỏ của
doanh nghiệp.
Các chiến lược cố gắng giảm tỷ lệ rời bỏ liên quan đến sự can thiệp của con
người không phát triển tốt, Ngân hàng khó có khả năng thích ứng đủ nhanh với những
thay đổi trong nhu cầu của khách hàng, mặc dù các ngân hàng phân khúc khách hàng
theo các nhà quản lý địa phương, nhưng vẫn khó phát hiện các mẫu khách hàng theo
cách thủ công, đặc biệt nếu họ quản lý một số lượng lớn khách hàng. Dự đoán rời bỏ
khách hàng là phương pháp gán xác suất rời bỏ cho từng khách hàng trong cơ sở dữ liệu
của công ty, theo mối quan hệ được dự đoán giữa thông tin lịch sử của khách hàng đó và
hành vi rời bỏ trong tương lai của khách hàng đó. Trên thực tế, xác suất chấm dứt mối
quan hệ với Ngân hàng sau đó được sử dụng để xếp hạng các khách hàng từ ít có khả

Trang 4
năng rời bỏ nhất đến ít nhất và những khách hàng có xu hướng rời bỏ cao nhất sẽ nhận
được các chiến dịch duy trì tiếp thị. Hai thách thức ảnh hưởng đến sự thành công của các
chiến dịch này. Đầu tiên, điều quan trọng là phải phát triển các chiến thuật tiếp thị phù
hợp để thuyết phục những người rời bỏ tiềm năng ở lại. Thứ hai, các công ty có thể cải
thiện lợi tức đầu tư của họ vào các chiến dịch duy trì bằng cách phân biệt những người
rời bỏ tiềm năng, những người nhạy cảm hơn với các hành động tiếp thị (tức là những
khách hàng dễ thuyết phục) với những người sẽ rời đi, cho dù họ có nhận được đề nghị
giữ chân hay không (tức là không thuyết phục được khách hàng ở lại). Nỗ lực này được
gọi là hiệu ứng ròng hoặc mô hình nâng cao.

Ngày nay, các phương pháp khai thác dữ liệu như kỹ thuật học máy hiện đang
được sử dụng để dự đoán sự rời bỏ của khách hàng trong các Ngân hàng cạnh tranh và
để khám phá các thông tin có giá trị đối với việc giải quyết vấn đề khách hàng rời bỏ.
Khi các thuật toán máy học được đào tạo với dữ liệu phát sinh từ các giao dịch của
khách hàng, kiến thức hữu ích trong dữ liệu được phát hiện và các thách thức trong
ngân hàng được giải quyết bằng cách tìm một số mẫu thông thường, quan hệ nhân quả
và mối tương quan với thông tin kinh doanh. Khả năng khách hàng hủy đăng ký dịch
vụ của một Ngân hàng cũng có thể được dự đoán. Điều này rất quan trọng vì nó giúp
ban lãnh đạo ngân hàng xác định những khách hàng có nguy cơ rời bỏ và phân tích
xem họ có đáng để giữ lại hay không. Như đã được chứng minh bởi một số nghiên
cứu, các mô hình rời bỏ máy học rất quan trọng để triển khai các kỹ thuật CRM trong
ngân hàng và nhiều ngành khác nhằm nâng cao tỷ lệ giữ chân khách hàng.
Sự tiến bộ của công nghệ trong vài thập kỷ qua đã giúp các ngân hàng và nhiều
tổ chức dịch vụ khác có thể thu thập và lưu trữ dữ liệu về khách hàng của họ và phân
loại họ thành các loại khách hàng rời bỏ hoặc không. Bản thân dữ liệu không có nhiều
giá trị nếu chúng không được nghiên cứu để tiết lộ thông tin chứa trong chúng. Để tìm
thông tin có giá trị từ dữ liệu, một quá trình gọi là khai thác dữ liệu được áp dụng.
Học máy, một tập hợp con của khai thác dữ liệu, cho phép các tổ chức nghiên cứu
Trang 5
hành vi của khách hàng, bao gồm cả việc rời bỏ mô tả trạng thái trong đó khách hàng
hủy đăng ký hoặc rời bỏ tổ chức để đến với Ngân hàng đối thủ, do đó dẫn đến tổn thất
về doanh thu và lợi nhuận. Các nhà nghiên cứu và các tổ chức phụ thuộc vào khách
hàng đã xác định nhu cầu nghiên cứu các mẫu và xu hướng trong dữ liệu và rút ra kết
luận từ chúng, dự đoán liệu khách hàng có phải là người rời bỏ tiềm năng hay không.
Kiến thức quan trọng này cho phép các ngân hàng duy trì sự liên quan và giữ chân
khách hàng bằng cách áp dụng các chương trình khách hàng thân thiết làm tăng sự hài
lòng của khách hàng.
Hiện nay, phân tích và dự đoán tỷ lệ khách hàng rời bỏ Ngân hàng được rất
nhiều nhà nghiên cứu quan tâm và được xử lý thông qua các mô hình như: Random
Forest, Logistic regression, Decision Tree, XGBoot,…Nhưng trong mỗi mô hình được
sử dụng này đều có các lỗ hổng như Random Forest rất dễ bị ngưng hoạt động nếu
vượt quá hạn mức (overfitting), Mô hình Decision Tree phụ thuộc rất lớn vào dữ liệu
của bạn, với một sự thay đổi nhỏ trong bộ dữ liệu, cấu trúc mô hình Decision Tree có
thể thay đổi hoàn toàn, Logistic Regression là nó yêu cầu các điểm dữ liệu được tạo ra
một cách độc lập với nhau,… . Ngân hàng cũng như các công ty tài chính luôn có một
nguồn dữ liệu khách hàng rất lớn dẫn đến việc phải có một mô hình có thể đáp ứng
hoạt động được trên nguồn dữ liệu lớn này. Tiêu chí lợi nhuận tối đa dự kiến được
phát triển gần đây được sử dụng như một trong những biện pháp đo lường hiệu suất
chính để cung cấp thêm thông tin chi tiết từ góc độ lợi ích chi phí. Kết quả thực
nghiệm cho thấy thước đo đánh giá được áp dụng có tác động lớn đến hiệu suất của
các kỹ thuật. Việc khám phá chuyên sâu về các kiểu phản ứng đối với các biện pháp
khác nhau được thực hiện bằng cách so sánh nội bộ gia đình trong từng nhóm giải
pháp và so sánh toàn cầu giữa các kỹ thuật đại diện từ các nhóm khác nhau. Kết quả
cũng chỉ ra rằng có nhiều không gian để cải thiện hiệu suất của các giải pháp về mặt
đo lường dựa trên lợi nhuận. Nghiên cứu của chúng tôi cung cấp những hiểu biết có

Trang 6
giá trị cho các học giả và chuyên gia, đồng thời nó cũng cung cấp cơ sở để phát triển
các phương pháp mới nhằm giải quyết sự mất cân bằng giai cấp trong dự đoán rời bỏ.
Do đó, dự đoán khách hàng rời bỏ có thể được trình bày dưới dạng nhiệm vụ phân
loại nhị phân với sự phân bổ lớp không cân bằng, trong đó những người rời bỏ thuộc về
nhóm thiểu số và những người không rời bỏ thuộc về nhóm đa số. Vấn đề mất cân bằng
lớp tạo ra ảnh hưởng tiêu cực lớn đến các thuật toán học phân loại tiêu chuẩn. Hầu hết
trong số họ có xu hướng thiên về tầng lớp đa số. Trong những trường hợp cực đoan,
Ngân hàng có thể phân loại tất cả các trường hợp thành nhóm đa số, dẫn đến độ chính xác
tổng thể cao nhưng độ chính xác thấp không thể chấp nhận được đối với nhóm lợi ích
thiểu số. Chẳng hạn, khi một mô hình được đào tạo trên một tập dữ liệu với 1% trường
hợp thuộc lớp thiểu số, tỷ lệ chính xác 99% có thể đạt được bằng cách chỉ cần phân loại
tất cả các trường hợp thuộc về lớp đa số. Thật vậy, bài toán học trên tập dữ liệu mất cân
bằng được coi là một trong mười bài toán thách thức trong nghiên cứu khai phá dữ liệu.
Để giải quyết vấn đề học tập từ các tập dữ liệu mất cân bằng, nhiều giải pháp đã được đề
xuất trong vài năm qua. Hầu hết các giải pháp được đề xuất nổi tiếng gần như rơi vào ba
nhóm: cấp độ dữ liệu, cấp độ thuật toán và giải pháp đồng bộ. Các giải pháp cấp dữ liệu
áp dụng lấy mẫu lại như một bước tiền xử lý để giảm tác động tiêu cực do mất cân bằng
lớp. Các giải pháp ở cấp độ thuật toán nhằm mục đích phát triển các thuật toán mới hoặc
sửa đổi các thuật toán hiện có để học tập thiên vị đối với lớp thiểu số. Các giải pháp đồng
bộ hoặc sửa đổi các thuật toán học tập đồng bộ ở cấp dữ liệu để xử lý trước dữ liệu trước
giai đoạn học tập của các bộ phân loại cơ sở hoặc nhúng một khung nhạy cảm với chi phí
trong quy trình học tập đồng bộ. Mỗi loại giải pháp đều có ưu và nhược điểm, không có
sự đồng thuận rõ ràng về điều gì tạo nên giải pháp tốt nhất để giải quyết vấn đề mất cân
bằng giai cấp trong dự đoán rời bỏ.

Để giảm tỷ lệ rời bỏ, Ngân hàng thường có thể chạy một chiến dịch email để thúc
đẩy việc sử dụng một tính năng của sản phẩm. Nhưng một chiến dịch như vậy nên được
nhắm mục tiêu đến những người dùng không sử dụng tính năng này, chứ không phải gửi

Trang 7
đến tất cả những người dùng có nguy cơ rời bỏ vì bất kỳ lý do gì. Làm tắc nghẽn hộp thư
đến của người dùng với nội dung không phù hợp sẽ khiến họ bỏ đi chứ không cứu được
họ! Dự đoán rủi ro rời bỏ có thể là một biến số hữu ích trong việc lựa chọn khách hàng để
các nhóm Thành công của Khách hàng can thiệp trực tiếp, nhưng ngay cả khi đó, nó chỉ
là một biến số xác định mục tiêu.

Việc xậy dựng mô hình máy học để dự đoán khách hàng trung thành rời bỏ phải
phù hợp với ý nghĩa về mặc kinh doanh của Ngân hàng (mô hình phải dựa trên thông tin
hành vi hiện tại để dự doán khách hàng rời đi trong tương lại). Phù hợp với pháp luật về
bảo mật thông tin khách hàng của Ngân hàng. Dễ hiểu để các bộ phận trong Ngân hàng
có thể phối hợp nhịp hàng để triển khai. Hữu ý cho hiều nhiều chức năng để Ngân hàng
có thể thực hiện các công việc cần làm tiếp theo để lên phương án và thực hiện chiến dịch
để giữ chân khách hàng (sản phẩm, tiếp thị, hỗ trợ, v.v.).

1.2. Mục tiêu nghiên cứu

Đề tài ‘’Áp dụng mô hình máy học dự đoán khách hàng trung thành ròi bỏ Ngân hàng” là
quy trình tạo ra mô hình mấy học dựa trên thông tin hành vi và thông tin khách hàng để
dự doán khách hàng rời bỏ ngân hàng trong tương lai. Thông qua mô hình này có thể
giúp Ngân hàng:

− Giữ chân được khách hàng hiện tại có khả năng rời bỏ trong tương lai.

− Tập tận dụng hiểu quả nguồn lực ngân hàng.

− Phát triển được các sản phẩm phù hợp với khách hàng hơn.

− Tính toán ước lượng được dòng tiền trong ngân hàng

− Tuân thủ thông tư 07/2019/TT-NHNN của ngân hàng nhà nước.

− Giữ chân khách hàng làm giảm nhu cầu tìm kiếm khách hàng mới, cho phép các tổ
chức tập trung vào việc củng cố mối quan hệ với khách hàng hiện tại.

Trang 8
− Khách hàng có thời gian quan hệ dài với Ngân hàng, quen thuộc với công ty hơn,
có xu hướng mua hàng nhiều hơn và khi hài lòng, họ có thể thực hành tiếp thị giới
thiệu.
− Phục vụ và duy trì khách hàng lâu dài ít tốn kém hơn do kiến thức thu được tăng
lên trong vòng đời tiêu dùng của họ.

1.3. Đối tượng nghiên cứu

− Đề tài nghiêm cứu dự trên tập dữ liệu thực tế Khách hàng cá nhân đã và
đang có quan hệ Ngân hàng thông qua hệ thống ( T24, Wayfour,…) của một
ngân hàng cổ phần thương mại lớn tại Việt Nam.

1.4. Phạm vi nghiên cứu


Đề tài này được thực hiện trên dữ liệu mẫu thông tin nội bộ của Ngân hàng
từ 2018-2020 để thực hiện xây đựng mô hinh máy học và hướng phát triển,
không bị ảnh hưởng từ các ý tố bên ngoài ( thông tin bất lợi với Ngân hàng,
độ phủ và quy mô hình Ngân hàng,….).

1.5. Phương pháp nghiên cứu

− Nghiên cứu tổng quan, lý thuyết: Dựa trên việc nghiên cứu phân tích các
công trình nghiên cứu liên quan, từ đó đánh giá ưu nhược điểm của các
hướng tiếp cận và đề xuất phương pháp phù hợp với ứng dụng cụ thể.
− Nghiên cứu thực nghiệm: Các phương pháp đề xuất, sau khi đã được phân
tích đánh giá định tính sẽ được cài đặt thử nghiệm và đánh giá trên các bộ dữ
liệu thực tế.
− Đánh giá thử nghiệm: Trước tiên sẽ được tiến hành một cách độc lập trên
từng mô đun, sau đó sẽ kết hợp và triển khai hệ thống hoàn chỉnh.

Trang 9
1.6. Ý nghĩa khoa học hoặc thực tiễn

− Ý nghĩa lý thuyết: Luận văn khi hoàn thành không chỉ là hệ thống hoá các
kiến thức về phương pháp trong lĩnh vực học máy mà còn là tài liệu để tham
khảo trong việc xây dựng các mô hình khác liên quan tới các bài toán phân
loại trong Ngân hàng (Dự báo khách hàng vỡ nợ, dự báo khách hàng có
hành vi gian lận,…) .
− Ý nghĩa thực tiễn: giúp cho doanh nghiệp nguyên nhân khách hàng trung
thành rời bỏ, xác định giá phân nhóm khách hàng cần tập trung vào mang lại
giá trị, ước lượng lượng rủi ro dòng tiền cho các tổ chức tài chính.

1.7. Kết cấu luận văn


Đề tài được trình bày theo năm chương chính như sau:

Chương 1: Tổng quan đề tài

Chương 2: Tổng quan nghiêm cứu và cơ sở lý thuyết

Chương 3: Đề xuất mô hình

Chương 4: Đánh giá kết quả và bàn luận

Chương 5: Kết luận và hướng phát triển

Trang 10
Chương 2: TỔNG QUAN NGIÊM CỨU VÀ CƠ SỞ
LÝ THUYẾT

2.1. Tình hình nghiêm cứu liên quan


2.1.1. Các nghiên cứu liên quan

2.1.2. Phân tích và đánh giá các nghiên cứu

2.2. Cơ sở lý thuyết

2.2.1. Khách hàng trung thành rời bỏ

a. Định nghĩa khách hàng trung thành

Từ churn có nguồn gốc từ thuật ngữ tỷ lệ churn, dùng để chỉ khách hàng rời đi
trong một khoảng thời gian nhất định sau khi đã sử dụng sản phẩm hoặc dịch vụ., như
chúng ta sẽ thảo luận chi tiết hơn ở phần sau. Điều này dẫn đến khách hàng hoặc dân số
người dùng thay đổi theo thời gian, đó là lý do tại sao thuật ngữ churn có ý nghĩa. Từ ban
đầu có nghĩa là “di chuyển mạnh mẽ”.

Tùy theo ngành, sản phẩm dịch vụ cung cấp của mỗi tổ chức, chúng ta có thể chia
churn thành các nhóm như sau:

◦ Một sản phẩm hoặc dịch vụ được cung cấp và sử dụng trên cơ sở định kỳ
(các ứng dụng trả phí theo hàng tháng,…).
◦ Khách hàng tương tác với sản phẩm (Facebook, zalo,…).

Trang 11
◦ Đăng ký có thể bị kết thúc hoặc hủy bỏ, được gọi là churn. Nếu không có
đăng ký, khách hàng sẽ rời bỏ khi họ ngừng sử dụng sản phẩm. (Các gói
dịch vụ mạng viễn thông,…)
◦ Đăng ký có thể bị kết thúc hoặc hủy bỏ, Thời gian, giá và thanh toán cho
khách hàng và đăng ký (nếu có) được ghi lại trong cơ sở dữ liệu, điển hình
là cơ sở dữ liệu giao dịch. (Ngân hàng, tổ chức tín dụng,….)
◦ Khi khách hàng sử dụng hoặc tương tác với sản phẩm hoặc dịch vụ, những
sự kiện này thường được theo dõi và lưu trữ trong kho dữ liệu.( Lazada,
shopee, Tiki,…)

Thông thường trong lĩnh vực tài chính Ngân hàng, không có trường hoặc cờ trên
đăng ký hoặc tài khoản nào nói rằng “Đây là tài khoản/khách churn” trong cấu trúc quản
lý dữ liệu của một tổ chức (chỉ biết khi khách hàng đã rời đi khi khách hàng đến chi
nhánh/ phòng giao dịch hủy tài khoản như vậy không tín kịp thời với công nghệ số và
nghiệp vụ quan hệ khách hàng hiện tại). Đúng hơn, churn là một trạng thái động cho mỗi
tài khoản hay mỗi khách phải được xác định tại một thời điểm nhất định tuỳ theo mục
tiêu của một chức nhất định. Đối với vấn đề đó, nếu có một trường hoặc cờ trên tài khoản
hoặc tập lệnh phụ cho biết đó là một churn, chúng ta phải được trên thực trạng của dữ
liệu rồi tự định nghĩa thông qua trao đổi với người có kinh nghiệm để xác định khách
hàng churn (ví dụ trong ngân hàng thì có thể trao đổi với bộ phân quản trị rủi ro).

Định nghĩa phổ biến nhất về khách hàng đang hoạt động cho các sản phẩm không
đăng ký/ sử dụng chỉ đơn giản là khách hàng đã sử dụng sản phẩm trong khoảng thời gian
gần đây. Hoạt động của người dùng có xu hướng được nhóm lại, do đó, việc coi khoảng
thời gian hoạt động là một chuỗi các sự kiện là điều tự nhiên mà không có khoảng cách
lớn giữa hai sự kiện liên tiếp bất kỳ ( sử dụng thường xuyên sang trạng thái không sử
dụng sản phẩm dịch vụ). Nếu vượt quá giới hạn thời gian tối đa (thông lệ là 6 tháng), đó
được coi là churn. Giới hạn thời gian như vậy nên được đặt đủ lâu để hầu hết những

Trang 12
người làm việc vượt quá giới hạn sẽ không quay lại với việc sử dụng sản phẩm/dịch vụ, ít
nhất là trong một thời gian (thông lệ là 6 tháng).

Ví dụ: Khách hàng tại một Ngân hàng không có bất kỳ giao dịch phát sinh (chuyển tiền
qua tài khoản) trong vòng sáu tháng liên tục.

Mục tiêu chính của bất kỳ dịch vụ nào là phát triển bằng cách thêm khách hàng
hoặc người dùng thông qua việc tham gia thị trường và bán hàng. (Điều này đúng đối với
cả doanh nghiệp vì lợi nhuận và phi lợi nhuận.). Khi các khách hàng rời đi, điều này sẽ
ảnh hưởng đến sự phát triển của công ty và thậm chí có thể dẫn đến thu hẹp. Hầu hết các
nhà cung cấp dịch vụ tập trung vào việc khách hàng quay lại mua hàng hay sử dụng lại
dịch vụ. Nhưng để thành công, một dịch vụ cũng phải hoạt động để giảm thiểu tình trạng
khách hàng rời đi. Nếu tình trạng Khách hàng rời đi không được giải quyết một cách liên
tục và chủ động, sản phẩm hoặc dịch vụ sẽ không phát huy hết tiềm năng của nó. Do đó,
nhu cầu duy trì doanh thu của họ đã thúc đẩy các công ty hiểu và phân tích hành vi của
khách hàng để xác định trước những khách hàng có xu hướng churn hơn. Bằng cách này,
doanh nghiệp có thể chủ động hành động để giữ chân khách hàng và tăng lợi nhuận.

Việc phát hiện tình trạng churn cụ thể trong lĩnh vực ngân hàng có thêm những
thách thức. Thứ nhất, các ngân hàng lớn thường có hàng chục triệu khách hàng trong
danh mục khách hàng của họ. Các chiến lược cố gắng giảm thiểu tình trạng churn liên
quan đến sự can thiệp của con người không mở rộng quy mô tốt. Thứ hai, họ không có
khả năng thích ứng đủ nhanh với những thay đổi trong nhu cầu của khách hàng. Thứ ba,
mặc dù các ngân hàng phân khúc khách hàng qua các nhà quản lý địa phương, vẫn khó
phát hiện các mẫu khách hàng theo cách thủ công, đặc biệt nếu họ quản lý một số lượng
lớn khách hàng. Những tính năng này tạo ra nhu cầu của các phương pháp tự động có thể
phát hiện các mẫu hành vi không tầm thường của khách hàng có thể đề xuất trước sự xáo
trộn tiềm năng trong các tập dữ liệu khổng lồ này. Những đặc điểm này thúc đẩy việc sử
dụng các kỹ thuật học máy, cung cấp các phương pháp học có giám sát đã chứng minh

Trang 13
tìm hiểu các mẫu không tầm thường trong dữ liệu (không có sự can thiệp của con người)
và khái quát hóa tốt cho dữ liệu chưa từng thấy trước đó.

Tuy nhiên, không phải tất cả khách hàng đều cần mức độ dịch vụ giống nhau,
cũng như tất cả họ đều sẵn sàng trả tiền như nhau cho dịch vụ đó hoặc để có được dịch vụ
theo cùng một cách. Ý thức chung cho chúng ta biết rằng không thể thực hiện một cách
trọn vẹn, trong một môi trường ngày càng không đồng nhất, nhiệm vụ khó khăn là phát
triển lòng trung thành của tất cả khách hàng. Vì lý do này, bắt đầu từ sự chắc chắn rằng
khách hàng không hài lòng sẽ luôn tồn tại, các công ty phải tập trung nỗ lực vào việc phát
triển một chương trình duy trì trên phạm vi rộng, duy trì và cải thiện các khía cạnh đó của
ưu đãi và các rào cản để thay đổi điều đó tác động nhiều nhất và tốt nhất đến liên kết tổng
thể của khách hàng như một nhóm. Mục tiêu không phải là bảo vệ tất cả khách hàng, mà
là bảo vệ càng nhiều khách hàng càng tốt và đặc biệt là những người có giá trị nhất đối
với một công ty nhất định.

Mặt khác, mặc dù các khoảng thời gian quan trọng làm tăng thời gian cho phép
phản ứng của ngân hàng, chúng cũng có thể dễ dàng dẫn đến kết quả không nhất quán do
có thể có sự thay đổi trong môi trường Giai đoạn này. [6] kết luận rằng những thay đổi
liên quan trong nền kinh tế, sự gián đoạn trong mô hình kinh doanh hoặc thậm chí là
khủng hoảng chính trị hoặc tài chính có thể ảnh hưởng đến xu hướng rời bỏ ngân hàng
của khách hàng. Tất cả những điều này cho thấy cần phải tìm ra sự cân bằng tối ưu giữa
độ chính xác của các dự đoán và thời gian phản ứng cho phép. Vì lý do này, điều cần
thiết là phải xác định trước thời gian chúng ta muốn và chúng ta có thể biết liệu khách
hàng có xu hướng churn hay không. Câu trả lời này phụ thuộc vào nhu cầu của ngân hàng
và cũng là một thách thức đáng kể.

Tuy nhiên, và mặc dù sự hài lòng của khách hàng có ảnh hưởng tích cực đến mức
độ liên kết, nhưng điều đó không phải lúc nào cũng đủ. Có nhiều tình huống trong đó
chất lượng dịch vụ tốt hơn không có tác động đáng kể đến lòng trung thành của người
tiêu dùng: ví dụ: khách hàng thay đổi ngân hàng do ủng hộ người quen, khách hàng
Trang 14
không rõ về thông tin sản phẩm, thái độ của nhân viên đối khách hàng,... Do đó, còn phải
có các yếu tố khác, ngoài sự hài lòng với dịch vụ, ảnh hưởng đến lòng trung thành của
khách hàng.

Trong thời gian tồn tại tự nhiên của khách hàng, có thể xảy ra những thay đổi bên
ngoài như sự xuất hiện của sản phẩm mới, sự thay đổi trong cung cấp của đối thủ cạnh
tranh, thay đổi công nghệ và / hoặc thay đổi nội bộ (nâng cao trình độ hiểu biết của khách
hàng hoặc tăng khả năng chuyên môn của họ, thay đổi kinh tế xã hội , v.v.) xảy ra có thể
ảnh hưởng đến kỳ vọng của khách hàng và kết quả là mức độ hài lòng của họ. Các công
ty phải theo dõi những thay đổi này để điều chỉnh các chính sách và thủ tục của họ sao
cho họ có thể duy trì và cải thiện ý kiến của khách hàng về dịch vụ được cung cấp. Quá
trình phân tích các khía cạnh có tác động nhiều nhất đến sự hài lòng và sự điều chỉnh tiếp
theo trong các thủ tục và chính sách thương mại phải trở thành một quá trình liên tục theo
thời gian.

Mặt khác, ở góc độ hoạt động, việc thỉnh thoảng hỏi ý kiến của tất cả các khách
hàng là không thể, với chi phí cao, thậm chí không thể thỉnh thoảng hỏi ý kiến của họ
(thậm chí còn hơn thế nữa trong trường hợp các công ty có quy mô hàng trăm nghìn hoặc
thậm chí hàng triệu khách hàng đang hoạt động) về sự hài lòng nhận thấy về dịch vụ mà
họ đang được cung cấp và / hoặc mức độ gắn kết của họ. Do đó, các công ty phải làm
việc với đủ mẫu đại diện và phát triển, dựa trên phân tích của họ, các chính sách thương
mại phù hợp.

Để bền vững, các rào cản đối với sự thay đổi phải được xây dựng, như sự hài lòng,
dựa trên nhận thức của khách hàng. Bằng cách này, sự phát triển tích cực của các rào cản
đối với sự thay đổi trở thành một yếu tố xuất sắc, bên cạnh sự hài lòng về dịch vụ, điều
mà đối thủ cạnh tranh khó vượt qua trong nỗ lực thu hút khách hàng tốt nhất. Việc xây
dựng các chính sách và thủ tục nhằm duy trì và cải thiện sự xuất sắc ở cả hai khía cạnh
(sự hài lòng và các rào cản đối với sự thay đổi) nên hoạt động như những công cụ phòng
ngừa để bảo vệ khách hàng khỏi bị các đối thủ cạnh tranh dụ dỗ.
Trang 15
Nỗ lực kinh doanh này — được đo lường dưới dạng chiết khấu, lợi ích và đặc
quyền dành cho khách hàng để họ loại bỏ ý định thay đổi nhà cung cấp — cần được cân
bằng với giá trị mong đợi của khách hàng. Điều này có nghĩa là có thể có những khách
hàng mà công ty sẽ quyết định không giữ lại ngay cả khi ý định thay đổi của họ đã được
xác định trước, vì lợi nhuận kỳ vọng khi kéo dài tuổi thọ khách hàng của họ không đủ
cho chi phí của hành động thương mại cần thiết.

b. Cơ sở lý thuyết xác định khách hàng trung thành rời bỏ

Churn rate

Churn rate là tỷ lệ khách hàng (quan sát ) churn trên tổng số lượng khách hàng ( tổng
quan sát ) tại cùng một thời điểm.Tỷ lệ churn tiêu chuẩn thường được gọi là tỷ lệ churn
khách hàng vì nó đề cập đến tình trạng ngừng hoạt động hoàn toàn của một chủ tài khoản
có thể có nhiều đăng ký. Vì vậy, đối với tỷ lệ churn tiêu chuẩn, một chủ tài khoản hủy
một đăng ký nhưng vẫn giữ một đăng ký khác không được coi là bỏ qua.

Kháchhàng churn
Công thức: Churn rate=
Tổng khách hàng

Retention rate

Trái ngược với churn rate ta có Retention rate (tỷ lệ giữ chân khách hàng ), được tính
bằng khách hàng trung thành trên tổng số lượng khách hàng ( tổng quan sát ) tại cùng một
thời điểm.

Khách hàng Retention


Công thức: Retention rate=
Tổng khách hàng

Mối quan hệ giữa churn rate và retention rate

Trang 16
Đây là một thực tế quan trọng về tỷ lệ churn ( churn rate ) và tỷ lệ duy trì( Retention
rate): chúng có liên quan theo một cách rất chính xác và là hai mặt của cùng một đồng
tiền.

Công thức: Churn rate + Retention rate=100 %

Các Phương pháp xác định churn rate

Net retention rate (NRR)

Tỷ lệ duy trì ròng (NRR) là tỷ lệ doanh thu định kỳ mà công ty hay tổ chức vẫn nhận
được vào cuối kỳ từ những người đăng ký có mặt lúc đầu. Giống như tất cả các đảm bảo
về khách hàng churn và khách hàng duy trì, tỷ lệ duy trì ròng được đo lường trong một
khoảng thời gian cụ thể (thường là một năm). Giống như tất cả các thước đo churn, tỷ lệ
giữ chân ròng bỏ qua doanh thu mới có được từ các lần đăng ký trong khoảng thời gian.
Mặt khác, một thực tế quan trọng về tỷ lệ giữ chân thực là nó bao gồm những thay đổi về
doanh thu từ những người đăng ký được giữ lại nếu điều này xảy ra. Điều này có thể xảy
ra đối với bất kỳ sản phẩm hoặc dịch vụ nào có nhiều gói sản phẩm, số lượng không hợp
lý tạm thời hoặc thay đổi gói giá (hầu hết các gói đăng ký trả phí).

Ví dụ:

Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_ Trang_thai


dịch doanh_thu thu_hang_thang(MRR)

00000001 5-Feb-16 31-Jan-18


5,000,000

00000002 9-Apr-16 31-Jan-18


10,000,000

Trang 17
Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_ Trang_thai
dịch doanh_thu thu_hang_thang(MRR)

00000003 10-Nov-16 31-Jan-18


1,000,000

00000004 4-Jan-17 31-Jan-18


550,000

00000005 5-May-17 31-Jan-18


3,000,000

00000001 5-Feb-16 28-Feb-18


5,000,000

00000002 9-Apr-16 28-Feb-18 - Churn

00000003 10-Nov-16 28-Feb-18


1,000,000

00000004 4-Jan-17 28-Feb-18


550,000

00000005 5-May-17 28-Feb-18


3,000,000

00000006 4-Feb-18 28-Feb-18 New


100,000

Trang 18
Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_ Trang_thai
dịch doanh_thu thu_hang_thang(MRR)

00000007 5-Feb-18 28-Feb-18 New


500,000

Bảng:

Để tính NRR là MRR của những khách hàng đã ở lại (tổng số khách hàng 1, 3, 4
và 5 trên 28/02/2018 hoặc 9,550,000) chia cho MRR của những người đã sử dụng
dịch vụ lúc đầu (19,550,000 ) , hoặc 9,550,000 / 19,550,000 = 48.85%

Tỷ lệ giữ chân ròng = 9,550,000 / 19,550,000 = 48.85%

Tỷ lệ churn ròng =100% - 48.85% = 51.15%

Tỷ lệ giữ chân ròng là phép đo duy nhất liên quan đến thời gian chờ thường được trích
dẫn hơn là tỷ lệ giữ chân chứ không phải tỷ lệ churn. Điều này một phần là do các tình
huống phát sinh trong các gói đăng ký nhiều mức giá, đặc biệt là khả năng mất thời
gian ròng âm (mặt khác, tỷ lệ giữ chân thực luôn dương).

● Vì cách tính thời gian hoạt động dựa trên NRR, khách hàng trả nhiều tiền hơn
có tác động lớn hơn đến tỷ lệ khi họ rời đi.
● Những thay đổi về NRR đối với những khách hàng không rời đi cũng ảnh
hưởng đến tỷ lệ.

Tỷ lệ giữ chân ròng và Tỷ lệ churn ròng dựa trên doanh thu khác với tỷ lệ churn(tiêu
chuẩn) dựa trên số lượng người đăng ký. Tác động của việc bán thêm đối với những
người đăng ký được giữ lại có thể bù đắp hiệu quả tình trạng ngừng hoạt động, và việc
giảm doanh số giữa những người đăng ký được giữ lại có thể làm tăng hiệu quả tình
Trang 19
trạng ngừng hoạt động. Việc tăng giá và hết thời gian giảm giá làm giảm tỷ lệ churn
rõ ràng trong tỷ lệ giữ chân ròng, điều này làm cho nó trở thành một phép đo ít cụ thể
hơn về tình trạng churn và ít hữu ích hơn để chống lại tình trạng churn. Độ churn tiêu
chuẩn (dựa trên số lượng) và độ churn MRR được mô tả trong các phần sau là các
phép đo cụ thể hơn về độ churn và được ưu tiên hơn.

Một lý do có cơ sở hơn một chút là bất cứ khi nào hàng bán tăng cao hơn lượng bán
giảm, tỷ lệ churn ròng (bắt nguồn từ 100% trừ đi tỷ lệ duy trì ròng) ít hơn so với tỷ lệ
churn tiêu chuẩn (dựa trên số lượng) bỏ qua các thay đổi về doanh thu. Như tôi vừa
giải thích, những thay đổi về doanh thu thuần (hàng bán thêm và hết hạn chiết khấu
trừ đi hàng bán) che giấu một cách hiệu quả tỷ lệ churn cơ bản thực sự. Đối với nhiều
công ty, việc báo cáo tỷ lệ giữ chân ròng thay vì một trong các phép đo thời gian cụ
thể hơn là một vấn đề của mối quan hệ đầu tư tốt hơn và một chút sai lệch về các
nguyên tắc kinh doanh cơ bản. Trong những trường hợp cực đoan, sự gia tăng trong
nhóm doanh thu từ hàng bán thêm có thể lớn hơn tác động tổng hợp của việc giảm
lượng hàng bán ra và làm giảm nguồn doanh thu. Đây là một kịch bản hiếm gặp
nhưng rất đáng mong đợi, được gọi là rối loạn tiêu cực.

Tỷ lệ churn tiêu chuẩn

Tỷ lệ churn dựa trên tài khoản tiêu chuẩn có ý nghĩa đơn giản nhất vì nó không bị ảnh
hưởng bởi các đợt bán thêm, giảm giá và hết hạn chiết khấu. Nó luôn đơn giản đề cập
đến tỷ lệ khách hàng hoàn toàn hủy bỏ dịch vụ. Tỷ lệ churn tiêu chuẩn được sử dụng
làm chỉ số hoạt động chính khi tất cả người đăng ký trả số tiền tương tự hoặc đăng ký
miễn phí. Nếu tất cả người đăng ký trả tiền giống hệt nhau (nghĩa là không có chiết
khấu hoặc bất kỳ biến thể nào hoặc sản phẩm miễn phí), thì thời gian churn tiêu chuẩn
có thể được tính bằng truy vấn tỷ lệ giữ chân thực hoặc truy vấn tỷ lệ churn tiêu
chuẩn. Nhưng nếu có sự thay đổi nhỏ về giá cả hoặc nếu có các khoản chiết khấu tạm

Trang 20
thời, thì bạn nên sử dụng phương pháp tính churn tiêu chuẩn được đưa ra trong phần
này. Hoạt động của người dùng có xu hướng được nhóm lại, do đó, việc coi khoảng
thời gian hoạt động là một chuỗi các sự kiện là điều tự nhiên mà không có khoảng
cách lớn giữa hai sự kiện liên tiếp bất kỳ. Nếu vượt quá giới hạn thời gian tối đa, đó
được coi là bỏ cuộc. Giới hạn thời gian như vậy nên được đặt đủ lâu để hầu hết những
người làm việc vượt quá giới hạn sẽ không quay lại, ít nhất là trong một thời gian.
( phù hợp với Ngân hàng)

Ví dụ:

Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_thu_hang_thang Trang_thai


dịch doanh_thu (MRR)

00000001 5-Feb-16 31-Jan-18 5,000,000

00000002 9-Apr-16 31-Jan-18 10,000,000

00000003 10-Nov-16 31-Jan-18 1,000,000

00000004 4-Jan-17 31-Jan-18 550,000

00000005 5-May-17 31-Jan-18 3,000,000

00000001 5-Feb-16 28-Feb-18 5,000,000

00000002 9-Apr-16 28-Feb-18 - Churn

00000003 10-Nov-16 28-Feb-18 1,000,000

Trang 21
Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_thu_hang_thang Trang_thai
dịch doanh_thu (MRR)

00000004 4-Jan-17 28-Feb-18 550,000

00000005 5-May-17 28-Feb-18 3,000,000

00000006 4-Feb-18 28-Feb-18 100,000 New

00000007 5-Feb-18 28-Feb-18 500,000 New

Bảng:

Để tính churn tiêu chuẩn là những khách hàng đã ở lại (tổng số khách hàng
1, 3, 4 và 5 trên 28/02/2018 chia cho MRR của người đã sử dụng dịch vụ
lúc đầu.

Tỷ lệ giữ chân =4 / 5 = 80%

Tỷ lệ churn =100% - 80% = 20%

Churn rate nâng cao (Doanh thu định kỳ hàng tháng - MRR )

Tỷ lệ churn tiêu chuẩn có thể có vấn đề với các sản phẩm đăng ký nhiều mức giá. Tỷ
lệ churn tiêu chuẩn bỏ qua lượng bán giảm, điều này nên được coi là một phần của
thời gian ngừng hoạt động, trong khi tỷ lệ duy trì ròng bao gồm lượng bán giảm
nhưng cũng bao gồm hàng bán tăng thêm, không nên được coi là churn. Có một biện

Trang 22
pháp khác được thực hiện cho tình huống này: MRR churn. Đây là cách tính churn
phúc tạp nhất, nhưng nó là chính xác nhất khi có nhiều sản phẩm và giá cả của tập
lệnh phụ. Sử dụng MRR churn nếu bạn có những khách hàng trả nhiều mức giá khác
nhau: nghĩa là những khách hàng có giá trị nhất của bạn trả gấp đôi mức giá thấp nhất
của bạn trở lên. Trong phần mềm B2B dành cho doanh nghiệp, những khách hàng có
giá trị nhất có thể trả nhiều hơn gấp 100 lần những khách hàng ít giá trị nhất và MRR
churn là điều cần thiết tuyệt đối trong các tình huống như vậy. MRR churn một lần
nữa là tỷ lệ lỗ so với trạng thái ban đầu, nhưng bây giờ tử số của tỷ lệ churn là tổng số
lỗ từ cả số lần bán chạy và giảm, trong khi mẫu số là doanh thu của khách hàng khi
bắt đầu. minh họa cho các tính toán hỗn loạn với bán tăng và giảm bán, chu kỳ MRR
bao gồm mất hoàn toàn MRR từ các chu kỳ hoàn toàn (xu hướng từ trên xuống hướng
xuống trong hình 2.6) cũng như tổn thất do bán giảm (hình lưỡi liềm hướng xuống thứ
hai trong Hình 2.6) là tử số. Nó bao gồm MRR được giữ lại dưới dạng giá trị tự nhiên
nhưng không bao gồm MRR bán thêm. Vì lý do này, đây là thước đo chính xác nhất
để đánh giá tình hình hoạt động của các sản phẩm đăng ký đa giá.

Ví dụ:

Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_thu_hang_ Trang_thai


dịch doanh_thu thang(MRR)

00000001 5-Feb-16 31-Jan-18 5,000,000

00000002 9-Apr-16 31-Jan-18 10,000,000

00000003 10-Nov-16 31-Jan-18 1,000,000

00000004 4-Jan-17 31-Jan-18 550,000

Trang 23
Customer_id Ngay_bat_dau_giao_ Ngay_ghi_nhan_ Doanh_thu_hang_ Trang_thai
dịch doanh_thu thang(MRR)

00000005 5-May-17 31-Jan-18 3,000,000

00000001 5-Feb-16 28-Feb-18 5,000,000

00000002 9-Apr-16 28-Feb-18 - Churn

00000003 10-Nov-16 28-Feb-18 500,000

00000004 4-Jan-17 28-Feb-18 550,000

00000005 5-May-17 28-Feb-18 3,000,000

00000006 4-Feb-18 28-Feb-18 100,000 New

00000007 5-Feb-18 28-Feb-18 500,000 New

Bảng:

Tỷ lệ churn MRR là MRR của những khách hàng còn lại hoặc bây giờ trả ít hơn
(10trd vnd từ khách hàng 2, người đã churn, và 0.5 trd vnd thay đổi so với khách
hàng 3, người đã hạ cấp, cho một tổng là 9.05trd vnd ) chia cho MRR của tất cả
các khách hàng lúc bắt đầu (19,550)

MRR churn = 9.05/ 19.55 = 46.29%

So sánh các phương pháp


Trang 24
Một tình huống khá phổ biến không thích hợp để sử dụng Tỷ lệ churn theo doanh thu là
đối với các kịch bản phụ có kế hoạch hàng năm với Tỷ lệ churn theo doanh thu thấp hơn
kế hoạch hàng tháng. Các khách hàng sử dụng sản phẩm, dịch vụ có thể chốt ở mức thấp
nhưng cam kết cả năm bằng cách trả trước. Điều này thường tốt cho việc kinh doanh thuê
bao vì nếu thực hiện đúng, nó sẽ dẫn đến giá trị lâu dài hơn cho người đăng ký. Tuy
nhiên, nó sẽ được coi là giảm giá khi người đăng ký chuyển từ gói hàng tháng kế hoạch
hàng năm và những thay đổi như vậy sẽ có tác động tiêu cực đến tỷ lệ churn được báo
cáo. Trong trong tình huống như vậy, có lẽ tốt hơn là sử dụng tỷ lệ churn tiêu chuẩn.

Tỷ lệ churn theo doanh thu là thích hợp nhất khi có sự khác biệt thực sự lớn giữa Tỷ lệ
churn theo doanh thu của các loại tài khoản khác nhau: trong bán hàng phần mềm B2B,
các tài khoản lớn có thể dễ dàng thanh toán gấp 10 lần hoặc hơn số tiền của các tài khoản
nhỏ. Đối với các công ty có sự khác biệt trong giá cả của họ, thường có một mối quan hệ
nhất quán giữa ba thước đo thời gian.

Tỷ lệ churn tiêu chuẩn > Tỷ lệ churn theo doanh thu > Tỷ lệ churn ròng

  Tiêu chí đánh giá

Cách

tính churn Sản phẩm Biến động giá Quy mô Khách hàng

Có ít sản Biến động giá ít giữ


Tỷ lệ churn ròng phẩm dòng sản phẩm Tổ chức nhỏ Doanh ngiệp

Có nhiều
dòng sản Biến động giá
Tỷ lệ churn tiêu phẩm đa nhiều giữ dòng sản Cá nhân/ doanh
chuẩn dạng phẩm Tổ chức lớn nghiệp

Tỷ lệ churn theo Có ít sản Biến động giá ít giữ Tổ chức lớn Doanh ngiệp
Trang 25
doanh thu phẩm dòng sản phẩm

Bảng

Chúng ta có thể mong đợi rằng Tỷ lệ churn theo doanh thu thường sẽ cao hơn thước đo
Tỷ lệ churn tiêu chuẩn vì Tỷ lệ churn theo doanh thu bao gồm tác động của việc bán
giảm, nhưng churn tiêu chuẩn thì không. Tuy nhiên, hầu như luôn luôn xảy ra trường hợp
các tài khoản trả nhiều tiền hơn thường xuyên hơn các tài khoản trả ít hơn cho các sản
phẩm đa giá. Những người đăng ký trả ít nhất hầu như luôn luôn kiếm được nhiều tiền
hơn. Điều này có vẻ nghịch lý nếu chúng ta không làm việc trên một sản phẩm như vậy,
theo logic rằng trả nhiều tiền hơn sẽ khiến khách hàng không hài lòng hơn. Tuy nhiên,
trong các sản phẩm B2B, giá cao hơn sẽ đến với những người đăng ký công ty lớn sử
dụng sản phẩm nhiều hơn (có nhiều người dùng hơn), và các công ty lớn hơn hầu như
luôn ổn định hơn các công ty nhỏ hơn. Ngoài ra, các công ty lớn hơn trả nhiều tiền hơn
có xu hướng cam kết sử dụng sản phẩm lâu hơn vì họ đã có một quá trình cân nhắc lâu
hơn trước khi mua hàng và đầu tư nhiều hơn vào việc thiết lập và vận hành sản phẩm
đăng ký. Do đó, Tỷ lệ churn theo doanh thu tính tất cả người đăng ký như nhau hầu như
luôn cao hơn Tỷ lệ churn theo doanh thu cho một sản phẩm B2B.

Tỷ lệ churn ròng được tính từ việc duy trì ròng hầu như luôn luôn là ít nhất trong tất cả
các biện pháp churn. Điều này là do, ngoài việc phản ánh tỷ lệ gián đoạn thấp của những
người đăng ký công ty lớn, nó cũng tính số tiền bán lại trong các tài khoản được giữ lại
so với t Tỷ lệ churn tiêu chuẩn. Như đã đề cập trước đây, tỷ lệ churn ròng được tính từ
khách hàng giữ lại ròng thậm chí có thể là âm khi hàng bán tăng cao hơn lượng bán
xuống và số lần bán chạy.

1.1. Dự đoán khách hàng trung thành rời bỏ

Churn predict

Trang 26
Dự đoán Churn là một nhiệm vụ phân tích yếu tố của kinh doanh nhằm phát hiện những
khách hàng có khả năng tự ý rời bỏ công ty. Khi một công ty đã xác định được những
người không thích tiềm năng, một chiến dịch duy trì tùy chỉnh có thể được thiết kế để
nâng cao lòng trung thành của khách hàng. Lòng trung thành cực kỳ có lợi vì những
khách hàng gắn bó tạo ra nhiều doanh thu hơn những khách hàng khác, đồng thời nó làm
giảm chi phí hoạt động và việc tiêu tiền do những nỗ lực tiếp thị không hiệu quả gây ra.

Sự thành công của các chiến dịch giữ chân không chỉ phụ thuộc vào độ chính xác của
việc dự đoán những churn tiềm năng, mà với tầm quan trọng không kém, nó phụ thuộc
vào thời điểm dự đoán được thực hiện. Các công trình trước đây liên quan đến dự đoán
thời gian không hoạt động đã trình bày các mô hình dự đoán thời gian gián đoạn hàng
tháng với trọng tâm là hành vi tĩnh của khách hàng và thậm chí các nghiên cứu xem xét
hành vi động của khách hàng, chủ yếu xem xét hành vi cấp độ hàng tháng. Tuy nhiên,
hành vi của khách hàng dễ bị thay đổi theo các ngày trong tháng và trong thời gian dẫn
đến quyết định bỏ qua của khách hàng, họ bắt đầu cư xử khác. Do đó, việc xem xét các
đặc điểm hành vi hàng tháng ảnh hưởng tiêu cực đến hiệu suất dự đoán, vì nó bỏ qua
những thay đổi trong hành vi qua các ngày trong tháng. Hơn nữa, việc dự đoán khách
hàng churn đi hàng tháng sẽ là muộn đối với những khách hàng đã quyết định rời đi vào
đầu tháng vì họ sẽ không bị phát hiện là người quấy rầy cho đến tháng sau.

Dự đoán Churn đã được thực hiện bằng cách sử dụng các kỹ thuật khác nhau bao gồm
học dự đoán và giữ chân những khách hàng khó tính, giúp đưa ra quyết định và chuyển
thông tin sang CRM. Quá trình phát triển của khách hàng phải được theo dõi và phải ước
tính số lượng khách hàng có nguy cơ rời bỏ. Đó là lý do tại sao các công ty phải có một
mô hình dự đoán đáng tin cậy (được điều chỉnh cho phù hợp với nghiên cứu thị trường và
dựa trên thông tin hành vi được công ty thu thập một cách có hệ thống) cho phép họ xác
định — với đủ dự đoán — những khách hàng có xu hướng chuyển đổi nhà cung cấp dịch
vụ và, do đó, khởi chạy các hành động giữ chân hiệu quả. Theo phép ẩn dụ y học, việc
chẩn đoán sớm xu hướng mắc bệnh sẽ làm giảm đáng kể mức độ tích cực của phương
Trang 27
pháp điều trị gắn kết lòng trung thành bắt buộc và sẽ tăng khả năng phục hồi của khách
hàng. Trong bối cảnh này, giá trị của khách hàng (được hiểu là giá trị của khách hàng là
tổng giá trị lặp lại thực tế và giá trị tiềm năng của họ) trở thành thứ nguyên cơ bản sẽ xác
định loại liệu pháp nào, chủ động và / hoặc phản ứng, nên được áp dụng bất kỳ lúc nào.

Vấn đề dự đoán churn có thể được giải quyết thông qua học có giám sát, chuyển nhiệm
vụ thành một bài toán phân loại nhị phân. Máy học có thể được sử dụng để dự đoán
khách hàng nào có nhiều khả năng sẽ chấp nhận hơn . Với nhiều loại kỹ thuật dự đoán,
chiến lược thông thường để chọn đúng là xây dựng một số mô hình và đánh giá hiệu suất
dự đoán của chúng bằng cách sử dụng các biện pháp thống kê. Tuy nhiên, cách tiếp cận
này gần đây đã bị chỉ trích vì nó xa rời mục tiêu chính của quá trình học tập, đó là thực
hiện hành động có lợi cho khách hàng thông qua các chiến dịch duy trì [43, 44]. Theo
nghĩa này, các số liệu định hướng mục tiêu đã được phát triển trong những năm gần đây
để giải quyết vấn đề dự đoán churn, tính toán lợi nhuận kỳ vọng của một chiến dịch giữ
chân [20, 44].

c. Dự đoán khách hàng trung thành rời bỏ

2.2.2. Máy học và giải thuật học máy điển hình

a. Máy học

b. Các giải thuật

2.3. Môi trường thực hiện

Chương 3: ĐỀ XUẤT MÔ HÌNH

3.1. Quy trình thực nghiệm


3.1.1. Sơ đồ thực hiện

Trang 28
3.1.2. Diễn giải quy trình

3.2. Mô tả dữ liệu 
3.2.1. Thu thập dữ liệu

3.2.2. Phương định nghĩa tiêu chí 

3.2.3. Tiền xử lý dữ liệu

3.2.4. Xác định mối quan hệ giữa biến phụ thuộc và biến độc lập

3.3. Xây dựng mô hình

Chương 4: ĐÁNH GIÁ KẾT QUẢ VÀ BÀN LUẬN

4.1. Phương pháp lựa chọn và Đánh giá mô hình

4.2. Lựa chọn mô hình tốt cho bài toán dự đón khách hàng rời bỏ
ngân hàng

4.3. Hiện thực hóa Mô hình

Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Tổng quả kết quả nghiêm cứu

5.2. Hướng phát triển

TÀI LIỆU THAM KHẢO


[1] Gupta, S., Lehmann, D. R., & Stuart, J. A. (2004). Valuing customers. Journal of marketing
research, 41(1), 7-18.

Trang 29
[2] Reichheld, F. F. (1996). Learning from customer defections. Harvard business review, 74(2), 56-67.
3] Mark R. Colgate &  Peter J. Danaher  Journal of the Academy of Marketing
Science volume 28, pages375–387 (2000)

PHỤ LỤC

Trang 30

You might also like