You are on page 1of 14

Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Machine Learning VÀ ỨNG DỤNG


TRONG XẾP HẠNG TÍN DỤNG KHÁCH HÀNG CÁ NHÂN
TẠI CÁC NGÂN HÀNG THƯƠNG MẠI Việt Nam
PGS. TS Nguyễn Hữu Tài
Trường Đại học Kinh tế Quốc dân
NCS. ThS. Đặng Hương Giang1
Trường Đại học Kinh tế Kỹ Thuật Công nghiệp
Tóm tắt
Hệ thống phần mềm chấm điểm xếp hạng tín dụng (XHTD) khách hàng cá nhân
hiện nay của các ngân hàng thương mại (NHTM) mới chỉ dừng lại ở mức đưa dữ liệu,
thông tin khách hàng vào hệ thống và trả lại kết quả là điểm XHTD của khách hỗ trợ cán
bộ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức độ
chính xác cao nhưng vẫn có sai số nhất định. Sẽ thế nào nếu một khách hàng đến xin vay
tại NH này và bị từ chối vì điểm XHTD thấp nhưng được một NH khác cho vay và là một
khách hàng tốt, luôn trả nợ đúng hạn? Hay ngược lại, một khách hàng có điểm XHTD
tốt được ngân hàng cho vay nhưng sau đó lại trở thành một khoản nợ xấu với ngân hàng.
Đây là 2 trường hợp thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của
các NHTM. Câu hỏi đặt ra là liệu có thể nâng cao độ chính xác trong đánh giá khách
hàng không? Làm thế nào để không bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những
khách hàng không thực sự tốt như thể hiện bên ngoài? Hệ thống Machine Learning với
nền tảng Big Data có thể giải quyết vấn đề này.
Từ khóa: Machine Learning, ngân hàng thương mại, xếp hạng tín dụng, Big Data
Machine Learning applications in personal credit ratings
of Vietnam Commercial Banks
Abstract
With current credit score software system for individual clients of commercial banks,
it is only set up to input data and customer’s information into the system and the returned
result is customer’s credit score which help loan officer to make lending decision. However,
this is a rigid, inflexible evaluation way. Although the current system has high accuracy,
it still has errors in measurement. What happens if a customer applies a loan at a bank

1
Email: danghuonggiang1902@gmail.com

87
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

and his/her loan application is rejected because of low credit score but that same person
and loan application is approved by other bank and become a customer with good credit
and always pay on time. Or in an opposite situation, a customer with good credit score is
qualified for a loan but that loan is becoming a bad credit loan for the bank. These are 2
situations showing the failure of current credit score software system at commercial banks.
Is there any way to increase the accuracy in evaluating customers? How do we avoid missing
potential customers or prevent and get rid of customers that are not as good as they are
showing. The Machine Learning system with Big Data base can help solving this problem.
Keywords: Machine Learning, Commecial bank, credit ratings, Big Data, Artificial
intelligence.

1. Lời mở đầu
Những năm gần đây, sau khi phải đối mặt với những rủi ro lớn gây tổn thất cho ngân
hàng, đặc biệt là rủi ro tín dụng xảy ra với tần suất khá cao, giá trị lớn, các ngân hàng
thương mại Việt Nam đã chú trọng nhiều hơn đến hoạt động quản trị rủi ro tín dụng
trong kinh doanh và dần tiếp cận tới các chuẩn mực quản trị rủi ro và đánh giá tín dụng
(Credit Scoring) theo Hiệp ước quốc tế Basel II vào hoạt động quản trị rủi ro của mình.
Đây được cho là hướng đi đúng của các ngân hàng khi một mặt, họ vẫn có thể hút
khách hàng qua những sản phẩm, dịch vụ hấp dẫn, mặt khác, họ cần trang bị cho mình
những công cụ, phương pháp đánh giá khả năng chi, trả của mỗi khách hàng, qua đó dễ
dàng đưa ra quyết định cấp vốn.
Cùng với sự phát triển của cuộc Cách mạng công nghiệp 4.0, những tiến bộ trong
khoa học công nghệ đã cho phép các đơn vị tài chính, ngân hàng, giảm rủi ro cho vay
qua việc phân tích nhiều dữ liệu khác nhau về khách hàng. Bằng các kỹ thuật thống
kê, Machine Learning, các dữ liệu này được phân tích và cô đọng đưa ra một giá trị duy
nhất được gọi là điểm tín dụng thể hiện tính rủi ro cho vay. Điểm tín dụng càng cao, mức
độ tín dụng của khách hàng càng lớn. Đánh giá tín dụng có thể áp dụng Trí tuệ nhân tạo
(Artificial Intelligence), dựa trên mô hình tiên đoán, đánh giá khả năng chi trả món vay
của khách hàng: đúng hạn, trễ hạn hoặc không đủ khả năng thanh toán.
Lợi ích lớn nhất của đánh giá tín dụng là giúp các công ty tài chính, ngân hàng đưa
ra quyết định nhanh chóng, hiệu quả trong việc chấp nhận hoặc từ chối món vay của
khách hàng, tăng hoặc giảm giá trị khoản vay, lãi suất, kỳ hạn. Nhờ tính chính xác và tốc
độ đưa ra quyết định nhanh như vậy, đã khiến cho đánh giá tín dụng trở thành nền tảng
của quản trị rủi ro trong các lĩnh vực như ngân hàng, viễn thông, bảo hiểm và bán lẻ.

88
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2. Tổng quan về xếp hạng tín dụng khách hàng cá nhân của NHTM
2.1. XHTD và vai trò của XHTD khách hàng cá nhân
XHTD là việc đưa ra nhận định về mức độ tín dụng đối với trách nhiệm tài chính;
hoặc đánh giá mức độ rủi ro tín dụng phụ thuộc các yếu tố bao gồm năng lực đáp ứng
các cam kết tài chính, khả năng dễ bị vỡ nợ khi các điều kiện kinh doanh thay đổi, ý thức
và thiện chí trả nợ của người đi vay.
Hệ thống XHTD của NHTM nhằm cung cấp những dự đoán khả năng xảy ra rủi ro
tín dụng có thể được hiểu là sự khác biệt về mặt kinh tế giữa những gì mà người đi vay
hứa thanh toán với những gì mà NHTM thực sự nhận được. Khái niệm rủi ro được xét
đến ở đây là một sự không chắc chắn hay một tình trạng bất ổn có thể ước đoán được
xác suất xảy ra. Khái niệm tín dụng được hiểu là quan hệ chuyển giao quyền sử dụng vốn
giữa người cho vay và người đi vay trên nguyên tắc có hoàn trả.
Hệ thống XHTD giúp NHTM quản trị rủi ro tín dụng bằng phương pháp tiên tiến,
giúp kiểm soát mức độ tín nhiệm khách hàng, thiết lập mức lãi suất cho vay phù hợp với
dự báo khả năng thất bại của từng nhóm khách hàng. NHTM có thể đánh giá hiệu quả
danh mục cho vay thông qua sự giám sát sự thay đổi dư nợ và phân loại nợ trong từng
nhóm khách hàng đã được xếp hạng, qua đó điều chỉnh danh mục theo hướng ưu tiên
nguồn lực vào những nhóm khách hàng an toàn.
Hệ thống XHTD là một công cụ quan trọng để tăng cường tính khách quan, nâng
cao chất lượng và hiệu quả của hoạt động tín dụng. Mô hình tính điểm tín dụng là
phương pháp lượng hóa mức độ rủi ro thông qua đánh giá thang điểm, các chỉ tiêu đánh
giá trong những mô hình chấm điểm được áp dụng khác nhau đối với từng loại khách
hàng. Khái niệm hiện đại về XHTD được tập trung vào các nguyên tắc chủ yếu bao gồm
phân tích tín nhiệm trên cơ sở ý thức và thiện chí trả nợ của người đi vay và từng khoản
vay; đánh giá rủi ro dài hạn dựa trên ảnh hưởng của chu kỳ kinh doanh và xu hướng khả
năng trả nợ trong tương lai; đánh giá rủi ro toàn diện và thống nhất dựa vào hệ thống
ký hiệu xếp hạng. Trong phân tích XHTD cần thiết sử dụng phân tích định tính để bổ
sung cho những phân tích định lượng. Các dữ liệu định lượng là những quan sát được
đo bằng số, các quan sát không thể đo lường bằng số được xếp vào dữ liệu định tính. Các
chỉ tiêu phân tích có thể thay đổi phù hợp với sự thay đổi của trình độ công nghệ và yêu
cầu quản trị rủi ro. Việc thu thập số liệu để đưa vào mô hình XHTD cần được thực hiện
một cách khách quan, linh động. Sử dụng cùng lúc nhiều nguồn thông tin để có được cái
nhìn toàn diện về tình hình tài chính của khách hàng vay.

89
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2.2. Một số mô hình XHTD khách hàng cá nhân


Nghiên cứu của Stefanie Kleimeier về mô hình điểm số tín dụng cá nhân áp dụng
cho các ngân hàng bán lẻ tại Việt Nam Stafanie Kleimeier đã tiến hành nghiên cứu chi
tiết nguồn số liệu được tổng hợp từ các NHTM tại Việt Nam theo hai mươi hai biến số
bao gồm độ tuổi, thu nhập, trình độ học vấn, nghề nghiệp, thời gian công tác, tình trạng
cư ngụ, giới tính, tình trạng hôn nhân, mục đích vay... để xác định mức ảnh hưởng của
các biến số này đến rủi ro tín dụng và qua đó thiết lập một mô hình điểm số tín dụng cá
nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam.
Nghiên cứu của Stefanie Kleimeier đã xây dựng mô hình chấm điểm tín dụng cá
nhân gồm hai phần là chấm điểm nhân thân và năng lực trả nợ, chấm điểm quan hệ với
ngân hàng như trình bày trong Bảng 1. Căn cứ vào tổng điểm đạt được để xếp loại theo
mười mức giảm dần từ Aaa đến D như trình bày trong Bảng 2. Tuy nhiên, công trình
nghiên cứu này không đưa ra cách tính điểm cụ thể cho từng chỉ tiêu, để vận dụng được
mô hình đòi hỏi các NHTM phải thiết lập thang điểm cho từng chỉ tiêu đánh giá phù hợp
với thực trạng và hệ thống cơ sở dữ liệu cá nhân tại ngân hảng mình.
Bảng 1: Ký hiệu XHTD cá nhân theo Stefanie Kleimeier

Điểm Xếp hạng Ý nghĩa xếp hạng


> 400 Aaa
Cho vay tối đa theo đề nghị của người vay
351 - 400 Aa
301 - 350 A
251 - 300 Bbb Cho vay theo tài sản đảm bảo
201 - 250 Bb Cho vay theo tài sản đảm bảo và đánh giá đơn vay vốn
151 - 200 B Yêu cầu đánh giá thận trọng đơn vay vốn và có tài sản đảm bảo đầy đủ
101 - 150 Ccc
Từ chối cho vay
51 - 100 Cc
0 - 50 C
0 D

Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring
for Vietnam’s Retail Banking Market

90
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Bảng 2: Chỉ tiêu chấm điểm XHTD cá nhân theo mô hình Stefanie Kleimeier

Bước 1: Chấm điểm nhân thân và năng lực trả nợ


Tuổi 18 - 25 tuổi 26 - 40 tuổi 40 - 60 tuổi > 60 tuổi
Trình độ học vấn Sau đại học Đại học, Cao đẳng Trung học Dưới trung học
Nghề nghiệp Chuyên môn Giúp việc Kinh doanh Hưu trí
Thời gian công tác < 0,5 năm 0,5 - 1 năm 1 - 5 năm > 5 năm
Thời gian làm công việc hiện tại < 0,5 năm 0,5 - 1 năm 1 - 5 năm > 5 năm
Tình trạng cư trú Nhà riêng Nhà thuê Sống cùng gia đình Khác
Số người phụ thuộc Độc thân 1 - 3 người 3 - 5 người > 5 người
Thu nhập hàng năm < 12 triệu đồng 12 - 36 triệu đồng 36 - 120 triệu đồng > 120 triệu đồng
Thu nhập gia đình hàng năm < 24 triệu đồng 24 - 72 triệu đồng 72 - 240 triệu đồng > 240 triệu đồng
Bước 2: Chấm điểm quan hệ với ngân hàng
Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Có trễ hạn ít hơn 30 Có trễ hạn trên
hàng (ngắn hạn) hạn ngày 30 ngày
Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Có trễ hạn trong 2 Có trễ hạn trước 2
hàng (dài hạn) hạn năm gần đây năm gần đây
Tổng giá trị khoản vay chưa trả < 100 triệu đồng 100 - 500 triệu 500 triệu đồng - 1 tỷ > 1 tỷ đồng
đồng đồng
Các dịch vụ khác đang sử dụng Tiền gửi tiết kiệm Thẻ tín dụng Tiền gửi tiết kiệm và Không
thẻ tín dụng
Số dư bình quân tài khoản tiết < 20 triệu đồng 20 - 100 triệu đồng 100 - 500 triệu đồng > 500 triệu đồng
kiệm trong năm trước đây

Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring
for Vietnam’s Retail Banking Market

Mô hình điểm số tín dụng cá nhân của FICO


Điểm số tín dụng (Credit score) cá nhân là một phương tiện kiểm soát tín dụng
được gán cho mỗi cá nhân tại một số nước phát triển giúp tổ chức tín dụng ước 20 lượng
mức rủi ro khi cho vay. Điểm tín dụng càng thấp thì mức rủi ro của nhà cho vay càng
cao. Fair Isaac Corp đã xây dựng mô hình điểm số tín dụng FICO thấp nhất là 300 và
cao nhất là 850 áp dụng cho cá nhân dựa vào tỷ trọng của 5 chỉ số phân tích được trình
bày trong Bảng 3.

91
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Bảng 3: Tỷ trọng các tiêu chí đánh giá trong mô hình điểm số tín dụng FICO

Tỷ trọng Tiêu chí đánh giá


35% Lịch sử trả nợ (Payment history): Thời gian trễ hạn càng dài và số tiền trễ hạn càng cao thì điểm số tín
dụng càng thấp
30% Dư nợ tại các tổ chức tín dụng (Amount owed): Nợ quá nhiều so với mức cho phép đặc biệt là đối với thẻ
tín dụng sẽ làm giảm điểm số tín dụng
15% Độ dài của lịch sử tín dụng (Length of credit history): Thông tin càng nhiều năm càng đáng tin và điểm
số tín dụng sẽ càng cao
10% Số lần vay nợ mới (new credit): Vay nợ thường xuyên bị xem là dấu hiệu có khó khăn về tài chính nên
điểm số tín dụng càng thấp
10% Các loại tín dụng được sử dụng (Types of credit used): Các loại nợ khác nhau sẽ được tính điểm số tín
dụng khác nhau
Nguồn http://en.wikipedia.org

Mô hình điểm số tín dụng FICO được áp dụng rộng rãi ở Mỹ do các thông tin liên
quan đến tình trạng tín dụng của mọi người có thể được ngân hàng rà soát dễ dàng qua
các công ty dữ liệu tín dụng (Credit reporting companies). Công ty dữ liệu tín dụng thực
hiện ghi nhận và cập nhật thông tin từ các tổ chức tín dụng, 21 phân tích và cho điểm
đối với từng người. Theo mô hình điểm số tín dụng của FICO thì người có điểm số tín
dụng ở mức 700 được xem là tốt, đối với cá nhân có điểm số tín dụng thấp hơn 620 sẽ có
thể bị ngân hàng e ngại khi xét cho vay.

3. Machine Learning và ứng dụng trong xếp hạng tín dụng khách
hàng cá nhân của NHTM
Với hệ thống phần mềm chấm điểm XHTD khách hàng cá nhân hiện nay của các
NHTM mới chỉ dừng lại ở mức đưa dữ liệu, thông tin khách hàng vào hệ thống và trả lại
kết quả là điểm XHTD của khách hỗ trợ cán bộ tín dụng ra quyết định. Tuy nhiên đây là
hình thức đánh giá cứng nhắc, tuy mức độ chính xác cao nhưng vẫn có sai số nhất định.
Sẽ thế nào nếu một khách hàng đến xin vay tại NH này và bị từ chối vì điểm XHTD thấp
nhưng được một NH khác cho vay và là một khách hàng tốt, luôn trả nợ đúng hạn? Hay
ngược lại, một khách hàng có điểm XHTD tốt được ngân hàng cho vay nhưng sau đó lại
trở thành một khoản nợ xấu với ngân hàng. Đây là 2 case thể hiện sự bất cập của phần
mềm chấm điểm tín dụng hiện tại của các NHTM. Với phần mềm hiện tại có thể giải
thích mức độ dự báo khả năng trả nợ trong tương lai của khách hàng không thể chính
xác hoàn toàn và ngân hàng chấp nhận sai số đó. Câu hỏi đặt ra là liệu có thể nâng cao

92
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

độ chính xác trong đánh giá khách hàng không? Làm thế nào để không bỏ lỡ các khách
hàng tiềm năng hoặc loại bỏ những khách hàng không thực sự tốt như thể hiện bên
ngoài? Hệ thống Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này.
3.1. Tổng quan về Trí tuệ nhân tạo, Machine Learning và Big Data
Trí tuệ nhân tạo hay trí thông minh nhân tạo (tiếng Anh: artificial intelligence hay
machine intelligence, (AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống nhân tạo
nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định
và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của Trí tuệ nhân tạo. Trí
thông minh nhân tạo là một trong những ngành trọng yếu của tin học. Trí thông minh
nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của
máy móc.
AI thể hiện một mục tiêu của con người, Machine Learning là một phương tiện được
kỳ vọng sẽ giúp con người đạt được mục tiêu đó. Và thực tế thì Machine Learning đã
mang nhân loại đi rất xa trên quãng đường chinh phục AI. Machine Learning và AI có
mối quan hệ chặt chẽ với nhau nhưng không hẳn là trùng khớp vì một bên là mục tiêu
(AI), một bên là phương tiện (Machine Learning). Chinh phục AI mặc dù vẫn là mục
đích tối thượng của Machine Learning, nhưng hiện tại Machine Learning tập trung vào
những mục tiêu ngắn hạn hơn như:
(1) Làm cho máy tính có những khả năng nhận thức cơ bản của con người như nghe,
nhìn, hiểu được ngôn ngữ, giải toán, lập trình,...
(2) Hỗ trợ con người trong việc xử lý một khối lượng thông tin khổng lồ mà chúng ta
phải đối mặt hàng ngày, hay còn gọi là Big Data.
Machine Learning theo định nghĩa cơ bản là ứng dụng các thuật toán để phân tích
cú pháp dữ liệu, học hỏi từ nó, và sau đó thực hiện một quyết định hoặc dự đoán về các
vấn đề có liên quan. Vì vậy, thay vì code phần mềm bằng cách thức thủ công với một bộ
hướng dẫn cụ thể để hoàn thành một nhiệm vụ cụ thể, máy được “đào tạo” bằng cách sử
dụng một lượng lớn dữ liệu (Big Data) và các thuật toán cho phép nó học cách thực hiện
các tác vụ và ngày càng thông minh hơn.
3.2. Ứng dụng của Machine Learning trong xếp hạng tín dụng khách hàng cá
nhân tại các NHTM Việt Nam
Nhiều tổ chức tài chính sử dụng các mô hình chấm điểm để giảm rủi ro trong đánh
giá tín dụng cũng như trong việc cấp và giám sát tín dụng. Các mô hình chấm điểm tín

93
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

dụng dựa trên các lý thuyết thống kê cổ điển được sử dụng rộng rãi. Tuy nhiên, các mô
hình này không dùng được khi có số lượng lớn dữ liệu đầu vào. Điều này ảnh hưởng đến
tính chính xác của dự báo dựa trên mô hình.
Theo nhiều nghiên cứu thực nghiệm, các kỹ thuật học máy cùng với các thuật toán
khai thác dữ liệu (data mining) khác dựa trên cách tính toán và chuyển đổi kiểu mới hoạt
động tốt hơn cho mục đích dự báo. Các thuật toán học máy được thiết kế để học từ một
lượng lớn dữ liệu lịch sử và sau đó tính toán ra kết quả dự báo. Lấy điểm tín dụng cho các
khoản vay từ các ngân hàng bán lẻ làm ví dụ. Quá trình kinh doanh điển hình cho việc
cung cấp dịch vụ cho vay là: nhận các hồ sơ vay vốn, đánh giá rủi ro tín dụng, ra quyết
định về việc cho vay và giám sát việc hoàn trả vốn gốc và lãi.
Trong quá trình đó, các vấn đề có thể xảy ra, chẳng hạn như làm thế nào để đẩy
nhanh tiến trình thẩm định tín dụng và làm thế nào để giám sát quá trình hoàn trả và
thực hiện can thiệp kịp thời khi khả năng vỡ nợ xuất hiện.
Để giải quyết hai vấn đề nêu trên, chúng ta có thể xây dựng hai mô hình trong hai
tiến trình khởi tạo vốn vay và tiến trình giám sát.
Trong quá trình khởi tạo, đối tượng cần kiểm tra bao gồm tất cả các ứng viên nộp
đơn xin vay vốn. Mô hình có thể được sử dụng để phân tích và học thông qua dữ liệu lịch
sử của các hồ sơ đăng ký vay vốn, qua đó đánh giá liệu một ứng viên mới có đủ tin cậy để
được vay hay không nếu các chỉ tiêu đặc trưng của người nộp đơn được cung cấp, như thu
nhập, tình trạng hôn nhân, tuổi, lịch sử tín dụng (chẳng hạn đã từng nợ xấu hay chưa),...
Trong quá trình giám sát, hệ thống kiểm tra dữ liệu của người được duyệt vay vốn.
Bằng cách sử dụng dữ liệu lịch sử hồ sơ hoàn trả và trạng thái đặc điểm của khách hàng
đã hoàn thành toàn bộ quá trình vay vốn, chúng ta có thể đào tạo mô hình khác để đưa
ra dự kiến về việc liệu khách hàng này có xác suất lớn hay không khả năng vỡ nợ; bằng
cách quan sát hồ sơ hoàn trả của người nộp đơn cho một vài giai đoạn hoàn vốn đầu tiên
và thay đổi các đặc tính, mô hình này sẽ giúp tạo ra các điều chỉnh mới dựa trên thông
tin cập nhật. Quy trình tự động này hiệu quả hơn về thời gian xử lý cũng như tính chính
xác so với cách làm truyền thống.
Tuy nhiên, có rất nhiều thuật toán học máy đang có sẵn, câu hỏi đặt ra là “Thuật
toán nào là tốt nhất?”. Không có câu trả lời rõ ràng cho câu hỏi này vì tính hiệu quả của
các thuật toán phụ thuộc vào dữ liệu và còn phụ thuộc vào cấu trúc dữ liệu cụ thể. Cách
chung để tìm một mô hình thích hợp cho một bộ dữ liệu cụ thể hoặc một loại tập dữ liệu
là áp dụng thuật toán đã được sử dụng rộng rãi và đã được kiểm chứng.

94
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Trong hai tiến trình được nhắc tới ở trên, cả hai trông giống nhau nhưng có các mô
hình khác nhau. Tiến trình giám sát hoàn trả trông tương tự như tiến trình cấp vốn vay,
nhưng nó được học và đúc rút ra từ các dữ liệu lịch sử khác nhau, cụ thể là từ khách hàng
cũ đã hoàn thành việc trả nợ, bao gồm toàn bộ lịch sử hồ sơ thanh toán và các đặc điểm
của khách hàng. Một thuật toán học máy khác có thể được ứng dụng để phù hợp tương
ứng với các thay đổi của cấu trúc dữ liệu.
Ngày nay, các thuật toán Machine Learning hay được sử dụng nhất có thể được phân
loại là phân loại đơn hoặc phân loại toàn bộ. Các đại diện của các thuật toán phân loại
đơn là CART, Naïve Bayes, SVM, logistics. Việc sửa đổi các bộ phân loại đơn, nhiều mô
hình cùng học để giải quyết cùng một vấn đề, được sử dụng rộng rãi, chẳng hạn như
Random Forests, CART-Adaboost,...
Về cơ bản, Machine Learning cũng giống như việc dạy kiến thức tài chính cho một
học sinh mới dựa trên số liệu lịch sử để thực hiện xác định chất lượng của khoản vay,
sau đó bộ máy này sẽ có kinh nghiệm để tự quyết định. Nói rộng hơn, kỹ thuật Machine
Learning có thể được sử dụng trong tất cả các loại vấn đề phân loại.
Trong lĩnh vực ngân hàng/bảo hiểm, dựa trên Machine Learning có thể phát triển các
ứng dụng, bao gồm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics),
Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell). Qua nhiều năm, một số kỹ
thuật xây dựng mô hình khác nhau để thực hiện xếp hạng tín dụng đã phát triển, bao
gồm: tham số hoặc phi tham số (parametric or non-parametric), thống kê hoặc Machine
Learning, các thuật toán giám sát hoặc không giám sát, mạng neuron. Các kỹ thuật gần
đây gồm các cách tiếp cận rất tinh vi, sử dụng hàng trăm hoặc hàng ngàn mô hình khác
nhau, các cách thức kiểm định mô hình khác nhau, đa dạng kết hợp rất nhiều thuật toán
để mong đạt được kết quả với độ chính xác cao.
Mặc dù đa dạng là vậy, nhưng có một kỹ thuật xây dựng mô hình nổi bật có tên là thẻ
điểm tín dụng (Credit Scorecard) được nhiều ngân hàng trên thế giới áp dụng rộng rãi
(Các ngân hàng như Commonwealth Bank of Australia, Standard Chartered Bank,... cũng
đang áp dụng kỹ thuật này). Thường được gọi là thẻ điểm tiêu chuẩn (Standard Scorecard),
nó dựa trên Mô hình hồi quy Logistic (Logistic Regression Model). Mô hình thẻ điểm tín
dụng dạng này được xây dựng đơn giản, dễ hiểu, dễ triển khai và chạy nhanh. Kết hợp
giữa thống kê và Machine Learning, độ chính xác của phương pháp này tương đương với
các kỹ thuật tinh vi, điểm số đầu ra của nó có thể được áp dụng trực tiếp để đánh giá xác
suất nợ xấu, từ đó cung cấp đầu vào cho việc định giá nợ xấu dựa trên rủi ro. Điều này rất
quan trọng đối với các bên cho vay cần tuân thủ khuôn khổ pháp lý Basel II.

95
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Mô hình thẻ điểm tín dụng có thể được mô tả một cách đơn giản như sau: nó bao
gồm tập hợp các thuộc tính đầu vào từ khách hàng, cụ thể là đặc điểm khách hàng (Ví dụ
như tuổi, thu nhập, nghề nghiệp,...), thông tin tín dụng quá khứ của họ (Ví dụ như thông
tin thu thập được từ Trung tâm thông tin tín dụng Quốc gia - CIC, cũng như thông tin
tín dụng khác mà ngân hàng nắm được),... căn cứ vào tính toán của mô hình, mỗi thuộc
tính sẽ được gán một hệ số nhất định, tổng của các con số này bằng điểm số đầu ra. Căn
cứ vào điểm số đầu ra, người ta có thể xác định được xác suất khách hàng có khả năng
phát sinh nợ xấu. Chính nhờ xác suất này mà việc tính được giá trị của rủi ro tín dụng
dễ dàng được thực hiện, qua đó ngân hàng nhanh chóng biết được số vốn tối thiểu dành
cho rủi ro tín dụng phù hợp với tiêu chuẩn Basel II.
Như vậy, hệ thống chấm điểm tín dụng và xếp hạng khách hàng bằng thẻ điểm,
được tạo ra bởi công nghệ Machine Learning, ứng dụng mô hình hồi qui Logistic, không
chỉ giúp đánh giá khả năng thực hiện các nghĩa vụ tài chính của một khách hàng đối với
một ngân hàng như việc trả lãi và trả gốc nợ vay khi đến hạn, mà nó còn là công cụ hỗ
trợ ngân hàng trong kiểm soát việc tuân thủ Basel II.

4. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng
tín dụng khách hàng cá nhân của NHTM
4.1. Quy trình phát triển hệ thống Machine Learning
Các bước phát triển hệ thống Machine Learning gồm: (1) Requirements; (2) Data;
(3) Model; (4) Production.
Requirements - Yêu cầu: là giai đoạn tìm hiểu về những gì người dùng đang cần,
mong muốn từ hệ thống Machine Learning. Trong mọi trường hợp, bước này là quan
trọng nhất. Càng thêm thời gian dành riêng cho giao tiếp và hiểu biết lẫn nhau giữa các
bộ phận, mục tiêu càng rõ ràng và cụ thể càng có nhiều cơ hội dự án sẽ thành công hơn.
Data - Số liệu: dữ liệu là “kinh nghiệm” cho model (mô hình). Nếu chúng ta có thể
train các model với rất nhiều “kinh nghiệm” có chất lượng tốt, nó sẽ học những phương
án tốt hơn để phục vụ mục đích. Đối với các trường hợp trong đó dữ liệu không đủ hoặc
quá lộn xộn nó cần một bước chuẩn bị dữ liệu, hoặc là thu thập thêm dữ liệu, hoặc là
mua từ 1 bên thứ 3, hoặc là sử dụng dữ liệu opensource. Trong trường hợp bất kỳ dữ liệu
phải được hoàn thiện sạch sẽ và có cấu trúc tốt.
Model - Mô hình: Mục đích của bước này để thống nhất về số liệu chính xác để đánh
giá các mô hình 1 cách khách quan. Mất nhiều ngày làm việc để lựa chọn các thuật toán,
train model, kiểm tra nó và lập lại. Đây là phần cốt lõi và quan trọng nhất của quá trình.

96
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Production - Vận hành: Một khi các thuật toán được thử nghiệm sẵn sàng để hoạt
động, có hai công việc chính trong bước vận hành:
Tích hợp với các thiết lập hiện có.
Tự động cập nhật các mô hình. Mô hình tự động cập nhật theo thời gian khi mà
lượng data mới liên tục được thêm vào.
4.2. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách
hàng cá nhân của NHTM
Việc phát triển một mô hình Machine Learning cũng có nhiều bước và sẽ có một
vài điểm/bước tương đồng so với việc phát triển 1 phần mềm công nghệ thông thường
và Machine Learning là một nhánh cực kỳ hiện đại của việc phát triển phần mềm. Như
trong phần mềm thông thường, các giải pháp đóng gói sẵn tốn ít chi phí nhưng không
phù hợp với nhu cầu cụ thể, trong khi ngược lại xây dựng hệ thống Machine Learning
đưa đến các giải pháp có khả năng thiên biến vạn hóa hơn.
Dựa trên nghiên cứu về hệ thống XHTD khách hàng cá nhân hiện tại và mục tiêu
của việc ứng dụng Trí tuệ nhân tạo với công nghệ Machine Learning và nền tảng Big
Data, tác giả đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách
hàng cá nhân đối với các NHTM gồm các bước sau:
4.2.1. Xác định mục tiêu của hệ thống
Hệ thống được xây dựng với các mục tiêu chính sau:
1. Hỗ trợ thẩm định, phê duyệt cấp tín dụng và quản lý rủi ro tín dụng
2. Xây dựng chính sách khách hàng
3. Khắc phục những điểm yếu của hệ thống XHTD cũ
4. Đáp ứng yêu cầu của NHNN
4.2.2. Xây dựng nền tảng - kho dữ liệu khách hàng (Big Data)
Các NHTM cần chuẩn hóa dữ liệu lịch sử tín dụng khách hàng cá nhân tại hệ thống
ngân hàng của mình với các thông tin khách hàng về các tiêu chí chấm điểm. Dữ liệu
càng lớn càng tốt, đề xuất thời gian số hóa lưu trữ hồ sơ khách hàng tối thiểu 10 năm.
Các trường thông tin khách hàng được sắp xếp khoa học với các thông tin:
1. Về nhân thân;

97
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2. Về lịch sử giao dịch với ngân hàng;


3. Về thông tin khoản vay;
4. Về tài sản đảm bảo;
5. Về lịch sử trả nợ của khách hàng.
4.2.3. Xây dựng mô hình XHTD khách hàng cá nhân với nền tảng Big Data và công
nghệ Machine Learning
Việc xây dựng mô hình XHTD khách hàng cá nhân với nền tảng Big Data và công
nghệ Machine Learning thực hiện qua các bước công việc sau:
1. Lựa chọn mô hình XHTD phù hợp;
2. Lập trình hệ thống Machine Learning dựa trên mục tiêu đặt ra, mô hình XHTD
được lựa chọn và hệ thống dữ liệu Big Data sẵn có.
4.2.4. Vận hành thử nghiệm, đánh giá và đưa vào sử dụng chính thức
Sử dụng mô hình mới với công nghệ Machine Learning để đánh giá và dự báo kết
quả XHTD dựa trên dữ liệu nhóm khách hàng cũ.
So sánh kết quả dự báo của công nghệ Machine Learning với kết quả thực tế đã xảy
ra với nhóm khách hàng này và so sánh với với kết quả dự báo của công nghệ XHTD
khách hàng cá nhân hiện tại. Thông qua phân tích tập khách hàng cũ với kho dữ liệu
khách hàng có sẵn và so sánh độ chính xác với công nghệ cũ để đánh giá mô hình XHTD
mới công nghệ Machine Learning, đánh giá điểm mạnh và yếu của mô hình để có hướng
điều chỉnh mô hình.
Ứng dụng trên tập khách hàng mới và sau đó đánh giá mức độ chính xác dựa trên
kết quả thực tế của khách hàng

5. Kết luận
Dự báo chính xác về năng lực trả nợ của khách hàng trong tương lai là quan trọng
hàng đầu trong nghiệp vụ tín dụng của ngân hàng thương mại, điều này giúp các nhà
cấp tín dụng được kỳ vọng đưa ra quyết định nhanh chóng về việc có nên cho một khách
hàng vay hay không. Hiện nay những quyết định này được đưa ra dựa trên các thông tin
rất hạn chế. Với sự bùng nổ của dữ liệu trong mười năm qua, cơ hội sử dụng dữ liệu này
một cách thông minh đã phát triển theo cấp số nhân; nhưng những cơ hội này thường
vẫn chưa được thực hiện bởi vì việc giải thích số lượng lớn dữ liệu phức tạp vượt quá

98
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

khả năng của con người. Nó đã được chứng minh rằng sử dụng các kỹ thuật Machine
Learning cho phép người ta tận dụng tất cả các dữ liệu sẵn có, và do đó, đạt được một sự
cải thiện đáng kể về khả năng dự đoán trước các mô hình truyền thống. Các dự đoán tốt
hơn (và đúng thời gian hơn) lần lượt dẫn đến tác động tích cực đến quyết định cho vay
của ngân hàng đối với khách hàng của mình. Ngoài ra, phương pháp mô hình hóa này
có một khía cạnh tự điều chỉnh cho phép nó tự động điều chỉnh theo các xu hướng trong
dữ liệu đầu vào đơn giản bằng cách đào tạo định kỳ, do đó làm giảm nhu cầu truy cập lại
trọng số trong các mô hình truyền thống và nâng cao mức độ chính xác của các dự báo.
Điều này không có nghĩa là vai trò của một nhà phân tích là con người sẽ trở nên lỗi
thời. Có những trường hợp mà các mô hình máy tính có thể không tính toán và dự báo
chính xác được, ví dụ, khi xảy ra các sự kiện bất thường (chiến tranh, thiên tai, biến động
chính trị,...). Những sự kiện này tạo ra sự gián đoạn khi các mẫu trong quá khứ không
còn áp dụng nữa. Do đó, việc tính điểm tín dụng tự động dựa trên thuật toán Machine
Learning và phân tích của con người có thể bổ sung cho nhau trong việc xác định rủi ro
tín dụng.

TÀI LIỆU THAM KHẢO


1. Altman, E.I., 1968. Financial ratios, discriminant analysis and the prediction of cor-
porate bankruptcy. The journal of finance, 23(4), pp.589-609.
2. Baesens, B., Van Gestel, T., Viaene, S., Stepanova, M., Suykens, J. and Vanthienen,
J., 2003. Benchmarking state-of-the-art classification algorithms for credit scoring,
Journal of the operational research society, 54(6), pp.627-635.
3. Chintan Trivedi, Irina Rabinovich and Shyarsh Desai (2017),Applying Machine
Learning to Leverage Big Data for Commercial Credit Scoring, The Credit & Finan-
cial Management Review,
4. Dinh Thi Huyen Thanh & Stafanie Kleimeier (2006), Credit Scoring for Vietnam’s
Retail Banking Market
5. Dominique Guegan, Bertrand Hassani (2017), Maison des Sciences Économiques,
106-112.
6. Fawcett, T., 2006. An introduction to ROC analysis. Pattern recognition letters,
27(8), pp.861-874.
7. Fensterstock, B.A., Salters, J. and Willging, R., 2013. On the Use of Ensemble Models
for Credit Evaluation. Credit Financ. Manag. Rev, 1(1), pp.1-14.

99
Kỷ yếu HộI THảO KHOA HọC QUốC GIA
"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

8. Friedline, T., Masa, R.D. and Chowa, G.A., 2015. Transforming wealth: Using the in-
verse hyperbolic sine (IHS) and splines to predict youth’s math achievement. Social
science research, 49, pp.264-287.
9. Huang, C.L., Chen, M.C. and Wang, C.J., 2007. Credit scoring with a data min-
ing approach based on support vector machines. Expert systems with applications,
33(4), pp.847-856.
10. Lo, K. and Lys, T., 2000. The Ohlson model: contribution to valuation theory, limita-
tions, and empirical applications. Journal of Accounting, Auditing & Finance, 15(3),
pp.337-367.
11. Philipp Kallerhoff, PhD, Jumiya (2017), Big Data and Credit Unions: Machine
Learning in Member Transactions, Filene Research Institute.
12. Piotroski, J.D., 2000. Value investing: The use of historical financial statement infor-
mation to separate winners from losers. Journal of Accounting Research, pp.1-41.
13. Rasmussen, C.E. and Williams, C.K., 2006. Gaussian processes for machine learning
(Vol. 1). Cambridge: MIT press.
14. West, D., 2000. Neural network credit scoring models. Computers & Operations
Research, 27(11), pp.1131- 1152
Ngày gửi bài: 19/5/2018
Ngày gửi lại bài: 21/5/2018
Ngày duyệt đăng: 02/06/2018

100

You might also like