You are on page 1of 4

LỜI CẢM ƠN

Có thể nói khoa học dữ liệu là một môn học khó và là một phần nền
tảng kiến thức quan trọng mà sinh viên ngành Tài chính – Ngân hàng
cần có để áp dụng vào công việc phân tích, đầu tư sau này. Nhưng qua
6 buổi học, nhờ sự giảng dạy tận tình của thầy Hồ Văn Phúng mà sinh
viên đã có sự hiểu biết cũng như áp dụng nó vào thực tế.
Để đạt được điều này, chúng tôi xin chân thành cảm ơn các thầy cô là
giảng viên Đại học Kinh tế đã cùng xây dựng môn học này, gia đình và
bạn bè đã có sự hỗ trợ chúng tôi trong suốt thời gian qua để hoàn thành
môn học Khoa học dữ liệu.
Với dự án cuối cùng, cũng là tổng kết cho cả quá trình học của nhóm
chúng tôi. Mặc dù vẫn sẽ có những thiếu sót khi tiếp xúc với một lĩnh
vực mới trong một thời gian ngắn. Nhưng kinh nghiệm mà chúng tôi đúc
kết được so với ban đầu đã vượt qua mong đợi. Rất mong thầy có
những góp ý chân thành và châm chước để nhóm có thể có thêm nhiều
dự án tốt hơn
Một lần nữa, cảm ơn thầy vì khoảng thời gian gắn bó vừa qua. Vì những
giá trị thầy trao đi cho sinh viên của mình.
Trân trọng.
GIỚI THIỆU:
1.1 Khoa học dữ liệu:
Khoa học dữ liệu là lĩnh vực nghiên cứu nhằm quản trị và phân tích dữ
liệu để tìm ra các hiểu biết, các tri thức hành động, các quyết định dẫn
dắt hành động. Bao gồm ba phần chính: Tạo ra và quản trị dữ liệu, phân
tích dữ liệu, chuyển kết quả phân tích thành giá trị của hành động. Hay
số hoá để dùng dữ liệu dựa vào ba nguồn tri thức: toán học (thống kê
toán học), công nghệ thông tin (máy học) và tri thức của lĩnh vực ứng
dụng cụ thể.
Cuộc cách mạng công nghiệp 4.0 và sự phổ biến của internet, trí tuệ
nhân tạo cùng với IoT và các thiết bị thông minh tạo ra sự bùng nổ về
dữ liệu (Big data). Chúng chứa lượng lớn thông tin hữu ích cho nhiều
ngành nghề trải dài từ kinh doanh, y tế, khoa học... Tuy vậy, vẫn cần sự
sàng lọc và sắp xếp lượng lớn dữ liệu “lộn xộn” này. Đó là lý do ngành
Khoa học dữ liệu ra đời.
1.2 Giới thiệu và lý do chọn đề tài
Hệ thống thanh toán là một phần quan trọng trong nền kinh tế và có sự
liên quan chặt chẽ đến lĩnh vực Tài chính – Ngân hàng. Thẻ tín dụng,
hiện là một trong số những phương thức thực hiện các giao dịch trong
nền kinh tế phổ biến nhất qua quá trình phát triển của tiền.
Sử dụng thẻ tín dụng để thanh toán không chỉ mang lại lợi ích về mặt
tiện dụng, tiết kiệm thời gian cũng như tính an toàn, dễ nắm giữ của nó.
Mà qua đó cùng với các phương thức thanh toán khác như ngân hàng
số còn hình thành thước đo mới mang tên Credit Information Centre hay
điểm tín dụng. Nhằm đánh giá độ uy tín trong việc thanh toán các khoản
nợ của khách hàng. Hãy tưởng tượng bạn là một người dân bình
thường trong nền kinh tế. Bạn không nổi tiếng và ngân hàng, nơi bạn
cho vay cũng không biết bạn là ai. Họ không biết là bạn có đủ “uy tín” để
vay và trả lại cả gốc lẫn lãi hay không và họ cũng phải cân nhắc giữa
bạn và rất nhiều người muốn vay tiền tiềm năng khác vì số lượng tiền có
hạn của Ngân hàng. Chính vì lẽ đó, điểm tín dụng là công cụ hoàn hảo
để các tổ chức tín dụng có căn cứ để xác định đối tượng mình có nên
cho vay hay không mà không cần cất công điều tra người đó kĩ như thể
cảnh sát truy tìm tội phạm. Chỉ cần một chiếc máy tính, họ đã có thể tìm
kiếm và tổng hợp những thông tin liên quan đến vấn đề rủi ro tín dụng
của bạn. Và nền kinh tế sẽ hoạt động hiệu quả nhất có thể để chuyển
tiền từ những người tiết kiệm sang những người muốn đầu tư thật sự.
Với mục tiêu cụ thể trong dự án này cũng chính là tên của nó “Phân tích
hành vi thanh toán thẻ tín dụng và Ảnh hưởng của nó đến quyết định
cho vay tín dụng của các ngân hàng.”
1.3 Đối tượng và phương pháp nghiên cứu; mô hình nghiên cứu
Bộ dữ liệu này chứa thông tin về các khoản thanh toán mặc định, các
yếu tố nhân khẩu học, dữ liệu tín dụng, lịch sử thanh toán và báo cáo
hóa đơn của khách hàng thẻ tín dụng ở Đài Loan từ tháng 4 năm 2005
đến tháng 9 năm 2005.
Nghiên cứu này nhằm vào trường hợp thanh toán mặc định của khách
hàng ™ ở Đài Loan và so sánh độ chính xác dự đoán xác suất vỡ nợ
trong số sáu phương pháp khai thác dữ liệu. Từ góc độ quản lý rủi ro,
kết quả của độ chính xác dự đoán về xác suất vỡ nợ ước tính sẽ có giá
trị hơn kết quả phân loại nhị phân – khách hàng đáng tin cậy hoặc
không đáng tin cậy. Từ đó các tổ chức tín dụng có căn cứ cụ thể để
quyết định có cho vay hay không.
• Mô tả về bộ dữ liệu:
Có 25 biến:
ID: ID của từng khách hàng
LIMIT_BAL: số tiền tín dụng nhất định bằng đô la NT (bao gồm tín dụng
cá nhân và gia đình/bổ sung)
SEX: giới tính (1=nam, 2=nữ)
EDUCATION: học vấn hiện tại (1=cao học, 2=đại học, 3=trung học,
4=khác, 5=không rõ, 6=không rõ)
MARIAGE: tình trạng hôn nhân (1=đã kết hôn, 2=độc thân, 3= khác)
AGE: tuổi tính bằng năm
PAY_0: tình trạng trả nợ tháng 9/2005 (-1=thanh toán hợp lệ, 1=chậm
thanh toán trong một tháng, 2=chậm thanh toán trong hai tháng,...
8=chậm thanh toán trong tám tháng, 9=chậm thanh toán trong chín
tháng trở lên)
PAY_2: tình trạng trả nợ tháng 8/2005 (quy mô như trên)
PAY_3: tình trạng trả nợ tháng 7/2005 (quy mô tương tự như trên)
PAY_4: tình hình trả nợ tháng 6/2005 (quy mô như trên)
PAY_5: tình hình trả nợ tháng 5/2005 (quy mô như trên)
PAY_6: tình hình trả nợ tháng 4/2005 (quy mô tương tự như trên)
BILL_AMT1: số tiền sao kê hóa đơn tháng 9 năm 2005 (NT dollar)
BILL_AMT2: số tiền sao kê hóa đơn tháng 8 năm 2005 (NT dollar)
BILL_AMT3: số lượng sao kê hóa đơn trong tháng bảy, 2005 (NT dollar)
BILL_AMT4: số tiền sao kê hóa đơn tháng 6 năm 2005 (NT dollar)
BILL_AMT5: số tiền sao kê hóa đơn tháng 5 năm 2005 (NT dollar)
BILL_AMT6: số tiền sao kê hóa đơn tháng Tư, 2005 (NT dollar)
PAY_AMT1: số tiền thanh toán trước đó trong tháng Chín, 2005 (NT
dollar)
PAY_AMT2: số tiền thanh toán trước đó vào tháng Tám, 2005 (NT
dollar)
PAY_AMT3: số tiền thanh toán trước đó vào tháng 7 năm 2005 (NT
dollar)
PAY_AMT4: số tiền thanh toán trước đó vào tháng 6 năm 2005 (NT
dollar)
PAY_AMT5: số tiền thanh toán trước đó vào tháng 5 năm 2005 (NT
dollar)
PAY_AMT6: số tiền thanh toán trước đó vào tháng Tư, 2005 (NT
dollar)default.payment.next.month: Thanh toán mặc định (1=yes, 0=no)

You might also like