BTVN1

Uploaded by

THUY TIEN TINA

0% found this document useful (0 votes)

3 views6 pages

Khoa học dữ liệu

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Khoa học dữ liệu

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views6 pages

BTVN1

Uploaded by

THUY TIEN TINA

Khoa học dữ liệu

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 6

Search inside document

BÀI TẬP VỀ NHÀ 4

PHÂN LỚP DỮ LIỆU

Lab 1 - Chuẩn bị dữ liệu

1. Từ file dữ liệu Thunhap_HoGiaDinh.xlsx tách làm 2 file excel riêng

- ThuNhap_HoGiaDinh_data.xlsx: chiếm 70% dữ liệu
- ThuNhap_HoGiaDinh_forecast.xlsx: chiếm 30% dữ liệu để dự báo và bỏ đi dữ liệu cột
biến phụ thuộc (Vay vốn)

Lab 2 – Phân lớp dữ liệu

1. Sử dụng 3 phương pháp: hồi quy logistic, svm và cây quyết định tiến hành phân lớp
theo “Vay vốn”. Đánh giá các phương pháp. Lưu ý thể hiện quan sát dữ liệu theo
dạng bảng hoặc biểu đồ
a. Mô hình được xây dựng trong phần mềm Organge như sau:
b. Đánh giá các phương pháp và Ma trận nhầm lẫn

Nhìn vào bảng đánh giá của ma trận nhầm lẫn ta có thể thấy rằng cả ba đều có False
Positive bà False negative đều chiếm phần lớn. Trong đó thì False positive của mô hình
SVM có tỷ lệ nhỏ nhất. Hơn nữa, khi nhìn vào các chỉ số để đánh giá trong bảng Test and
Score, có thể thấy rằng chỉ số đánh giá tính chính xác (AUC) của mô hình Logistic
Regression là cao nhất => Do đó, mô hình tốt nhất để thực hiện cho dự báo là Logistic
Regression.
2. Sử dụng mô hình tốt nhất để dự báo “Vay vốn” cho khách hàng trong file:
ThuNhap_HoGiaDinh_forecast.xlsx
a. Mô hình dư báo được xây dựng như sau:

b. Kết quả dự báo

Thống Kê Trong Công Nghiệp
From Everand
Thống Kê Trong Công Nghiệp
Phong Nguyễn Như
Rating: 5 out of 5 stars
5/5 (1)
XSTK - THỐNG KÊ
Document138 pages
XSTK - THỐNG KÊ
Nguyễn Lâm Anh Thy
No ratings yet
Bài Tiểu Luận Nhóm
Document23 pages
Bài Tiểu Luận Nhóm
Thanh Ngân Phạm Lê
No ratings yet
Bài Tập Về Nhà 4 - Phân Lớp Dữ Liệu
Document5 pages
Bài Tập Về Nhà 4 - Phân Lớp Dữ Liệu
Trần Đỗ Thảo Vy
No ratings yet
DS-Lab Buoi4
Document5 pages
DS-Lab Buoi4
Lê Nhật Quyên
No ratings yet
Phanlopdulieu
Document4 pages
Phanlopdulieu
Vy Ngô
No ratings yet
BT Venha
Document1 page
BT Venha
Phúc Trương
No ratings yet
DS Lab - Buoi4
Document5 pages
DS Lab - Buoi4
Mai Đinh
No ratings yet
Ds-Lab Buoi4 Venha
Document8 pages
Ds-Lab Buoi4 Venha
nhinguyen.31231026864
No ratings yet
Lê Nguyễn Dạ Thảo-BTVN-buổi 4
Document6 pages
Lê Nguyễn Dạ Thảo-BTVN-buổi 4
lenguyendathao92
No ratings yet
BÀI TẬP 4
Document6 pages
BÀI TẬP 4
HẠNH CAO THỊ MỸ
No ratings yet
DS-Lab Buoi4
Document1 page
DS-Lab Buoi4
nguyenkhoatb2018
No ratings yet
DS-Lab Buoi4
Document4 pages
DS-Lab Buoi4
ngannguyen.31211026898
No ratings yet
DS-Lab Buoi4
Document5 pages
DS-Lab Buoi4
Lê Thị Ngọc Mai
No ratings yet
BTVN4 KHDL
Document4 pages
BTVN4 KHDL
thuanphat.pdv
No ratings yet
Phanlop - Nguyễn Phúc Tín
Document5 pages
Phanlop - Nguyễn Phúc Tín
tinnguyen1447
No ratings yet
KHDL 2 Orange
Document15 pages
KHDL 2 Orange
Vương Lam
No ratings yet
Nhóm-4 BTL AI 212IS42A19
Document36 pages
Nhóm-4 BTL AI 212IS42A19
linhtrieu1702
100% (1)
Tai Lieu NCKH NC - KHOA NANG CAO
Document48 pages
Tai Lieu NCKH NC - KHOA NANG CAO
Dương Nguyễn
No ratings yet
231 - 71miss40233 - 02 - Kiểm Tra Cuối Kỳ
Document25 pages
231 - 71miss40233 - 02 - Kiểm Tra Cuối Kỳ
Thúy Ngân
No ratings yet
Logistic Regression PDF
Document8 pages
Logistic Regression PDF
le_phung_5
100% (3)
Check Sheet
Document18 pages
Check Sheet
Mỹ Linh
No ratings yet
Ôn Tập Kinh Tế Lượng
Document9 pages
Ôn Tập Kinh Tế Lượng
Thanh Thảo
No ratings yet
TCDL
Document36 pages
TCDL
Huyên Huỳnh Thanh
No ratings yet
KHDL
Document19 pages
KHDL
hungnguyen.31211024151
No ratings yet
BCM - Đề cương Kinh tế lượng - Phần 1
Document20 pages
BCM - Đề cương Kinh tế lượng - Phần 1
trangphap2100
No ratings yet
Bài mẫu khai phá 2
Document27 pages
Bài mẫu khai phá 2
nguyenanhbim6
No ratings yet
Ghi bài TKMT LÝ THUYẾT
Document12 pages
Ghi bài TKMT LÝ THUYẾT
MaRiCer
No ratings yet
THUYẾT TRÌNH
Document2 pages
THUYẾT TRÌNH
Nguyễn Trần Hải Anh
No ratings yet
Bai 2 - Phuong Phap Và Công Cu Mo Hinh Hoa - ND - Binh
Document27 pages
Bai 2 - Phuong Phap Và Công Cu Mo Hinh Hoa - ND - Binh
ndbinh03
No ratings yet
ĐỀ TÀI: Thuật toán K-mean và ứng dụng vào bài toán phân lớp đối tượng khách hàng trong kinh doanh
Document19 pages
ĐỀ TÀI: Thuật toán K-mean và ứng dụng vào bài toán phân lớp đối tượng khách hàng trong kinh doanh
phamchauanh125
No ratings yet
Bai 3 1-7
Document58 pages
Bai 3 1-7
tranvuminh2905
No ratings yet
8603 THU NGUYEN THI HH 5 926280068
Document37 pages
8603 THU NGUYEN THI HH 5 926280068
Thu Nguyen
No ratings yet
Khai phá dữ liệu
Document44 pages
Khai phá dữ liệu
cute panda channel
No ratings yet
NHÓM 7- HỒI QUY TUYẾN TÍNH - ỨNG DỤNG DỮ LIỆU LỚN TRONG KINH DOANH (BIGDATA)
Document34 pages
NHÓM 7- HỒI QUY TUYẾN TÍNH - ỨNG DỤNG DỮ LIỆU LỚN TRONG KINH DOANH (BIGDATA)
Trương Thanh Lộc
No ratings yet
Phần Ii: Thống Kê: Thống kê toán là bộ môn toán học nghiên cứu quy luật của các
Document70 pages
Phần Ii: Thống Kê: Thống kê toán là bộ môn toán học nghiên cứu quy luật của các
Thảo Võ Nguyễn Đoan
No ratings yet
BT Phân L P
Document4 pages
BT Phân L P
NGỌC NGUYỄN THẾ
100% (1)
Đạo Văn Dưới 30% DEADLINE: THỨ 6 - 29/03 - 21H PPT: CN 1/4 - 9H00 Ai Làm Phần Nào Thêm Ppt Phần Đó Rồi T Với Ý Chỉnh Format Lại Sau
Document18 pages
Đạo Văn Dưới 30% DEADLINE: THỨ 6 - 29/03 - 21H PPT: CN 1/4 - 9H00 Ai Làm Phần Nào Thêm Ppt Phần Đó Rồi T Với Ý Chỉnh Format Lại Sau
35. Yen Nhi Le
No ratings yet
Nhapmonhocmay
Document33 pages
Nhapmonhocmay
06 Phạm Xuân Cường
No ratings yet
Giáo trình môn cung cấp điện - 662760
Document360 pages
Giáo trình môn cung cấp điện - 662760
Hoài Thu
No ratings yet
KHDL Nhóm 5
Document18 pages
KHDL Nhóm 5
THU NGUYỄN THỊ NGỌC
No ratings yet
Bai Tap Lon XSTK (Mt2013) - Hk211
Document8 pages
Bai Tap Lon XSTK (Mt2013) - Hk211
Ngọc Châu
No ratings yet
S Giáo D C Và Đào T o Hà N I Trư NG THPT Yên Viên
Document12 pages
S Giáo D C Và Đào T o Hà N I Trư NG THPT Yên Viên
vanvinh280605
No ratings yet
Bài Tập Lớn Phân Tích Thiết Kế Hệ Thống Lê Duy Tiến 520CNT1034
Document25 pages
Bài Tập Lớn Phân Tích Thiết Kế Hệ Thống Lê Duy Tiến 520CNT1034
leduytien262
No ratings yet
Chan Doan Mo Hinh Hoi Quy
Document12 pages
Chan Doan Mo Hinh Hoi Quy
Anh Le Thi Quynh
No ratings yet
Nhóm 5 - Khai Phá
Document36 pages
Nhóm 5 - Khai Phá
Nguyễn Xuân Tuấn
No ratings yet
Đồ Án Khoa Học Dữ Liệu
Document16 pages
Đồ Án Khoa Học Dữ Liệu
ĐẠT HÀ QUANG
No ratings yet
BTVN 5
Document4 pages
BTVN 5
Lê Thị Diệu Linh
No ratings yet
KHDL
Document41 pages
KHDL
Thiên Bảo
No ratings yet
Ontap HTTT
Document14 pages
Ontap HTTT
MaRiCer
No ratings yet
ĐỒ ÁN CUỐI KỲ
Document49 pages
ĐỒ ÁN CUỐI KỲ
522h0058
No ratings yet
Mô Hình H I Quy Nhóm B
Document21 pages
Mô Hình H I Quy Nhóm B
nhinguyenyangyang
No ratings yet
BT KHDL Nhóm 9
Document4 pages
BT KHDL Nhóm 9
Bảo Khang
No ratings yet
Chuong 5 - Lý thuyết mẫu và lý thuyết ước lượng- đã cập nhật
Document62 pages
Chuong 5 - Lý thuyết mẫu và lý thuyết ước lượng- đã cập nhật
Hoàng Kim Cương
No ratings yet
KHDL1
Document16 pages
KHDL1
Khánh Đinh Hoàng Nam
No ratings yet
HỆ THỐNG THI - Dự báo KT-XH1.2021
Document4 pages
HỆ THỐNG THI - Dự báo KT-XH1.2021
ngocdi2308
No ratings yet
Baitap 20521658
Document5 pages
Baitap 20521658
Nghĩa Trương Đăng
No ratings yet
11250/2504900/Eklund-Larsen - Pdf?Sequence 1&isallowed Y: I/ Model For Analysing Credit Risk in The Enterprise Sector
Document19 pages
11250/2504900/Eklund-Larsen - Pdf?Sequence 1&isallowed Y: I/ Model For Analysing Credit Risk in The Enterprise Sector
KHÁNH NGUYỄN THỊ
No ratings yet
Phan Lop
Document1 page
Phan Lop
hznghia123
No ratings yet
Mau Bao Cao Bai Thi Het Mon
Document3 pages
Mau Bao Cao Bai Thi Het Mon
quyenduongngo
No ratings yet