Welcome to Scribd!

Skip carousel

Lab 5

Uploaded by

Vĩnh Hưng

0% found this document useful (0 votes)

7 views7 pages

Original Title

Lab5

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

7 views7 pages

Lab 5

Uploaded by

Vĩnh Hưng

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 7

Search inside document

Chapter 16

Trong chương này ta tìm hiểu về 3 mục chính là:

 Coefficients

Ví dụ về tầm quan trọng của Feature với hồi quy tuyến tính (linear regression.)

 Decision Tree

Có hai loại là :

 regression trees CART(cây hồi quy)

Ví dụ về tầm quan trọng của regression trees CART(cây hồi qui) với hồi quy tuyến tính
(linear regression.)

 Random Forest(rừng ngẫu nhiên

Ví dụ về Random Forest(rừng ngẫu nhiên

 Permutation feature importance

Permutation feature importance là một kỹ thuật để đo lường độ quan trọng của các đặc
trưng với mô hình được sử dụng. Đầu tiên, một mô hình phù hợp với tập dữ liệu, chẳng
hạn như một mô hình không hỗ trợ điểm quan trọng của tính năng gốc. Sau đó, mô hình
được sử dụng để đưa ra dự đoán trên tập dữ liệu, mặc dù các giá trị của một đối tượng
(cột) trong tập dữ liệu được xáo trộn. Đây là lặp lại cho từng tính năng trong tập dữ liệu.
Sau đó toàn bộ quá trình này được lặp lại 3, 5, 10 hoặc hơn. Kết quả là điểm quan trọng
trung bình cho từng tính năng đầu vào (và phân bổ điểm đưa ra sự lặp lại).

Ví dụ về Permutation feature importance

Feature Selection with Importance

quá trình chọn lọc các đặc trưng quan trọng có thể được sử dụng để giúp diễn giải dữ
liệu, nhưng chúng cũng có thể được sử dụng trực tiếp để giúp chọn lọc các tính năng hữu
ích nhất cho mô hình dự đoán.
Ví dụ về Feature Selection with Importance

Chapter 17
MinMaxScaler là điều chỉnh lại tỷ lệ các biến trong phạm vi [0,1]

Tạo biến chia tỷ lệ

Chuẩn hóa dữ liệu từ dataset

Standardizing một tập dữ liệu là quá trình biến đổi dữ liệu sao cho chúng có trung bình
bằng 0 và độ lệch chuẩn bằng 1

Ví dụ biển đổi dữ liệu(Standardizing)

Chapter 18
RobustScaler là một phương pháp chuẩn hóa dữ liệu trong xử lý dữ liệu và machine
learning. Nó tương tự như StandardScaler, nhưng thay vì sử dụng trung bình và độ lệch
chuẩn, RobustScaler sử dụng trung vị và phạm vi tương ứng. Phương pháp này làm cho
dữ liệu trở nên ổn định hơn đối với các giá trị ngoại lệ (outliers) trong tập dữ liệu, bằng
cách sử dụng trung vị để giảm ảnh hưởng của các giá trị ngoại lệ và sử dụng phạm vi để
chuẩn hóa dữ liệu.

IQR Robust Scaler Transform là một phương pháp chuẩn hóa dữ liệu trong xử lý dữ
liệu và machine learning, sử dụng IOR

IQR là sự chênh lệch giữa phần tư thứ ba (Q3) và phần tư thứ nhất (Q1) của tập dữ liệu,
và nó được sử dụng để đo lường sự biến đổi của dữ liệu một cách ổn định hơn so với
phương pháp trung bình và độ lệch chuẩn, đặc biệt là khi dữ liệu chứa nhiều giá trị ngoại
lệ

Hiển thị data sau khi RobustScaler transform.

Đánh giá mô hình sau khi RobustScaler transform.

Phân tích thành phần chính
Document8 pages
Phân tích thành phần chính
Nguyen Hoai Thu
No ratings yet
Lý thuyết
Document7 pages
Lý thuyết
Hoang Duc Trong
No ratings yet
How To Use Iterative Imputation
Document3 pages
How To Use Iterative Imputation
Vĩnh Hưng
No ratings yet
inSysDev - 04 - 13 - BT2 - Hán Văn Luân
Document67 pages
inSysDev - 04 - 13 - BT2 - Hán Văn Luân
nqdcntt2002
No ratings yet
Khoa học máy
Document14 pages
Khoa học máy
Thanh Phương Thái Hoàng
No ratings yet
Khdl Phần Lý Thuyết
Document21 pages
Khdl Phần Lý Thuyết
tinhle.31221023009
No ratings yet
MLP302x Regression 2
Document10 pages
MLP302x Regression 2
đức ngọc trần
No ratings yet
Bai 2
Document43 pages
Bai 2
Vu Thi Ngoc Dung FX11326
No ratings yet
Học máy là một lĩnh vực của trí tuệ nhân tạo
Document3 pages
Học máy là một lĩnh vực của trí tuệ nhân tạo
Ngo Lam
No ratings yet
Report
Document14 pages
Report
Linh Trúc
No ratings yet
668 - Fulltext - 4.ĐTVT - Phuoc - Vuong Quang Phuoc
Document12 pages
668 - Fulltext - 4.ĐTVT - Phuoc - Vuong Quang Phuoc
tung pham
No ratings yet
KHDL 2 Orange
Document15 pages
KHDL 2 Orange
Vương Lam
No ratings yet
Baitap 20521658
Document5 pages
Baitap 20521658
Nghĩa Trương Đăng
No ratings yet
đề cương hệ thống thông minh
Document64 pages
đề cương hệ thống thông minh
Ngọc Đỗ
No ratings yet
Chuong4 Procedure Function
Document59 pages
Chuong4 Procedure Function
khoa pham
No ratings yet
DATAMINING 14.10 Update
Document27 pages
DATAMINING 14.10 Update
Nô Lệ Tư Bản
No ratings yet
Tiền xử lý dữ liệu
Document7 pages
Tiền xử lý dữ liệu
daoviethaanhttt
No ratings yet
17. Giảm chiều dữ liệu - Deep AI KhanhBlog
Document2 pages
17. Giảm chiều dữ liệu - Deep AI KhanhBlog
phanthikieuvy0612
No ratings yet
02 Descriptive-Statistics - VI
Document2 pages
02 Descriptive-Statistics - VI
sankhasubhra mandal
No ratings yet
Slide Spss SV
Document48 pages
Slide Spss SV
ngoc147153
No ratings yet
Huongdanthuchanh So3
Document9 pages
Huongdanthuchanh So3
Đạt Nguyễn Thành
No ratings yet
MLP301x 1
Document8 pages
MLP301x 1
đức ngọc trần
No ratings yet
PCA Fix
Document17 pages
PCA Fix
ngtientrung31
No ratings yet
2.2.1 Tiền xử lý dữ liệu: 2.2 Tổng hợp các phương pháp sử dụng
Document13 pages
2.2.1 Tiền xử lý dữ liệu: 2.2 Tổng hợp các phương pháp sử dụng
Anh Nguyễn Quỳnh
No ratings yet
MLP303x Classification
Document9 pages
MLP303x Classification
đức ngọc trần
No ratings yet
Cac Mo Hinh He Thong
Document34 pages
Cac Mo Hinh He Thong
Vũ Vinh
No ratings yet
NHÓM 1 - BUỔI 1 - KINH TẾ LƯỢNG TÀI CHÍNH
Document10 pages
NHÓM 1 - BUỔI 1 - KINH TẾ LƯỢNG TÀI CHÍNH
kimchi.15102004
No ratings yet
4 - Phan Lop Du Lieu-Final
Document12 pages
4 - Phan Lop Du Lieu-Final
Đức Trần Trọng
No ratings yet
Huong Dan Su Dung Weka PDF
Document16 pages
Huong Dan Su Dung Weka PDF
Phong Thien Thanh
50% (2)
Chuong 4 - Dich Tieng Viet
Document66 pages
Chuong 4 - Dich Tieng Viet
nganvo.35231022147
No ratings yet
2.9: Logistic regression la gì? Chạy các ví dụ và giải thích
Document9 pages
2.9: Logistic regression la gì? Chạy các ví dụ và giải thích
Anh Quân
No ratings yet
Data Mining1
Document14 pages
Data Mining1
hoaphonglan0202
No ratings yet
Nhóm 2
Document14 pages
Nhóm 2
Gia Phú
No ratings yet
Các Bư C CH y DT
Document2 pages
Các Bư C CH y DT
Giáp Tài
No ratings yet
Lab 01 - Preprocessing: Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Khoa Học Tự Nhiên
Document17 pages
Lab 01 - Preprocessing: Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Khoa Học Tự Nhiên
triet24042404
No ratings yet
Những dòng mã trên được sử dụng để nhập các thư viện Python để làm việc với máy học và dữ liệu văn bản
Document1 page
Những dòng mã trên được sử dụng để nhập các thư viện Python để làm việc với máy học và dữ liệu văn bản
Hoàng Đoàn
No ratings yet
BCCK Aem N2
Document23 pages
BCCK Aem N2
Mỹ Duyên
No ratings yet
Chương 7. Phân tích và xử lý dữ liệu
Document90 pages
Chương 7. Phân tích và xử lý dữ liệu
Nguyễn Như
No ratings yet
Đề cương học máy
Document8 pages
Đề cương học máy
phamquyet12052002
No ratings yet
NguyenCongHuan - B19DCCN288 - BaiTH2
Document10 pages
NguyenCongHuan - B19DCCN288 - BaiTH2
Công Huân Nguyễn
No ratings yet
Business Analytics by James R Evans (Textbook) - 260-299
Document40 pages
Business Analytics by James R Evans (Textbook) - 260-299
Ngọc Hân Ngô
No ratings yet
BT Phân L P
Document4 pages
BT Phân L P
NGỌC NGUYỄN THẾ
100% (1)
Tối ưu hóa truy vấn
Document17 pages
Tối ưu hóa truy vấn
fa Hồng Quân va
No ratings yet
Chương 3: Mô Hình Hoá Nghiệp Vụ
Document20 pages
Chương 3: Mô Hình Hoá Nghiệp Vụ
mitutu1234321
No ratings yet
1. Tiền xử lý dữ liệu
Document20 pages
1. Tiền xử lý dữ liệu
Nguyễn Thảo Ly
No ratings yet
Báo Cáo MNKHDL
Document23 pages
Báo Cáo MNKHDL
Đinh Trọng Hùng
No ratings yet
Functions For Manipulating Data in Postgresql
Document16 pages
Functions For Manipulating Data in Postgresql
bobibibo619
No ratings yet
Roadmap Data Science
Document14 pages
Roadmap Data Science
batong96
No ratings yet
Random Forest
Document5 pages
Random Forest
Huấn Nguyễn
No ratings yet
Hiện tượng đa cộng tuyến
Document4 pages
Hiện tượng đa cộng tuyến
Tuan Nguyen Ngoc
No ratings yet
BTL BA cuối-kỳ
Document45 pages
BTL BA cuối-kỳ
Nguyễn Đức Thắng
No ratings yet
ChâuGiaHào
Document9 pages
ChâuGiaHào
Hào Châu
No ratings yet
Chương Iii
Document12 pages
Chương Iii
Bảo Trân Nguyễn
No ratings yet
L2 Preprocess
Document20 pages
L2 Preprocess
manunited668
No ratings yet
DS
Document3 pages
DS
hanh nguyen
No ratings yet
Tailieuxanh Tieu Luan Tim Hieu Ve Ung Dung Cua Pca Trong Phan Tich Mo Ta Dinh Luong 8814
Document19 pages
Tailieuxanh Tieu Luan Tim Hieu Ve Ung Dung Cua Pca Trong Phan Tich Mo Ta Dinh Luong 8814
Trung Chánh Ngô
No ratings yet
Template Trong C
Document16 pages
Template Trong C
Kiều Linh
No ratings yet
Phan4 - C15 - Du Bao Kinh Doanh
Document30 pages
Phan4 - C15 - Du Bao Kinh Doanh
Thành Tâm Trần Hoàng
No ratings yet
Phan Tich H I Qui Xu The
Document8 pages
Phan Tich H I Qui Xu The
[Cong Hieu] Uan Mai
No ratings yet
Thống Kê Trong Công Nghiệp
From Everand
Thống Kê Trong Công Nghiệp
Phong Nguyễn Như
Rating: 5 out of 5 stars
5/5 (1)
How To Use Iterative Imputation
Document3 pages
How To Use Iterative Imputation
Vĩnh Hưng
No ratings yet
Chapter 4
Document3 pages
Chapter 4
Vĩnh Hưng
No ratings yet
Bao Cao Do An
Document65 pages
Bao Cao Do An
Vĩnh Hưng
No ratings yet
Tóm tắt
Document2 pages
Tóm tắt
Vĩnh Hưng
No ratings yet
PhanLamVinhHung MauNhiemVuDoAn
Document1 page
PhanLamVinhHung MauNhiemVuDoAn
Vĩnh Hưng
No ratings yet