Bài tập về nhà chương 5 - ST7

Uploaded by

Nguyên Mai

0% found this document useful (0 votes)

3 views8 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views8 pages

Bài tập về nhà chương 5 - ST7

Uploaded by

Nguyên Mai

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 8

Search inside document

BÀI TẬP CHƯƠNG 5

1. Nhập dữ liệu từ file sẵn có Supermarket_Data.xlsx và chọn cột Target phù hợp

Nhập dữ liệu

Sử dụng Preprocess để tiền xử lý dữ liệu

Sử dụng Data Sampler để thu được bộ dữ liệu mới gồm 5000 biến
2. Sử dụng phương pháp Hierarchical Clustering và K-mean phân cụm dữ liệu
a) Mô hình xây dựng
b) Chọn phân cụm theo kết quả của Hierarchical Clustering:

Sử dụng công cụ Distances để tùy chọn cách đo lượng phân cụm

Chọn phương pháp Hierarchical Clustering, thực hiện các phân cụm phù hợp
Sử dụng Silhouette Plot để xem ta phân cụm có hợp lý chưa bằng cách quan sát
chỉ số Silhoette của từng cụm
(chỉ số được đánh giá là phù hợp khi nó không âm và tiến dần về 1)
- Theo kết quả của Hierarchical Clustering, nên chia dữ liệu thành 2 cụm là hợp
lý nhất vì quan sát chỉ số Silhouette của cụm 1 và cụm 2 thì thấy cả hai cụm đều
không âm.
c) Chọn phân cụm theo kết quả của k-Means
Chọn k-Means để tiến hành phân cụm
- Theo kết quả như từ hình trên, ta thấy phân thành 2 cụm là tối ưu nhất vì
có chỉ số cao nhất (0.617>0).
Sử dụng Silhouette Plot để xem ta phân cụm có hợp lý chưa
Từ kết quả trên cho thấy cả 2 cụm dữ liệu đều lớn>0 và không có giá trị âm

Gom Nhom
Document47 pages
Gom Nhom
Nguyễn Hoàng Khả Di
No ratings yet
BTVN2
Document6 pages
BTVN2
THUY TIEN TINA
No ratings yet
Phân cụm dữ liệu
Document2 pages
Phân cụm dữ liệu
Ha Ngo
No ratings yet
BTVN 5
Document4 pages
BTVN 5
Lê Thị Diệu Linh
No ratings yet
Bài tập về nhà - Phân cụm dữ liệu
Document6 pages
Bài tập về nhà - Phân cụm dữ liệu
Bùi Phương Uyên
No ratings yet
S2 - Lê Ngọc Mai
Document6 pages
S2 - Lê Ngọc Mai
Le Mai
No ratings yet
Iv. Kết Quả Mô Hình: Preprocess -> impute mising Values -> Remove rows with missing values
Document8 pages
Iv. Kết Quả Mô Hình: Preprocess -> impute mising Values -> Remove rows with missing values
Trang Thu
No ratings yet
KTra
Document1 page
KTra
VY HỒ THỊ YẾN
No ratings yet
KHDL 2 Orange
Document15 pages
KHDL 2 Orange
Vương Lam
No ratings yet
MLP303x Classification
Document9 pages
MLP303x Classification
đức ngọc trần
No ratings yet
5 - Gom Nhom Du Lieu-T
Document47 pages
5 - Gom Nhom Du Lieu-T
Tieu Trung
No ratings yet
Báo Cáo - Dự Báo Doanh Số Bán Hàng
Document22 pages
Báo Cáo - Dự Báo Doanh Số Bán Hàng
linh kiều
No ratings yet
4 - Gom Nhom Du Lieu
Document47 pages
4 - Gom Nhom Du Lieu
Vũ Chiến
No ratings yet
4 - Gom Nhom Du Lieu
Document47 pages
4 - Gom Nhom Du Lieu
QUỲNH HUỲNH TRẦN TRÚC
No ratings yet
Report
Document14 pages
Report
Linh Trúc
No ratings yet
Nhom10 - Ly Quoc Dung - 19133015 - Doan Tran Dang Khoa - 19133028 - Nguyen Quoc Bao - 19133002 - Vo Hoang Kha Dieu - 19133014 - Report
Document14 pages
Nhom10 - Ly Quoc Dung - 19133015 - Doan Tran Dang Khoa - 19133028 - Nguyen Quoc Bao - 19133002 - Vo Hoang Kha Dieu - 19133014 - Report
tùng phạm
No ratings yet
Bài 5- Đề cương bài giảng
Document7 pages
Bài 5- Đề cương bài giảng
Minh Hoàng
No ratings yet
Học Máy
Document33 pages
Học Máy
linh kiều
No ratings yet
BTVN5 KHDL
Document4 pages
BTVN5 KHDL
Cường Trần Minh
No ratings yet
5 - Gom Nhom Du Lieu-T
Document48 pages
5 - Gom Nhom Du Lieu-T
Tram Anhh
No ratings yet
Bài Tiểu Luận Nhóm
Document23 pages
Bài Tiểu Luận Nhóm
Thanh Ngân Phạm Lê
No ratings yet
Đề cương học máy
Document8 pages
Đề cương học máy
phamquyet12052002
No ratings yet
2.2.1 Tiền xử lý dữ liệu: 2.2 Tổng hợp các phương pháp sử dụng
Document13 pages
2.2.1 Tiền xử lý dữ liệu: 2.2 Tổng hợp các phương pháp sử dụng
Anh Nguyễn Quỳnh
No ratings yet
Khdl Phần Lý Thuyết
Document21 pages
Khdl Phần Lý Thuyết
tinhle.31221023009
No ratings yet
Nhóm Hi
Document31 pages
Nhóm Hi
hoangcuongimtt
No ratings yet
Báo Cáo K Means Cluster
Document7 pages
Báo Cáo K Means Cluster
HUY NGUYEN QUANG
No ratings yet
Báo cáo CĐHTTT - Nhóm học phần 1 - Group 7
Document18 pages
Báo cáo CĐHTTT - Nhóm học phần 1 - Group 7
quanga1k57hh1
No ratings yet
Một phương pháp sử dụng bộ lọc Kalman kết hợp với thuật toán bám ảnh Camshift nhằm nâng cao chất lượng bám trong các hệ thống robot tự động tìm kiếm và bám bắt mục tiêu
Document6 pages
Một phương pháp sử dụng bộ lọc Kalman kết hợp với thuật toán bám ảnh Camshift nhằm nâng cao chất lượng bám trong các hệ thống robot tự động tìm kiếm và bám bắt mục tiêu
pvdai
No ratings yet
ChuyenDe FINAL Ne
Document61 pages
ChuyenDe FINAL Ne
Đào Hồng
No ratings yet
Powpoint
Document29 pages
Powpoint
EDM NCS
No ratings yet
thuật toán SVM
Document10 pages
thuật toán SVM
Trường Mai
No ratings yet
BÁO CÁO DEMO THUẬT TOÁN K
Document3 pages
BÁO CÁO DEMO THUẬT TOÁN K
Linh Tran
No ratings yet
Vi K-Means, HC
Document3 pages
Vi K-Means, HC
Vi Trần
No ratings yet
5 - Gom Nhom Du Lieu-T
Document48 pages
5 - Gom Nhom Du Lieu-T
Huyền Phạm
No ratings yet
Phần 2
Document15 pages
Phần 2
hoangducquocnna2020
No ratings yet
2.4 - 2.6 Udth
Document13 pages
2.4 - 2.6 Udth
Võ Thị Tuyết Ngân
No ratings yet
Phân C M
Document13 pages
Phân C M
nguyenhuy
No ratings yet
File Báo Cáo
Document8 pages
File Báo Cáo
ado30025061
No ratings yet
Chương 1
Document6 pages
Chương 1
Nguyễn Thị Thu Hoài
No ratings yet
Thuat Toan 2
Document4 pages
Thuat Toan 2
Pháp Huỳnh
100% (1)
Khai phá dữ liệu
Document20 pages
Khai phá dữ liệu
Nguyen Linh
No ratings yet
Marketing - Data-Driven Customer Segmentation (Tiếp Thị - Phân Khúc Khách Hàng Dựa Trên Dữ Liệu)
Document10 pages
Marketing - Data-Driven Customer Segmentation (Tiếp Thị - Phân Khúc Khách Hàng Dựa Trên Dữ Liệu)
addacnew1
No ratings yet
BT KHDL Nhóm 9
Document4 pages
BT KHDL Nhóm 9
Bảo Khang
No ratings yet
BAO CAO BTL XSTK đã chỉnh
Document42 pages
BAO CAO BTL XSTK đã chỉnh
Dương Đàm
No ratings yet
K Means
Document20 pages
K Means
030137210358
No ratings yet
Chương Iii
Document12 pages
Chương Iii
Bảo Trân Nguyễn
No ratings yet
BaiMau DuLieuThuCap
Document20 pages
BaiMau DuLieuThuCap
BÌNH NGUYỄN NGỌC XUÂN
No ratings yet
Nguyen Duc Huy Nhap Mon Hoc May
Document15 pages
Nguyen Duc Huy Nhap Mon Hoc May
Phạm Hải Nam
No ratings yet
trí tuệ nhân tạo trong robot
Document19 pages
trí tuệ nhân tạo trong robot
Nguyễn Siêu
No ratings yet
Thuật toán K means
Document9 pages
Thuật toán K means
Nguyễn Trung Tiến
No ratings yet
Báo-Cáo MachineLearning
Document18 pages
Báo-Cáo MachineLearning
duyanhnguyen100802
No ratings yet
BT Phân L P
Document4 pages
BT Phân L P
NGỌC NGUYỄN THẾ
100% (1)
ĐỀ THI MÔN CÔNG NGHỆ 4.0
Document19 pages
ĐỀ THI MÔN CÔNG NGHỆ 4.0
Minh Võ
No ratings yet
Đề Thi Môn Công Nghệ 4.0 1
Document23 pages
Đề Thi Môn Công Nghệ 4.0 1
kien.le2008
No ratings yet
2.9: Logistic regression la gì? Chạy các ví dụ và giải thích
Document9 pages
2.9: Logistic regression la gì? Chạy các ví dụ và giải thích
Anh Quân
No ratings yet
08 - Mo Hình Ket Hop
Document57 pages
08 - Mo Hình Ket Hop
Win Lã
No ratings yet
Báo Cáo K - Means Phan H NG Doanh
Document10 pages
Báo Cáo K - Means Phan H NG Doanh
Doanh Phan
No ratings yet
De Cuong BTL2 XSTK
Document9 pages
De Cuong BTL2 XSTK
Lưu Huyền Đức
No ratings yet
Thống Kê Trong Công Nghiệp
From Everand
Thống Kê Trong Công Nghiệp
Phong Nguyễn Như
Rating: 5 out of 5 stars
5/5 (1)