You are on page 1of 9

Họ tên sv: Phạm Khánh Chi

MSSV: 31221020700
Phần 2: sử dụng phần mềm Orange, Lưu kết quả phân tích thành tập tin: S2_HoTenSV
1. Bài tập phân cụm: sử dụng phương pháp Hierarchical clustering và k-Means phân
cụm dữ liệu trong file: iris, (quan sát dữ liệu theo dạng bảng và biểu đồ)
Màn hình thực hiện phân cụm
2. Lựa chọn phương pháp tốt hơn với số cụm tốt nhất so sánh với nhãn iris ban đầu.
chụp màn hình thực hiện
3. Nộp tập tin Word, Excel kết quả và orange

Bảng dữ liệu không có missing value.


phương pháp Hierarchical clustering
Chụp lại các màn hình kết quả và giải thích các lựa chọn
Đánh giá nội bộ qua Silhouette index
Linkage: Weighted
Phân thành 2 cụm
Ta thấy: C1: 79 đa số >=0.5  đạt
C2: 71 có khoảng <=0.2  không đạt
Linkage: Single
Phân thành 2 cụm
Ta thấy: C1: 100 đa số >=0.5  đạt
C2: 50 >=0.5  đạt

Linkage: Complete
Phân thành 2 cụm
Ta thấy C1: 77 đa số >=0.5  đạt
C2: 73 có 1 khoảng <=0.2  không đạt

Linkage: Ward
Phân thành 2 cụm
Ta thấy C1: 49 >=0.5  đạt
C2: 101 đa số >=0.5; nhưng có 1 khoảng <=0.2  không đạt

Linkage: Average
Phân thành 2 cụm
Ta thấy C1: 50 >=0.5  đạt
C2: 100 đa số >=0.5  đạt

 Average và Single đều thỏa, ở đây em phân tích Linkage: Average


Đánh giá ngoài khi dùng: Average

Độ chính xác: (50+100)/150=1


k-Means
Chụp lại các màn hình kết quả và giải thích các lựa chọn
Đánh giá ngoài của phương pháp k-Means

Độ chính xác: (50+100)/150=1


2. Do phương pháp Hierarchical clustering và k-Means khi phân thành 2 cụm đều cho ta
kết quả tốt nhất, nên ta có thể xài 1 trong 2 phương pháp đều được.

You might also like