You are on page 1of 6

Họ tên sv: Lê Ngọc Mai

MSSV: 31221026795
Phần 2: sử dụng phần mềm Orange, Lưu kết quả phân tích thành tập tin: s2_HoTenSV
1. Bài tập phân cụm: sử dụng phương pháp Hierarchical clustering và k-Means phân
cụm dữ liệu trong file: bank marketing, (quan sát dữ liệu theo dạng bảng và biểu
đồ)
phương pháp Hierarchical clustering
Chụp lại các màn hình kết quả và giải thích các lựa chọn
-Chọn công cụ Distances để tuỳ chọn cách đo lượng độ phân cụm
-Từ Distances, tiếp tục chọn phương pháp Hierarchical Clustering, thực hiện cáctùy chọn
phân cụm phù hợp.
-Để xem việc chúng ta tự phân cụm có hợp lý chưa, ta chọn chức năng SilhouettePlot và
quan sát chỉ số Silhouette của từng cụm. Chỉ số được đánh giá là phù hợp khi nó không
âm và tiến dần về 1
- Sau khi thực hiện nhiều cách chia cụm khác nhau, thì em thấy với phương
phápHierarchical Clustering, dữ liệu chia thành 2 cụm là hợp lí nhất. Vì quan sát chỉ số
Silhouette Plot của cụm 1 và cụm 2 thì thấy cả hai đều không âm.
k-Means
Chụp lại các màn hình kết quả và giải thích các lựa chọn
-Chọn k-Means để tiến hành phân cụm
-Theo kết quả k-Means như trên hình, ta thấy phân chia thành 2 cụm là tối ưu nhất vì có
chỉ số cao nhất (0.170 > 0).
-Tiếp theo, ta quan sát biểu diễn phân cụm trong công cụ Silhouette Plot
Màn hình thực hiện phâm cụm

2. Lựa chọn phương pháp tốt hơn với số cụm tốt nhất so sánh với nhãn lớp ban đầu.
chụp màn hình thực hiện
Như vậy, có thể thấy cả 2 cụm dữ liệu đều có chỉ số Silhouette lớn hơn 0 và
khôngtồn tại giá trị âm => Với phương pháp k-Means, dữ liệu chia thành 2 cụm là
hợp lý nhất.
3. Nộp tập tin Word, Excel kết quả và orange

You might also like