You are on page 1of 4

Bài tập về nhà - Phân cụm dữ liệu

Trần Minh Cường_31211026631


Lab 1 – PHÂN CỤM DỮ LIỆU (CLUSTERING)
1. File dữ liệu từ file Supermarket_Data.xlsx và chọn cột target phù hợp
2. Sử dụng phương pháp Hierarchical clustering và k-Means phân cụm dữ liệu
a. Chụp màn hình xây dựng mô hình:

b. Theo kết quả của Hierarchical Clustering nên chọn phân cụm như thế nào,
giải thích và chụp hình minh chứng kết quả bên dưới:
Theo kết quả thử nghiệm phân nhóm từ 2 đến 5, cho kết quả như sau:
Phân nhóm 2: điểm Sihou = 0.213, tương đồng trong cùng nhóm, nhóm số 2 bị phân tách
Phân nhóm 3: điểm Sihou = 0.032, tương đồng trong cùng nhóm, nhóm số 1 và 3 bị phân
tách
Phân nhóm 4: điểm Sihou = 0.068, tương đồng trong cùng nhóm, nhóm số 1 và 2 bị phân
tách
Từ kết quả trên, nên phân làm 2 nhóm sẽ có điểm Sihou cao và có phân tách trong cùng một
nhóm.
c. Theo kết quả của K-Means nên chọn phân cụm như thế nào, giải thích và
chụp hình minh chứng kết quả bên dưới:
Theo như kết quả K-Means thì nên phân bài toán thành 12 nhóm.

You might also like