Task 2

Uploaded by

Thư Anh

0% found this document useful (0 votes)

3 views3 pages

Original Title

Task2 (1)

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views3 pages

Task 2

Uploaded by

Thư Anh

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 3

Search inside document

Câu 1: Vẽ biểu đồ phân tán (scatter plot) cho tập dữ liệu Customer_transaction_record.csv.

Biểu đồ phân tán cho tập dữ liệu Customer_transaction_record.csv được thể hiện như sau:
12

6 VisitFrequency
AmountSpent

0
0 2 4 6 8 10 12

Từ biểu đồ phân tán, chúng ta có thể thấy rằng dữ liệu có xu hướng phân bố thành hai cụm:
Cụm 1: Bao gồm các khách hàng có tần suất truy cập cao và số tiền chi tiêu lớn.
Cụm 2: Bao gồm các khách hàng có tần suất truy cập thấp và số tiền chi tiêu nhỏ.

Câu 2: Dựa trên biểu đồ phân tán, hãy chọn số K phù hợp để phân cụm dữ liệu.
Số K là số lượng cụm mà chúng ta muốn phân tách dữ liệu. Trong trường hợp này, chúng ta có
thể thấy rằng dữ liệu có xu hướng phân bố thành hai cụm rõ ràng. Do đó, chúng ta có thể chọn
K = 2 là số lượng cụm phù hợp.

Câu 3: Chọn hai điểm dữ liệu ngẫu nhiên làm tâm ban đầu của các cụm.
Hai điểm dữ liệu ngẫu nhiên được chọn làm tâm ban đầu của các cụm là:
Centroid 1: (Visit Frequency = 10, Amount Spent = 25)
Centroid 2: (Visit Frequency = 35, Amount Spent = 18)

Câu 4: Gán mỗi điểm dữ liệu vào cụm có tâm gần nhất với nó.
Đối với mỗi điểm trong tập dữ liệu, chúng ta có thể sử dụng công thức khoảng cách Euclide để
tính khoảng cách đến từng trọng tâm. Điểm đó sẽ được gán cho cụm có trọng tâm gần nhất.
CustomerID VisitFrequency AmountSpent Cluster
1 8 31 1
2 7 32 1
3 22 6 2
4 11 32 1
5 38 29 1
6 40 29 1
7 39 25 1
8 28 13 2
9 23 6 2
10 27 8 2
11 30 14 2
12 32 17 2
13 28 11 2

Câu 5: Tính lại tâm của các cụm.

Sau khi tất cả các điểm đã được gán vào các cụm, chúng ta có thể tính lại trọng tâm của mỗi
cụm. Cái mới centroid là vị trí trung bình của tất cả các điểm trong cụm.
Trọng tâm 1: (10, 27) = (∑(x1, y1) / n1, ∑(x2, y2) / n1)
- Trong đó:
∑(x1, y1) là tổng của tọa độ x và y của tất cả các điểm trong cụm 1
n1 là số lượng điểm trong cụm 1
Trọng tâm 2: (35, 17) = (∑(x2, y2) / n2, ∑(x3, y3) / n2)
- Trong đó:
∑(x2, y2) là tổng của tọa độ x và y của tất cả các điểm trong cụm 2
n2 là số lượng điểm trong cụm 2

Câu 6: Lặp lại các bước 4 và 5 cho đến khi các cụm không còn thay đổi.
Sau khi tính lại tâm của các cụm, chúng ta thấy rằng các điểm dữ liệu không thay đổi cụm. Do
đó, chúng ta có thể dừng quá trình lặp lại.
Kết quả phân cụm:
Dựa trên các bước trên, chúng ta có kết quả phân cụm như sau:
Cluster CustomerID VisitFrequency AmountSpent
1 1, 2, 5, 6, 7 8, 7, 38, 40, 39 31, 32, 29, 29, 25
2 3, 4, 8, 9, 10, 11, 12, 13 22, 11, 28, 27, 30, 32, 28, 23 6, 32, 13, 8, 14, 17, 11, 6
Kết luận:
Dựa trên kết quả phân cụm, chúng ta có thể thấy rằng tập dữ liệu
Customer_transaction_record.csv có thể được phân thành hai cụm:
Cụm 1: Bao gồm các khách hàng trung thành, có tần suất truy cập cao và số tiền chi tiêu lớn.
Cụm 2: Bao gồm các khách hàng ít trung thành, có tần suất truy cập thấp và số tiền chi tiêu nhỏ.
Bảng phân tích kết quả phân cụm

Đặc điểm Cụm 1 Cụm 2

Tần suất truy cập Cao Thấp
Số tiền chi tiêu Lớn Nhỏ
Giá trị khách hàng Cao Thấp
Khả năng mua lại Cao Thấp
Khả năng giới thiệu Cao Thấp

Chapter 6.1 Clustering
Document21 pages
Chapter 6.1 Clustering
ha quan
No ratings yet
BaiTap3 Nhom17
Document34 pages
BaiTap3 Nhom17
tramypt2653
No ratings yet
5
Document40 pages
5
Trọng Hoàng
No ratings yet
Baocao AI DL ML
Document11 pages
Baocao AI DL ML
Trần Hiếu
No ratings yet
Tinh Nhanh Lop 4
Document3 pages
Tinh Nhanh Lop 4
Nhuquyen Nguyen
No ratings yet
Chuong 05. Tinh Toan Don Gian Va Ma Tran
Document11 pages
Chuong 05. Tinh Toan Don Gian Va Ma Tran
Thiện Trương
No ratings yet
Bao Cao
Document44 pages
Bao Cao
Việt Anh Nguyễn Huy
No ratings yet
Báo Cáo K - Means Phan H NG Doanh
Document10 pages
Báo Cáo K - Means Phan H NG Doanh
Doanh Phan
No ratings yet
Xulianh
Document12 pages
Xulianh
LÃM NGUYỄN HỮU
No ratings yet
Bui Hoang Hai
Document12 pages
Bui Hoang Hai
Việt Anh Nguyễn Huy
No ratings yet
Báo Cáo BTL Môn Python
Document19 pages
Báo Cáo BTL Môn Python
Như Đức
No ratings yet
Baocao AI
Document13 pages
Baocao AI
Trần Hiếu
No ratings yet
Giaibaitap Chuong2,8,9
Document23 pages
Giaibaitap Chuong2,8,9
Quyên Nguyễn
No ratings yet
Bao Cao
Document11 pages
Bao Cao
Nguyễn Trung Hải
No ratings yet
thuật toán kmean
Document19 pages
thuật toán kmean
Trần Trung Anh
No ratings yet
DS C1 MoDau
Document54 pages
DS C1 MoDau
Huỳnh Nguyễn Thành Đạt
No ratings yet
Chương 8 Phân Tích Phương Sai221
Document32 pages
Chương 8 Phân Tích Phương Sai221
Lẹo Hà
No ratings yet
IT005 M18-Kiemtra
Document7 pages
IT005 M18-Kiemtra
Thành Trung Nguyễn
No ratings yet
02 LePhuongAnh N19DCCN006 BT - TH.22102022
Document8 pages
02 LePhuongAnh N19DCCN006 BT - TH.22102022
TIKTOK HOT
No ratings yet
4 - Gom Nhom Du Lieu
Document47 pages
4 - Gom Nhom Du Lieu
Vũ Chiến
No ratings yet
4 - Gom Nhom Du Lieu
Document47 pages
4 - Gom Nhom Du Lieu
QUỲNH HUỲNH TRẦN TRÚC
No ratings yet
Đề ôn cuối kỳ toán cho các nhà kinh tế
Document3 pages
Đề ôn cuối kỳ toán cho các nhà kinh tế
vyhoangkieutrang
No ratings yet
Bao Cao Mau
Document18 pages
Bao Cao Mau
trinhminh562
No ratings yet
CK
Document10 pages
CK
thienne123r
No ratings yet
Code TN KTS DE1
Document28 pages
Code TN KTS DE1
Nguyễn Tấn Tín
No ratings yet
CNTT Trong Hoa Hoc
Document144 pages
CNTT Trong Hoa Hoc
Phuong Nguyen
No ratings yet
Chương 8 Phân Tích Phương Sai 232
Document33 pages
Chương 8 Phân Tích Phương Sai 232
anhhaoo0502
No ratings yet
Chương 1
Document8 pages
Chương 1
Nhung
No ratings yet
Counting
Document14 pages
Counting
Minh Quân Đinh Cao
No ratings yet
QHD CNP
Document20 pages
QHD CNP
Nguyễn Linh
No ratings yet
Bài 3 CÁC KIỂU DỮ LIỆU TRONG PLC PHỔ BIẾN NHẤT
Document8 pages
Bài 3 CÁC KIỂU DỮ LIỆU TRONG PLC PHỔ BIẾN NHẤT
qtyvtcdhrv
No ratings yet
5 - Gom Nhom Du Lieu-T
Document47 pages
5 - Gom Nhom Du Lieu-T
Tieu Trung
No ratings yet
XSTK1 PDF
Document45 pages
XSTK1 PDF
Sang Nguyễn
No ratings yet
K Means
Document20 pages
K Means
030137210358
No ratings yet
Chủ đề 1
Document19 pages
Chủ đề 1
0296Nguyễn Nhật Song Hào
No ratings yet
3 Chiavatri
Document29 pages
3 Chiavatri
Đức Ngọ Nguyễn
No ratings yet
Tiểu Luận Cơ Sở Tự Động
Document76 pages
Tiểu Luận Cơ Sở Tự Động
Thehoang Phan
No ratings yet
Chuong 3 TKT UEB
Document80 pages
Chuong 3 TKT UEB
Trứng Cút
No ratings yet
Slide TH-C T-P Aimesoft
Document26 pages
Slide TH-C T-P Aimesoft
Thương Phạm
No ratings yet
thiXSTK HKHè (CK)
Document2 pages
thiXSTK HKHè (CK)
ngocnguyenthe
No ratings yet
Bai 10 Định Dạng Cell
Document29 pages
Bai 10 Định Dạng Cell
Hoa Phương
No ratings yet
Assignment ICT4 K65C
Document7 pages
Assignment ICT4 K65C
tom
No ratings yet
ITMO Beamer Theme
Document82 pages
ITMO Beamer Theme
OBELINK DYING
No ratings yet
FAIR2020 - paper - 18 - Ứng Dụng Mạng Phức Hợp Trong Khai Phá Dữ Liệu Tương Tác Người Dùng
Document7 pages
FAIR2020 - paper - 18 - Ứng Dụng Mạng Phức Hợp Trong Khai Phá Dữ Liệu Tương Tác Người Dùng
Henry
No ratings yet
Slide TH-C T-P Aimesoft
Document26 pages
Slide TH-C T-P Aimesoft
Thương Phạm
No ratings yet
Bài tập KTL chương 1
Document71 pages
Bài tập KTL chương 1
Lê Gia Bảo
No ratings yet
Hieudk 10 D 1
Document28 pages
Hieudk 10 D 1
levanduongno1
No ratings yet
Quyhoachdong 000
Document37 pages
Quyhoachdong 000
Nguyễn Dũng Hoàng
No ratings yet
AI Ch7 Clustering Final
Document40 pages
AI Ch7 Clustering Final
Thanh Trí
No ratings yet
Mat Ma Hill Mat Ma Hill
Document24 pages
Mat Ma Hill Mat Ma Hill
minh.nguyen142857x7
No ratings yet
Pro - Erp-Scm - Phan Thuý Thanh - 31201021446
Document48 pages
Pro - Erp-Scm - Phan Thuý Thanh - 31201021446
Thuy Thanh Phan
100% (1)
Chuong III 4 So Trung Binh Cong
Document16 pages
Chuong III 4 So Trung Binh Cong
Ly Ly
No ratings yet
Hệ Mật Mã Khóa Công Khai Dựa Trên Đường Cong Elliptic
Document41 pages
Hệ Mật Mã Khóa Công Khai Dựa Trên Đường Cong Elliptic
long vu
No ratings yet
Gom Nhom
Document47 pages
Gom Nhom
Nguyễn Hoàng Khả Di
No ratings yet
Nội dung tuần 1 môn học QHTT
Document15 pages
Nội dung tuần 1 môn học QHTT
Khánh Phương
No ratings yet
BAOCAO
Document7 pages
BAOCAO
Nguyễn Dũng
No ratings yet
Bài 5
Document19 pages
Bài 5
Trần Thanh Tân
No ratings yet
I08-Cau Hinh To Hop
Document24 pages
I08-Cau Hinh To Hop
trungcao2010
No ratings yet
2.4 - 2.6 Udth
Document13 pages
2.4 - 2.6 Udth
Võ Thị Tuyết Ngân
No ratings yet
Vận Trù Học
From Everand
Vận Trù Học
Phong Nguyễn Như
No ratings yet
Đối thủ cạnh tranh của Alpenliebe tại thị trường Việt Nam
Document2 pages
Đối thủ cạnh tranh của Alpenliebe tại thị trường Việt Nam
Thư Anh
No ratings yet
Bảo Vệ Môi Trường
Document2 pages
Bảo Vệ Môi Trường
Thư Anh
No ratings yet
NLKT Trắc Nghiệm Chương 1 5
Document38 pages
NLKT Trắc Nghiệm Chương 1 5
Thư Anh
No ratings yet
Đối tượng nghiên cứu
Document1 page
Đối tượng nghiên cứu
Thư Anh
No ratings yet
Pháp luật đại cương
Document3 pages
Pháp luật đại cương
Thư Anh
No ratings yet
Pháp Luật Đại Cương
Document30 pages
Pháp Luật Đại Cương
Quế Hà
No ratings yet