You are on page 1of 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐỀ THI HỌC PHẦN

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN PHÁT HIỆN TRI THỨC
VÀ KHAI PHÁ DỮ LIỆU
Hệ: CQ Khóa:
Địa điểm: Online
Ngày thi: 13/12/2020 Ca thi: 2
Thời gian làm bài: 90 phút
KHOA: VIỆN CNTT & KTS
Bộ môn: CNTT

Quy định làm bài thi:


Sinh viên giải các bài toán sau bằng cách viết tay ra giấy. Đầu mỗi trang giấy
ghi Họ tên và mã sinh viên, số thứ tự trang giấy làm bài. Đề thi gồm 2 trang.
Quy định nộp bài thi:
Sinh viên nộp bài thi bằng cách chụp/quét bài làm, tạo file Word hoặc PDF chứa
hình ảnh bài làm, đặt tên file tương ứng: HọtênSV_MaSV.docx hoặc
HọtênSV_MaSV.pdf. Nộp 01 file chứa tất cả các câu đã làm.

Câu 1: (2 điểm)
Thuộc tính nào mà thuật toán cây ID A B Class
quyết định sẽ chọn để phân tách khi 1 T F 1
dùng Information Gain để quyết định 2 F F 1
phân tách với hai thuộc tính A, B và 3 T T 2
bảng thông tin ở bên. 4 F T 1
5 T F 1
6 F F 1
7 T F 2
8 F T 2
9 T F 1
10 T F 2
11 F F 2
12 T T 1
Câu 2: (3 điểm)
Với minsup=60%, minconf=50%. Thực hiện thuật toán tìm mẫu phổ biến và sinh ra
các luật kết hợp cho các giao dịch được thể hiện ở bảng dưới đây.
TID Items
T01 A1, A2, A4, A5
T02 A3, A4, A5
T03 A1, A2, A5
T04 A3, A4, A5
T05 A1, A2, A3
T06 A2, A3, A4, A5
T07 A3, A4
T08 A1, A4, A5
T09 A1, A2, A3, A5
T10 A2, A4
Câu 3: (3 điểm)
Cho tập mẫu gồm những các thuộc tính (A1, A2, Class) như sau: (1, 1, C), (1, 2,
B), (2, 1, C), (2, 1.5, A), (3, 2, B), (4,1.5, A), (4, 2, C), (5, 1.5, B), (4.5, 2, A), (4,
4, A), (4.5, 4, B), (4.5, 5, C), (4, 5, B), (5, 5, A), (4, 4.2, A)
Hãy xác định nhãn cho đối tượng (3.8, 4.3) theo thuật toán k-NN với k=3, với
khoảng cách Euclide. Trong trường hợp có nhãn như nhau, ưu tiên lấy nhãn xuất
hiện nhiều hoặc lấy nhãn xuất hiện trước trong danh sách trên.
Câu 4: (2 điểm)
Tìm medoid của một cụm gồm 5 mẫu sau đây với khoảng cách Euclide:
X1 = (1, 2), X2 = (1.3, 2.1), X3 = (2, 1), X4 = (2.4, 2.6), X5 = (2.2, 2.2)

Ghi chú: Cán bộ coi thi không giải thích gì thêm

You might also like