Professional Documents
Culture Documents
1
21/01/2021
2
21/01/2021
3
21/01/2021
4
21/01/2021
10
5
21/01/2021
11
12
6
21/01/2021
13
14
7
21/01/2021
15
8
21/01/2021
18
9
21/01/2021
10
21/01/2021
Ví dụ:
– Pr gồm 2 vị từ sơ cấp là PNAME
= "Maintenance" và BUDGET<= 200000.
– Các vị từ giao tối thiểu:
22
11
21/01/2021
12
21/01/2021
Giả sử ta có:
Pr={LOC=“Montreal”,LOC=“New York”,LOC=“Paris”}
26
13
21/01/2021
Pr={LOC=“Montreal”,LOC=“New York”,LOC=“Paris”}
Đầy đủ theo (1) nhưng không đầy đủ theo (2)
Chỉnh sửa???
27
28
14
21/01/2021
Ví dụ:
Pr ={LOC=“Montreal”, LOC=“New York”,
LOC=“Paris”, BUDGET≤200000,
BUDGET>200000}
29
30
15
21/01/2021
1. Khởi tạo
– Tìm một Pi Pr sao cho Pi phân hoạch R theo
qui tắc 1.
– Pr’ pi; Pr Pr - pi; F fi
2. Lặp lại việc thêm các vị từ vào Pr’ cho đến
khi nó đầy đủ
Tìm pj Pr sao cho pj phân hoạch fk của Pr’
theo qui tắc 1.
Đặt Pr’Pr’pj; Pr Pr – pj; F F fj
Nếu pk Pr’, là một vị từ không phù hợp thì
Pr’ Pr’ – pk; F F – fk
32
16
21/01/2021
33
17
21/01/2021
35
36
18
21/01/2021
38
19
21/01/2021
39
40
20
21/01/2021
41
Tính đầy đủ
Do Pr’ là đầy đủ và tối thiểu nên các vị từ
chọn là đầy đủ.
Tính tái tạo
Nếu quan hệ R được phân mảnh thành FR =
{R1,R2,…,Rr} R = Ri FR Ri
Tính rời nhau
Các minterm predicates làm cơ sở để phân
mảnh cần phải rời nhau từng đôi.
42
21
21/01/2021
43
PAY
TITLE, SAL
L1
EMP PROJ
ENO, ENAME, TITLE PNO, PNAME, BUDGET, LOC
L2 L3
Member(L1) = EMP
Owner(L1) = PAY ASG
ENO, PNO, RESP, DUR
44
22
21/01/2021
45
46
23
21/01/2021
47
24
21/01/2021
49
Trong đó,
L1
PAY1 = SAL≤30000(PAY)
EMP
PAY2 = SAL>30000(PAY)
ENO, ENAME, TITLE
50
25
21/01/2021
Tính đầy đủ
Toàn vẹn tham chiếu
Cho R là quan hệ member của link có owner là
quan hệ S được phân mảnh thành FS = {S1, S2, ...,
Sn}. Ngoài ra, gọi A là thuộc tính kết nối giữa R và S
thì với từng bộ t của R, tồn tại bộ t’ của S sao cho
t[A] = t’[A]
Tính tái tạo
Giống phân mảnh ngang chính
Tính rời nhau
chỉ có đồ thị kết giữa owner và các member
fragments. 51
26
21/01/2021
54
27
21/01/2021
55
56
28
21/01/2021
57
58
29
21/01/2021
59
60
30
21/01/2021
61
Nhập: ma trận AA
Xuất: ma trận ái lực gom cụm CA là một sắp
xếp các hoán vị AA
Khởi tạo: đặt và cố định một trong các cột
của AA vào CA.
Lặp: đặt n-i cột còn lại vào i+1 vị trí còn lại
trong ma trận CA. Đối với từng cột, chọn vị trí
đóng góp (contribution) lớn nhất vào độ đo ái
lực toàn cục.
Sắp thứ tự dòng: sắp xếp các dòng theo thứ
tự cột. 62
31
21/01/2021
63
với
64
32
21/01/2021
65
66
33
21/01/2021
67
Định nghĩa:
TQ = tập các ứng dụng chỉ truy cập TA
BQ = tập các ứng dụng chỉ truy cập BA
OQ = tập các ứng dụng vừa truy cập TA vừa truy cập BA
và:
CTQ = tổng số các truy cập đến các thuộc tính bởi các
ứng dụng chỉ truy cập TA
CBQ = tổng số các truy cập đến các thuộc tính bởi các
ứng dụng chỉ truy cập BA
COQ = tổng số các truy cập đến các thuộc tính bởi các
ứng dụng truy cập cả TA và BA
Sau đó tìm điểm dọc theo đường chéo làm cực đại
CTQ*CBQ-COQ2 68
34
21/01/2021
Có 2 vấn đề:
Tạo cluster ở điểm giữa ma trận CA
– Dịch lên một dòng và dịch trái một cột, áp
dụng thuật toán tìm điểm phân hoạch tốt nhất.
– Làm điều này cho tất cả các dịch chuyển khả dĩ
– Chi phí O(n2)
Nhiều hơn 2 clusters
– Phân hoạch theo m-cách
– Thử với 1, 2,…,m-1 điểm tách dọc theo đường
chéo và tìm điểm tốt nhất cho từng điểm.
– Chi phí O(2n) 69
70
35
21/01/2021
36
21/01/2021
73
37