TẬP THÔ VÀ CÁC KHÁI NIỆM

CHƢƠNG 1
Giới thiệu
 Lý thuyết tập thô - Rough Set Theory
 Ngƣời đề xuất: Zdzislaw Pawlak
– Vào năm 1980 của thế kỷ 20
Giới thiệu
 Ứng dụng: Là một công cụ để phân lớp các bảng dữ
liệu chứa các thông tin mơ hồ, không chắc chắn.
 Đóng vai trò quan trọng trong lĩnh vực trí tuệ nhân
tạo và các ngành khoa học liên quan đến nhận thức:
– Lĩnh vực máy học
– Thu nhận tri thức
– Phân tích quyết định, khám phá và phát hiện tri thức từ
các cơ sở dữ liệu, các hệ chuyên gia, các hệ hỗ trợ
quyết định v.v…
Cách tiếp cận
 Lý thuyết tập thô dựa trên giả thuyết: để định
nghĩa một tập hợp, chúng ta cần phải có thông
tin về mọi đối tƣợng trong tập vũ trụ.
 Chẳng hạn: nếu các đối tƣợng là những bệnh
nhân bị một bệnh nhất định thì các triệu chứng
của bệnh tạo thành thông tin về bệnh nhân.

Cách tiếp cận
 Tập thô có quan điểm hoàn toàn khác với quan
điểm truyền thống của tập hợp, trong đó mọi tập
hợp đều đƣợc định nghĩa duy nhất bởi các phần
tử của nó mà không cần biết bất kỳ thông tin nào
về các phần tử của tập hợp.
 Thực tế có thể tồn tại một số đối tƣợng giống
nhau ở một số thông tin nào đó, và ta nói rằng
chúng có quan hệ bất khả phân biệt với nhau.
Cách tiếp cận
 Đây chính là quan hệ mấu chốt và là điểm xuất
phát của lý thuyết tập thô:
 Biên giới của tập thô là không rõ ràng, và để xác
định nó ta phải đi tìm xấp xỉ của nó bằng các tập
hợp khác nhằm mục đích xác định một số đối
tƣợng nào đó có thuộc tập hợp hay không.
 Lý thuyết tập thô với cách tiếp cận nhƣ vậy đã
đƣợc ứng dụng trong rất nhiều lĩnh vực của đời
sống xã hội.
Hệ thông tin
 Một tập dữ liệu thể hiện dƣới dạng bảng, mỗi dòng
biểu diễn một trƣờng hợp, một sự kiện, một bệnh
nhân hoặc đơn giản là một đối tƣợng.
 Mỗi cột biểu diễn một thuộc tính (một biến, thông
tin, một đặc tính) của mỗi đối tƣợng; thuộc tính có
thể đƣợc cung cấp bởi chuyên gia hoặc ngƣời
dùng.
 Bảng nhƣ vậy đƣợc gọi là một hệ thống thông tin.
Hệ thông tin
 Về hình thức, mỗi hệ thông tin là một cặp (U, A)
 Trong đó:
– U là một tập khác rỗng các đối tƣợng gọi là tập vũ
trụ
– A là một tập khác rỗng các thuộc tính sao cho
a:U÷V
a
với mọi aeA.
– Tập V
a
đƣợc gọi là tập giá trị của a.
Hệ thông tin
 VD 1.1: Một hệ thống
thông tin nhƣ sau:
– U là tập gồm 7 đối
tƣợng: x
1
, …, x
7

– Tập thuộc tính A gồm 2
thuộc tính: Age và LEMS
(Lower Extremity Motor
Score).

Age LEMS
x
1
16-30 50
x
2
16-30 0
x
3
31-45 1-25
x
4
31-45 1-25
x
5
46-60 26-49
x
6
16-30 26-49
x
7
46-60 26-49
Hệ thông tin
 Cặp đối tƣợng x
3
và x
4
cũng
nhƣ x
5
và x
7
có giá trị bằng
nhau tại cả hai thuộc tính.
 Các đối tƣợng này không
phân biệt từng đôi đối với
tập thuộc tính {Age, LEMS}.
 Các đối tƣợng này (có thể)
có quan hệ bất khả phân
biệt

Age LEMS
x
1
16-30 50
x
2
16-30 0
x
3
31-45 1-25
x
4
31-45 1-25
x
5
46-60 26-49
x
6
16-30 26-49
x
7
46-60 26-49
Hệ quyết định
 Trong nhiều ứng dụng tập vũ trụ đƣợc phân chia
thành các tập đối tƣợng con bởi một tập các thuộc
tính phân biệt đƣợc gọi là tập thuộc tính quyết định.
 Hệ thông tin trong trƣờng hợp này gọi là hệ quyết
định.
 Hệ quyết định dạng: S = (U, A {d}), trong đó D = {d}
với d e A là tập thuộc tính quyết định.
 Các phần tử của tập A gọi là thuộc tính điều kiện
hoặc đơn giản gọi là các điều kiện.

Hệ quyết định
 Bảng bên thể hiện
một hệ quyết định,
trong đó:
 A = {Age, LEMS} tập
các thuộc tính điều
kiện.
 D = {Walk} là tập
thuộc tính quyết
định (Walk) với 2 giá
trị: Yes, No.

Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Hệ quyết định
 Cặp đối tƣợng x
3

x
4
có giá trị tại thuộc
tính quyết định khác
nhau.
 Cặp đối tƣợng x
5

x
7
có giá trị tại thuộc
tính quyết bằng
nhau.
 Quan hệ bất khả
phân biệt?
Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Quan hệ bất khả phân biệt
 Sự dƣ thừa thông tin
 Quan hệ tƣơng đƣơng-lớp tƣơng đƣơng
 Thuật toán xác định lớp tƣơng đƣơng.
Sự dƣ thừa thông tin
 Một hệ (bảng) quyết định thể hiện tri thức về các đối
tƣợng trong thế giới thực.
 Tuy nhiên trong nhiều trƣờng hợp bảng này có thể
đƣợc tinh giảm do tồn tại ít nhất hai khả năng dƣ
thừa thông tin sau đây:
– Nhiều đối tƣợng giống nhau, hay không thể phân biệt
với nhau lại đƣợc thể hiện lặp lại nhiều lần.
– Một số thuộc tính có thể là dƣ thừa, theo nghĩa khi bỏ
đi các thuộc tính này thì thông tin do bảng quyết định
cung cấp mà ta quan tâm sẽ không bị mất mát.
Sự dƣ thừa thông tin
 Ví dụ 1-2: Có thể bỏ
đi thuộc tính c mà
thông tin về các đối
tƣợng vẫn không đổi,
vì nếu một đối tƣợng
với 2 thuộc tính a, b
nhận 2 giá trị 0, 1 thì
có thể nói ngay rằng
giá trị của nó tại
thuộc tính c là 1.
STT a b c d
1 0 0 1 0
2 0 1 1 0
3 0 1 1 0
4 0 1 1 0
5 1 0 0 1
6 1 0 0 1
7 1 1 0 1
8 1 1 0 1
9 1 1 0 0
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Xem xét sự dƣ thừa thông tin nói trên qua khái niệm
quan hệ tƣơng đƣơng.
 Một quan hệ hai ngôi R _ XxX đƣợc gọi là quan hệ
tƣơng đƣơng khi và chỉ khi:
– R là quan hệ phản xạ: xRx, ¬x e X.
– R là quan hệ đối xứng: xRy ¬ yRx, ¬x,y e X.
– R là quan hệ bắc cầu: xRy và yRz ¬ xRz, ¬x,y,z e X.
 Một quan hệ tƣơng đƣơng R sẽ phân hoạch tập đối
tƣợng thành các lớp tƣơng đƣơng, trong đó lớp
tƣơng đƣơng của đối tƣợng x là tập tất cả các đối
tƣợng có quan hệ R với x.
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Xét hệ thông tin + = (U, A). Mỗi tập thuộc tính B _ A đều
tạo ra tƣơng ứng một quan hệ tƣơng đƣơng IDN
+
:
 IDN
+
(B) = {(x, x’) e U
2
| ¬a e B, a(x) = a(x’)}
 IDN
+
(B) đƣợc gọi là quan hệ B-bất khả phân biệt.
 Nếu (x, x’) e IDN
+
(B) thì các đối tƣợng x và x’ là không thể
phân biệt đƣợc với nhau qua tập thuộc tính B.
 Với mọi đối tƣợng x e U, lớp tƣơng đƣơng của x trong
quan hệ IDN
+
(B) đƣợc ký hiệu bới [x]
B
.
 Có thể viết IDN(B) thay cho IDN
+
(B).
 Quan hệ B-bất khả phân biệt phân hoạch tập đối tƣợng U
thành các lớp tƣơng đƣơng mà ta ký hiệu là U| IDN
+
(B).
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Ví dụ 1.3: Tập thuộc tính
{a,b,c} phân tập đối tƣợng
{1,2,…,9} thành tập lớp
tƣơng đƣơng sau:
 U | IDN
+
(B) = {{1}, {2,3,4},
{5,6},{7,8,9}}
 Đối tƣợng 2 và 3 thuộc cùng
một lớp tƣơng đƣơng nên
chúng không phân biệt đƣợc
với nhau qua tập thuộc tính
{a,b,c}.
STT a b c d
1 0 0 1 0
2 0 1 1 0
3 0 1 1 0
4 0 1 1 0
5 1 0 0 1
6 1 0 0 1
7 1 1 0 1
8 1 1 0 1
9 1 1 0 0
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Ví dụ 1.4 - Xét tại thuộc tính
{LEMS}, các đối tƣợng x
3
,
x
4
có cùng giá trị 1-25 nên
thuộc cùng một lớp tƣơng
đƣơng định nghĩa bởi quan
hệ IND({LEMS}), hay chúng
là bất khả phân biệt qua
thuộc tính {LEMS}.
Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Ba đối tƣợng x
5
, x
6
và x
7

cũng thuộc cùng một lớp
tƣơng đƣơng định nghĩa
bởi quan hệ IND({LEMS})
tƣơng ứng với giá trị thuộc
tính LEMS bằng 26-29.

Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Quan hệ tƣơng đƣơng – Lớp
tƣơng đƣơng
 Quan hệ IDN định ra ba
phân hoạch sau của tập đối
tƣợng U.
IND({Age}) =
{{x
1
,x
2
,x
6
},{x
3
,x
4
},{x
5
,x
7
}}
IND({LEMS}) =
{{x
1
},{x
2
},{x
3
,x
4
},{x
5
,x
6,
x
7
}}
IND({Age,LEMS}) =
{{x
1
},{x
2
},{x
6
},{x
3
,x
4
},{x
5
,x
7
}}

Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Thuật toán xác định lớp tƣơng
đƣơng.
 Vào:
– Tập đối tƣợng U
– Tập thuộc tính B
 Ra: Tập các lớp tƣơng đƣơng L
Thuật toán xác định lớp tƣơng
đƣơng.

Bƣớc 1: L = C
Bƣớc 2:
- Nếu U = = C thì: Thực hiện bƣớc 5
- Ngƣợc lại thì: Thực hiện bƣớc 3
Bƣớc 3:
- Xét x e U
1. P = {x};
2. U = U \ {x};
3. For (y e U)
Nếu (x và y là bất khả phân biệt quan tập thuộc tính B) thì
P = P {y};
U = U \ {y};
L = L P;
Bƣớc 4: Lặp lại bƣớc 2.
Bƣớc 5: Kết thúc.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Lý thuyết tập thô đƣa ra một quan điểm mới cho
các tri thức không rõ ràng, tri thức mập mờ.
Theo quan điểm này sự mập mờ đƣợc biểu diễn
bởi một vùng biên giới của tập hợp.
 Khái niệm tập hợp cũng có thể đƣợc định nghĩa
bởi ý nghĩa của các toán tử topology, IN (ở
trong) và close (đóng kín) gọi là xấp xỉ.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Cụ thể: Cho một tập đối tƣợng U và một quan hệ
hai ngôi R _ U x U. Tập U đƣợc gọi là tập vũ trụ
và R đƣợc gọi là quan hệ bất khả phân biệt.
Quan hệ R biểu diễn các tri thức còn thiếu về các
phần tử trong tập U.
 Giả sử R là một quan hệ tƣơng đƣơng. Khi đó
cặp (U,R) đƣợc gọi là không gian xấp xỉ, trong đó
U là một tập vũ trụ và R là một quan hệ tƣơng
đƣơng trên U.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Cho X _ U, mục tiêu của ta là phải xác định tập X
thông qua quan hệ R.
 Với R(x) ta xác định một lớp tƣơng đƣơng gồm
các đối tƣợng có quan hệ R với x.
 Quan hệ bất khả phân biệt R mô tả các tri thức
còn thiếu về tập vũ trụ U.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Lớp tƣơng đƣơng của quan hệ R, đƣợc gọi là
“các hạt” mô tả một phần cơ bản của tri thức mà
ta có thể nhận đƣợc thông qua quan hệ R.
 Nếu chỉ sử dụng quan hệ bất khả phân biệt R,
nhìn chung, ta không thể đạt đƣợc các đối tƣợng
riêng lẻ trong tập U mà chỉ “các hạt” có thể truy
cập của tri thức đƣợc mô tả bởi quan hệ này.

Xấp xỉ tập hợp và không gian xấp
xỉ.
 Tập tất cả các đối tƣợng có thể xác định chính
xác thuộc tập X thông qua quan hệ R đƣợc gọi là
R - xấp xỉ dƣới và đƣợc ký hiệu là R
*
(X).
R
*
(X) = {x:R(x)_X}.
 Tập tất cả các đối tƣợng chỉ có xác định là có thể
thuộc tập X thông qua quan hệ R đƣợc gọi là R –
xấp xỉ trên của tập X, và đƣợc ký hiệu là R
*
(X).
R
*
(X) = {x:R(x)·X ≠ C}.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Tập tất cả các đối tƣợng vừa có thể là thuộc tập X
vừa có thể thuộc tập –X xác định thông qua quan hệ
R gọi là vùng biên giới của tập X đối với quan hệ R,
và đƣợc ký hiệu là RN
R
(X).
RN
R
(X) = R
*
(X) - R
*
(X).
 Định nghĩa về khái niệm lý thuyết tập thô.
– Một tập X đƣợc gọi là “MỊN” đối với quan hệ R nếu và
chỉ nếu biên giới của X là rỗng.
– Một tập X đƣợc gọi là “THÔ” đối với quan hệ R nếu và
chỉ nếu biện giới của X là không rỗng.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Các định nghĩa về xấp xỉ tập hợp cũng có thể đƣợc
biểu diễn theo dạng “các hạt” tri thức nhƣ sau:
 Xấp xỉ dƣới của một tập hợp là hợp của tất cả “các
hạt” nằm hoàn toàn bên trong tập hợp X;
 Xấp xỉ trên của một tập hợp là hợp của tất cả “các
hạt” mà giao của nó với tập hợp X là không rỗng;
 Biên giới của một tập hợp là sự khác biệt giữa xấp xỉ
trên và xấp xỉ dƣới của tập hợp.
Xấp xỉ tập hợp và không gian xấp
xỉ.
“Các hạt” tri thức Tập các đối tƣợng U
Xấp xỉ dƣới
Xấp xỉ trên
Tập hợp X
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Một số tính chất của các xấp xỉ:
R
*
(X) _ X _ R
*
(X)
R
*
(C) = R
*
(C) = C;
R
*
(U) = R
*
(U) = U;
R
*
(X Y) = R
*
(X) R
*
(Y)
R
*
(X · Y) = R
*
(X) · R
*
(Y)
R
*
(X Y) _ R
*
(X) R
*
(Y)
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Một số tính chất của các xấp xỉ:
R
*
(X · Y) _ R
*
(X) · R
*
(Y)
X _ Y ÷ R
*
(X) _ R
*
(Y) và R
*
(X) _ R
*
(Y)
R
*
(-X) = -R
*
(X)
R
*
(-X) = -R
*
(X)
R
*
R
*
(X) = R
*
R
*
(X) = R
*
(X).
R
*
R
*
(X) = R
*
R
*
(X) = R
*
(X)
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Định nghĩa 4 phân lớp của tập thô:
– Một tập X là “thô” xác định bởi quan hệ R nếu và
chỉ nếu R
*
(X) ≠ C và R
*
(X) ≠ U.
– Một tập X là “bên trong” không thể xác định bởi R
nếu và chỉ nếu R
*
(X) = C và R
*
(X) ≠ U.
– Một tập X là “bên ngoài” không thể xác định bởi R
nếu và chỉ nếu R
*
(X) ≠ C và R
*
(X) = U.
– Một tập X là “tổng thể” không thể xác định bởi R
nếu và chỉ nếu R
*
(X) = C và R
*
(X) = U.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Ý nghĩa trực quan của sự phân lớp:
– Một tập X là thô xác định bởi R: nghĩa là đối với R
ta có thể quyết định là một số phần tử của tập U
thuộc vào tập X và một số phần tử của tập U
thuộc vào tập –X.
– Một tập X là “bên trong” không thể xác định bởi R
nghĩa là đối với R ta có thể quyết định một số
phần tử của tập U thuộc vào tập –X, nhƣng không
thể quyết định đối với bất kỳ phần tử nào của U là
nó có thuộc vào tập X hay không.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Ý nghĩa trực quan của sự phân lớp:
– Một tập X là “bên ngoài” không thể xác định bởi R
nghĩa là đối với R ta có thể quyết định đối với một
số phần tử của tập U thuộc vào tập X, nhƣng ta
không thể quyết định đối với bất kỳ phần tử nào
của U là nó có thể thuộc vào tập –X hay không.
– Một tập X là “tổng thể” không thể xác định bởi R
nghĩa là đối với quan hệ R ta không thể quyết định
bất kỳ phần tử nào của U là nó có thuộc vào tập X
hoặc –X hay không.
Xấp xỉ tập hợp và không gian xấp
xỉ.
 Tập thô X cũng có thể đƣợc đặc trƣng bởi hệ số:


 Hệ số này gọi là độ chính xác của xấp xỉ, với X
khác rỗng.
 Rõ ràng 0 ≤ ≤ 1. Nếu = 1 thì X là
“MỊN” đối với R (X là chắc chắn đối với R), mặt
khác, nếu < 1 thì X là “THÔ” đối với R (X
là mập mờ đối với R)
Xấp xỉ tập hợp
 Một quan hệ tƣơng đƣơng R cho ta một phân
hoạch các đối tƣợng của tập vũ trụ U.
 Các lớp tƣơng đƣơng này có thể đƣợc sử dụng
để tạo nên các tập con của tập vũ trụ.
 Các tập con này thƣờng chứa các đối tƣợng có
cùng giá trị tại tập các thuộc tính quyết định.
 Nhƣ vậy tập các giá trị tại các thuộc tính quyết
định có thể đƣợc mô tả một cách rõ rằng thông
qua tập các giá trị tại tập các thuộc tính điều
kiện.
Xấp xỉ tập hợp
 Ví dụ 1.4: Xét hệ quyết định điều tra về vấn đề da
cháy nắng
STT Trọng lƣợng Dùng thuốc Kết quả
1 Nhẹ Có Không cháy nắng
2 Nhẹ Có Không cháy nắng
3 Nặng Không Cháy nắng
4 Trung bình Không Không cháy nắng
Xấp xỉ tập hợp
 Ví dụ 1.4:
– Thuộc tính “Kết quả” là thuộc tính quyết định và
hai thuộc tính “Trọng lƣợng” và “Dùng thuốc” là
các thuộc tính điều kiện.
– Tập thuộc tính điều kiện B = {“Trọng lƣợng”,
“Dùng thuốc”} phân hoạch tập đối tƣợng U thành
tập các lớp tƣơng đƣơng:
U | INC(B) = {{1,2}, {3}, {4}}
Xấp xỉ tập hợp
 Ví dụ 1.4:
– Nhận thấy rằng tất cả các đối tƣợng thuộc cùng
một lớp tƣơng đƣơng đều có cùng giá trị tại thuộc
tính quyết định. Do đó, ta có thể mô tả thuộc tính
quyết định nhƣ sau:
– Kết quả là không cháy nắng nếu và chỉ nếu: Trọng
lƣợng là nhẹ và có dùng thuốc hoặc Trọng lƣợng
là trung bình và không dùng thuốc
– Kết quả là cháy nắng nếu và chỉ nếu: Trọng lƣợng
là nặng và không dùng thuốc
Xấp xỉ tập hợp
 Ví dụ 1.4:
– Ta nói rằng khái niệm “cháy nắng” và “không
cháy nắng” trong thuộc tính Kết quả có thể đƣợc
định nghĩa rõ ràng thông qua hai thuộc tính Trọng
lƣợng và Dùng thuốc.
– Tuy vậy không phải lúc nào cũng có thể định
nghĩa một khái niệm rõ ràng nhƣ vậy:
Xấp xỉ tập hợp
 Xét bảng bên: Giá trị
của thuộc tính Walk
không thể đƣợc định
nghĩa rõ ràng qua 2
thuộc tính điều kiện
là Age và LEMS:
Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Xấp xỉ tập hợp
 Hai đối tƣợng x
3
và x
4
thuộc cùng một lớp tƣơng
đƣơng tạo bởi hai thuộc tính điều kiện nhƣng lại có
giá trị khác nhau tại thuộc tính quyết định Walk, vì
vậy nếu một đối tƣợng nào đó có (Age, LEMS) = (31-
45, 1-25) thì ta vẫn không thể biết chắc chắn giá trị
của nó tại thuộc tính Walk là “Yes” hay “No”, nói
cách khác ta sẽ không thể có một luật nhƣ sau:
“Walk là Yes nếu Age là 31-45 và LEMS là 1-25”.
 Và đây chính là nơi mà khái niệm tập thô được sử
dụng.
Xấp xỉ tập hợp
 Nhƣ vậy trong bảng trên:
– Đối tƣợng nào có giá trị tại tập thuộc tính {Age, LEMS}
thuộc tập {{16-30,50}, {16-30,26-49}} thì có Walk là Yes.
– Đối tƣợng nào có giá trị tại tập thuộc tính {Age, LEMS}
thuộc tập {{16-30,0}, {46-60,26-49}} thì có Walk là No.
– Nếu đối tƣợng nào có giá trị tại tập thuộc tính {Age,
LEMS} thuộc tập {{31-45,1-25}} thì có Walk là Yes hoặc
No, nhƣ đã nói ở trên đối tƣợng này thuộc về biên giới
của 2 hai giá trị Yes và No.

Xấp xỉ tập hợp
 Cho hệ thông tin + = (U, A), tập thuộc tính B _ A, tập
đối tƣợng X _ U.
 Có thể xấp xỉ tập hợp X bằng cách chỉ sử dụng các
thuộc tính trong B từ việc xây dựng các tập hợp B-
xấp xỉ dƣới và B-xấp xỉ trên đƣợc định nghĩa nhƣ
sau:
– B-xấp xỉ dƣới của tập X :
– B-xấp xỉ trên của tập X :
Xấp xỉ tập hợp
 Tập hợp là các đối tƣợng trong U mà sử dụng các thuộc
tính trong B ta có thể biết chắc chắn rằng chúng là các phần
tử của X.
 Tập hợp là các đối tƣợng trong U mà sử dụng các thuộc
tính trong B ta có thể nói rằng chúng có thể là các phần tử
của X.
 Tập hợp BN(X) = \ đƣợc gọi là B-biên của tập X và chứa
các đối tƣợng mà sử dụng các thuộc tính của B ta không
thể xác định đƣợc chúng có thuộc tập X hay không.
 Tập hợp U \ đƣợc gọi là B-biên ngoài của tập X, gồm
những đối tƣợng mà sử dụng tập thuộc tính B ta biết chắc
chắn chúng không thuộc tập X.
Xấp xỉ tập hợp
 Một tập hợp X đƣợc gọi là “THÔ” nếu vùng biên
của nó là không rỗng, ngƣợc lại ta nói rằng tập
này là “RÕ”.
 Lƣu ý: Do khái niệm vùng biên của một tập hợp
đối tƣợng gắn liền với một tập thuộc tính nào đó
nên khái niệm THÔ hay RÕ ở đây cũng gắn liền
với tập thuộc tính đó.
Xấp xỉ tập hợp
 Ví dụ 1-5: Xét bảng
Age LEMS
Walk
x
1
16-30 50
Yes
x
2
16-30 0
No
x
3
31-45 1-25
No
x
4
31-45 1-25
Yes
x
5
46-60 26-49
No
x
6
16-30 26-49
Yes
x
7
46-60 26-49
No
Xấp xỉ tập hợp
 Với tập đối tƣợng X = {x | Walk(x) = Yes} = {x
1
, x
4
, x
6
}
và tập thuộc tính B = {Age, LEMS}. Khi đó ta nhận
đƣợc các vùng xấp xỉ sau đây của W thông qua B:
 = {x
1
, x
6
}, = {x
1
, x
3
, x
4
, x
6
}
 BN
B
(X) = {x
3
, x
4
}, U \ = {x
2
, x
5
, x
7
}
Xấp xỉ tập hợp
 Xấp xỉ bảng 1-5
Xấp xỉ tập hợp
 Ví dụ 1-6: Xét bảng thuộc tính của xe hơi
Đối tƣợng Kiểu dáng Số xi lanh Số cửa Nhiên liệu Tải trọng Vận tốc
1 USA 6 2 High Medium Medium
2 USA 6 4 Medium Medium Medium
3 USA 4 2 Medium Medium Medium
4 USA 4 2 Medium Medium Medium
5 USA 4 2 High Medium Medium
6 USA 6 4 High Medium Medium
7 USA 4 2 High Medium Medium
8 USA 4 2 High Light High
9 JAPAN 4 2 Low Light High
10 JAPAN 4 2 Medium Medium High
11 JAPAN 4 2 High Medium High
12 JAPAN 4 2 Low Medium High
13 JAPAN 4 2 Medium Medium High
14 USA 4 2 Medium Medium High
Ví dụ 1-6
 Tập vũ trụ U = {1,2,3,4,5,6,7,8,9,10,11,12,13,14}
 Chọn tập thuộc tính B = {Số xi lanh, Nhiên liệu, Tải
trọng}
 Tập thuộc tính quyết định D = {Vận tốc}. Khi đó tập
thuộc tính quyết định D gồm hai khái niệm là D
medium

với “Vận tốc=Medium” và D
High
với “Vận tốc = High”.

D
medium
= {1,2,3,4,5,6,7}
D
High
= {8, 9, 10, 11,12,13,14}
Ví dụ 1-6
 Các lớp tƣơng đƣơng ứng với quan hệ IND(B) là
E
1
= {1,6}
E
2
= {2}
E
3
= {3,4,10,13,14}
E
4
= {5,7,11}
E
5
= {8}
E
6
= {9} và
E
7
= {12}.
Ví dụ 1-6
 Xấp xỉ trên và xấp xỉ dƣới của D
Medium
và D
High
là:
B
*
D
Medium
= {E
1
, E
2
} = {1,6,2}
B
*
D
Medium
= {E
1
, E
2
, E
3
, E
4
} =
{1,6,2,3,4,10,13,14,5,7,11}
B
*
D
High
= {E
5
, E
6
, E
7
} = {8,9,12}
B
*
D
High
= {E
3
, E
4
, E
5
, E
6
, E
7
} =
{3,4,10,13,14,5,7,11,8,9,12}
Thuật toán xác định xấp xỉ dƣới
 Vào :
Tập các đối tƣợng X
Tập các thuộc tính B
 Ra :
Tập các đối tƣợng B
*
X
Thuật toán xác định xấp xỉ dƣới
 Vào :
Tập các đối tƣợng X
Tập các thuộc tính B
 Ra :
Tập các đối tƣợng B
*
X
Thuật toán xác định xấp xỉ dƣới
B1: Khởi tạo B
*
X = ∅ .
Xác định tập các phân hoạch P của tập vũ trụ U tạo bởi B.
U
1
= U
B2:
Nếu U
1
≠ ∅ Thì: Thực hiện bƣớc 3.
Ngƣợc lại: Thực hiện bƣớc 5
B3: Xét x ∈ U
1

Tìm phân hoạch P
i
∈ P sao cho: x ∈ P
i
.
Nếu P
i
⊆ X Thì : B
*
X = B
*
X ∪ P
i

U
1
= U
1
\ P
i
.
B4: Lặp lại bƣớc 2.
B5: Kết thúc

Thuật toán xác định xấp xỉ trên
 Vào :
Tập các đối tƣợng X
Tập các thuộc tính B
 Ra :
Tập các đối tƣợng B
*
X
Thuật toán xác định xấp xỉ dƣới
 Vào :
Tập các đối tƣợng X
Tập các thuộc tính B
 Ra :
Tập các đối tƣợng B
*
X
Thuật toán xác định xấp xỉ trên
B1: Khởi tạo B
*
X = ∅ .
Xác định tập các phân hoạch P của tập vũ trụ U tạo bởi B.
X
1
= X
B2:
Nếu X
1
≠ ∅ Thì: Thực hiện bƣớc 3.
Ngƣợc lại: Thực hiện bƣớc 5
B3: Xét x ∈ X
1

Tìm phân hoạch P
i
∈ P sao cho: x ∈ P
i
.
B
*
X = B
*
X ∪ P
i

Với mọi p ∈ P
i
∩ X
1
.
X
1
= X
1
\ {p}
B4: Lặp lại bƣớc 2.
B5: Kết thúc

Bài tập
 Ví dụ 1-6: Xét bảng thuộc tính của xe máy
– X là tập các xe máy có mức tiêu thụ chậm
– Y là tập các xe máy có mức tiêu thụ nhanh
– Tập thuộc tính B={Thƣơng hiệu, Nhiên liệu, Giá tiền}
 Yêu cầu:
– Tìm tập xấp xỉ trên và xấp xỉ dƣới của X, Y đối với tập thuộc
tính B
– Cài đặt các thuật toán tìm xấp trên và xấp xỉ dƣới
Xe máy Thƣơng hiệu Mầu sơn Vận tốc Nhiên liệu Giá tiền Tiêu thụ
1 Honda Xanh Cao T.Bình Cao Nhanh
2 Yamaha Xanh Cao Cao T.Bình Chậm
3 Yamaha Đỏ T.Bình Cao Cao Nhanh
4 Yamaha Vàng Cao Cao Cao Nhanh
5 Honda Vàng T.Bình Thấp T.Bình Nhanh
6 Honda Vàng Thấp Thấp Thấp Nhanh
7 Honda Đỏ Cao Cao T.Bình Chậm
8 Yamaha Xanh T.Bình Cao Thấp Chậm
9 Yamaha Vàng T.Bình T.Bình Thấp Nhanh
10 Honda Xanh Cao T.Bình Thấp Chậm
11 Honda Đỏ Cao T.Bình Cao Nhanh
12 Yamaha Vàng Thấp T.Bình Thấp Nhanh
13 Honda Xanh Thấp Thấp Thấp Nhanh
14 Honda Xanh T.Bình T.Bình Thấp Nhanh
15 Yamaha Xanh Thấp T.Bình Thấp Chậm

Sign up to vote on this title
UsefulNot useful