Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Look up keyword
Like this
0Activity
0 of .
Results for:
No results containing your search query
P. 1
chuong 2

chuong 2

Ratings: (0)|Views: 1|Likes:
Published by Ngân Trần
tài liệu
tài liệu

More info:

Categories:Types, Research
Published by: Ngân Trần on Dec 05, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/05/2012

pdf

text

original

 
 
Ch
ươ 
ng 2 .
 
C
Ơ 
S
Ở 
LÝ THUY
T
2.1
 
Gi
ớ 
i thi
u
Trong l
 ĩ 
nh v
c khai thác d
li
u trên CSDL chu
i, khai thác m
u tu
n t
là bàitoán
đầ
u tiên
đượ 
c
đề
xu
t b
ở 
i Agrawal và Srikant vào n
ă
m 1995 [3] và
đ
ã thu hútnhi
u nghiên c
u [4], [5], [10], [17], [18], [20], [23]. Cho CSDL chu
i, khai thácm
u tu
n t
là xác
đị
nh nh
ng m
u mà s
xu
t hi
n c
a chúng trong CSDL th
ang
ưỡ 
ng h
tr 
ợ 
t
i thi
u. Khai thác m
u tu
n t
 
đượ 
c
ng d
ng trong nhi
u l
 ĩ 
nh v
cnh
ư
: phân tích th
tr 
ườ 
ng, phân tích m
u truy c
 p web, d
 
đ
oán nhu c
u mua s
mc
a khách hàng…Lu
t tu
n t
 
đượ 
c sinh t
m
u tu
n t
, nó bi
u di
n m
i quan h
gi
a hai lo
t s
 ki
n, lo
t s
ki
n này s
x
y ra sau lo
t s
ki
n kia. Lu
t tu
n t
m
ở 
ng kh
n
ă
ngs
d
ng và ý ngh
 ĩ 
a bi
u
đạ
t c
a m
u tu
n t
, th
hi
n tri th
c ti
m
n c
a d
li
utu
n t
.
2.2
 
Ý ngh
 ĩ 
a lu
t tu
n t
ự 
 
Lu
t tu
n t
bi
u di
n m
i quan h
gi
a các m
u tu
n t
theo th
ờ 
i gian. Có th
 coi lu
t tu
n t
m
ở 
ng t
nhiên c
a m
u tu
n t
, t
ươ 
ng t
nh
ư
lu
t
ế
t h
ợ 
 p m
ở 
ng t
nhiên c
a t
 p ph
bi
ế
n [2]. M
t lu
t tu
n t
bi
u th
d
ướ 
i d
ng X
Y,ngh
 ĩ 
a là trong các chu
i d
li
u, n
ế
u m
u X xu
t hi
n thì m
u Y c
ũ
ng xu
t hi
ntheo sau m
u X v
ớ 
i
độ
tin c
y cao. So v
ớ 
i các m
u tu
n t
, các lu
t giúp ta hi
u t
th
ơ 
n v
th
t
th
ờ 
i gian th
hi
n trong CSDL chu
i. Ví d
, m
t ng
ườ 
i mua
đĩ 
a phimStar Wars ph
n 4 s
mua ti
ế
 p ph
n 5 và ph
n 6. Nh
ư
v
y m
u mua hàng (4, 5, 6) làm
u th
hi
n ho
t
độ
ng mua. Tuy nhiên, trong th
c t
ế
m
t c
a hàng bán
đĩ 
a có hàngtr 
ă
m khách hàng v
ớ 
i s
ở 
thích khác nhau. Do
đ
ó, m
u (4, 5, 6) có xu h
ướ 
ng xu
t hi
nv
ớ 
i
độ
h
tr 
ợ 
th
 p. Khai thác v
ớ 
i
độ
h
tr 
ợ 
th
 p v
n tr 
v
các m
u, tuy nhiên s
nhi
u m
u sai và không thích h
ợ 
 p. N
ế
u nh
ư
s
d
ng lu
t, có th
lo
i b
 
đ
i các m
u
- 10 -
 
 sai nh
ư
v
y b
ng cách
đư
a ra khái ni
m
độ
tin c
y cho t
 p m
u. Ch
có nh
ng lu
tth
a ng
ưỡ 
ng h
tr 
ợ 
và ng
ưỡ 
ng tin c
y m
ớ 
i
đượ 
c khai thác. Nh
ư
v
y, thông qua lu
t tu
n t
chúng ta có th
bi
ế
t
đượ 
c lo
t s
ki
n nàoth
ườ 
ng s
x
y ra sau lo
t s
ki
n tr 
ướ 
c
đ
ó. Lu
t tu
n t
tuy khá
đơ 
n gi
n nh
ư
ngnh
ng thông tin mà lu
t mang l
i có nhi
u ý ngh
 ĩ 
a quan tr 
ng, h
tr 
ợ 
không nh
 cho quá trình ra quy
ế
t
đị
nh, qu
n lý và có tính
đị
nh h
ướ 
ng. Lu
t tu
n t
t h
u íchtrong nhi
u l
 ĩ 
nh v
c: y d
ượ 
c [24], th
ươ 
ng m
i [8], công ngh
ph
n m
m [13], [15],[22]. M
t s
ví d
v
ý ngh
 ĩ 
a c
a lu
t tu
n t
trong các l
 ĩ 
nh v
c
ng d
ng:
 
Phân tích th
tr 
ườ 
ng: N
ế
u m
t khách hàng mua xe h
ơ 
i thì sau
đ
ó kháchhàng này s
mua b
o hi
m. Quy lu
t này r 
t h
u ích cho vi
c thi
ế
t
ế
 chi
ế
n l
ượ 
c qu
ng cáo s
n ph
m
đố
i v
ớ 
i khách hàng.
 
Y d
ượ 
c: N
ế
u m
t b
nh nhân b
s
t và gi
m m
c thrombosite, sau
đ
ó xu
thi
n nh
ng
đố
m
đỏ
trên da thì có kh
n
ă
ng b
nh nhân này m
c b
nh s
txu
t huy
ế
t. Lu
t tu
n t
này giúp d
 
đ
oán b
nh
để
có h
ướ 
ng
đ
i
u tr 
thíchh
ợ 
 p cho b
nh nhân.
 
Công ngh
ph
n m
m: N
ế
u trình
đ
i
u khi
n thi
ế
t b
trong h
 
đ
i
u hànhWindow g
i th
t
c KeAcquireSpinLock thì sau
đ
ó c
ũ
ng s
g
i th
t
cKeReleaseSpinLock 
 
[14].
2.3
 
Phát bi
u bài toán khai thác lu
t tu
n t
ự 
 2.3.1
 
Các khái ni
m v
chu
i d
ữ 
li
u
Cho t
 p
 I = {i
1
 , i
2
 , …, i
m
 }
g
m
m
ph
n t
còn g
i là các item. M
t itemset làt
 p không có th
t
khác r 
ng, g
m các item. Itemset
i
ký hi
u là
(i
1
 , i
2
 , …, i
)
v
ớ 
im
i
i
 j
m
t item. Itemset có l
c l
ượ 
ng là
ký hi
u
k-
itemset. Không m
t tínht
ng quát, gi
s
các item trong itemset
đượ 
c s
 p theo th
t
t
ă
ng d
n.M
t chu
i (sequence) là m
t danh sách có th
t
nh
ng itemset. Chu
i
 s
 
đượ 
cký hi
u là
 s
1
s
2
s
n
ho
c
〈 
 s
1
→ 
 s
2
→ 
→ 
 s
n
 〉 
v
ớ 
i m
i
 s
i
là m
t itemset,
n
là s
l
ượ 
ngitemset. Kích th
ướ 
c c
a chu
i b
ng s
l
ượ 
ng itemset có trong chu
i. Chi
u dài c
a
- 11 -
 
 chu
i là t
ng s
item có trong chu
i, ký hi
u . Chu
i có chi
u dài
còn
đượ 
c g
i là
k-sequence
. Ví d
,
 s
=
(B)(AC)
là m
t
3-sequence
có kích th
ướ 
c là 2.
=
=
n ji
 s
1
Chu
i
 β 
=
〈 
b
1
b
2
… b
m
 〉 
 
đượ 
c g
i là chu
i con c
a chu
i
α 
=
〈 
a
1
a
2
… a
n
 〉 
 
hay
 
α 
là chu
i cha c
a
 β 
, ký hi
u
 β 
 
 ⊆ 
 
α 
 ,
n
ế
u t
n t
i nh
ng s
nguyên
1
≤ 
j
1
< j
2
< … < j
n
≤ 
m
sao cho
b
1
 ⊆ 
a
 j1
 , b
2
 ⊆ 
a
 j2
 , …, b
m
 ⊆ 
a
 jm
. Ví d
chu
i
(B)(AC)
là chu
i con c
a
(AB)(E)(ACD)
; nh
ư
ng
(AB)(E)
không ph
i là chu
i con c
a chu
i
(ABE)
ng
ượ 
c l
i.
C
ơ 
s
ở 
d
ữ 
li
u chu
i:
C
ơ 
s
ở 
d
li
u chu
i là m
t t
 p h
ợ 
 p các b
d
li
u d
ng (
 sid, s
), trong
đ
ó
 sid 
đị
nh danh c
a chu
i và
 s
là chu
i các itemset.
M
u:
M
u là m
t chu
i con c
a m
t chu
i d
li
u. M
i itemset trong m
tm
u còn
đượ 
c g
i là m
t thành ph
n (element).
Độ
h
tr
ợ 
(
support 
):
Cho CSDL chu
i
 D
, m
i chu
i có m
t ch
s
 
đị
nh danhduy nh
t.
Độ
h
tr 
ợ 
tuy
t
đố
i c
a m
t m
u tu
n t
 
 f 
t
ng s
chu
i trong
 D
ch
a
 f 
, ký hi
u
{ }
()
 Dii
 supfSDf
=
.
Độ
h
tr 
ợ 
t
ươ 
ng
đố
i c
a
 f 
là t
l
ph
ntr 
ă
m chu
i trong
 D
ch
a
 f 
.
 
đ
ây, m
c h
tr 
ợ 
tuy
t
đố
i ho
c t
ươ 
ng
đố
i s
 
đượ 
c s
 d
ng chuy
n
đổ
i qua l
i, kí hi
u là
 sup(f)
.
M
u tu
n t
ự 
:
Cho tr 
ướ 
c ng
ưỡ 
ng h
tr 
ợ 
t
i thi
u (
minSup
) xác
đị
nh b
ở 
i ng
ườ 
idùng,
minSup
 
(
0, 1
]
. M
t m
u
 f 
 
đượ 
c coi là ph
bi
ế
n n
ế
u
độ
h
tr 
ợ 
c
a nó l
ớ 
n h
ơ 
nho
c b
ng
minSup
:
 sup(f)
≥ 
minSup
, khi
đ
ó
 f 
đượ 
c g
i là m
u tu
n t
.d
: Cho CSDL nh
ư
b
ng 2.1 có t
 p các item phân bi
t là {A, B, C} và
minSup
tuy
t
đố
i 2. Xét chu
i
 s
1
=
(AB)(B)(B)(AB)(B)(AC)
, chu
i
 s
1
6itemset là: (AB), (B), (B), (AB), (B), (AC) và có 9 item. V
y
 s
1
có kích th
ướ 
c là 6và có
độ
dài là 9. Trong chu
i
 s
1
, item A xu
t hi
n ba l
n nh
ư
ng n
ế
u tính
độ
h
tr 
ợ 
 thì
độ
h
tr 
ợ 
c
a item A ch
 
đượ 
c tính là 1
đố
i v
ớ 
i chu
i
 s
1
 
đ
ó. Chu
i
 p
=
(AB)(C)
 m
t chu
i con c
a chu
i
 s
1
, vì v
y chu
i con
 p
còn
đượ 
c g
i là m
u. Trong
- 12 -

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->