You are on page 1of 17

ĐẠI HỌC SƯ PHẠM HÀ NỘI

KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO

TÌM HIỂU DATAGUIDES


Giảng viên hướng dẫn: TS. Phạm Thị Anh Lê

Học viên: Nguyễn Thị Ngọc Anh

Trần Thị Mai Oanh

Môn: Tìm kiếm truy xuất thông tin


NỘI DUNG
Bài toán

Nội dung

Ưu nhược điểm

Kết luận

2
BÀI TOÁN
• Input: Một CSDL bán cấu trúc.

• Output: Cấu trúc chỉ mục DataGuides mô tả


đường dẫn dữ liệu.

3
GIỚI THIỆU

Dataguide

Hình 1. Một số phương pháp đánh index 4


ĐỊNH NGHĨA 1

Cho một cơ sở dữ liệu nguồn(bán cấu trúc) S, một


DataGuides cho S là một đồ thị G thỏa mãn:
- Mọi đường dẫn trong S cũng xảy ra trong G.
- Mọi đường dẫn trong G xảy ra trong S.
- Mọi đường dẫn trong G là duy nhất.

5
ĐỊNH NGHĨA 1

Ví dụ:

Hình 2. Một S và DataGuide của S


6
ĐỊNH NGHĨA 1
Ví dụ 2:

Hình 3. Một S và DataGuide của S 7


ĐỊNH NGHĨA 1
Ví dụ 3:

8
Hình 4. Một S và 2 DataGuide G1, G2 của S
ĐỊNH NGHĨA 1
Ví dụ 4:

9
Hình 5. Một S và 2 DataGuide của S
ĐỊNH NGHĨA 2

Cho w, w’ là 2 labels và một đồ thị G:


w G w’ if w(G) = w’(G)

10
ĐỊNH NGHĨA 2
Ví dụ:

Hình 6. Một S và 1 DataGuide của S và 1 DataGuide gần đúng


11
ĐỊNH NGHĨA 3 - DataGuide mạnh
Cho một dữ liệu bán cấu trúc S, một DataGuides cho S là một đồ
thị G, biết:
• Có một đường dẫn nhãn w của S.
• Ts(w): là tập mục tiêu của w trong S.
• Tg(w) là tập mục tiêu đơn lẻ của w trong G.
• Ls(w) = {m | Ts(m) =Ts(w)}
• Ls(w) là tập hợp của tất cả các đường dẫn nhãn trong S đó chia
sẻ cùng một mục tiêu thiết lập như w.
• Tương tự, Lg(w) ={m | Tg(m) = Tg(w)}
• Lg(w) là tập tất cả các đường dẫn nhãn trong G có cùng mục tiêu
như w.
• Nếu đối với tất cả các đường dẫn nhãn w của S, Ls(w) = Lg(w),
thì G là một DataGuide mạnh cho S. 12
ĐỊNH NGHĨA 3 - DataGuide mạnh
Ví dụ:
• Ts(B.C)={6,7}
• Tg(B.C)={15}
• Ls(B.C)={m|Ts(m)=Ts(B.C)};
• m=(B.C)
• Ls(B.C)={B.C}
• Lg(B.C)={B.C}
• Vậy Ls(B.C)=Lg(B.C)
• Tương tự với (A.C). (đpcm).

13
ƯU ĐIỂM
- Đơn giản
- Hiệu suất cao trên hầu hết các loại cây.
- Chỉ mục có thể được xử lý hiệu quả như một
cây chuẩn, hủy bỏ sự cần thiết phải sử dụng các
lược đồ bổ sung hoặc các ngôn ngữ lập trình để
tương tác với chỉ mục.

14
NHƯỢC ĐIỂM
- Tốn nhiều chi phí.
- Việc cố gắng truy cập vào một cha mẹ của một
nút nhất định khá khó khăn và có thể không
hiệu quả.
- Cơ chế cập nhật động cũng có nhược điểm là nó
đòi hỏi phải có DataGuides cấp dưới để được
tính lại sau mỗi lá mới được đưa vào.

15
KẾT LUẬN

Thông qua việc tìm hiểu, nghiên cứu các


công trình nghiên cứu liên quan về
DataGuides chúng em đã tìm hiểu được như
sau:
• Định nghĩa của DataGuide
• Định nghĩa DataGuide mạnh
• Ưu, nhược điểm của DataGuide

16
CẢM ƠN CÔ VÀ CÁC BẠN!!!

17

You might also like