You are on page 1of 16

21/01/2021

 Định nghĩa CSDL phân tán


 Đặc điểm của CSDL phân tán
 Tại sao phải sử dụng CSDL phân tán
 Các vấn đề cần giải quyết trong CSDL phân
tán
 Hệ quản trị CSDL phân tán

1
21/01/2021

program 1
File 1
data description 1

program 2
data description 2 File 2

program 3
data description 3 File 3

Application
program 1
(with data
semantics)
DBMS

description
Application
program 2 manipulation
(with data database
semantics) control

Application
program 3
(with data
semantics)
4

2
21/01/2021

Database Computer
Technology Networks
integration distribution

Distributed
Database
Systems
integration

integration ≠ centralization
5

 Định nghĩa 1
– CSDL phân tán (distributed database) là sự tập
hợp dữ liệu mà về mặt luận lý chúng thuộc
cùng một hệ thống nhưng được đặt nhiều nơi
(site) của một mạng máy tính.
– Sự phân tán dữ liệu: dữ liệu phải được phân
tán ở nhiều nơi.
– Sự tương quan luận lý: dữ liệu của các nơi sử
dụng chung để cùng giải quyết một vấn đề.

3
21/01/2021

Site 1
Site 2

Site 5

Communication
Network

Site 4 Site 3

Centralized DBMS on a Network


7

Site 1
Site 2

Site 5
Communication
Network

Site 4 Site 3

Distributed DBMS Environment


8

4
21/01/2021

Cơ sở Cơ sở
dữ liệu 1 dữ liệu 2
Terminal T
T T
T T
Máy tính 1 Máy tính 2

Chi nhánh 1 Chi nhánh 2


Mạng truyền
thông

Chi nhánh 3

T Cơ sở
Máy tính 3
T dữ liệu 3
T

CSDL phân tán trên một mạng phân tán địa lý


9

Trung tâm máy tính


Chi nhánh 1 Chi nhánh 2
T T
T T
T Cơ sở Cơ sở T
dữ liệu 1 dữ liệu 2

Máy tính 1 Máy tính 2

Mạng cục bộ

Chi nhánh 3
T Máy tính 3 Cơ sở
T dữ liệu 3
T

CSDL phân tán trên một mạng cục bộ


10

5
21/01/2021

Trung tâm máy tính

Chi nhánh 1 Chi nhánh 2


T T
Cơ sở Cơ sở Cơ sở
T T
dữ liệu 1 dữ liệu 2 dữ liệu 3
T T

Máy tính Máy tính Máy tính


phía sau 1 phía sau 2 phía sau 3

Mạng cục bộ

Máy tính ứng dụng (phía trước)

Chi nhánh 3
T
T
T

Hệ thống đa xử lý (multipropressor system)


11

 Định nghĩa 2
–CSDL phân tán là sự tập hợp dữ liệu được phân
tán trên các máy tính khác nhau của một mạng
máy tính. Mỗi nơi của mạng máy tính có khả
năng xử lý tự trị và có thể thực hiện các ứng
dụng cục bộ. Mỗi nơi cũng tham gia thực hiện ít
nhất một ứng dụng toàn cục, mà nơi này yêu cầu
truy xuất dữ liệu ở nhiều nơi bằng cách dung hệ
thống truyền thông con.
12

6
21/01/2021

 Định nghĩa 2
–Sự phân tán dữ liệu (data distribution): dữ liệu
phải được phân tán ở nhiều nơi.
–Ứng dụng cục bộ (local application): ứng dụng
được chạy hoàn thành tại một nơi và chỉ sử dụng
dữ liệu cục bộ của nơi này.
–Ứng dụng toàn cục (global application/
distributed application): ứng dụng được chạy
hoàn thành và sử dụng dữ liệu tại ít nhất 2 nơi.

13

 Điều khiển tập trung (centralized control)


 Độc lập dữ liệu (data independence)
 Giảm dư thừa (reduction of redundancy)
 Tính toàn vẹn (integrity)
 Phục hồi (recovery)
 Điều khiển đồng thời (concurrency control)
 Tính riêng tư (privacy) và tính bảo mật
(security)

14

7
21/01/2021

 Điều khiển tập trung


–Người quản trị CSDL cục bộ (local DBA)
–Người quản trị CSDL toàn cục (global DBA)
–Tính tự trị vị trí (site autonomy)

15

 Độc lập dữ liệu (data independence)


Tính trong suốt dữ liệu (data transparency)
–Trong suốt phân mảnh (fragmentation)
–Trong suốt vị trí (location)
–Trong suốt nhân bản (replication)
–Trong suốt ánh xạ cục bộ (local mapping)
Trong suốt phân tán (distribution
transparency)

16

8
21/01/2021

R R1
R1
Nơi 1

R2

R2
R3 Nơi 2

R4
R3
Nơi 3

Quan hệ toàn cục Mảnh Hình ảnh vật lý

17

18

9
21/01/2021

SELECT ENAME,SAL
FROM EMP,ASG,PAY Tokyo
WHERE DUR > 12
AND EMP.ENO = ASG.ENO Boston Paris
AND PAY.TITLE = EMP.TITLE Paris projects
Paris employees
Communication Paris assignments
Network Boston employees

Transparent Access
Montreal
New
Montreal projects
York Paris projects
Boston projects New York projects
New York employees with budget > 200000
New York projects Montreal employees
New York assignments Montreal assignments

19

Distributed Database

Distributed Database - User View 20

10
21/01/2021

 Giảm dư thừa
– Nhược điểm của dư thừa dữ liệu
•Không nhất quán dữ liệu (data inconsistency)
•Tốn nhiều vùng nhớ lưu trữ
–Ưu điểm của dư thừa dữ liệu
•Tính cục bộ (locality) của ứng dụng cao
•Tính sẵn sàng của dữ liệu (data availibility)
cao

21

 Các lý do về tổ chức và kinh tế


 Các CSDL hiện tại cần kết nối với nhau
 Sự lớn mạnh gia tăng
 Giảm chi phí truyền thông
 Các nghiên cứu về hiệu suất
 Độ tin cậy và tính sẵn sàng

22

11
21/01/2021

 Quản lý giao tác phân tán


(Distributed Transaction Management)
 Xử lý câu truy vấn phân tán
(Distributed Query Process)
 Điều khiển truy xuất đồng thời
(Concurrence Control)
 Điều khiển khôi phục sau sự cố (Recovery)
…
23

 Các thành phần của một D-DBMS gồm:


– Quản trị CSDL (DB – Database management)
– Truyền thông dữ liệu (DC – Data
Communication)
– Từ điển dữ liệu (DD – Data Dictionary)
– CSDL phân tán (DDB – Distributed Database)

24

12
21/01/2021

 Quản trị CSDL


– Quản lý CSDL
– Thực hiện các yêu cầu của ứng dụng
 Truyền thông dữ liệu
– Nhận yêu cầu truy xuất dữ liệu của ứng
dụng chạy tại thiết bị đầu cuối.
– Trả kết quả về cho ứng dụng

25

Từ điển dữ liệu


– Lữu trữ thông tin về các đối tượng trong
CSDL.
– Lưu trữ thông tin về sự phân tán dữ liệu
tại các nơi.
CSDL phân tán
– Liên lạc giữa các nơi: gửi yêu cầu và
nhận kết quả.

26

13
21/01/2021

TTT

Cơ sở dữ DB DC
liệu cục bộ 1 DDB
DD
Nơi 1
Nơi 2
DD
DDB
Cơ sở dữ DB DC
liệu cục bộ 2

TTT

Các thành phần của một D-DBMS thương mại


27

 Các chức năng tiêu biểu của D-DBMS:


– Truy xuất CSDL từ xa
– Hỗ trợ một số mức trong suốt phân tán
– Hỗ trợ cho việc quản trị CSDL phân tán
– Hỗ trợ cho việc điều khiển tương tranh và
phục hồi các giao tác phân tán.

28

14
21/01/2021

Tác vụ cơ bản
truy xuất CSDL
Chương trình
ứng dụng DBMS 1

Nơi 1
Nơi 2
DBMS 2 Cơ sở dữ liệu
2
Kết quả

Truy xuất từ xa thông qua các tác vụ cơ bản của


DBMS
29

Yêu cầu thực hiện chương trình


phụ trợ
Chương trình
ứng dụng DBMS 1

Nơi 1
Các tác vụ cơ bản truy Nơi 2
Kết quả cuối cùng xuất CSDL và kết quả
DBMS 2
Chương trình
phụ trợ Cơ sở dữ liệu
2

Truy xuất từ xa thông qua một chương trình phụ trợ

30

15
21/01/2021

 Tính đồng nhất và không đồng nhất


(homogeneity và heterogenity)
– Phần cứng
– Hệ điều hành
– Các DBMS cục bộ
 D-DBMS đồng nhất
– Các DBMS cục bộ giống nhau
 D-DMDS không đồng nhất
– Có ít nhất 2 DBMS cục bộ khác nhau
– Chuyển đổi các mô hình dữ liệu khác nhau
31

16

You might also like