Professional Documents
Culture Documents
CHƯƠNG 2:
CẤU TRÚC VÀ CƠ SỞ HẠ
TẦNG CỦA KHO DL
2
CÁC TÍNH NĂNG CỦA
KHO DỮ LIỆU
3
HƯỚNG CHỦ ĐỀ (Subject-oriented)
7
ĐỘ MỊN/CHI TIẾT DỮ LIỆU
(Data Granularity)
8
KHO DỮ LIỆU VÀ CSDL
9
Thảo luận nhóm:
1. Phân tích điểm giống và khác nhau
giữa CSDL và KDL
2. Phân biệt DW và Data mart
10
CSDL Vs. KDL
ĐỊNH NGHĨA
Cơ sở dữ liệu là một tập hợp các dữ Kho dữ liệu là một hệ thống thông tin
liệu có tổ chức, thường được lưu trữ và lưu trữ lịch sử và giao hoán dữ liệu từ
truy cập từ hệ thống máy tính. Nó được một hoặc nhiều nguồn. Nó được thiết kế
thiết kế để xây dựng và nhập dữ liệu cho để phân tích, báo cáo, tích hợp dữ liệu
một nhiệm vụ cụ thể. giao dịch từ các nguồn khác nhau.
11
CSDL Vs. KDL
Phương pháp xử lý Xử lý giao dịch trực tuyến Xử lý phân tích trực tuyến
(OLTP) (OLAP).
Nhiệm vụ Giúp thực hiện các hoạt động Cho phép phân tích tình hình
cơ bản cho doanh nghiệp doanh nghiệp
và ra quyết định CL
Hướng Hướng ứng dụng Hướng chủ đề
Phạm vi Trong một ứng dụng Tập hợp nhiều ứng dụng
13
DATA MART
Một Data mart là một cơ sở dữ liệu hoặc tập hợp các cơ sở dữ liệu
riêng biệt, mỗi nhóm có một trọng tâm cụ thể.
Data mart là một tập con của EDW hoặc chứa một phần dữ liệu từ
EDW, vì vậy chu trình tải (Load cycle) của DW không nhanh hơn chu
trình tải của EDW (cung cấp dữ liệu cho Data mart).
Data mart có thể được xây dựng theo 2 phương pháp cơ bản sau:
Xây dựng một nền tảng riêng biệt với DW
Tạo các khung nhìn từ DW
14
Data Warehouse Vs. Data mart
15
TEXTBOOK:PG.30
KIẾN TRÚC KHO DỮ LIỆU
16
CÁC THÀNH PHẦN CHÍNH
17
CÁC THÀNH PHẦN CHÍNH
18
DATA ACQUISTION
( Thu thập dữ liệu)
20
DÀN DỮ LIỆU
(Data Staging Component)
Là thành phần làm cho dữ liệu sẵn sàng để có thể truy vấn. Bao gồm 3 chức
năng chính:
Rút trích dữ liệu
Chuyển đổi dữ liệu
Truyền dữ liệu
21
DATA STORAGE
(Lưu trữ dữ liệu)
Bao gồm thành phần lưu trữ dữ liệu (Data
Storage Component) và Metadata.
Được tính từ bắt đầu quá trình truyền dữ liệu
vào Kho dữ liệu.
Thực hiện các chức năng liên quan đến:
Truyền dữ liệu
Sao lưu và khôi phục
Bảo mật
Giám sát và tinh chỉnh DL
….. 22
THÀNH PHẦN LƯU TRỮ DỮ LIỆU
23
SIÊU DỮ LIỆU
(Metadata Component)
Siêu dữ liệu trong KDL tương tự như từ điển dữ liệu
hoặc danh mục dữ liệu trong cơ sở dữ liệu hệ thống
quản lý.
Là dữ liệu mô tả dữ liệu.
Bao gồm:
Operational metadatasiêu dữ liệu tác nghiệp
Extraction and transformation metadata
End-user metadata
24
INFORMATION DELIVERY
(Phân phối thông tin)
25
Textbook: pg.154
PHÂN PHỐI THÔNG TIN
(Information Delivery Component)
26
Textbook: pg.154
THÀNH PHẦN ĐIỀU KHIỂN VÀ QUẢN LÝ
(Management and Control Component)
27
THÀNH PHẦN ĐIỀU KHIỂN VÀ QUẢN LÝ
(Management and Control Component)
28
KIẾN TRÚC KHO DỮ LIỆU
Information Sources Data Warehouse OLAP Servers cung cấp các hàm Clients của người dùng, cái mà họ
nguồn thông tin Server (Tier 2) (Tier 3) thấy được
(Tier 1)
e.g., MOLAP
Semistructured Analysis
Sources Data serve
Warehouse
extract Query/Reporting
transform
load serve
refresh
e.g., ROLAP
Operational
serve Data Mining
DB’s
30
CÁC LOẠI KIẾN TRÚC KHO DỮ LIỆU
Textbook: pg.33 31
KHO DỮ LIỆU TẬP TRUNG
(Centralized Data Warehouse)
37
CƠ SỞ HẠ TẦNG KHO DỮ
LIỆU
38
CƠ SỞ HẠ TẦNG TÁC NGHIỆP
(Operational Infrastructure)
CSHT tác nghiệp hỗ trợ từng thành phần kiến trúc KDL bao
gồm:
Con người
Quy trình
Huấn luyện
Phần mềm quản lý
39
CƠ SỞ HẠ TẦNG VẬT LÝ
(Physical Infrastructure)
Một số tiêu chí chung khi lựa chọn hệ điều hành cho KDL:
Khả năng mở rộng
Tính bảo mật
Độ tin cậy.
Tính khả dụng
Tính đa nhiệm ưu tiên
Sử dụng cách tiếp cận đa tiến trình
Sự bảo vệ bộ nhớ
41
CÁC PLATFORM CHO KHO DỮ LIỆU
Single platform:
Mọi tính năng từ back-end đến front-end
đều triển khai trên cùng một platform:
mainframe, minicomputer, server
Linux…Là nền tảng của các KDL sơ khai.
Hybrid platform
Khi single platform không đáp ứng được
với các HTTT hiện đại thì giải pháp đa
nền tảng sẽ là giải pháp khả thi. 42
PLATFORM CHO THU THẬP DỮ LIỆU
Textbook: pg.171
43
PLATFORM CHO DÀN DỮ LIỆU
Textbook: pg.172
44
PLATFORM CHO CHUYỂN DỮ LIỆU
Textbook: pg.173
45
KIẾN TRÚC CLIENT/SERVER CHO KDL
Textbook: pg.174
46
BỘ CÔNG CỤ HỖ TRỢ
Textbook: pg.185
47
BÀI TẬP THẢO LUẬN NHÓM:
1. Các mục tiêu và tính năng của các công cụ hỗ trợ Kho dữ
liệu? (pg.186-188)
2. Các thiết bị kho dữ liệu (Data warehouse appliances) pg. 188-
189
BÀI TẬP VỀ NHÀ:
Review question Chapter 8 (pg.191)
Bài tập 1, 2, 5 Chapter 8 (pg.1922)
48
Q&A
49