You are on page 1of 33

Machine Translated by Google

Nhân bản – Phụng sự – Khai phóng

Chương 2: Khái niệm thiết kế kho dữ liệu


kho dữ liệu
Machine Translated by Google

Nội dung chương

•Tổng quan về lịch sử của Kho dữ liệu

• Thứ bậc

2
Machine Translated by Google

Mô hình hóa khái niệm của kho dữ liệu


Mô hình hóa khái niệm DW thực hiện chuyển đổi đặc tả yêu cầu kinh doanh bán chính thức

thành lược đồ đa chiều khái niệm chính thức với các mối quan hệ cấp cao nhất giữa các

thực thể khác nhau.

Các đặc điểm của mô hình dữ liệu khái niệm trong DW: • Nó

chứa các thực thể thiết yếu và các mối quan hệ giữa chúng.

• Không có thuộc tính nào được chỉ định.

• Không có khóa chính nào được chỉ định.

Việc hình thức hóa dẫn đến một sơ đồ đồ họa đa chiều, trong đó

bao gồm các lược đồ thực tế với các biện pháp liên quan và phân cấp kích thước của chúng.

3
Machine Translated by Google

Ví dụ

Lược đồ khái niệm của


Kho dữ liệu Northwind

4
Machine Translated by Google

Mô hình hóa khái niệm của kho dữ liệu: Thuật ngữ


• Một lược đồ bao gồm một tập hợp các chiều và một tập hợp các sự kiện

(đo).

• Một thực tế bao gồm các giá trị định lượng được lưu trữ trong các biện pháp và một định tính

ngữ cảnh được xác định thông qua các mức thứ nguyên.

• Một thứ nguyên bao gồm một cấp độ hoặc một hoặc nhiều thứ bậc.

• Đến lượt mình, một hệ thống phân cấp bao gồm một tập hợp các cấp độ.

• Một mức tương tự như một loại thực thể trong mô hình ER.

• Các thể hiện của một mức được gọi là các thành viên.

• Một cấp độ có một tập hợp các thuộc tính mô tả các đặc điểm của các thành

viên của họ (thông tin bổ sung liên quan đến cấp độ thứ nguyên).


5
Machine Translated by Google

Ví dụ

6
Machine Translated by Google

Lược đồ đa chiều

Lược đồ sao bao gồm một Lược đồ bông tuyết là một biến thể của lược đồ sao

bảng thực tế với một bảng duy trong đó các bảng thứ nguyên từ lược đồ sao được
nhất cho mỗi chiều.
tổ chức thành một hệ thống phân cấp bằng cách

chuẩn hóa chúng

7
Machine Translated by Google

Ví dụ: Lược đồ sao

Một lược đồ hình sao để bán hàng trong một công ty sản xuất. Bảng dữ kiện bán hàng

bao gồm số lượng, giá cả và các chỉ số liên quan khác. SALESREP, KHÁCH HÀNG, SẢN PHẨM
và THỜI GIAN là các bảng thứ nguyên.

số 8
Machine Translated by Google

Ví dụ: Lược đồ bông tuyết

Trong lược đồ bông tuyết, phiên bản chuẩn hóa hiện mở rộng ra 11 bảng và các
thuộc tính có số lượng thẻ thấp trong mỗi bảng thứ nguyên ban đầu sẽ bị xóa
để tạo thành các bảng riêng biệt

9
Machine Translated by Google

thứ bậc

là những yếu tố chính trong các ứng dụng phân tích, vì chúng cung cấp
phương tiện để biểu diễn dữ liệu được phân tích ở các mức độ
trừu tượng khác nhau. Tồn tại nhiều
loại phân cấp. • Thứ
bậc cân bằng • Thứ bậc
không cân bằng • Thứ bậc
tổng quát • Thứ bậc thay
thế • Thứ bậc song
song • Thứ bậc không nghiêm ngặt

10
Machine Translated by Google

Hệ thống phân cấp cân bằng

Hệ thống phân cấp cân bằng chỉ có một đường dẫn ở cấp lược đồ, trong đó tất cả các

cấp là bắt buộc.

Ví dụ: hệ thống phân cấp cân bằng trong đó có cùng số cấp độ từ mỗi sản phẩm riêng lẻ đến

gốc của hệ thống phân cấp.

11
Machine Translated by Google

Hệ thống phân cấp không cân bằng

Hệ thống phân cấp không cân bằng chỉ có một đường dẫn ở cấp lược đồ, trong đó ít nhất một cấp là

không bắt buộc.

Ở cấp độ phiên bản, có thể có các thành viên chính mà không có các thành viên con liên quan.

Các thứ bậc không cân bằng bao gồm một trường hợp đặc biệt là thứ bậc đệ quy hay còn

gọi là thứ bậc cha-con trong đó cùng một cấp được liên kết bởi hai vai trò của quan hệ cha-con.

12
Machine Translated by Google

Ví dụ
Một. Một lược đồ phân cấp

trong đó một ngân hàng bao gồm

một số chi nhánh,

trong đó một chi nhánh có

thể có các cơ quan; hơn nữa,

một cơ quan có thể có máy ATM.

b. Một chi nhánh không có đại


lý và một số đại lý không
có máy ATM.

13
Machine Translated by Google

Ví dụ

Hệ thống phân cấp không cân bằng trong đó nhân viên không có cấp dưới
sẽ không có hậu duệ trong cây cá thể.

14
Machine Translated by Google

Phân cấp tổng quát

Hệ thống phân cấp được gọi là hệ thống phân cấp tổng quát khi các thành viên của một cấp

độ thuộc các loại khác nhau.

Ví dụ:

Khách hàng có thể là công ty hoặc cá nhân. các biện pháp liên quan đến khách hàng

phải được tổng hợp khác nhau tùy theo loại khách hàng, ví dụ: đối với các công ty, đường dẫn

tổng hợp là Khách hàng Ngành Chi nhánh, trong khi đối với cá nhân thì đó là Khách

hàng Nghề nghiệp Chi nhánh

15
Machine Translated by Google

Hệ thống phân cấp thay thế

Các hệ thống phân cấp thay thế đại diện cho tình huống ở cấp độ lược đồ, có một số hệ thống phân

cấp không độc quyền chia sẻ ít nhất ở cấp độ lá.

Một thành viên con được liên kết với nhiều hơn một thành viên chính và những thành viên này

thành viên cha mẹ thuộc các cấp độ khác nhau.

Hệ thống phân cấp thay thế là cần thiết khi chúng ta muốn phân tích các biện pháp từ một góc độ duy

nhất (ví dụ: thời gian) bằng cách sử dụng các tập hợp thay thế.

Trong một hệ thống phân cấp tổng quát, một thành viên con chỉ liên quan đến một trong các

đường dẫn, trong khi ở một hệ thống phân cấp thay thế, một thành viên con có liên quan đến

tất cả các đường dẫn và người dùng phải chọn một trong số chúng để phân tích

16
Machine Translated by Google

Ví dụ

Một. Thứ nguyên Thời gian bao gồm

hai hệ thống phân cấp tương ứng với các

nhóm tháng khác nhau thành năm dương lịch

và năm tài chính.

b. một thể hiện của kích thước

nơi người ta cho rằng năm tài chính

bắt đầu vào tháng Hai.

17
Machine Translated by Google

Hệ thống phân cấp song song

Hệ thống phân cấp song song phát sinh khi một thứ nguyên có nhiều hệ thống phân cấp

liên quan đến nó, chiếm các tiêu chí phân tích khác nhau.

Các hệ thống phân cấp thành phần có thể thuộc các loại khác nhau. Các

hệ thống phân cấp song song có thể phụ thuộc hoặc độc lập tùy thuộc vào

liệu các cấu trúc phân cấp thành phần có chia sẻ cấp độ hay không.

18
Machine Translated by Google

Ví dụ

Một ví dụ về thứ nguyên có hai hệ thống phân cấp độc lập song song.

Hệ thống phân cấp Nhóm sản phẩm được sử dụng để nhóm các sản phẩm theo

danh mục hoặc bộ phận, trong khi hệ thống phân cấp Vị trí nhà phân phối
nhóm chúng theo bộ phận hoặc khu vực của nhà phân phối.

19
Machine Translated by Google

Phân cấp không giới hạn

Một hệ thống phân cấp có ít nhất một mối quan hệ nhiều-nhiều được gọi là không nghiêm

ngặt; mặt khác, nó được gọi là nghiêm ngặt.

Thực tế là một hệ thống phân cấp chặt chẽ hay không là trực giao với loại của nó

Ví dụ: một

hệ thống phân cấp không nghiêm ngặt

nơi một nhân viên có thể

được chỉ định cho một số thành phố.

20
Machine Translated by Google

Bài toán đếm đôi

21
Machine Translated by Google

Chuyển đổi một hệ thống phân cấp không nghiêm ngặt thành một hệ thống nghiêm ngặt

Tạo thành viên mẹ mới cho mỗi nhóm thành viên mẹ được liên kết với một
thành viên con duy nhất trong mối quan hệ nhiều-nhiều.

Ví dụ: Một thành viên mới đại diện cho ba thành phố Atlanta, Orlando và Tampa

sẽ được tạo. một thành viên mới cũng phải được tạo ở cấp tiểu bang, vì ba thành
phố thuộc về hai tiểu bang. bỏ qua sự tồn tại

của một số thành viên chính và chọn một trong số họ làm thành viên chính.

Ví dụ: có thể chọn thành phố Atlanta.

22
Machine Translated by Google

Thuộc tính phân phối

chỉ ra cách các biện pháp được phân phối giữa một số thành viên cha mẹ

cho các mối quan hệ nhiều-nhiều.

một thước đo đại diện cho


tiền lương tổng thể của
nhân viên, nghĩa là tổng số
tiền lương được trả trong mỗi ph

lưu trữ tỷ lệ phần


trăm thời gian mà
một nhân viên làm việc
trong mỗi phần.

23
Machine Translated by Google

Thuộc tính phân phối

thuộc tính phân phối là không xác định, nó có thể được tính gần
đúng bằng cách xem xét tổng số thành viên cha mà thành viên con được
liên kết.

một phần ba giá trị của biện pháp sẽ được tính cho mỗi thành phố.

24
Machine Translated by Google

Biến đổi thành các chiều độc lập.

chỉ được áp dụng khi biết chính xác phân phối của các biện pháp.

Ví dụ: khi biết được số tiền lương được trả khi làm việc ở các bộ phận
khác nhau.

từ lương của nhân viên đến lương của nhân viên theo bộ phận.

25
Machine Translated by Google

Sự kiện với nhiều chi tiết

các biện pháp được nắm bắt ở nhiều mức độ chi tiết.

Ví dụ: doanh số bán hàng tại Hoa Kỳ có thể được báo

cáo theo tiểu bang, trong khi doanh số bán hàng

tại Châu Âu có thể được báo cáo theo thành phố

Ví dụ: xem xét một kho dữ liệu y


tế để phân tích bệnh nhân, trong đó có
một chiều chẩn đoán với các mức chẩn đoán,
họ chẩn đoán và chẩn đoán
nhóm.

26
Machine Translated by Google

Các hình thức bình thường đa chiều (MNF)

đảm bảo tổng hợp thước đo chính xác khi có các hệ thống phân cấp phức tạp. yêu
cầu mỗi biện pháp được xác định duy nhất bởi tập hợp các cấp lá liên quan. 1MNF là cơ
sở để thiết kế lược đồ chính xác.

không thỏa mãn


1MNF, vì
phép đo không được
xác định bởi tất cả
các cấp độ của lá và do
đó, thực tế phải được phân tác

27
Machine Translated by Google

Ví dụ

Tổng số dư của hai tài khoản


A1 và A2 bằng 600 nhưng tổng
hợp (ví dụ: theo thứ nguyên
Thời gian hoặc Khách hàng)
cho giá trị bằng 1.300.

tính toán trùng lặp!!!

28
Machine Translated by Google

Kích thước nhiều-nhiều

Trong một chiều nhiều-nhiều, một số thành viên của chiều


tham gia vào cùng một thành viên thực tế.

29
Machine Translated by Google

30
Machine Translated by Google

31
Machine Translated by Google

32
Machine Translated by Google

Nhân bản – Phụng sự – Khai phóng

Tận hưởng khóa học…!

Đô ho a may tinh 33

You might also like