You are on page 1of 38

CƠ SỞ DỮ LIỆU NÂNG CAO

CHƯƠNG 2:
QUY TRÌNH XÂY DỰNG
KHO DL DOANH NGHIỆP

GV: HỒ THỊ THANH TUYẾN


NỘI DUNG CHÍNH

1. LẬP KẾ HOẠCH VÀ QUẢN TRỊ DỰ ÁN

2. CÁC GIAI ĐOẠN PHÁT TRIỂN DỰ ÁN

3. VAI TRÒ VÀ TRÁCH NHIỆM CỦA THÀNH VIÊN DỰ ÁN

4. NHẬN DIỆN CÁC YẾU TỐ THÀNH CÔNG CỦA DỰ ÁN

2
LẬP KẾ HOẠCH &
QUẢN TRỊ DỰ ÁN KDL

3
THỰC TRẠNG

 Hơn 50% dự án xây dựng KDL thất bại: phần lớn là


chưa hoàn thành, một số ít hoàn thành nhưng không
hiệu quả.
 Nguyên nhân:
- Phân tích hiện trạng chưa đầy đủ
- Xác định nhu cầu, phạm vi dự án không toàn diện
- Quản lý dự án chưa hiệu quả
- Thiếu giải pháp để giải quyết những khó khăn về con
người và sự thay đổi của tổ chức khi triển khai KDL.
- …. 4
CÁC YẾU TỐ QUAN TRỌNG

Giá trị và các kỳ vọng


Đánh giá rủi ro
Phương pháp tiếp cận
Chọn lựa giải pháp
Chọn nhà cung cấp
Các yêu cầu kinh doanh
Sự ủng hộ của cấp trên
Đánh giá KDL
5
CÁC GIÁ TRỊ VÀ KỲ VỌNG

Cần phân tích và làm rõ các câu hỏi về lợi ích và kỳ vọng:
Với tình hình và văn hóa DN, có thực sự cần KDL?
KDL mang lại lợi ích gì cho công tác quản lý và ra quyết
định
Nó cải thiện được những vấn đề gì?
Những kỳ vọng của DN đối với KDL
Lãnh đạo/quản lý DN cần gì ở KDL
6
ĐÁNH GIÁ RỦI RO

Tiêu chí đánh giá là điều kiện và văn hóa của doanh
nghiệp.
Rủi ro được xem như một phần chi phí của dự án
Bên cạnh đó, cần đánh giá:
Những chi phí cơ hội.
Rủi ro DN phải đối mặt khi không có DW
Rủi ro của DN khi triển khai DW
7
PHƯƠNG PHÁP TIẾP CẬN

Top-down hay Bottom-up?


Top-down: cần nhiều thời gian, mang lại một KDL tổng
thể cho toàn DN với đầy đủ các yêu cầu tổng thể.
Bottom-up: Xây dựng và có ứng dụng nhanh chóng nhất
từ các datamart ứng với các ứng dụng cụ thể trước khi có
được KDL tổng thể.

8
CHỌN LỰA GIẢI PHÁP

Tự xây mới hay mua KDL (in-house or vendor software)?


 Vấn đề chính của mọi tổ chức. Cần phải tính toán kỹ dựa
trên nhiều yếu tố: tình trạng, khả năng, văn hóa...
 Nhiều nội dung cần phải tính toán như:
 Có bao nhiêu DataMart tự xây dựng?
 Có bao nhiêu DataMart trong số đó kết hợp với giải
pháp đã có ?
 Các kiểu trộn và ghép nào sẽ được làm ?
9
LỰA CHỌN NHÀ CUNG CẤP
(Single vendor of best-of-breed)

• Giải pháp nhà cung cấp đơn: • Giải pháp lựa chọn đặc thù tốt nhất mà
kết hợp nhiều nhà cung cấp:
 Tích hợp công cụ mức cao
 Xem xét và nắm bắt không đổi  Xây dựng được môi trường phù hợp
khớp tới tổ chức
 Cộng tác liền nét các thành phần
 Không cần dàn xếp giữa CSDL và
 Quản lý thông tin tập trung công cụ hỗ trợ
 Giá tổng hợp không đáng kể  Chọn được sản phẩm phù hợp nhất
với chức năng

10
YÊU CẦU KINH DOANH

Đây là yếu tố quan trọng nhất dẫn dắt yêu cầu xây dựng
KDL
KDL để giải quyết vấn đề trích xuất thông tin chiến
lược
Phải hiểu rõ các yêu cầu trước khi xây dựng KDL:
cần thông tin gì? Chứ không phải làm thế nào để có
nó?
Cần khảo sát nhu cầu trước khi lập kế hoạch  xác
định phạm vi dự án 11
Một số thông tin cần khảo sát
• Sứ mạng và chức năng của mỗi nhóm người dùng
• Hệ thống máy tính dùng cho nhóm
• Chỉ số hiệu năng chính đánh giá nhóm người dùng
• Các yếu tố tác động tới thành công của nhóm người dùng
• Khách hàng và phương pháp phân loại
• Kiểu dữ liệu nắm vết cho khách hàng (cá thể và nhóm)
• Sản phẩm được sản xuất và bán
• Phân lớp các sản phẩm và dịch vụ
• Địa danh mà kinh doanh hướng tới
• Các mức độ của ích lợi được đo lường cho khách hàng, cho sản phẩm và cho khu vực
• Các mức độ chi tiết giá và thuế
• Truy vấn hiện có và báo cáo thông tin chiến lược
Lưu ý
• Nhân tố tác động tới thành công của mỗi nhóm người sử dụng
• Các cấp độ đo lợi ích
• Không thể thiếu sự hỗ trợ từ quản lý chính yếu của công ty: xây dựng kho dữ liệu như một phần trong
12
chiến lược phát triển của đơn vị
SỰ ĐỒNG THUẬN CỦA QUẢN LÝ CẤP TRÊN

Đưa ra các yêu cầu cụ thể cho KDL


Tạo điều kiện hỗ trợ triển khai dự án
Hỗ trợ giải quyết các vấn đề mâu thuẫn
Hướng dẫn và ra chính sách để vận
hành KDL trong DN

13
ĐÁNH GIÁ KHO DỮ LIỆU

 Lợi ích thực sự của Dự án KDL chỉ xuất hiện sau khi người dùng đã áp dụng
toàn diện.
 Lưu ý, việc tính toán ích lợi từ Dự án KDL không dễ dàng nên nhiều công ty
đã không giới thiệu được quá trình KDL với một phân tích đánh giá đầy đủ
về chi phí.
 Một số ích lợi:
 Ích lợi từ tích hợp dữ liệu
 Tăng cường chất lượng dữ liệu
 Dễ dàng truy nhập thông tin
14
KẾ HOẠCH TỔNG THỂ

• Sự khác biệt của Dự án DW với OLTP xây


dựng CSDL thông thường
 OLTP có ba miền chức năng chính:
 tập dữ liệu trực tuyến,
 thực hiện giao dịch kinh doanh,
 xử lý thứ tự các áp dụng OLTP
 DW tương ứng có ba bộ phận kế tiếp nhau (như
mô tả ở trên):
 thu thập dữ liệu,
 các thành phần lưu trữ dữ liệu,
 các thành phần cung cấp thông tin.
15
 Sự khác biệt chi tiết ở bảng bên
Dự án DW Vs. Dự án CSDL

Thu thập dữ liệu Lưu trữ dữ liệu Cung cấp thông tin

Số lượng lớn nguồn DL Lưu giữ DL dung lượng Một vài kiểu người dùng
Nguồn DL hỗn tạp lớn Truy vấn được kéo dài tới
Hạ tầng tính toán khác Độ tăng trưởng nhanh hạn
nhau Nhu cầu xử lý song song Kiểu truy vấn phức
Nguồn DL bên ngoài Lưu DL khi dàn dựng Kích hoạt dựa trên Web
Tải ban đầu đồ sộ Kiểu chỉ số phức Phân tích đa chiều
Cân nhắc nhân bản DL Lưu giữ kiểu DL mới Giao diện với ứng dụng
Tích hợp DL khó khăn Lưu giữ DL cũ DSS
Biến đổi DL phức hợp Tương thích các bộ công Chất liệu cho DM
Làm sạch DL cụ Công cụ đa nhà cung cấp
RDBMS & MDDBMS 16
MỘT SỐ LƯU Ý

 Dự án KDL phạm vi lớn hơn theo hướng phức tạp hơn, đòi hỏi nhiều công nghệ
khác nhau
 Cho phép mở rộng về thời gian với nhiều kiểu hoạt động hơn
 Nguồn nhân lực bên trong không dư
 Có nhiều bài toán khác thường
 Về siêu dữ liệu: cần có tầm nhìn xa
 Lịch biểu thời gian: Thời gian đủ rộng để xây dựng và hoàn thiện hạ tầng
 Thời gian để thiết kế kiến trúc
 Thu hút người sử dụng ở mọi bước của Dự án
 Huấn luyện người sử dụng
 Phát triển song song
17
ĐÁNH GIÁ TÍNH SẴN SÀNG

 Cần sự trợ giúp của các chuyên gia ngoài


 Cần báo cáo đánh giá tính sẵn sàng trước khi hoàn thiện kế
hoạch dự án
 Mục đích của báo cáo:
Giảm rủi ro từ bất thường lớn xẩy ra,
Cung cấp tiếp cận nội tại trong giải pháp
Đánh giá lại hội đồng của công ty
 Nhìn và xác định lại phạm vi và kích thước
Định danh các nhân tố thành công
Xác định kại kỳ vọng người sử dụng
Tinh chỉnh như cầu huấn luyện 18
TIẾP CẬN THEO CHU TRÌNH SỐNG

 Ưu điểm của tiếp cận theo chu


trình sống
Hoàn thành mọi mục đích chính trong quá
trình phát triển
Tuân thủ tiếp cận hệ thống khi xây dựng HT
MT
Phân rã tính phức tạp, gán công việc tới các
thành viên
Tập dự báo về bài toán và phân phối
 Nhận xét:
Tiếp cận chu trình sống phân rã độ phức tạp
của dự án

Pg.83 19
CÁC GIAI ĐOẠN PHÁT TRIỂN

20
CÁC GIAI ĐOẠN PHÁT TRIỂN KDL

 Các bước (pha) phát triển DW.


 Lập kế hoạch tổng thể.
 Xác định yêu cầu.
 Thiết kế.
Xây dựng
Triển khai
Mở rộng và duy trì
 Mỗi quan hệ tới ba thành phần chức
năng: thu thập, lưu giữ và cung cấp
thông tin
Pg.84 21
VAI TRÒ VÀ TRÁCH NHIỆM
CỦA THÀNH VIÊN DỰ ÁN

22
ĐỘI NGŨ PHÁT TRIỂN DỰ ÁN

 Vai trò của đội phát triển.


 Hai nguyên nhân chính làm dự án thất bại.
 Quáphức tạp
 Nhu cầu mơ hồ
 Cách thức làm việc của đội phát triển.
 Tổ chức của Đội phát triển dự án:
 Liệt kê được mọi thách thức và các kỹ năng chuyên biệt cần có của dự án
 Lên được danh mục các vai trò cần có để phát triển hệ thống
 Gán vai trò của đội với từng cá nhân trong đội
 Thành viên:Kỹ năng, kinh nghiệm và tri thức là quan trọng đối với thành
viên + Toàn đội: phong cách, tinh thần làm việc theo nhóm, sự say mê
phát triển DW và quyết tâm cao (cam kết) của từng thành viên 23
ĐỘI NGŨ PHÁT TRIỂN DỰ ÁN

Vai trò và trách nhiệm:


 Phân vai trò và công việc theo nhiều cách.
Phân chia bề rộng sau đó bao gồm công việc
riêng vào phân lớp này
 Phù hợp nhất với môi trường của đội.
 Có thể đưa ra hai cách thức tiếp cận bề
rộng rồi kết hợp.
 Mỗi khi xác định phân lớp bề rộng gán mỗi
việc riêng trong mỗi phân lớp đó

24
CÁC CÁCH PHÂN LOẠI VAI TRÒ TRONG
ĐỘI NGŨ PHÁT TRIỂN
Phân loại: Cung cấp nhân viên cho sự phát triển ban đầu, nhân sự
để thử nghiệm, nhân sự để bảo trì liên tục, nhân sự cho kho dữ liệu
quản lý
 Phân loại bề rộng : CNTT và End-Users, sau đó phân loại con
(subclassifications) trong mỗi của cặp phân loại rộng, tiếp tục phân
loại con
 Phân loại: vai trò nhân viên mặt tiền, vai trò nhân viên mặt hậu
Phân loại: Người huấn luyện, đội hình thường trực, đội đặc biệt
 Phân loại: Quản lý, phát triển, hỗ trợ
Phân loại: Quản trị, thu thập dữ liệu, lưu trữ dữ liệu, cung cấp
thông tin
25
DANH SÁCH CÁC VAI TRÒ
Nhà tài trợ điều hành Chuyên gia cung cấp DL
Giám đốc dự án Nhà phân tích kinh doanh
Quản lý dự án Quản trị hệ thống
Quản lý đại diện người sử dụng Chuyên gia di trú dữ liệu
Quản trị kho dữ liệu Chuyên gia chuẩn bị (tiền XL) dữ liệu
Quản lý sự thay đổi tổ chức Trưởng nhóm Data Mark
Quản trị CSDL Chuyên gia hạ tầng
Quản lý siêu dữ liệu Người dùng chính yếu (power user)
Phân tích yêu cầu kinh doanh Trưởng nhóm đào tạo
Kiến trúc kho DL Biên tập kỹ thuật
Phát triển thu thập dữ liệu Chuyên gia công cụ
Phát triển truy cập dữ liệu Chuyên gia quan hệ nhà cung cấp
Phân tích chất lượng DL Quản lý web (web master)
26
Kiểm thử kho DL Dựng mẫu dữ liệu
Người phát triển bảo trì Kiến trúc sư an ninh
Danh sách các vai trò và chức năng, nhiệm vụ
Nhà tài trợ điều hành Quản trị KDL
Chỉ đạo, hỗ trợ, làm trọng tài. Chức năng DBA
Người quản lý dự án Chuyên gia chuyển đổi DL
Giao nhiệm vụ, giám sát, kiểm tra. Trích xuất, trích hợp, chuyển dạng DL
Người quản lý quan hệ người dùng Người phân tích đảm bảo chất lượng
Phối hợp với các nhóm người dùng Kiểm soát chất lượng DL của KDL
Kiến trúc sư chính Người đồng điều phối kiểm thử
Thiết kế kiến trúc Kiểm thử chương trình, hệ thống, công cụ

Chuyên gia hạ tầng Chuyên gia ứng dụng người dùng cuối
Thiết kế / xây dựng cơ sở hạ tầng Xác nhận ngữ nghĩa và quan hệ của DL
Người phân tích kinh doanh Lập trình viên phát triển
Xác định yêu cầu Lập trình nội bộ và scripts
Người mô hình hóa DL (Data Modeler) Trưởng nhóm đào tạo
27
Mô hình hóa quan hệ và chiều Đồng điều phối đào tạo người dùng và đội
phát triển
Đội phát triển dự án: Danh sách các mức độ kỹ năng và kinh nghiệm
Nhà tài trợ điều Cấp điều hành cao cấp, kiến thức kinh doanh chuyên sâu, có
hành nhiệt tình và năng lực làm ôn hóa và phân xử khi cần thiết.
Người quản lý dự Kỹ năng con người, kinh nghiệm quản lý dự án, định hướng kinh
án doanh và người sử dụng, năng lực thực tế và hiệu quả.
Người quản lý quan Kỹ năng con người, được tôn trọng trong cộng đồng người
hệ người dùng dùng, có kỹ năng tổ chức, làm việc nhóm, kiến thức hệ thống từ
quan điểm người dùng.
Kiến trúc sư chính Kỹ năng phân tích, năng lực nhìn khung cảnh lớn, chuyên môn
trong giao tiếp, kiến thức về khái niệm kho dữ liệu.
Chuyên gia hạ tầng Chuyên gia về phần cứng, hệ điều hành, hạ tầngmáy tính, kinh
nghiệm như chuyên viên HĐH.
Người phân tích Kỹ năng phân tích, khả năng tương tác với người dùng, kinh
kinh doanh nghiệm công nghiệp đầy đủ như nhà phân tích
Người mô hình hóa Chuyên gia mô hình hóa quan hệ và chiều với các công cụ 28
DL (Data Modeler) trường hợp, kinh nghiệm như nhà phân tích dữ liệu.
Đội phát triển dự án: Danh sách các mức độ kỹ năng và kinh nghiệm
Người quản trị KDL Chuyên gia thiết kế và thi hanh cơ sở dữ liệu vật lý, có kinh nghiệm như DBA,
MDDBMS quan hệ bổ sung.
Chuyên gia chuyển đổi dữ Kiến thức về cấu trúc dữ liệu, kiến thức chuyên sâu về các hệ thống nguồn, có
liệu kinh nghiệm như nhà phân tích.
Người phân tích đảm bảo Kiến thức về kỹ thuật chất lượng dữ liệu, kiến thức về dữ liệu hệ thống nguồn,
chất lượng kinh nghiệm như nhà phân tích.
Người điều phối kiểm thử Quen thuộc với các phương pháp và tiêu chuẩn kiểm thử, sử dụng công cụ kiểm
thử, có kiến thức của một số công cụ cung cấp thông tin kho dữ liệu, kinh
nghiệm người lập trình / nhà phân tích.

Chuyên gia chương trình Có kiến thức sâu về ứng dụng nguồn
ứng dụng người dùng cuối

Lập trình viên phát triển Có kỹ năng lập trình và phân tích, có kinh nghiệm lập trình bằng ngôn ngữ và
DBMS được lựa chọn.

Trưởng nhóm đào tạo Có kỹ năng đào tạo, có kinh nghiệm trong đào tạo CNTT / người dùng, có kỹ
năng phối hợp và tổ chức.
SỰ THAM GIA CỦA NGƯỜI SỬ DỤNG

 Tương tác người sử dụng là trực tiếp và bản chất.


 Nếu có một khác biệt cơ bản giữa OLTP và DW: từ dùng hệ
thống của người sử dụng  họ cần là một phần của đội phát
triển.
 Dự án DW gọi tới kỹ thuật phát triển ứng dụng kết hợp.
Đội phát triển dự án: Sự tham gia của người dùng
Lập kế hoạch Cung cấp mục đích, mục tiêu, kỳ vọng, thông tin kinh doanh trong quá trình khảo sát sơ bộ; hỗ
dự án trợ hoạt động quản lý mức đỉnh, khởi tạo dự án là nhà tài trợ điều hành.

Xác định yêu Tham gia tích cực các cuộc họp để xác định yêu cầu, định danh mọi hệ thống nguồn, xác định
cầu độ đo để đo lường thành công kinh doanh, và các chiều kinh doanh để phân tích, xác định
thông tin cần thiết từ kho dữ liệu.

Thiết kế Khảo sát lại mô hình DL chiều; thiết kế trích xuất và chuyển đổi dữ liệu, cung cấp sử dụng dự
kiến cho kích thức CSDL; xem xét lại thiết kế kiến trúc và siêu dữ liệu; tham gia lựa chọn công
cụ, xem xét lại thiết kế cung cấp thông tin.

Xây dựng Tham gia tích cực kiểm thử chấp nhận người dùng; kiểm thử công cụ cung cấp thông tin; công
nhận chức năng thu nhận dữ liệu và chuyển đổi; xác nhận chất lượng dữ liệu, kiểm thử sử dụng
siêu dữ liệu; kiểm chuẩn chức năng truy vấn, kiểm thử chức năng OLAP; tham gia vào tài liệu
ứng dụng.

Triển khai Kiểm tra dấu vết kiểm toán và xác nhận tải ban đầu dữ liệu; làm phù hợp với phân phôi khác với
kỳ vọng; sắp xếp và tham gia vào đào tạo người dùng, cung cấp chấp nhận cuối cùng.

Bảo trì Cung cấp đầu vào cho các cải tiến, kiểm thử và chấp nhận cải tiến.
SỰ QUAN TÂM CỦA QUẢN LÝ

 Dự án DW thành công khi quản lý dự án hiệu quả nhất có thể được.


 Nguyên lý quản lý dự án, dấu hiệu khuyến cáo, nhân tố thành công, tính phù
hợp với thực tiễn
Một số nguyên lý hướng dẫn:
 Liên quan tới quyết định và hành động quản lý dự án:
 Trách nhiệm của nhà đầu tư, người quản lý và người sử dụng.
 Sự tiến hóa mới.  Chất lượng dữ liệu.
 Xây dựng cho tăng trưởng  Chính sách dự án
Mô hình dữ liệu chiều  Người quản lý dự án.
 Vai trò của đội phát triển  Yêu cầu người dùng
Kỳ vọng thực tế  Dữ liệu ngoài
NHẬN DIỆN CÁC YẾU TỐ
THÀNH CÔNG CỦA DỰ ÁN

33
CÁC KỊCH BẢN LỖI

 Nền móng dữ liệu không tốt  Thiếu hụt dữ liệu


Chất lượng tồi, không đúng cách Sụp đổ trước khi hoàn thiện
 dữ liệu xa xỉ  Tính cô lập của dữ liệu
Truy nhập và hiệu năng kém KDL chuyên đề đứng độc lập
 Mục đích xa rời  Tính tù hãm của dữ liệu:
Không gắn với người sử dụng Người dùng không thể/khó nhận

34
Tín hiệu cảnh báo Nguyên nhân Hành động
Bước xácMỘT địnhSỐyêuDẤU HIỆU
Mất năng lực CẢNH BÁO
phân Ngừng thu nhận thông tin không mong
cầu vượt qua hạn định tích muốn. Hủy bỏ mọi vấn đề đã họp với
mục tiêu người sử dụng. Đặt lại mục tiêu cuối của
công ty.
MỘT
Tự công ty tốn quá Lựa chọn công cụ Nếu có thời gian và ngân sách, xem xét SỐ
nhiều công sức viết của bên thứ ba lỗi các công cụ khác nhau. Nếu không thì cần
chương trình. thời tăng cnhân viên lập trình. DẤU
Người sử dụng không Có biểu hiện lo Vấn đề này rất tinh tế Làm việc với nhà
hợp tác cung cấp dữ ngại về quyền sở tài trợ điều hành để giải quyết vấn đề. HIỆU
liệu chi tiết hữu dữ liệu.
Người sử dụng không Người sử dụng Đầu tiên, đảm bảo rằng các công cụ truy
CẢNH
thoải mái với các không được đào vấn được lựa chọn là thích hợp. Sau đó,
công cụ truy vấn tạo đầy đủ. tiến hành việc đào tạo bổ sung.
BÁO
Vấn đề tiếp nhận dữ Chuyển đổi và lập Xem lại toàn bộ việc chuyển đổi dữ liệu
liệu vượt quá vùng bản đồ dữ liệu và tiện ích tích hợp. Đảm bảo rằng không
dàn dựng. không hoàn chỉnh thiếu dữ liệu. Cùng đại diện người sử
dụng tham gia quá trình xác minh. 35
Nhà tài trợ, điều hành: Đảm bảo hỗ trợ liên tục, dài hạn, cam kết
Thiết lập được xác định lên phía trước, rõ, thực sự, và đồng ý giá trị kinh
doanh từ kho dữ liệu. Quản lý được kỳ vọng của người sử dụng thực tế
Nhận được nhiệt tình tham gia người dùng trong suốt dự án.
MỘT SỐ
Việc khai phá dữ liệu, chuyển đổi và tải (ETL) chức năng là hầu hết thời NHÂN
gian, nhiều lao động hoạt động. Không ước tính thời gian và công sức cho
hoạt động này dưới hạn. TỐ
Đầu tiên ghi nhận kiến trúc, sau đó công nghệ, sau đó công cụ. Chọn một
kiến trúc là đúng cho môi trường.
THÀNH
Các truy vấn và các công cụ thông tin cho người dùng là cực kỳ quan trọng. CÔNG
Chọn những công cụ hữu ích và dễ sử dụng nhất, tránh chọn theo tính
“quyến rũ” (“hiện đại nhất”) của công cụ. Tránh chảy máu công nghệ.
Kế hoạch cần là tăng trưởng và cách mạng. Quan tâm xem xét hiệu suất.
Người quản lý dự án cần theo định hướng người sử dụng.
Tập trung thiết kế theo truy vấn, mà không theo giao dịch.
36
Xác định các nguồn dữ liệu thích hợp. Chỉ tải dữ liệu cần thiết.
BÀI TẬP VỀ NHÀ

REVIEW QUESTIONS VÀ BÀI TẬP CHƯƠNG 4

37
Q&A

38

You might also like