You are on page 1of 35

Bộ công cụ kho dữ liệu

Bởi Ralph
Kimball

Chương 2: Bán lẻ
Biên soạn: Song Nguyên
24/02/2019
2.0 Giới thiệu

■ Quy trình bốn bước để thiết kế mô hình chiều


■ Bảng dữ kiện cấp giao dịch
■ Sự thật phụ gia và không phụ gia
■ Thuộc tính bảng thứ nguyên mẫu
■ Các khía cạnh nhân quả, chẳng hạn như sự thăng tiến
■ Thứ nguyên suy biến, chẳng hạn như số phiếu giao dịch
■ Mở rộng mô hình thứ nguyên hiện có
■ Thuộc tính kích thước bông tuyết
■ Tránh bẫy “quá nhiều chiều”
■ Khóa thay thế
■ Phân tích giỏ thị trường
2.1 Quy trình thiết kế kích thước bốn
bước
■ 1. Chọn quy trình nghiệp vụ để lập mô hình.
■ 2. Khai báo nội dung của quy trình kinh
doanh.
■ 3. Chọn các kích thước áp dụng cho từng
hàng của bảng dữ kiện.
■ 4. Xác định các sự kiện bằng số sẽ xuất hiện
trong mỗi hàng của bảng sự kiện.
2.2 Nghiên cứu điển hình về bán lẻ
2.2.1 Bước 1. Chọn quy trình kinh
doanh
■ Bước đầu tiên trong thiết kế là kết hợp sự hiểu biết về
các yêu cầu nghiệp vụ với sự hiểu biết về dữ liệu có
sẵn.

■ Chúng tôi sẽ xây dựng mô hình một chiều để tránh dư


thừa ETL.

■ Lưu ý: Mô hình chiều thứ nhất phải trả lời các câu hỏi
kinh doanh cấp bách nhất và có thể truy cập dễ dàng để
trích xuất dữ liệu.
2.2.2 Bước 2. Khai báo hạt
■ Dữ liệu nguyên tử cung cấp tính linh hoạt
phân tích tối đa vì nó có thể được hạn chế và
cuộn lại theo mọi cách có thể.
■ Ví dụ khai báo hạt bao gồm:
❑ Một chi tiết đơn hàng riêng lẻ trên phiếu bán lẻ của khách hàng
được đo bằng thiết bị quét
❑ Thẻ lên máy bay cá nhân để lên chuyến bay
❑ Ảnh chụp nhanh hàng ngày về mức tồn kho cho từng sản phẩm
trong kho hoặc ảnh chụp nhanh hàng ngày về số lần hiển thị cho
đối tác/nhà xuất bản về độ chi tiết của cổng thông tin (Ys, Ns,
v.v.)
❑ Ảnh chụp nhanh hàng tháng cho mỗi tài khoản ngân hàng
2.2.3 Bước 3. Chọn kích thước

■ Khi nội dung của bảng dữ kiện đã được chọn, kích


thước ngày, sản phẩm và cửa hàng sẽ xuất hiện ngay
lập tức. Tuyên bố thực tế về hạt phải phù hợp với độ mờ
bổ sung. (TBD = Được quyết định)
2.2.4 Bước 4. Xác định sự thật

■ Bước thứ tư và cũng là bước cuối cùng trong


thiết kế là xác định cẩn thận những sự kiện
nào sẽ xuất hiện trong bảng sự kiện.
2.3 Thuộc tính bảng thứ nguyên

■ Bây giờ chúng ta đã thực hiện quy trình bốn


bước, hãy quay lại bảng thứ nguyên và tập
trung vào việc lấp đầy chúng bằng các thuộc
tính mạnh mẽ.
■ Tỷ lệ phần trăm và tỷ lệ , chẳng hạn như tỷ suất
lợi nhuận gộp, không mang tính chất cộng gộp .
Tử số và mẫu số phải được lưu trữ trong bảng
dữ kiện. Tỷ lệ có thể được tính toán trong một
công cụ truy cập dữ liệu cho bất kỳ phần nào
của bảng dữ kiện bằng cách nhớ tính tỷ lệ của
các tổng chứ không phải tổng của các tỷ lệ.
2.3.1 Kích thước ngày
2.3.1 Kích thước ngày (ct)
■ Kho dữ liệu luôn cần một bảng thứ nguyên ngày rõ ràng. Có nhiều
thuộc tính ngày không được hàm ngày SQL hỗ trợ, bao gồm các kỳ
tài chính, mùa, ngày lễ và cuối tuần . Thay vì cố gắng xác định
những phép tính lịch không chuẩn này trong một truy vấn, chúng ta
nên tra cứu chúng trong bảng thứ nguyên ngày.
2.3.2 Kích thước sản phẩm

Các yêu cầu về không gian bảng chiều mờ nhạt so


với những cân nhắc về không gian bảng thực tế.
2.3.2 Kích thước sản phẩm (ct)
2.3.2 Kích thước sản phẩm (Chi tiết)
2.3.2 Kích thước sản phẩm (Chi tiết)
2.3.3 Kích thước cửa hàng (vị trí)
2.3.4 Kích thước khuyến mãi
■ Sản phẩm đang khuyến mãi có nâng được không?
■ Khuyến mại có cho thấy doanh số bán hàng giảm trước
hay sau khuyến mại không (chuyển đổi thời gian)
■ Các sản phẩm đang được khuyến mãi tăng doanh số
nhưng các sản phẩm khác lại giảm (tự ăn thịt)
■ Khuyến mãi cho thấy sự tăng trưởng của thị trường?
■ Khuyến mãi có lãi không?
■ Bảng thông tin không có sự thật về phạm vi khuyến mãi
❑ Những sản phẩm nào đang khuyến mãi không bán
được?
❑ Bảng sự kiện chỉ ghi lại SKU đã bán; do đó, chúng tôi
tải ít nhất 1 hàng cho mỗi sản phẩm được khuyến mãi
trong cửa hàng mỗi ngày (phạm vi khuyến mãi)
2.3.4 Kích thước khuyến mãi
2.3.5 Suy biến thứ nguyên số giao dịch
2.4 Lược đồ bán lẻ đang hoạt động

Nếu bạn đang sử dụng công cụ truy cập dữ liệu có nhiều


chức năng hơn, kết quả có thể xuất hiện dưới dạng báo cáo
nhiều bảng.
2.4 Lược đồ bán lẻ đang hoạt động
■ Phân tích mô hình mua sắm theo địa lý, nhân khẩu học, hành vi…
■ Tôn tạo thiết kế ban đầu của chúng tôi với kích thước của người
mua sắm thường xuyên.
❑ Thứ nguyên người mua sắm thường xuyên
❑ Kích thước thư ký
❑ Thời gian trong ngày
■ Bàn thắng
❑ Trên thực tế, việc bổ sung kích thước mới không làm thay đổi
các khóa hoặc sự kiện của kích thước hiện có
❑ Tất cả các ứng dụng có sẵn vẫn tiếp tục chạy mà không làm
sáng tỏ hoặc thay đổi khi có các thuộc tính thứ nguyên mới, các
dữ kiện đo mới, mờ mới.
❑ Việc tóm tắt hoặc tổng hợp trước khi hoàn thiện sẽ hạn chế khả
năng thêm các thứ nguyên mới của chúng tôi
2.5 Khả năng mở rộng lược đồ bán
lẻ
2.5 Khả năng mở rộng lược đồ bán
lẻ (ct)tôi sẽ mô tả một số danh mục sửa đổi
Chúng
không mong muốn này, bắt đầu bằng danh mục
đơn giản nhất:
■ Thuộc tính thứ nguyên mới.
■ Kích thước mới.
■ Sự thật mới được đo lường.
■ Kích thước ngày càng chi tiết hơn.
■ Bổ sung nguồn dữ liệu hoàn toàn mới liên
quan đến các thứ nguyên hiện có cũng như
các thứ nguyên mới không mong đợi.
2.6 Chống lại sự thôi thúc của vùng
thoải mái
■ Chuẩn hóa kích thước (Bông tuyết).
■ Quá nhiều kích thước.
2.6.1 Chuẩn hóa kích thước (Bông
tuyết)
2.6.1 Chuẩn hóa kích thước (Bông
tuyết) (ct)
■ Vô số các bảng hình bông tuyết khiến cho việc trình
bày trở nên phức tạp hơn nhiều.
■ Tương tự như vậy, các trình tối ưu hóa cơ sở dữ
liệu sẽ phải vật lộn với sự phức tạp của lược đồ
bông tuyết.
■ Việc tiết kiệm không gian đĩa nhỏ liên quan đến các
bảng kích thước bông tuyết là không đáng kể.
■ Hoạt động trượt tuyết làm chậm khả năng duyệt
trong một chiều của người dùng.
■ Cuối cùng, kỹ thuật trượt tuyết đánh bại việc sử
dụng các chỉ mục bitmap.
2.6.2 Quá nhiều kích thước
2.7 Khóa thay thế

■ Khóa thay thế có nhiều bí danh khác: khóa


vô nghĩa, khóa số nguyên, khóa không tự
nhiên, khóa nhân tạo, khóa tổng hợp, v.v.
■ Các khóa thay thế chỉ dùng để nối các bảng
thứ nguyên với bảng dữ kiện.
2.7 Chìa khóa thay thế (ct)

■ Người lập mô hình đôi khi không muốn từ bỏ


các khóa tự nhiên của mình vì họ muốn điều
hướng bảng dữ kiện dựa trên mã vận hành
trong khi tránh nối vào bảng thứ nguyên
■ Ban đầu, việc triển khai mô hình thứ nguyên
bằng cách sử dụng mã hoạt động có thể
nhanh hơn, nhưng về lâu dài, các khóa thay
thế chắc chắn sẽ mang lại hiệu quả
2.7 Chìa khóa thay thế (ct)

■ Một trong những lợi ích chính của khóa thay


thế là chúng bảo vệ môi trường kho dữ liệu
khỏi những thay đổi trong hoạt động.
■ Khóa thay thế là số nguyên càng nhỏ càng
tốt trong khi vẫn đảm bảo rằng nó sẽ chứa số
lượng số trong tương lai hoặc số lượng hàng
tối đa trong chiều một cách thoải mái.
2.7 Chìa khóa thay thế (ct)

■ Như chúng tôi đã đề cập trước đó, khóa thay


thế được sử dụng để ghi lại các điều kiện
kích thước có thể không có mã hoạt động,
chẳng hạn như điều kiện “Không có hiệu lực
khuyến mãi”.
■ Thứ nguyên ngày là một thứ nguyên trong đó
các khóa thay thế phải được chỉ định theo
thứ tự tuần tự, có ý nghĩa
2.7 Chìa khóa thay thế (ct)

■ Cuối cùng, cần có các khóa thay thế để hỗ


trợ một trong những kỹ thuật chính để xử lý
các thay đổi đối với các thuộc tính của bảng
thứ nguyên.

■ Tất nhiên, cần phải nỗ lực để gán và quản lý


các khóa thay thế, nhưng nó gần như không
đáng sợ như nhiều người tưởng tượng.
2.7 Chìa khóa thay thế (ct)

■ Cần có khóa thay thế nếu số kiểm soát giao


dịch không phải là duy nhất ở các vị trí hoặc
được sử dụng lại.

■ Số kiểm soát giao dịch của bạn có thể là một


cột chữ và số 24 byte cồng kềnh. Trong
những trường hợp như vậy, sẽ thuận lợi hơn
nếu sử dụng khóa thay thế
2.8 Phân tích giỏ thị trường
Bản tóm tắt

■ Chúng tôi lần đầu tiên được tiếp xúc với việc
thiết kế một mô hình chiều.
■ Chúng tôi đặc biệt khuyến khích quy trình
bốn bước để giải quyết các thiết kế mô hình
chiều.
■ Việc tải bảng dữ kiện bằng dữ liệu nguyên tử
mang lại sự linh hoạt cao nhất vì chúng ta có
thể tóm tắt dữ liệu đó “theo mọi cách”.

You might also like