You are on page 1of 81

Chương IIIV

GIẢNG VIÊN: TRẦN THỊ KIM CHI


1 Giới thiệu Business Intelligence (BI) và Power BI

2 Chức năng Power BI

3 Mô hình kết nối với Power PI

4 Daskboard trong Power BI

5 Thực hành Power BI

6 Câu hỏi – Bài tập

2
Giới thiệu Business Intelligence
(BI) và Power BI
• BI (Business Intelligence viết tắt là BI) là tập các công nghệ và công
cụ để chuyển đổi những nguồn dữ liệu lớn từ nhiều nguồn khác nhau
thành những thông tin có ý nghĩa, giúp đưa ra các quyết định hiệu quả
phục vụ cho hoạt động kinh doanh.
• BI có mặt ở khắp các doanh nghiệp như hệ thống siêu thị, ngân hàng,
viễn thông,...đó đều là những nơi cần thu thập, xử lý khối lượng dữ
liệu cực lớn. - Là cơ sở dữ liệu thô (thường là cơ sở dữ liệu quan hệ)
đến từ nhiều nguồn dữ liệu khác nhau như HRM, CRM, thương mại
điện tử, Facebook,...
Giới thiệu Business Intelligence
(BI) và Power BI
• Năm 2020 theo đánh giá mới đây của Gartner, Microsoft tiếp tục vượt
qua các sản phẩm BI nổi tiếng khác: SAP, IBM, Qlik, Tableau,.. để
dẫn đầu mảng Business Intelligence & Analytics Platforms.
• Đây là năm thứ 13 liên tiếp mà MS được định vị dẫn đầu về mảng
này, nhìn vào biểu đồ sau cho chúng ta thấy rõ nét MS đang dẫn đầu
cũng như tạo được một khoảng cách với các hãng còn lại cả về tầm
nhìn (vision) & khả năng thực thi.
CHỨC NĂNG POWER BI

BI- Hệ thống báo cáo quản trị thông minh

BI-Giúp cho nhà quản trị đưa ra quyết định kinh


doanh nhanh và quản trị hiệu quả.

BI- Công cụ báo cáo phân tích trực quan, đa chiều


giúp có cái nhìn chi tiết hơn

BI –Dự báo được xu hướng

BI- Giúp quản trị doanh nghiệp mọi lúc, mọi nơi…
Giới thiệu Business Intelligence
(BI) và Power BI
Những ưu điểm của tính năng tổng hợp bao gồm:
• Cải thiện hiệu suất truy vấn với dữ liệu lớn: Mỗi tương tác với trực
quan Power BI đều gửi các truy vấn DAX đến tập dữ liệu. Dữ liệu
tổng hợp được lưu trong bộ nhớ cache sử dụng một phần nhỏ tài
nguyên cần thiết cho dữ liệu chi tiết. Vì thế, bạn có thể mở khóa dữ
liệu lớn mà có thể không truy cập được.
• Làm mới dữ liệu được tối ưu: Kích thước bộ nhớ cache nhỏ hơn
làm giảm thời gian làm mới nên dữ liệu đến với người dùng nhanh
hơn.
• Các kiến trúc cân đối: Bộ nhớ đệm trong bộ nhớ Power BI có thể xử
lý các truy vấn tổng hợp, hạn chế các truy vấn được gửi trong chế độ
DirectQuery và giúp bạn đáp ứng các giới hạn đồng thời. Những truy
vấn ở cấp độ chi tiết còn lại có xu hướng được lọc, truy vấn cấp độ
giao dịch mà các kho dữ liệu và hệ thống dữ liệu lớn thường xử lý tốt.
MÔ HÌNH KẾT NỐI VỚI POWER BI

Mô hình kết nối dữ liệu từ các nguồn DB với Power BI và phần kết xuất cho người dùn
DASHBOARD TRONG POWER BI
DASHBOARD TRONG POWER BI
DASHBOARD TRONG POWER BI
DASHBOARD TRONG POWER BI
THỰC HÀNH POWER BI
1) Cài đặt Power BI
2) Tạo tài khoản miễn phí
3) Giao diện Power BI
4) Kết nối dữ liệu
5) Giao diện Power BI trên Web
6) Cài dặt Refresh cho báo cáo
THỰC HÀNH POWER BI
1) Cài đặt Power BI
1. Chạy trên giao diện Desktop / Laptop Truy cập vào đường link :
https://powerbi.microsoft.com/en-us/
và chọn Sign in để đăng nhập vào hệ thống Power BI của Microsoft.
2. Chạy trên giao diện Mobile
Tìm ứng dụng Microsoft Power BI trên App Stores / Google Play
cho 2 hệ điều hành iOs / Android với đường link:
• Trên Google Play:
https://play.google.com/store/apps/details?id=com.microsoft.pow
erbim&hl=en
• Trên iOS: https://itunes.apple.com/us/app/microsoft-power-bi
THỰC HÀNH POWER BI
2) Tạo tài khoản miễn phí
• Truy cập vào đường link https://temp-mail.org/en/
• Khi truy cập vào đường link này thì hệ thống sẽ tự động sinh ra 1
email và dùng email này để đăng ký tài khoản sử dụng miễn phí 2
tháng trên Power BI.
THỰC HÀNH POWER BI
3) Giao diện Power BI
THỰC HÀNH POWER BI
3) Giao diện Power BI
THỰC HÀNH POWER BI
4) Kết nối dữ liệu
THỰC HÀNH POWER BI
4) Kết nối dữ liệu
THỰC HÀNH POWER BI
5) Giao diện Power BI trên Web
THỰC HÀNH POWER BI
5) Giao diện Power BI trên Web
THỰC HÀNH POWER BI
5) Giao diện Power BI trên Web
THỰC HÀNH POWER BI
1. Tạo một bảng tổng hợp
• Bước 1: Cài đặt một bảng mới với các trường bạn muốn,
điều này còn phụ thuộc vào dữ liệu và model (mô hình).
• Bước 2: Xác định các tổng hợp bằng cách sử dụng hộp
thoại Manage Aggregations.
• Bước 3: Nếu có thể, hãy thay đổi chế độ lưu trữ cho bảng
tổng hợp.
THỰC HÀNH POWER BI
• 2. Quản lý các tổng hợp
• Sau khi tạo một bảng mới với các trường mong muốn, trong
thanh Fields của bất kỳ Power BI Desktop view, nhấp chuột
phải vào bảng và chọn Manage aggregations.
THỰC HÀNH POWER BI
2. Quản lý các tổng hợp
• Hộp thoại Manage Aggregation hiển thị một dòng cho mỗi
cột trong bảng, nơi bạn có thể chỉ định hành vi tổng hợp.
• Trình đơn Summarization trong hộp thoại Manage
aggregation cung cấp các giá trị sau:
• Count
• GroupBy
• Max
• Min
• Sum
• Count table rows
THỰC HÀNH POWER BI
3. Validations
• Hộp thoại Manage aggregation thực thi các xác thực đáng
chú ý sau:
• Detail Column phải có cùng kiểu dữ liệu với Aggregation Column, ngoại
trừ Count và Count table rows trong Summarization. Count và Count table
rows chỉ hỗ trợ cho các cột tổng hợp số nguyên và không yêu cầu kiểu dữ
liệu phù hợp.
• Tổng hợp theo chuỗi bao gồm ba hoặc nhiều bảng không được phép. Ví dụ,
các tổng hợp trên bảng A không thể tham chiếu đến bảng B có các tổng hợp
tham chiếu đến bảng C.
• Tổng hợp trùng lặp, trong đó, hai mục nhập sử dụng cùng một hàm
Summarization và tham chiếu đến cùng Detail Table và Detail Column,
không được phép.
• Detail Table phải sử dụng chế độ lưu trữ DirectQuery, không phải Import.
THỰC HÀNH POWER BI
3. Validations
• Nhóm theo cột khóa ngoại được dùng bởi một mối quan hệ
không hoạt động và dựa vào hàm USERELATIONSHIP để
tổng hợp các lần truy cập không được hỗ trợ.
• Hầu hết các xác thực được thực thi bằng cách tắt các giá trị
thả xuống và hiển thị văn bản giải thích trong chú tooltip,
như ảnh sau.

.
THỰC HÀNH POWER BI
4. Bảng tổng hợp bị ẩn
• Người dùng với quyền chỉ đọc truy cập vào tập dữ liệu
không thể truy vấn các bảng tổng hợp. Điều này tránh các
lo ngại về bảo mật khi được sử dụng với row-level security
(RLS). Người dùng và truy vấn đề cập đến bảng chi tiết
không phải bảng tổng hợp và không cần biết về bảng tổng
hợp.
• Vì lý do này, các bảng tổng hợp bị ẩn khỏi view Report.
Nếu bảng không bị ẩn, hộp thoại Manage aggregations sẽ
đặt nó ẩn khi bạn chọn Apply All.

.
THỰC HÀNH POWER BI
5. Storage modes
• Tính năng tổng hợp tương tác với các chế độ lưu trữ cấp bảng. Bảng
Power BI có thể sử dụng các chế độ DirectQuery, Import hoặc Dual
Storage. DirectQuery truy vấn trực tiếp phần phụ trợ trong khi Import
lưu trữ dữ liệu vào bộ nhớ và gửi truy vấn đến dữ liệu đã lưu trong bộ
nhớ cache. Tất cả các nguồn dữ liệu DirectQuery không đa chiều và
Power BI Import đều có thể hoạt động với tính năng tổng hợp.
• Để đặt chế độ lưu trữ của bảng tổng hợp thành Import nhằm tăng tốc
truy vấn, hãy chọn bảng tổng hợp trong Power BI
Desktop Model view. Trong ngăn Properties, mở
rộng Advanced, thả xuống các lựa chọn trong chế độ Storage và
chọn Import. Lưu ý rằng hành động này không thể đảo ngược.

.
THỰC HÀNH POWER BI
5. Storage modes
THỰC HÀNH POWER BI
6. RLS cho tổng hợp
• Để hoạt động chính xác cho các tổng hợp, biểu thức RLS
phải lọc cả bảng tổng hợp và bảng chi tiết.
• Trong ví dụ dưới đây, biểu thức RLS trên
bảng Geography hoạt động cho các tổng hợp, bởi vì
Geography nằm trên lọc các mối quan hệ với cả
bảng Sales và Sales Agg. Các truy vấn chạm vào bảng tổng
hợp và những truy vấn không có RLS đều sẽ được áp dụng
thành công.
.
THỰC HÀNH POWER BI
6. RLS cho tổng hợp
THỰC HÀNH POWER BI
6. RLS cho tổng hợp
• Một biểu thức RLS trên bảng Product chỉ lọc bảng chi
tiết Sales, không lọc bảng tổng hợp Sales Agg. Vì bảng
tổng hợp là một biểu diễn khác của dữ liệu trong bảng chi
tiết, nên sẽ không an toàn khi trả lời các truy vấn từ bảng
tổng hợp nếu bộ lọc RLS không thể áp dụng được. Chỉ lọc
bảng chi tiết không được khuyến nghị vì các truy vấn của
người dùng từ vai trò này sẽ không được hưởng lợi từ các
lần truy cập tổng hợp.
• Một biểu thức RLS chỉ lọc bảng tổng hợp Sales Agg và
không phải bảng chi tiết Sales không được phép.
.
THỰC HÀNH POWER BI
6. RLS cho tổng hợp
• Đối với tổng hợp dựa trên các cột GroupBy, biểu thức RLS áp dụng
cho bảng chi tiết có thể được dùng để lọc bảng tổng hợp, vì tất cả các
cột GroupBy trong bảng tổng hợp đều được bao phủ bởi bảng chi tiết.
Mặt khác, bộ lọc RLS trên bảng tổng hợp không thể được áp dụng
cho bảng chi tiết, do không được phép.
• Trên đây là phần đầu tiên của loạt bài viết về cách sử dụng và quản lý
các tổng hợp trong Power BI. Hy vọng rằng những kiến thức
được BAC tổng hợp trên đây sẽ hữu ích với bạn đọc. Đừng quên theo
dõi các phần tiếp theo sẽ được gửi đến bạn đọc tại website bacs.vn.
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
• Mô hình thứ nguyên thường sử dụng tổng hợp dựa trên các
mối quan hệ. Tập dữ liệu Power BI từ data warehouse và
data marts giống như lược đồ hình sao hoặc bông tuyết, với
mối quan hệ giữa bảng kích thước và bảng thực tế.
• Trong mô hình dưới đây, từ một nguồn dữ liệu, các bảng
đang sử dụng chế độ lưu trữ DirectQuery. Bảng Sales thực
tế chứa hàng tỷ dòng. Đặt chế độ lưu trữ của Sales thành
Import cho bộ nhớ đệm sẽ làm tiêu tốn bộ nhớ và chi phí
quản lý.
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
• Thay vào đó, tạo bảng tổng hợp Sales Agg. Trong bảng Sales Agg, số
lượng các dòng bằng với tổng của SalesAmount được nhóm
bởi CustomerKey, DateKey và ProductSubcategoryKey.
Bảng Sales Agg ở mức độ chi tiết cao hơn Sales, vì thế thay vì hàng
tỷ dòng, bảng này có thể chứa hàng triệu dòng nên rất dễ quản lý.
• Nếu các bảng thứ nguyên dưới đây được dùng phổ biến cho các truy
vấn có giá trị kinh doanh cao, chúng có thể lọc Sales Agg, sử dụng
các mối quan hệ one-to-many hoặc many-to-one.
• Geography
• Customer
• Date
• Product Subcategory
• Product Category
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ

Lưu ý: Bảng Sales Agg giống như các bảng khác, nó có tính linh hoạt
khi được tải theo nhiều cách khác nhau. Việc tổng hợp có thể được thực
hiện trong cơ sở dữ liệu nguồn bằng các quy trình ETL/ELT hoặc bằng
biểu thức M cho bảng.
Bảng tổng hợp có thể sử dụng chế độ lưu trữ Import, có hoặc không làm
mới tăng dần trong Power BI Premium, hoặc nó có thể sử dụng
DirectQuery và được tối ưu hóa cho các truy vấn nhanh bằng cách dùng
chỉ mục columnstore. Tính linh hoạt này cho phép các kiến trúc cân
bằng có thể phân tán tải truy vấn để tránh tắt nghẽn.
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
Thay đổi chế độ lưu trữ của
bảng tổng hợp Sales
Agg thành Import sẽ mở ra
một hộp thoại cho biết các
bảng thứ nguyên liên quan
có thể được đặt thành chế độ
lưu trữ Dual.
THỰC HÀNH POWER BI
7. Tổng hợp dựa trên các mối quan hệ
Cài đặt các bảng thứ nguyên có liên
quan thành Dual cho phép chúng hoạt
động như là Import hoặc DirectQuery,
tùy thuộc vào truy vấn con. Trong ví
dụ:
Các truy vấn tổng hợp số liệu từ
bảng Sales Agg ở chế độ Import và
nhóm theo các thuộc tính từ các bảng
Dual có liên quan, có thể trả về từ bộ
nhớ đệm trong bộ nhớ.
Các truy vấn tổng hợp số liệu từ bảng
DirectQuery Sales và nhóm các thuộc
tính từ các bảng Dual liên quan, có thể
trả về chế độ DirectQuery. Logic truy
vấn, bao gồm hoạt động Group By,
được chuyển đến cơ sở dữ liệu nguồn.
THỰC HÀNH POWER BI
8. Mối quan hệ regular và limited
• Tổng hợp lượt truy cập dựa trên mối quan hệ yêu cầu mối
quan hệ regular (thông thường).
• Mối quan hệ thông thường bao gồm các kết hợp chế độ lưu
trữ dưới đây. Trong đó, cả hai bảng đều từ một nguồn duy
nhất:
• Trường hợp duy nhất mà mối quan hệ nhiều nguồn được
xem là thông thường là nếu cả hai bảng được đặt thành
Import. Mối quan hệ Many-to-many luôn luôn được xem là
limited.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Truy vấn sau truy cập tổng hợp, bởi vì, các cột trong
bảng Date ở mức độ chi tiết có thể đạt được tính tổng hợp.
Cột SalesAmount sử dụng tổng hợp Sum.

THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Truy vấn sau không đạt tới tổng hợp mặc dù, yêu cầu tổng hợp
của SalesAmount, truy vấn đang thực hiện thao tác GroupBy trên
một cột trong bảng Product, cột này không ở mức độ chi tiết có thể
đạt được tổng hợp.
• Nếu bạn quan sát các mối quan hệ trong model (mô hình), một danh
mục sản phẩm phụ có thể có nhiều dòng Product (sản phẩm). Truy
vấn sẽ không thể xác định sản phẩm nào cần tổng hợp. Trong trường
hợp này, truy vấn sẽ hoàn nguyên về DirectQuery và gửi truy vấn
SQL tới nguồn dữ liệu.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Tổng hợp không chỉ dành cho các phép tính đơn giản thực hiện một
tổng. Các phép tính phức tạp cũng có thể hưởng lợi, về mặt khái
niệm, một phép tính phức tạp được chia thành các truy vấn con cho
mỗi SUM, MIN, MAX, và COUNT và mỗi truy vấn con được đánh
giá để xác định xem nó có thể đạt được tổng hợp hay không. Logic
này không đúng trong mọi trường hợp do tối ưu hóa kế hoạch truy
vấn nhưng nhìn chung nó nên được áp dụng. Ví dụ dưới đây đạt tới
tổng hợp.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Hàm COUNTROWS có thể được hưởng lợi từ các tổng
hợp. Truy vấn sau truy cập tập hợp vì có một tổng
hợp Count table rows được xác định bằng bảng Sales.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Hàm AVERAGE cũng có thể hưởng lợi từ các tổng hợp.
Truy vấn sau đạt tới tổng hợp bởi vì AVERAGE bên trong
được gấp lại thành SUM chia cho COUNT. Vì
cột UnitPrice có các tổng hợp được xác định cho cả SUM
và COUNT, nên đạt được tổng hợp.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Trong một vài trường hợp, hàm DISTINCTCOUNT có thể hưởng lợi từ tổng hợp.
Truy vấn dưới đây đạt tổng hợp bởi vì có một GroupBy cho CustomerKey, mục
này duy trì tính khác biệt trong bảng tổng hợp. Kỹ thuật này vẫn có thể đạt đến
ngưỡng hiệu suất, trong đó, hơn hai đến năm triệu giá trị khác biệt có thể ảnh hưởng
đến hiệu suất truy vấn.
• Tuy nhiên, nó lại có thể hữu ích trong các trường hợp có hàng tỷ hàng trong bảng
chi tiết nhưng có hai đến năm triệu giá trị khác biệt trong cột. Trong trường hợp này,
DISTINCTCOUNT có thể hoạt động nhanh hơn so với việc quét bảng có hàng tỷ
hàng, ngay cả khi nó được lưu vào bộ nhớ.
THỰC HÀNH POWER BI
9. Ví dụ về truy vấn tổng hợp dựa trên mối quan hệ
• Các hàm thời gian thông minh DAX nhận biêt tổng hợp.
Truy vấn sau đạt đến tổng hợp bởi vì hàm DATESYTD tạo
bảng các giá trị CalendarDay và bảng tổng hợp ở mức chi
tiết được bao phủ cho từng cột trong bảng Date. Đây là một
ví dụ về bộ lọc có giá trị bảng đối với hàm CALCULATE,
hàm này có thể hoạt động với các tổng hợp.
THỰC HÀNH POWER BI
10. Mô hình Hadoop
• Các mô hình dữ liệu lớn dựa trên Hadoop có các đặc điểm
khác với các mô hình thứ nguyên. Để tránh kết hợp giữa
các bảng lớn, các mô hình dữ liệu lớn thường không sử
dụng các mối quan hệ nhưng không chuẩn hóa các thuộc
tính thứ nguyên thành các bảng dữ liệu. Bạn có thể mở khóa
các mô hình dữ liệu lớn như vậy để phân tích tương tác
bằng cách dùng các tổng hợp dựa trên các cột GroupBy.
• Bảng dưới đây chứa cột số Movement sẽ được tổng hợp.
Tất cả các cột khác là thuộc tính để nhóm theo. Bảng chứa
dữ liệu IoT và một số lượng lớn các dòng, chế độ lưu trữ là
DirectQuery. Các truy vấn trên nguồn dữ liệu tổng hợp trên
toàn bộ tập dữ liệu rất chậm vì khối lượng quá lớn.
THỰC HÀNH POWER BI
10. Mô hình Hadoop
THỰC HÀNH POWER BI
10. Mô hình Hadoop
• Để khởi động phân tích tương tác trên tập dữ liệu, bạn có
thể thêm một bảng tổng hợp nhóm theo hầu hết các thuộc
tính nhưng loại trừ các thuộc tính có tính cơ bản cao như
kinh độ và vĩ độ. Điều này làm giảm đáng kể số lượng hàng
và đủ nhỏ để vừa với bộ nhớ đệm trong bộ nhớ một cách
thoải mái.
THỰC HÀNH POWER BI
10. Mô hình Hadoop
• Bạn xác định tổng hợp ánh xạ cho bảng Driver Activity
Agg trong hộp thoại Manage aggregations.
THỰC HÀNH POWER BI
10. Mô hình Hadoop
• Trong tổng hợp dựa trên GroupBy cột, các mục
nhập GroupBy không phải là tùy chọn. Nếu không có
chúng, các tổng hợp sẽ không bị ảnh hưởng. Điều này khác
với việc sử dụng tổng hợp dựa trên các mối quan hệ, trong
đó, các mục nhập GroupBy là tùy chọn.
• Bảng dưới đây biểu diễn các tổng hợp cho bảng Driver
Activity Agg.
THỰC HÀNH POWER BI
10. Mô hình Hadoop
Bạn có thể đặt chế độ lưu trữ của tổng hợp bảng Driver Activity
Agg là Import.
THỰC HÀNH POWER BI
11. Ví dụ về truy vấn tổng hợp GroupBy
• Truy vấn dưới đây đạt tổng hợp bởi vì cột Activity
Date được bao phủ bởi bảng tổng hợp. Hàm
COUNTROWS sử dụng tổng hợp Count table rows.
THỰC HÀNH POWER BI
11. Ví dụ về truy vấn tổng hợp GroupBy
• Đặc biệt, đối với các mô hình chứa các thuộc tính bộ lọc
trong bảng thực tế, bạn nên sử dụng tổng hợp Count table
rows. Power BI có thể gửi các truy vấn đến tập dữ liệu sử
dụng COUNTROWS trong trường hợp người dùng không
yêu cầu rõ ràng. Ví dụ, hộp thoại bộ lọc biểu diễn số dòng
cho mỗi giá trị.
THỰC HÀNH POWER BI
12. Các kỹ thuật tổng hợp kết hợp
• Bạn có thể kết hợp các mối quan hệ và kỹ thuật cột
GroupBy để tổng hợp. Tổng hợp dựa trên các mối quan hệ
có thể cần các bảng thứ nguyên không chuẩn hóa được chia
thành nhiều bảng. Nếu điều này gây tốn chi phí và không
thực tế, bạn có thể thay thế các thuộc tính cần thiết trong
bảng tổng hợp cho các dimensions đó và sử dụng các mối
quan hệ cho những dimensions khác.
• Ví dụ: Mô hình dưới đây thay thế Month, Quarter,
Semester và Year trong bảng Sales Agg. Không có mối
quan hệ giữa Sales Agg và bảng Date nhưng có mối quan
hệ với Customer và Product Subcategory. Chế độ lưu trữ
của Sales Agg là Import.
THỰC HÀNH POWER BI
12. Các kỹ thuật tổng hợp kết hợp
THỰC HÀNH POWER BI
12. Các kỹ thuật tổng hợp kết hợp
• Bảng dưới đây hiển thị các mục được đặt trong hộp
thoại Manage aggregations cho bảng Sales Agg. Các mục
nhập GroupBy trong đó Date là bảng chi tiết bắt buộc, để
truy cập tổng hợp cho các truy vấn nhóm theo thuộc
tính Date. Như trong ví dụ trước, các mục
nhập GroupBy cho CustomerKey và ProductSubcategor
yKey không ảnh hưởng đến các lần truy cập tổng hợp,
ngoại trừ DISTINCTCOUNT, vì sự hiện diện của các mối
quan hệ.
THỰC HÀNH POWER BI
12. Các kỹ thuật tổng hợp kết hợp
THỰC HÀNH POWER BI
13. Ví dụ về truy vấn tổng hợp kết hợp
• Truy vấn dưới đây đạt đến tổng hợp bởi vì bảng tổng hợp
bao phủ CalendarMonth và CategoryName có thể truy
cập được thông qua các mối quan hệ one-to-
many. SalesAmount sử dụng tổng hợp SUM.
THỰC HÀNH POWER BI
13. Ví dụ về truy vấn tổng hợp kết hợp
• Truy vấn dưới đây không đạt đến tổng hợp bởi vì bảng tổng
hợp không bao phủ CalendarDay.
THỰC HÀNH POWER BI
13. Ví dụ về truy vấn tổng hợp kết hợp
• Truy vấn thông minh theo thời gian dưới đây không đạt đến
tổng hợp bởi vì hàm DATESYTD tạo một bảng các giá
trị CalendarDay và bảng tổng hợp không bao
gồm CalendarDay.
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
• Ưu tiên tổng hợp cho phép nhiều bảng tổng hợp được xem xét bởi một truy vấn con.
• Ví dụ dưới đây là một mô hình tổng hợp chứa nhiều nguồn:
• Bảng DirectQuery của Driver Activity chứa hơn một nghìn tỷ dòng dữ liệu IoT có
nguồn gốc từ hệ thống big-data. Nó phục vụ các truy vấn xuyên suốt để xem các
IoT riêng lẻ trong ngữ cảnh bộ lọc được kiểm soát.
• Bảng Driver Activity Agg là một bảng tổng hợp trung gian trong chế độ
DirectQuery. Nó chứa hơn một tỷ hàng trong Azure SQL Warehouse và được tối ưu
tại nguồn bằng cách sử dụng các chỉ mục columnstore.
• Bảng Driver Activity Agg2 Import ở một cấp độ chi tiết cao, bởi vì các thuộc tính
theo nhóm rất ít và số lượng thấp. Số lượng các dòng có thể lên đến hàng nghìn, vì
vậy nó có thể dễ dàng vừa với bộ nhớ đệm trong bộ nhớ. Các thuộc tính này tình cờ
được sử dụng bởi một bảng điều hành cấp cao, vì vậy các truy vấn đề cập đến
chúng phải nhanh nhất có thể.
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
• Lưu ý: Các bảng tổng hợp DirectQuery sử dụng một nguồn
dữ liệu khác nhau từ bảng chi tiết chỉ được hỗ trợ nếu bảng
tổng hợp là một SQL Server, Azure SQL hoặc nguồnAzure
SQL Data Warehouse.
• Dấu bộ nhớ của mô hình này tương đối nhỏ nhưng nó lại
mở ra một tập dữ liệu lớn. Nó đại diện cho một kiến trúc
cân bằng vì nó trải rộng tải truy vấn qua các thành phần
của kiến trúc, sử dụng dựa trên thế mạnh của chúng.
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
• Hộp thoại Manage aggregations cho Driver Activity
Agg2 đặt trường Precedence (ưu tiên) là 10, cao hơn Driver
Activity Agg. Cài đặt ưu tiên cao hơn có nghĩa là các truy
vấn sử dụng tổng hợp sẽ xem xét Driver Activity Agg2 đầu
tiên. Thay vào đó, các truy vấn con không ở mức chi tiết
mà Driver Activity Agg2 có thể trả lời sẽ xem xét Driver
Activity Agg. Các truy vấn chi tiết mà bảng tổng hợp không
thể trả lời được sẽ được chuyển hướng đến Driver Activity.
• Bảng được chỉ định trong cột Detail Table là Driver
Activity, không phải Driver Activity Agg, bởi vì không
được phép tổng hợp theo chiều.
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
THỰC HÀNH POWER BI
14. Ưu tiên tổng hợp
Bảng dưới đây biểu diễn các tổng hợp cho bảng Driver Activity Agg2.
THỰC HÀNH POWER BI
15. Phát hiện truy vấn đạt hoặc bỏ sót tổng hợp
• SQL Profiler có thể phát hiện các truy vấn được trả về từ công cụ lưu
trữ bộ nhớ đệm hoặc được đẩy đến nguồn dữ liệu bởi DirectQuery.
Bạn có thể sử dụng cùng một quy trình để phát hiện xem liệu các tổng
hợp có đang bị tấn công hay không.
• SQL Profiler cũng cung cấp sự kiện mở rộng Query
Processing\Aggregate Table Rewrite Query.
• Đoạn mã JSON dưới đây cho thấy một ví dụ về đầu ra của sự kiện khi
một tập hợp được sử dụng.
• matchingResult cho biết truy vấn con đã sử dụng một tập hợp.
• dataRequest cho biết các cột được GroupBy và cột tổng hợp mà truy
vấn con sử dụng.
• mapping cho biết các cột trong bảng tổng hợp được ánh xạ tới.
THỰC HÀNH POWER BI
15. Phát hiện truy vấn đạt hoặc bỏ sót tổng hợp
THỰC HÀNH POWER BI
16. Đồng bộ hóa bộ nhớ đệm
• Các tổng hợp kết hợp các chế độ lưu trữ DirectQuery,
Import và Dual có thể trả về các dữ liệu khác nhau trừ khi
bộ nhớ đệm trong bộ nhớ đươc giữ đồng bộ với nguồn dữ
liệu. Ví dụ, thực thi truy vấn sẽ không che giấu các vấn đề
dữ liệu bằng cách lọc kết quả DirectQuery để khớp với các
giá trị được lưu trong bộ nhớ cache.
• Có những kỹ thuật được thiết lập để xử lý các vấn đề như
trên tại nguồn nếu cần thiết. Tối ưu hóa hiệu suất chỉ nên
được dùng theo những cách không ảnh hưởng đến khả năng
đáp ứng các yêu cầu kinh doanh của bạn. Bạn có trách
nhiệm biết các luồng dữ liệu của mình và thiết kế phù hợp.
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
Bước 1: Bạn mở Power BI Desktop lên, chọn mục Get Data, chọn tiếp More để
mở ra toàn bộ nội dung phần chọn dữ liệu nguồn (hoặc vào trong Power Query
Editor rồi chọn New Source và làm tương tự)
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
Bước 2: Trong cửa sổ Get Data, phần All, chọn PDF
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
Bước 3: Xác định đường dẫn tới thư mục chứa file PDF, sau đó
chọn file PDF cần nạp vào Power BI
Bước 4: Tại cửa sổ Navigator (mục tiêu), chọn các bảng chứa nội
dung cần lấy.
Ví dụ với file PDF trên, ta sẽ có 5 Table tương ứng với 5 trang của
file. Chúng ta sẽ chọn cả 5 Table này, sau đó bấm Load
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
Bước 5: Khi đó dữ liệu sẽ được Power BI Desktop đọc và nạp vào
hệ thống. Tiếp theo chúng ta bấm chọn Edit Queries để mở cửa sổ
Power Query Editor (Nếu tại bước 1 bạn đã mở Power Query
Editor rồi thì bước này không cần thực hiện lại nữa).
Ta thấy có 5 Query tương ứng với 5 bảng. Việc tiếp theo sẽ là gộp
các Query trong cùng 1 bảng.
Bước 6: Kiểm tra các bảng dữ liệu ta thấy:
• Nếu nội dung nằm trên cùng 1 bảng thì các Query phải có tên
tiêu đề giống nhau.
• Nếu nội dung có bao gồm cả bảng khác thì chúng ta chỉ làm tiếp
với những Query trong cùng 1 bảng.
Tại bước này, tiến hành đặt tên tiêu đề các cột trong các Query cần
gộp cho giống nhau
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
Bước 7: Sử dụng Append Queries để ghép nối các Query lại
Bấm vào Table 001, chọn mục Append Queries > Append Queries as New
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI
• Trong cửa sổ Append Queries, chúng ta thực hiện như sau:
• Chọn Three or more tables (vì cần nối nhiều hơn 1 bảng vào với
bảng gốc)
• Chọn các bảng cần nối, bấm Add>> để chuyển vào phần Tables
to append
• Xem lại thứ tự các bảng đã đúng như ý muốn chưa, nếu chưa thì
sắp xếp lại vị trí từng bảng dựa vào các phím mũi tên bên cạnh
vùng Tables to append
• Bấm OK để hoàn thành thao tác
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI

Như vậy kết quả thu được sẽ là 1 bảng tổng hợp có chứa dữ liệu
của cả 5 bảng ban đầu. Đây chính là kết quả mà chúng ta mong
muốn.
CÁCH NẠP DỮ LIỆU TỪ FILE PDF
VÀO POWER BI

Như vậy kết quả thu được sẽ là 1 bảng tổng hợp có chứa dữ liệu
của cả 5 bảng ban đầu. Đây chính là kết quả mà chúng ta mong
muốn.

You might also like