You are on page 1of 26

PHÂN TÍCH DỮ LIỆU

SQL & POWER BI


BECOME AN EXPERT IN DATA ANALYTICS
THÔNG TIN GIẢNG VIÊN

Mr. Nguyễn Phương Nam

Hơn 5 năm kinh nghiệm trong lĩnh vực


Data Analytics

Senior Data Analyst - Techcombank

Chứng chỉ: Microsoft Certified: Data


Analyst Associate

phuongnam506@gmail.com
4

Theo bạn Data Warehouse là gì?

Bài 2: Thực hành các thao tác với dữ liệu


trên Power Query
MỤC LỤC

1 Tổng quan về Power Query

Giới thiệu các chức năng cơ bản trong


2
Power Query

3 Giới thiệu cơ bản về M trong Power Query

4 Bài tập thực hành


TỔNG QUAN VỀ POWER QUERY
Power Query là gì?

● Power Query là công nghệ kết nối dữ liệu cho phép bạn khám phá, kết nối, kết
hợp và chỉnh sửa các nguồn dữ liệu để đáp ứng nhu cầu phân tích.

● Power Query là 1 trong 3 tool phân tích dữ liệu có sẵn trong Excel bao gồm:
Power Query – Power Pivot – Power View

● Power Query có sẵn trong các phiên bản của Power BI Desktop và trong các
phiên bản Excel từ năm 2016 trở lên (trong mục Get & Transform). Các phiên
bản Excel 2010 và 2013 có thể tải trực tiếp và cài đặt như một tool trong
Excel.
Giới thiệu chi tiết về giao diện của Power Query

1. Thanh Ribbon
2. Queries
3. Data Preview
4. Formula Bar
5. Properties
6. Applied Steps
Giới thiệu chi tiết về giao diện của Power Query

1. The Ribbon : Giao diện người dùng cho trình soạn thảo khá giống với Excel. Nó chức
năng về chỉnh sửa, thêm mới… dữ liệu được chia thành 5 tab chính.
2. Queries List (Danh sách truy vấn): Khu vực này liệt kê tất cả các truy vấn trong
Power Query. Bạn có thể điều hướng đến bất kỳ truy vấn nào từ khu vực này để có
thể chỉnh sửa nó.
3. Data Preview: Khu vực này là nơi hiển thị bản xem trước của dữ liệu với tất cả các
bước chuyển đổi hiện đang được áp dụng. Bạn cũng có thể sử dụng nhiều lệnh biến
đổi dữ liệu ở đây
4. Formula Bar (Thanh công thức): Nơi để xem và chỉnh sửa M code của bước
chuyển đổi hiện tại.
5. Properties: Nơi bạn có thể đặt tên cho truy vấn của mình.
6. Applied Steps: Khu vực này là danh sách theo thứ tự thời gian của tất cả các bước
chuyển đổi đã được áp dụng cho dữ liệu được hiển thị ở phần Data Preview
GIỚI THIỆU CÁC CHỨC NĂNG
CƠ BẢN TRONG POWER QUERY
HOME Tab

Home tab chứa tất cả các chức năng chuyển đổi và các thiết lập tác động lên toàn bộ
bảng.
HOME Tab

1. Close – Có các option Close & Load và Close & Load To (giống File Tab)
2. Query – Dùng để refresh các query đang có, chỉnh sửa các Properties hoặc vào
giao diện Advanced Editor để sửa code M
3. Manage Columns – Dùng để giữ hoặc xóa các cột trong bảng
4. Reduce Rows – Quản lý dòng trong bảng dữ liệu
5. Sort – Sắp xếp các cột theo chiều tăng hoặc giảm
6. Transform – Chứa rất nhiều các chức năng transformation hữu ích
• Split Columns – Chia dữ liệu trong cột theo điều kiện
• Group By – Group và Summarize dữ liệu
• Data Type – Kiểm tra loại dữ liệu của cột/ Cho phép bạn thay đổi loại dữ liệu
trong cột
• Use First Row as Headers – Chuyển dòng đầu tiên thành tên của các cột
(headers)
HOME Tab

7. Replace Values – Tìm và thay thế giá trị của 1 cột Combine – Cho phép merge,
append hoặc combine files khi bạn làm việc với folder
8. Parameter – Tạo Parameter trong Power Query
9. Data Sources – Chỉnh sửa các thiết lập về Data Sources
10. New Query – Tạo query mới từ Data Sources cũ hoặc mới
TRANSFORM Tab

Transform tab chứa tất cả các chức năng chuyển đổi tác động lên cột hoặc bảng
TRANSFORM Tab

1. Table – Chứa các chức năng sẽ chuyển đổi cả toàn bộ bảng như transpose,
reverse hoặc count rows,…
2. Any Column – Chứa các chức năng làm việc trên bất kì cột dữ liệu nào trong bảng
(sẽ nói chi tiết trong ví dụ )
3. Text Column – Chứa các chức năng làm việc trên dữ liệu text bao gồm split, trim,
clean, ….
4. Number Column – Chứa các chức năng làm viêc trên dữ liệu dạng number bao
gồm cơ ban như cộng trừ nhân chia hay đến các phép thống kê.
5. Date & Time Column – Chứa các chức năng làm việc trên dữ liệu dạng Date và
Time
6. Structured Column – Chứa các chức năng làm việc với dữ liệu có cấu trúc đặc
biệt.
VIEW Tab

View tab có ít chức năng hơn so với tab khác và cũng ít được dùng hơn, tuy nhiên,
nó cũng có 1 số chức năng mà bạn có thể sẽ rất cần thiết.
VIEW Tab

1. Layout – Cho phép bạn ẩn hoặc hiện Query Setting Pane (nơi chứa Properties và
Applied Steps) và thanh Formula Bar
2. Data Preview – Cho phép bạn ẩn hoặc hiện các ký tự khoảng trắng (white space)
hoặc chuyển font chữ thành monospace trong vùng Data Preview
3. Columns – Cho phép bạn lựa chọn và đến 1 cột trong Data Preview
4. Parameters - Cho phép bạn được sử dụng Parameter trong Data Sources và các
bước chuyển đổi dữ liệu.
5. Advanced – Mở cửa sổ Advanced Query Editor
6. Dependencies – Mở 1 diagram view của các query phụ thuộc
GIỚI THIỆU CƠ BẢN VỀ M
TRONG POWER QUERY
Giới thiệu ngôn ngữ M

● M hay được biết đến là Power Query Formula Language được sử dụng trong Power
Query (Transform trong Excel 2016) và công cụ truy vấn cho Power BI Desktop. Các hàm
và cú pháp của nó rất khác với các hàm bảng tính Excel.

● M là ngôn ngữ truy vấn mashup (functional language) được sử dụng để truy vấn đa dạng
nguồn dữ liệu. Nó chứa các lệnh để chuyển đổi dữ liệu và có thể trả về kết quả của truy
vấn và biến đổi cho bảng Excel hoặc mô hình dữ liệu trên Excel hoặc Power BI.

● Về bản chất: Trước tiên, ta sử dụng Power Query (M) để truy vấn nguồn dữ liệu, tinh
chỉnh và tải dữ liệu. Sau đó, ta sử dụng DAX để xây dựng các measure phân tích dữ liệu
trong Power Pivot. Cuối cùng, ta xây dựng các báo cáo trên Excel hoặc trực quan hóa dữ
liệu trên Power BI bằng các biểu đồ, hình ảnh...
Syntax của M

M có 2 block đó là let và in. Ví dụ:

Nếu trong phần let có nhiều hơn 1 dòng code, bạn cần thêm dấu “,” vào cuối mỗi
dòng
Syntax của M

Ví dụ minh họa:
BÀI TẬP THỰC HÀNH

• Ta có tình huống sau:


Bạn là chuyên viên phân tích tài chính của một công ty công nghệ bán máy tính và điện
thoại thông minh. Hiện tại, bạn đang hoạt động ở 3 quốc gia: Pháp, Vương quốc Anh và
Trung Quốc.
Mỗi tháng, bạn tạo một báo cáo tổng hợp cho người quản lý của mình, với các KPI như
tổng doanh thu, doanh thu theo quốc gia hoặc doanh thu theo sản phẩm. Để làm như vậy,
mỗi người quản lý quốc gia - Dennis, Douglas và Karen - sẽ gửi cho bạn một tệp.

• Vấn đề: mỗi tệp liệt kê doanh số bán hàng theo mệnh giá riêng của quốc gia. Quá mất
thời gian để chuyển đổi chúng sang Euro và để chỉnh sửa dữ liệu, sau đó tổng hợp
chúng vào báo cáo cuối cùng.
BÀI TẬP THỰC HÀNH

Các vấn đề cần giải quyết:


• Dữ liệu cần tổng hợp từ nhiều file
• Dữ liệu có nhiều file không cùng format
• Dữ liệu cần chuyển đổi và chuẩn hóa trước khi đưa vào tính toán báo cáo
• Báo cáo cần tổng hợp định kỳ => cần giải pháp để automate
Bài tập tự luyện

• Thực hành lại ví dụ trong bài

• Trong folder PBI Lesson 2 Practice, dùng Power Query để chỉnh sửa các

lỗi sai của file Lesson 2 Power Query Practice

• Trong folder PBI Lesson 2 Practice, dùng Power Query để load các file từ

folder Data và More Data, sau đó append vào thành 1 query duy nhất
Q&A

You might also like