You are on page 1of 12

Hướng dẫn sử dụng Power Query để chuẩn

hóa dữ liệu
https://uniace.vn/huong-dan-su-dung-power-query-de-chuan-hoa-du-lieu/
Trong thực tiễn, đôi khi chúng ta có nguồn dữ liệu có cấu trúc không phù hợp cho phân tích,
cụ thể có dữ liệu có cấu trúc như sau:

Chúng ta cần thay đổi cấu trúc này để thuận tiện cho các phân tích, cụ thể như sau:
Bước 1: Dữ liệu phải ở dạng Table, đặt tên cho Table là Cautrucbandau, cách
thực hiện như sau:
Đưa con trỏ vào bất kỳ ô nào trong vùng dữ liệu, nhấn tổ hợp phím Ctr+T, cửa sổ Create
Table xuất hiện. Trong đó, nhập địa chỉ dữ liệu và chú ý họp check My table has headers.
Thực tế địa chỉ dữ liệu, Excel tự nhận diện.

Đặt tên cho table là Cautrucbandau:


Bước 2: Tải dữ liệu vào Power Query, chọn tab Data (1) và chọn From
Table/Range (2)

Kết quả sẽ xuất hiện cửa sổ Power Query Editor như sau:

Bước 3: Trong cửa sổ Power Query Editor, chọn tab Add Column (1) ,
chọn Index Column (2), sau đó chọn From 0 (3).
Kết quả như sau:
Bước 4: Sau đó, chuyển đổi cột dữ liệu số này thành số hiệu duy nhất cho mỗi
record. Để làm được điều đó hãy chọn Transform (1), Standard (2) và chọn
Integer-Divide (3).

Khi đó, cửa sổ Integer - Drive sẽ xuất hiện

Hãy điền giá trị 5 vào ô Value vì đó là số lượng dòng trong table dữ liệu gốc hiện cần dùng
để chuyển thành 1 dòng.
Bây giờ, cột giá trị mới sẽ hiển thị số hiệu định danh mỗi record. ( xem 0, 1, 2, 3, 4, 5) trong
bảng bên dưới.
Bước 5: Chọn cột Bien (1), chọn Transform (2) và chọn Pivot Column (3),
chọn Dulieu cho Value Column (4), và sau đó tiếp tục chọn Advanced Options
(5) và thiết lập Don’t Aggregate (6) và chọn OK (7).

Dữ liệu sau khi xoay sẽ trông như thế này.


Bước 6: Không cần dùng cột Index nên xóa: Chọn cột Index (1), chọn nút phải
và chọn Remove (2).

Bước 7: Bước chỉnh format. Tùy biến mà chọn dạng thích hợp. Chọn cột thích
hợp và chọn Transform, chọn Data Type (2), chọn dạng thích hợp, trong trường
hợp này, chọn Text (3).

Sau đó các bạn vào Home (1), chọn Close & Load (2), chọn Close & Load (3).
Kết quả sẽ được dạng như mong muốn như sau:

Tuy nhiên, các biến nên ghi theo dạng không dấu như sau:

Cách tự động cập nhập file Excel bằng


Power Query
Giả sử, hàng ngày bạn đều nhận được một file tương tự như tình huống trên. Thì Power
Query cho phép bạn tự động hóa file này bằng cái Refresh dữ liệu, mà không cần lặp đi lặp
lại các thao tác trên.

Bước 1: Kết nối file dữ liệu hàng ngày nhận được thông qua thao tác.
Data --> Get Data --> From File --> From Workbook
Bước 2: chọn tên file mà bạn muốn cập nhập hàng ngày

Bước 3. Thực hiện thao tác load file ra sheet. Lưu ý, các file bạn chọn có thể
file được định dạng table hoặc không, do đó nên chọn tên sheet để load ra. Như
hình phía dưới thì table sẽ có ký hiệu như Table1 và tên sheet sẽ có ký hiệu như
DATA.
Bước 4: Lặp lại các thao tác thiết lập ban đầu như mình hướng dẫn ở phần đầu,
để chuẩn hóa dữ liệu
Bước 5: Cập nhập các file mới nhận được hàng ngày bằng cách
Data --> Refresh All --> Refresh All

Vậy là toàn bộ các file mà hàng ngày bạn phải chuyển đổi thủ công hằng ngày có thể được
cập nhập tự động bằng cách này. Tất cả những thiết lập này duy nhất 1 lần và bạn có thể sử
dụng mãi mãi cho các lần sau này.
Power Query ngoài giúp bạn chuẩn hóa dữ liệu, hay tự động cập nhập các file thì còn rất
nhiều tính năng khác. Các bạn có thể tham khảo bài viết Power Query là gì để có thể có một
góc nhìn khác về các tính năng của Excel hiện đại.

You might also like