Professional Documents
Culture Documents
liệu. Nếu cấu trúc dữ liệu không đúng sẽ không thực hiện những phân tích tốt.
Nếu dữ liệu có cấu trúc phù hợp, mọi phân tích trong Excel sẽ trở nên dễ dàng.
Hãy xem Power Query sẽ giúp gì trong trường hợp này qua một số ví dụ.
Down dữ liệu tử trang web của tổng cục thống kê theo địa chỉ
http://thongke.tourism.vn/index.php/statistic/stat/6?
share=99&type=type1&rowcode=17&input-type=4&row-
list=17_1701,17_1702,17_1703&nam=2016,2010,2011,2012,2013,2014,2015,2
017,2008,2009,2018,2019,2020
Màn hình down dữ liệu
Sau khi down dữ liệu về, chúng ta có bảng dữ liệu như sau:
Với cấu trúc dữ liệu này rất khó cho phân tích nên cần làm sạch nó và tổ chức
nó theo dạng phù hợp.
Trước tiên nên bỏ dữ liệu 6 tháng đầu năm vì như thế rất khó so sánh được với
những liệu khác.
Tiếp theo nên bỏ hàng tổng, vì nó không cần thiết lưu trữ trong cơ sở dữ liệu.
Nên bổ sung những ô trống cho những dữ liệu năm phù hợp, như sau:
Sau đó, các em đổi tên cột Attribute thành cột tên Phương tiện, Cột Value
thành cột tên Lượt khách, kết quả như sau:
Tiếp theo, lưu kết quả như sau:
Chọn File > Chọn Close and Load hay Close and Load to…
Nếu chọn Close and Load thì kết quả sẽ lưu vào một Sheet trong Worksheet
dang có (File hiện có).
Nên đổi tên Sheet mới theo tên sao cho thuận tiện ví dụ DataMoi.
Cụm hàng thành cột
https://uniace.vn/huong-dan-su-dung-power-query-de-chuan-hoa-du-lieu/
Trong thực tiễn, đôi khi chúng ta có nguồn dữ liệu có cấu trúc không phù hợp cho phân tích,
cụ thể có dữ liệu có cấu trúc như sau:
Chúng ta cần thay đổi cấu trúc này để thuận tiện cho các phân tích, cụ thể như sau:
Bước 1: Dữ liệu phải ở dạng Table, đặt tên cho Table là Cautrucbandau, cách thực hiện như
sau:
Đưa con trỏ vào bất kỳ ô nào trong vùng dữ liệu, nhấn tổ hợp phím Ctr+T, cửa sổ Create
Table xuất hiện. Trong đó, nhập địa chỉ dữ liệu và chú ý họp check My table has headers.
Thực tế địa chỉ dữ liệu, Excel tự nhận diện.
Đặt tên cho table là Cautrucbandau:
Bước 2: Tải dữ liệu vào Power Query, chọn tab Data (1) và chọn From Table/Range (2)
Kết quả sẽ xuất hiện cửa sổ Power Query Editor như sau:
Bước 3: Trong cửa sổ Power Query Editor, chọn tab Add Column (1) , chọn Index Column
(2), sau đó chọn From 0 (3).
Bước 7: Bước chỉnh format. Tùy biến mà chọn dạng thích hợp. Chọn cột thích hợp và chọn
Transform, chọn Data Type (2), chọn dạng thích hợp, trong trường hợp này, chọn Text (3).
Sau đó các bạn vào Home (1), chọn Close & Load (2), chọn Close & Load (3).
Kết quả sẽ được dạng như mong muốn như sau:
Tuy nhiên, các biến nên ghi theo dạng không dấu như sau: