You are on page 1of 52

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC


-----    -----

BÁO CÁO MÔN HỌC


KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH

Giảng viên: Th.S Nguyễn Danh Tú

Sinh viên: Hoàng Đức Minh Triều

MSSV: 20185415

Lớp: Toán Tin - 02

Hà Nội, năm 2021


Đồ án môn học

MỤC LỤC
TỰ ĐÁNH GIÁ ............................................................................................................. 4
PHẦN I : KẾT QUẢ THỰC HÀNH ........................................................................... 5
1. BÀI THỰC HÀNH TUẦN 1 .............................................................................. 5
1.1 Sắp xếp dữ liệu .................................................................................................................. 5
1.2 Lọc dữ liệu ......................................................................................................................... 7
1.3 Q&A ................................................................................................................................... 8
1.4 DATA VALIDATION .................................................................................................... 13
1.5 Định dạng có điều kiện ................................................................................................... 17

2. BÀI THỰC HÀNH TUẦN 2 ............................................................................ 23


2.1 Pivot.................................................................................................................................. 23
2.2 Vẽ đồ thị cơ bản............................................................................................................... 28
2.3 Đồ thị nâng cao ................................................................................................................ 30
2.5 Vẽ dashboard ................................................................................................................... 32

3. BÀI THỰC HÀNH TUẦN 3 ............................................................................ 32


3.1 Vẽ dashboard và phân tích ............................................................................................. 32

4. BÀI THỰC HÀNH TUẦN 4 ............................................................................ 33


4.1 Extract Data & ETL bằng Power Query ...................................................................... 33
4.2 Transform data ............................................................................................................... 36
4.3 Load data ......................................................................................................................... 38
4.4 Add column...................................................................................................................... 39

5. BÀI THỰC HÀNH TUẦN 5 ............................................................................ 41


5.1 Sử dụng Power Query ETL dữ liệu rồi vẽ dashboard ................................................. 41
5.2 Google Studio để vẽ dashboard...................................................................................... 43

6. BÀI THỰC HÀNH TUẦN 6 ............................................................................ 44


6.1 Thực hành trên Power BI ............................................................................................... 44
6.2 Thực hành với dữ liệu trên Kaggle ................................................................................ 45

7. BÀI THỰC HÀNH SỐ 7 .................................................................................. 46


PHẦN II : KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌC 51
1. KẾT QUẢ THU ĐƯỢC ................................................................................... 51
2. ĐÁNH GIÁ VÀ GÓP Ý ................................................................................... 51

2
TÀI LIỆU THAM KHẢO.......................................................................................... 52
Đồ án môn học

TỰ ĐÁNH GIÁ
Trong quá trình học, em cũng đã có sự cố gắng và học tập nghiêm túc. Bên cạnh đó
nhưng có nhiều lúc chậm tiến độ của bài thực hành. Em đã tham gia đầy đủ buổi học trên lớp,
họp và cùng nhóm thực hiện đề tài được giao. Nhưng em cũng chưa hiểu rõ nhiều phần, một
số phần chỉ hiểu được kiến thức cơ bản và chưa biết áp dụng, chưa tìm tòi để nâng cao nhiều
kiến thức hơn.

Báo cáo gồm mục đích sau :

• Tổng kết và xâu chuỗi những kiến thức đã được học và thực hành.
• Đánh giá, góp ý cho môn học

Nội dung báo cáo :

• Tự đánh giá bản thân trong quá trình học tập


• Kết quả các bài thực hành tuần
• Tổng kết, đánh giá, góp ý cho môn học

Trong quá trình học tập, thực hành và viết báo cáo, em sẽ gặp phải những sai sót, rất
mong thầy và các bạn đóng góp để em phát triển hơn. Em cũng cảm ơn thầy Nguyễn
Danh Tú đã tận tình chỉ dạy, đôn đốc chúng em, tạo điều kiện để em có thể hoàn thành
môn học này. Em xin chân thành cảm ơn thầy !

4
Báo cáo môn học

PHẦN I : KẾT QUẢ THỰC HÀNH


1. BÀI THỰC HÀNH TUẦN 1
1.1 Sắp xếp dữ liệu
• Theo 1 tiêu chí

• Theo nhiều tiêu chí

5
Đồ án môn học

• Theo màu

• Sắp xếp theo yêu cầu đặc thù : Tên sau khi tách ra từ họ và tên

6
Báo cáo môn học

1.2 Lọc dữ liệu


• Lọc theo địa chỉ tại ‘HCM’

• Lọc theo năm sinh 1985

7
Đồ án môn học

• Lọc theo tháng sinh (tháng 2)

1.3 Q&A
• Lọc nhân viên bộ phận kho

8
Báo cáo môn học

• Nhân viên có mức lương từ 8 đến 10 triệu

• Nhân viên các xác minh lại hộ khẩu (bôi màu vàng hoặc không có thông
tin hộ khẩu)

9
Đồ án môn học

• Nhân viên bộ phận kho có hộ khẩu tại Hà Nội để lên lịch trực tết

• Copy paste series

10
Báo cáo môn học

• Copy paste theo định dạng

• Ngang dọc

11
Đồ án môn học

• Dạng ảnh

• Từ nguồn khác

12
Báo cáo môn học

• Paste theo filter

1.4 DATA VALIDATION


• Dạng danh sách

13
Đồ án môn học

• Dạng điều kiện

• Thông báo lỗi

14
Báo cáo môn học

15
Đồ án môn học

• Danh sách dạng nâng cao

• Merger Cell

16
Báo cáo môn học

1.5 Định dạng có điều kiện


• Định dạng top%

• Định dạng tiến độ

17
Đồ án môn học

• Định dạng điều kiện số

• Dạng bảng

18
Báo cáo môn học

• Định dạng ô

• Định dạng lọc trùng

19
Đồ án môn học

• Xóa định dạng

• Quản lí định dạng

20
Báo cáo môn học

• Định dạng dòng chẵn lẻ

• Định dạng trùng

21
Đồ án môn học

• Ngày tháng năm sinh

• Định dạng theo nhân viên hộ khẩu ‘Hà Nội’

22
Báo cáo môn học

2. BÀI THỰC HÀNH TUẦN 2


2.1 Pivot
• Tạo báo cáo

• Làm mới

23
Đồ án môn học

• Lấy dữ liệu chi tiết từ báo cáo

• Định dạng

24
Báo cáo môn học

• Thêm các cột dòng

• Bỏ các cột dòng

25
Đồ án môn học

• Thêm báo cáo dạng cổ điển

• Tùy chỉnh công thức count/ sum

26
Báo cáo môn học

• Nhóm các loại dữ liệu

• Tiền xử lí

27
Đồ án môn học

2.2 Vẽ đồ thị cơ bản


• Sử dụng switch và chart type

• Sử dụng chart layout

28
Báo cáo môn học

• Chart 1

• Chart 2

29
Đồ án môn học

• Pie

2.3 Đồ thị nâng cao


• Vẽ đồ thị cột kết hợp đường

30
Báo cáo môn học

• Vẽ đồ thị phương trình 1

• Vẽ đồ thị phương trình 2

31
Đồ án môn học

2.5 Vẽ dashboard

3. BÀI THỰC HÀNH TUẦN 3


3.1 Vẽ dashboard và phân tích
• Vẽ dashboard

32
Báo cáo môn học

• Phân tích
- Đồng phục nhập ngoại quá nhiều, học sinh sinh viên còn sử dụng tiền của bố mẹ, đất
nước còn nghèo nên không thể nhập nhiều đồ ngoại về làm đồng phục được, không giữ
được nét truyền thống của đất nước. Khuyến khích người Việt dùng đồ Việt
- Nhìn biểu đồ doanh thu theo năm thì thấy số liệu có vẻ sai, người Việt thường có xu
hướng mua sắm vào dịp cuối năm và đầu năm mới. Ở đây giữa năm doanh thu lại cao
một cách bất thường, còn dịp đầu năm và cuối năm thì lại thấp. Tháng 3 và tháng 8
không thể là dịp mà người dân Việt Nam mua sắm nhiều nhất được.
- Doanh thu đồ nam không thể nào thấp hơn đồ nữ được, vì phụ nữ mua sắm nhiều hơn
nam giới rất nhiều. Phụ nữ cũng chuộng đồ ngoại hơn nam.
- Nhân viên Tuấn Đạt bán được hàng nhiều nhất, khen thưởng để cổ vũ tinh thần.
- Doanh thu tại HCM là lớn nhất, rồi đến Hà Nội, các tỉnh nam bộ và đồng bằng sông
hồng.Tại miền trung thì chỉ có Đà Nẵng
- Các tỉnh đều ưa chuộng mua đồ nội thất, đến đồ nam nữ,da dày.
- Tại các tỉnh Bình Phước, Đồng Nai lại chỉ bán được hàng ngoại => vô lí
=>dựa vào đồ thị, nhà sản xuất nên tích trữ và có các chiến dịch kinh doanh phù hợp
cho quý 3 để đạt doanh thu lớn hơn như năm 2019.

4. BÀI THỰC HÀNH TUẦN 4


4.1 Extract Data & ETL bằng Power Query

• Load

33
Đồ án môn học

• Fromfile

• From folder

34
Báo cáo môn học

• From google sheet

• Remove

35
Đồ án môn học

4.2 Transform data


• Append

• Group by

36
Báo cáo môn học

• Merge

• Transpose

37
Đồ án môn học

• Unpivot

4.3 Load data

38
Báo cáo môn học

4.4 Add column


• Add

• Add

39
Đồ án môn học

• Add

• Add

• Add

40
Báo cáo môn học

5. BÀI THỰC HÀNH TUẦN 5


5.1 Sử dụng Power Query ETL dữ liệu rồi vẽ dashboard
• Sử dụng Power Pivot để lập mô hình

41
Đồ án môn học

• Vẽ Chart

• Vẽ Dashboard

42
Báo cáo môn học

5.2 Google Studio để vẽ dashboard

43
Đồ án môn học

6. BÀI THỰC HÀNH TUẦN 6


6.1 Thực hành trên Power BI

44
Báo cáo môn học

6.2 Thực hành với dữ liệu trên Kaggle


• Vẽ Dashboard

• Phân tích
- Thị trường tập trung ở Châu Âu và Bắc Mỹ = > Châu A là thị trường tiềm năng, vì
đời sống con người ở châu Á đang được tăng lên rất nhanh, nhu cầu rất lớn
- Do thị trường chủ yếu ở Châu Âu và Bắc Mỹ nên xe con chiếm tỉ trọng doanh thu rất
lớn.
- Lượng mua hàng tập trung vào các tháng cuối năm
- Đại đa số các đơn hàng thuộc loại Medium và Small

45
Đồ án môn học

7. BÀI THỰC HÀNH SỐ 7


• Basic chart

• Map chart

46
Báo cáo môn học

• Table và Matrix

• Line Chart

47
Đồ án môn học

• Waterfall + tree +guage

• Card

48
Báo cáo môn học

• Silcer

• Biểu đồ nâng cao

49
Đồ án môn học

• Biểu đồ nâng cao

• Biểu đồ nâng cao

50
Báo cáo môn học

PHẦN II : KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌC
1. KẾT QUẢ THU ĐƯỢC
Sau quá trình học tập và rèn luyện qua các bài thực hành thầy giao, em đã học được
rất nhiều thứ. Em cũng có cái nhìn tổng quan về kinh doanh thông minh, đã biết làm
một số công việc của nhà phân tích dữ liệu
• Học được cách xây dựng kho dữ liệu
• Học được cách thu thập dữ liệu từ nhiều nguồn khác nhau như trên
mạng, google sheet, SQL server, Excel, …
• Học được cách sắp xếp, lọc dữ liệu, nhiều tính năng, sử dụng các hàm
trong excel
• Biết cách sử dụng Power Query và Power Pivot
• Học được cách ETL dữ liệu
• Xác định được DIM, FACT
• Học được cách xây dựng các mô hình như OLAP, OLTP
• Biết sử dụng Google Data Studio để tạo báo cáo, cập nhật dữ liệu
• Sử dụng được Power BI : ETL dữ liệu, xây dựng mô hình, tạo các báo
cáo thông minh trực quan, biết nhiều tính năng hay ho.
• Liên kết được kiến thức các môn học đã từng học như cơ sở dữ liệu,
phân tích thiết kế hệ thống, hệ hỗ trợ quyết định
2. ĐÁNH GIÁ VÀ GÓP Ý
Đánh giá
• Môn học có ý nghĩa to lớn và cần thiết trong thời đại phát triển của khoa
học dữ liệu. Là một trong những môn học mà em học tập được nhiều thứ
nhất trong thời sinh viên mặc dù trong quá trình học tập còn chưa được
chăm chỉ.
• Em không chỉ thu được kết quả trong quá trình học tập trên lớp mà còn
học được nhiều trong những bài thực hành tuần.
• Thầy cũng rất tận tâm trong quá trình giảng dạy, thường xuyên hỏi han
tình hình và đôn đốc sinh viên.
• Thầy tạo các bài thảo luận trên lớp để giúp sinh viên hiểu rõ hơn những
lí thuyết đã thực hành.
Góp ý
• Nếu được thì thầy có thể phân bố ra cả kì học
• Thầy có thể thêm những bài thực hành phân tích bằng ngôn ngữ Python
• Thời gian những buổi thực hành tuần có một số buổi có thời gian dài
• Có các bài tập thực hành nhiều hơn sau những buổi thực hành, vì thực
hành chúng em làm theo sau một thời gian thì dễ quên

51
Đồ án môn học

TÀI LIỆU THAM KHẢO


1. Bài giảng kho dữ liệu và kinh doanh thông minh, Viện Toán ứng dụng và Tin học,
Nguyễn Danh Tú, 2021.
2. Bài giảng Hệ hỗ trợ quyết định, Viện Toán ứng dụng và Tin Học, Nguyễn Thành
Nam, 2021.
3. Bài giảng Phân tích thiết kế hệ thống, Viện Toán ứng dụng và Tin học, Nguyễn
Quang Hòa, 2020.
4. Nguyễn Danh Tú, “ETL dữ liệu trong Excel.”
5. Nguyễn Danh Tú, “Pivot.”
6. Nguyễn Danh Tú, “Tùy chỉnh Chart.”
7. Nguyễn Danh Tú, “Xây dựng Dashboard trên Excel.”
8. Nguyễn Danh Tú, “Tiền xử lý dữ liệu với công cụ Power Query.”
9. Railsware Product Academy, “Google Data Studio Tutorial for Beginners.”
10. Pavan Lalwani , “Power BI Tutorial.”

52

You might also like