Professional Documents
Culture Documents
Nội dung
Vào cuối chương trình, các bạn có thể chọn một trong 2 lựa chọn sau: Kết hợp các kỹ
năng của mình để hoàn thành một dự án capstone hoặc đi thực tập tại danh nghiệp
● Công việc: Vị trí tuyển dụng: Data Analyst, Business Inteligent Analyst, … Một số đơn
vị tuyển dụng: Viettel, FPT Software, MB Bank, Momo, …
● Học tiếp các Chứng chỉ tiếp theo về dữ liệu của Funix để nắm vững hơn về hệ sinh thái
dữ liệu trong doanh nghiệp như: Kỹ thuật dữ liệu, khoa học dữ liệu, học máy.
● Học viên có thể tiếp tục theo học để có thể lấy bằng Kỹ sư phần mềm của FPT University
và các trường đại học quốc tế khác (Deakin, City University of Seatle).
● PO2: Có góc nhìn toàn diện về tính chất công việc, nghiệp vụ của một DA/BI, từ đó định
hướng được career path phù hợp nhất cho bản thân.
● PO3: Nắm được một quy trình hoàn chỉnh và chi tiết khi làm việc với dữ liệu, từ phân
tích/đưa ra bài toán nghiệp vụ, trao đổi với stake holders (khách hàng và các bên liên
quan) đến mô hình hóa dữ liệu thông qua các mô hình học máy.
● PO4: Sử dụng thành thạo các ứng dụng sau cho các bài toán thu thập, xử lý và phân tích
dữ liệu: Excel, Power BI, Python và một số framework đặc thù khác (scikit-learn, pandas,
…).
● PO5: Làm việc tốt với các hệ cơ sở dữ liệu quan hệ: Từ thiết kế và xây dựng hệ CSDL,
viết truy vấn SQL, đến thiết kế và tối ưu Data Warehouse và các tiến trình ETL.
Học viên có thể tự trang bị, củng cố lại kiến thức nền tảng, hoặc có thể đăng ký học các
môn nền tảng này tại FUNIX trong chứng chỉ điều kiện của chương trình Data Analysis:
● Các hệ cơ sở dữ liệu
● Excel cơ bản
(Các bạn click vào link để đọc thêm các thông tin chi tiết về môn học).
Sau đó, học viên sẽ bắt đầu tìm hiểu các quy trình về phân tích dữ liệu thông qua Excel –
một trong những công cụ cơ bản và thông dụng nhất để làm việc với dữ liệu – cho dù là kinh
doanh, tiếp thị, phân tích dữ liệu hay nghiên cứu. Bạn sẽ có được kinh nghiệm quý báu trong
việc phân tích dữ liệu của mình bằng các kỹ thuật trong Excel như tạo bảng tổng hợp, trực quan
hóa và mô hình hóa dữ liệu.
Mục tiêu
#
1 Nắm được các khái niệm cơ bản về công việc Phân tích dữ liệu và hệ sinh thái
khoa học dữ liệu.
2 Hiểu rõ vai trò của Phân tích dữ liệu trong các bài toán kinh doanh.
3 Nắm được cách thức kết nối và giao tiếp với các bên liên quan trong một dữ án
liên quan đến Phân tích dữ liệu.
4 Sử dụng được excel để xử lý bài toán phân tích dữ liệu cơ bản từ đầu đến cuối.
2 Cài đặt và làm quen với giao diện của Power BI Desktop.
3 Xử lý, chuyển đổi và tích hợp được dữ liệu thô vào Power BI.
4 Xây dựng mô hình dữ liệu quan hệ với các bảng dữ liệu và quan hệ dữ liệu.
5 Sử dụng DAX để tính toán, trích xuất và phân tích dữ liệu.
6 Xây dựng được các báo cáo Power BI đẹp mắt, có thể tương tác với người dùng.
7 Thiết kế, xây dựng và triển khai được một quy trình BI hoàn chỉnh trên Power
BI từ dữ liệu thô với các báo cáo và dashboard chất lượng.
8 Đăng nhập và làm quen với Power BI Service.
Trong môn học này, học viên sẽ được làm quen với ngôn ngữ Python và cách sử dụng
thư viện Pandas để xử lý dữ liệu dạng bảng. Với Pandas, các bạn có thể dễ dàng thực hiện các
công việc như làm sạch dữ liệu, chuẩn hoá và biến đổi dữ liệu. Ngoài ra, Pandas cũng hỗ trợ rất
nhiều định dạng file dữ liệu khác nhau như json, xlsx, csv, ... Việc này sẽ giúp các bạn có nhiều
lựa chọn hơn khi làm việc với dữ liệu.
Trong ở phần 3 của môn học này, các bạn sẽ được thực hành trực quan hoá dữ liệu với
Python bằng cách sử dụng các thư viện của Python như Matplotlib, Seaborn, Folium, Plotly.
Trong phần cuối cùng của môn học, các bạn sẽ được làm quen với học máy, đây là một
lĩnh vực rất rộng lớn và được sử dụng rộng rãi trong phân tích dữ liệu nâng cao. Nếu trước đây
các bạn đã được làm quen với mô hình Linear Regression cơ bản (trong môn Giới thiệu về phân
tích dữ liệu) thì ở phần này, các bạn sẽ được giới thiệu các mô hình khác như Regression nâng
cao, hồi quy logistic, cây quyết định, k-Mean. Mỗi mô hình đều được sử dụng khi phân tích dữ
liệu nâng cao: hồi quy logistic có thể giúp các bạn phân loại đâu là khách hàng tiềm năng, k-
Means sẽ giúp các bạn phân nhóm được các nhóm khách hàng có đặc điểm chung, ...
Mục tiêu
#
1 Sử dụng Python để làm việc với các dữ liệu dạng text file, dữ liệu web
Học viên cần đưa ra các câu hỏi để có thể xác định
bài toán
1. Mục tiêu:
2. Yêu cầu:
Thực hiện làm sạch dữ liệu trước khi thực hiện xây
dựng mô hình
2 Phân tích dữ liệu Assignment 1: Xây dựng báo cáo về tình hình Covid
2 với Power BI tại Việt Nam
Chủ đề: Trong ASM này học viên sẽ sử dụng Power BI
để xây dựng báo cáo về tình hình COVID19 tại Việt
Nam. Trong quá trình làm bài học viên sẽ được thực
hành đầy đủ về các giai đoạn trong Workflow khi làm
việc với Power BI.
Yêu cầu:
Học viên đọc kĩ phần yêu cầu tổng quan sau đó
có thể thực hiện các yêu cầu lần lượt theo hướng
dẫn trong phần 2.
Học viên xem kỹ các phần tài liệu tham khảo.
3 Truy vấn nâng Assignment 1: Phân tích kinh doanh sử sụng SQL
3 cao và xây dựng
kho dữ liệu Chủ đề: Công ty A đã thành lập được một thời gian và
giờ công ty muốn thực hiện một vòng gọi vốn từ quỹ
đầu tư mạo hiểm. Bạn hãy dùng khả năng phân tích của
mình để vẽ ra được một bức tranh về sự tăng trưởng
vượt bậc của công ty. Trong ASM này, bạn sẽ đóng vai
trò là một nhà phân tích dữ liệu để giúp Giám đốc điều
hành của một công ty A kể câu chuyện về dữ liệu. Bạn
sẽ sử dụng các kỹ năng về phân tích dữ liệu truy cập và
phân tích hiệu suất website để tạo được câu chuyện về
dữ liệu.
Yêu cầu:
Chủ đề: Tập dữ liệu PetFinder chứa các thông tin của
các vật nuôi, gồm các thông tin như sau: Tên, tuổi,
giống, màu lông, ... Bạn được giao nhiệm vụ thiết kế
Data Warehouse để lưu trữ các dữ liệu đó.
Yêu cầu:
Thiết kế được ERD cho Data Warehouse dựa trên bộ
dữ liệu cho trước.
Xác định được tối thiểu 3 business queries (truy vấn
nghiệp vụ) để thực hiện phân tích dữ liệu.
Xây dựng được quy trình ETL trong SSIS.
Mô tả được quy trình ETL để đưa dữ liệu vào Data
Warehouse.
Đưa được dữ liệu vào Database.
Viết các câu lệnh SQL để xây dựng Database.
Viết các câu lệnh SQL để lấy dữ liệu cho các business
queries đã xác định.
4 Ứng dụng học Assigment 1: Tính toán và phân tích điểm thi (Test
máy trong phân Grade Calculator)
tích dữ liệu
Chủ đề: Trong bài assignment này, bạn cần viết một
chương trình để tính toán điểm thi cho nhiều lớp với sĩ
số hàng nghìn học sinh. Mục đích của chương trình giúp
giảm thời gian chấm điểm.
Mục tiêu: Bạn sẽ học cách viết một chương trình
Python tập trung vào lập trình cơ bản, sử dụng list,
function và xử lý với chuỗi. Hơn nữa, bạn sẽ biết cách
truy cập file để đọc dữ liệu và ghi kết quả thống kê
được.
Yêu cầu: Bài tập này cung cấp cho học viên một nguồn
dữ liệu thực tế. Các bạn sẽ thực hành sử dụng các hàm
khác nhau trong Python để giải quyết một bài toán cụ
thể.
Yêu cầu:
Học viên đọc kỹ nội dung kiến thức và làm theo
từng yêu cầu trong file jupyter-notebook
Học viên xem kỹ lại nội dung liên quan đến thuật
toán phân cụm trong giáo trình
9 Đội ngũ thiết kế xây dựng và phản biện, hướng dẫn chương trình
Đội ngũ Danh sách
Đội ngũ xây dựng ThS Nguyễn Thế Chinh: Viện công nghệ Hoàng Gia, Thụy Điển,
Chuyên viên nghiên cứu Machine Learning tại Coderschool