Professional Documents
Culture Documents
DATA ENGINEER
Quản trị điều hành ngày càng dựa trên phân Số lượng người dùng vẫn thế nhưng khi
tích dữ liệu. chạy report phức tạp hệ thống quá tải
Khi chuyển đổi số một thời gian, đủ tích lũy Các hệ thống báo cáo tổng hợp nhiều chiều
dữ liệu -> Cần khai thác dữ liệu. không làm được, hoặc không chính xác.
Dữ liệu có đủ nhưng mỗi lần cần 1 báo cáo
mất cả tuần.
TAI SAO LẠI ĐƯA NỘI DUNG DATA ENGINEER?
NỘI DUNG CHÍNH
2 Data Warehouse
Dữ liệu vệ tinh -> Dự báo thời tiết -> Quyết định đi chơi
Data -> Information
Data -> Information
DỮ LIỆU VÀ THÔNG TIN
Data Information
Dữ liệu có thể là ký tự, số, ảnh, từ, văn bản, có ý Thông tin là dữ liệu theo ngữ cảnh và có ý nghĩa
nghĩa hoặc vô nghĩa với con người kèm theo
Dữ liệu đứng một mình có thể là vô nghĩa Nhưng thông tin thì luôn luôn tự thân nó có
nghĩa
Dữ liệu dựa trên các bản ghi, quan sát,.. Thông tin dựa trên phân tích dữ liệu
Dữ liệu thường không được tổ chức và phụ Thông tin luôn phụ thuộc vào dữ liệu và có tổ
thuộc vào thông tin chức
DỮ LIỆU VÀ THÔNG TIN
OLTP VÀ OLAP
SO SÁNH DATA BASE VÀ DATA WAREHOUSE
Tham số Database Data warehouse
Mục đích Được thiết kế để lưu lại bản ghi Được thiết kế để phân tích
Xử lý Online Transactional Processing (OLTP) Online Analytical Processing (OLAP)
Chuẩn hóa Chuẩn hóa không được chuẩn hóa
Định hướng phục vụ định hướng cho ứng dụng, sản phẩm cho các loại mục đích khai thác dữ liệu nhau
giới hạn lưu trữ thường giới hạn trong 1 ứng dụng lưu trữ dữ liệu từ nhiều nguồn khác nhau
độ khả dụng dữ liệu có sẵn từ thời gian thực, cần là có được làm mới khi cần thiết từ nhiều nguồn
khác nhau, cần thì phải đợi hệ thống chạy tạo
lại dữ liệu định kì cần thiết
Loại truy vấn Các truy vấn giao dịch đơn giản được sử dụng. Các truy vấn phức tạp được sử dụng cho mục
đích phân tích.
Tóm tắt dữ liệu Lưu dữ liệu chi tiết Lưu trữ dữ liệu tóm tắt
MÔ HÌNH NGÔI SAO
MÔ HÌNH NGÔI SAO
XÂY DỰNG DATA WAREHOUSE
MÔ HÌNH NGÔI SAO
MÔ HÌNH NGÔI SAO
XÂY DỰNG DATA WAREHOUSE
MÔ HÌNH THIÊN HÀ (BÔNG TUYẾT)
MÔ HÌNH THIÊN HÀ (BÔNG TUYẾT)
Sử dụng tùy
theo vai trò & Kiến trúc DL tổng thể
thẩm quyền
Doanh nghiệp Cơ quan
Cổng Web
Data Marts
Kho Dữ Liệu
tổng hợp EDW Khai phá
Dữ liệu
Cập nhật
Metadata
Xử lý tạm
•Đơn vị nghiệp vụ đưa • Phân tích các hệ • Lưa chọn mô hình • Extract (Trích xuất)
yêu cầu nghiệp vụ thống OLTP liên ngôi sao hay bông •Load (Tải lên)
quan tuyết (thiên hà)
•Bộ phận BA phân tích •Transform (Chuyển
• Các hệ thống • Thiết kế các bảng
các thông tin nghiệp vụ, dimension, fact đổi)
yêu cầu tiện ích và OLTP có phải
phương pháp hiển thị chỉnh sửa không?.
Phát triển báo cáo và sử Lên kế hoạch thực thi Test trên hệ thống DEV Triển khai hệ thống
dụng cac công cụ BI ETL hoặc Stag Production