You are on page 1of 14

Mô hình dự đoán

Trịnh Thành
thanh.trinh@phenikaa-uni@edu.vn
Faculty of computer science
Phenikaa university
Nội dung
Dự đoán là gì
Mô hình dự đoán
Các thuật toán áp dụng trong mô hình dự báo
Học có giám sát
Học không có giám sát
Mô hình có tham số
Mô hình không có tham số.
Dự đoán là gì?
• Phân tích dự báo (predictive analytics) đang là một hướng
quan trọng trong lĩnh vực khai phá dữ liệu, nhất là khai phá dữ
liệu lớn.
Áp dụng rất rộng rãi trong các ngành bán hàng: Ví dụ Amazon, shopee
Mô hình dự đoán
• Mô hình dự đoán (Prediction Modeling): Là một kỹ thuật/thuật toán phân
tích dữ liệu đã biết để dự đoán những hành động/hành vi/ kết quả (tương ứng
với dữ liệu) trong tương lai.
Training set
Thuật toán dự
Dữ liệu đã biết Mô hình dự báo
báo

Testing set
Dữ liệu mới Mô hình dự báo Các dự báo

• Các giải pháp mô hình dự đoán là một dạng công nghệ khai thác dữ
liệu hoạt động (data mining) bằng cách phân tích dữ liệu lịch sử và
hiện tại, đồng thời tạo ra một mô hình để giúp dự đoán kết quả trong
tương lai.
Mô hình học máy
Tất cả các mô hình học máy đều có thể xem là các mô
hình dự đoán:

- Các mô hình học máy cổ điển: Unsupervised learning và


supervised learning.
- Mô hình ensemble: Random forest; bagging; boosting
- Reinforcement leaning: Monte Carlo Tree Search
(MCTS) : alpha GO (2016)
- Neural networks và Deep learning
Mô hình dự đoán:
• Mô hình dự báo trong lĩnh vực Học máy và khai thác dữ liệu (data
mining) thường được chia làm 2 loại.
• Học có giám sát (Supervised learning)
• Học không giám sát (Unsupervised learning)
Humans Trailer - YouTube

https://www.youtube.com/watch?v=BV8qFeZxZPE
Khái niệm về học giám sát (supervised learning)
• Vậy chúng ta có thể hiểu: Học có giám sát cần phải cung cấp cho máy tính một tập dữ liệu mẫu (Bao gồm các
câu hỏi, đáp án). Sau đấy các thuật toán (học có giám sát) sẽ học và tìm ra quy luật để tìm ra các đáp án cho
các câu hỏi mới.

• Ví dụ: 4 Đặc tính: VỎ, MÀU, VỊ, Cấu trúc:


• Vỏ sần sùi, màu vàng, ngọt, có múi - đáp án: Quả cam
• Vỏ trơn, màu đỏ, ngọt chua, không có múi - đáp án: Quả táo.

Quả cam

Quả táo
Thuật toán Học
có giám sát

Vỏ sần sùi, màu


vàng, ngọt, có múi

Dữ liệu mới Mô hình dự đoán


• 4 Đặc tính: VỎ, MÀU, VỊ, Cấu trúc:

• Vỏ nhăn, màu vàng, vị đắng, có múi.→


• Vỏ trơn, màu xanh, vị ngọt, không có múi. →
Vỏ sần sùi, màu
vàng, ngọt, có múi

Dữ liệu mới Mô hình dự đoán

• Học có giám sát là thuật toán dự đoán đầu ra/kết quả (label)
của một dữ liệu mới (new data) dựa trên dữ liệu đã biết
trước đó (existed data, label). Học có giám sát rất thông dụng
trong các thuật toán về Machine learning hay AI.

• Có thể xem X ={Các thuộc tính}; Y ={nhãn tương ứng}


Học không giám sát (Unsupervised learning)
Ta có một tập dữ liệu
không gắn nhãn, tìm
quan hệ ẩn trong dữ
liệu. Nhóm 1

Nhóm 2

Thuật toán
học không Nhóm 3
giám sát
Màu xanh lá cây, có 4 cạnh, có 4 góc.

Sẽ thuộc
nhóm
Dữ liệu nào ???
mới Mô hình dự đoán
Học không giám sát
• Học không giám sát là một lớp mô hình học sử dụng một thuật toán để mô tả hoặc
trích xuất ra các mối quan hệ tiềm ẩn trong dữ liệu. Khác với học có giám sát, học
không giám sát chỉ thực thi trên dữ liệu đầu vào không cần các thuộc tính nhãn, hoặc
mục tiêu của việc học. Tức là không hề được cung cấp trước một kiến thức nào trước
trừ dữ liệu. Các dữ liệu không được “hướng dẫn” trước như trong trường hợp học có
giám sát. Các thuật toán cần học được từ dữ liệu mà không hề có bất cứ sự hướng
dẫn nào.

• Trong thuật toán này, chúng ta không biết được outcome hay nhãn mà chỉ có dữ liệu
đầu vào. Thuật toán unsupervised learning sẽ dựa vào cấu trúc của dữ liệu để thực
hiện một công việc nào đó.

• Một cách toán học, Học không giám sát là chúng ta chỉ có dữ liệu X mà không có
nhãn Y tương ứng.

You might also like