Professional Documents
Culture Documents
資料探勘介紹
高中資訊先修課程
目錄
2
3-1. 資料庫知識發現 (KDD) 步驟
( 圖片來源: Fayyad, U., Piatesky-Shapiro, G. & Smyth , P. (1996). The KDD process for extracting useful knowledge
from volumes of Data. Communications of the ACM, 39(11), 27-34. ) 3
3-1. 資料庫知識發現 (KDD) 步驟
❏ 資料預處理
➔ 資料清理、整合、轉換
❏ 資料探勘
➔選擇模型、訓練模型
❏ 評估驗證
4
3-1. 資料庫知識發現 (KDD) 步驟
❏ 資料預處理
➔ 資料整合、清理、轉換
❏ 資料探勘
➔選擇模型、訓練模型
❏ 評估驗證
( 圖片來源: http://203.71.151.9/~luti/105data-comnine.htm )
5
資料預處理
6
資料預處理
7
資料預處理
8
資料預處理
9
資料預處理
10
( 圖片來源: http://www.simulkade.com/posts/2015-05-07-how-to-smoothen-noisy-
資料預處理
11
資料預處理
12
資料預處理
13
3-1. 資料庫知識發現 (KDD) 步驟
❏ 資料預處理
➔ 資料清理、整合、轉換
❏ 資料探勘
➔選擇模型、訓練模型
❏ 評估驗證
14
資料探勘
❏ 選擇模型
➔ 迴歸方法 (Regression)
➔ 分類方法 (Classification)
➔ 聚類方法 (Clustering) 迴歸方法 -
線性迴歸
(linear
regression)
15
( 圖片來源: https://kknews.cc/zh-tw/tech/p5x8ygz.html )
資料探勘
❏ 選擇模型
➔ 迴歸方法 (Regression)
➔ 分類方法 (Classification)
➔ 聚類方法 (Clustering)
分類方法 -
支持向量機
(SVM)
16
( 圖片來源: https://kknews.cc/zh-tw/tech/p5x8ygz.html )
資料探勘
❏ 選擇模型
➔ 迴歸方法 (Regression)
➔ 分類方法 (Classification)
聚類方法 -
➔ 聚類方法 (Clustering)
K 均值聚類
(K-means)
17
( 圖片來源: https://kknews.cc/zh-tw/tech/p5x8ygz.html )
資料探勘
❏ 訓練模型
➔使用訓練資料集 (Traning Set) 和驗證資料集 (Validation Set) 來訓
練模型。
( 圖片來源: https://notesforai.blogspot.com/2018/05/blog-post.html)
18
評估驗證
20
3-2. 資料探勘定義與功能
顧客平均每月消費總金額是多少? 哪些顧客下個月的消費有可能會超過一萬元?
昨日有多少顧客沒有瀏覽網頁商品? 未來一週多少客戶可能瀏覽網頁商品?
去年的銷售業績統計報表 明天預期之銷售業績額度
22
3-3. 常見的資料探勘分析方法
23
決策樹 (Decision Tree)
決策樹是一種過程單純、執行效率也較高的模型,適用於分類和回歸資料
類型的預行。
24
( 圖片來源: https://chtseng.wordpress.com/2017/02/10/ 決策樹 -decision-trees/)
決策樹 (Decision Tree)
可透過計算每種分割方法的分數,來決定決策樹的架構。
25
( 圖片來源: https://chtseng.wordpress.com/2017/02/10/ 決策樹 -decision-trees/)
邏輯回歸 (Logistic Regression)
❏ 邏輯回歸可以判定資料邊界,對不同類別的數據做分割
26
邏輯回歸 (Logistic Regression)
( 圖片來源: https://kknews.cc/health/4ovvxx2.html)
27
類神經網路 (Neural Network)
神經網路技術是指用電腦來模仿生物的神經網路,並經過不斷學習,讓機
器能夠像人類一樣擁有推導能力。
( 圖片來源: https://dotblogs.com.tw/allanyiin/2016/03/12/222215
http://hn28082251.blogspot.com/2018/07/artificial-neural-network.html) 28
類神經網路 (Neural Network)
( 圖片來源: https://kknews.cc/zh-tw/tech/8g9lk44.html)
30
類神經網路 (Neural Network)
❏ 卷積 (Convolution)
( 圖片來源: https://colah.github.io/posts/2015-08-Understanding-LSTMs/)
33
[ 補充資料 ] 資料探勘的應用實例
❏ 美國著名超級市場 Wal-Mart
❏美國超大型量販店 Target
( 圖片來源: https://localrecordsoffice.co/target-hiring-10000-workers-across-u-s/)
35
[ 補充資料 ] 資料探勘的應用實例
( 圖片來源: http://insankutuphanesi.com/)
36
3-4. 問題討論
❏ 探討資料探勘技術差別
➔(1) 不同資料探勘分析方法能了解資料的何種特性?
➔(2) 資料探勘技術與資料視覺化的比較
37