You are on page 1of 2

數位時代的淘金術─從大數據到人工智慧

陳昇瑋 研究員

Keywords: 大數據、深度學習

大數據(Big Data)又被稱為巨量資料,其概念其實就是過去 10 年廣泛用於企業內部


的資料分析、商業智慧(Business Intelligence)和統計應用之大成。但大數據現在不只是資
料處理工具,更是一種企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟
體技術進化和雲端環境成熟等種種客觀條件就位,方才讓資料分析從過去的洞悉歷史進化到
預測未來,甚至是破舊立新,開創從所未見的商業模式。
一般而言,大數據的定義是 Volume(容量)、Velocity(速度)和 Variety(多樣
性),但也有人另外加上 Veracity(真實性)和 Value(價值)兩個 V。但其實不論是幾 V,
大數據的資料特質和傳統資料最大的不同是,資料來源多元、種類繁多,大多是非結構化資
料,而且更新速度非常快,導致資料量大增。而要用大數據創造價值,不得不注意數據的真
實性。

深度學習只要三個步驟:建構網路、設定目標、開始學習。 簡單說,深度學習就是
一個函數集。類神經網路就是一堆函數的集合,我們丟進去一堆數值,整個網路就輸出一堆
數值,從這裡面找出一個最好的結果,也就是機器運算出來的最佳解,機器可以依此決定要
在棋盤上哪一點下手,人類也可以按照這個建議作決策。
假設有一個函數叫總統府,這個函數的內容是 x = 無能,那麼無論我們輸入的是小馬、
小英、地產大亨或前總統的妻子,最後的結果都 = 無能。
當然現實世界不會這麼簡單,總統府裡面高深莫測,就像深度學習的類神經網路一樣,我們
可以在這個函數裡加進各種變數,來模擬兩黨政治、全球暖化、恐怖攻擊等考量,經過一層
又一層的運算之後,最後從總統府輸出的,就是這個函數集建議的最佳決策。
但現實世界中,這個函數集更複雜,而且要等好幾年,才能看到結果。在程式設計裡,
我們不但可以很快看到結果,還可以告訴機器,這個結果 no good,請調整函數內容,給我
其他結果。這個過程,就是所謂的「學習」,經過大量的訓練過程,最終機器就能找到一個
最佳函數,得出最佳解。 以 AlphaGo 為例,團隊設定好神經網路架構後,便將大量的棋譜
資料輸入,讓 AlphaGo 學習下圍棋的方法,最後它就能判斷棋盤上的各種狀況,並根據對
手的落子做出回應。
圖[1] 圖解大數據。
資料來源

[1] https://www.bnext.com.tw/article/35807/BN-2015-03-31-151014-36

[2] https://panx.asia/archives/53209

You might also like