Professional Documents
Culture Documents
別組的書面報告3
別組的書面報告3
現金在過去的非法交易中有著極重要的地位,隨著加密貨幣的興起,這種支付工具結合
現金的「匿名」特質和電子支付的「便利」特性,也常常使其被牽扯在非法活動之中,極有
可能改變黑市的運作模式,對社會造成極大的影響,因此在學術研究上,加密貨幣究竟對黑
市造成多大的影響一直都是很值得探討的問題。
這篇論文的主旨是希望能量化且找出這些非法使用者的特性,作者設計了一套新的方法
流程,藉由比特幣的交易特性、政府監管機關過去對非法活動的逮捕紀錄等,對加密貨幣和
非法活動之間的關係有了更清晰的刻畫。例如過去 FBI 曾經從 Silk Road 這個黑市交易平台沒
收超過 400 萬的比特幣,從這些被沒收的比特幣為起點,本篇論文發展了兩個識別比特幣非
法活動的方法,其一是利用非法使用者彼此之間會頻繁交易的行為做為區隔,其二是定義這
些非法使用者常會有的交易特性來進行分群,例如他們傾向對於自己的身份更為保密。
研究結果發現有將近四分之一的使用者涉及非法交易,在總交易筆數中甚至佔了將近一
半以上;而從 2016 年起,雖然絕對金額仍持續上升,但比特幣非法活動相對佔全部的比例下
降,主因有二,首先是由於比特幣愈來愈普及,大量合法使用者的出現使得非法活動的比例
被稀釋;另外也因為有其他更不透明、更易隱藏個人資訊的加密貨幣被發明,部分非法使用
者因而改變交易的貨幣種類。
和合法使用者相比,比特幣的非法使用者傾向交易更多次,但一次的金額較小,且傾向
重複地與同一人交易,這是因為對於非法使用者來說比特幣為交易功能,而合法使用者通常
只用來投資或投機,所以非法使用者也會想辦法持有較少的比特幣避免被抓到。
二、資料數據處理與分析
資料處理
第一步:蒐集資料
作者使用的研究數據,從比特幣的創世區塊(genesis block)被產生的發生日期 2009/01/03
到 2017/04/31,將所有比特幣區塊鏈上公開的交易紀錄(包含交易 ID、交易金額、手續費、收
錢/寄錢地址、時間戳記、區塊標號等)記錄下來。
第二步:資料轉換
作者接著透過 Union-Find 演算法,將原始資料(只記錄交易地址資訊)轉換成使用者資料
(紀錄使用者掌控哪些交易地址)。文章中對於這個演算法提出一個簡單的例子:如果使用者在
某交易上同時使用了地址 A 與地址 B、又在另一筆交易上同時使用了地址 B 與地址 C,根據
遞移律,地址 A、地址 B、地址 C 背後的使用者應該為同一個人。
然而,此方法有天生的缺陷:會高估比特幣使用者的數量。在很多情況下,使用者可能
會使用完全不同系列且無交集的地址,使用此演算法會將這些無交集的地址判定為不同使用
者,因此,在計算相關統計量時(如每位使用者的交易量),會有偏誤的情形,但在某些統計量
(如非法使用者與合法使用者的比值)就較不會有這種問題。
第三步:資料過濾
原始資料中,一個交易紀錄可能同時包含多個比特幣接收者,作者將這些資料分割成一
列一列、單一買家對單一賣家的交易,得到 8.15 億條交易。接著移除交易費、區塊獎勵、幣
別交換……等等與買賣行為無關的交易紀錄,另外,價值小於 1 美金的交易,因為很可能只
是作為傳遞訊息、測試訊息、給予小費等用途,所以也從中剔除,經過這些過濾,作者一共
得到 3.03 億條交易紀錄。然而,一條交易紀錄包含著給錢的與收錢的使用者,作者將交易紀
錄再分為兩條交易,因此研究數據中共有 6.06 億條交易紀錄。
資料樣本
根據前面的資料處理方式,資料樣本中一共有 6.06 億條交易紀錄與 1.06 億位交易者。
1. 被執法機關查封的比特幣地址:
執法機關有時會將沒收的比特幣拿出來拍賣,由於交易紀錄是公開的,因此可以由此追
溯判定此前的哪些地址與交易紀錄和非法交易有關,透過此法共識別出1016個非法使用
者。
2. 與暗網有交易紀錄的比特幣地址:
暗網上的「熱錢包」(非法交易者可以存入或提出比特幣的地址),接著假設所有在暗網的
交易都是違法的,所以與這些「熱錢包」有交易紀錄的地址都是非法使用者,透過此法
共識別出六百萬個非法使用者。
3. 在暗網上的論壇發現與交易有關的比特幣地址:
暗網上的論壇時常有人在交易時秀出比特幣地址,除了增加自己的可信度並可告訴對方
應將比特幣傳至哪個地址才可順利完成交易,這些地址有時會與前兩種方法重疊,排除
重複的地址後,作者又找到448個額外的非法使用者。
非法使用者樣本
根據上面提及的方式,將三種方式找到的非法使用者進行分類,整理成以下的表格。我們可
以發現到非法使用者中,暗網使用者(Black market user)佔比較大、查封的使用者(Seized user)
與論壇使用者(Forum user)相對少很多,但查封的使用者(Seized user)與論壇使用者(Forum
user)在交易量上卻有不小的佔比。
此樣本優點:有考慮不同特徵的非法交易(多樣化)
此樣本缺點:沒考慮除了暗網交易相關的非法交易。(如:洗錢、比特幣小偷、勒索)
四、識別非法交易
SLM 和 DCE 模型
根據前述的方法我們已知道實證上存在有大量的非法交易者使用比特幣,接下來我們根據兩
種方法來區分使用者的合法性:
第一步:將識別到的非法使用者歸為同一非法群體,剩下的歸為合法群體
第二步:對於每一個使用者去判斷相對於另一個群體,他是否與自己所分配到的群體內
部使用者交易頻繁,若有則留在該群組,無則將該使用者換到另一群組
第三步:重複第二步驟直至所有的使用者不再更換所在的群體
在反覆的操作下,原始識別到的非法使用者不一定會繼續待在非法群體,因為他有可能
大部分的交易行為是合法的,但被有關當局查獲其非法活動,因此在第二步中會將此人
歸類到合法群體。
2. Detection-controlled estimation
第二種方法主要根據合法和非法使用者的不同特質來辨別,該方法為兩階段的 DCE 模型
DCE 模型中各項變數與非法交易機率關係為:
Darknet sites: 與非法交易機率呈正向關係,活躍暗網數量愈多,非法交易愈多
Tumbling: 與非法交易機率呈正向關係。愈隱藏身分愈可能是非法交易者
Darknet shock volume: 與非法交易機率呈正向關係。突發事件發生後,非法交易者傾
向迅速將比特幣移出被抓的暗網
Bitcoin market cap/ Bitcoin hype:與非法交易機率呈反向關係。比特幣愈受歡迎非法交易
者更不喜歡用比特幣進行交易
Pre-Silk-Road user: 啞變量,Silk-Road 被關前有交易紀錄的為”1”,與非法交易機率呈正
向關係。在 Silk-Road 被禁後還繼續使用比特幣的較可能是合法使用者
Shadow coins: 與非法交易機率呈正向關係。若非法交易者較喜愛用這些加密貨幣,導
致其市值高,那還用比特幣的交易者應是合法使用者
非法使用者的交易特徵
接下來我們針對非法和合法使用者的特徵來進行評估,分為單變量和多變量兩種方式:
1. 單變量分析
觀察”Observed” ,”SLM”, “DCE”三種分法下,合法和非法使用者上述變數的差異,而發現到
三種分法皆得到相同的結果:
非法使用者傾向交易更頻繁且金額較小(非法使用者多用於買賣商品,而一般使用者
則以投機和投資為主)
非法使用者傾向持有較少的比特幣(持有的機會成本和被查獲的風險)
非法使用者有更多的交易對象(反映大的交易量和高度集中的交易對象)
非法使用者在暗網市場活絡時更加活躍
2. 多變量分析
綜合單變量的變數利用 DCE model 去進行多變量的測試,同樣有兩個階段,分別檢測是
否為 illegal 和是否被偵查到,我們可以發現到結論與單變量分析完全一致。
有多少非法交易使用比特幣?
從 SLM 和 DCE 分別得出比特幣被用於非法交易的比率後,下表從使用者數量、交易筆數、持
有金額、帳戶數量、總金額呈現估計的合法與非法交易規模:
基於此結果我們得出以下兩點結論:
1. 非法交易佔比遠比可直接觀察到的高許多。
2. 本文發展的 SLM 與 DCF 兩種估計方法雖然依靠的假設和資訊相當不同,但結果非常相
似,因此可理解為兩者相互證明為可靠的估計方法。
不同時期的非法交易
本章節討論使用比特幣進行非法交易數量隨時間的變化。下圖呈現 2009 年到 2017 年比特幣
合法和非法交易使用者相對數量:
非法交易者的網絡特徵
六、結論
加密貨幣和區塊鍊的興起可以改變金融市場的許多面向,但同時也存在一些缺點,本文
發現比特幣有關的非法活動佔整體很可觀的比例。由於比特幣對於非法使用者來說是支付功
能而非投資,和合法使用者相比,這些非法使用者傾向交易更多次,但一次的金額較小,且
傾向重複地與同一人交易,並持有相對少的比特幣避免被抓到,此外,他們也會使用一些相
關的工具去掩蓋他們的交易紀錄。最後,隨著加密貨幣的興起,更多合法使用者也持有比特
幣,加上其他種加密貨幣的出現及暗網數量的減少,使得比特幣的非法使用者比例下降,但
總金額仍是持續增長。