You are on page 1of 1

位置情報解析のためのプライバシ保護手法

川本 淳平(筑波大学) 佐久間 淳(筑波大学・科学技術振興機構)
背景
大量の位置情報データ解析
• いつ誰がどこを訪問したのかというデータ, モバイル端末のGPSなどから取得可能
• 頻出訪問地点セットの抽出 (よく訪問されている点の集合を探す)
• 主導線の発見(良く使われている経路はどこか?)
などが効率的かつ自動で取得可能と期待
• 渋滞や事故の早期発見
個々人のプライバシに配慮しつつ社会にとって有益な情報を取得することが求められている

プライバシを考慮した位置情報解析
位置情報データを解析機関に公開する場合のプライバシ
• 公開データから個人が特定できてはいけない
• k-匿名性の応用が考えられるが解析結果(頻出訪問地点集合)が不明瞭となる
提案手法
• 頻出では無い ( l 人以下しか訪れていない) 訪問地点を予め取り除く l-抑制 手法
孤立点に対しても
k-匿名を達成するため
曖昧化度合いが大きい

孤立点を抑制するので
効率的に匿名化できる

抑制を導入後の匿名化

2次元データにおける k 匿名性の問題点

評価実験
2km

実験に用いたデータ
• 人の流れデータ (http://pflow.csis.u-tokyo.ac.jp/index-j.html) 2km
• 人々の動きが活発な通勤時間 (6am-8am)
• 首都圏南西部から 1 万人をランダムに抽出

データの形式と事前処理

この中に含まれる点を
代表点(中心点)に置き換える
緯度・経度のグリッド変換

• 元データは(日時,緯度,経度)の三つ組みでプライバシ保護のためユーザ識別子は取り除いた
• 緯度・経度は 2km×2km のグリッドに変換

未匿名化

2 匿名を保証

1 抑制 2 匿名を保証

10 抑制 10 匿名を保証

• 頻出訪問地点集合の発見には宇野らの LCM (http://research.nii.ac.jp/~uno/codes-j.htm) を使用し最小サポートは 300人とした.
• 図中の点の色は同じグループに属していることを示す(つまり {東京,渋谷,原宿} が頻出であれば同色の点となる).