利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚. 背景 商品の量が多い 見つからな い orz ネットショップ.

Slides:



Advertisements
Similar presentations
画像処理・実習 第十四回:パターン認識 東海大学 情報理工学部 情報メディア学科 濱本和彦. 今回の内容 5. パターン認識 5.1 マッチングの原理 5.2 テンプレートマッチング 実習 相互相関とテンプレートマッチング.
Advertisements

協調フィルタリングに基づく ソフトウェア開発技術の推薦 ソフトウェアサイエンス研究会@信州大学 2005 年 6 月 23 日 奈良先端科学技術大学院大学 情報科学研究科 秋永 知宏,大杉 直樹,柿元 健,角田 雅照, 門田 暁人,松本 健一.
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
生体情報を利用したオンライン認証システムに関する研 究 情報工学科 大山・山口・小尾研究室 学士課程4年田中 丈登.
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
配偶者選択による グッピー (Poecilia reticulata) の カラーパターンの進化 :野外集団を用いた研究 生物多様性進化分野 A1BM3035 吉田 卓司.
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Fill-in LevelつきIC分解による 前処理について
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
パネル型クエリ生成インタフェース画像検索システムの改良
駒澤大学 経営学部 情報セキュリティ B 公開鍵暗号による 認証つきの秘匿通信 ―― 鍵に注目して ――
CCC DATAset における マルウェアの変遷
秘匿積集合プロトコルの 推薦システムへの応用
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
秘密のリンク構造を持つグラフのリンク解析
Scalable Collaborative Filtering Using Cluster-based Smoothing
データモデリング 推薦のための集合知プログラミング.
プライバシ協調フィルタリングにおける 利用者評価行列の次元削減
Extremal Combinatorics 14.1 ~ 14.2
AllReduce アルゴリズムによる QR 分解の精度について
中間発表用スライド 田中健太.
「まめだくん Ver.1.0」 特徴と利用方法.
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
Paper from PVLDB vol.7 (To appear in VLDB 2014)
コンピュータビジョン Computer Vision(CV) パワーポイント 抜粋
秘匿積集合プロトコルを利用した プライバシ協調フィルタリングの提案
PlanetLab における 効率的な近隣サーバ選択法
ネストした仮想化を用いた VMの安全な帯域外リモート管理
サーバ構成と運用 ここから私林がサーバ構成と運用について話します.
クラウドの内部攻撃者に対する安全なリモートVM監視機構
ガウス過程による回帰 Gaussian Process Regression GPR
プログラム実行履歴を用いたトランザクションファンクション抽出手法
静的情報と動的情報を用いた プログラムスライス計算法
Deep Learningを用いたタンパク質のコンタクト残基予測
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
ソフトウェア部品分類手法への コンポーネントランク法の応用
Linux リテラシ 2006 第5回 SSH と SCP CIS RAT.
2章 暗号技術 FM15002 友池 絲子.
コンポーネントランク法を用いたJavaクラス分類手法の提案
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
バイトコードを単位とするJavaスライスシステムの試作
様々な情報源(4章).
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
Intel SGXを用いた仮想マシンの 安全な監視機構
○ 後藤 祥1,吉田 則裕2 ,井岡 正和1 ,井上 克郎1 1大阪大学 2奈良先端科学技術大学院大学
1.目的 サプライチェーンにおいて重要なこと ・商品のコスト ・商品の充填率 需要が予測できれば、 充填率を下げずに在庫が減らせる 在庫
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Data Clustering: A Review
秘匿リストマッチングプロトコルとその応用
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
指紋がキーとなる金庫 “ Indexed Fuzzy Vault ” の開発
C9 石橋を叩いて渡るか? ~システムに対する信頼度評価~
プログラムスライスを用いた凝集度メトリクスに基づく 類似メソッド集約候補の順位付け手法
保守請負時を対象とした 労力見積のためのメトリクスの提案
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
2)L3D, Univ. of Colorado, Boulder
ベイズ音声合成における 事前分布とモデル構造の話者間共有
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
VMリダイレクト攻撃を防ぐための 安全なリモート管理機構
Q q 情報セキュリティ 第12回:2004年6月25日(金) の補足 q q.
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
C10:秘匿共通集合計算プロトコルを用いた 就職活動支援システム“JHT”
Webページタイプによるクラスタ リングを用いた検索支援システム
Presentation transcript:

利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚

背景 商品の量が多い 見つからな い orz ネットショップ

情報推薦システム 他の利用者の嗜好に 基づき,利用者の嗜好 を予測 利用者の嗜好に合う 商品を提示する amazon

Windows C MAC A A Windows C 従来方式の問題点と 提案方式 BAC S サーバ 従来方式 MAC A ? B Windows C B’ 嗜好情報 漏洩の可能性 提案方式 BAC ? B MAC B’ 漏洩しない 暗号化

精度 MAE コスト GB 1.秘匿 CF 方式 PCF ◎ 0.72 × 1024 2.アイテム クラスタリング CCF○ 0.75 △ 28 3.ユーザ サンプリング SCF △ 0.99 △ 36 4.最尤法 LL× 1.0 ◎ --- 5.秘匿積集合を 利用した方式 ○ 0.83 ◎ 0.8 精度 MAE コスト GB 1.秘匿 CF 方式 PCF ◎ 0.72 × 1024 2.アイテム クラスタリング CCF○ 0.75 △ 28 3.ユーザ サンプリング SCF △ 0.99 △ 36 4.最尤法 LL× 1.0 ◎ --- 5.秘匿積集合を 利用した方式 ○ 0.83 ◎ 0.8 提案方式

要素技術:一覧 協調フィルタリング方式 (CF 方式 )  嗜好の評価値を予測する  一般的な推薦システムに利用されている技 術 2 者間秘匿積集合プロトコル  お互いが評価したアイテムの数 s(u i,u j ) を得 る  お互いどのアイテムを評価しているか秘密 Oblivious Transfer( 紛失通信 ) 準同型性暗号

提案方式 1/3 2 者間秘匿積集合プロトコルを使用し、 s(a,*) の値をそれぞれ出す 閾値 T を決める、 T ≦ s(a,*) の式を満た すユーザの集合を B とする  今回は T=1 、 B={c,d} i1i1 i2i2 i3i3 i4i4 s(a,*) a * 25 b130 c231 d2152 i1i1 i2i2 i3i3 i4i4 a * 25 b130 c231 d2152

提案方式 2/3 -1 a i1i1 i2i2 i3i3 i4i4 a * 25 i1i1 i2i2 i3i3 i4i4 d dc i1i1 i2i2 i3i3 i4i4 c n out of 1 OT

提案方式 2/3 -2 a i1i1 i2i2 i3i3 i4i4 a * 25 i1i1 i2i2 i3i3 i4i4 d1101 dc i1i1 i2i2 i3i3 i4i4 c0011 n out of 1 OT

提案方式 3/3 i1i1 i2i2 i3i3 i4i4 類似度 s(a,*) 平均 a * c d * =a の平均+ d との類似度・ d の評価 類似度の総和 分子 = s(a,c)(r 1,c -r c )+s(a,d)(r 1,d -r d ) = 1( )+2(2-2.7) = -0.7 分母 = h 1,c s(a,c)+h 1,d s(a,d) = 0×1+1×2 = 2 * = a の平均 + 分子 / 分母 =3.5+(-0.7)/2 = 3.15 ・ 準同型性暗号では割り算は計算できない → 分子と分母を計算し,復号してから割り算を計算する

評価実験 公開データベース (Group Lens) を使用し MAE ・通信コスト・計算コストを調べる  100 個の評価値を未評価とみなし推薦値を求め MAE を調べる ユーザ数 943 人 アイテム数 1682 個 総評価数 暗号文のサイズ べき乗計算 100,000 個 256byte 1764(ms)

精度 Proposed SCF[3] 推薦者数

計算コスト 推薦者数 s 6.5 日 337s 5 分

通信コスト 推薦者数 104.3GB 0.8GB

結論 利用者のプライバシ情報を保護しなが ら協調フィルタリング方式を行った  5 つの方式を提案した 秘匿協調フィルタリング方式 CCF 方式 SCF 方式 LL 方式 秘匿積集合プロトコルを利用した方式

今後の課題 通信コスト・計算コストの削減 精度の向上

要素技術: 協調フィルタリング方式 (CF 方式 ) i1i1 i2i2 i3i3 i4i4 類似度 S 平均 a * b1302 c d * =a の平均+ b との類似度・ b の評価 +d との類似度・ d の評価 類似度の総和 = = 2.8 0(1-2)+0.96(2-2.7) アイテム

要素技術: 2 者間秘匿積集合プロトコル 復号 0 の数 =|A∩B|=1 A={2,3} B={1,2} ab

関連技術 ・準同型性暗号 ・ OT 準同型性暗号  暗号化したまま計算できる Oblivious Transfer ab B={1,2,3} 2 1・31・3

紛失通信 サーバ クライアン ト

通信コスト・計算コストまと め ※類似度 s(u i,u j ) が被推薦者に漏れる SCF( 従来 ) 提案方式 精度 ×○ 通信コスト ×○ 計算コスト ×○ 漏洩する情報 ○ × ※× ※

考察:類似度 1/2 従来方式 → コサイン尺度 提案方式 → 積集合の大きさ 提案方式の精度が なぜ向上したのか検討

考察:類似度 2/2 相関係数 =0.922 → 提案方式の類似度はユーザ間の 類似度を反映している コサイン尺度 交わりの大きさ

考察: 2 者間秘匿積集合プロトコル 2 者間秘匿積集合プロトコルのコスト  推薦者の評価値の数を秘匿する場合, 1 推薦者あたり n の計算コストが生じる ユーザ数 943 ,アイテム数 1682 だと 1 推薦者あたり 48 分計算コストが生じる  通信コストは (m-1)n ユーザ数 943 ,アイテム数 1682 だと 682GB 実験ではこれらのコストを除いている → セキュリティとコストのトレードオフ

提案方式 D

アプローチ 評価行列の次元削減 12345 A B C D E 135 A B C D E 12345 A C E CCF 方式 SCF 方式

323β 4 フィレ オ 24α カレー iPhone CCF 方式 第 3 次的な情報から アイテムをクラスタリ ング そのクラスタ中でのみ 秘匿 CF 方式を適用 何人かサンプリングす る コミュニティに分割す る 評価値を決め秘匿 CF 方 式を適用 21 クラス アイテム集合 I iPhone フィレ オ A5 * B51 C15 D5 SCF 方式 ユーザ集合 U αβ コミュニティ iPhone フィレ オ カレー α442 β323 A5 * 2

推薦システム:問題点 BAC S サーバ MAC A ? B Windows C B’ 嗜好情報漏洩の可能性 嗜好情報が漏洩せず 推薦結果を出したい

従来研究 Canny の方式 [1]  共役勾配法を用いて特異値分解を準同型性暗号 で行う 秘匿 CF 方式 [5]  準同型性暗号を用いて協調フィルタリングを行 う  欠損値を秘匿するために O(n 2 ) の通信コスト ユーザ数 943 人,アイテム数 1682 個で 1TB の通信コス ト 莫大な計算コスト・通信コスト

目的 秘匿積集合プロトコル [3] というアプロー チで、個人情報を秘匿したまま嗜好を予 測する 手法を提案する  計算コスト・通信コストを削減する