プライバシ協調フィルタリングにおける 利用者評価行列の次元削減

Slides:



Advertisements
Similar presentations
協調フィルタリングに基づく ソフトウェア開発技術の推薦 ソフトウェアサイエンス研究会@信州大学 2005 年 6 月 23 日 奈良先端科学技術大学院大学 情報科学研究科 秋永 知宏,大杉 直樹,柿元 健,角田 雅照, 門田 暁人,松本 健一.
Advertisements

HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚. 背景 商品の量が多い 見つからな い orz ネットショップ.
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
電子透かしにおける マスキング効果の主観評価
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
「わかりやすいパターン認識」 第1章:パターン認識とは
駒澤大学 経営学部 情報セキュリティ B 公開鍵暗号による 認証つきの秘匿通信 ―― 鍵に注目して ――
セキュアネットワーク符号化構成法に関する研究
情報工学科 06A2055 平塚 翔太 Hiratsuka Shota
CCC DATAset における マルウェアの変遷
秘匿積集合プロトコルの 推薦システムへの応用
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
Scalable Collaborative Filtering Using Cluster-based Smoothing
データモデリング 推薦のための集合知プログラミング.
中間発表用スライド 田中健太.
「まめだくん Ver.1.0」 特徴と利用方法.
回帰分析.
センサノード 時刻同期と位置測定 浅川 和久 2008/11/16 センサノード 時刻同期と位置測定.
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
秘匿積集合プロトコルを利用した プライバシ協調フィルタリングの提案
PlanetLab における 効率的な近隣サーバ選択法
実時間動画像マルチキャストのための フィルタリング手法の実装と評価
ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装
クラウドの内部攻撃者に対する安全なリモートVM監視機構
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
第10回 情報セキュリティ 伊藤 高廣 計算機リテラシーM 第10回 情報セキュリティ 伊藤 高廣
ソースコードの変更履歴における メトリクス値の変化を用いた ソフトウェアの特性分析
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
Mathematicaによる固有値計算の高速化 ~ Eigenvalue calculation speed by Mathematica ~ 情報工学科 06A2055 平塚 翔太.
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
クラウドにおけるVMリダイレクト攻撃を防ぐためのリモート管理機構
DNSクエリーパターンを用いたOSの推定
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
不完全な定点観測から 真の不正ホストの分布が分かるか?
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
Data Clustering: A Review
秘匿リストマッチングプロトコルとその応用
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
指紋がキーとなる金庫 “ Indexed Fuzzy Vault ” の開発
C9 石橋を叩いて渡るか? ~システムに対する信頼度評価~
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
仮想マシンに対する 高いサービス可用性を実現する パケットフィルタリング
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
VMリダイレクト攻撃を防ぐための 安全なリモート管理機構
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
C10:秘匿共通集合計算プロトコルを用いた 就職活動支援システム“JHT”
ネット時代のセキュリティ3(暗号化) 2SK 情報機器工学.
Webページタイプによるクラスタ リングを用いた検索支援システム
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
Mathematicaによる固有値計算の高速化 Eigenvalue calculation speed by Mathematica
データの改竄を防ぐ仕組み 2002/9/12 牧之内研究室「インターネット実習」Webページ
マルチエージェントシステムにおける 通信コストの構造依存性に関する解析
AAMと回帰分析による視線、顔方向同時推定
ランダムプロジェクションを用いた音響モデルの線形変換
Presentation transcript:

プライバシ協調フィルタリングにおける 利用者評価行列の次元削減 ○木澤 寛厚, 菊池 浩明(東海大)

背景 ネットショップ 商品が多すぎ 見つからないorz

情報推薦システム 他の利用者の嗜好に基づき,利用者の嗜好を予想 利用者の嗜好に合う商品を提示する amazon http://www.amazon.co.jp/ amazon 他の利用者の嗜好に基づき,利用者の嗜好を予想 利用者の嗜好に合う商品を提示する

従来方式と提案方式の違い S 漏洩しない 漏洩 B’ B’ A A C C B A B C A C B A B C MAC MAC ? ? サーバ MAC S 漏洩しない 漏洩 暗号化 MAC A MAC A Windows C Windows C ? B MAC A ? B Windows C A C B A B C

提案方式 精度 MAE コスト GB 1.秘匿CF方式 PCF ◎ 0.72 × 1024 2.アイテム   クラスタリング CCF ○   0.75  ○  28 3.ユーザ   サンプリング SCF △   0.99  ○  36 4.最尤法 LL ×   1.0  ◎  --- 精度 MAE コスト GB 1.秘匿CF方式 PCF ◎   0.72  ×  1024 2.アイテム   クラスタリング CCF ○   0.75  ○  28 3.ユーザ   サンプリング SCF △   0.99  ○  36 4.最尤法 LL ×   1.0  ◎  ---

協調フィルタリング(CF方式) A 5 * 2 3.5 B 1 3 0.97 C 0.35 D 1.0 iPhone フィレオフィッシュ カレー 類似度S 平均 A 5 * 2 3.5 B 1 3 0.97 C 0.35 D 1.0 Bとの類似度・Bの評価+Cとの類似度・Cの評価 *=Aの平均+ 類似度の総和 0.97(1-3)+0.35(5-3) =3.5 +               = 2.6 0.97+0.35

提案方式:秘匿CF方式 準同型性暗号でCF方式を計算する 準同型性暗号でCF方式を計算する 評価値の正規化 欠損値をマスクするフラグ コサイン尺度を和と積で実現するために      評価値を距離で割る 欠損値をマスクするフラグ 予測値のアイテムを評価していないユーザは  推薦に利用しない 評価値の積の予備計算 準同型性暗号でCF方式を計算する 評価値の正規化 コサイン尺度を和と積で実現するために      評価値を距離で割る 欠損値をマスクするフラグ 予測値のアイテムを評価していないユーザは  推薦に利用しない 評価値の積の予備計算

秘匿CF方式 -予備計算 1024GB =(a1b1+a2b2+a3b3)(b2-b) Bとの類似度・Bの評価 = S(A,B)・(b2-b) =(a1b1+a2b2+a3b3)(b2-b) =(a1b1b2+a2b2b2+a3b3b2)-(a1b1b+a2b2b+a3b3b) Bとの類似度・Bの評価 = S(A,B)・(b2-b) =(a1b1+a2b2+a3b3)(b2-b) =(a1b1b2+a2b2b2+a3b3b2)-(a1b1b+a2b2b+a3b3b) 被推薦者 B A 1024GB 暗号文 m(m+1)/2個

アプローチ CCF方式 1 3 5 A B C D E 評価行列の次元削減 1 2 3 4 5 A B C D E SCF方式 1 2 3

CCF方式 SCF方式 2 1 α β 第3次的な情報から アイテムをクラスタリング そのクラスタ中でのみ 秘匿CF方式を適用 アイテム集合I 2 1 クラス 第3次的な情報から   アイテムをクラスタリング そのクラスタ中でのみ  秘匿CF方式を適用 何人かサンプリングする コミュニティに分割する 評価値を決め秘匿CF方式を適用 iPhone フィレオ A 5 * B 1 C D SCF方式 ユーザ集合U α β コミュニティ コミュニティ iPhone フィレオ カレー α 4 2 β 3 A 5 * 3 2 β 4 フィレオ α カレー iPhone

評価実験 公開データベース(Group Lens)を使用し MAE・通信コスト・計算コストを調べる CCF方式はクラスタ数,SCF方式はコミュニティ数を 変動させMAE・通信コスト・計算コストを調べる 暗号文のサイズを256byteとして通信コストを導出する べき乗計算を1764(ms)として計算コストを導出する ユーザ数 943人 アイテム数 1682個 総評価数 100,000個

CCF方式 MAE クラスタ数1~19 MAE

CCF方式 通信コスト・計算コスト 2967秒 1024GB 156秒 3GB

結論 課題 プライバシを秘匿した秘匿CF方式を提案 通信コストを減少させるための3つの改良案を提案 各方式を実用可能なコストまで下げる CCF方式 SCF方式 (LL方式) 各方式を実用可能なコストまで下げる 課題

ご清聴ありがとうございました

関連技術 - 準同型性暗号 暗号化したまま計算できる E 割り算は行えない

関連技術 – 協調フィルタリング方式(CF法) 評価値 高10 9 8 7 6 5 4 3 2 1低 X=9? itemA itemB itemC itemD itemE itemF user1 8 5 4 9 7 user2 X

協調フィルタリング(評価値計算) ユーザ集合 U={u1,u2,…,um} アイテム集合 I={i1,i2,…,in} ・Uk = i ∈ U|ri,k = φ(未評価のアイテムの評価) ・s(ui,uj) = uiとujの類似度(コサイン尺度) ・  = uiの評価した評価値の平均

コサイン尺度(類似度) ・ユーザaとユーザbの類似度を求める ユーザaの各アイテムに対する評価値A={a1,a2,…an}   ユーザbの各アイテムに対する評価値B={b1,b2,…bn} これらを準同型性暗号で行う

秘匿CF方式 (分母) 2-2 A 「フィレオ」の予測値を 得るためには 「Flag フィレオ」の値を使って 分母を計算する ユーザB 暗号文 iPhone フィレオ カレー Flag iPhone 5 1 3 Flag フィレオ Flag カレー iPhone フィレオ カレー A 5 ? 2 B 1 3 C D ユーザC iPhone フィレオ カレー Flag iPhone 1 5 3 Flag フィレオ Flag カレー 「フィレオ」の予測値を 得るためには 「Flag フィレオ」の値を使って 分母を計算する ユーザD iPhone フィレオ カレー Flag iPhone 5 2 Flag フィレオ Flag カレー

秘匿CF方式(コサイン尺度) B A カレー フィレオ iPhone 暗号化して 行う場合

SCF方式 MAE number of communities d

SCF方式 通信コスト number of communities d

協調フィルタリング方式 D B C A iPhone カレー A 1 ? 2 B 5 3 C D ?の値を計算 サーバ 推薦依頼 値を返す フィレオフィッシュ カレー A 1 ? 2 B 5 3 C D ?の値を計算 サーバ D 推薦依頼 値を返す B C A

協調フィルタリング方式(類似度) 類似度計算 s(A,B) iPhone フィレオフィッシュ カレー A a1 a2 a3 B b1 b2 b3 C c1 c2 c3 D d1 d2 d3 iPhone フィレオフィッシュ カレー A 5 ? 2 B 1 3 C D サーバ 類似度計算 s(A,B) (5*5+0*1+2*3)/{√(52+02+22)*√(52+12+32)}=0.97

協調フィルタリング(予測値計算) pa,2=3.5+{0.97(1-3)+0.35(5-3)}/(0.97+0.35) =2.6 iPhone フィレオフィッシュ カレー A 5 ? 2 B 1 3 C D pa,2=3.5+{0.97(1-3)+0.35(5-3)}/(0.97+0.35) =2.6 サーバ これらの計算を 準同型性暗号で計算する

提案方式:秘匿CF方式 A D C B iPhone カレー A 5 ? 2 iPhone カレー A 5 ? 2 B 1 3 C D 暗号化したまま ?を計算し 復号する iPhone フィレオフィッシュ カレー A 5 ? 2 iPhone フィレオフィッシュ カレー A 5 ? 2 B 1 3 C D A 暗号化した 評価値を 送信 推薦依頼 D C B

秘匿CF方式 – 手順 A 被推薦者は分子と分母をそれぞれ計算 (暗号化したまま) 分子と分母の値をそれぞれ復号 被推薦者は分子と分母をそれぞれ計算   (暗号化したまま) 分子と分母の値をそれぞれ復号 閾値復号する                      (鍵はm人のユーザで分散しているとする) 分子と分母の値を割り平均を足す      

秘匿CF方式(分母) ポイント 1.コサイン尺度には割り算があるのでそのままでは準同型性暗号の適用は不可能. 2.予測値を得たいアイテムを評価していないユーザの類似度は加算しない iPhone フィレオ カレー A 5 ? 2 B 1 3 C D iPhone フィレオ カレー A 5 ? 2 B 1 3 C D コサイン尺度

秘匿CF方式 (分母) 1-1 コサイン尺度を準同型性暗号で計算 できるように和と積だけにする B コサイン尺度を準同型性暗号で計算  できるように和と積だけにする 各ユーザが評価値をあらかじめノルムで割っておく(単位ベクトルにする) a3 a2 a1 A b3 b2 b1 B |u| カレー フィレオ iPhone B A カレー フィレオ iPhone 評価値とする

秘匿CF方式 (分母) 1-2 A B A カレー フィレオ iPhone 暗号化して 行う場合

秘匿CF方式 (分母) 2-1 0か1のフラグを用意して未評価を判断 B C D 一つ一つ暗号化して,全て被推薦者Aに送信する ※実際はノルムを割る iPhone フィレオ カレー D 5 2 iPhone フィレオ カレー Flag iPhone 5 2 Flag フィレオ Flag カレー 一つ一つ暗号化して,全て被推薦者Aに送信する

秘匿CF方式 (分母) 2-2 A 「フィレオ」の予測値を 得るためには 「Flag フィレオ」の値を使って 分母を計算する ユーザB 暗号文 iPhone フィレオ カレー Flag iPhone 5 1 3 Flag フィレオ Flag カレー iPhone フィレオ カレー A 5 ? 2 B 1 3 C D ユーザC iPhone フィレオ カレー Flag iPhone 1 5 3 Flag フィレオ Flag カレー 「フィレオ」の予測値を 得るためには 「Flag フィレオ」の値を使って 分母を計算する ユーザD iPhone フィレオ カレー Flag iPhone 5 2 Flag フィレオ Flag カレー

秘匿CF方式 (分母) 2-3 A フィレオを評価していないユーザDの類似度が0になるため足されたことにならない ユーザB フィレオを評価していないユーザDの類似度が0になるため足されたことにならない iPhone フィレオ カレー A 5 ? 2 B 1 3 C D iPhone フィレオ カレー Flag フィレオ 5 1 3 ユーザC iPhone フィレオ カレー Flag フィレオ 1 5 3 ユーザD iPhone フィレオ カレー Flag フィレオ 分母=S(A,B)+S(A,C)+S(A,D)=0.97+0.35+0=1.32