IBISML2010 秘密の忠告からのオンライン予測 筑波大学 コンピュータサイエンス専攻 科学技術振興機構 さきがけ 佐久間 淳.

Slides:



Advertisements
Similar presentations
情報セキュリティ 第3回 現代暗号の基礎数理. 脅威と暗号技術 セキュリティに対する脅威 脅かされる特性 暗号技術 機密性 正真性 認証 否認不可能性 盗聴 (秘密が漏れる) 改竄 (情報が書き換えられる) なりすまし (正しい送信者のふりをする) 否認 (後から私じゃないと言う) 共通鍵暗号 公開鍵暗号.
Advertisements

効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
List decoding for Reed-Muller codes and its application to polar codes 安永 憲司 東京工業大学 大学院情報理工学研究科 数理・計算科学専攻 1.
利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚. 背景 商品の量が多い 見つからな い orz ネットショップ.
白井ゼミ 豊田秀樹(2008)『データマイニング入門』 (東京図書)。4章
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
オンライン学習 Prediction Learning and Games Ch2
「わかりやすいパターン認識」 第1章:パターン認識とは
駒澤大学 経営学部 情報セキュリティ B 公開鍵暗号による 認証つきの秘匿通信 ―― 鍵に注目して ――
Bipartite Permutation Graphの ランダム生成と列挙
黒澤 馨 (茨城大学) 情報セキュリティ特論(4) 黒澤 馨 (茨城大学) 2017/3/4 confidential.
補章 時系列モデル入門 ー 計量経済学 ー.
© Yukiko Abe 2014 All rights reserved
秘密のリンク構造を持つグラフのリンク解析
プライバシ協調フィルタリングにおける 利用者評価行列の次元削減
黒澤 馨 (茨城大学) 情報セキュリティ特論(6) 黒澤 馨 (茨城大学) 2017/3/13 confidential.
社会心理学のStudy -集団を媒介とする適応- (仮)
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
第2章 第1節 情報通信の仕組み 4 暗号技術と情報の保護 5 コンピュータとネットワークの管理
数 学 の か た ち 第3講 暗号を作ろう 早苗 雅史 数学とソフトウエア
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
黒澤 馨 (茨城大学) 情報セキュリティ特論(7) 黒澤 馨 (茨城大学)
計算量理論輪講 岩間研究室 照山順一.
東京工業大学 機械制御システム専攻 山北 昌毅
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
法政大学 情報科学部 2008年度「離散数学」講義資料
補章 時系列モデル入門 ー 計量経済学 ー.
暗号技術 ~公開鍵暗号方式の仕組み~ (3週目)
第10回 情報セキュリティ 伊藤 高廣 計算機リテラシーM 第10回 情報セキュリティ 伊藤 高廣
黒澤 馨 (茨城大学) 情報セキュリティ特論(5) 黒澤 馨 (茨城大学)
Q q 情報セキュリティ 第3回:2005年4月28日(金) q q.
Q q 情報セキュリティ 第3回:2005年4月22日(金) q q.
数学のかたち 暗号を作ろう Masashi Sanae.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Q q 情報セキュリティ 第5回:2005年5月13日(金) q q.
決定木とランダムフォレスト 和田 俊和.
Q q 情報セキュリティ 第8回:2006年6月9日(金) q q.
情報セキュリティ  第4回 メッセージ認証コード.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
情報セキュリティ  第11回 デジタル署名.
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Online Decoding of Markov Models under Latency Constraints
インターネットにおける真に プライベートなネットワークの構築
7.4 Two General Settings D3 杉原堅也.
2章 暗号技術 FM15002 友池 絲子.
PKI 情報工学専攻 1年 赤木里騎 P91~102.
Q q 情報セキュリティ 第11回:2004年6月18日(金) q q.
5.RSA暗号 素因数分解の困難性を利用した暗号.
25. Randomized Algorithms
東北大学大学院情報科学研究科 教授 西関 隆夫
Data Clustering: A Review
ボルツマンマシンの定義 ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。
Q q 情報セキュリティ 第8回:2005年6月3日(金) q q.
暗号技術 ~暗号技術の基本原理~ (1週目) 情報工学科  04A1004 石川 真悟.
Q q 情報セキュリティ 第4回:2005年5月12日(金) q q.
多層的な知人関係に基づく 自己情報コントロールの実現
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
Diffie-Hellman 鍵共有 ElGamal 暗号 楕円曲線暗号,量子コンピュータ
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
VMリダイレクト攻撃を防ぐための 安全なリモート管理機構
Q q 情報セキュリティ 第12回:2004年6月25日(金) の補足 q q.
ネット時代のセキュリティ3(暗号化) 2SK 情報機器工学.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
暗号技術・セキュリティ 情報工学科  04A1004 石川 真悟.
Presentation transcript:

IBISML2010 秘密の忠告からのオンライン予測 筑波大学 コンピュータサイエンス専攻 科学技術振興機構 さきがけ 佐久間 淳

シナリオ 株価予測 N人の株価予測エキスパートがいる 各エキスパートは自分の予測関数や予測を他のエキスパートに明かしたくない しかし全員の知恵を集めればよりよい予測ができるかもしれないと思っている

シナリオ 株価予測 N人の株価予測エキスパートがいる 各エキスパートは自分の予測関数や予測を他のエキスパートに明かしたくない しかし全員の知恵を集めればよりよい予測ができるかもしれないと思っている 感染病流行予測 感染病の流行を予測しようとしているN個の病院がある 個々の病院のカルテやその分析結果は、患者のプライバシーを考慮すると開示できない しかし全病院の予測結果を集約できれば、感染病の流行を正確に予測できるかもしれない

シナリオ 株価予測 N人の株価予測エキスパートがいる 各エキスパートは自分の予測関数や予測を他のエキスパートに明かしたくない しかし全員の知恵を集めればよりよい予測ができるかもしれないと思っている 感染病流行予測 感染病の流行を予測しようとしているN個の病院がある 個々の病院のカルテやその分析結果は、患者のプライバシーを考慮すると開示できない しかし全病院の予測結果を集約できれば、感染病の流行を正確に予測できるかもしれない それぞれの予測を他に開示せずによりよい予測は可能か?

Which advice do I trust…? オンライン予測:株価予測を例に For t=1,2,…,T: エキスパート: 忠告「株価は “騰がる (yi,t=1)” or “下がる(yi,t=0)”」を開示 学習者: エキスパートの忠告を基に予測yH,t を生成 環境(マーケット): 株価yt を開示 エキスパート: 自身の予測に対する損失 l (yt, yi,t)を受ける 学習者: 自身の予測に対する損失 l (yt, yH,t) を受ける Experts …… Increase! Drop! Learner Which advice do I trust…?

Regret minimization 評価基準:regret 学習者Hの損失和 最も少ない損失和を被ったエキスパートの損失和

Regret minimization 評価基準:regret 目標: RH,T < O(T) T→∞ の極限においてRH,T は消失 (a.k.a. Hannan consistency) 期間が十分長ければ、最良のエキスパートと同等程度の損失ですむ この目標を達成するために、学習者はどのような戦略をとればよいか? 学習者Hの損失和 最も少ない損失和を被ったエキスパートの損失和

Exponential Weighting Scheme 戦略 よい予測をしているエキスパートは選ばれやすいように 悪い予測をしているエキスパートは選ばれにくいように

Exponential Weighting Scheme 戦略 よい予測をしているエキスパートは選ばれやすいように 悪い予測をしているエキスパートは選ばれにくいように 各エキスパートついて重みwitを毎ステップ更新 i番目のエキスパートの累積損失

Exponential Weighting Scheme 戦略 よい予測をしているエキスパートは選ばれやすいように 悪い予測をしているエキスパートは選ばれにくいように 各エキスパートついて重みwitを毎ステップ更新 重みwitを正規化 i番目のエキスパートの累積損失

Exponential Weighting Scheme 戦略 よい予測をしているエキスパートは選ばれやすいように 悪い予測をしているエキスパートは選ばれにくいように 各エキスパートついて重みwitを毎ステップ更新 重みwitを正規化 pitによる予測の決定 pitに比例する確率でエキスパートを一つ選択 (jとする) yjtを時刻tの学習者の予測とする i番目のエキスパートの累積損失

完全情報モデル 完全情報モデル (eg. Exponential weighting) 学習者はすべてのエキスパートの忠告と損失を観測可能 Experts …… Increase! Drop! Learner 完全情報モデル (eg. Exponential weighting) 学習者はすべてのエキスパートの忠告と損失を観測可能 Exponential weighting LearnerのRegret bound[Vovk90] Hannan cosistent! T:ラウンド数、N: エキスパート数

Let me know your prediction 部分情報モデル Experts …… increase drop Drop! Let me know your prediction Learner 部分情報モデル (eg. Exp3 [Auer et. al. 2003]) あらかじめ決めたエキスパートからのみ忠告と損失を観測 Exp3 learnerのRegret bound エキスパートからの秘密の忠告を扱うにはまだ不足 実現したいシナリオはもっと制限の厳しい情報モデル Hannan cosistent!

エキスパートも学習者も互いに予測と損失を一切開示したくない Hannnan consistentなオンライン予測はほとんど不可能に見えるが? プライベート情報モデル Experts …… My prediction cannot be revealed… My prediction cannot be revealed… Learner Nobody tells me the advice… プライベート情報モデル エキスパートも学習者も互いに予測と損失を一切開示したくない Hannnan consistentなオンライン予測はほとんど不可能に見えるが?

プライベート情報モデルにおけるExponential Weighting 各エキスパートついて重みwitを毎ステップ更新 重みwitを正規化 pitによる予測の決定 pitに比例する確率でエキスパートを一つ選択              (jとする) yjtを時刻tの学習者の予測とする 各エキスパートがローカルで計算可能 i番目のエキスパートの累積損失 このルーレット選択を解決するoblivious rouletteを考える ローカルで計算できない ローカルで計算できない

Oblivious rouletteの直感的な理解 エキスパート 学習者 1.エキスパートを確率wiでランダムに一人指名 それ以外の場合は存在しないエキスパートを指名 1 2 …… D N-1 N

Oblivious rouletteの直感的な理解 エキスパート 学習者 2.エキスパートをランダムに一人指名 1 2 …… D N-1 N

Oblivious rouletteの直感的な理解 エキスパート 学習者 1 2 …… D 3.学習者と同じエキスパートを選んだエキスパートが いれば、そのエキスパートの予測を採用、 いなければ再試行 N-1 N

Oblivious rouletteの直感的な理解 エキスパート 学習者 エキスパートをランダムに一人指名 1 2 …… D 学習者と同じエキスパートを選んだエキスパートが いれば、そのエキスパートの予測を採用 いなければ再試行 N-1 N

Oblivious rouletteの直感的な理解 エキスパート 学習者 エキスパートをランダムに一人指名 1 エキスパート2の予測を採用 2 こうすることで… …… に従うルーレット選択が実現 D ただし、誰がどんな予測をしたか、学習者はどんな予測を得たか、などは知られてしまう N-1 N

準同形性公開鍵暗号によるoblivious rouletteの構築 m ∊ ZN をメッセージ, r ∊ ZN を乱数とする (pk, sk): 公開鍵と秘密鍵のペア 暗号化: 複号化: m0,m1, r1,r2 ∊ ZN 暗号系が(加法的)準同型性を持つとき: 暗号文の和 暗号文と平文の積 これを使ってルーレット選択の結果のみが学習者に伝わるような計算法を開発

Oblivious roulette protocol 各エキスパート 学習者 1. エキスパートをランダムに一人指名 (jk’とする)し、以下を評価 2. エキスパートは以下を評価し学習者へ送信 1. エキスパートをランダムに一人指名 (jkとする) 3. プレイヤは(c1k,…,cNk)を解読:       ならuを出力、そうでなければ1へ

プロトコルの性質 プロトコルの肝 Oblivious roulette protocol エキスパートは互いの予測や重みを他人に見られない ルーレット盤を見ない(見せない)ルーレットを実現 エキスパートは互いの予測や重みを他人に見られない 学習者はだれから予測をもらったか、どんな予測を採用したかエキスパートに知られない これをつかうとexponential weightingをプライベート情報モデルで実行できる エキスパートの指名jkと学習者の指名が一致すれば0、そうでなければランダムな値をとる エキスパートiの予測

この研究の成果 プライベート情報モデルにおいても… Hannan consistencyを達成できました 観測可能な情報 Regret bound 完全情報モデル 全エキスパートの損失,予測 部分情報モデル 指名したエキスパートの損失,予測 プライベート情報モデル 他エキスパートの損失,予測は観測できない プライベート情報モデルにおいても… Hannan consistencyを達成できました しかもregret boundは完全情報モデルと同じオーダーです 結論:情報を他のエキスパートと共有しなくとも、学習者は完全情報モデルにおけるexponential weightingと同等の予測ができます

Experiments: Regret Exp3 (partial. info. mdl) SEW/OR, SEW/DR (private. info. mdl) Regret lower bound

まとめ 完全情報モデルと同等の性能を達成。しかも、 エキスパートは予測と損失を開示しなくてもよい 学習者も予測と損失を開示しなくともよい 拡張 いろんなオンライン学習がこれによりプライベート化できるはず… 繰り返しゲームにおけるminmax戦略とregret最小化は等価 ペイオフ行列を秘密にたままのminmax均衡の実現 Boosting…シナリオ募集中