Extractor D3 川原 純.

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Probabilistic Method 7.7
      ベクトル空間   実数体 体:数の集合で四則がその中で行えるもの 例)有理数全体、実数全体、複素数全体 R:実数体     C:複素数体  ベクトル空間
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
3.2.3~3.3 D3 川原 純.
セキュアネットワーク符号化構成法に関する研究
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Extremal Combinatorics 14.1 ~ 14.2
Probabilistic Method.
Extremal Combinatrics Chapter 4
Reed-Solomon 符号と擬似ランダム性
先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning
Probabilistic Method 6-3,4
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
Probabilistic method 輪講 第7回
8.Intersecting Families
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
黒澤 馨 (茨城大学) 情報セキュリティ特論(7) 黒澤 馨 (茨城大学)
Selfish Routing and the Price of Anarchy 第2回
情報学研究科 通信情報システム専攻 小野寺研究室 M1 奥村 佳弘
博士たちの愛する素数 徳山 豪 東北大学 Prime numbers that professors love
k 個のミスマッチを許した点集合マッチング・アルゴリズム
ニューラルネットは、いつ、なぜ、どのようにして役立つか?
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
物理学者でない人 のための統計力学 東京工業大学 渡辺澄夫 DEX-SMI 1/1/2019.
Probabilistic Method 2007/11/02 岩間研究室M1 市場孝之.
7.4 Two General Settings D3 杉原堅也.
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
【第二講義】1次元非線形写像の不変集合とエントロピー
Basic Tools B4  八田 直樹.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
予測に用いる数学 2004/05/07 ide.
25. Randomized Algorithms
Selfish Routing and the Price of Anarchy 4.3
Additive Combinatrics 7
情報生命科学特別講義III (13) 固定パラメータアルゴリズムと 部分k木
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
様々な情報源(4章).
SUNFLOWER B4 岡田翔太.
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
14. The Basic Method M1 太田圭亮 14.3 Spaces of polynomials
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
Lecture 8 Applications: Direct Product Theorems
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
5.3, 5.4 D2 岡本 和也.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
Max Cut and the Smallest Eigenvalue 論文紹介
人工知能特論II 第8回 二宮 崇.
JNNS-DEX-SMI-玉川 公開講座 「交換モンテカルロ法とその応用」
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
7.8 Kim-Vu Polynomial Concentration
Additive Combinatorics輪講 6章
4.プッシュダウンオートマトンと 文脈自由文法の等価性
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
Chapter5 Systems of Distinct Representatives
Speaker: Kazuhiro Inaba Paper Introduction from WSDM 2015
情報数理Ⅱ 第10章 オートマトン 平成28年12月21日.
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
ランダムプロジェクションを用いた音響モデルの線形変換
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

Extractor D3 川原 純

Extractor Extractor : 一様でない確率分布から一様分布に近い分布を作り出す技法。 X x1, x2, ...,xn 例:自然界にある乱数(熱揺らぎ等) 確率分布 サンプリング X x1, x2, ...,xn f (extractor) 正体不明(のことも多い) f(x1), f(x2),..., f(xn) 一様分布に「近い」

Extractor Extractor : 一様でない確率分布から一様分布に近い分布を作り出す技法。 X f(X) 例:自然界にある乱数(熱揺らぎ等) 確率分布 X f (extractor) f(X) 正体不明(のことも多い) 一様分布に「近い」分布

弱い乱数発生源 どんな確率分布からでも一様分布が作り出せる訳ではない 弱い乱数発生源(weak random sources)を考える マルコフ鎖発生源(Markov-chain source) 確率遷移行列 予測不可能発生源(unpredictable source) {0, 1}n上の確率分布 X ビット固定発生源(bit fixing source) {0, 1}n上の確率分布 X で n-k ビットを固定したもの 例: Pr[X=1] = 1 Pr[X=0] = 0 の分布からはどのようにしても作れない 以下の例はすべて {0,1}n 上の確率分布 (k は定数) に従う 直観的には n ビット中、k ビットがランダム

分布が「近い」とは 定義 T 上の分布 P と Q が ε-close であるとは、 が成り立つこととする。これを分布の統計距離と呼ぶ。 任意の事象 A ⊆ T に対して が成り立つことと同値。

分布がランダムさをもつとは 定義 {0, 1}n 上の確率分布 X の min-エントロピーを以下のように定義する H∞(X) ≧ k なら X H∞(X) ≧ k なら 任意の x∈{0,1}n に対して 1 log ≧ k Pr[X=x] 直観的には k ビットのランダムさをもつ Pr[X=x] ≦ 2-k

Extractor の(理想的な)目標        を満たす任意の {0,1}n 上の確率分布 X から1ビットを “extract” する extractor の設計 f: {0,1}n → {0,1}         を満たす任意の X に対して、 Pr[x ← X, f(x) = 1] = 1/2 となる f を設計する

理想的なExtractor は構築不可能 を満たす任意の {0,1}n 上の確率分布 X に 定理         を満たす任意の {0,1}n 上の確率分布 X に 対して Pr[x ← X, f(x) = 1] = 1/2 となるような f は存在しない 1 証明のアイデア H∞(X) = min f(X) 1 f : {0,1}3 → {0,1} f log pi n = 3 X 1 = 000 1/8 log 1/4 001 1/16 = 2 1/16 1/2 … 1/4 1/16 1/2 1/16 1/4 任意の H∞(Y) ≧ n – 1 を満たす Y について、 f(Y) は一様分布か? 111 1/8

理想的なExtractor は構築不可能 を満たす任意の {0,1}n 上の確率分布 X に 定理         を満たす任意の {0,1}n 上の確率分布 X に 対して Pr[x ← X, f(x) = 1] = 1/2 となるような f は存在しない 1 H∞(Y) = ≧ 2 証明のアイデア log 1/6 f(X) 1 f : {0,1}3 → {0,1} f n = 3 X Y 000 1/8 1/6 f(X) f 001 1/16 1/6 1/16 1/6 … 1/4 1/16 1/6 1/16 1/6 1/4 111 1/8 1/6

理想的なExtractor は不可能 を満たす任意の {0,1}n 上の確率分布 X に 対して、Pr[x ← X, f(x) = 1] = 1/2 となる f は存在しない 証明 ある X に対して、S = {x | f(x) = b} とする。 b は 0 or 1 |S| ≧ 2n-1 となる b が存在する 確率分布 Y を、 f(y) = b となる y には 1/|S| を、 f(y) = b となる y には 0 を割り当てる。 H∞(Y) ≧ n – 1 を満たし、明らかに Pr[y ←Y, f(y) = 1] = 0 or 1 なので、矛盾

Extractor の定義 定義 (k, ε)-extractor とは関数 で、 を満たす任意の {0,1}n 上の確率分布 X に ついて Ext(X, Ud) が一様分布 Um と ε-close になるもの である。 d はシードと考える d を下げる、mを上げるのが目標

BPP アルゴリズムのシミュレート Extractor があれば BPP アルゴリズムをシミュレートできる。 f(w) を計算するBPPアルゴリズムを考える。 となる多項式チューリング機械 A(w, z) が存在する(z ∈ {0,1}m)。 得体のしれない確率分布 X と extractor Ext が存在するなら すべての y ∈ {0,1}d について、Ext(x, y) = z を計算して、 A(w, z) を走らせて、得られた答えの多数決をとる。

Disperser の定義 定義 (k, ε)-disperser とは関数 で、 を満たす任意の {0,1}n 上の確率分布 X に ついて Dis(X, Ud) の台のサイズが少なくとも (1 - ε)2m である Disperser は RP アルゴリズムをシミュレートできる

X ∈ Lk の場合(Lk は次元が k 以上の 上の アフィン部分空間の集合)        アフィン部分空間の集合) sum-product theorem を使う前 k ≧ 2 log n のとき、extractor の存在を証明(probabilistic method) k ≧ n / 2 のとき、extractor を構築 sum-product theorem を使った後 k ≧ δn, m = 1 のとき、disperser を構築 [Barakら 05] k ≧ δn のとき、optimal extractor を構築 [Bouら 07] 小さな次元で大きな有限体のとき、extractor を構築 [GR05]

X ∈ の場合 sum-product theorem を使う前 k ≧ 2 log n のとき、optimal extractor を構築(ラムゼーグラフ) k ≧ n / 2 のとき、optimal extractor を構築 [CG88] [Vaz 87] sum-product theorem を使った後 k ≧ 0.4999n のとき、optimal extractor を構築 [Bou 07] k ≧ δn, m = 1 のとき、disperser を構築 [BW05]

A statistical version of the Sum-Product Theorem で、       を満たす任意の {0,1}n 上の確率分布 X に ついて Dis(X, Ud) の台のサイズが少なくとも (1 - ε)2m である Sum-Product Theorem は集合のサイズに関する命題なので、 disperser の構築に有用 しかし、extractor は f(X) が一様であることも要求するので、 単に集合の個数を議論するだけでは不十分 H0(A) = |support(A)| Hshannon(A) = ∑-pi log pi H2(A) =

Theorem 3.2.15 (Sum-Product Theorem) F =Fp とする。H0(A) ≦ 0.9 log p を満たすすべての A ⊂ F に対して、H0(A + A) ≧ H0(A)1+ε と H0(A × A) ≧ H0(A)1+ε の少なくとも一方を満たす ε ≧ 0 が存在する。 H0(A) = |support(A)| H2(A) = H0 を H2 や H∞に置き換えた定理が成り立ってほしいが、 実際は成り立たない

F =Fp とする。H0(A) ≦ 0.9 log p を満たすすべての A ⊂ F に対して、 Theorem 3.2.16 F =Fp とする。H0(A) ≦ 0.9 log p を満たすすべての A ⊂ F に対して、  H0(A × A + A) > (1+ε)H0(A) を満たす ε ≧ 0 が存在する。 H0(A) = |support(A)| H2(A) = H0 を H2 に置き換えた定理が成り立つ H2(A × A + A) > (1+ε)H2(A)

r = min(r(A), r(B), r(C)) とする。 [BW04] は以下の定理を示した。 H2(A) = A, B, C を FP 上の独立な分布とする。 r(X) = H2(X) / log p , r = min(r(A), r(B), r(C)) とする。 [BW04] は以下の定理を示した。 r ≦ 0.9 なら r(A,B,C) ≧ (1+ε)r r >0.9 なら r(A,B,C) = 1 となる定数 ε >0 が存在する。

以下のように関数列 f i を構築する H2(A × A + A) > (1+ε)H2(A) 3t 個の発生源から、少なくとも (1+ε)t H2(A) の エントロピーをもった1つの発生源に変換することができる。 この手法で k ≧δn, c = poly(1/δ) 上の(optimal)extractor を構築した [BW04]