Basic Tools B4  八田 直樹.

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 線形代数学. 2 履修にあたって 電子情報システム学科 必修 2005 年度1セメスタ開講 担当 草苅良至 (電子情報システム学科) 教官室: G I 511 内線: 2095 質問等は上記のいずれかに行なうこと。 注意計算用のノートを準備すること。
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
0章 数学基礎.
Probabilistic Method 7.7
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
数理統計学(第四回) 分散の性質と重要な法則
第6章 数え上げ理論と確率 B4 酒井 隆行.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計解析 第7回 第6章 離散確率分布.
Microsoft Excel 2010 を利用した 2項分布の確率計算
Extremal Combinatorics 14.1 ~ 14.2
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
論理式の表現を数学的に取り扱いやすくするために代数学の助けを借りる.
第2章補足Ⅱ 2項分布と正規分布についての補足
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第2章 確率と確率分布 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
Probabilistic Method 6-3,4
統計学 11/08(木) 鈴木智也.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
Probabilistic method 輪講 第7回
10.通信路符号化手法2 (誤り検出と誤り訂正符号)
(ラプラス変換の復習) 教科書には相当する章はない
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
ガウス過程による回帰 Gaussian Process Regression GPR
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
情報学研究科 通信情報システム専攻 小野寺研究室 M1 奥村 佳弘
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
Probabilistic Method 2007/11/02 岩間研究室M1 市場孝之.
7.4 Two General Settings D3 杉原堅也.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
6. ラプラス変換.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
Extractor D3 川原 純.
25. Randomized Algorithms
Additive Combinatrics 7
様々な情報源(4章).
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
母分散の信頼区間 F分布 母分散の比の信頼区間
5 Recursions 朴大地.
A path to combinatorics 第3章後半(Ex3.8-最後)
14. The Basic Method M1 太田圭亮 14.3 Spaces of polynomials
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
4. システムの安定性.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
人工知能特論II 第8回 二宮 崇.
物理フラクチュオマティクス論 応用確率過程論 (2006年4月11日)
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
Chapter5 Systems of Distinct Representatives
確率と統計 確率編- 平成20年10月29日(木).
確率と統計 確率編- 平成19年10月25日(木) 確率と統計2007.
Microsoft Excel 2010 を利用した 2項分布の確率計算
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
確率統計学 (データ解析学) 書き込み式ノート(Ver.1) 担当教員:綴木 馴.
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

Basic Tools B4  八田 直樹

確率的手法 確率的手法は非常に強力なツールである。 たとえば、             について、 であれば、 ということが言える。

定義 有限確率空間(finite probability space) 有限集合 関数 P { → [0,1]} s.t. 事象(event) Subsets 事象の確率はP(A)= と定義される。

定義 定義域(domain) または標本空間(smaple space) 確率分布(probability distribution) P 一様分布(uniform distribution) 補集合(complement)

任意の事象A,Bについて、 たとえば、 ={1,2,…6}の空間について A:2の倍数 B:3の倍数 とすると、

定義 条件付き確率 例:一様分布なP A:要素が2である B:偶数 P(A|B)=1/3 P(B|A) =1

定義 独立(independent) となる事象A,Bの関係 このとき、条件付き確率の定義より、 独立は、互いに素(disjointness)とは異なる。 たとえば、 であるとき、AとBは互いに素だが、独立ではない。 A:偶数 B:奇数

互いに独立(mutually independent) 事象の集合 が任意の部分集合 について、 であるとき、Aと は互いに独立である。 独立だが互いに独立でない例 コインを2回投げたとき :i回目が表 A :2回の裏表が同じ とした時、Aと 、Aと はそれぞれ独立だが、 となり、互いに独立ではない。

部分集合と確率 有限集合 と、そのランダム部分集合Sを考える。 Sは の中の要素それぞれについて、確率pで表が出 るコインを投げて、表ならSに含めるといった方法で構 成する。 このとき、Sの分布は標本空間 = と、 確率分布 であらわされる。 たとえば、 ={1,2,3,4,5}の時、 コイン: ○ × ○ ○ × 要素 : 1  2  3  4  5 S = {1,3,4}

ここで、Sが一様に与えられる、つまりp=1/2として、 部分集合Sの集合を族Fとすると、 標本空間 はFとなり、 となる。 = であったので、この場合、 部分集合Sの確率分布は となる。

定義 確率変数X は →R(確率空間内の実数値) という 写像をする関数としてあらわされる。 確率変数Xの分布は →[0,1]である、関数 で定義される。 これは、 となる事象Aの確 率分布と同義である。

定義 確率変数の期待値 例:サイコロの目を確率変数としたときの、期待値

期待値の性質と分散 期待値の線形性 が互いに独立である場合、 確率変数の分散(variance)

2項分布 確率pで1をとり、確率1-pで0を取る確率変数Xを ベルヌーイの変数と呼び、期待値はpである。 2項分布とは確率pで1となる、独立なn個のベルヌーイ 変数の和、 であらわされ、 と書かれる。

コイン: ○ ○ ○ × × ○ ○ × ○ × ・ × × ○ ○ ○ 通り n=5 p=1/3 のとき k=3になる確率を考える。 それぞれの事象が起こる確率は よって、任意の について、 コイン: ○ ○ ○ × ×   ○ ○ × ○ × ・   × × ○ ○ ○ 通り

期待値  分散

Elementary tools Counting Sieve 複数の事象が互いに素な確率は個々の事象の確率 の和で抑えられる。 もし、 ならば、

Independence Sieve が互いに独立で、すべての について ならば、 互いに独立なので、 期待値の線形性 これは独立に関係なく成り立つ。 また、あるaについて のとき、 となるiが存在する。

マルコフの不等式 Xを非負の確率変数、 を実数とすると、 証明:

チェルノフの不等式 で、それぞれが互 いに独立である確率変数 は 任意の >0について、以下を満たす。 対称性より、 マルコフの不等式を用いて、次のようになる。 ここで、 とすると、以下が得られる。

チェルノフの不等式 その2 確率pのn個のベルヌーイ変数の和をXとすると、 任意の について、以下が成り立つ。 先と同様の変形を行う。

ここで、 であることを利用して、 t = ln(m/pn)とおいて計算すると。( ) が得られる。 とおいてさらに計算。 同様に、以下のようにおいて計算していくと、 となる。

チェビシェフの不等式 Xを確率変数、 を任意の正の実数とすると、 証明: とおいて、マルコフの不等式を 適用する。

Second Moment Method チェビシェフの不等式で とした場合、 以下の式が得られる。 ここで であるなら、 の確率は定数で抑えられる。 つまり、このとき、XとE[X]はほとんど等しい。 よって、E[X]がわかれば、 となるXが少なくと も1つ存在することがわかり、さらに がわかれば、 となるXが多数存在することが わかる。

Advanced tools ここからは、ツールの紹介をする。 Deletion Method 局所的に「良く」ない「悪い」ものが生じるランダムな設 定に対して、対象が「良く」なるまで「悪い」ところを変 化(削除)し続けることができる。

ラヴァースのふるい 事象 の依存関係をn頂点からなるグラフ Gとしてあらわし、( と が独立なら ) その最大次数をd、任意のiについて、 の時、 ならば、 このとき、 の最大値p について、4ep<1なら、 どこにも属さない要素が存在。 独立 2 従属 1 3 6 5 4

エントロピー 確率変数Yがそれぞれ確率 でm個の値 をとりうる時、エントロピーは と定義される。 これは情報量を意味する。 (一様分布)なら になる。 Concentration property のとき、 となるbが存在する。 確率が小さければ、エントロピーは増える凸関数

Subadditivity property は事象 の要素をYの座標値としてとる、確率変 数で、 は 集合 の要素をと る確率変数とするとき、 例: N=1で等号成立

ジョンソンの不等式 を集合、Yをその部分集合とし、 のすべての要 素と となる事象が互いに独立であるようにす る。 そして、 を となる事象とする。 ここで、 を とし、従属関 係を表す記号とする。 とおくと、以下の不等式が得られる。 ただし、

あずまの不等式 を積確率空間とし、 である2つの要素が一つの座標しか変わ らないなら、 であるという命題を 満たす確率変数Xをとると、 Xの期待値を として、 が成り立つ。 これは、チェルノフの不等式の拡張である。

タラグランドの不等式 先と同様に を積確率空間とす る。そして、 に対して距離 を定義し、 任意の実ベクトル に対して、 となる が存在するような、最 小のものをtとする。 としたとき、以下の不等 式が成り立つ。

の一様分布とおくと、 は一様分布のn-cube をとる。 このとき、xが の要素なら、すべての となり、xは からハミング距離 以内に存在す る。