第8回 二項分布の近似、ポアソン分布、正規分布

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
数理統計学(第四回) 分散の性質と重要な法則
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学 11/13(月) 担当:鈴木智也.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計学 11/19(月) 担当:鈴木智也.
数理統計学  第8回 第2章のエクササイズ 西山.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
Probabilistic Method 6-3,4
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
10. 積分 積分・・確率モデルと動学モデルで使われる この章は計算方法の紹介 積分の定義から
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
第11回 中心極限定理 と 大数の法則 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
数理統計学 第4回 西山.
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
第6回 ベルヌイ試行、二項分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
Presentation transcript:

第8回 二項分布の近似、ポアソン分布、正規分布 確率・統計Ⅰ 第8回 二項分布の近似、ポアソン分布、正規分布 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均 確率変数の平均(続き)、確率変数の分散 確率変数の共分散、チェビシェフの不等式 ベルヌイ試行と二項分布 二項分布(続き)、幾何分布など 二項分布の近似、ポアソン分布、正規分布 正規分布とその性質 i.i.d.の和と大数の法則 中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!

二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

二項分布のポアソン近似 X を 二項分布 B(n, p) に従う確率変数とする。 λ=np を一定にして n→∞ のとき、 「ポアソン分布」 と呼ぶ(後出) 証明には、解析学の基本公式のひとつ (1+ x/n)n →ex を使う。 n がある程度大きく、しかも p が小さい場合に、左辺(二項分布) を右辺の式(ポアソン分布)で近似できる。    目安としては、n≧100, p≦0.05

二項分布のポアソン近似の様子 p=0.01, n=300 ∴λ=np=3 ポアソン近似の目安は n≧100, p≦0.05

二項分布のポアソン近似の様子 二項分布 B(300, 0.01) ∴np=3 (…省略) r → 0 …300 数学的には、横軸(r) は 300 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 二項分布 B (3000, 0.001) ∴np=3 (…省略) r → 0 …3000 数学的には、横軸(r) は 3000 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 二項分布 B (30000, 0.0001) ∴np=3 (…省略) r → 0 …30000 数学的には、横軸(r) は 30000 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 (λ=3 のポアソン分布) (…省略) r → 0 ……∞ 数学的には、横軸(r) は ∞ までとらないといけないが(どんな大きな r に対する確率も0ではない)、r≧10 の確率は無視できる。

二項分布のポアソン近似の方法 X が 二項分布 B(n, p) に従うとき、 nが大きく(n≧100)、 pが小さい( p≦0.05)ならば のかわりに を計算 こっちよりはずっと楽 (λ= np ) これもシンドイが

二項分布のポアソン近似(例題) X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。 例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。 まじめに計算すると P(X=0) = (399/400)400

二項分布のポアソン近似(例題) パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 1 - 0.37 = 0.63 例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 要するに、eのテーラー展開 e= 1+ 1 + 1/2! + 1/3!+ … の第一項×(1/e) が P(X=0) である。 第二項×(1/e) が P(X=1)、第三項×(1/e) が P(X=2)、… だから、P(X=0) = 1/e = 0.37, P(X=1) = 1/e = 0.37, P(X≧2) = 1- 0.37×2 = 0.26 つまり、確率1/400のパチスロを400回やっても、一回も当たらない確率が37%もあるのである。ちょうど一回当たる確率も同じ37%(そして2回以上当たる確率が残りの26%)。 「平均1回当たる」(二項分布のnpでもポアソン分布のλでも平均はたしかに1)というのは事実であるし、「当たるまでに回す平均回数が400回」(幾何分布の平均は1/pであった)というのも事実であるが、「400回やれば1回ぐらい当たって当然」ではないことに注意! 「平均」だけですべてを判断してはいけない。分散npq=399/400 がほぼ 1 もあるのだ。分散の理解こそが確率論の鍵…? 1 - 0.37 = 0.63

[4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。 [再演習] 二項分布 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。  (1) 精度が0.999の部品1000個のうち、どの部品も故障しない確率を求めよ。  (2) 精度が0.999の部品10000個のうち、どの部品も故障しない確率を求めよ。 ヒント:(1) 故障する個数 X は、B(1000, 0.001) に従う。(0.999)1000 の計算は大変だが、ポアソン近似すれば、P( X=0 ) = 1/e = 0.37 (2)故障する個数 X は、 B(10000, 0.001) に従う。 ポアソン近似すれば、P( X=0 ) = 1/e10 = 0.0000452

二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

ポアソン分布 P( X = r ) が次の式で与えられる確率分布を、パラメータλのポアソン分布 という: ・ポアソン分布は離散分布であるが、r の値は 0, 1, 2, … と理論上は無限個ある。(ただし、大きい r に対する確率は急速に小さくなり、事実上無視できる。そのため、重要なのはいつも r = 0, 1, 2 あたりである。) 問のヒント:ex のテーラー展開を使う。(分からない者は解析学の本を調べよ。) ( r = 0, 1, 2, … ) 離散型; 値無限個 (問) これが確かに確率分布であることを確かめよ。

ポアソン分布 r = 0 1 2 3 4 … (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。) 二項分布が、(p+q)n の展開式の各項をバラバラにした分布なのと同様、ポアソン分布は、eλ のテーラー展開の各項をバラバラにした分布になっている。(ただしそれは“比率”の話であって、そのままだと和が 1 でないので、和が 1 になるように定数 eλ で割っておく) ※ eλのテーラー展開の項は、先に行くほど急速に小さくなるので、ポアソン分布の確率も r が(λより)大きくなると急速に小さくなる。(たとえば、λ=1 のとき、r > 1 の確率をすべて合わせても、r = 1 の確率より小さい。) (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。)

ポアソン分布の平均と分散 ポアソン分布に従うとき、 E(X) =λ V(X) =λ 確率変数 X がパラメータλの 二項分布の平均が np で、λ=np を一定にして n→∞ とした極限がパラメータλのポアソン分布だったから、ポアソン分布の平均がλであることは自然だろう。また二項分布の分散は npq で、qは1に近づくのだから、分散がλ=np になることもうなずける。 問のヒント:二項分布と同様に、階乗の性質を使う方法と、微分を使う方法がある。それぞれ、二項分布の場合と全く同様である。 (問) これらを確かめよ。

ポアソン分布のグラフ r =λ ポアソン分布 (λ=10 ) ( r = 0, 1, 2, …… ) 最大値 λが 10 で、わりと大きいので、かなり正規分布に近い形をしているが、まだ少し左にゆがんでいる。 ※注: λは整数とは限らないが、r は整数なので、λが整数でない場合の最大値はλの前後どちらかの整数(一番近くとは限らない)でとる。 r =λ 最大値

ポアソン分布のグラフとλ λによる変化 r → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8 1 2 λが小さいときは、r = 0, 1, 2 あたりの確率がほとんどで、あとは急速に減少していく。

ポアソン分布の意味 空間または時間の1単位あたり、 平均λ回起こる(ことがわかっている) 事象があるとする。 例1:製品1個あたり平均2個の傷が入る工芸品 いきなりこのような例を出されると、どこがベルヌイ試行(二項分布)と関係があるのかわかりにくいだろう。 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

ポアソン分布の意味 このとき、特定の1単位に、 実際にそれが 何回起こるかの確率 パラメータλのポアソン分布 例1:製品1個あたり平均2個の傷が入る工芸品 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

ポアソン分布の意味 例1:製品1個あたり平均2個の傷が入る工芸品 区画数 N 区画に傷のある確率 p = 2 / N 各区画に傷ができる事象は独立 ∴ 製品1個の傷の個数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 2

ポアソン分布の意味 例2:パン1個あたり平均2個の干しぶどうが入る工場 × N 個 パンの数 N 干しぶどうの数 2N 干しぶどう1個がこのパンに入る確率 p = 1 / N 例1と異なり、1個のパンを細かく分割すると考えるとなんだかおかしいだろう。 たくさんの小麦粉とたくさんの干しぶどうを混ぜて、パンを無限に生産していくわけだから、パン1個あたりの干しぶどうの平均個数λを一定にして、パンの個数を増やした極限と考えればよい。 各干しぶどうがこのパンに入る事象は独立 ∴ パン1個の干しぶどうの個数 X は B(2N, p) に従う (2N個分のベルヌイ試行とみなせるから) 2N p = λ = 2

ポアソン分布の意味 例3:昼間の1時間あたり平均3回の電話がかかる会社 1時間を N等分 1区間に電話のかかる確率 p = 3 / N t1 t2 t1 t2 t1 t2 1時間を N等分 1区間に電話のかかる確率 p = 3 / N これは例1と同じ考え方の時間版 各区間に電話のかかる事象は独立 ∴ 1時間の電話の回数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 3

ポアソン分布(例) λ=0.7のポアソン分布の値 馬に蹴られて死んだプロシアの兵士 (1875-1894) これは、ポアソン分布の応用発見にかかわる歴史的な例である(ポーランドの統計家ボルトキーヴィッツが1898年の論文でポアソン分布の適用例として示したもので、ポアソン分布自体の発見からは60年も経っていた)。 pが小さく、nが大きいと考えられる。現代では、交通事故死者数などがこれにあたるだろう。 λ=0.7のポアソン分布の値

ポアソン分布(例) 馬に蹴られて死んだプロシアの兵士 (1875-1894)

ポアソン分布(例題) X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。 例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。 このように、ポアソン分布の問題では、N や p はぼかされており、「平均個数」のみが与えられる。このため、慣れないと解き方が分かりにくいかもしれない。

ポアソン分布(例題) 例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 約 5% ≒ 0.052

ポアソン分布の応用例 細胞内の染色体交替数、バクテリア数など、生物統計への応用 放射線物質の崩壊 在庫管理(いくつ仕入れておけば売り切れの確率をあるレベル以下にできるか) 電話や道路の混雑状況の見積もり→回線数をどれだけ用意すれば、(平常時は)十分やっていけるか etc…

二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

二項分布の正規近似 (ド・モアブル-ラプラスの定理) X を 二項分布 B(n, p) に従う確率変数とする。 n→∞のとき、 「正規分布」 と呼ぶ(後出) 「~」は「漸近的に等しい」と読み、比が1に近づくことを表す。 ポアソン近似と異なり、右辺は連続型なので、左辺も P(X=r) でなく P(a≦X≦b) にしておかなければならない。

二項分布の正規近似´ (ド・モアブル-ラプラスの定理;別の形) X を 二項分布 B(n, p) に従う確率変数とする。 n→∞のとき、 「標準正規分布」 と呼ぶ(後出) 前の形からどうやって変形したか: 右辺の積分が簡単になるよう、x’=(x-np)/√(npq) と変数変換すると、積分の上下の a, b にしわよせがくる。それを a’, b’ と置きなおし、左辺の a, b を a’, b’ に直す。すると左辺にすべてのしわよせがくる。そこで左辺の不等式を同値変形する(式を同値変形しても確率は変わらない)。すなわち不等式の各辺から np を引き、さらに各辺を √(npq) で割る。 こうすると右辺は n によらないから、「~」でなく「→」で書ける。

二項分布の正規近似の様子 p = 0.3 n = 10 r’ B( np + √(npq)r’ ) は、標準化した二項分布の確率分布である。r’ は (r - np) / √(npq) の値をr=0,1,…,n に対してとる。その間隔は1/√(npq) である。 そこで、棒の横幅を 1/√(npq) にとると、くっついた棒グラフができる。棒の長さ(高さ)で確率を表していたから、【高さ】の合計が 1 (全確率)であり、棒の【面積】の合計は 1/√(npq)となる。そこで縦座標を √(npq) 倍すると、棒の【面積】が確率になる。

二項分布の正規近似の様子 p = 0.3 n = 100 r’

二項分布の正規近似の様子 p = 0.3 n = 1000 r’

二項分布の正規近似の様子 標準正規分布 x

正規分布 確率密度関数 が次の式で与えられる確率分布を、平均μ, 分散σ2の正規分布 N(μ,σ2) という: ガウス分布ともいう。複雑に見えるが、後の計算でもわかるとおり、本質的には e-x^2 である。 記号 N(μ,σ2) は、確率変数や密度関数を表す記号ではなく、単に「平均μ, 分散σ2 の正規分布」という言葉の代わりである。 問のヒント:積分に対して変数変換 x’ = (x-μ) /σを行うと簡単になる。(この変数変換は N(μ,σ2) に関する計算ではいつも行うパターンなので、慣れておくとよい。) ただ、どうしても「ガウス積分」の値∫-∞ ∞ e -x^2 / 2 dx = √(2π) が必要。解析学の本なら必ず載っているので、知らない/分からない者は調べよ。 (問) これが確かに確率分布であることを確かめよ。

標準正規分布 確率密度関数 が次の式で与えられる平均0, 分散1の正規分布を、 標準正規分布 N(0, 1) という:

二項分布の正規近似(再) (ド・モアブル-ラプラスの定理) N(np, npq) X を 二項分布 B(n, p) に従う確率変数とする。 複雑に見えた右辺は、平均np, 分散npq(すなわち左辺の二項分布と同じ平均・分散)の正規分布 N(np, npq) であった。

二項分布の正規近似´ (再) (ド・モアブル-ラプラスの定理;別の形) N(0, 1) X を 二項分布 B(n, p) に従う確率変数とする。 (ド・モアブル-ラプラスの定理;別の形) N(0, 1) n→∞のとき、 この形での右辺は、標準正規分布 N(0,1) であった。

二項分布の正規近似の方法 確率変数 X は二項分布 B(n, p) に従う 確率変数 Z は正規分布 N(np, npq) に従う とする。 p が 0 や 1 に近くなく、n が十分大きいとき、 目安: np≧5 かつ nq≧5 連続分布では、一点の確率は0だから、P( X = r ) を P( r - 0.5 ≦ X < r + 0.5 ) でおきかえる(二項分布においては、どちらでも確率は同じである!)。これでド・モアブル-ラプラスの定理が使える。 補正に0.5 を使うのは、近似をよくするための工夫である。これを「半整数補正」という。(これが必要なことはド・モアブル-ラプラスの定理の厳密な証明の中で示される。) <と≦の区別に深い意味はない。(連続分布の場合、一点の確率は0だから、<と≦の差はない) ※「n が十分大きい」というのは、経験法則としては 9/(n+9) ≦ p ≦ n/(n+9) のとき、あるいはもっと簡単に np, nq がともに5以上のとき近似は良好であるといわれている。 P( X = r ) = P( r - 0.5 ≦ X < r + 0.5 ) ≒ P( r - 0.5 ≦ Z < r + 0.5 )

二項分布の正規近似の方法 P( X = r ) = P( r - 0.5 ≦ X < r + 0.5 ) では、これはどうやって計算するのか? とても無理 式で書けば 数表を使う P( X = r ) = P( r - 0.5 ≦ X < r + 0.5 ) ≒ P( r - 0.5 ≦ Z < r + 0.5 )

二項分布の正規近似の方法 確率変数 Z は正規分布 N(np, npq) に従う 確率変数 Z* は標準正規分布 N(0, 1) に従う とする。 確率変数 Z* は標準正規分布 N(0, 1) に従う N(0,1) の数表はある Z* に関する確率は分かる P( r - 0.5 ≦ Z < r + 0.5 ) 数表の見方など、N(0,1) に関するさまざまな確率の具体的な求め方などについては次回に説明する。

二項分布の正規近似(例題1) 例題: 確率変数 X が B(10, 0.5) に従うとき、P(4≦X≦6) を厳密に求め、これと正規近似から得られる確率を比較せよ。

二項分布の正規近似(例題1) P(3.5≦Z<6.5) = P(-0.95≦ Z*<0.95) = ( N(0,1) の表を利用) 例題: 確率変数 X が B(10, 0.5) に従うとき、P(4≦X≦6) を求め、これと正規近似から得られる確率を比較せよ。 P(4≦X≦6)=0.65625 Z を N(10×0.5, 10×0.5×0.5) = N(5, 2.5) に従う確率変数とすると P(3.5≦Z<6.5) = P(-0.95≦ Z*<0.95) = ( N(0,1) の表を利用) ≒ 0.6578

二項分布の正規近似(例題2) 例題: 確率変数 X が B(30, 1/6) に従うとき、P(X≦5) を求め、これと正規近似から得られる確率を比較せよ。 この計算は大変!

二項分布の正規近似(例題2) = P(-2.69≦Z*<0.24) = ( N(0,1) の表を利用) ≒ 0.59… 例題: 確率変数 X が B(30, 1/6) に従うとき、P(X≦5) を求め、これと正規近似から得られる確率を比較せよ。 P(X≦5)=0.6164 Z を N(30×1/6, 30×1/6×5/6) = N(5, 25/6) に従う確率変数とすると この場合は p =1/6 で 1/2 にそれほど近くないため、正規近似は「非常によい」とはいえない。 (“目安”に照らすと np=5, nq=25 だからギリギリOKだが) では p が もっともっと小さかったら?( 0.1 とか 0.01 とか)。 nが相当大きくても、 np はまだ小さい(たとえば4以下)ことにもなるだろう。となると正規近似では精度が悪い。ではどうするか。 それが「ポアソン近似」であった。 = P(-2.69≦Z*<0.24) = ( N(0,1) の表を利用) ≒ 0.59…

二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

二項分布の正規近似と ポアソン近似の関係について 正規近似[ B(n, p) → N(np, npq) ] の条件: p が 0 や 1 に近すぎず、 n が十分大きいとき (目安: np≧5 かつ nq≧5) ポアソン近似[ B(n, p) → λ=np のポアソン分布] の条件: このように、正規近似はpが0.5周辺の場合、ポアソン近似はpが0や1の近く(pが1に近い場合はpとqを入れ替えればよい)の場合という、互いに補うケースを扱っていることがわかる。 しかし、nがpの小ささを打ち消すほど大きくなってしまえば、ポアソン分布も正規分布になってしまう。実際、λが大きくなると、ポアソン分布は正規分布に近づく。(次ページ参照) ※ λがあまりに大きくなるとポアソン分布の計算も面倒になるが、その場合は正規分布で近似できるから、ポアソン近似を使う必要がないのである。λの小さなポアソン分布しか活躍しないのは、そのせい。 p が小さく、 n が(npが小さすぎない程度)大きいとき  (目安: n≧100 かつ p≦0.05) ※ 逆に言えば、 pがやや小さくても、 n が非常に大きいなど、両方の条件がクリアされているなら、どちらを使ってもよい。

二項分布の正規近似と ポアソン近似の関係について Y をパラメータλのポアソン分布に従う確率変数とする。 λ→∞ のとき、 Y は N(λ, λ) に近づく。 ( は N(0, 1) に近づく。)

ポアソン分布のグラフとλ(再) λによる変化 r → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8 1 2 λが大きくなると、正規分布に近づく。(実際、λ→∞のとき正規分布に収束することが証明できるのだった。)

メニューに戻る メニューへ