Presentation is loading. Please wait.

Presentation is loading. Please wait.

第8回 二項分布の近似、ポアソン分布、正規分布

Similar presentations


Presentation on theme: "第8回 二項分布の近似、ポアソン分布、正規分布"— Presentation transcript:

1 第8回 二項分布の近似、ポアソン分布、正規分布
確率・統計Ⅰ 第8回 二項分布の近似、ポアソン分布、正規分布 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均 確率変数の平均(続き)、確率変数の分散 確率変数の共分散、チェビシェフの不等式 ベルヌイ試行と二項分布 二項分布(続き)、幾何分布など 二項分布の近似、ポアソン分布、正規分布 正規分布とその性質 i.i.d.の和と大数の法則 中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!

2 二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

3 二項分布のポアソン近似 X を 二項分布 B(n, p) に従う確率変数とする。 λ=np を一定にして n→∞ のとき、
「ポアソン分布」 と呼ぶ(後出) 証明には、解析学の基本公式のひとつ (1+ x/n)n →ex を使う。 n がある程度大きく、しかも p が小さい場合に、左辺(二項分布) を右辺の式(ポアソン分布)で近似できる。    目安としては、n≧100, p≦0.05

4 二項分布のポアソン近似の様子 p=0.01, n=300 ∴λ=np=3 ポアソン近似の目安は n≧100, p≦0.05

5 二項分布のポアソン近似の様子 二項分布 B(300, 0.01) ∴np=3 (…省略) r → 0 …300
数学的には、横軸(r) は 300 までとらないといけないが、r≧10 の確率は無視できる。

6 二項分布のポアソン近似の様子 二項分布 B (3000, 0.001) ∴np=3 (…省略) r → 0 …3000
数学的には、横軸(r) は 3000 までとらないといけないが、r≧10 の確率は無視できる。

7 二項分布のポアソン近似の様子 二項分布 B (30000, 0.0001) ∴np=3 (…省略) r → 0 …30000
数学的には、横軸(r) は までとらないといけないが、r≧10 の確率は無視できる。

8 二項分布のポアソン近似の様子 (λ=3 のポアソン分布) (…省略) r → 0 ……∞
数学的には、横軸(r) は ∞ までとらないといけないが(どんな大きな r に対する確率も0ではない)、r≧10 の確率は無視できる。

9 二項分布のポアソン近似の方法 X が 二項分布 B(n, p) に従うとき、 nが大きく(n≧100)、 pが小さい( p≦0.05)ならば
のかわりに を計算 こっちよりはずっと楽 (λ= np ) これもシンドイが

10 二項分布のポアソン近似(例題) X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。
例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。 まじめに計算すると P(X=0) = (399/400)400

11 二項分布のポアソン近似(例題) パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 1 - 0.37 = 0.63
例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 要するに、eのテーラー展開 e= /2! + 1/3!+ … の第一項×(1/e) が P(X=0) である。 第二項×(1/e) が P(X=1)、第三項×(1/e) が P(X=2)、… だから、P(X=0) = 1/e = 0.37, P(X=1) = 1/e = 0.37, P(X≧2) = 1- 0.37×2 = 0.26 つまり、確率1/400のパチスロを400回やっても、一回も当たらない確率が37%もあるのである。ちょうど一回当たる確率も同じ37%(そして2回以上当たる確率が残りの26%)。 「平均1回当たる」(二項分布のnpでもポアソン分布のλでも平均はたしかに1)というのは事実であるし、「当たるまでに回す平均回数が400回」(幾何分布の平均は1/pであった)というのも事実であるが、「400回やれば1回ぐらい当たって当然」ではないことに注意! 「平均」だけですべてを判断してはいけない。分散npq=399/400 がほぼ 1 もあるのだ。分散の理解こそが確率論の鍵…? = 0.63

12 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。
[再演習] 二項分布 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。  (1) 精度が0.999の部品1000個のうち、どの部品も故障しない確率を求めよ。  (2) 精度が0.999の部品10000個のうち、どの部品も故障しない確率を求めよ。 ヒント:(1) 故障する個数 X は、B(1000, 0.001) に従う。(0.999)1000 の計算は大変だが、ポアソン近似すれば、P( X=0 ) = 1/e = 0.37 (2)故障する個数 X は、 B(10000, 0.001) に従う。 ポアソン近似すれば、P( X=0 ) = 1/e10 =

13 二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

14 ポアソン分布 P( X = r ) が次の式で与えられる確率分布を、パラメータλのポアソン分布 という:
・ポアソン分布は離散分布であるが、r の値は 0, 1, 2, … と理論上は無限個ある。(ただし、大きい r に対する確率は急速に小さくなり、事実上無視できる。そのため、重要なのはいつも r = 0, 1, 2 あたりである。) 問のヒント:ex のテーラー展開を使う。(分からない者は解析学の本を調べよ。) ( r = 0, 1, 2, … ) 離散型; 値無限個 (問) これが確かに確率分布であることを確かめよ。

15 ポアソン分布 r = 0 1 2 3 4 … (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。)
二項分布が、(p+q)n の展開式の各項をバラバラにした分布なのと同様、ポアソン分布は、eλ のテーラー展開の各項をバラバラにした分布になっている。(ただしそれは“比率”の話であって、そのままだと和が 1 でないので、和が 1 になるように定数 eλ で割っておく) ※ eλのテーラー展開の項は、先に行くほど急速に小さくなるので、ポアソン分布の確率も r が(λより)大きくなると急速に小さくなる。(たとえば、λ=1 のとき、r > 1 の確率をすべて合わせても、r = 1 の確率より小さい。) (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。)

16 ポアソン分布の平均と分散 ポアソン分布に従うとき、 E(X) =λ V(X) =λ 確率変数 X がパラメータλの
二項分布の平均が np で、λ=np を一定にして n→∞ とした極限がパラメータλのポアソン分布だったから、ポアソン分布の平均がλであることは自然だろう。また二項分布の分散は npq で、qは1に近づくのだから、分散がλ=np になることもうなずける。 問のヒント:二項分布と同様に、階乗の性質を使う方法と、微分を使う方法がある。それぞれ、二項分布の場合と全く同様である。 (問) これらを確かめよ。

17 ポアソン分布のグラフ r =λ ポアソン分布 (λ=10 ) ( r = 0, 1, 2, …… ) 最大値
λが 10 で、わりと大きいので、かなり正規分布に近い形をしているが、まだ少し左にゆがんでいる。 ※注: λは整数とは限らないが、r は整数なので、λが整数でない場合の最大値はλの前後どちらかの整数(一番近くとは限らない)でとる。 r =λ 最大値

18 ポアソン分布のグラフとλ λによる変化 r → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8
1 2 λが小さいときは、r = 0, 1, 2 あたりの確率がほとんどで、あとは急速に減少していく。

19 ポアソン分布の意味 空間または時間の1単位あたり、 平均λ回起こる(ことがわかっている) 事象があるとする。
例1:製品1個あたり平均2個の傷が入る工芸品 いきなりこのような例を出されると、どこがベルヌイ試行(二項分布)と関係があるのかわかりにくいだろう。 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

20 ポアソン分布の意味 このとき、特定の1単位に、 実際にそれが 何回起こるかの確率 パラメータλのポアソン分布
例1:製品1個あたり平均2個の傷が入る工芸品 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

21 ポアソン分布の意味 例1:製品1個あたり平均2個の傷が入る工芸品 区画数 N 区画に傷のある確率 p = 2 / N
各区画に傷ができる事象は独立 ∴ 製品1個の傷の個数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 2

22 ポアソン分布の意味 例2:パン1個あたり平均2個の干しぶどうが入る工場 × N 個 パンの数 N 干しぶどうの数 2N
干しぶどう1個がこのパンに入る確率 p = 1 / N 例1と異なり、1個のパンを細かく分割すると考えるとなんだかおかしいだろう。 たくさんの小麦粉とたくさんの干しぶどうを混ぜて、パンを無限に生産していくわけだから、パン1個あたりの干しぶどうの平均個数λを一定にして、パンの個数を増やした極限と考えればよい。 各干しぶどうがこのパンに入る事象は独立 ∴ パン1個の干しぶどうの個数 X は B(2N, p) に従う (2N個分のベルヌイ試行とみなせるから) 2N p = λ = 2

23 ポアソン分布の意味 例3:昼間の1時間あたり平均3回の電話がかかる会社 1時間を N等分 1区間に電話のかかる確率 p = 3 / N
t1 t2 t1 t2 t1 t2 1時間を N等分 1区間に電話のかかる確率 p = 3 / N これは例1と同じ考え方の時間版 各区間に電話のかかる事象は独立 ∴ 1時間の電話の回数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 3

24 ポアソン分布(例) λ=0.7のポアソン分布の値 馬に蹴られて死んだプロシアの兵士 (1875-1894)
これは、ポアソン分布の応用発見にかかわる歴史的な例である(ポーランドの統計家ボルトキーヴィッツが1898年の論文でポアソン分布の適用例として示したもので、ポアソン分布自体の発見からは60年も経っていた)。 pが小さく、nが大きいと考えられる。現代では、交通事故死者数などがこれにあたるだろう。 λ=0.7のポアソン分布の値

25 ポアソン分布(例) 馬に蹴られて死んだプロシアの兵士 ( )

26 ポアソン分布(例題) X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。
例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。 このように、ポアソン分布の問題では、N や p はぼかされており、「平均個数」のみが与えられる。このため、慣れないと解き方が分かりにくいかもしれない。

27 ポアソン分布(例題) 例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 約 5% ≒ 0.052

28 ポアソン分布の応用例 細胞内の染色体交替数、バクテリア数など、生物統計への応用 放射線物質の崩壊
在庫管理(いくつ仕入れておけば売り切れの確率をあるレベル以下にできるか) 電話や道路の混雑状況の見積もり→回線数をどれだけ用意すれば、(平常時は)十分やっていけるか etc…

29 二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

30 二項分布の正規近似 (ド・モアブル-ラプラスの定理) X を 二項分布 B(n, p) に従う確率変数とする。 n→∞のとき、 「正規分布」
と呼ぶ(後出) 「~」は「漸近的に等しい」と読み、比が1に近づくことを表す。 ポアソン近似と異なり、右辺は連続型なので、左辺も P(X=r) でなく P(a≦X≦b) にしておかなければならない。

31 二項分布の正規近似´ (ド・モアブル-ラプラスの定理;別の形) X を 二項分布 B(n, p) に従う確率変数とする。 n→∞のとき、
「標準正規分布」 と呼ぶ(後出) 前の形からどうやって変形したか: 右辺の積分が簡単になるよう、x’=(x-np)/√(npq) と変数変換すると、積分の上下の a, b にしわよせがくる。それを a’, b’ と置きなおし、左辺の a, b を a’, b’ に直す。すると左辺にすべてのしわよせがくる。そこで左辺の不等式を同値変形する(式を同値変形しても確率は変わらない)。すなわち不等式の各辺から np を引き、さらに各辺を √(npq) で割る。 こうすると右辺は n によらないから、「~」でなく「→」で書ける。

32 二項分布の正規近似の様子 p = 0.3 n = 10 r’ B( np + √(npq)r’ ) は、標準化した二項分布の確率分布である。r’ は (r - np) / √(npq) の値をr=0,1,…,n に対してとる。その間隔は1/√(npq) である。 そこで、棒の横幅を 1/√(npq) にとると、くっついた棒グラフができる。棒の長さ(高さ)で確率を表していたから、【高さ】の合計が 1 (全確率)であり、棒の【面積】の合計は 1/√(npq)となる。そこで縦座標を √(npq) 倍すると、棒の【面積】が確率になる。

33 二項分布の正規近似の様子 p = 0.3 n = 100 r’

34 二項分布の正規近似の様子 p = 0.3 n = 1000 r’

35 二項分布の正規近似の様子 標準正規分布 x

36 正規分布 確率密度関数 が次の式で与えられる確率分布を、平均μ, 分散σ2の正規分布 N(μ,σ2) という:
ガウス分布ともいう。複雑に見えるが、後の計算でもわかるとおり、本質的には e-x^2 である。 記号 N(μ,σ2) は、確率変数や密度関数を表す記号ではなく、単に「平均μ, 分散σ2 の正規分布」という言葉の代わりである。 問のヒント:積分に対して変数変換 x’ = (x-μ) /σを行うと簡単になる。(この変数変換は N(μ,σ2) に関する計算ではいつも行うパターンなので、慣れておくとよい。) ただ、どうしても「ガウス積分」の値∫-∞ ∞ e -x^2 / 2 dx = √(2π) が必要。解析学の本なら必ず載っているので、知らない/分からない者は調べよ。 (問) これが確かに確率分布であることを確かめよ。

37 標準正規分布 確率密度関数 が次の式で与えられる平均0, 分散1の正規分布を、 標準正規分布 N(0, 1) という:

38 二項分布の正規近似(再) (ド・モアブル-ラプラスの定理) N(np, npq) X を 二項分布 B(n, p) に従う確率変数とする。
複雑に見えた右辺は、平均np, 分散npq(すなわち左辺の二項分布と同じ平均・分散)の正規分布 N(np, npq) であった。

39 二項分布の正規近似´ (再) (ド・モアブル-ラプラスの定理;別の形) N(0, 1)
X を 二項分布 B(n, p) に従う確率変数とする。 (ド・モアブル-ラプラスの定理;別の形) N(0, 1) n→∞のとき、 この形での右辺は、標準正規分布 N(0,1) であった。

40 二項分布の正規近似の方法 確率変数 X は二項分布 B(n, p) に従う 確率変数 Z は正規分布 N(np, npq) に従う
とする。 p が 0 や 1 に近くなく、n が十分大きいとき、 目安: np≧5 かつ nq≧5 連続分布では、一点の確率は0だから、P( X = r ) を P( r ≦ X < r ) でおきかえる(二項分布においては、どちらでも確率は同じである!)。これでド・モアブル-ラプラスの定理が使える。 補正に0.5 を使うのは、近似をよくするための工夫である。これを「半整数補正」という。(これが必要なことはド・モアブル-ラプラスの定理の厳密な証明の中で示される。) <と≦の区別に深い意味はない。(連続分布の場合、一点の確率は0だから、<と≦の差はない) ※「n が十分大きい」というのは、経験法則としては 9/(n+9) ≦ p ≦ n/(n+9) のとき、あるいはもっと簡単に np, nq がともに5以上のとき近似は良好であるといわれている。 P( X = r ) = P( r ≦ X < r ) ≒ P( r ≦ Z < r )

41 二項分布の正規近似の方法 P( X = r ) = P( r - 0.5 ≦ X < r + 0.5 )
では、これはどうやって計算するのか? とても無理 式で書けば 数表を使う P( X = r ) = P( r ≦ X < r ) ≒ P( r ≦ Z < r )

42 二項分布の正規近似の方法 確率変数 Z は正規分布 N(np, npq) に従う 確率変数 Z* は標準正規分布 N(0, 1) に従う
とする。 確率変数 Z* は標準正規分布 N(0, 1) に従う N(0,1) の数表はある Z* に関する確率は分かる P( r ≦ Z < r ) 数表の見方など、N(0,1) に関するさまざまな確率の具体的な求め方などについては次回に説明する。

43 二項分布の正規近似(例題1) 例題: 確率変数 X が B(10, 0.5) に従うとき、P(4≦X≦6) を厳密に求め、これと正規近似から得られる確率を比較せよ。

44 二項分布の正規近似(例題1) P(3.5≦Z<6.5) = P(-0.95≦ Z*<0.95) = ( N(0,1) の表を利用)
例題: 確率変数 X が B(10, 0.5) に従うとき、P(4≦X≦6) を求め、これと正規近似から得られる確率を比較せよ。 P(4≦X≦6)= Z を N(10×0.5, 10×0.5×0.5) = N(5, 2.5) に従う確率変数とすると P(3.5≦Z<6.5) = P(-0.95≦ Z*<0.95) = ( N(0,1) の表を利用)

45 二項分布の正規近似(例題2) 例題: 確率変数 X が B(30, 1/6) に従うとき、P(X≦5) を求め、これと正規近似から得られる確率を比較せよ。 この計算は大変!

46 二項分布の正規近似(例題2) = P(-2.69≦Z*<0.24) = ( N(0,1) の表を利用) ≒ 0.59…
例題: 確率変数 X が B(30, 1/6) に従うとき、P(X≦5) を求め、これと正規近似から得られる確率を比較せよ。 P(X≦5)=0.6164 Z を N(30×1/6, 30×1/6×5/6) = N(5, 25/6) に従う確率変数とすると この場合は p =1/6 で 1/2 にそれほど近くないため、正規近似は「非常によい」とはいえない。 (“目安”に照らすと np=5, nq=25 だからギリギリOKだが) では p が もっともっと小さかったら?( 0.1 とか 0.01 とか)。 nが相当大きくても、 np はまだ小さい(たとえば4以下)ことにもなるだろう。となると正規近似では精度が悪い。ではどうするか。 それが「ポアソン近似」であった。 = P(-2.69≦Z*<0.24) = ( N(0,1) の表を利用) ≒ 0.59…

47 二項分布の近似、 ポアソン分布、正規分布 二項分布のポアソン近似 ポアソン分布 二項分布の正規近似 ポアソン近似と正規近似の関係について

48 二項分布の正規近似と ポアソン近似の関係について
正規近似[ B(n, p) → N(np, npq) ] の条件: p が 0 や 1 に近すぎず、 n が十分大きいとき (目安: np≧5 かつ nq≧5) ポアソン近似[ B(n, p) → λ=np のポアソン分布] の条件: このように、正規近似はpが0.5周辺の場合、ポアソン近似はpが0や1の近く(pが1に近い場合はpとqを入れ替えればよい)の場合という、互いに補うケースを扱っていることがわかる。 しかし、nがpの小ささを打ち消すほど大きくなってしまえば、ポアソン分布も正規分布になってしまう。実際、λが大きくなると、ポアソン分布は正規分布に近づく。(次ページ参照) ※ λがあまりに大きくなるとポアソン分布の計算も面倒になるが、その場合は正規分布で近似できるから、ポアソン近似を使う必要がないのである。λの小さなポアソン分布しか活躍しないのは、そのせい。 p が小さく、 n が(npが小さすぎない程度)大きいとき  (目安: n≧100 かつ p≦0.05) ※ 逆に言えば、 pがやや小さくても、 n が非常に大きいなど、両方の条件がクリアされているなら、どちらを使ってもよい。

49 二項分布の正規近似と ポアソン近似の関係について
Y をパラメータλのポアソン分布に従う確率変数とする。 λ→∞ のとき、 Y は N(λ, λ) に近づく。 ( は N(0, 1) に近づく。)

50 ポアソン分布のグラフとλ(再) λによる変化 r → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8
1 2 λが大きくなると、正規分布に近づく。(実際、λ→∞のとき正規分布に収束することが証明できるのだった。)

51 メニューに戻る メニューへ


Download ppt "第8回 二項分布の近似、ポアソン分布、正規分布"

Similar presentations


Ads by Google