第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
数理統計学(第四回) 分散の性質と重要な法則
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学 11/13(月) 担当:鈴木智也.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
確率・統計Ⅱ 第7回.
統計学 11/19(月) 担当:鈴木智也.
数理統計学  第8回 第2章のエクササイズ 西山.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
Probabilistic Method 6-3,4
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
第11回 中心極限定理 と 大数の法則 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
母分散の信頼区間 F分布 母分散の比の信頼区間
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第8回 二項分布の近似、ポアソン分布、正規分布
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学  第9回 西 山.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
第6回 ベルヌイ試行、二項分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
Presentation transcript:

第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散 確率変数の共分散 ベルヌイ試行、二項分布 二項分布(続き)、幾何分布 ポアソン分布 正規分布 正規分布(続き) 大数の法則、中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!

ポアソン分布 ポアソン分布 二項分布のポアソン近似 ポアソン分布の意味 ポアソン分布の平均・分散

ポアソン分布 P( X = x ) が次の式で与えられる確率分布を、パラメータλのポアソン分布 という: ・ポアソン分布は離散分布であるが、x の値は 0, 1, 2, … と理論上は無限個ある。(ただし、大きい x に対する確率は急速に小さくなり、事実上無視できる。そのため、重要なのはいつも x = 0, 1, 2 あたりである。) 問のヒント:eλ のテーラー展開を使う。(分からない者は解析学の本を調べよ。) ( x = 0, 1, 2, … ) 離散型; 値無限個 (問) これが確かに確率分布であることを確かめよ。

ポアソン分布 x = 0 1 2 3 4 … (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。) 二項分布が、(p+q)n の展開式の各項をバラバラにした分布なのと同様、ポアソン分布は、eλ のテーラー展開の各項をバラバラにした分布になっている。(ただしそれは“比率”の話であって、そのままだと和が 1 でないので、和が 1 になるように定数 eλ で割っておく) ※ eλのテーラー展開の項は、先に行くほど急速に小さくなるので、ポアソン分布の確率も r が(λより)大きくなると急速に小さくなる。(たとえば、λ=1 のとき、r > 1 の確率をすべて合わせても、r = 1 の確率より小さい。) (比率はこのまま、全部で 1 になるように、全体に e -λ を掛ける。)

ポアソン分布のグラフ x =λ ポアソン分布 (λ=10 ) ( x = 0, 1, 2, …… ) 最大値 λが 10 で、わりと大きいので、かなり正規分布に近い形をしているが、まだ少し左にゆがんでいる。 ※注: λは整数とは限らないが、x は整数なので、λが整数でない場合の最大値はλの前後どちらかの整数(一番近くとは限らない)でとる。 x =λ 最大値

ポアソン分布のグラフとλ λによる変化 x → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8 1 2 λが小さいときは、x = 0, 1, 2 あたりの確率がほとんどで、あとは急速に減少していく。

ポアソン分布 ポアソン分布 二項分布のポアソン近似 ポアソン分布の意味 ポアソン分布の平均・分散

二項分布のポアソン近似 X を 二項分布 B(n, p) に従う確率変数とする。 λ=np を一定にして n→∞ のとき、 「ポアソン分布」 証明には、解析学の基本公式のひとつ (1+ x/n)n →ex を使う。 n がある程度大きく、しかも p が小さい場合に、左辺(二項分布) を右辺の式(ポアソン分布)で近似できる。    目安としては、n≧100, p≦0.05

二項分布のポアソン近似の様子 p=0.01, n=300 ∴λ=np=3 ポアソン近似の目安は n≧100, p≦0.05

二項分布のポアソン近似の様子 二項分布 B(300, 0.01) ∴np=3 (…省略) x → 0 …300 数学的には、横軸(r) は 300 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 二項分布 B (3000, 0.001) ∴np=3 (…省略) x → 0 …3000 数学的には、横軸(r) は 3000 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 二項分布 B (30000, 0.0001) ∴np=3 (…省略) x → 0 …30000 数学的には、横軸(r) は 30000 までとらないといけないが、r≧10 の確率は無視できる。

二項分布のポアソン近似の様子 (λ=3 のポアソン分布) (…省略) x → 0 ……∞ 数学的には、横軸(r) は ∞ までとらないといけないが(どんな大きな r に対する確率も0ではない)、r≧10 の確率は無視できる。

二項分布のポアソン近似の方法 X が 二項分布 B(n, p) に従うとき、 nが大きく(n≧100)、 pが小さい( p≦0.05)ならば のかわりに を計算 こっちよりはずっと楽 (λ= np ) これもシンドイが

二項分布のポアソン近似(例題) X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。 例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 X を B(400, 1/400) に従う確率変数とするとき、1 - P(X=0) を求めればよい。 まじめに計算すると P(X=0) = (399/400)400

二項分布のポアソン近似(例題) パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 1 - 0.37 = 0.63 例題: ビジ確率1/400 のパチスロを400回回したとき、少なくとも一回当たる確率を求めよ。 パラメータλ= 400×1/400 = 1 のポアソン分布として計算すれば 要するに、eのテーラー展開 e= 1+ 1 + 1/2! + 1/3!+ … の第一項×(1/e) が P(X=0) である。 第二項×(1/e) が P(X=1)、第三項×(1/e) が P(X=2)、… だから、P(X=0) = 1/e = 0.37, P(X=1) = 1/e = 0.37, P(X≧2) = 1- 0.37×2 = 0.26 つまり、確率1/400のパチスロを400回やっても、一回も当たらない確率が37%もあるのである。ちょうど一回当たる確率も同じ37%(そして2回以上当たる確率が残りの26%)。 「平均1回当たる」(二項分布のnpでもポアソン分布のλでも平均はたしかに1)というのは事実であるし、「当たるまでに回す平均回数が400回」(幾何分布の平均は1/pであった)というのも事実であるが、「400回やれば1回ぐらい当たって当然」ではないことに注意! 「平均」だけですべてを判断してはいけない。分散npq=399/400 がほぼ 1 もあるのだ。分散の理解こそが確率論の鍵…? 1 - 0.37 = 0.63

[4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。 [再演習] 二項分布 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。  (1) 精度が0.999の部品1000個のうち、どの部品も故障しない確率を求めよ。  (2) 精度が0.999の部品10000個のうち、どの部品も故障しない確率を求めよ。 ヒント:(1) 故障する個数 X は、B(1000, 0.001) に従う。(0.999)1000 の計算は大変だが、ポアソン近似すれば、P( X=0 ) = 1/e = 0.37 (2)故障する個数 X は、 B(10000, 0.001) に従う。 ポアソン近似すれば、P( X=0 ) = 1/e10 = 0.0000452

ポアソン分布 ポアソン分布 二項分布のポアソン近似 ポアソン分布の意味 ポアソン分布の平均・分散

ポアソン分布の意味 空間または時間の1単位あたり、 平均λ回起こる(ことがわかっている) 事象があるとする。 例1:製品1個あたり平均2個の傷が入る工芸品 いきなりこのような例を出されると、どこがベルヌイ試行(二項分布)と関係があるのかわかりにくいだろう。 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

ポアソン分布の意味 このとき、特定の1単位に、 実際にそれが 何回起こるかの確率 パラメータλのポアソン分布 例1:製品1個あたり平均2個の傷が入る工芸品 例2:ぶどうパン1個あたり平均2個の干しぶどうが入る工場 例3:昼間の1時間あたり平均3回の電話がかかる会社

ポアソン分布の意味 例1:製品1個あたり平均2個の傷が入る工芸品 区画数 N 区画に傷のある確率 p = 2 / N 各区画に傷ができる事象は独立 ∴ 製品1個の傷の個数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 2

ポアソン分布の意味 例2:パン1個あたり平均2個の干しぶどうが入る工場 × N 個 パンの数 N 干しぶどうの数 2N 干しぶどう1個がこのパンに入る確率 p = 1 / N 例1と異なり、1個のパンを細かく分割すると考えるとなんだかおかしいだろう。 たくさんの小麦粉とたくさんの干しぶどうを混ぜて、パンを無限に生産していくわけだから、パン1個あたりの干しぶどうの平均個数λを一定にして、パンの個数を増やした極限と考えればよい。 各干しぶどうがこのパンに入る事象は独立 ∴ パン1個の干しぶどうの個数 X は B(2N, p) に従う (2N個分のベルヌイ試行とみなせるから) 2N p = λ = 2

ポアソン分布の意味 例3:昼間の1時間あたり平均3回の電話がかかる会社 1時間を N等分 1区間に電話のかかる確率 p = 3 / N t1 t2 t1 t2 t1 t2 1時間を N等分 1区間に電話のかかる確率 p = 3 / N これは例1と同じ考え方の時間版 各区間に電話のかかる事象は独立 ∴ 1時間の電話の回数 X は B(N, p) に従う (N個分のベルヌイ試行とみなせるから) N p = λ = 3

ポアソン分布(例) λ=0.7のポアソン分布の値 馬に蹴られて死んだプロシアの兵士 (1875-1894) これは、ポアソン分布の応用発見にかかわる歴史的な例である(ポーランドの統計家ボルトキーヴィッツが1898年の論文でポアソン分布の適用例として示したもので、ポアソン分布自体の発見からは60年も経っていた)。 pが小さく、nが大きいと考えられる。現代では、交通事故死者数などがこれにあたるだろう。 λ=0.7のポアソン分布の値

ポアソン分布(例) 馬に蹴られて死んだプロシアの兵士 (1875-1894)

ポアソン分布(例題) X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。 例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 X を 1製品あたりの傷の個数とすると、 Xはパラメータλ=2 のポアソン分布に従う。 このように、ポアソン分布の問題では、N や p はぼかされており、「平均個数」のみが与えられる。このため、慣れないと解き方が分かりにくいかもしれない。

ポアソン分布(例題) 例題: 1個につき平均2個の傷が普通の工芸品がある。傷が5個以上ある製品は返品を受け付けている。製作した製品の何%が返品されると考えられるか。 約 5% ≒ 0.052

ポアソン分布の応用例 細胞内の染色体交替数、バクテリア数など、生物統計への応用 放射線物質の崩壊 在庫管理(いくつ仕入れておけば売り切れの確率をあるレベル以下にできるか) 電話や道路の混雑状況の見積もり→回線数をどれだけ用意すれば、(平常時は)十分やっていけるか etc…

ポアソン分布 ポアソン分布 二項分布のポアソン近似 ポアソン分布の意味 ポアソン分布の平均・分散

ポアソン分布の平均と分散 ポアソン分布に従うとき、 E(X) =λ V(X) =λ 確率変数 X がパラメータλの 二項分布の平均が np で、λ=np を一定にして n→∞ とした極限がパラメータλのポアソン分布だったから、ポアソン分布の平均がλであることは自然だろう。また二項分布の分散は npq で、qは1に近づくのだから、分散がλ=np になることもうなずける。 問のヒント:二項分布と同様に、階乗の性質を使う方法と、微分を使う方法がある。それぞれ、二項分布の場合と全く同様である。 (問) これらを確かめよ。

ポアソン分布のグラフ r =λ ポアソン分布 (λ=10 ) ( r = 0, 1, 2, …… ) 最大値 λが 10 で、わりと大きいので、かなり正規分布に近い形をしているが、まだ少し左にゆがんでいる。 ※注: λは整数とは限らないが、r は整数なので、λが整数でない場合の最大値はλの前後どちらかの整数(一番近くとは限らない)でとる。 r =λ 最大値

ポアソン分布のグラフとλ λによる変化 r → 1 2 λ= 0.7 λ= 1 λ= 2 λ= 3 λ= 5 λ= 8 1 2 λが小さいときは、r = 0, 1, 2 あたりの確率がほとんどで、あとは急速に減少していく。

メニューに戻る メニューへ