第6回 ベルヌイ試行、二項分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
統計解析 第7回 第6章 離散確率分布.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
統計学 12/3(月).
統計解析 第8回 第7章 2項分布.
統計学 11/13(月) 担当:鈴木智也.
Microsoft Excel 2010 を利用した 2項分布の確率計算
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計解析 第8回 第7章 2項分布.
統計学 11/19(月) 担当:鈴木智也.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学 12/13(木).
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
数理統計学 第11回 西 山.
第11回 中心極限定理 と 大数の法則 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
数理統計学 第4回 西山.
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第8回 二項分布の近似、ポアソン分布、正規分布
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学  第9回 西 山.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
Microsoft Excel 2010 を利用した 2項分布の確率計算
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

第6回 ベルヌイ試行、二項分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散 確率変数の共分散 ベルヌイ試行、二項分布 二項分布(続き)、幾何分布 ポアソン分布 正規分布 正規分布(続き) 大数の法則、中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!

ベルヌイ試行、二項分布 ベルヌイ試行 二項分布 ・二項分布の公式 ・例題 ・パラメータによるグラフの変化

ベルヌイ試行 例1:一個のサイコロを繰り返し投げる 例2:一個の硬貨を繰り返し投げる 正確には…: 独立試行の繰り返しのことをベルヌイ試行という。 例1:一個のサイコロを繰り返し投げる 例2:一個の硬貨を繰り返し投げる 正確には…:

ベルヌイ試行 試行結果は「成功」Sあるいは「失敗」Fのいずれか1つである。 成功確率 p は、試行を通じて一定である。(したがって失敗確率 q=1-p も一定。) 試行は独立である。すなわち、他の試行結果によって p の値は変化しない。 繰り返す回数のことをベルヌイ試行の長さという

ベルヌイ試行 例 サイコロ投げで、6の目が出るかどうか コイン投げ(表か裏か) 無作為に選ばれた動物のオスかメスかを知る 製品検査(良あるいは不良) マージャン(勝つか負けるか) カンニング(見つかるかどうか) 小泉内閣を支持するか否か 薬の投与によってある病気が治療するか否か 厳密に「同一条件」「独立試行」をみたすのは、偶然ゲームくらいしかないかもしれないが、ベルヌイ試行の条件が近似的に成立すると仮定することによって、次に述べる二項分布のような数学的モデルで観測値の説明を試みるのである。

ベルヌイ試行と二項分布 ベルヌイ試行 二項分布 ・二項分布の公式 ・例題 ・パラメータによるグラフの変化

二項分布 n=3, (1/6)がp, (5/6)がq=1-p この3は? 例: サイコロを3回投げ、1が出る回数 を X とする。 X の確率分布は「成功」確率 p=1/6 の二項分布。 X 1 2 3 確率 この3は? n=3, (1/6)がp, (5/6)がq=1-p

二項分布 例: サイコロを3回投げ、1が出る回数 を X とする。 たとえば、 X=2 となるのは 成功…○ 失敗…× ○○× ○×○ 成功…○ 失敗…× 1 2 3 ○○× ○×○ ×○○ 1,2,3の3つから2つ取る組み合わせ 3C2 の 3 とおりで、確率はどれも p2q だから、P( X=2 ) = 3C2 ・ p2q = 3 p2q

二項分布 例2: サイコロを4回投げ、1が出る回数 を X とする。 これだと、 X=2 となるのは 1 2 3 4 ○○×× ○×○× ○××○ ×○○× ×○×○ ××○○ 1,2,3,4 の4つから2つ取る組み合わせ 4C2 の 6 とおりで、確率はどれも p2q2 だから、P( X=2 ) = 4C2 ・ p2q2 = 6 p2q2

二項分布 ・この分布のパラメータは、 n と p の2つ (q=1-p) 一般に、 X の確率分布表として次のようなパターンが考えられる: 1 2 …… n-1 n 確率 nC0 p0 qn nC1 p1qn-1 nC2 p2qn-2 nCn-1 pn-1q1 nCn pnq0 = = = = = nCr は「n個からr個取る組み合わせ」 ・この分布のパラメータは、 n と p の2つ (q=1-p)

二項分布 確率変数 X の確率分布 P( X = x ) が次の式で与えられるとき、「Xは二項分布 B(n, p) に従う」 と言う : 二項展開の項になっていることから、二項分布と呼ぶ。記号「B」はBinary(二項)の略 「二項分布」といっても、特定の分布を指すわけではない。パラメータを含むから、ある種のパターンの分布の集まり全体についての名前である。(nとpの値によって、分布のグラフの形はかなり変る。) 問のヒント:二項展開の式を使う。 (問) これが確かに確率分布であることを確かめよ。

(回数以外の情報は捨てていることに注意) 二項分布になる例 ・長さ n のべルヌイ試行(一回あたりの「成功」確率pとする)で、「成功」の回数を X とする。 (回数以外の情報は捨てていることに注意) ・確率変数 X の分布は二項分布になる。 X のとりうる値は、0, 1, 2, …, n (離散型) B ( n , p )

(二項係数の計算法) 例: 理論(文字)計算用 実際(数値)計算用 高校などで習ったはずだが、いちおう復習。 r が n に近い場合は、nCr = n C n-r を使うと楽。たとえば、10C7 は 10C3 として計算すればよい。 例:

二項分布 参考: パスカルの三角形 1 1 1 1 1 1 1 1 1 1 1 1 2 2 3 3 3 二項係数をまとめて求めるときは、パスカルの三角形が便利。 4 6 4 4 5 10 10 5 5 n 行目 nC0 nC1 nC2 … nCn が順に並ぶ

二項分布(例題) 例題:不良品率が2%のとき、ランダムに選んだ10個のうち不良品が2個の確率を求めよ。 確率変数 X を「選んだ10個の中の不良品の個数」とすると、 X は B(10, 0.02) に従う。 解答の書き方について注意: B(10, 0.02) = 10C2(0.02)2(0.98)8 = … などと書いてはいけない。確率変数 X をきちんと定義すること。 よって

[1] 偏りのないコインを投げて、表が出たら勝ち、裏が出たら負けとする。 [演習] 二項分布 [1] 偏りのないコインを投げて、表が出たら勝ち、裏が出たら負けとする。   5回やって4回以上勝つのと、10回やって8回以上勝つのとでは、どちらが困難だろうか。 (どちらも勝率としては「8割以上」である。) ヒント:B(n,p)で、p=0.5 (1) 勝つ回数 X は B(5, p) に従うから、P( X=4 ) + P( X=5 ) = 5×(0.5)5 + (0.5)5 = 0.188 (2) 勝つ回数 X は B(10, p) に従うから、 P( X=8 ) + P( X=9 ) + P( X=10 ) = 45×(0.5)10 + 10×(0.5)10 + (0.5)10 = 0.055

(ちなみに本人は、直感的に「当然8割くらいはいけるだろう」と思っていたりする) [演習] 二項分布 [2] ある学生が「俺は試験ではいつも5問中3問解ける」とうそぶいている。いっぽう、O理科大学は、5問中3問解ければ合格できると言われている。入試問題が実際に5問だったとして、この学生がO理科大学に合格できる確率はいくらだろうか。  (ちなみに本人は、直感的に「当然8割くらいはいけるだろう」と思っていたりする) ヒント:正解数 X は B(5,p) に従う。p= 3/5 = 0.6 だから、 P( X=3 ) + P( X=4 ) + P( X=5 ) = 0.683 なんと7割ない! (もしこれが10問だったら、6問以上解ける確率は 0.633 とさらに下がる。)  なお、もしもこれが○×式の問題で、鉛筆倒しで答を選んだ場合、p=1/2=0.5と考えられるが、このとき5問中3問以上正解する確率は0.5。なんとでたらめに答を選んだ学生の半数が合格してしまう。合格基準を5問中4問以上に上げれば、でたらめに答を選んだ学生が合格する確率は0.1875つまり19%に下がる。  このように、二項分布を使えばいろいろなことがわかるのだ。そしてそれは、漠然とした直感とは異なることもある。

(1) 10発打ったとき、実際に3割つまり3発以上当たる確率 (2) 5発打ったとき、少なくとも1発当たる確率 を求めよ。 [演習] 二項分布 [3] 1発打って当たる確率が3割の人が、  (1) 10発打ったとき、実際に3割つまり3発以上当たる確率  (2) 5発打ったとき、少なくとも1発当たる確率 を求めよ。 ヒント:p=0.3 (1) 当たる回数 X は B(10, 0.3) に従う。3発未満しか当たらない確率は、P( X=0) + P( X=1 ) + P( X=2 ) = 0.383 だから、求める確率は 1 - 0.383 = 0.617 たったの6割ちょっと。 (2) 当たる回数 X は B(10, 0.3) に従う。 5発ともはずれる確率は、P( X=0 ) = (0.7)5 だから、求める確率は 1 - (0.7)5 = 0.832 なんと8割以上。

[4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。 [演習] 二項分布 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。  (1) 精度が0.999の部品1000個のうち、どの部品も故障しない確率を求めよ。  (2) 精度が0.999の部品10000個のうち、どの部品も故障しない確率を求めよ。 ヒント:(1) 故障する個数 X は、B(1000, 0.001) に従う。P( X=0 ) = (0.999)1000 = 0.37 (2)故障する個数 X は、 B(10000, 0.001) に従う。 P( X=0 ) = (0.999)10000 = 0.0000452 (←どうやって計算する?)  ちなみに、10000個の部品がどれも故障しない確率は、精度が0.99999では0.368, 0.999999では0.905, 0.9999999でやっと0.99となる。部品10000個の宇宙船が安心して飛べるためには、セブン-ナイン(小数点以下9が7つ)の精度が必要ということである。

メニューに戻る メニューへ