Download presentation
Presentation is loading. Please wait.
Published byRidwan Hermanto Modified 約 5 年前
1
第6回 ベルヌイ試行、二項分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率変数の共分散 ベルヌイ試行、二項分布 二項分布(続き)、幾何分布 ポアソン分布 正規分布 正規分布(続き) 大数の法則、中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!
2
ベルヌイ試行、二項分布 ベルヌイ試行 二項分布 ・二項分布の公式 ・例題 ・パラメータによるグラフの変化
3
ベルヌイ試行 例1:一個のサイコロを繰り返し投げる 例2:一個の硬貨を繰り返し投げる 正確には…:
独立試行の繰り返しのことをベルヌイ試行という。 例1:一個のサイコロを繰り返し投げる 例2:一個の硬貨を繰り返し投げる 正確には…:
4
ベルヌイ試行 試行結果は「成功」Sあるいは「失敗」Fのいずれか1つである。
成功確率 p は、試行を通じて一定である。(したがって失敗確率 q=1-p も一定。) 試行は独立である。すなわち、他の試行結果によって p の値は変化しない。 繰り返す回数のことをベルヌイ試行の長さという
5
ベルヌイ試行 例 サイコロ投げで、6の目が出るかどうか コイン投げ(表か裏か) 無作為に選ばれた動物のオスかメスかを知る
製品検査(良あるいは不良) マージャン(勝つか負けるか) カンニング(見つかるかどうか) 小泉内閣を支持するか否か 薬の投与によってある病気が治療するか否か 厳密に「同一条件」「独立試行」をみたすのは、偶然ゲームくらいしかないかもしれないが、ベルヌイ試行の条件が近似的に成立すると仮定することによって、次に述べる二項分布のような数学的モデルで観測値の説明を試みるのである。
6
ベルヌイ試行と二項分布 ベルヌイ試行 二項分布 ・二項分布の公式 ・例題 ・パラメータによるグラフの変化
7
二項分布 n=3, (1/6)がp, (5/6)がq=1-p この3は? 例: サイコロを3回投げ、1が出る回数 を X とする。
X の確率分布は「成功」確率 p=1/6 の二項分布。 X 1 2 3 確率 この3は? n=3, (1/6)がp, (5/6)がq=1-p
8
二項分布 例: サイコロを3回投げ、1が出る回数 を X とする。 たとえば、 X=2 となるのは 成功…○ 失敗…× ○○× ○×○
成功…○ 失敗…× ○○× ○×○ ×○○ 1,2,3の3つから2つ取る組み合わせ 3C2 の 3 とおりで、確率はどれも p2q だから、P( X=2 ) = 3C2 ・ p2q = 3 p2q
9
二項分布 例2: サイコロを4回投げ、1が出る回数 を X とする。 これだと、 X=2 となるのは
○○×× ○×○× ○××○ ×○○× ×○×○ ××○○ 1,2,3,4 の4つから2つ取る組み合わせ 4C2 の 6 とおりで、確率はどれも p2q2 だから、P( X=2 ) = 4C2 ・ p2q2 = 6 p2q2
10
二項分布 ・この分布のパラメータは、 n と p の2つ (q=1-p) 一般に、 X の確率分布表として次のようなパターンが考えられる:
1 2 …… n-1 n 確率 nC0 p0 qn nC1 p1qn-1 nC2 p2qn-2 nCn-1 pn-1q1 nCn pnq0 = = = = = nCr は「n個からr個取る組み合わせ」 ・この分布のパラメータは、 n と p の2つ (q=1-p)
11
二項分布 確率変数 X の確率分布 P( X = x ) が次の式で与えられるとき、「Xは二項分布 B(n, p) に従う」 と言う :
二項展開の項になっていることから、二項分布と呼ぶ。記号「B」はBinary(二項)の略 「二項分布」といっても、特定の分布を指すわけではない。パラメータを含むから、ある種のパターンの分布の集まり全体についての名前である。(nとpの値によって、分布のグラフの形はかなり変る。) 問のヒント:二項展開の式を使う。 (問) これが確かに確率分布であることを確かめよ。
12
(回数以外の情報は捨てていることに注意)
二項分布になる例 ・長さ n のべルヌイ試行(一回あたりの「成功」確率pとする)で、「成功」の回数を X とする。 (回数以外の情報は捨てていることに注意) ・確率変数 X の分布は二項分布になる。 X のとりうる値は、0, 1, 2, …, n (離散型) B ( n , p )
13
(二項係数の計算法) 例: 理論(文字)計算用 実際(数値)計算用 高校などで習ったはずだが、いちおう復習。
r が n に近い場合は、nCr = n C n-r を使うと楽。たとえば、10C7 は 10C3 として計算すればよい。 例:
14
二項分布 参考: パスカルの三角形 1 1 1 1 2 2 3 3 3 二項係数をまとめて求めるときは、パスカルの三角形が便利。 4 6 4 4 5 10 10 5 5 n 行目 nC0 nC1 nC2 … nCn が順に並ぶ
15
二項分布(例題) 例題:不良品率が2%のとき、ランダムに選んだ10個のうち不良品が2個の確率を求めよ。
確率変数 X を「選んだ10個の中の不良品の個数」とすると、 X は B(10, 0.02) に従う。 解答の書き方について注意: B(10, 0.02) = 10C2(0.02)2(0.98)8 = … などと書いてはいけない。確率変数 X をきちんと定義すること。 よって
16
[1] 偏りのないコインを投げて、表が出たら勝ち、裏が出たら負けとする。
[演習] 二項分布 [1] 偏りのないコインを投げて、表が出たら勝ち、裏が出たら負けとする。 5回やって4回以上勝つのと、10回やって8回以上勝つのとでは、どちらが困難だろうか。 (どちらも勝率としては「8割以上」である。) ヒント:B(n,p)で、p=0.5 (1) 勝つ回数 X は B(5, p) に従うから、P( X=4 ) + P( X=5 ) = 5×(0.5)5 + (0.5)5 = 0.188 (2) 勝つ回数 X は B(10, p) に従うから、 P( X=8 ) + P( X=9 ) + P( X=10 ) = 45×(0.5) ×(0.5)10 + (0.5)10 = 0.055
17
(ちなみに本人は、直感的に「当然8割くらいはいけるだろう」と思っていたりする)
[演習] 二項分布 [2] ある学生が「俺は試験ではいつも5問中3問解ける」とうそぶいている。いっぽう、O理科大学は、5問中3問解ければ合格できると言われている。入試問題が実際に5問だったとして、この学生がO理科大学に合格できる確率はいくらだろうか。 (ちなみに本人は、直感的に「当然8割くらいはいけるだろう」と思っていたりする) ヒント:正解数 X は B(5,p) に従う。p= 3/5 = 0.6 だから、 P( X=3 ) + P( X=4 ) + P( X=5 ) = なんと7割ない! (もしこれが10問だったら、6問以上解ける確率は とさらに下がる。) なお、もしもこれが○×式の問題で、鉛筆倒しで答を選んだ場合、p=1/2=0.5と考えられるが、このとき5問中3問以上正解する確率は0.5。なんとでたらめに答を選んだ学生の半数が合格してしまう。合格基準を5問中4問以上に上げれば、でたらめに答を選んだ学生が合格する確率は0.1875つまり19%に下がる。 このように、二項分布を使えばいろいろなことがわかるのだ。そしてそれは、漠然とした直感とは異なることもある。
18
(1) 10発打ったとき、実際に3割つまり3発以上当たる確率 (2) 5発打ったとき、少なくとも1発当たる確率 を求めよ。
[演習] 二項分布 [3] 1発打って当たる確率が3割の人が、 (1) 10発打ったとき、実際に3割つまり3発以上当たる確率 (2) 5発打ったとき、少なくとも1発当たる確率 を求めよ。 ヒント:p=0.3 (1) 当たる回数 X は B(10, 0.3) に従う。3発未満しか当たらない確率は、P( X=0) + P( X=1 ) + P( X=2 ) = 0.383 だから、求める確率は = たったの6割ちょっと。 (2) 当たる回数 X は B(10, 0.3) に従う。 5発ともはずれる確率は、P( X=0 ) = (0.7)5 だから、求める確率は 1 - (0.7)5 = なんと8割以上。
19
[4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。
[演習] 二項分布 [4] ある部品が一定期間内に故障を起こさない確率を「精度」と呼ぼう。 (1) 精度が0.999の部品1000個のうち、どの部品も故障しない確率を求めよ。 (2) 精度が0.999の部品10000個のうち、どの部品も故障しない確率を求めよ。 ヒント:(1) 故障する個数 X は、B(1000, 0.001) に従う。P( X=0 ) = (0.999)1000 = 0.37 (2)故障する個数 X は、 B(10000, 0.001) に従う。 P( X=0 ) = (0.999)10000 = (←どうやって計算する?) ちなみに、10000個の部品がどれも故障しない確率は、精度が では0.368, では0.905, でやっと0.99となる。部品10000個の宇宙船が安心して飛べるためには、セブン-ナイン(小数点以下9が7つ)の精度が必要ということである。
20
メニューに戻る メニューへ
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.