統計学 11/19(月) 担当:鈴木智也
講義の全体構成 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 主な確率分布 ←ここ! ☆中間試験はここまで 第3部 推測統計:データから全体像を推測
主な確率分布 二項分布(離散型) これが基本型。 ポアソン分布(離散型) 二項分布から導出できる。 正規分布(連続型) これも二項分布から導出できる。
二項分布とは ☆結果が二通り(例:SかF)しかない実験 結果がSとなる確率をpで表す。 結果がFとなる確率は、q(=1-p)である。 この実験をn回行い、結果がSとなる回数をXとする。 ⇒Xは確率変数であり、その分布は二項分布(n, p)に従う。
二項分布:例題 実験:じゃんけん その結果 S=勝つ F=勝たない(負け、あいこ) 勝つ確率:p=1/3 勝たない確率:q=2/3 (n=3、x=1)
二項分布:例題の答え ケースA:一回目に勝つ場合の確率 (1/3)×(2/3)×(2/3)=(1/3)×(2/3)2 (1/3)×(2/3)×(2/3)=(1/3)×(2/3)2 ケースB:二回目に勝つ場合の確率 (2/3)×(1/3)×(2/3)=(1/3)×(2/3)2 ケースC:三回目に勝つ場合の確率 (2/3)×(2/3)×(1/3)=(1/3)×(2/3)2 注:A、B、Cは互いに排反。 ⇒3回中1回だけ勝つ確率は、3×(1/3)×(2/3)2。
二項分布の公式 X=xjという値を取る確率は P(xj)=nCx px qn-x =for j=1,…,n. nCx は、n 個のものから x 個のものを選び出す公式であり、 nCx = n!/{x!(n-x)!}。 注:n! は n の階乗であり、 n!=n×(n-1) ×(n-2) ×…×2×1である。
二項分布:期待値と分散 確率変数Xが二項分布に従う場合、 期待値:E(X)=np 分散:V(X)=npq=np(1-p) (証明は省略) 例:3回のじゃんけんで勝つ回数の期待値は1回。
二項分布からポアソン分布へ ☆次のような例を考えよう。 不動産業界で大型契約が成立する確率は低い。→ p=0.001(=0.1%)とする。 1000人の顧客と商談を行った( n=1000 )ときに、5件の大型契約を成功させる確率はいくらか? ⇒理論上は、ポアソン分布で計算できる。 P(X=5) =1000C5 0.0015 0.99995。
二項分布からポアソン分布へ② しかし、現実には計算が煩雑すぎる。 (1000C5 がいくつになるか試算してみよ。) この例のように、n→∞、p→0の場合、 np→m(定数) なら、二項分布はポアソン分布で近似する。 注:“A→B”は「Aの値がBに近づく」と読む。
ポアソン分布の公式 二項分布において、n→∞、p→0の場合、 X=xjの確率は P(xj)=(mxe-m)/x! で近似的に計算できる。 (注)なお、eは指数であり、m= npである 。
ポアソン分布:期待値と分散 確率変数Xがポアソン分布に従う場合、 期待値:E(X)=m 分散:V(X)=m 証明:二項分布の場合、期待値がnpであることから、ポアソン分布での期待値はmとなる。分散も同様に証明できる。
正規分布 連続型の確率分布で中心となるのが「正規分布(Normal Distribution)である。 正規分布は、期待値μを挟んで左右対称で、釣鐘型(教科書P.163の図)。 ☆特徴:期待値μと分散σ2が分れば、正規分布の形状は把握できる。
標準正規分布 確率変数Xが、期待値μで分散σ2の正規分布に従うとする。 X~N(μ,σ2) このとき、Xは次のように「標準化」できる。 Z=(X-μ)/σ~ N(0,1) 期待値0で分散が1の正規分布を「標準正規分布」(←この分布は頻出)と呼ぶ。
標準正規分布N(0,1)の性質 どのような正規分布であっても、前頁の式によって、 N(0,1)に変換できる。 Z~ N(0,1)のとき、確率変数 Z が z という値を取る確率を P で表すと、 P(-1.96 < z < 1.96) = 0.95 P(z >1.96) =0.025, P(z<-1.96) =0.025 であることが知られている。
正規分布と二項分布の関係 ☆二項分布 Bi(n,p)で n→∞, p→0のとき、二項分布は ポアソン分布で近似できる。 正規分布で近似できる。
第3部にむけて 第3部で習う重要なことがらは、「t‐検定」であり、それを理論的に支えるのが「中心極限定理」と「t‐分布」である。 第3部で習う重要なことがらは、「t‐検定」であり、それを理論的に支えるのが「中心極限定理」と「t‐分布」である。 ①中心極限定理で「正規分布」を使う。 ②また、その正規分布は「標準正規分布」に変換された後、t‐分布で近似される。