確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之
種々の公式(1) <規則1>大きさ n の標本から求めた標本平均 m の分布は,以下の性質をもつ. ① 標本平均 m の期待値(平均)E(m)は,母平均に等しい. ② 標本平均 m の分散V(m)は,母分散の 1/n 倍に等しい. ②’ 標本平均mの標準偏差D(m)は,母標準偏差の1/(√n)倍に等しい.
この式は,母集団の分布が正規分布以外の任意のものでも常に成り立つ. 種々の公式(2) <規則2>正規分布する母集団から無作為に抽出した,大きさ n の標本から得られる標本分散 s2 の期待値(平均) E(s2) と分散V(s2) とは,以下の式で与えられる. この式は,母集団の分布が正規分布以外の任意のものでも常に成り立つ.
種々の公式(3) <規則3>確率変数 X1 と X2 は互いに独立に分布し,かつ, とすると,和 Y = X1 + X2 および 差Z= X1 - X2 の期待値(平均)と分散は以下の式で与えられる. ポイント:この規則は,母集団の分布にかかわらず成り立つ.また,和の分散と差の分散とが等しく,かつ,いずれも元の分散の和になっている.
種々の公式(4) <規則4>確率変数Xの期待値(平均)が E(X)=μ, 分散が V(X)=σ2とする.このとき,以下の式が成り立つ.ただし,a は定数とする.
種々の公式(5) <対数の法則>平均μ,分散σ2の任意の母集団から,大きさnの標本を無作為に抽出して得られる確率変数を,X1,X2,・・・,Xn とするとき,これらの平均mと母平均μとの差がεを超える確率は,nを十分大きく取るとゼロに近づく.
種々の公式(6) <チェビシェフの不等式>母平均μ,母分散σ2 をもつ確率変数 X とその母平均との差について,以下の不等式が成り立つ.
種々の公式(7) <中心極限の定理>確率変数 X が,母平均μ,母分散σ2 をもつ(任意の)分布に従うとき,これから無作為に抽出した大きさ n の標本平均 m の分布は,n が大きくなるにつれて母平均μ,母分散σ2 /n の正規分布に従う. 正規分布の重要性 コメント:もとの母集団がどのようなものであっても,標本の大きさnが大きければ,標本平均mの分布はいつも正規分布で近似できる,ことは正規分布の重要性を示唆している.
重要な確率分布 正規分布は統計学において極めて重要な意味があることをみてきた.以下では,正規分布以外の主要な確率分布を紹介する.
重要な確率分布 正規分布 2項分布 ポアソン分布
2項分布 1回の試行で事象Aの起きる確立がpとする.このとき,n回の試行において事象Aが起きる回数Xの分布を,2項分布という.X=kとなる確率は,一般には以下の式で与えられる.
ポアソン分布 事象Aの生起確率pとする.いまpが極めて小さいとき,事象Aが生起する回数Xの分布を,ポアソン分布という.X=kとなる確率は以下の式で与えられる.
重要な性質(覚えてしまうと便利) 平 均 分 散 正規分布 μ σ2 2項分布 np npq ポアソン分布 λ
その他の確率分布 負の2項分布 幾何分布 超幾何分布 他項分布 t分布 指数分布 ガンマ分布 ワいブル分布 カイ2乗分布 一様分布 コーシー分布 ベータ分布 F分布 アーラン分布 などなど
確率の計算法 各分布に対して確率を計算する必要がしばしば発生する.その際,前述の定義式に従って計算してもよいが,実質的に計算不可能な場合も発生する.
2項分布の確率計算法 生起確率がpで,かつ,繰り返し回数がnの2項分布に対して,nが十分大きいときには,2項分布は,平均がnp,分散がnpqの正規分布で近似できる. さらに,平均m=np,分散σ2 =npqの正規分布は, 変数変換 により,平均ゼロ,分散1の標準正規分布となり,標準正規分布に関する確率計算値は,数表(正規分布表)から読み取ることができる.(計算をしなくてすむ!)
統計的検定
母平均に関する検定(標本の大きさnが大きいとき) 大標本の場合 帰無仮説H0の設定. H0:μ=μ0 実験・調査をして,標本平均m,標本分散s2を求める. |Z0|≧1.96ならば危険率5%で, |Z0|≧ 2.576ならば危険率1%で,仮説H0を棄却する.そうでないときは仮説を否定しない. 母集団が正規分布に近いときは,n≧30,そうでないときはn≧50とする. (注)ここの数値は正規分布表から得ている.
(注)ここの数値は正規分布表から得ている. 母平均の差の検定(大標本の場合) 帰無仮説H0の設定. H0:μA=μB 実験・調査をして大きさnAの標本Aと大きさnBの標本Bをもとめ,それらから標本平均mA, mB,標本分散sA2, sB2を求める. |Z0|≧1.96ならば危険率5%で, |Z0|≧ 2.576ならば危険率1%で,仮説H0を棄却する.そうでないときは仮説を否定しない. 母集団が正規分布に近いときは,n≧30,そうでないときはn≧50とする. (注)ここの数値は正規分布表から得ている.
母平均に関する検定(標本の大きさnが小さいとき) 小標本の場合 帰無仮説H0の設定. H0:μ=μ0 実験・調査をして,標本平均m,標本分散s2を求める. |t0|≧t(n-1,0.05)ならば危険率5%で, |t0|≧ t(n-1,0.01)ならば危険率1%で,仮説H0を棄却する.そうでないときは仮説を否定しない. 母集団が正規分布に近いときは,n≧30,そうでないときはn≧50とする. (注)ここの数値はt分布表から得ている.
(注)ここの数値もt分布表から得ている. 母平均の差の検定(小標本の場合) 帰無仮説H0の設定. H0:μA=μB 実験・調査をして大きさnAの標本Aと大きさnBの標本Bをもとめ,それらから標本平均mA, mB,標本分散sA2, sB2を求める. |t0|≧t(2(n-1),0.05)ならば危険率5%で, |t0|≧ t(2(n-1),0.01)ならば危険率1%で,仮説H0を棄却する.そうでないときは仮説を否定しない. (注)ここの数値もt分布表から得ている.
今後の勉強 t分布,t検定 F分布,F検定 区間推定 をまず勉強してください. その後,興味あるテーマを順次勉強してください. 区間推定 をまず勉強してください. その後,興味あるテーマを順次勉強してください. サンプル数(標本の大きさ)の決め方 無作為抽出法 分散分析 分散の検定,分散の差の検定 感性検査(嗜好の検査) などなど 統計の勉強は手を動かすことが大切!