統計解析第 11 回 第 15 章 有意性検定
今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力
中心極限定理 変量 X が平均 μ 、分散 σ 2 の確率分布に従うならば x の n 個の平均はだいたい平均 μ 、分散 σ 2 /n の正規分布に従う 例: 1,2,3 が 1/3 の確率で出るルーレット、期待値 2 、分散 2/3(0.66…) 、標準偏差 回の和は 3(3/3):1/27 4(4/3):3/27 5(5/3):6/27 6(6/3):7/27 7(7/3):6/27 8(8/3):3/27 9(9/3):1/27 期待値 6 分散 0.22 標準偏差 /1.73=0.4716
仮説の設定 ある女性は、ミルクティーに関して 「ミルクを先に入れたか、後に入れたか、飲めばわかる」 と主張する。 主張を確かめるために実験する ミルクを先に入れた紅茶 ミルクを後に入れた紅茶 をそれぞれ 1 杯ずつ用意して飲んでもらい、 当たるか否か確かめる。 帰無仮説: 彼女はわからない。 → 当たる確率は 1/2 対立仮説: 彼女はわかる。 → 当たる確率は 1/2 より大きい
有意水準と棄却域 テストを 10 回行う。 もし、当たる確率が 1/2 ならば、すなわち帰無仮説が正しいならば 彼女が当てる回数の確率は以下の通り n 回当てる確率 = 10 C n (1/2) n (1/2) 10-n 彼女が 9 回以上当てる確率 = = ≒ 1% 帰無仮説が正しいならば 起こりそうもない。
有意水準と棄却域(2) 有意水準:起こりそうもないという目安 例:有意水準 5%→5% 以下しか起こりそうにないことはうそ 棄却域:起こりそうもない結果 有意水準 5% の棄却域は 9 回以上 有意水準 10% の棄却域は 8 回以上 棄却域に落ちた結果は有意であるという 例: 10 回中 9 回以上当てたならば、 5% 有意水準で有意である。
片側検定と両側検定 製品を平均 1000g, 標準偏差 5g で生産する機械 1009g の製品が生産された。 帰無仮説が正しいとするとその結果が起こる確率は? 帰無仮説:機械は正しい → 平均 1000, 標準偏差 5 対立仮説:機械は正しくない → 平均 1000, 標準偏差 5 でない X ~ N(1000, 5 2 ) z=(x-1000)/5 とすると Z ~ N(0,1 2 ) x=1009→z=1.8 よって、 1009 以上の製品が生産される確率は P(x>1009)=P(z>1.8)=1-F(1.8)= ≒ % 有意で棄却 平均から 9 以上離れた製品が生産される確率は P(x>1009)+P(x 1008) ≒ % 有意で棄却されない 片側 検定 両側 検定
中心極限定理と一緒に使う 製品を平均 1000g, 標準偏差 5g で生産する機械 9 回の平均を計ったら 1003g であった。 帰無仮説:機械は正しい → 平均 1000, 標準偏差 5 対立仮説:機械は正しくない → 平均 1000, 標準偏差 5 でない 帰無仮説: N(1000, 5 2 )→9 回の平均~ N(1000,(5/3) 2 ) 対立仮説: N(1000, 5 2 ) でない →9 回の平均~ N(1000,(5/3) 2 ) でない 1003g は有意水準 5% で片側検定するとどうか? 有意水準 5% で両側検定するとどうか? ?
第 1 種の過誤と第 2 種の過誤 第 1 種の過誤:帰無仮説は本当は真の時、これを棄却する誤り。 第 2 種の過誤:帰無仮説が本当は偽の時、これを保持する誤り。 箱の中に白玉と黒玉がある 帰無仮説:白 10 、黒 90 対立仮説:白 50 、黒 50 第 1 種の過誤 白 10 、黒 90 で 4 つとも黒でない 非復元抽出で 4 個取り出す。 4 つとも黒ならば帰無仮説を採択、 そうでなければ帰無仮説を棄却 第 2 種の過誤 白 50 、黒 50 で 4 つとも黒 過誤の確率を知るには対立仮説で具体的に数値が与えられていないとだめ ? ?
検出力 検出力= 1 -(第 2 種の過誤の起こる確率) 第 2 種の過誤の起こる確率 → 帰無仮説が本当は偽の時、これを保持する確率 1 -(第 2 種の過誤の起こる確率) → 帰無仮説が本当は偽の時、これを棄却する確率