数理統計学 第12回 西 山
<検定>に入ります 推定と検定は一部重なっています。(前半) 検定独自の話題は<検出力>です。(後半) 検定は<二択問題>です <帰無仮説>と<対立仮説>が要点。 <両側検定>と<片側検定> 教科書: 163~164頁
【例題】検定入門 ある高校の1年生からランダムに9名を選んで100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 14.08、14.06、11.82、12.80 だった。学年全体の平均が12.0秒に達していると思ってよいか?
【解答】推定ですませても可 ① = 2.306 95%信頼区間: 12.7~14.3 サンプル数=9個 → 自由度=8 サンプル数=9個 → 自由度=8 ① = 2.306 95%信頼区間: 12.7~14.3 母集団の平均が12.0秒とは考えられない
【解答】その2 母平均に12.0秒を仮置きして、 サンプル平均を標準化のうえ判断 帰無仮説 T値が2.306(95%範囲)を超えることは ありえないと判断
推定と検定は、同じ割り切り ありえない! 採択域 棄却域 ありえる ありえない では、学年平均が13.0秒と考えていいですか?
練習問題【1】 正常なブレーキなら時速40KMから急ブレーキをかけたとき40メートルで止まれるはずとする。試みに同じ車で10回の停止実験をしたところ、 39.9, 41.4, 39.9, 41.3, 42.1, 42.0, 41.6, 42.3, 39.8, 41.8 という結果になった(単位:メートル)。 ブレーキは正常と判断してよいか。判断の信頼性とあわせて答えなさい。 ヒント: 標本平均=41.21 不偏分散=0.952
推定で回答します 自由度=9 サンプル平均 標準誤差 平均40メートルでは止まれません
仮置きする方が簡単! ブレーキは異常
では、母平均=41と判断してよいか? 標本平均=41.21 不偏分散=0.952 41はありえる
【例題】片側検定が必要な場合(左側) あるメーカーの新型電池は耐久時間を1000時間と表示している。最近、「すぐ切れる」というクレームが相次いで寄せられた。そのため、20個のサンプルをとって、計測してみると、以下の結果になった。 授業 ここまで(1限) 電池の生産に異常はないと言えるか?
検定を二択にする 帰無仮説 (正常) 仮置き! 対立仮説 (短い)
【考え方】寿命が長すぎても問題なし 帰無仮説(=仮置き値): μ=1000時間 有意水準 5% 限界値 正常 95% 異常 5% 1000
【解答】 限界値はT分布で決めると厳密! このサンプルは偶然ではない 異常発生!
練習問題【2】 正常なブレーキなら時速40KMから急ブレーキをかけたとき40メートルで止まれるはずとする。甘くなっていたブレーキを修理して試したところ 41.8, 41.6, 41.1, 39.1, 39.2, 39.8, 40.7, 41.0, 40.6, 43.1 という結果になった(単位:メートル)。 ブレーキは甘くないと判断してよいか。 ヒント: 標本平均=40.8 不偏分散=1.483
どんなT値を異常と判定する? 正常 異常 異常とするのは 高いT値だけ!
<片側検定>と呼びます 限界値 正常 異常 T値は高すぎる ブレーキはまだ甘い
標準値(T値)で限界値を決める点が勘どころ 検定は二択問題です 帰無仮説(仮置き) 対立仮説(異常状態) ブレーキは正常 vs ブレーキは異常 ブレーキは正常 vs ブレーキは甘い ブレーキは正常 vs ブレーキがききすぎる 血圧は正常 vs 高血圧! 運転技術は十分 vs まだ未熟 得点は合格 vs 得点は不合格 片側検定 標準値(T値)で限界値を決める点が勘どころ