4. 統計的検定 (ダイジェスト版) 保健統計 2013年度
Ⅰ 仮説検定の考え方 次のような問題を考える。 2012年のセンター試験、英語の平均点は124点であった。 Ⅰ 仮説検定の考え方 次のような問題を考える。 2012年のセンター試験、英語の平均点は124点であった。 T高校では3年生全員がセンター試験を受験したが、受験生の中から25人を選んで調査したところ、その平均点は135点であった。 T高校の生徒の英語の試験の成績は、全受験者平均より良いといえるだろうか。 ⇒ この疑問に対し、統計的に答える方法が統計的検定 母集団(T高校3年生全員) × 標本(n=25) × × × × × × × × × 標本平均x=135 母平均μ 検定(124点より良いかどうか)
T高校の受験生全体の英語の平均点をμとあらわすと、 H0: μ=124 H1: μ>124 a) 仮説の設定 1) 検定仮説、対立仮説 この問題において、 「T高校の生徒の英語の成績は全受験者平均と変わらない」 のか、 「T高校の生徒の英語の成績は全受験者平均より高い」 のかが知りたいことである。 T高校の受験生全体の英語の平均点をμとあらわすと、 H0: μ=124 H1: μ>124 という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。
検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。 検定仮説(H0) 検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。(この場合、T高校としては「全受験者平均より良い」という結論を出したいので、この仮説は否定してほしい) 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。 検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。
仮説検定は次のような手順をとる。 b) 仮説検定の手順 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ 仮説検定は次のような手順をとる。 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ 検定仮説の採択域と棄却域を設定する <ステップ3> 統計量が採択域 統計量が棄却域 <ステップ4> H0を採択 H1を採択
<ステップ2>仮説検定に適当な統計量 T高校の例では、25人の標本平均 𝑥 の分布は中心極限定理により、平均μ、分散 𝜎 2 𝑛 の正規分布にしたがう。 これを標準化した 𝑧= 𝑥 −𝜇 𝜎 𝑛 は標準正規分布にしたがうので、これが仮説検定に適当な統計量である。 (母分散が未知の場合は 𝑡= 𝑥 −𝜇 𝑠 𝑛 が自由度n-1のt分布にしたがうことを使う)
仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、 𝑥 は平均 𝜇=124 、 <ステップ3>採択域と棄却域の設定 仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、 𝑥 は平均 𝜇=124 、 標準偏差 𝜎 𝑛 = 40 25 = 40 5 =8 の正規分布にしたがう。 𝑧= 𝑥 −𝜇 𝜎 𝑛 = 135−124 40 25 = 11 8 =1.375となる。これは標本分布の95%の範囲内(両側検定の場合)である。⇒検定仮説を採択 𝑥 の分布 zの分布 標準化 →
もし、z=2.5という結果が出たなら、どのように考えれば良いのであろうか。( 𝑥 =144のとき、z=2.5となる。) この例の場合対立仮説を採択し、他の母集団(たとえばμ=145)から得られた標本と考える。 片側検定の場合は、 zが0よりだいぶ大きい場合、検定仮説を棄却して対立仮説を採択することになるが、このようなzの値は、μ<124を仮定した分布(たとえばμ=120)のすべてにおいて、検定仮説が棄却される。 zがここだったら検定仮説を棄却し、対立仮説を採択する。 zがここだったら検定仮説を棄却し、対立仮説を採択する。
片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、 採択域と棄却域は次のように設定される。 判定の境界値はそれぞれの統計量の分布による。(統計量の分布が標準正規分布で両側検定の場合は、-1.96と1.96の間に入れば採択域、それ以外が棄却域となる) 片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、 𝑧≤1.64 のとき検定仮説を採択し、 𝑧>1.64 のとき対立仮説を採択する。 t分布にしたがう変数であれば、α=.05の列から求める自由度のものを探す。(ここでは、t0.90と表記する。) 両側検定 棄却域 採択域 棄却域 片側検定 採択域 棄却域
Ⅱ 1つの標本にもとづく検定 a) 母分散が既知の場合の母平均の検定 次のような問題を考える。 Ⅱ 1つの標本にもとづく検定 a) 母分散が既知の場合の母平均の検定 次のような問題を考える。 (例) ある工場では直径5mmのねじを標準偏差0.04mmにおさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、9本を標本として選んだところ、その平均が4.97mmであった。これは品質管理上異常なしと考えて良いだろうか。 解) 1.仮説の設定 この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定するので、 H0: μ=5 vs. H1: μ≠5 と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異常がある」には、大きすぎると小さすぎるの両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる)。
この例では母分散が分かっているので、標本平均 𝑥 を用いて、 2.検定統計量 この例では母分散が分かっているので、標本平均 𝑥 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0から大きく離れていたならばこの仮定は誤りだったと考える。 𝑧= 𝑥 −𝜇 𝜎 𝑛 zがここだったら検定仮説が正しいが zがここだったら検定仮説は誤りで、 このような分布が正しいと考える。
この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定をおこなうなら、 −1.96≤𝑧≤1.96 のとき検定仮説を採択し、 −1.96≤𝑧≤1.96 のとき検定仮説を採択し、 𝑧<−1.96 または 𝑧>1.96 のとき対立仮説を採択する。 † 検定仮説が正しいなら、z>1.96またはz<-1.96となるような 𝑥 が選ばれる確率は5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味している。 4.統計量の計算 検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると となる。よって 𝑧<−1.96 なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。 棄却域 -1.96 採択域 1.96 棄却域 𝑧= 𝑥 −𝜇 𝜎 𝑛 = 4.97−5 0.04 9 = −0.03 0.04 3 = −0.09 0.04 =− 9 4 =−2.25