様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定 ① 1標本の検定 1つの母集団における母数についての仮説を検定する 例:静大生のパソコン保有率は50%を越えているのだろうか? 浜松市の1世帯当たりの年間収入の平均値は300万を越えているのだろうか? ② 2標本の検定 2つの母集団における2つの母数間の関係についての仮説を検定する 例:静大生と浜医大生のパソコン保有率には差があるのだろうか? 浜松市と静岡市在住者の通勤時間には差があるのだろうか? ③ 3標本以上の検定 3つの以上の母集団における母数間の関係についての仮説を検定する 例:静大生では学年(1~4年)によってアルバイト収入に差があるのだろうか? 静大では、プロ野球セントラルリーグの各チームを好む比率に差があるのだろうか? ④ 2変数間の関連の強さに関する検定 得られた標本相関係数の値から考えて、母相関係数は0でないといえるのだろうか? 得られたクロス表から判断して、2変数間に関連があると言えるのだろうか?
1標本の比率の検定 検定の場面 1つの母集団の母比率に対する仮説を、その母集団からのn個の無作為標本から求めた標本比率に基づいて検定する。 仮説の設定 帰無仮説 : 母比率πは、π0である → μ= π0 対立仮説 : 母比率はπ0でない → π≠ π0 (両側検定) 帰無仮説が正しい場合の標本比率の分布 平均π0 分散π0(1-π0)/n の正規分布で近似できる 標本分布における実現値の位置による判定 帰無仮説を棄却 帰無仮説を棄却できない
1標本の比率の検定 : 具体的な手順 標準化
1標本の比率の検定 : 具体例 静大生からの無作為標本100名に基づく政党支持調査によれば、「支持政党無し」が55%であった。この結果から、静大生の半分以上は「支持政党無し」と判断して良いであろうか? 有意水準5% 帰無仮説:静大生の「支持政党無し」の比率は50%である 対立仮説:静大生の「支持政党無し」の比率は50%ではない 帰無仮説が正しい場合の標本比率の分布 平均0.5、分散0.5(1-0.5)/100=0.0025 (標準偏差0.05) の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却されない(半分以上が「支持政党無し」であるとは言えない)
2標本の比率の差の検定 検定の場面 帰無仮説 帰無仮説が正しい場合の標本比率の分布( π1=π2=πとする) 2つの母集団における2つの母比率間の関係についての仮説を検定する 例: 浜松キャンパスの静大生と静岡キャンパスの静大生では、ジュビロを支持する比率に差があるのだろうか? 検定の場面 2つの母集団における母比率の差(π1-π2)に対する仮説(帰無仮説)を、それぞれの母集団から独立に得たn1、n2個の無作為標本に基づく標本比率p1、p2から検定する。 帰無仮説 一般的には母比率の差に対する仮説π0=π1-π2であるが、殆どのケースではπ0 =0,つまり、 π1=π2を帰無仮説とする。 帰無仮説が正しい場合の標本比率の分布( π1=π2=πとする) 平均 0(= π1-π2)、分散π1(1-π1)/n1+ π2(1-π2)/n2 =π(1-π){1/n1+ 1/n2} 正規分布で近似 但し、πは不明 → どのように推定するか? 2つの母集団で母比率は等しい → 2つの集団を込みにして母比率の推定値を求める 母集団1 母集団2
2標本の比率の差の検定 : 具体的な手順 標準化
静岡、及び浜松に在住の大学生からそれぞれ100名、50名を無作為に抽出し、 「ジュビロ磐田」に対する好みを尋ねたところ、静岡では50%、浜松では70%が「好き」と回答した。この結果から、静岡、浜松在住の学生では、「ジュビロ磐田」に対する好みの傾向が異なると言えるか? 有意水準5% 2標本の比率の差の検定 具体例 帰無仮説:静岡と浜松在住の学生の間には、「ジュビロ」に対する好みの差はない 対立仮説:静岡と浜松在住の学生では、「ジュビロ」に対する好みが異なる 2つの標本に共通な比率の推定 帰無仮説が正しい場合の比率の差の分布 平均0、分散0.57(1-0.57)(1/100+1/50)=0.00735 (標準偏差0.0858)の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却される