analysis of survey data 第3回 香川大学経済学部 堀 啓造 調査データ分析 analysis of survey data 第3回 香川大学経済学部 堀 啓造
帰無仮説(H0) 変わりない。 (男女に)違いがない。同じだ。 ->連関がない。
対立仮説(H1) ->連関がある。 変わりがある。 (男女に)違いがある。同じでない。 5%水準(p<0.05) *
自由度の考え方 統計学としてきわめて重要
2×3の表の場合 周辺度数は?
ある特定のセルが決まったとき 11 12 13 198 21 22 23 102 190 49 61 300
周辺度数が決まっていると 2×3の場合 (2-1)×(3-1)=2 自由度=2 3×6の場合 (3-1)×(6-1)=10 自由度=10
自由度が決まるとχ2値の分布が決まる 次の分布図
山口和範『よくわかる統計解析の 基本と仕組み』秀和システム
5%水準の考え方 分布がわかると確率がわかる。χ2値からどれくらいの確率で起こったことかわかるので稀な出来事ならH0を棄却する。 稀か稀でないかを5%基準で考える。これは統計学の慣習。絶対的な値の意味はないがまあ、そんなもんです。
岩原信九郎『教育と心理のための推計学』文化科学社
岩原信九郎『教育と心理のための推計学』文化科学社
以前のデータ
帰無仮説を採択した場合 書き方に注意。検定方法,自由度,χ2値,「p値または有意水準(5%水準)」を明かにする。 5%水準で連関がない。
対立仮説を採択した場合 男女とファッションの個性において有意な連関がある(χ2(1)=5.76, p<0.05)。すなわち,男性のほうが女性に比べて人と違うファッションをしている。 どのようになっているかはっきり記す。 5%水準で有意な連関がある。
4月23日課題:χ2検定を正しく記せ(4月28日締め切り) 買物の好き嫌いと最もドキドキする買物の価格(博報堂生活総合研究所「4つの価格」2002)
2×3の表の場合 もっともバカな買物と思うのは? 博報堂生活総合研究所調査「4つの価格」(2002)
%を入れる
期待値の計算
χ2検定
調整済み残差 (絶対値が2.0より大きいか?)
調整済み残差と%
調整済み残差の計算 (覚えなくていい) (観測度数ー期待度数)/sqrt(期待度数)/sqrt((1-ヨコの周辺度数/総度数)・(1-タテの周辺度数/総度数)) (セル11)2.680908 (セル12)-1.43088 (セル13)-1.89566 正規分布しているものとしてズレをチェック。 p=0.05 -> 1.96=2.0, p=0.01 -> 2.57 =2.6
調整済み残差の利用 χ2検定において有意な連関があった場合,どのセルにおいて違いがあると言えるのかを明らかにする。 ただし,厳密な検定には他の方法を使う。 SPSSにおいて出力され簡単に利用できるのでこれを使う。これを使わない場合よりは精度が高い。
残差を含めた結果の記述 買物の好き嫌いとバカな買物と思う価格には有意な連関がある(χ2(2)=7.211, p<0.05)。残差分析を行った結果,買物好きは買物嫌いに比べ5割高以上の価格をバカな買物と考える率が高い。 (考察のところで,これは仮説に反する(と一致する)ものである。などの考察を加える)。
「わからない」と「価格をいった」群の2群に分けるとどういう結果になるか
調査と実験 実験は独立変数をコントロールする。 調査 朝 コーヒーを飲ませる 朝 コーヒーを飲ませない 朝 コーヒーを飲んだ人 朝 コーヒーを飲ませる 朝 コーヒーを飲ませない 調査 朝 コーヒーを飲んだ人 朝 コーヒーを飲まなかった人 調査ではほかの要因が紛れていることが普通。Ex 朝食を食べる、食べない 実験ではほかの要因が紛れることをなるべく少なくする。