エクセルと SPSS による データ分析の方法 社会調査法・実習 資料
仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数
1.クロス表の分析 二つのカテゴリー変数を組み合わせた 度数分布をクロス表という。 ただし、連続量でもカテゴリー化する ことによってクロス表分析を用いるこ とはできる。 二つの変数の独立性を検定する方法に χ2 乗検定がある。
クロス表の例( SPSS によるアウト プット)
χ2 乗検定の例 下の結果は5%水準で統計的に有意であり、 二つの変数が独立という帰無仮説を棄却でき ることを示す。つまり、性別とテレビ視聴時 間には関連がある、と言える。
エクセルによるクロス表の分析 例 関数( COUNTIF など)による処 理では、クロス表の分析は面倒な ようである。 「ピボットテーブルとグラフレ ポート」のメニュを利用する。
クロス表の作成 「データ」 → 「ピボットテーブル/ピボットグラフ を選択」
出来上がったクロス表
クロス表のその後の分析 1. 縦%、横%の計算 2.χ2 乗検定による独立性の検定をする 3. 検定結果が有意だった場合は、どう いう傾向があるかを縦%、横%から読 みとる。 (ただし、前頁のクロス表は、 χ 2乗検 定には適合していないことに注意)
クロス表の読み方
χ2 検定は、セルの期待値(実測値で もほぼ同様)が 5 以下のものがある場 合は有効でない。 (200人の調査では、5 × 5のクロ ス表では、5以下のセルがあること の方が多いであろう。)
2 × 2のクロス表の場合の χ 2乗検定
χ2 値は、公式によって求められる。(前頁 の数式バーを参照、 2×2 以外の場合は単一 の式で計算するのは複雑であるので各自で 工夫してほしい) 自由度は( 2-1 ) × ( 2-1 )= 1 χ.05 2 ( 1 )= 3.84 > だから 2 つの 変数(Q1とQ2)が独立という帰無仮説 を棄却できない。つまり、Q1とQ2に関 連があるとは言えない。
2.T検定(平均値の差の検 定) 男女の比較のように二つのグループの 間での平均値の差を分析するのに使う。 比較したいグループが3つ以上の場合 は、分散分析を使う。
T 検定の分析方法 エクセルの「ツール」 → 「分析ツー ル」を用いて分析する。 まず従属変数が群間で分散が等しいか どうかの検定 (F 検定 ) を行なう。
T 検定の分析方法(続き) 分散の検定( F 検定) ↓ 等分散の帰無仮説を棄却できる場合は、 「等分散を仮定した2標本によるt検 定」 棄却される場合は、「分散が等しくな いと仮定した2標本によるt検定」
データ例 B 列に性別 ( 1、2で入力 ) 、 C 列に収入 が入っている。 B 列でグループ分けして比較するの で、あらかじめ B 列の値でデータをソートしておく 。
F 検定の結果 ( 省略 ) は、5%水準で等分散という 帰無仮説を棄却できなかった。したがって、等分 散を仮定したt検定を分析ツールの中から選択す る ( 下の図 ) 。
得られた結果
t値は 、自由度は 197 である。両側検定 ( 通常は両側 検定を用いる ) での有意確率を みると であり、帰無仮説 を有意水準 5 %で棄却できない 。したがって、両集団の収入 の平均値は等しいと見なされ る 。
3.相関係数 相関係数とは、二つの量的変数の関係 の強さを表す指標であり、-1から+ 1の範囲をとる。二つの変数が完全な 線形関係にある場合、正の相関ならば +1、負の相関ならば-1となる。
エクセルによる相関係数の計算 「ツール」 → 「分析ツール」を使う方 法と、関数を使う方法がある。相関係 数だけを単純に求める場合は、関数を 使った方が簡単であろう( CORREL )。
なお、本資料(スライド)は、下 記のURLアドレスにて公開して いる。 ~ishii/education/slide.html