1.尺度の種類 2.単純集計 3.クロス集計とχ2検定 4.平均値の比較(t検定と分散分析) 5.課題 6.参考文献 夏休み課題:データ分析 1.尺度の種類 2.単純集計 3.クロス集計とχ2検定 4.平均値の比較(t検定と分散分析) 5.課題 6.参考文献
1.尺度の種類 ①名義尺度(nominal scale) e.g.性別(男性・女性)、職業 裁判員制度に関する知識(e.g. 問1) 裁判員制度に関する知識・情報を入手す るメディア(問16) ②順序尺度・序数尺度(ordinal scale) e.g.成績(1位・2位・3位・・・・・) 背の順(1番目・2番目・3番目・・・・) 好きな順位(1位・2位・3位・・・・・)
③間隔尺度・距離尺度(interval scale, distance scale) e.g.新聞閲覧時間(問14) 裁判員制度に対する考え(問8) (全くそう思わない、あまりそう思わない、どち らともいえない、ややそう思う、非常にそう思う) ④比例尺度(ratio scale)=ゼロがある e.g.成績(0点・・・・100点) 鉛筆の長さ(0cm・・・・・15cm) メディア別信用(問17)
表1 各尺度の特徴 定 義 順序関係 加減算 変数例 名義 カテゴリーやグループ なし × 性別、 学科・コース 順序 大小関係 あり 表1 各尺度の特徴 定 義 順序関係 加減算 変数例 名義 カテゴリーやグループ なし × 性別、 学科・コース 順序 大小関係 あり テレビ視聴時間(低・(中)・高に分けた場合) 間隔 程度の違い △ 「全くそう思わない」~「そう思う」 比例 ゼロから始まる測定値 〇 テレビ視聴時間(実数できいた場合)
2.単純集計 高度な分析を行う前に、回答の全体的特性を度数や平均値を求めて、把握しよう(=単純集計)。 度数=〇人(△%)など。グラフに描くとより分かりやすくなることが多い。 ←名義、順序、間隔 平均値(中央値)=標準偏差、分散といったデータの散らばり具合にも目を通すようにする。 ←間隔、比例
3.クロス集計とχ2検定 どのグループ(カテゴリー)にどんな回答が多いかをみるときに使用。合わせてχ2検定を行ってしまうことが多い。 <例題2>問26(性別)×問8-2(裁判員裁判への参加意欲) ①「分析」→「記述統計」→「クロス集計表」 ②“行”と“列”に関係をみる変数を入れる。 ③「統計量」→「カイ2乗」にチェック。 ④「セル」→“度数”「観測」「期待」、“パーセンテージ” 「行」「列」、“残差”「調整済みの標準化」にそれぞれ チェック。 ⑤「続行」→「OK」 ※アウトプットの見方(次ページ)と資料1を参照。
3-1.SPSSアウトプットの見方(Χ2検定の場合) ②自由度 ③χ2値 Value df Asymp. Sig. (2-sided) Pearson Chi-Square 21.881a 4 .000 Likelihood Ratio 23.224 Linear-by-Linear Association 12.415 1 N of Valid Cases 693 ちなみに、有意確率はそのまま値をp=.000やp=.043のように記すことも可能。 <(小なり)で記述する場合は、 ・p<.05(p=.010~.049) ・p<.01(p=.009~.001) ・p<.001(p=.000) 裁判員裁判への参加意欲が回答者の性別で異なるかを検討するために、χ2検定を行ったところ、男女の回答は有意に異なることが明らかとなった(χ2(4)=21.881, p<.001)。裁判員として裁判に参加したいという考えに「非常にそう思う」と回答した男性(35名、9.9%)は女性(8名、2.4%)よりも多かった。以上より、裁判員裁判への参加意欲が非常に積極的なのは、女性よりも男性であるといえる。
4.平均値の比較(t検定と分散分析) 同じ 2つの平均値の差を調べる→t検定 2つの平均値・3つ以上の平均値の差を調べる→分散分析 同じ なし 違う あり 2つの平均値の差を調べる→t検定 2つの平均値・3つ以上の平均値の差を調べる→分散分析 対応なしのt検定 分散(SD) ウェルチの検定 対応 (繰り返し) 対応ありのt検定
4-1.対応のあるt検定 <例題3>テレビと新聞の情報に対する信用度は 異なるか。 問17のテレビと新聞の平均値の差を検定する。 <例題3>テレビと新聞の情報に対する信用度は 異なるか。 問17のテレビと新聞の平均値の差を検定する。 ①「分析」→「平均の比較」→「対応のあるサンプルのt検 定」 ②“変数1”=テレビと“変数2”=新聞を選択 ③「OK」 ※アウトプットの見方(次ページ)と文章表現は資料2参照。
4-2.SPSSアウトプットの見方 (対応のあるt検定の場合) Paired Differences Df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 メディア別信用(テレビ) - メディア別信用(新聞) -8.433 17.687 .722 -9.851 -7.015 -11.680 599 .000 ③t値 ②自由度 テレビと新聞に対する信用度が異なるかを調べるために、対応のあるT検定を行った。すると、表△(図でもよい)に示されているように、「テレビ」(M=58.65%, SD=20.95)よりも「新聞」(M=67.08%, SD=21.39)の方が有意に信用度が高い(t(599)=11.68, p<.001)。
4-3.対応のないt検定 <例題4>問8-1(日本で裁判員制度が必要)対す考え が問26(性別)で異なるか調べる。 <例題4>問8-1(日本で裁判員制度が必要)対す考え が問26(性別)で異なるか調べる。 ①「分析」→「平均の比較」→「独立したサンプルのt検定」 ②「検定変数」に「問8-1」を、「グループ化変数」に問26を 入れる。 ③「グループの定義」で、グループ1(=1)と2(=2)に当てはま る数字を入力→「続行」→「OK」。 ※アウトプットの見方(分散が“同じ”か“異なるか”で検定結果の見方が異なる)は次ページと資料3と文章表現は資料3を参照。
4-4.SPSSアウトプットの見方 (対応のないt検定の場合) Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 制度への考え1(必要性) Equal variances assumed 11.551 .001 -.641 690 .522 -.049 .077 -.200 .102 Equal variances not assumed -.643 678.106 .520 .076 -.199 .101 ①等分散を仮定できるか確認。P<.05の場合「等分散を仮定できない」ので、下段の値をチェックする。 ①有意確率を確認。 p=.520(p>.05) ⇒ns(n.s.) ③t値 ②自由度 回答者の性別により、「裁判員制度は必要である」と考える程度が異なるかを明らかにするためにT検定を行った。すると、女性(M=3.15, SD=0.91)と男性(M=3.10, SD=1.09)で考え方に差がないことがわかった(t(678.106)=0.643, ns、表■参照)。
4-5.3つ以上のグループの差を調べる分散分析 「分析」→「平均の比較」→「一元配置分散分析」 <例題5>問9-1(有罪・無罪を的確に判断する自信)が問8-2(裁 判員裁判への参加意欲)によって異なるか? ⇒一元配置の分散分析 「分析」→「平均の比較」→「一元配置分散分析」 「因子」に「問8-2」、「従属変数リスト」に「問9-1」を 「オプション」→「記述統計量」「等分散性の検定」 「その後の検定」→「Tukey」「Dunnett T3」 ※次ページと資料4参照。 「分析」→「一般線型モデル」→「1変量」でもできる。 「分散分析」はt検定の2つの平均値の差を調べる場合も使える。
4-6.SPSSアウトプットの見方 (一元配置の分散分析の場合) ②自由度 ※分散分析の時は2つ!! ③F値 Sum of Squares df Mean Square F Sig. Between Groups 78.644 4 19.661 20.395 .000 Within Groups 663.255 688 .964 Total 741.899 692 裁判員裁判への参加意欲により裁判員として有罪・無罪を的確に判断する自信の程度が異なるかを調べるために分散分析を行った。その結果、裁判員裁判への参加意欲の主効果が認められた(F(4, 688)=20.395, p<.001、表★参照)。多重比較を行ったところ、裁判員裁判への参加意欲が低い者はそれが高い者よりも裁判員を務めることを大変だと感じていることが明らかになった。具体的には、裁判員裁判に裁判員として参加したいに「非常にそう思う」(M=3.21, SD=1.25)と回答した者は、他の回答者たちよりも判断に自信を持っていた。一方、「全くそう思わない」(M=2.00, SD=1.03)と回答した者は、他の回答者たちよりも判断に自信がなかった。また、「ややそう思う」(M=2.76, SD=1.00)と回答した者は「あまりそう思わない」(M=2.31, SD=0.90)と回答した者たちよりも自信を持っていた。つまり、概して裁判員裁判に対する参加意欲が高い方が有罪・無罪を的確に判断する自信を持っていることが明らかとなった。
<例題6>問26(回答者の性別)と問8-2(裁判員裁. 判への. 参加意欲) によって、問9-7(裁判員として冷 <例題6>問26(回答者の性別)と問8-2(裁判員裁 判への 参加意欲) によって、問9-7(裁判員として冷 静に判断する自信がある)の程度が異なる か? ⇒二元配置の分散分析 「分析」→「一般線型モデル」→「1変量」 「固定因子」→「問26」「問8-2」、 「従属変数」→「問9-7」 「オプション」→「記述統計」「等分散性の検定」 「その後の検定」、「因子」から「問8-2」を選択。「Tukey」も選択。 ※資料5参照
5.課題 χ2検定とt検定かχ2検定と分散分析による分析(結果の文章と表か図を分析ごとにA4版1枚に作成。それぞれプリントアウトして提出。表紙不要。ホチキスどめ不要。) 以下、 χ2検定についての課題を作成する手順です(参考まで)。 ①パワーポイントの手順に従って、自分でχ2検定を使用した 分析を行う。使用項目はパワポと違うものでも同じもの でも構わない。 ②パワポの「SPSSのアウトプットの見方」と「資料1」を参考に、 「結果の文章」を書く。 ③SPSSのアウトプットから、自分で表を作成する。 ④1枚の用紙に②と③をまとめる。グループ名、学籍番号、氏 名を忘れずに。
t検定もしくは分散分析についても、手順は、 χ2検定と同様ですが、一応手順を参考までに書いておきます。 ①パワーポイントの手順に従って、自分でt検定か分散分 析を使用した分析をしてみる。使用項目はパワポと 違うものでも同じものでも構わない。 ②パワポの「SPSSのアウトプットの見方」と「資料2~5」のい ずれかを参考に、「結果の文章」を書く。 ③SPSSのアウトプットから、自分で表か図を作成。 ④1枚の用紙②と③にまとめる。グループ名、学籍番号、氏 名を忘れずに記載する。
6.参考文献 広田すみれ (2005). 読む統計学使う統計学 慶應義塾大学出版会 ★岸 学 (2005). SPSSによるやさし統計学 オーム社 村井潤一郎・柏木恵子 (2008). ウォームアップ心理統計 東京大学出版会