寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp
講義で使用しているテキスト(ボーンシュテット & ノーキ)で学習した分割表の連関測度を,R で計算するには?
名義尺度での連関係数 最適予測係数(Guttman’s lambda) rapportパッケージをインストールし,lambda.test関数を使う. 表9.1 信仰する宗教と校内礼拝の否認判決に対する意見のクロス表 宗教 合計 判決に プロテスタント カトリック その他 賛成 338 (36.1%) 178 (42.1%) 114 (63.3%) 630 (41.1%) 反対 598 (63.9%) 245 (57.9%) 58 (33.7%) 901 (58.9%) 936 (100.0%) 423 (100.0%) 172 (100.0%) 1531 (100.0%) ボーンシュテット & ノーキ『社会統計学』第9章
コード table9_1 <- matrix(c(338,598,178,245,114,58), nrow=2, ncol=3, dimnames=list(判決 = c("賛成", "反対"), 宗教 = c("プロテスタント","カトリック", "その他"))) table9_1 # クロス集計表を出力 lambda.test(table9_1,0) # Guttman's lambda (Goodman & Kruskal's lambda) # 第2引数 # 0: 行変数と列変数の両方に対してラムダを計算 # 1: 行変数から列変数を予測する(行ごとに最頻値に注目) # 2: 列変数から行変数を予測する(列ごとに最頻値に注目)
出力 > table9_1 # クロス集計表を出力 宗教 判決 プロテスタント カトリック その他 賛成 338 178 114 反対 598 245 58 > > lambda.test(table9_1,0) $row [1] 0 $col [1] 0.08888889
順序尺度での連関測度 グッドマン=クラスカルの γ ケンドールの順位相関係数 τb 分割表に対して,青木繁伸先生のウェブにある,グッドマン・クラスカルのガンマを計算する関数を利用する. ケンドールの順位相関係数 τb 分割表に対して,青木繁伸先生のウェブにある,ケンドールのτb を計算する関数を利用する. 個票データ(講義テキスト9.3参照)の場合には,cor 関数を使って method = “kendall” オプションをつける(テキストp.127).
実習 ボーンシュテット & ノーキの表9.2を行列として入力し,グッドマン=クラスカルの γ とケンドールの順位相関係数 をそれぞれ計算する.青木先生が用意した関数 gamma2, tau.b を使う. round 関数を使って適当なところでまるめてよい テキストではそれぞれ 0.349 と 0.233 である.実習で得られた数値は符号が異なる.なぜか?
表9.2と操作仮説 性差別禁止の支持 性役割態度:「女性は家を守るべき」という意見に 強く賛成 賛成 反対 強く反対 強く支持 34 91 104 39 やや支持 89 281 200 27 やや反対 33 116 41 9 49 55 11 2 H1:女性は家にいて家事をすべきだという意見に反対 する人ほど,性差別禁止の法可決をより強く支持する.
順序尺度での連関測度 スチュアートの順位相関係数 τc ソマーズの係数 dyx 分割表に対して電卓を使うように計算を実行するか,自分で関数を定義する(それほどむずかしくない).
順位データの連関測度 スピアマンの順位相関係数 ρs 個票データに対して,cor 関数を使って method = “spearman” オプションをつける(テキストp.127). もともと順位が記録されている個票データならば,そのままピアソンの相関係数を計算すればよい.オプションをつける必要はない.
実習 テキスト第5章練習問題 (3) に取り組む.
2 * 2 表での連関測度 ユールの連関係数 Q ファイ係数 分割表から対角要素の積を計算して(テキストp.216-217),その和(分母)と差(分子)を使う. 青木繁伸先生のウェブにある,グッドマン・クラスカルのガンマを計算する関数を利用する. ファイ係数 方法1:個票データで2値のコード化(テキストp.67, p.233)をして,cor 関数を使う. 方法2:分割表に対して,パッケージ vcd のassocstats 関数を用いる.ピアソンの一致性係数 C とクラメルの V も出力される.
2 * 2 表での連関指数計算方法 オッズ・条件つきオッズ オッズ比 分割表から必要な要素を抜き出して計算する(テキストp.216-217) 分割表に対して,パッケージ vcd のoddsratio 関数を用いる.log=FALSE オプションをつける. 参考:藤井良宜『カテゴリカルデータ解析』(共立出版)第4章 Fisher の直接確率法(関数は fisher.test)では,オッズ比が出力される.
実習 ボーンシュテット & ノーキ『社会統計学』第9章問題の15に取り組む.Q,ファイ,オッズ比を計算.人口動態と地域のクロス表(1960-70年の63都市データ). 人口動態 減少・不変 増加 計 地域 西部 4 10 14 西部以外 30 19 49 34 29 63