Download presentation
Presentation is loading. Please wait.
1
社会統計 第11回 多重分割表分析の論理(第10章)
社会統計 第11回 多重分割表分析の論理(第10章) 寺尾 敦 青山学院大学社会情報学部
2
イントロダクション ここまでは,主に,2変数間の関係を検討してきた
2変数の分割表 1要因分散分析 第10章と第11章では,3変数以上の関係を検討する.多変量解析(multivariate analysis) 多重分割表(multivariate contingency table) 重回帰分析(multiple regression analysis)
3
10.1 . 付加変数の統制 イギリスでは,コウノトリの多い地域では,出生率が高い.コウノトリが赤ちゃんを連れてくるのだろうか?
イギリスでは,コウノトリの多い地域では,出生率が高い.コウノトリが赤ちゃんを連れてくるのだろうか? 参考:太郎丸『カテゴリカル・データ解析入門』第6章 10.1.1節では,イギリスではなくオランダとしている. X と Y に共変動(covariation)が見られても,それは直ちに因果関係の存在を意味しない. X が Y に影響(間に Z を媒介する場合も含む) Y が X に影響 第3の変数 Z が X と Y の両方に影響
4
都市化が進むと,コウノトリの数は少なくなり,出生率も下がる.
都市化の程度 出生率
5
コウノトリの数と出生率の間に因果関係がまったく存在しないことは,常識的に明らか.
これは明らかに,みかけの共変動 一般に,2変数間の関係を明確化するために,この関係に混入しうる第3の変数の影響を統制する必要がある.
6
2変数の真の関係を明確にするために,他の変数(Z)の影響を統制したい.
2変数間の真の共変動がどれだけあるかを確かめるには,みかけ上の共変動から他変数に起因する部分を除去する必要がある. 実験における変数の統制 恒常化:どの条件においても,変数の影響を一定にする 無作為化:変数の影響をランダムにする.
7
調査研究では,実験のような変数統制ができないことがほとんど.
研究対象となる人あるいはものの属性を,研究者が物理的に操作できない. 2変数の関係に影響すると考えられる付加変数を確定し,その付加変数を測定し,統計的操作によって付加変数の影響を統制する.
8
2変数関係に影響する要因のすべてを識別して分析に加えることは不可能.
したがって,付加変数として何を取り上げるかを決めるために,理論が極めて重要となる.
9
2変数間関係に他変数が混入するパターン 疑似関係(疑似相関) 媒介関係 複合因果
10
疑似関係 疑似関係(spuriousness):2変数 X と Y の共通原因となっている別の変数 Z が存在するために,2変数 X と Y の間に相関関係(疑似相関,spurious correlation)が見られること. 例:コウノトリの数(X)と出生率(Y) 因果関係を主張するために必要なこと 時間的順序 理論的説明 疑似相関の検討
11
興味ある2変数間に因果関係はないが,共通する原因変数が2変数間に共変動をもたらしている場合,その共通原因の影響を統計的に一定に保つことによって,見かけ上の共変動を除去できる.
統計的統制を行っても共変動関係が残れば,2変数間に因果関係が存在する可能性は高くなる.
12
10.1.2. 媒介関係 媒介関係(intervening relation):独立変数と従属変数を媒介する変数が存在する関係. X Z Y
媒介関係 媒介関係(intervening relation):独立変数と従属変数を媒介する変数が存在する関係. 例:年齢(X)と道徳的保守性(Y)を信仰の強さ(Z)が媒介.信仰の強さを一定にすれば(たとえば,信仰の程度が同程度の人を集めれば),年齢と道徳的保守性の共変動は小さくなる. X Z Y 媒介関係
13
直接効果と間接効果 直接効果 Y X 間接効果 Z
安田三郎『社会統計学』p.103 直接効果がなくても,X と Y の相関を疑似相関とは言わない.間接的とはいえ,因果関係が存在するから.
14
媒介関係と疑似関係 X Y X Y Z Z
15
疑似関係と媒介関係は,第3の変数の影響を一定に保ったときに興味ある2変数の共変動関係が小さくなるという点において同じ.
しかし,関係の実質的意味は異なる. 疑似関係なのか媒介関係なのかは,統計分析からは決定できない.理論や,解釈のしやすさから決まる.
16
10.1.3. 複合因果 人間の行動が単一要因によるものだと断定する社会理論はほとんどない.
複合因果 人間の行動が単一要因によるものだと断定する社会理論はほとんどない. 複合因果(multiple causation):原因となる変数が複数ある因果関係 興味ある従属変数に対して,複数の独立変数が持つ,複合的で同時的な関係を検討する.
17
検討されるもの 分析方法 独立変数(要因)の集合全体としての効果
疑似関係や媒介関係を統制したときの,独立変数それぞれの効果(相対的な重要性) 要因の組み合わせの効果(交互作用) 分析方法 多要因の分散分析 重回帰分析 多重分割表の分析(疑似関係,媒介関係の分析によく用いられる)
18
10.2. 2×2 表における 第3の変数の統制 多重クロス表:3変数以上の変数のクロス表
10.2. 2×2 表における 第3の変数の統制 多重クロス表:3変数以上の変数のクロス表 2変数間の関係がクロス表に整理されているとする.このとき,第3の変数の影響を検討するために,3重クロス表を用いる. 立体的な表を作ることは難しいので,第3の変数の値に応じて,2重クロス表を複数作成する. ここでは,どの変数も2値変数である場合を説明する. 2×2×2表
19
10.2.1. 仮想例:家族の信仰と 10代の性行動 零次の表(zero-order table):統制される変数がない分割表
信仰の強さと婚前性交の間に相関関係 家族は信仰深い? 計 いいえ [0] はい [1] 婚前性交 ある [1] 39.1% 16.0% 27.1% ない [0] 60.9% 84.0% 72.9% 100% (92) 100% (100) 100% (192) ファイ係数:φ = -0.26
20
家族の信仰と婚前性交との関係に,何らかの第3の変数は存在するか?
性体験を促す機会が頻繁にあるかどうかが,婚前性交の有無に影響するのでは? 信仰深い家庭は,行動への束縛が強く,そうした機会が少ないのでは? 自動車を日常的に使用しているかどうかを,第3の変数として検討してみてはどうだろうか.
21
第3の変数の影響を検討するために,1次の表(first-order table)を作る.
第3の変数のカテゴリごとに,興味ある2変数のクロス表を作成する. 次数は統制される変数の数を表す. これにより,第3の変数の影響を一定にして(第3の変数の影響が同じ部分ごとに),興味ある2変数間の関係を検討できる.
22
第3変数に効果がない場合 1次の表(下位表)で認められる関係が,零次の表で認められる関係と変わらなかったとする(次のスライド).このとき,第3の変数は(零次の表での)共変動に効果を持たない. 条件つき相関係数(conditional correlation coefficient):第3の変数ごとに作った分割表(下位表)におけるファイ係数.これらの値はほぼ同じで,零次の表でのファイ係数と変わらない. オッズ比も変化していない.(確かめてみよ)
23
ファイ係数:φ = -0.27 ファイ係数:φ = -0.25 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交
ある 39.7% 15.9% 27.3% (36) ない 60.3% 84.1% 72.7% (96) 100% (63) 100% (69) 100% (132) ファイ係数:φ = -0.27 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 37.9% 16.1% 26.7% (16) ない 62.1% 83.9% 73.3% (44) 100% (29) 100% (31) 100% (60) ファイ係数:φ = -0.25
24
統制される変数(自動車の使用)と,興味ある2変数それぞれとのクロス集計表を作成してみる.
1次の表での周辺度数を使って作成できる. 信仰深い家庭では,そうでない家庭に比べ,自動車を自由に使用させているのか? 自動車を日常的に使用している若者は,そうでない若者に比べ,婚前性交の経験率が高いのか?
25
ファイ係数:φ = -0.006 ファイ係数:φ = -0.006 家族は信仰深い? 計 いいえ はい 自動車を使用? 31.5% (29)
31.0% (31) 31.25% 68.5% (63) 69.0% (69) 68.75% 100% (92) 100% (100) 100% (192) ファイ係数:φ = 自動車を使用? 計 いいえ はい 婚前性交 ある 27.3% (36) 26.7% (16) 27.1% ない 72.7% (96) 73.3% (44) 72.9% 100% (132) 100% (60) 100% (192) ファイ係数:φ =
26
第3変数が部分的効果を 持つ場合 下位表において,興味ある2変数の関係は依然として認められるが,その関係の強さが弱くなったとする.(次のスライド) このとき,第3の変数は,2変数間の連関を部分的に説明する. 家族が信仰深くてもそうでなくても,自動車を使用することで,婚前性交の経験率が上昇する. 興味ある2変数の共変動関係は,弱くはなったが残っている.
27
ファイ係数:φ = -0.16 ファイ係数:φ = -0.17 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交
ある 25.5% 12.9% 17.4% ない 74.5% 87.1% 82.6% 100% (47) 100% (85) 100% (132) ファイ係数:φ = -0.16 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 53.3% 33.3% 48.3% ない 46.7% 66.7% 51.7% 100% (45) 100% (15) 100% (60) ファイ係数:φ = -0.17
28
第3の変数による完全な説明 2つの下位表におけるファイ係数がゼロ.つまり,第3の変数の影響を一定にすると,興味ある2変数間の関係が消失したとする. このとき,第3の変数は,興味ある2変数間の関係を完全に説明する. 家族の信仰は10代の若者が自家用自動車を日常的に使用できるかを規定し,自動車使用機会が婚前交渉の主要な決定因となる.
29
ファイ係数:φ = 0.00 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある
9.1% ない 90.9% 100% (44) 100% (88) 100% (132) ファイ係数:φ = 0.00 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 66.7% ない 33.3% 100% (48) 100% (12) 100% (60) ファイ係数:φ = 0.00
30
練習問題 第3変数の効果がない場合の表をつくりかえたように,第3変数による完全な説明が成り立つ場合の表を作り変えよ(テキスト表10.4を作り変える).2つの下位表の周辺度数を用いればできる.ファイ係数も計算してみよ. 信仰と自動車使用機会の表 自動車使用機会と婚前性交の表
31
ファイ係数:φ = -0.43 ファイ係数:φ = 0.60 家族は信仰深い? 計 いいえ はい 自動車を使用? 52.2% 12.0%
31.25% 47.8% 88.0% 68.75% 100% (92) 100% (100) ファイ係数:φ = -0.43 自動車を使用? 計 いいえ はい 婚前性交 ある 9.1% 66.7% 27.1% ない 90.9% 33.3% 72.9% 100% (132) 100% (60) 100% (192) ファイ係数:φ = 0.60
32
周辺度数分布において,X と Z,および,Z と Y に関連があるために, X と Y の間に関連が現れた.
周辺度数による elaboration(後述) X(家族の信仰)と Z(行動への束縛)の関連について,次のスライドを参照. 参考:安田三郎『社会統計学』p.101
33
ファイ係数:φ = 0.00 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある
9.1% ない 90.9% 100% (44) 100% (88) 100% (132) ファイ係数:φ = 0.00 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 66.7% ない 33.3% 100% (48) 100% (12) 100% (60) ファイ係数:φ = 0.00
34
第3の変数が,元の2変数(X,Y)のいずれともゼロでない相関を示すときだけ,この第3の変数を媒介変数として,もとの2変数の共変動を説明できる可能性がある.
一般には,2変数の相関が正なら,第3の変数とこれら2変数との相関はどちらも正か,あるいは,どちらも負.(そうでないこともありうる) 2変数の相関が負なら,第3の変数との相関は,一方が正で他方が負. (そうでないことも)
35
第3の変数による完全な説明は,媒介関係の場合だけでなく,2変数の相関が疑似関係であるときにも見られる.
第3の変数を媒介変数と考えるか,2変数の共通原因と考えるかは,理論や解釈のしやすさによる.統計的な結果からは決められない.
36
10.2.5. 第3変数の交互作用効果 がある場合 2つの下位表で連関の程度(ファイ係数,オッズ比)が大きく異なる.
零次の表と比べると,たとえば,一方の下位表では連関が減少し,もう一方の下位表では連関が増大する. 連関が逆方向(プラスとマイナス)になることもある. 交互作用効果(interaction effect):第3の変数の値によって,興味ある2変数の関係が異なる.
37
ファイ係数:φ = -0.42 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある
50.0% 11.8% 28.3% (34) ない 88.2% 71.7% (86) 100% (52) 100% (68) 100% (120) ファイ係数:φ = -0.42 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 25.0% 25.0% (18) ない 75.0% 75.0% (54) 100% (40) 100% (32) 100% (72) ファイ係数:φ = 0.00
38
ファイ係数:φ = -0.12 ファイ係数:φ = -0.04 家族は信仰深い? 計 いいえ はい 自動車を使用? 43.5% 32.0%
37.5% 56.5% 68.0% 62.5% 100% (92) 100% (100) ファイ係数:φ = -0.12 自動車を使用? 計 いいえ はい 婚前性交 ある 28.3% 25.0% 27.1% ない 71.6% 75.0% 72.9% 100% (120) 100% (72) 100% (192) ファイ係数:φ = -0.04
39
3重クロス表を構成してみないと,交互作用効果の発見はできない.
2変数 X と Y の単純相関が,条件つき相関と,どのように,どれぐらい異なるのかは,3重クロス表を構成しなければわからない.
40
条件つき効果のまとめ グラフを利用すると,3重クロス表から明らかになった関係が,よりわかりやすくなることが多い(テキスト p.239 ,図10.2) 2要因分散分析で学習した図と本質的に同じ.
41
第3の変数を導入して3重クロス集計を行い,関連の分析を深化させることを,elaboration と呼ぶ.
零次の表での関連が疑似相関かどうか 原因と結果の間を媒介する変数は何か どんな条件のもとで,零次の表での関連が明確になるか 安田三郎『社会統計学』2.4節
42
疑似相関を暴いて,零次の表での単純関連の見かけ性を説明するタイプの elaboration を,explanation と呼ぶ.
媒介関係の分析は,独立変数と従属変数の間の間接的な因果関係をより詳しく解釈することに役立つので,interpretation と呼ばれる. 注意:テキスト(p.284)では,explanation と interpretation の意味を区別していない.
43
交互作用効果を明らかにする elaboration は,specification と呼ばれる.
特に,第3の変数が独立変数 X と関連を持たない場合.たとえば,第3の変数が性別,独立変数が年齢の場合.
44
10.3. 偏相関係数 条件つき相関係数は,第3の変数 Z のカテゴリごとに,X と Y の相関係数を計算したもの.
X と Y それぞれから Z と関連した部分を除去したときの,X と Y の相関.
45
偏相関係数(partial correlation):第3の変数を統制したときの,興味ある2変数間の相関係数.
3変数とも連続変数の場合に定義された式だが,これを離散変数間の相関にも適用する.
46
変数 X と Y の相関係数 [XY] は,いくつかの要素の,ある種の和である.
[XY: z1]:第3の変数 Z のカテゴリが z1 であるときの,X と Y の条件つき相関係数.[XY:z2] も同様. [XZ]:X と Z の相関係数.[ZY] も同様. ここが偏相関係数 [XY: Z]
47
通常の数式のように変形(移項)すると,以下の式が得られる.これは,偏相関の定義式で分母を無視した形である.
48
[XZ] および [ZY] の両方がゼロでないとき,疑似関係あるいは媒介関係による elaboration が可能になる.偏相関係数の値は,零次の表での単純相関 [XY] よりも小さな値になる.
49
[XZ] または [ZY] がゼロであるなら,偏相関係数の値は,零次の表での単純相関 [XY] と近い値になる.[ZY] = 0 とすると,
50
偏相関係数がゼロなら,[XY] は [XZ] と [ZX] の積に等しい.
51
テキスト(p. 294)では,交互作用効果がない場合に偏相関係数を計算できると書かれている.
実際には,交互作用効果の有無にかかわらず,偏相関係数を計算することができる. 定義式の右辺にある,3つの相関係数が計算できればよい.
52
ただし,交互作用があるときには,偏相関係数を計算することにあまり意味はない.
交互作用がないとき,2つの条件つき相関係数は似た値になるので(図10.2参照),これらをあわせて偏相関係数としている.
53
交互作用効果があると,X と Y の偏相関係数は,単純相関(零次の表での相関係数)と近い値になることが多い.
家族の信仰深さと婚前性交の例では,単純相関は であり,偏相関は となる. 偏相関係数だけ見ても,Z が無効果の場合(偏相関係数は単純相関と一致)と区別できない.
54
偏相関係数は3つの単純相関([XY], [XZ], [ZY])から計算する.これら3つの相関を示すクロス表からは,詳細な関係(たとえば,交互作用効果)はわからなかったことに注意.偏相関係数を計算するだけでなく,必ず3重クロス表を検討するべきである.
55
10.3.1. 例示:3変数間相関 外に飲みに行った経験(X)と,婚前性交への態度(Y)とのクロス表 ファイ係数:φ = -0.371
計 ない ある 婚前性交 悪い 55.2% 19.3% 37.2% 悪くない 44.8% 88.2% 71.7% 100% (774) 100% (781) 100% (1,555) ファイ係数:φ = 1983年GSS調査より
56
家庭外で飲酒した経験がある者は,そうでない者に比べ,婚前性交を悪くないと考える.
「経験がない者は悪いと考える」と言ってもよい これら2変数の両方に相関を持つ変数として,性別(Z)が考えられる. 女性は,家庭外での飲酒と,婚前性交の両方に,あまり寛容ではないだろう. 性別を共通原因とする疑似相関ではないのか?
57
性別(Z)と,婚前性交への態度(Y)とのクロス表
計 男 女 婚前性交 悪い 30.0% 42.6% 37.2% 悪くない 70.0% 57.2% 62.8% 100% (669) 100% (866) 100% (1,555) ファイ係数:φ = 0.128 1983年GSS調査より
58
10.3.1. 例示:3変数間相関 性別(Z)と,外に飲みに行った経験(X)とのクロス表 ファイ係数:φ = -0.190 性別 計 男 女
ある 61.1% 42.0% 50.2% ない 38.9% 58.0% 49.8% 100% (774) 100% (781) 100% (1,555) ファイ係数:φ = 1983年GSS調査より
59
偏相関係数を計算すると, これは X と Y の単純相関(-0.371)よりも低いが,その差はわずか.性別による elaboration はうまくいかない.
60
性別が共通原因である疑似相関を疑ったが,2変数 X と Y に対して性別(Z)はあまり影響しておらず,偏相関は単純相関と少ししか違わなかった.
偏相関係数を説明するための例だったので,3重クロス表の構成は行っていない.もちろん,実際の分析では3重クロス表を構成するべきである.
61
偏相関係数の有意性検定 第3の変数による統制を行っても,興味ある2変数間には相関が存在する(つまり,母集団での偏相関係数はゼロではない)と言えるか? 帰無仮説 H0:母集団での偏相関係数は0 対立仮説 H1:母集団での偏相関係数は0ではない(両側検定の対立仮説) 注意:テキストでは,外に飲みに行った経験があると婚前性交に対して寛容になると考えて,対立仮説を片側にしている.
62
検定統計量
63
理解確認のポイント 第3の変数 Z による,(X と Y の)疑似関係とは何か,説明できますか?
多重クロス表を構成する目的を説明できますか?
64
多重クロス表を構成することができますか?
零次の表 1次の表 条件つき相関係数から,媒介関係あるいは疑似関係を明らかにすることができますか? 条件つき相関係数から,交互作用効果を見つけることができますか?
65
偏相関係数とは何か,説明できますか? 偏相関係数を計算することができますか?
定義式は覚えなくてもよい. 第3の変数 Z による媒介関係あるいは疑似関係が存在する場合,X と Y の偏相関係数は,零次の表での相関係数と比べて,どのように変化しますか?
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.